JP4947860B2 - 消費者電化製品に関連する装置をボイス制御する方法及び装置 - Google Patents
消費者電化製品に関連する装置をボイス制御する方法及び装置 Download PDFInfo
- Publication number
- JP4947860B2 JP4947860B2 JP2001275281A JP2001275281A JP4947860B2 JP 4947860 B2 JP4947860 B2 JP 4947860B2 JP 2001275281 A JP2001275281 A JP 2001275281A JP 2001275281 A JP2001275281 A JP 2001275281A JP 4947860 B2 JP4947860 B2 JP 4947860B2
- Authority
- JP
- Japan
- Prior art keywords
- user
- voice
- accept
- rukoto
- commands
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 39
- 230000001755 vocal effect Effects 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 2
- 238000004458 analytical method Methods 0.000 abstract description 7
- 238000012512 characterization method Methods 0.000 abstract description 3
- 230000005236 sound signal Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Details Of Television Systems (AREA)
- Navigation (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Selective Calling Equipment (AREA)
- Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
Description
【発明の属する技術分野】
本発明は、消費者電化製品に関連する装置をボイス制御する方法及び装置に関わる。
【0002】
【従来の技術】
消費者電化製品に関連する装置、例えば、テレビジョンセット又はビデオレコーダのオペレータ制御は、ボイス制御によりユーザに簡単になり得る。例えば、装置設定の変更、例えば、局の選択のようなオペレータ制御器能の実行、又は、プログラミング動作の実施のために音声制御を使用することが公知である。
【0003】
この目的のために、ユーザによって話されるオペレータ制御コマンドは、最初に音響信号として検出され、電気信号に変換され、ディジタル化される。ディジタル化されたボイス信号は、音声認識システムに供給される。音声認識は、通常ここでは音響モデル及び音声モデルに基づく。音響モデルは、多数の音声パターンを使用し、数学的アルゴリズムが口頭の言葉に音響的に最もよく適合する言葉を示すために使用される。音声モデルは、どの文脈中で及びどの頻度である言葉が通常使用されるかにおいて多数の文書サンプルに基づいて確立される分析に基づく。
【0004】
現行のシステムでは、遠隔制御ユニットと一体化されたマイクロホンにオペレータ制御コマンドを話す。騒がしい背景の雑音によって生じる認識率の低下は、ユーザの口の直ぐ前で遠隔制御ユニットを保持することによって防止される。しかしながら、これは、従来の遠隔制御ユニットの場合のように、ユーザが遠隔制御ユニットを持ち上げなくてはならないことをまだ必要とする。音声入力に関して、一つ以上のマイクロホンが消費者電化製品に関連する装置に設けられた場合にはより便利になり得、それによりユーザは遠隔制御ユニットを携帯することなく部屋の任意の所望の場所からオペレータ制御を実行することができる。背景の騒がしさの要求される抑制は、この場合、「統計ビーム形成」又は「ブラインドソース分離」のような特別なマイクロホンアレイ及び方法の使用によって行われ得る。しかしながら、動作中の装置は、どの音声入力が現在のユーザによるものかを判定することができない。従って、これらオペレータ制御コマンドだけに応答するが他の人による発声を無視することは可能でない。
【0005】
ユーザの便宜をよりよくするために更に試みられる方法は、テレビジョン又はセットトップボックスと一体化されたハードディスクへのテレビジョン番組の自動バッファ記憶である。視聴傾向の分析後、この場合、ユーザが定期的に予め選択した番組又は番組のタイプが自動的に記録される。ユーザが任意の時間にテレビジョンをオンにする場合、ユーザはある程度の確率で、お気に入りの番組を観ることができる。しかしながら、ユーザが数人いる場合、どのユーザがどの時間にテレビジョンを作動したかを区別することが可能でないことにより分析の質が劣化される。
【0006】
【発明が解決しようとする課題】
本発明は、前述の不都合な点を回避する、ボイス制御する方法を特定する目的に基づく。
【0007】
【課題を解決するための手段】
この目的は、請求項1記載の方法によって実現される。
【0008】
原則として、消費者電化製品に関連する装置をボイス制御する方法は、ユーザの音声入力をディジタル化されたボイス信号に変換することを含む。音声の個々の音の特性であり、従って、口頭の音の認識を可能にする第1の特徴がディジタル化されたボイス信号から抽出される。更に、夫々のユーザの声の特性把握を可能にし、異なるユーザの音声入力の間で区別するために使用される第2の特徴がディジタル化された音声信号から抽出される。上記装置が、第1のユーザからの上記装置をオンにするボイスコマンドの後、特徴的な声の特徴に関して更なる音声入力を試験し、これら特徴に基づいて同じ話者にこの音声入力が割り当てられ得る場合にだけこの音声入力を受け入れることによって、更なるボイスコマンドを上記第1のユーザからだけ受け入れる。
【0009】
結果として、所与の期間中に幾人かの同時ユーザのうちの一人だけがボイス制御に関わる装置を作動し得ることを確実にし得、これは幾人かのユーザのうち一人だけが適合する遠隔制御ユニットを有する場合に類似する。
【0010】
特に、装置をオンにするためのボイスコマンドが任意の第1のユーザから受けられることが有利であり、その後、この第1のユーザからのボイスコマンド入力だけが受けられる。
【0011】
装置をオフにするためのボイスコマンドは、第1のユーザからだけ受けられることが好ましく、装置をオフにした後、ボイスコマンドが任意のユーザから再び受けられることが可能となる。
【0012】
しかしながら、ある適用法に関して、装置をオフにするためのボイスコマンドが任意のユーザから受けられることが有利となり得る。
【0013】
同様にして、第1のユーザに入力された後に、第2のユーザからのボイスコマンドが受けられることを可能にするオペレータ制御コマンドが有利的に提供される。これにより、第1のユーザから第2のユーザへ遠隔制御ユニットを渡すことに相当するように、オペレータ制御の権限を譲ることを可能にする。
【0014】
視聴傾向の分析を実施し、この分析から様々なユーザのプロフィールを形成するために、様々なユーザの識別が行われることが特に有利となる。
【0015】
このようにして得られるユーザプロフィールは、異なるユーザのために好ましい番組を別々にバッファ記憶することを可能にするようテレビジョン番組のバッファ記憶装置において好ましくは使用される。
【0016】
同様にして、ユーザプロフィールは、様々なユーザの視聴傾向に適する視聴されるべき番組を提案するために使用されてもよい。
【0017】
【発明の実施の形態】
本発明の実施例を図面に基づいて説明する。
【0018】
第1の実施例のシーケンスをフローチャートの形態で図1中に概略的に示す。
ボイス制御されたテレビジョンの場合、あるユーザからだけ将来の音声入力を受けるために様々なユーザ間の音声入力で区別される。
【0019】
最初に、第1の方法の段階1において、アナログボイス信号を生成するために音響信号が電気信号に変換され、アナログ音声信号はディジタル音声信号に変換される。
【0020】
次の方法の段階2において、音声の可能な限り典型的な個々の音であり、騒がしさ並びに発音における変動に関してエラー強い第1の特徴がディジタル化された音響信号から得られる。同様にして、方法の段階3において、夫々のユーザの声の特性把握を可能にし、様々なユーザの音声入力間で区別する第2の特徴がディジタル化された音響信号から抽出される。提示する実施例において、この特徴の抽出は、音声認識ユニット及び話者認識ユニットに対して別々に行われるが、一緒に行われてもよい。
【0021】
第1の特徴に基づいて、実際の音声認識が方法の段階4において行われる。方法の段階5において、その時に話しているユーザを識別するために話者認識が第2の特徴を補助として行われる。しかしながら、同様にして、個々のユーザの識別が行われること無く他のユーザからの区別を可能にするために第2の特徴だけが記憶されてもよい。
【0022】
方法の段階6において、テレビジョンが既にオンにされたか否かが確認される。オンの場合、方法の段階7及び8が実行され、さもなければ方法の段階9及び10が実行される。テレビジョンがまだオンにされていない場合、方法の段階9において、例えば、「オン」又は「テレビジョン オン」のようなオンにするコマンドが与えられたか否かが次に確認される。このコマンドが与えられた場合、方法の段階10において、テレビジョンがオンにされ、入力を発生するユーザが認められる。識別の代わりに、異なるユーザ間で区別だけが行われる場合、現在のユーザを特徴付ける第2の特徴が相応じて記憶される。その後、方法の段階9においてオンにするコマンドが与えられていない場合と同じように方法の段階1に戻る。
【0023】
既にオンされたテレビジョンの場合において、方法の段階6の後に方法の段階7が続く。この段階では、音声入力が既に方法の段階10において予め認められたユーザによるものか否かが確認される。そのユーザによるものである場合、ボイス制御されたシステムを制御する入力コマンドが方法の段階8において、例えば、メニューコントロール又はナビゲーションのために使用される。その後、方法の段階7においてユーザの中で変更が確立された場合と同じように方法の段階1に戻る。
【0024】
この実施例の様々な変更態様が考えられる。例えば、装置をオフにする音声入力が任意のユーザから受けられてもよい。同様にして、第1のユーザによって入力されるとき、第2の又は更なるユーザの音声入力が将来受けられることを可能にするオペレータ制御コマンドが設けられてもよい。
【0025】
第2の実施例のシーケンスをフローチャートの形態で図2に概略的に示す。この場合、ボイス制御されたテレビジョンの様々なユーザの識別が行われ、これは、この識別からこれらユーザに対してユーザプロフィールを形成するためである。
【0026】
方法の段階1乃至5は、図1からの実施例の段階1乃至5と一致するが、一方で方法の段階5では、その時話しているユーザを識別することが重要となる。他方で、方法の段階6、7、及び、9における様々な分岐が不要となる。音声入力に対応するオペレータ制御コマンドは、方法の段階8において実行される。更に、方法の段階11において、入力を発生する識別されたユーザが現在の時間及びテレビジョンチャネルに関する詳細、又は、その時放送している番組に関する詳細と一緒に記憶される。これら詳細は、テレビジョンセットで既に利用できてもよく、又は、特に、垂直帰線消去間隔におけるアナログテレビジョン信号の場合、更なる信号としてテレビジョン信号と伝送されてもよい。例えば、内部クロックからの時刻が使用され得、又は、テレテキストで伝送される時間信号が評価される。同様にして、テレビジョンチャネルは、その時選択されたテレビジョンセットの番組サイトから、又は、テレテキスト又はVPS信号12における対応する詳細から直接的に決定されてもよい。最後に、その時放送されている番組に関する詳細、即ち、題名、ジャンル、例えば、エンターテイメント、スポーツ等が装置に既にあるEPG又は相応じて伝送されるデータから捕捉されてもよい。
【0027】
音声認識の使用により決定されるユーザプロフィールは、ハードディスク上のテレビジョン番組のバッファ記憶装置又はテレビジョン並びにセットトップボックスに設けられる同様の記憶媒体において特に使用され得る。視聴傾向の分析の正確さは、夫々のユーザの認識によってこの場合著しく高められる。子供達が親よりも著しく長い時間テレビジョンの前で過ごす家族の例において、ハードディスクは従って子供用番組だけでもはや満たされない。その代わりに、更なる話者認識は、家族の構成員の数に対して視聴傾向分析が別々に形成されることを可能にする。ハードディスクの限られたバッファメモリ空間は、特定のキーに従って個々のユーザの中で分割され得、それにより、各ユーザに所定の分け前のハッファ記憶されたテレビジョン番組が与えられる。
【0028】
同様にして、音声認識の使用により決定されるユーザプロフィールは、ラジオ番組又は他の伝送されたデータを記録するためにも使用され得る。
【0029】
ボイス信号の検出のために、単一のマイクロホン又は2つ以上のマイクロホンを有するマイクロホンアレイが設けられてもよい。マイクロホンアレイは、例えば、テレビジョン受像機と一体化されてもよい。マイクロホンは、検出された音響信号を電気信号に変換し、この電気信号は増幅器によって増幅され、AD変換器によってディジタル信号に変換され、信号処理ユニットに供給される。後者は、検出された音信号の異なるスケーリング又は処理によってユーザがいる夫々の場所を考慮し得る。更に、スピーカから発せられる音響信号に対するマイクロホン信号の補正が行われてもよい。このようにして調整される信号は、音声認識ユニット及び話者認識ユニットに供給され、アルゴリズム又はハードウェアユニットが別々に構成、又は、さもなければ一緒に構成されることが可能となる。決定されるコマンド及びユーザの識別は、システムを制御するために最終的にシステムマネージャに供給される。
【0030】
本発明は、例えば、TVセット、ビデオレコーダ、DVDプレーヤ、衛星受信器、組み合わされたTV−ビデオシステム、オーディオ機器、又は、完全なオーディオシステムのような消費者電化製品に関連する幅広い種類の装置のボイス遠隔制御のために使用されてもよい。
【図面の簡単な説明】
【図1】あるユーザからだけ将来のボイスコマンドを受けるために様々なユーザのボイスコマンド間で区別する方法のシーケンスを概略的に示す図である。
【図2】この識別から様々なユーザのユーザプロフィールを形成するために様々なユーザを識別する方法のシーケンスを概略的に示す図である。
Claims (6)
- ユーザの音声入力がディジタル化されたボイス信号に変換され、
上記音声の個々の音の特性であり従って口頭の音の認識を可能にする第1の特徴が上記ディジタル化された音声信号から抽出され、
夫々のユーザの声の特性把握を可能にし異なるユーザの音声入力の間で区別するために使用される第2の特徴が上記ディジタル化された音声信号から抽出される、消費者電化製品に関連する装置をボイス制御する方法であって、
上記装置が、第1のユーザからの上記装置をオンにするボイスコマンドの後、特徴的な声の特徴に関して更なる音声入力を試験し、これら特徴に基づいて上記音声入力が同じ話者に割り当てられ得る場合にだけ上記音声入力を受け入れることによって、更なるボイスコマンドを上記第1のユーザからだけ受け入れることを特徴とする方法。 - 上記装置が、上記装置をオンにする上記ボイスコマンドを任意の第1のユーザから受け入れ、その後、上記第1のユーザからのボイスコマンドだけを一時的に受け入れることを特徴とする請求項1記載の方法。
- 上記装置が、上記装置をオフにするボイスコマンドを上記第1のユーザからだけ受け入れ、
上記装置をオフにした後、ボイスコマンドを任意のユーザから再び受け入れることを特徴とする請求項2記載の方法。 - 上記装置が、上記装置をオフにするボイスコマンドを任意のユーザから受け入れることを特徴とする請求項2記載の方法。
- 上記装置が、上記第1のユーザによって入力された後、第2のユーザからのボイスコマンドを受け入れることを可能にするオペレータ制御コマンドが提供されることを特徴とする請求項1記載の方法。
- 請求項1乃至5のうちいずれか一項記載の方法を実行する装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10046561 | 2000-09-19 | ||
DE10046561.7 | 2000-09-19 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011278728A Division JP5442703B2 (ja) | 2000-09-19 | 2011-12-20 | 消費者電化製品に関連する装置をボイス制御する方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002123295A JP2002123295A (ja) | 2002-04-26 |
JP4947860B2 true JP4947860B2 (ja) | 2012-06-06 |
Family
ID=7656945
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001275281A Expired - Lifetime JP4947860B2 (ja) | 2000-09-19 | 2001-09-11 | 消費者電化製品に関連する装置をボイス制御する方法及び装置 |
JP2011278728A Expired - Lifetime JP5442703B2 (ja) | 2000-09-19 | 2011-12-20 | 消費者電化製品に関連する装置をボイス制御する方法及び装置 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011278728A Expired - Lifetime JP5442703B2 (ja) | 2000-09-19 | 2011-12-20 | 消費者電化製品に関連する装置をボイス制御する方法及び装置 |
Country Status (7)
Country | Link |
---|---|
US (1) | US7136817B2 (ja) |
EP (1) | EP1189206B1 (ja) |
JP (2) | JP4947860B2 (ja) |
KR (1) | KR100845476B1 (ja) |
CN (1) | CN1185623C (ja) |
AT (1) | ATE328345T1 (ja) |
DE (1) | DE60120062T2 (ja) |
Families Citing this family (70)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7324947B2 (en) | 2001-10-03 | 2008-01-29 | Promptu Systems Corporation | Global speech user interface |
WO2003085639A1 (en) * | 2002-04-08 | 2003-10-16 | Koninklijke Philips Electronics N.V. | Controlling an apparatus based on speech |
AU2003260926A1 (en) * | 2002-10-23 | 2004-05-13 | Koninklijke Philips Electronics N.V. | Controlling an apparatus based on speech |
EP1426924A1 (en) * | 2002-12-03 | 2004-06-09 | Alcatel | Speaker recognition for rejecting background speakers |
KR20050023941A (ko) * | 2003-09-03 | 2005-03-10 | 삼성전자주식회사 | 음성 인식 및 화자 인식을 통한 개별화된 서비스를제공하는 a/v 장치 및 그 방법 |
US8295446B1 (en) * | 2004-09-03 | 2012-10-23 | Confinement Telephony Technology, Llc | Telephony system and method with enhanced call monitoring, recording and retrieval |
JP3824168B2 (ja) * | 2004-11-08 | 2006-09-20 | 松下電器産業株式会社 | ディジタル映像再生装置 |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
CN101038742B (zh) * | 2006-03-16 | 2011-06-22 | 鸿富锦精密工业(深圳)有限公司 | 利用影像特征辅助语音遥控的装置及方法 |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8797465B2 (en) * | 2007-05-08 | 2014-08-05 | Sony Corporation | Applications for remote control devices with added functionalities |
JP4307498B2 (ja) * | 2007-07-10 | 2009-08-05 | 本田技研工業株式会社 | ナビ装置、ナビシステム |
CN101452507A (zh) * | 2007-12-06 | 2009-06-10 | 深圳富泰宏精密工业有限公司 | 手持行动电子装置语音认证系统及方法 |
CN101493987B (zh) * | 2008-01-24 | 2011-08-31 | 深圳富泰宏精密工业有限公司 | 手机声控遥控系统及方法 |
CN101902587A (zh) * | 2009-06-01 | 2010-12-01 | 沈阳同方多媒体科技有限公司 | 一种通过语音对电视机进行控制的系统 |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US11012732B2 (en) | 2009-06-25 | 2021-05-18 | DISH Technologies L.L.C. | Voice enabled media presentation systems and methods |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
CN101882370A (zh) * | 2010-06-30 | 2010-11-10 | 中山大学 | 一种语音识别遥控器 |
WO2012169679A1 (ko) * | 2011-06-10 | 2012-12-13 | 엘지전자 주식회사 | 디스플레이 장치, 디스플레이 장치의 제어 방법 및 디스플레이 장치의 음성인식 시스템 |
US20130238326A1 (en) * | 2012-03-08 | 2013-09-12 | Lg Electronics Inc. | Apparatus and method for multiple device voice control |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9606767B2 (en) * | 2012-06-13 | 2017-03-28 | Nvoq Incorporated | Apparatus and methods for managing resources for a system using voice recognition |
CN103543930A (zh) * | 2012-07-13 | 2014-01-29 | 腾讯科技(深圳)有限公司 | 一种电子书操作控制方法及装置 |
US9786281B1 (en) * | 2012-08-02 | 2017-10-10 | Amazon Technologies, Inc. | Household agent learning |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
KR102091236B1 (ko) * | 2012-09-28 | 2020-03-18 | 삼성전자 주식회사 | 전자기기 및 그 제어방법 |
US9460715B2 (en) * | 2013-03-04 | 2016-10-04 | Amazon Technologies, Inc. | Identification using audio signatures and additional characteristics |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
US9911421B2 (en) * | 2013-06-10 | 2018-03-06 | Panasonic Intellectual Property Corporation Of America | Speaker identification method, speaker identification apparatus, and information management method |
KR20150012464A (ko) * | 2013-07-25 | 2015-02-04 | 삼성전자주식회사 | 디스플레이 장치 및 개인화 서비스 제공 방법 |
EP3043348B1 (en) * | 2013-09-03 | 2017-10-04 | Panasonic Intellectual Property Corporation of America | Voice interaction control method |
CN103533391B (zh) * | 2013-10-12 | 2016-09-14 | 青岛旲天下智能科技有限公司 | 一种声控式交互的双向互动数字电视盒系统的工作方法 |
KR102210433B1 (ko) * | 2014-01-21 | 2021-02-01 | 삼성전자주식회사 | 전자 장치 및 이의 음성 인식 방법 |
KR20150092996A (ko) * | 2014-02-06 | 2015-08-17 | 삼성전자주식회사 | 디스플레이 장치 및 이를 이용한 전자 장치의 제어 방법 |
WO2015146179A1 (ja) * | 2014-03-28 | 2015-10-01 | パナソニックIpマネジメント株式会社 | 音声コマンド入力装置および音声コマンド入力方法 |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
KR102246900B1 (ko) | 2014-07-29 | 2021-04-30 | 삼성전자주식회사 | 전자 장치 및 이의 음성 인식 방법 |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
CN104378710A (zh) * | 2014-11-18 | 2015-02-25 | 康佳集团股份有限公司 | 一种无线音箱 |
US10152299B2 (en) * | 2015-03-06 | 2018-12-11 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
TWI555393B (zh) * | 2015-08-24 | 2016-10-21 | 晨星半導體股份有限公司 | 電視節目智慧播放方法與其控制裝置 |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
DE102015015040A1 (de) | 2015-11-12 | 2017-05-18 | Schneider Gmbh & Co. Kg | Verfahren, Anlage und System zur Bearbeitung optischer Linsen |
JP6571587B2 (ja) * | 2016-05-18 | 2019-09-04 | 日本電信電話株式会社 | 音声入力装置、その方法、及びプログラム |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
DK179588B1 (en) | 2016-06-09 | 2019-02-22 | Apple Inc. | INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
CN106162254A (zh) * | 2016-06-30 | 2016-11-23 | 深圳市九洲电器有限公司 | 一种用户语音分析方法及系统 |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
DE102017001680A1 (de) | 2017-02-22 | 2018-08-23 | Schneider Gmbh & Co. Kg | Anlage und Verfahren zur Bearbeitung optischer Linsen |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10567515B1 (en) | 2017-10-26 | 2020-02-18 | Amazon Technologies, Inc. | Speech processing performed with respect to first and second user profiles in a dialog session |
US10715604B1 (en) * | 2017-10-26 | 2020-07-14 | Amazon Technologies, Inc. | Remote system processing based on a previously identified user |
CN108509107A (zh) * | 2018-03-26 | 2018-09-07 | 百度在线网络技术(北京)有限公司 | 应用功能信息显示方法、装置及终端设备 |
US11145299B2 (en) | 2018-04-19 | 2021-10-12 | X Development Llc | Managing voice interface devices |
US10949228B1 (en) * | 2018-09-28 | 2021-03-16 | United Services Automobile Association (Usaa) | System and method for controlling the content of a device in response to an audible request |
US11468197B2 (en) * | 2019-05-06 | 2022-10-11 | Apple Inc. | Configuring context-based restrictions for a computing device |
CN113848747A (zh) * | 2021-11-03 | 2021-12-28 | 珠海格力电器股份有限公司 | 智能家居设备控制方法及装置 |
Family Cites Families (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4757525A (en) * | 1982-09-29 | 1988-07-12 | Vmx, Inc. | Electronic audio communications system with voice command features |
US4866777A (en) * | 1984-11-09 | 1989-09-12 | Alcatel Usa Corporation | Apparatus for extracting features from a speech signal |
JPS61130999A (ja) * | 1984-11-30 | 1986-06-18 | 株式会社神戸製鋼所 | 音声認識装置 |
JPS61138999A (ja) * | 1984-12-12 | 1986-06-26 | 株式会社神戸製鋼所 | 音声認識装置 |
US5127043A (en) * | 1990-05-15 | 1992-06-30 | Vcs Industries, Inc. | Simultaneous speaker-independent voice recognition and verification over a telephone network |
US6400996B1 (en) * | 1999-02-01 | 2002-06-04 | Steven M. Hoffberg | Adaptive pattern recognition based control system and method |
US6192255B1 (en) * | 1992-12-15 | 2001-02-20 | Texas Instruments Incorporated | Communication system and methods for enhanced information transfer |
US5717743A (en) * | 1992-12-16 | 1998-02-10 | Texas Instruments Incorporated | Transparent telephone access system using voice authorization |
US6081782A (en) * | 1993-12-29 | 2000-06-27 | Lucent Technologies Inc. | Voice command control and verification system |
US5623539A (en) * | 1994-01-27 | 1997-04-22 | Lucent Technologies Inc. | Using voice signal analysis to identify authorized users of a telephone system |
US5774859A (en) * | 1995-01-03 | 1998-06-30 | Scientific-Atlanta, Inc. | Information system having a speech interface |
US5835894A (en) * | 1995-01-19 | 1998-11-10 | Ann Adcock Corporation | Speaker and command verification method |
US5774858A (en) * | 1995-10-23 | 1998-06-30 | Taubkin; Vladimir L. | Speech analysis method of protecting a vehicle from unauthorized accessing and controlling |
US6006175A (en) * | 1996-02-06 | 1999-12-21 | The Regents Of The University Of California | Methods and apparatus for non-acoustic speech characterization and recognition |
US5752231A (en) * | 1996-02-12 | 1998-05-12 | Texas Instruments Incorporated | Method and system for performing speaker verification on a spoken utterance |
JPH1031577A (ja) * | 1996-07-17 | 1998-02-03 | Brother Ind Ltd | 音声入力情報処理システム |
KR100206799B1 (ko) * | 1996-08-19 | 1999-07-01 | 구자홍 | 화자 인식형 캠코더 |
US5777571A (en) * | 1996-10-02 | 1998-07-07 | Holtek Microelectronics, Inc. | Remote control device for voice recognition and user identification restrictions |
US5915001A (en) * | 1996-11-14 | 1999-06-22 | Vois Corporation | System and method for providing and using universally accessible voice and speech data files |
CN1244984A (zh) * | 1996-11-22 | 2000-02-16 | T-内提克斯公司 | 用于信息系统访问和交易处理的语音识别 |
IL119948A (en) * | 1996-12-31 | 2004-09-27 | News Datacom Ltd | Voice activated communication system and program guide |
US5907326A (en) * | 1997-03-10 | 1999-05-25 | International Business Machines Corporation | System and method for updating cultural profiles with dragging and dropping locale objects |
KR19980085738A (ko) * | 1997-05-30 | 1998-12-05 | 배순훈 | 음성 인식 리모콘 |
US5897616A (en) * | 1997-06-11 | 1999-04-27 | International Business Machines Corporation | Apparatus and methods for speaker verification/identification/classification employing non-acoustic and/or acoustic models and databases |
US5946653A (en) * | 1997-10-01 | 1999-08-31 | Motorola, Inc. | Speaker independent speech recognition system and method |
WO1999027668A1 (en) * | 1997-11-20 | 1999-06-03 | Nielsen Media Research, Inc. | Voice recognition unit for audience measurement system |
JPH11327753A (ja) * | 1997-11-27 | 1999-11-30 | Matsushita Electric Ind Co Ltd | 制御方法及びプログラム記録媒体 |
IL127791A (en) * | 1998-04-21 | 2003-06-24 | Ibm | System and method for selecting and accessing portions of information stream(s) from a television |
US6421453B1 (en) * | 1998-05-15 | 2002-07-16 | International Business Machines Corporation | Apparatus and methods for user recognition employing behavioral passwords |
US6167251A (en) * | 1998-10-02 | 2000-12-26 | Telespree Communications | Keyless portable cellular phone system having remote voice recognition |
JP2000250944A (ja) * | 1998-12-28 | 2000-09-14 | Toshiba Corp | 情報提供方法、情報提供装置、情報受信装置、並びに情報記述方法 |
WO2000039789A1 (en) * | 1998-12-29 | 2000-07-06 | Alcatel Usa Sourcing, L.P. | Security and user convenience through voice commands |
US6804638B2 (en) * | 1999-04-30 | 2004-10-12 | Recent Memory Incorporated | Device and method for selective recall and preservation of events prior to decision to record the events |
US6584439B1 (en) * | 1999-05-21 | 2003-06-24 | Winbond Electronics Corporation | Method and apparatus for controlling voice controlled devices |
JP2001268669A (ja) * | 2000-03-21 | 2001-09-28 | Ricoh Co Ltd | 移動電話端末を利用した機器制御装置、方法、及び記録媒体 |
US7047196B2 (en) * | 2000-06-08 | 2006-05-16 | Agiletv Corporation | System and method of voice recognition near a wireline node of a network supporting cable television and/or video delivery |
US6754629B1 (en) * | 2000-09-08 | 2004-06-22 | Qualcomm Incorporated | System and method for automatic voice recognition using mapping |
US6498970B2 (en) * | 2001-04-17 | 2002-12-24 | Koninklijke Phillips Electronics N.V. | Automatic access to an automobile via biometrics |
US6785647B2 (en) * | 2001-04-20 | 2004-08-31 | William R. Hutchison | Speech recognition system with network accessible speech processing resources |
US6601762B2 (en) * | 2001-06-15 | 2003-08-05 | Koninklijke Philips Electronics N.V. | Point-of-sale (POS) voice authentication transaction system |
-
2001
- 2001-08-06 EP EP01402126A patent/EP1189206B1/en not_active Expired - Lifetime
- 2001-08-06 DE DE60120062T patent/DE60120062T2/de not_active Expired - Lifetime
- 2001-08-06 AT AT01402126T patent/ATE328345T1/de not_active IP Right Cessation
- 2001-08-29 KR KR1020010052377A patent/KR100845476B1/ko active IP Right Grant
- 2001-09-05 CN CNB011312858A patent/CN1185623C/zh not_active Expired - Lifetime
- 2001-09-11 JP JP2001275281A patent/JP4947860B2/ja not_active Expired - Lifetime
- 2001-09-14 US US09/952,126 patent/US7136817B2/en not_active Expired - Lifetime
-
2011
- 2011-12-20 JP JP2011278728A patent/JP5442703B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
EP1189206A2 (en) | 2002-03-20 |
KR100845476B1 (ko) | 2008-07-14 |
DE60120062D1 (de) | 2006-07-06 |
JP2002123295A (ja) | 2002-04-26 |
US7136817B2 (en) | 2006-11-14 |
JP5442703B2 (ja) | 2014-03-12 |
JP2012100309A (ja) | 2012-05-24 |
CN1185623C (zh) | 2005-01-19 |
DE60120062T2 (de) | 2006-11-16 |
KR20020022561A (ko) | 2002-03-27 |
EP1189206B1 (en) | 2006-05-31 |
CN1345029A (zh) | 2002-04-17 |
ATE328345T1 (de) | 2006-06-15 |
EP1189206A3 (en) | 2002-08-21 |
US20020035477A1 (en) | 2002-03-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4947860B2 (ja) | 消費者電化製品に関連する装置をボイス制御する方法及び装置 | |
US7567898B2 (en) | Regulation of volume of voice in conjunction with background sound | |
US7885818B2 (en) | Controlling an apparatus based on speech | |
US10359991B2 (en) | Apparatus, systems and methods for audio content diagnostics | |
EP1278183B1 (en) | Voice operated electronic appliance | |
US20060235698A1 (en) | Apparatus for controlling a home theater system by speech commands | |
CN106067996B (zh) | 语音再现方法、语音对话装置 | |
US20070216538A1 (en) | Method for Controlling a Media Content Processing Device, and a Media Content Processing Device | |
WO2001050454A1 (fr) | Regleur de dispositif, systeme de reglage de dispositif et support enregistre comportant le programme de reglage de dispositif | |
JP2003510645A (ja) | 音声認識装置及び消費者電子システム | |
US6927802B2 (en) | TV receiver with individually programmable SAPchannel | |
WO2003107327A1 (en) | Controlling an apparatus based on speech | |
JP6678315B2 (ja) | 音声再生方法、音声対話装置及び音声対話プログラム | |
JP7216621B2 (ja) | 電子機器、プログラムおよび音声認識方法 | |
KR20010030122A (ko) | 언어인식 방법 및 장치 | |
JP2006093918A (ja) | デジタル放送受信装置、デジタル放送受信方法、デジタル放送受信プログラム及びプログラム記録媒体 | |
JP4257546B2 (ja) | 記録再生装置、およびhdd内蔵型ディジタルテレビジョン | |
JP2013121096A (ja) | 音声調整装置およびデジタル放送受信装置 | |
KR20000014415U (ko) | 디지털 텔레비젼에서의 음량 조절 장치 | |
JP2005536104A (ja) | 2つのオーディオ入力信号を処理する方法 | |
KR20060004564A (ko) | 시각장애자를 위한 선호채널 서비스 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080718 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110517 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110815 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110920 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111220 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120221 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120306 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150316 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4947860 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |