JP5442703B2 - 消費者電化製品に関連する装置をボイス制御する方法及び装置 - Google Patents

消費者電化製品に関連する装置をボイス制御する方法及び装置 Download PDF

Info

Publication number
JP5442703B2
JP5442703B2 JP2011278728A JP2011278728A JP5442703B2 JP 5442703 B2 JP5442703 B2 JP 5442703B2 JP 2011278728 A JP2011278728 A JP 2011278728A JP 2011278728 A JP2011278728 A JP 2011278728A JP 5442703 B2 JP5442703 B2 JP 5442703B2
Authority
JP
Japan
Prior art keywords
user
voice
consumer electronics
speech
digitized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2011278728A
Other languages
English (en)
Other versions
JP2012100309A (ja
Inventor
エフ シュレーダー エルンスト
プラッテ ハンス−ヨアヒム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2012100309A publication Critical patent/JP2012100309A/ja
Application granted granted Critical
Publication of JP5442703B2 publication Critical patent/JP5442703B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Details Of Television Systems (AREA)
  • Selective Calling Equipment (AREA)
  • Navigation (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)

Description

本発明は、消費者電化製品に関連する装置をボイス制御する方法及び装置に関わる。
消費者電化製品に関連する装置、例えば、テレビジョンセット又はビデオレコーダのオペレータ制御は、ボイス制御によりユーザに簡単になり得る。例えば、装置設定の変更、例えば、局の選択のようなオペレータ制御器能の実行、又は、プログラミング動作の実施のために音声制御を使用することが公知である。
この目的のために、ユーザによって話されるオペレータ制御コマンドは、最初に音響信号として検出され、電気信号に変換され、ディジタル化される。ディジタル化されたボイス信号は、音声認識システムに供給される。音声認識は、通常ここでは音響モデル及び音声モデルに基づく。音響モデルは、多数の音声パターンを使用し、数学的アルゴリズムが口頭の言葉に音響的に最もよく適合する言葉を示すために使用される。音声モデルは、どの文脈中で及びどの頻度である言葉が通常使用されるかにおいて多数の文書サンプルに基づいて確立される分析に基づく。
現行のシステムでは、遠隔制御ユニットと一体化されたマイクロホンにオペレータ制御コマンドを話す。騒がしい背景の雑音によって生じる認識率の低下は、ユーザの口の直ぐ前で遠隔制御ユニットを保持することによって防止される。しかしながら、これは、従来の遠隔制御ユニットの場合のように、ユーザが遠隔制御ユニットを持ち上げなくてはならないことをまだ必要とする。音声入力に関して、一つ以上のマイクロホンが消費者電化製品に関連する装置に設けられた場合にはより便利になり得、それによりユーザは遠隔制御ユニットを携帯することなく部屋の任意の所望の場所からオペレータ制御を実行することができる。背景の騒がしさの要求される抑制は、この場合、「統計ビーム形成」又は「ブラインドソース分離」のような特別なマイクロホンアレイ及び方法の使用によって行われ得る。しかしながら、動作中の装置は、どの音声入力が現在のユーザによるものかを判定することができない。従って、これらオペレータ制御コマンドだけに応答するが他の人による発声を無視することは可能でない。
ユーザの便宜をよりよくするために更に試みられる方法は、テレビジョン又はセットトップボックスと一体化されたハードディスクへのテレビジョン番組の自動バッファ記憶である。視聴傾向の分析後、この場合、ユーザが定期的に予め選択した番組又は番組のタイプが自動的に記録される。ユーザが任意の時間にテレビジョンをオンにする場合、ユーザはある程度の確率で、お気に入りの番組を観ることができる。しかしながら、ユーザが数人いる場合、どのユーザがどの時間にテレビジョンを作動したかを区別することが可能でないことにより分析の質が劣化される。
本発明は、前述の不都合な点を回避する、ボイス制御する方法を特定する目的に基づく。
この目的は、請求項1記載の方法によって実現される。
原則として、消費者電化製品に関連する装置をボイス制御する方法は、ユーザの音声入力をディジタル化されたボイス信号に変換することを含む。音声の個々の音の特性であり、従って、口頭の音の認識を可能にする第1の特徴がディジタル化されたボイス信号から抽出される。更に、夫々のユーザの声の特性把握を可能にし、異なるユーザの音声入力の間で区別するために使用される第2の特徴がディジタル化された音声信号から抽出される。第1のユーザからのボイスコマンドの後、特徴的な声の特徴に関して更なる音声入力を試験し、これら特徴に基づいて同じ話者にこの音声入力が割り当てられ得る場合にだけこの音声入力を受けることによって、更なるボイスコマンドがこの第1のユーザからだけ受けられる。
結果として、所与の期間中に幾人かの同時ユーザのうちの一人だけがボイス制御に関わる装置を作動し得ることを確実にし得、これは幾人かのユーザのうち一人だけが適合する遠隔制御ユニットを有する場合に類似する。
特に、装置をオンにするためのボイスコマンドが任意の第1のユーザから受けられることが有利であり、その後、この第1のユーザからのボイスコマンド入力だけが受けられる。
装置をオフにするためのボイスコマンドは、第1のユーザからだけ受けられることが好ましく、装置をオフにした後、ボイスコマンドが任意のユーザから再び受けられることが可能となる。
しかしながら、ある適用法に関して、装置をオフにするためのボイスコマンドが任意のユーザから受けられることが有利となり得る。
同様にして、第1のユーザに入力された後に、第2のユーザからのボイスコマンドが受けられることを可能にするオペレータ制御コマンドが有利的に提供される。これにより、第1のユーザから第2のユーザへ遠隔制御ユニットを渡すことに相当するように、オペレータ制御の権限を譲ることを可能にする。
視聴傾向の分析を実施し、この分析から様々なユーザのプロフィールを形成するために、様々なユーザの識別が行われることが特に有利となる。
このようにして得られるユーザプロフィールは、異なるユーザのために好ましい番組を別々にバッファ記憶することを可能にするようテレビジョン番組のバッファ記憶装置において好ましくは使用される。
同様にして、ユーザプロフィールは、様々なユーザの視聴傾向に適する視聴されるべき番組を提案するために使用されてもよい。
あるユーザからだけ将来のボイスコマンドを受けるために様々なユーザのボイスコマンド間で区別する方法のシーケンスを概略的に示す図である。 この識別から様々なユーザのユーザプロフィールを形成するために様々なユーザを識別する方法のシーケンスを概略的に示す図である。
本発明の実施例を図面に基づいて説明する。
第1の実施例のシーケンスをフローチャートの形態で図1中に概略的に示す。ボイス制御されたテレビジョンの場合、あるユーザからだけ将来の音声入力を受けるために様々なユーザ間の音声入力で区別される。
最初に、第1の方法の段階1において、アナログボイス信号を生成するために音響信号が電気信号に変換され、アナログ音声信号はディジタル音声信号に変換される。
次の方法の段階2において、音声の可能な限り典型的な個々の音であり、騒がしさ並びに発音における変動に関してエラー強い第1の特徴がディジタル化された音響信号から得られる。同様にして、方法の段階3において、夫々のユーザの声の特性把握を可能にし、様々なユーザの音声入力間で区別する第2の特徴がディジタル化された音響信号から抽出される。提示する実施例において、この特徴の抽出は、音声認識ユニット及び話者認識ユニットに対して別々に行われるが、一緒に行われてもよい。
第1の特徴に基づいて、実際の音声認識が方法の段階4において行われる。方法の段階5において、その時に話しているユーザを識別するために話者認識が第2の特徴を補助として行われる。しかしながら、同様にして、個々のユーザの識別が行われること無く他のユーザからの区別を可能にするために第2の特徴だけが記憶されてもよい。
方法の段階6において、テレビジョンが既にオンにされたか否かが確認される。オンの場合、方法の段階7及び8が実行され、さもなければ方法の段階9及び10が実行される。テレビジョンがまだオンにされていない場合、方法の段階9において、例えば、「オン」又は「テレビジョン オン」のようなオンにするコマンドが与えられたか否かが次に確認される。このコマンドが与えられた場合、方法の段階10において、テレビジョンがオンにされ、入力を発生するユーザが認められる。識別の代わりに、異なるユーザ間で区別だけが行われる場合、現在のユーザを特徴付ける第2の特徴が相応じて記憶される。その後、方法の段階9においてオンにするコマンドが与えられていない場合と同じように方法の段階1に戻る。
既にオンされたテレビジョンの場合において、方法の段階6の後に方法の段階7が続く。この段階では、音声入力が既に方法の段階10において予め認められたユーザによるものか否かが確認される。そのユーザによるものである場合、ボイス制御されたシステムを制御する入力コマンドが方法の段階8において、例えば、メニューコントロール又はナビゲーションのために使用される。その後、方法の段階7においてユーザの中で変更が確立された場合と同じように方法の段階1に戻る。
この実施例の様々な変更態様が考えられる。例えば、装置をオフにする音声入力が任意のユーザから受けられてもよい。同様にして、第1のユーザによって入力されるとき、第2の又は更なるユーザの音声入力が将来受けられることを可能にするオペレータ制御コマンドが設けられてもよい。
第2の実施例のシーケンスをフローチャートの形態で図2に概略的に示す。この場合、ボイス制御されたテレビジョンの様々なユーザの識別が行われ、これは、この識別からこれらユーザに対してユーザプロフィールを形成するためである。
方法の段階1乃至5は、図1からの実施例の段階1乃至5と一致するが、一方で方法の段階5では、その時話しているユーザを識別することが重要となる。他方で、方法の段階6、7、及び、9における様々な分岐が不要となる。音声入力に対応するオペレータ制御コマンドは、方法の段階8において実行される。更に、方法の段階11において、入力を発生する識別されたユーザが現在の時間及びテレビジョンチャネルに関する詳細、又は、その時放送している番組に関する詳細と一緒に記憶される。これら詳細は、テレビジョンセットで既に利用できてもよく、又は、特に、垂直帰線消去間隔におけるアナログテレビジョン信号の場合、更なる信号としてテレビジョン信号と伝送されてもよい。例えば、内部クロックからの時刻が使用され得、又は、テレテキストで伝送される時間信号が評価される。同様にして、テレビジョンチャネルは、その時選択されたテレビジョンセットの番組サイトから、又は、テレテキスト又はVPS信号12における対応する詳細から直接的に決定されてもよい。最後に、その時放送されている番組に関する詳細、即ち、題名、ジャンル、例えば、エンターテイメント、スポーツ等が装置に既にあるEPG又は相応じて伝送されるデータから捕捉されてもよい。
音声認識の使用により決定されるユーザプロフィールは、ハードディスク上のテレビジョン番組のバッファ記憶装置又はテレビジョン並びにセットトップボックスに設けられる同様の記憶媒体において特に使用され得る。視聴傾向の分析の正確さは、夫々のユーザの認識によってこの場合著しく高められる。子供達が親よりも著しく長い時間テレビジョンの前で過ごす家族の例において、ハードディスクは従って子供用番組だけでもはや満たされない。その代わりに、更なる話者認識は、家族の構成員の数に対して視聴傾向分析が別々に形成されることを可能にする。ハードディスクの限られたバッファメモリ空間は、特定のキーに従って個々のユーザの中で分割され得、それにより、各ユーザに所定の分け前のハッファ記憶されたテレビジョン番組が与えられる。
同様にして、音声認識の使用により決定されるユーザプロフィールは、ラジオ番組又は他の伝送されたデータを記録するためにも使用され得る。
ボイス信号の検出のために、単一のマイクロホン又は2つ以上のマイクロホンを有するマイクロホンアレイが設けられてもよい。マイクロホンアレイは、例えば、テレビジョン受像機と一体化されてもよい。マイクロホンは、検出された音響信号を電気信号に変換し、この電気信号は増幅器によって増幅され、AD変換器によってディジタル信号に変換され、信号処理ユニットに供給される。後者は、検出された音信号の異なるスケーリング又は処理によってユーザがいる夫々の場所を考慮し得る。更に、スピーカから発せられる音響信号に対するマイクロホン信号の補正が行われてもよい。このようにして調整される信号は、音声認識ユニット及び話者認識ユニットに供給され、アルゴリズム又はハードウェアユニットが別々に構成、又は、さもなければ一緒に構成されることが可能となる。決定されるコマンド及びユーザの識別は、システムを制御するために最終的にシステムマネージャに供給される。
本発明は、例えば、TVセット、ビデオレコーダ、DVDプレーヤ、衛星受信器、組み合わされたTV−ビデオシステム、オーディオ機器、又は、完全なオーディオシステムのような消費者電化製品に関連する幅広い種類の装置のボイス遠隔制御のために使用されてもよい。

Claims (2)

  1. 消費者電化装置をボイス制御する方法であって、
    ユーザの音声入力をディジタル化されたボイス信号に変換するステップと、
    上記音声の個々の音の特性であり従って口頭の音の認識を可能にする第1の特徴を上記ディジタル化された音声信号から抽出するステップと、
    上記抽出された第1の特徴を、前記消費者電化装置を制御するボイスコマンドに変換するステップと、
    夫々のユーザの声の特性把握を可能にし異なるユーザの音声入力の間で区別するために使用される第2の特徴を上記ディジタル化された音声信号から抽出するステップと、
    上記ボイスコマンドによって上記消費者電化装置を操作する場合に、異なるユーザを識別するステップと、
    上記識別されたユーザのユーザプロフィールを形成するために、上記識別されたユーザの視聴傾向の分析を実施するステップと、
    上記異なるユーザに対して好ましい番組を別々にバッファ記憶することを可能にするために、テレビジョン番組のバッファ記憶装置において上記ユーザプロフィールを使用するステップと
    を有し、
    バッファメモリ空間は、割当キーに従って個々のユーザの間で分割され、それにより、夫々のユーザは、所定の分け前のバッファ記憶されたテレビジョン番組を与えられる、方法。
  2. 消費者電化装置であって、
    ユーザの音声入力をディジタル化されたボイス信号に変換する手段と、
    上記音声の個々の音の特性であり従って口頭の音の認識を可能にする第1の特徴を上記ディジタル化された音声信号から抽出する手段と、
    上記抽出された第1の特徴を、前記消費者電化装置を制御するボイスコマンドに変換する手段と、
    夫々のユーザの声の特性把握を可能にし異なるユーザの音声入力の間で区別するために使用される第2の特徴を上記ディジタル化された音声信号から抽出する手段と、
    上記ボイスコマンドによって当該消費者電化装置を操作する場合に、異なるユーザを識別する手段と、
    上記識別されたユーザのユーザプロフィールを形成するために、上記識別されたユーザの視聴傾向の分析を実施する手段と、
    上記異なるユーザに対して好ましい番組を別々にバッファ記憶することを可能にするために、テレビジョン番組のバッファ記憶装置において上記ユーザプロフィールを使用する手段と
    を有し、
    バッファメモリ空間は、割当キーに従って個々のユーザの間で分割され、それにより、夫々のユーザは、所定の分け前のバッファ記憶されたテレビジョン番組を与えられる、
    消費者電化装置。
JP2011278728A 2000-09-19 2011-12-20 消費者電化製品に関連する装置をボイス制御する方法及び装置 Expired - Lifetime JP5442703B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE10046561 2000-09-19
DE10046561.7 2000-09-19

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2001275281A Division JP4947860B2 (ja) 2000-09-19 2001-09-11 消費者電化製品に関連する装置をボイス制御する方法及び装置

Publications (2)

Publication Number Publication Date
JP2012100309A JP2012100309A (ja) 2012-05-24
JP5442703B2 true JP5442703B2 (ja) 2014-03-12

Family

ID=7656945

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2001275281A Expired - Lifetime JP4947860B2 (ja) 2000-09-19 2001-09-11 消費者電化製品に関連する装置をボイス制御する方法及び装置
JP2011278728A Expired - Lifetime JP5442703B2 (ja) 2000-09-19 2011-12-20 消費者電化製品に関連する装置をボイス制御する方法及び装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2001275281A Expired - Lifetime JP4947860B2 (ja) 2000-09-19 2001-09-11 消費者電化製品に関連する装置をボイス制御する方法及び装置

Country Status (7)

Country Link
US (1) US7136817B2 (ja)
EP (1) EP1189206B1 (ja)
JP (2) JP4947860B2 (ja)
KR (1) KR100845476B1 (ja)
CN (1) CN1185623C (ja)
AT (1) ATE328345T1 (ja)
DE (1) DE60120062T2 (ja)

Families Citing this family (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7324947B2 (en) 2001-10-03 2008-01-29 Promptu Systems Corporation Global speech user interface
WO2003085639A1 (en) * 2002-04-08 2003-10-16 Koninklijke Philips Electronics N.V. Controlling an apparatus based on speech
KR101034524B1 (ko) * 2002-10-23 2011-05-12 코닌클리케 필립스 일렉트로닉스 엔.브이. 음성에 근거하여 장치를 제어하는 음성 제어 유닛, 제어되는 장치 및 장치를 제어하는 방법
EP1426924A1 (en) * 2002-12-03 2004-06-09 Alcatel Speaker recognition for rejecting background speakers
KR20050023941A (ko) * 2003-09-03 2005-03-10 삼성전자주식회사 음성 인식 및 화자 인식을 통한 개별화된 서비스를제공하는 a/v 장치 및 그 방법
US7881446B1 (en) * 2004-09-03 2011-02-01 Confinement Telephony Technology, Llc Telephony system and method with enhanced validation
JP3824168B2 (ja) * 2004-11-08 2006-09-20 松下電器産業株式会社 ディジタル映像再生装置
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
CN101038742B (zh) * 2006-03-16 2011-06-22 鸿富锦精密工业(深圳)有限公司 利用影像特征辅助语音遥控的装置及方法
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8797465B2 (en) * 2007-05-08 2014-08-05 Sony Corporation Applications for remote control devices with added functionalities
JP4307498B2 (ja) * 2007-07-10 2009-08-05 本田技研工業株式会社 ナビ装置、ナビシステム
CN101452507A (zh) * 2007-12-06 2009-06-10 深圳富泰宏精密工业有限公司 手持行动电子装置语音认证系统及方法
CN101493987B (zh) * 2008-01-24 2011-08-31 深圳富泰宏精密工业有限公司 手机声控遥控系统及方法
CN101902587A (zh) * 2009-06-01 2010-12-01 沈阳同方多媒体科技有限公司 一种通过语音对电视机进行控制的系统
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US11012732B2 (en) 2009-06-25 2021-05-18 DISH Technologies L.L.C. Voice enabled media presentation systems and methods
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
CN101882370A (zh) * 2010-06-30 2010-11-10 中山大学 一种语音识别遥控器
WO2012169679A1 (ko) * 2011-06-10 2012-12-13 엘지전자 주식회사 디스플레이 장치, 디스플레이 장치의 제어 방법 및 디스플레이 장치의 음성인식 시스템
US20130238326A1 (en) * 2012-03-08 2013-09-12 Lg Electronics Inc. Apparatus and method for multiple device voice control
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9606767B2 (en) * 2012-06-13 2017-03-28 Nvoq Incorporated Apparatus and methods for managing resources for a system using voice recognition
CN103543930A (zh) * 2012-07-13 2014-01-29 腾讯科技(深圳)有限公司 一种电子书操作控制方法及装置
US9786281B1 (en) * 2012-08-02 2017-10-10 Amazon Technologies, Inc. Household agent learning
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
KR102091236B1 (ko) * 2012-09-28 2020-03-18 삼성전자 주식회사 전자기기 및 그 제어방법
US9460715B2 (en) * 2013-03-04 2016-10-04 Amazon Technologies, Inc. Identification using audio signatures and additional characteristics
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014199602A1 (ja) * 2013-06-10 2014-12-18 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 話者識別方法、話者識別装置及び情報管理方法
KR20150012464A (ko) * 2013-07-25 2015-02-04 삼성전자주식회사 디스플레이 장치 및 개인화 서비스 제공 방법
EP3261087A1 (en) 2013-09-03 2017-12-27 Panasonic Intellectual Property Corporation of America Voice interaction control method
CN103533391B (zh) * 2013-10-12 2016-09-14 青岛旲天下智能科技有限公司 一种声控式交互的双向互动数字电视盒系统的工作方法
KR102210433B1 (ko) 2014-01-21 2021-02-01 삼성전자주식회사 전자 장치 및 이의 음성 인식 방법
KR20150092996A (ko) * 2014-02-06 2015-08-17 삼성전자주식회사 디스플레이 장치 및 이를 이용한 전자 장치의 제어 방법
JP6436400B2 (ja) * 2014-03-28 2018-12-12 パナソニックIpマネジメント株式会社 音声コマンド入力装置および音声コマンド入力方法
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
KR102246900B1 (ko) 2014-07-29 2021-04-30 삼성전자주식회사 전자 장치 및 이의 음성 인식 방법
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
CN104378710A (zh) * 2014-11-18 2015-02-25 康佳集团股份有限公司 一种无线音箱
US10152299B2 (en) * 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
TWI555393B (zh) * 2015-08-24 2016-10-21 晨星半導體股份有限公司 電視節目智慧播放方法與其控制裝置
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
DE102015015040A1 (de) 2015-11-12 2017-05-18 Schneider Gmbh & Co. Kg Verfahren, Anlage und System zur Bearbeitung optischer Linsen
JP6571587B2 (ja) * 2016-05-18 2019-09-04 日本電信電話株式会社 音声入力装置、その方法、及びプログラム
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
CN106162254A (zh) * 2016-06-30 2016-11-23 深圳市九洲电器有限公司 一种用户语音分析方法及系统
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10715604B1 (en) * 2017-10-26 2020-07-14 Amazon Technologies, Inc. Remote system processing based on a previously identified user
US10567515B1 (en) 2017-10-26 2020-02-18 Amazon Technologies, Inc. Speech processing performed with respect to first and second user profiles in a dialog session
CN108509107A (zh) * 2018-03-26 2018-09-07 百度在线网络技术(北京)有限公司 应用功能信息显示方法、装置及终端设备
US11145299B2 (en) 2018-04-19 2021-10-12 X Development Llc Managing voice interface devices
US10949228B1 (en) * 2018-09-28 2021-03-16 United Services Automobile Association (Usaa) System and method for controlling the content of a device in response to an audible request
US11468197B2 (en) * 2019-05-06 2022-10-11 Apple Inc. Configuring context-based restrictions for a computing device
CN113848747A (zh) * 2021-11-03 2021-12-28 珠海格力电器股份有限公司 智能家居设备控制方法及装置

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4757525A (en) * 1982-09-29 1988-07-12 Vmx, Inc. Electronic audio communications system with voice command features
US4866777A (en) * 1984-11-09 1989-09-12 Alcatel Usa Corporation Apparatus for extracting features from a speech signal
JPS61130999A (ja) * 1984-11-30 1986-06-18 株式会社神戸製鋼所 音声認識装置
JPS61138999A (ja) * 1984-12-12 1986-06-26 株式会社神戸製鋼所 音声認識装置
US5127043A (en) * 1990-05-15 1992-06-30 Vcs Industries, Inc. Simultaneous speaker-independent voice recognition and verification over a telephone network
US6400996B1 (en) * 1999-02-01 2002-06-04 Steven M. Hoffberg Adaptive pattern recognition based control system and method
US6192255B1 (en) * 1992-12-15 2001-02-20 Texas Instruments Incorporated Communication system and methods for enhanced information transfer
US5717743A (en) * 1992-12-16 1998-02-10 Texas Instruments Incorporated Transparent telephone access system using voice authorization
US6081782A (en) * 1993-12-29 2000-06-27 Lucent Technologies Inc. Voice command control and verification system
US5623539A (en) * 1994-01-27 1997-04-22 Lucent Technologies Inc. Using voice signal analysis to identify authorized users of a telephone system
US5774859A (en) * 1995-01-03 1998-06-30 Scientific-Atlanta, Inc. Information system having a speech interface
US5835894A (en) * 1995-01-19 1998-11-10 Ann Adcock Corporation Speaker and command verification method
US5774858A (en) * 1995-10-23 1998-06-30 Taubkin; Vladimir L. Speech analysis method of protecting a vehicle from unauthorized accessing and controlling
US6006175A (en) * 1996-02-06 1999-12-21 The Regents Of The University Of California Methods and apparatus for non-acoustic speech characterization and recognition
US5752231A (en) * 1996-02-12 1998-05-12 Texas Instruments Incorporated Method and system for performing speaker verification on a spoken utterance
JPH1031577A (ja) * 1996-07-17 1998-02-03 Brother Ind Ltd 音声入力情報処理システム
KR100206799B1 (ko) * 1996-08-19 1999-07-01 구자홍 화자 인식형 캠코더
US5777571A (en) * 1996-10-02 1998-07-07 Holtek Microelectronics, Inc. Remote control device for voice recognition and user identification restrictions
US5915001A (en) * 1996-11-14 1999-06-22 Vois Corporation System and method for providing and using universally accessible voice and speech data files
JP2001505688A (ja) * 1996-11-22 2001-04-24 ティ―ネティックス,インコーポレイテッド 情報システムアクセスおよび取引処理のための音声認識
IL119948A (en) * 1996-12-31 2004-09-27 News Datacom Ltd Voice activated communication system and program guide
US5907326A (en) * 1997-03-10 1999-05-25 International Business Machines Corporation System and method for updating cultural profiles with dragging and dropping locale objects
KR19980085738A (ko) * 1997-05-30 1998-12-05 배순훈 음성 인식 리모콘
US5897616A (en) * 1997-06-11 1999-04-27 International Business Machines Corporation Apparatus and methods for speaker verification/identification/classification employing non-acoustic and/or acoustic models and databases
US5946653A (en) * 1997-10-01 1999-08-31 Motorola, Inc. Speaker independent speech recognition system and method
JP2001524776A (ja) * 1997-11-20 2001-12-04 ニールセン メディア リサーチ インコーポレイテッド 視聴者測定システムのための音声認識ユニット
JPH11327753A (ja) * 1997-11-27 1999-11-30 Matsushita Electric Ind Co Ltd 制御方法及びプログラム記録媒体
IL127791A (en) * 1998-04-21 2003-06-24 Ibm System and method for selecting and accessing portions of information stream(s) from a television
US6421453B1 (en) * 1998-05-15 2002-07-16 International Business Machines Corporation Apparatus and methods for user recognition employing behavioral passwords
US6167251A (en) * 1998-10-02 2000-12-26 Telespree Communications Keyless portable cellular phone system having remote voice recognition
JP2000250944A (ja) * 1998-12-28 2000-09-14 Toshiba Corp 情報提供方法、情報提供装置、情報受信装置、並びに情報記述方法
WO2000039789A1 (en) * 1998-12-29 2000-07-06 Alcatel Usa Sourcing, L.P. Security and user convenience through voice commands
US6804638B2 (en) * 1999-04-30 2004-10-12 Recent Memory Incorporated Device and method for selective recall and preservation of events prior to decision to record the events
US6584439B1 (en) * 1999-05-21 2003-06-24 Winbond Electronics Corporation Method and apparatus for controlling voice controlled devices
JP2001268669A (ja) * 2000-03-21 2001-09-28 Ricoh Co Ltd 移動電話端末を利用した機器制御装置、方法、及び記録媒体
US7047196B2 (en) * 2000-06-08 2006-05-16 Agiletv Corporation System and method of voice recognition near a wireline node of a network supporting cable television and/or video delivery
US6754629B1 (en) * 2000-09-08 2004-06-22 Qualcomm Incorporated System and method for automatic voice recognition using mapping
US6498970B2 (en) * 2001-04-17 2002-12-24 Koninklijke Phillips Electronics N.V. Automatic access to an automobile via biometrics
US6785647B2 (en) * 2001-04-20 2004-08-31 William R. Hutchison Speech recognition system with network accessible speech processing resources
US6601762B2 (en) * 2001-06-15 2003-08-05 Koninklijke Philips Electronics N.V. Point-of-sale (POS) voice authentication transaction system

Also Published As

Publication number Publication date
ATE328345T1 (de) 2006-06-15
US20020035477A1 (en) 2002-03-21
EP1189206B1 (en) 2006-05-31
EP1189206A3 (en) 2002-08-21
JP2012100309A (ja) 2012-05-24
KR100845476B1 (ko) 2008-07-14
DE60120062D1 (de) 2006-07-06
EP1189206A2 (en) 2002-03-20
JP4947860B2 (ja) 2012-06-06
DE60120062T2 (de) 2006-11-16
CN1185623C (zh) 2005-01-19
JP2002123295A (ja) 2002-04-26
US7136817B2 (en) 2006-11-14
KR20020022561A (ko) 2002-03-27
CN1345029A (zh) 2002-04-17

Similar Documents

Publication Publication Date Title
JP5442703B2 (ja) 消費者電化製品に関連する装置をボイス制御する方法及び装置
US7885818B2 (en) Controlling an apparatus based on speech
US10359991B2 (en) Apparatus, systems and methods for audio content diagnostics
US7567898B2 (en) Regulation of volume of voice in conjunction with background sound
EP1278183B1 (en) Voice operated electronic appliance
US20060235698A1 (en) Apparatus for controlling a home theater system by speech commands
US20070216538A1 (en) Method for Controlling a Media Content Processing Device, and a Media Content Processing Device
CN106067996B (zh) 语音再现方法、语音对话装置
US7050971B1 (en) Speech recognition apparatus having multiple audio inputs to cancel background noise from input speech
WO2001050454A1 (fr) Regleur de dispositif, systeme de reglage de dispositif et support enregistre comportant le programme de reglage de dispositif
US6927802B2 (en) TV receiver with individually programmable SAPchannel
WO2003107327A1 (en) Controlling an apparatus based on speech
JP2016206646A (ja) 音声再生方法、音声対話装置及び音声対話プログラム
KR20010030122A (ko) 언어인식 방법 및 장치
JP7216621B2 (ja) 電子機器、プログラムおよび音声認識方法
JP2006093918A (ja) デジタル放送受信装置、デジタル放送受信方法、デジタル放送受信プログラム及びプログラム記録媒体
WO2021027892A1 (zh) 接收装置
JP4257546B2 (ja) 記録再生装置、およびhdd内蔵型ディジタルテレビジョン
JP2013121096A (ja) 音声調整装置およびデジタル放送受信装置
JP2021092612A (ja) コマンド制御装置、制御方法および制御プログラム
KR20010002739A (ko) 음성인식기를 이용한 자동 캡션 삽입 장치 및 방법
JP2006129171A (ja) 映像機器および音声出力制御方法
JP2005536104A (ja) 2つのオーディオ入力信号を処理する方法
KR19980038619A (ko) 텔레비전에서의 시간알림방법

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130723

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130830

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131015

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131120

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131210

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131218

R150 Certificate of patent or registration of utility model

Ref document number: 5442703

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term