JP2004507936A - ダウンロード可能な音声命令の集合による音声制御型遠隔制御装置 - Google Patents
ダウンロード可能な音声命令の集合による音声制御型遠隔制御装置 Download PDFInfo
- Publication number
- JP2004507936A JP2004507936A JP2002522190A JP2002522190A JP2004507936A JP 2004507936 A JP2004507936 A JP 2004507936A JP 2002522190 A JP2002522190 A JP 2002522190A JP 2002522190 A JP2002522190 A JP 2002522190A JP 2004507936 A JP2004507936 A JP 2004507936A
- Authority
- JP
- Japan
- Prior art keywords
- remote control
- control device
- template data
- database
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 claims 5
- 230000007423 decrease Effects 0.000 claims 1
- 230000008901 benefit Effects 0.000 description 6
- 230000001419 dependent effect Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000011295 pitch Substances 0.000 description 1
- 230000008672 reprogramming Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q9/00—Arrangements in telecontrol or telemetry systems for selectively calling a substation from a main station, in which substation desired apparatus is selected for applying a control signal thereto or for obtaining measured values therefrom
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/4104—Peripherals receiving signals from specially adapted client devices
- H04N21/4126—The peripheral being portable, e.g. PDAs or mobile phones
- H04N21/41265—The peripheral being portable, e.g. PDAs or mobile phones having a remote control device for bidirectional communication between the remote control device and client device
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42204—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42204—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
- H04N21/42206—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor characterized by hardware details
- H04N21/42208—Display device provided on the remote control
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42204—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
- H04N21/42206—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor characterized by hardware details
- H04N21/42222—Additional components integrated in the remote control device, e.g. timer, speaker, sensors for detecting position, direction or movement of the remote control, microphone or battery charging device
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/435—Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/462—Content or additional data management, e.g. creating a master electronic program guide from data received from the Internet and a Head-end, controlling the complexity of a video stream by scaling the resolution or bit-rate based on the client capabilities
- H04N21/4622—Retrieving content or additional data from different sources, e.g. from a broadcast channel and the Internet
-
- G—PHYSICS
- G08—SIGNALLING
- G08C—TRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
- G08C2201/00—Transmission systems of control signals via wireless link
- G08C2201/30—User interface
- G08C2201/31—Voice input
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computer Networks & Wireless Communication (AREA)
- Selective Calling Equipment (AREA)
- Details Of Television Systems (AREA)
Abstract
電子装置を制御するための遠隔制御装置であって、前記遠隔制御装置は、音声命令データを検出するマイクロフォンと、前記マイクロフォンによって検出された音声命令を認識するためにテンプレートデータを用いて音声認識アルゴリズムを実行し、且つ前記電子装置を制御するための処理装置と、前記遠隔制御装置が前記音声命令を認識することができるようにするために外部データベースからテンプレートデータを受信する受信機と、前記選択され受信されたテンプレートデータを記憶するためのメモリとを有する。
Description
【0001】
【発明の属する技術分野】
本発明は、音声インターフェースを有する遠隔制御装置、より詳細にはテレビジョン受信機又は情報及び映画を見る及び収集するための電子装置用の遠隔制御装置に関する。
【0002】
【従来の技術】
音声認識のような遠隔制御装置で実現されなければならない機能の数は増加している。今日では、遠隔制御装置は1つの電子装置だけを制御するのではない。これに代わって、一つの遠隔制御装置が、テレビ、VCR及び衛星放送の受信用パラボラアンテナのような別々の電子装置を制御するために用いられる。それらの電子装置は、例えば文字放送及びインターネット通信の可能性等のより有用な機能を実現することによってますます複雑になっている。したがって、遠隔制御装置によって実行可能な命令の数も増加している。機能及び命令の増加により、一般に、キーボード上には、遠隔制御装置を大きく且つ扱いにくくさせるような多くのキーが備えられる。
【0003】
音声認識は、上記の問題に対する解決策であるように思える。音声認識自体の問題は、音声認識アルゴリズムがメモリを非常に使用するという点である。したがって、上記遠隔制御装置は、数個の音声命令を認識することができるだけである。近年、キーを通じて入力される制御命令の代わりに音声制御命令を使用する音声作動型遠隔制御システムが開発されている。音声作動型遠隔制御システムは、送信機に取り付けられた、音声命令を電気音声信号に変換するマイクロフォンと、音声信号により表される音声パターンに対応する遠隔制御信号を発生するための音声認識LSI(大規模集積化)回路とを有する。このように発生する遠隔制御信号は、制御される電子装置の受信機に送信される。このシステムでは、操作者によって与えられる音声命令に対応する標準パターンデータは、予め登録される。このシステムは話者に依存しない認識装置を有するものであり、米国特許第5,774,859号に記載されている。この話者に依存しない認識システムでは、テンプレートが、音声認識装置のメモリにすでに記憶されている(“事前訓練”)。テンプレートは通常、異なる音の高さ、方言等をカバーする莫大な数の話者の平均によって得られる。この解決策の大きな利点は、異なるユーザが音声命令を使用できるという点である。欠点は、個別化が欠如し、及び言語が決まることである。命令は、遠隔制御装置の製造業者によって選択される。このことは、“ミュート”、“ボリュームアップ”又は“チャンネル1”のような標準的な命令に対しては都合がよいが、ユーザがマクロの名称を選択することは可能ではないであろう。命令が事前に訓練される場合、このことは、言語が決まってしまい、国によって異なる遠隔制御装置が生産されなければならず、相違点が多く費用がかかることを意味する。
【0004】
もう一つの概念は話者に依存する認識である。このような遠隔制御装置は、米国特許第5,199,080号に示されている。構築された音声認識装置によって認識された音声命令に応答して遠隔制御信号を送信する音声作動型遠隔制御システムである。音声認識回路は、音声命令の各々に対して複数の標準パターンデータを記憶する標準パターンデータ記憶ユニットを有する。入力音声命令は、正確に音声認識するために、複数の標準パターンデータと比較される。このシステムは、新たに入力された音声命令のパターンデータの変化に応答して、記憶された標準パターンデータを自動的に更新するための学習ユニットを含む。このシステムは新たな音声命令に対しても訓練することができる。米国特許第5,199,080号に記載されたシステムのような話者に依存する認識装置の主な利点は、ユーザが望む如何なる言語でも、そのユーザが音声命令として使用したい単語の訓練をすることができるという点である。この場合、典型的には、単語を二回発音する。次に、音声認識装置は、取り込んだ言葉から特徴を抽出し、そのパターンを不揮発性メモリにテンプレートとして記憶する。話者に依存する認識のもう一つの利点は、高度な個別化である。音声認識装置は、命令の訓練をするユーザのその命令を非常に高い信頼度で認識する。しかし、その装置は、他の話者により発音された同じ命令をほとんど常に拒絶する。話者に依存する認識の不利な点は、音声命令を使用できるようにする前にシステムがいつも非常に時間がかかる訓練を受けなければならないという点、及び家族の場合ように異なるユーザが遠隔制御装置を用いることを許容できないという点である。何人かのユーザによって遠隔制御装置を訓練することは、訓練した各単語が限られたメモリの容量以上の容量を使用するため、不可能である。
【0005】
【発明が解決しようとする課題】
本発明は、話者に依存する音声認識と話者に依存しない音声認識との利点を組み合わせた遠隔制御装置に音声認識インターフェースを追加する。
【0006】
【課題を解決するための手段】
完全な音声データベースは、例えばPC、テレビ受像機、セットトップボックス(STB)上で実行することができ、又はネットワーク(例えば、インターネット若しくは他の広域ネットワーク)を通じてアクセス可能である。
【0007】
データベースは、遠隔制御装置に備えることができるコンパクトディスク(CD−ROM)又は他の記憶媒体上に記憶することができる。この場合、PC、テレビ、セットトップボックス(STP)又は制御される電子装置のようなローカルダウンロード装置を通じてダウンロードが行われる。
【0008】
データベースにアクセスするためにネットワークを使用するとき、先ず、テンプレートが、制御される電子装置、即ちPC、テレビジョン受像機、セットトップボックス(STB)のようなアクセス装置を通じてそのネットワークから読み出され、次に、遠隔制御装置に(多分、ローカル通信システムを通じてインターネットアクセス装置からダウンロード装置に配信された後に)ダウンロードされる。
【0009】
データベースは、全種類の異なる命令又は単語を記憶するため、多言語辞書のようなものである。使いやすいユーザーインターフェース、検索機能等により、ユーザは自分の好きな言語の辞書から単語の集合を選択することができる。このデータベースは、音声テンプレートのデータベースを特徴としており、選択された単語の音響テンプレートを調べる。次に、これらのテンプレートは、有線又は無線リンクによって遠隔制御装置に転送されることができる。PCをベースにした辞書ソフトウェアから単語を選択する代わりに、制御されるテレビジョン受信機によって表示されることができるインターネットサービス−データベースを用いることも可能である。必要な音声命令が、遠隔制御装置を通じて選択され、インターネットを通じてテンプレートデータを受信するテレビジョン受信機から遠隔制御装置に転送される。
【0010】
本発明の利点は、言語を選択し、単語を選択し、単語を変更することによって遠隔制御装置をすばやくカスタマイズするためユーザは高い自由度を持つという点である。ユーザは、必要とする音声命令に対して最も洗練されたテンプレートを常に又は自動的にダウンロードすることができる。このシステムは話者に依存しないシステムであり、これは、家族の皆が音声認識装置を訓練すること無く選択された音声命令を用いることができることを意味する。遠隔制御装置は、全ての国で同一である”空の”装置として、販売することができる。
【0011】
本発明の他の態様は、ユーザが、1つ以上の音声テンプレートに属する単語であって、遠隔制御装置のLCD上に表示することができる単語の英数字表示をダウンロードすることができることである。これは、ユーザが、訓練した命令の一覧をスクロールし、もはや必要でない特定の命令を消去するのに役立つ。
【0012】
本発明の上記の目的、特徴及び利点は、本発明の好適実施例が図によって示されている添付の図面を用いて、以下の記載からさらに明らかになるだろう。
【0013】
【発明の実施の形態】
図1は、プログラム可能な遠隔制御装置1のブロック図を示す。プログラム可能ということは、遠隔制御装置1が特定の音声命令を認識できるようにテンプレート(データ)の集合をデータベース2,2a又は20から遠隔制御装置1のメモリにダウンロードすることができることを意味する。プログラミングは、コンパクトディスク(CD)又はハードドライブのような局所記憶メモリにデータベース2を記憶するPC4を通じて行うことができる。PC4は、データバス3を通じてデータベース2からデータを受け取る。ユーザは使いやすいユーザインターフェース、例えばPC4上で実行されるプログラムを通じて、音声命令を表す単語の集合を選択することができる。この単語の集合は、音声命令を、音声認識装置が当該音声命令を認識した後に遠隔制御装置によって発生し且つ特定の電子装置に伝送される信号にリンクする。テンプレートデータは、赤外光を用いた無線リンク11又は伝送ケーブル(図示せず)によって、PC4から遠隔制御装置1に伝送することができる。
【0014】
局所データベースを用いる代わりに、インターネット及び/又は電話線9又はTV放送7,21のような他の通信チャネルを通じてデータベース2a,20にアクセスすることができる。データベース2の項目は、プログラム可能な遠隔制御装置1によって制御される遠隔PC10,テレビ8又はセットトップボックス19で選択されることができる。PC10、TV装置8又はセットトップボックス19との間の通信は、符号11により示される無線によって実現される。
【0015】
遠隔制御装置1をプログラムするために、他のいろいろな装置を利用してもよい。リンク及び命令を消去し追加し又は変更するため、遠隔制御装置の記憶された音声作動命令を、遠隔制御装置自体の表示部で表示できるようにすることが可能である。遠隔制御装置の記憶された音声作動命令をPC4、10又はテレビ8に表示できるようにすることも可能である。したがって、先ず、遠隔制御装置の特定のキーを押した後又は特定の音声命令の後、記憶されたデータは使用する表示装置に伝送される。この特定の命令のテンプレートデータは、ユーザによって消去可能であってはならないであろう。検出可能命令の集合を再プログラミングした後に、新しいテンプレートデータ及び必要であれば各検出可能音声命令の英数字表示が遠隔制御装置1のメモリに転送される。テンプレートデータの送信に必要な時間を短縮するため、変更されなかった検出可能命令のテンプレートデータは伝送されないことは明らかである。
【0016】
図2は、プログラム可能な遠隔制御装置1の詳細ブロック図を示す。この遠隔制御装置は送信機ユニット12を有する。この送信ユニット12は、赤外線(IR)又はRFを用いて、遠隔制御命令を、TV装置、VCR、セットトップボックス又はPCのような制御される電子装置にワイヤレスで送信するために用いられる。遠隔制御装置は、送信機ユニット12とは別個にテンプレート受信機22を有する。この受信機22も、例えばIR又はRFを通じてワイヤレスで動作することができる。遠隔制御装置はテンプレート受信機22によって外部データベースからテンプレートデータを受け取る。本発明の他の好適実施例では、遠隔制御装置は、テンプレートデータを受信し且つ制御される電子装置に制御命令を送信するための1つの送信機12を用いる。
【0017】
遠隔制御装置1の動作は中央処理装置(CPU)13により制御される。受信したテンプレートデータ及び検出可能音声命令用の英数字表示のような付加データは、CPU13によってメモリ15に記憶される。CPU13は外部電子装置を制御するための遠隔信号を発生する。この遠隔信号は、マイクロフォン16によって検出され音声認識処理装置14によって分析される音声信号によって表される音声パターンに対応する。音声認識処理装置14は、その音声パターンと、音声命令を検出するための記憶されたテンプレートデータとを比較する。遠隔制御装置1は、キーパッド18及び表示部17を有することができる。
【0018】
本発明は、その意図又は本質的な特性から逸脱しない他の特定の形式で具体化することもできる。従って、本実施例は、すべての点で解説的なものであって、限定するものではないと考えるべきである。
【図面の簡単な説明】
【図1】プログラム可能な遠隔制御装置のブロック図である。
【図2】プログラム可能な遠隔制御装置の詳細ブロック図である。
【発明の属する技術分野】
本発明は、音声インターフェースを有する遠隔制御装置、より詳細にはテレビジョン受信機又は情報及び映画を見る及び収集するための電子装置用の遠隔制御装置に関する。
【0002】
【従来の技術】
音声認識のような遠隔制御装置で実現されなければならない機能の数は増加している。今日では、遠隔制御装置は1つの電子装置だけを制御するのではない。これに代わって、一つの遠隔制御装置が、テレビ、VCR及び衛星放送の受信用パラボラアンテナのような別々の電子装置を制御するために用いられる。それらの電子装置は、例えば文字放送及びインターネット通信の可能性等のより有用な機能を実現することによってますます複雑になっている。したがって、遠隔制御装置によって実行可能な命令の数も増加している。機能及び命令の増加により、一般に、キーボード上には、遠隔制御装置を大きく且つ扱いにくくさせるような多くのキーが備えられる。
【0003】
音声認識は、上記の問題に対する解決策であるように思える。音声認識自体の問題は、音声認識アルゴリズムがメモリを非常に使用するという点である。したがって、上記遠隔制御装置は、数個の音声命令を認識することができるだけである。近年、キーを通じて入力される制御命令の代わりに音声制御命令を使用する音声作動型遠隔制御システムが開発されている。音声作動型遠隔制御システムは、送信機に取り付けられた、音声命令を電気音声信号に変換するマイクロフォンと、音声信号により表される音声パターンに対応する遠隔制御信号を発生するための音声認識LSI(大規模集積化)回路とを有する。このように発生する遠隔制御信号は、制御される電子装置の受信機に送信される。このシステムでは、操作者によって与えられる音声命令に対応する標準パターンデータは、予め登録される。このシステムは話者に依存しない認識装置を有するものであり、米国特許第5,774,859号に記載されている。この話者に依存しない認識システムでは、テンプレートが、音声認識装置のメモリにすでに記憶されている(“事前訓練”)。テンプレートは通常、異なる音の高さ、方言等をカバーする莫大な数の話者の平均によって得られる。この解決策の大きな利点は、異なるユーザが音声命令を使用できるという点である。欠点は、個別化が欠如し、及び言語が決まることである。命令は、遠隔制御装置の製造業者によって選択される。このことは、“ミュート”、“ボリュームアップ”又は“チャンネル1”のような標準的な命令に対しては都合がよいが、ユーザがマクロの名称を選択することは可能ではないであろう。命令が事前に訓練される場合、このことは、言語が決まってしまい、国によって異なる遠隔制御装置が生産されなければならず、相違点が多く費用がかかることを意味する。
【0004】
もう一つの概念は話者に依存する認識である。このような遠隔制御装置は、米国特許第5,199,080号に示されている。構築された音声認識装置によって認識された音声命令に応答して遠隔制御信号を送信する音声作動型遠隔制御システムである。音声認識回路は、音声命令の各々に対して複数の標準パターンデータを記憶する標準パターンデータ記憶ユニットを有する。入力音声命令は、正確に音声認識するために、複数の標準パターンデータと比較される。このシステムは、新たに入力された音声命令のパターンデータの変化に応答して、記憶された標準パターンデータを自動的に更新するための学習ユニットを含む。このシステムは新たな音声命令に対しても訓練することができる。米国特許第5,199,080号に記載されたシステムのような話者に依存する認識装置の主な利点は、ユーザが望む如何なる言語でも、そのユーザが音声命令として使用したい単語の訓練をすることができるという点である。この場合、典型的には、単語を二回発音する。次に、音声認識装置は、取り込んだ言葉から特徴を抽出し、そのパターンを不揮発性メモリにテンプレートとして記憶する。話者に依存する認識のもう一つの利点は、高度な個別化である。音声認識装置は、命令の訓練をするユーザのその命令を非常に高い信頼度で認識する。しかし、その装置は、他の話者により発音された同じ命令をほとんど常に拒絶する。話者に依存する認識の不利な点は、音声命令を使用できるようにする前にシステムがいつも非常に時間がかかる訓練を受けなければならないという点、及び家族の場合ように異なるユーザが遠隔制御装置を用いることを許容できないという点である。何人かのユーザによって遠隔制御装置を訓練することは、訓練した各単語が限られたメモリの容量以上の容量を使用するため、不可能である。
【0005】
【発明が解決しようとする課題】
本発明は、話者に依存する音声認識と話者に依存しない音声認識との利点を組み合わせた遠隔制御装置に音声認識インターフェースを追加する。
【0006】
【課題を解決するための手段】
完全な音声データベースは、例えばPC、テレビ受像機、セットトップボックス(STB)上で実行することができ、又はネットワーク(例えば、インターネット若しくは他の広域ネットワーク)を通じてアクセス可能である。
【0007】
データベースは、遠隔制御装置に備えることができるコンパクトディスク(CD−ROM)又は他の記憶媒体上に記憶することができる。この場合、PC、テレビ、セットトップボックス(STP)又は制御される電子装置のようなローカルダウンロード装置を通じてダウンロードが行われる。
【0008】
データベースにアクセスするためにネットワークを使用するとき、先ず、テンプレートが、制御される電子装置、即ちPC、テレビジョン受像機、セットトップボックス(STB)のようなアクセス装置を通じてそのネットワークから読み出され、次に、遠隔制御装置に(多分、ローカル通信システムを通じてインターネットアクセス装置からダウンロード装置に配信された後に)ダウンロードされる。
【0009】
データベースは、全種類の異なる命令又は単語を記憶するため、多言語辞書のようなものである。使いやすいユーザーインターフェース、検索機能等により、ユーザは自分の好きな言語の辞書から単語の集合を選択することができる。このデータベースは、音声テンプレートのデータベースを特徴としており、選択された単語の音響テンプレートを調べる。次に、これらのテンプレートは、有線又は無線リンクによって遠隔制御装置に転送されることができる。PCをベースにした辞書ソフトウェアから単語を選択する代わりに、制御されるテレビジョン受信機によって表示されることができるインターネットサービス−データベースを用いることも可能である。必要な音声命令が、遠隔制御装置を通じて選択され、インターネットを通じてテンプレートデータを受信するテレビジョン受信機から遠隔制御装置に転送される。
【0010】
本発明の利点は、言語を選択し、単語を選択し、単語を変更することによって遠隔制御装置をすばやくカスタマイズするためユーザは高い自由度を持つという点である。ユーザは、必要とする音声命令に対して最も洗練されたテンプレートを常に又は自動的にダウンロードすることができる。このシステムは話者に依存しないシステムであり、これは、家族の皆が音声認識装置を訓練すること無く選択された音声命令を用いることができることを意味する。遠隔制御装置は、全ての国で同一である”空の”装置として、販売することができる。
【0011】
本発明の他の態様は、ユーザが、1つ以上の音声テンプレートに属する単語であって、遠隔制御装置のLCD上に表示することができる単語の英数字表示をダウンロードすることができることである。これは、ユーザが、訓練した命令の一覧をスクロールし、もはや必要でない特定の命令を消去するのに役立つ。
【0012】
本発明の上記の目的、特徴及び利点は、本発明の好適実施例が図によって示されている添付の図面を用いて、以下の記載からさらに明らかになるだろう。
【0013】
【発明の実施の形態】
図1は、プログラム可能な遠隔制御装置1のブロック図を示す。プログラム可能ということは、遠隔制御装置1が特定の音声命令を認識できるようにテンプレート(データ)の集合をデータベース2,2a又は20から遠隔制御装置1のメモリにダウンロードすることができることを意味する。プログラミングは、コンパクトディスク(CD)又はハードドライブのような局所記憶メモリにデータベース2を記憶するPC4を通じて行うことができる。PC4は、データバス3を通じてデータベース2からデータを受け取る。ユーザは使いやすいユーザインターフェース、例えばPC4上で実行されるプログラムを通じて、音声命令を表す単語の集合を選択することができる。この単語の集合は、音声命令を、音声認識装置が当該音声命令を認識した後に遠隔制御装置によって発生し且つ特定の電子装置に伝送される信号にリンクする。テンプレートデータは、赤外光を用いた無線リンク11又は伝送ケーブル(図示せず)によって、PC4から遠隔制御装置1に伝送することができる。
【0014】
局所データベースを用いる代わりに、インターネット及び/又は電話線9又はTV放送7,21のような他の通信チャネルを通じてデータベース2a,20にアクセスすることができる。データベース2の項目は、プログラム可能な遠隔制御装置1によって制御される遠隔PC10,テレビ8又はセットトップボックス19で選択されることができる。PC10、TV装置8又はセットトップボックス19との間の通信は、符号11により示される無線によって実現される。
【0015】
遠隔制御装置1をプログラムするために、他のいろいろな装置を利用してもよい。リンク及び命令を消去し追加し又は変更するため、遠隔制御装置の記憶された音声作動命令を、遠隔制御装置自体の表示部で表示できるようにすることが可能である。遠隔制御装置の記憶された音声作動命令をPC4、10又はテレビ8に表示できるようにすることも可能である。したがって、先ず、遠隔制御装置の特定のキーを押した後又は特定の音声命令の後、記憶されたデータは使用する表示装置に伝送される。この特定の命令のテンプレートデータは、ユーザによって消去可能であってはならないであろう。検出可能命令の集合を再プログラミングした後に、新しいテンプレートデータ及び必要であれば各検出可能音声命令の英数字表示が遠隔制御装置1のメモリに転送される。テンプレートデータの送信に必要な時間を短縮するため、変更されなかった検出可能命令のテンプレートデータは伝送されないことは明らかである。
【0016】
図2は、プログラム可能な遠隔制御装置1の詳細ブロック図を示す。この遠隔制御装置は送信機ユニット12を有する。この送信ユニット12は、赤外線(IR)又はRFを用いて、遠隔制御命令を、TV装置、VCR、セットトップボックス又はPCのような制御される電子装置にワイヤレスで送信するために用いられる。遠隔制御装置は、送信機ユニット12とは別個にテンプレート受信機22を有する。この受信機22も、例えばIR又はRFを通じてワイヤレスで動作することができる。遠隔制御装置はテンプレート受信機22によって外部データベースからテンプレートデータを受け取る。本発明の他の好適実施例では、遠隔制御装置は、テンプレートデータを受信し且つ制御される電子装置に制御命令を送信するための1つの送信機12を用いる。
【0017】
遠隔制御装置1の動作は中央処理装置(CPU)13により制御される。受信したテンプレートデータ及び検出可能音声命令用の英数字表示のような付加データは、CPU13によってメモリ15に記憶される。CPU13は外部電子装置を制御するための遠隔信号を発生する。この遠隔信号は、マイクロフォン16によって検出され音声認識処理装置14によって分析される音声信号によって表される音声パターンに対応する。音声認識処理装置14は、その音声パターンと、音声命令を検出するための記憶されたテンプレートデータとを比較する。遠隔制御装置1は、キーパッド18及び表示部17を有することができる。
【0018】
本発明は、その意図又は本質的な特性から逸脱しない他の特定の形式で具体化することもできる。従って、本実施例は、すべての点で解説的なものであって、限定するものではないと考えるべきである。
【図面の簡単な説明】
【図1】プログラム可能な遠隔制御装置のブロック図である。
【図2】プログラム可能な遠隔制御装置の詳細ブロック図である。
Claims (14)
- 電子装置を制御するための遠隔制御装置であって、前記遠隔制御装置が、音声命令データを検出するマイクロフォンと、
前記マイクロフォンによって検出された音声命令を認識するためにテンプレートデータを用いて音声認識アルゴリズムを実行し、且つ前記電子装置を制御するための処理装置と、
前記遠隔制御装置が前記音声命令を認識することができるようにするために外部データベースからテンプレートデータを受信する受信機と、
受信された前記テンプレートデータを記憶するためのメモリと、
を有する遠隔制御装置。 - 前記データベースは、PC、TV受信機、セットトップボックスのようなアクセス装置によって、又は遠隔制御装置によって直に、アクセス可能である請求項1に記載の遠隔制御装置。
- 前記アクセス装置は、前記データベースを記憶するための記憶装置又はメモリを有する請求項2に記載の遠隔制御装置。
- 前記データベースは、インターネット又は他の広域ネットワークのようなネットワークを通じて、前記アクセス装置にアクセス可能である請求項2に記載の遠隔制御装置。
- 新たな音声命令を認識するために必要な新たなテンプレートデータが先ず前記データベースに記憶される命令群から選択され、次に前記遠隔制御装置にダウンロードされ記憶される請求項2,3又は4に記載の遠隔制御装置。
- 前記データベースは、前記インターネットにリンクされるテレビジョン受信機によって表示され、前記選択されたテンプレートは、前記インターネットを通じてダウンロードされ、前記テレビジョン受信機から前記遠隔制御装置にワイヤレスで送られる請求項5に記載の遠隔制御装置。
- 各検出可能音声命令用の英数字表現が前記遠隔制御装置のメモリに記憶される請求項1に記載の遠隔制御装置。
- 前記遠隔制御装置は、前記検出可能音声命令の英数字表現を表示するための表示部を有する請求項7に記載の遠隔制御装置。
- 前記ユーザは、表示された前記検出可能音声命令の一覧をスクロールすることができるとともに、不要な命令を削除することができ、これにより、関連する前記テンプレートデータを前記メモリから消去することができる請求項8に記載の遠隔制御装置。
- 前記電子装置は、テレビジョン受信機、セットトップボックス、VCR又は前記アクセス装置である請求項1又は2に記載の遠隔制御装置。
- 選択可能な前記命令は前記電子装置をオン又はオフにし、前記電子装置のチャンネルをチューニングし、音量を増減する請求項1に記載の遠隔制御装置。
- 前記テンプレートデータの各々は、前記遠隔制御装置によって実行することができる特定の命令にリンクされることができる請求項1に記載の遠隔制御装置。
- 外部データベースから、請求項1乃至12のうちの何れか1項に記載の遠隔制御装置のメモリにテンプレートデータをダウンロードする方法であって、前記方法は、
a)新たな音声命令を認識するために必要なテンプレートデータがデータベースに記憶される命令群から選択されるステップ、及び
b)前記必要なテンプレートデータが、前記データベースから前記遠隔制御装置に送信され、前記遠隔制御装置に記憶されるステップ、
を有する方法。 - 前記テンプレートデータが、例えば前記インターネット又は他の広域ネットワーク等のネットワークを通じて供給される請求項13に記載の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP00202919 | 2000-08-21 | ||
PCT/EP2001/009343 WO2002017625A1 (en) | 2000-08-21 | 2001-08-10 | A voice controlled remote control with downloadable set of voice commands |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004507936A true JP2004507936A (ja) | 2004-03-11 |
Family
ID=8171933
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002522190A Withdrawn JP2004507936A (ja) | 2000-08-21 | 2001-08-10 | ダウンロード可能な音声命令の集合による音声制御型遠隔制御装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20020071577A1 (ja) |
EP (1) | EP1314310A1 (ja) |
JP (1) | JP2004507936A (ja) |
KR (1) | KR20020043635A (ja) |
CN (1) | CN1196324C (ja) |
WO (1) | WO2002017625A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019107224A1 (ja) * | 2017-12-01 | 2019-06-06 | ヤマハ株式会社 | 機器制御システム、機器制御方法、及びプログラム |
US10938595B2 (en) | 2018-01-24 | 2021-03-02 | Yamaha Corporation | Device control system, device control method, and non-transitory computer readable storage medium |
Families Citing this family (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1184841A1 (de) * | 2000-08-31 | 2002-03-06 | Siemens Aktiengesellschaft | Sprachgesteuerte Anordnung und Verfahren zur Spracheingabe und -erkennung |
US10915296B2 (en) | 2000-11-01 | 2021-02-09 | Flexiworld Technologies, Inc. | Information apparatus that includes a touch sensitive screen interface for managing or replying to e-mails |
CN100334577C (zh) | 2000-11-01 | 2007-08-29 | 福来西奥德技术公司 | 用于设备到设备的普适数字输出的控制器及管理器 |
US11204729B2 (en) | 2000-11-01 | 2021-12-21 | Flexiworld Technologies, Inc. | Internet based digital content services for pervasively providing protected digital content to smart devices based on having subscribed to the digital content service |
US10860290B2 (en) | 2000-11-01 | 2020-12-08 | Flexiworld Technologies, Inc. | Mobile information apparatuses that include a digital camera, a touch sensitive screen interface, support for voice activated commands, and a wireless communication chip or chipset supporting IEEE 802.11 |
WO2002042896A1 (en) | 2000-11-20 | 2002-05-30 | Flexiworld Technologies, Inc. | tOBILE AND PERVASIVE OUTPUT COMPONENTS |
US20020097408A1 (en) | 2001-01-19 | 2002-07-25 | Chang William Ho | Output device for universal data output |
US20030061033A1 (en) * | 2001-09-26 | 2003-03-27 | Dishert Lee R. | Remote control system for translating an utterance to a control parameter for use by an electronic device |
US7324947B2 (en) | 2001-10-03 | 2008-01-29 | Promptu Systems Corporation | Global speech user interface |
JP2003202888A (ja) * | 2002-01-07 | 2003-07-18 | Toshiba Corp | 無線通信機能付きヘッドセットおよびこれを用いた音声処理システム |
US7072686B1 (en) | 2002-08-09 | 2006-07-04 | Avon Associates, Inc. | Voice controlled multimedia and communications device |
US8068881B2 (en) * | 2002-08-09 | 2011-11-29 | Avon Associates, Inc. | Voice controlled multimedia and communications system |
US7006006B2 (en) * | 2002-12-05 | 2006-02-28 | Witkow Edward H | System and method for controlling home entertainment units with radio frequency and infrared signals |
US7127305B1 (en) | 2003-07-21 | 2006-10-24 | Eyecon Technologies, Inc. | Method and apparatus for unified control of multiple devices |
US20060028337A1 (en) * | 2004-08-09 | 2006-02-09 | Li Qi P | Voice-operated remote control for TV and electronic systems |
US20060253205A1 (en) * | 2005-05-09 | 2006-11-09 | Michael Gardiner | Method and apparatus for tabular process control |
US8620667B2 (en) * | 2005-10-17 | 2013-12-31 | Microsoft Corporation | Flexible speech-activated command and control |
US20070136778A1 (en) * | 2005-12-09 | 2007-06-14 | Ari Birger | Controller and control method for media retrieval, routing and playback |
US20070143111A1 (en) * | 2005-12-21 | 2007-06-21 | Conley Kevin M | Voice controlled portable memory storage device |
US20070143117A1 (en) * | 2005-12-21 | 2007-06-21 | Conley Kevin M | Voice controlled portable memory storage device |
US8063749B2 (en) * | 2006-05-16 | 2011-11-22 | X10 Ltd. | Multifunctional two-way remote control device |
CN101902587A (zh) * | 2009-06-01 | 2010-12-01 | 沈阳同方多媒体科技有限公司 | 一种通过语音对电视机进行控制的系统 |
US11012732B2 (en) | 2009-06-25 | 2021-05-18 | DISH Technologies L.L.C. | Voice enabled media presentation systems and methods |
US8522283B2 (en) * | 2010-05-20 | 2013-08-27 | Google Inc. | Television remote control data transfer |
KR101917182B1 (ko) * | 2012-04-30 | 2019-01-24 | 삼성전자주식회사 | 영상처리장치, 음성취득장치, 그 음성인식방법 및 음성인식시스템 |
CN102760433A (zh) * | 2012-07-06 | 2012-10-31 | 广东美的制冷设备有限公司 | 联网家电用声控遥控器及其控制方法 |
US9478123B2 (en) | 2012-07-31 | 2016-10-25 | Intellectual Discovery Co., Ltd. | Remote control device and method |
KR20140060040A (ko) | 2012-11-09 | 2014-05-19 | 삼성전자주식회사 | 디스플레이장치, 음성취득장치 및 그 음성인식방법 |
WO2015018440A1 (en) * | 2013-08-06 | 2015-02-12 | Saronikos Trading And Services, Unipessoal Lda | System for controlling electronic devices by means of voice commands, more specifically a remote control to control a plurality of electronic devices by means of voice commands |
US11334314B2 (en) * | 2013-10-25 | 2022-05-17 | Voyetra Turtle Beach, Inc. | Networked gaming headset with automatic social networking |
US20150256873A1 (en) * | 2014-03-04 | 2015-09-10 | Microsoft Technology Licensing, Llc | Relayed voice control of devices |
CN105023575B (zh) * | 2014-04-30 | 2019-09-17 | 中兴通讯股份有限公司 | 语音识别方法、装置和系统 |
KR102277259B1 (ko) | 2014-11-26 | 2021-07-14 | 엘지전자 주식회사 | 디바이스 제어 시스템, 디지털 디바이스 및 디지털 디바이스 제어 방법 |
CN104918083A (zh) * | 2015-07-03 | 2015-09-16 | 成都怡云科技有限公司 | 一种学习型智能酒店客房电视系统 |
US9697824B1 (en) * | 2015-12-30 | 2017-07-04 | Thunder Power New Energy Vehicle Development Company Limited | Voice control system with dialect recognition |
KR20180027901A (ko) * | 2016-09-07 | 2018-03-15 | 삼성전자주식회사 | 원격 제어 장치 및 그 제어 방법 |
KR20180028703A (ko) * | 2016-09-09 | 2018-03-19 | 삼성전자주식회사 | 디스플레이 장치 및 이를 이용한 원격 제어 장치 설정 방법 |
US11373645B1 (en) * | 2018-06-18 | 2022-06-28 | Amazon Technologies, Inc. | Updating personalized data on a speech interface device |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5425128A (en) * | 1992-05-29 | 1995-06-13 | Sunquest Information Systems, Inc. | Automatic management system for speech recognition processes |
AU4773793A (en) * | 1992-07-17 | 1994-02-14 | Voice Powered Technology International, Inc. | Universal remote control device |
DE69425198T2 (de) * | 1993-08-13 | 2001-03-15 | Toshiba Kawasaki Kk | Zweiwegkabelfernsehsystem |
US5774859A (en) * | 1995-01-03 | 1998-06-30 | Scientific-Atlanta, Inc. | Information system having a speech interface |
US6057874A (en) * | 1996-11-21 | 2000-05-02 | General Instrument Corporation | Infrared blaster control system in cable television communication systems |
FR2783625B1 (fr) * | 1998-09-21 | 2000-10-13 | Thomson Multimedia Sa | Systeme comprenant un appareil telecommande et un dispositif de telecommande vocale de l'appareil |
US6543052B1 (en) * | 1999-07-09 | 2003-04-01 | Fujitsu Limited | Internet shopping system utilizing set top box and voice recognition |
EP1069694A1 (en) * | 1999-07-16 | 2001-01-17 | Alcatel | Telecommunication system with downloadable interface |
-
2001
- 2001-08-10 EP EP01974178A patent/EP1314310A1/en not_active Withdrawn
- 2001-08-10 KR KR1020027004886A patent/KR20020043635A/ko not_active Application Discontinuation
- 2001-08-10 CN CNB018024858A patent/CN1196324C/zh not_active Expired - Fee Related
- 2001-08-10 JP JP2002522190A patent/JP2004507936A/ja not_active Withdrawn
- 2001-08-10 WO PCT/EP2001/009343 patent/WO2002017625A1/en not_active Application Discontinuation
- 2001-08-21 US US09/933,842 patent/US20020071577A1/en not_active Abandoned
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019107224A1 (ja) * | 2017-12-01 | 2019-06-06 | ヤマハ株式会社 | 機器制御システム、機器制御方法、及びプログラム |
JP2019101730A (ja) * | 2017-12-01 | 2019-06-24 | ヤマハ株式会社 | 機器制御システム、機器制御方法、及びプログラム |
US11574631B2 (en) | 2017-12-01 | 2023-02-07 | Yamaha Corporation | Device control system, device control method, and terminal device |
US10938595B2 (en) | 2018-01-24 | 2021-03-02 | Yamaha Corporation | Device control system, device control method, and non-transitory computer readable storage medium |
Also Published As
Publication number | Publication date |
---|---|
EP1314310A1 (en) | 2003-05-28 |
KR20020043635A (ko) | 2002-06-10 |
CN1196324C (zh) | 2005-04-06 |
WO2002017625A1 (en) | 2002-02-28 |
CN1389064A (zh) | 2003-01-01 |
US20020071577A1 (en) | 2002-06-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2004507936A (ja) | ダウンロード可能な音声命令の集合による音声制御型遠隔制御装置 | |
US11996100B2 (en) | System and method for voice actuated configuration of a controlling device | |
KR102304052B1 (ko) | 디스플레이 장치 및 그의 동작 방법 | |
US20090112592A1 (en) | Remote controller with speech recognition | |
US20240046934A1 (en) | Display apparatus capable of releasing a voice input mode by sensing a speech finish and voice control method thereof | |
US20150373393A1 (en) | Display device and operating method thereof | |
KR102147329B1 (ko) | 영상 표시 기기 및 그의 동작 방법 | |
KR20180024927A (ko) | 디스플레이 장치 및 디스플레이 장치의 제어 방법 | |
WO2007133716A2 (en) | Multimodal communication and command control systems and related methods | |
US20160210966A1 (en) | Voice recognition processing device, voice recognition processing method, and display device | |
EP1207516B1 (en) | Device setter, device setting system, and recorded medium where device setting program is recorded | |
US20030191629A1 (en) | Interface apparatus and task control method for assisting in the operation of a device using recognition technology | |
KR102501655B1 (ko) | 디스플레이장치, 음성취득장치 및 그 음성인식방법 | |
KR20190100630A (ko) | 디스플레이 장치 및 그의 동작 방법 | |
US11664024B2 (en) | Artificial intelligence device | |
US20210306690A1 (en) | Channel recommendation device and operating method therefor | |
KR101859614B1 (ko) | 디스플레이 장치, 전자 장치, 대화형 시스템 및 이들의 제어 방법 | |
JP2005065156A (ja) | 音声認識処理システム及びそれに用いる映像信号記録再生装置 | |
KR20100081186A (ko) | 제어데이터 전송방법, 피제어장치, 원격제어 중개장치, 통합 원격제어장치, 서버, 그리고, 원격제어 시스템 | |
EP4116968A1 (en) | Natural language processing device | |
KR20020011028A (ko) | 음성신호를 이용한 원격 제어방법 및 제어장치 | |
KR20200110723A (ko) | 음성 제어를 수행하는 디스플레이 장치 및 그 음성 제어 방법 | |
KR20230007994A (ko) | 음성 제어를 수행하는 디스플레이 장치 및 그 음성 제어 방법 | |
KR20200095442A (ko) | 디스플레이장치, 음성취득장치 및 그 음성인식방법 | |
JP2021092612A (ja) | コマンド制御装置、制御方法および制御プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20040903 |
|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20081104 |