JP2005065156A - 音声認識処理システム及びそれに用いる映像信号記録再生装置 - Google Patents

音声認識処理システム及びそれに用いる映像信号記録再生装置 Download PDF

Info

Publication number
JP2005065156A
JP2005065156A JP2003295969A JP2003295969A JP2005065156A JP 2005065156 A JP2005065156 A JP 2005065156A JP 2003295969 A JP2003295969 A JP 2003295969A JP 2003295969 A JP2003295969 A JP 2003295969A JP 2005065156 A JP2005065156 A JP 2005065156A
Authority
JP
Japan
Prior art keywords
remote control
voice recognition
control device
recognition processing
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003295969A
Other languages
English (en)
Inventor
Kazuyuki Miyauchi
和行 宮内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP2003295969A priority Critical patent/JP2005065156A/ja
Publication of JP2005065156A publication Critical patent/JP2005065156A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

【課題】 リモコン装置にマイクを設けた従来の音声認識処理システムでは、リモコン装置本体に音声認識処理システムの中央処理装置、認識処理用参照辞書データのための外部記憶装置を搭載することで、リモコン装置のコスト上昇が避けられない。
【解決手段】 テレビ放送録画機40を操作するリモコン装置20は、マイク26から入力してディジタル化した音声データを、無線通信部29から無線アクセスポイント37、インターネット接続装置36、インターネット35からなる双方向の伝送路を経由して接続された音声認識処理サーバ30に送信する。音声認識処理サーバ30は入力音声データの音声認識処理を行い、その音声認識結果を、上記の伝送路を経由してリモコン装置20に返送する。リモコン装置20は、受信した音声認識結果を赤外線通信により、テレビ放送録画機40に送信して、録画予約等の検索ワードの表示など、その動作を制御する。
【選択図】 図1


Description

本発明は音声認識処理システム及びそれに用いる映像信号記録再生装置に係り、特に音声認識結果を赤外線通信により送信する音声認識処理システム、及び送信された音声認識結果を検索キーワードに利用する映像信号記録再生装置に関する。
テレビ放送の番組情報をハードディスク(以下HDD)などの大容量の記録媒体に録画できるハードディスクレコーダやビデオディスクレコーダなどの装置が近年増えてきている。これらの装置(以下VDRと略す)は長時間の録画が可能なため、録画済み番組が数十作品に及ぶこともあり、その選出のために番組名や出演者名などの番組情報から指定キーワードによって検索することが可能である。また、録画予約に関しても、従来のVDRでは、テレビ放送波に重畳されて受信される電子番組表(以下EPG)や、ネットワーク接続機能に基づいて入手したインターネット上の電子番組表(以下iEPG)の放送予定番組情報からキーワード指定などによる番組検索が可能で、絞り込まれた候補番組を録画予約の指定に利用することが可能である。
どちらの場合も、検索条件のキーワード指定はテレビ画面に表示される対話的操作画面の表示に従い、条件設定を行う。この操作は一般に赤外線リモコンの操作ボタンを駆使して条件を指定している。例えば、予め装置側が設定した規定のキーワードを画面に表示してその中から選択する方法で利用者操作の煩雑さを軽減しているものもある。
また、上記のEPG情報やiEPG情報を基に、録画予約を行う場合、EPGやiEPG情報は、放送局毎に時系列表示、時間帯毎に各放送局の番組を並列表示、指定条件に一致する番組だけを表示などの提示方法がある。このうち、指定条件に一致したものを表示する場合には、予め準備された条件を選択する方法と、利用者が自由に条件を指定する方法がある。前者の例としては、番組のジャンル分けの指定で、「映画」、「スポーツ」、「音楽」などの候補から選択する場合である。後者の例は、番組出演者名を指定する場合で、歌手、俳優、スポーツ選手の名前を指定することになる。この場合、候補として名前を表示するのには対照の名前が多すぎるので、実際には赤外線リモコンの操作ボタンを駆使して文字入力をして指定することになる。
ところが、一般に、赤外線リモコン装置の操作ボタンは、文字入力に適した配置とはなっておらず、VDR出力画面上にキーボードを模した画像や、五十音表を表示し、リモコン装置の矢印キーによる上下左右方向の画面上のカーソル移動により、一文字ずつ選択させる、いわゆるソフトウェアキーボードが採用される。しかし、利用者に自由にキーワード設定を許すために、画面上にキーボードの画像を表示してキーを選択させるソフトウェアキーボードでは、リモコン装置のボタンを押す操作が非常に多くなり、使い勝手が悪く、入力操作が容易ではない。
そこで、この点を改善するために、従来より音声にて入力を行う音声認識処理システムが知られている(例えば、特許文献1参照)。この特許文献1記載の従来の音声認識処理システムでは、ディジタル放送受信装置本体のマイクで音声入力し、ディジタル放送受信装置本体内の音声認識手段で音声認識処理を行う第1の方法と、リモコン装置のマイクで音声を入力し、リモコン装置内の音声認識手段で音声認識処理を行い、認識結果をリモコン信号を用いてディジタル放送受信装置本体に送信する第2の方法とが提案されている。
図12は従来の音声認識処理システムの一例のブロック図を示す。この音声認識処理システムは、上記の第1の方法を実現する処理システムであり、ディジタル放送受信装置1が、中央処理装置3、メモリ装置4、外部記憶装置5による音声認識手段を有すると共に、テレビ放送波を選局受信するチューナ装置6、選局したテレビ放送画像などを表示する表示装置7、リモコン装置2からの赤外線を受光して光電変換する赤外線受光部8、音声を収音するマイク9を有している。
リモコン装置2はディジタル放送受信装置1を遠隔操作するための装置で、遠隔操作信号であるリモコン信号を赤外線の形態で発光する赤外線発光部10と、音声入力のための操作ボタン(音声入力ボタン)11と、データ転送のための操作ボタン12とを有している。
次に、この従来の音声認識処理システムの動作について、図13のフローチャートと共に説明する。まず、利用者はリモコン装置2の操作ボタン(音声入力ボタン)11を押下すると(ステップS101)、リモコン装置2の赤外線発光部10から操作ボタン11の押下を示すコードの赤外線リモコン信号が発光される。この赤外線リモコン信号は、赤外線受光部8により受光されて光電変換され、得られた電気信号に基づきディジタル放送受信装置1を音声認識処理可能状態とする。
続いて、利用者がディジタル放送受信装置1の本体に設けられたマイク9に向かって入力しようとする操作を発声すると(ステップS102)、マイク9により音響−電気変換されて音声信号が発生され、その音声信号がディジタル信号に変換された後、中央処理装置3、メモリ装置4及び外部記憶装置5により公知の音声認識処理が行われる(ステップS103)。この音声認識処理結果は、中央処理装置3にて検索キーワードに利用される(ステップS104)。
図14は従来の音声認識処理システムの他の例のブロック図を示す。この音声認識処理システムは、上記の第2の方法を実現する処理システムであり、ディジタル放送受信装置13が、テレビ放送波を選局受信するチューナ装置6、選局したテレビ放送画像などを表示する表示装置7、リモコン装置2からの赤外線を受光して光電変換する赤外線受光部8を有する従来の構成である。これに対し、リモコン装置14は、図12に示したリモコン装置2と同様に、赤外線発光部10、操作ボタン(音声入力ボタン)11及びデータ転送用操作ボタン12を有するが、更にこれに加えて、マイク15、中央処理装置16、メモリ装置17及び外部記憶装置18を有している点に特徴がある。
次に、この従来の音声認識処理システムの動作について、図15のフローチャートと共に説明する。まず、利用者はリモコン装置14の操作ボタン(音声入力ボタン)11を押下すると(ステップS201)、リモコン装置14の赤外線発光部10から操作ボタン11の押下を示すコードの赤外線リモコン信号が発光される。この赤外線リモコン信号は、赤外線受光部8により受光されて光電変換される。
続いて、利用者がリモコン装置14に設けられているマイク15に向かって入力しようとする操作を発声すると(ステップS202)、マイク15により音響−電気変換されて音声信号が発生され、その音声信号がディジタル信号に変換された後、リモコン装置14内の中央処理装置16、メモリ装置17及び外部記憶装置18により公知の音声認識処理が行われる(ステップS203)。その音声認識結果は、一旦メモリ装置17に蓄積される。
続いて、利用者がリモコン装置14のデータ転送用ボタン12を押下すると、中央処理装置16の制御の下で、メモリ装置17から上記の音声認識結果が読み出されて赤外線発光部10に供給され、音声認識結果に応じたコードの赤外線リモコン信号が発光されてディジタル放送受信装置13へ送信される(ステップS204)。ディジタル放送受信装置13は、赤外線受光部8にて上記の赤外線リモコン信号を受光して電気信号に変換し、得られた電気信号に基づき所定の制御回路により検索キーワードに利用する(ステップS205)。
特開2002−290859号公報
しかるに、図12に示した従来の音声認識処理システムでは、リモコン装置2を操作する利用者とマイク9が離れているために、入力される音声に雑音が入りやすいという欠点がある。また、ディジタル放送受信装置1本体に音声認識処理システムとして高機能の中央処理装置3、認識処理参照辞書データのための外部記憶装置5が必要で、システム全体が高価となる。また、この認識処理用参照辞書データは日々更新されることが望ましく、更新のための処理が煩雑である。
一方、図13に示した従来の音声認識処理システムでは、利用者が操作するリモコン装置14にマイク15が設けられているため、マイク15からの雑音を低減する効果はあるが、リモコン装置14本体に音声認識処理システムの中央処理装置16、認識処理用参照辞書データのための外部記憶装置18を搭載することで、リモコン装置14のコスト上昇が避けられない。また、認識処理用辞書の更新用記憶領域を想定した外部記憶装置18のリモコン装置14への搭載は更なるコスト上昇につながるという問題がある。
本発明は、以上の点に鑑みなされたもので、マイクからの雑音を低減する効果を備え、かつ、リモコン装置のコスト上昇を抑え得る音声認識処理システム及びそれに用いる映像信号記録再生装置を提供することを目的とする。
また、本発明の他の目的は、キーワード入力の操作性を改善し得る音声認識処理システム及びそれに用いる映像信号記録再生装置を提供することにある。
上記の目的を達成するため、第1の発明の音声認識処理システムは、映像信号記録再生装置を遠隔操作する機能と音声入出力機能を備えたリモコン装置と、入力された音声信号の音声認識処理を行う音声認識処理サーバと、リモコン装置及び音声認識処理サーバ間を回線接続する所定の伝送手段とよりなる音声認識処理システムであって、リモコン装置は、入力された映像信号記録再生装置の動作制御に関する音声を収音して、ディジタル音声データに変換する音声入力手段と、ディジタル音声データを所定の伝送手段を介して音声認識処理サーバに送信する第1の送信手段と、音声認識処理サーバによるディジタル音声データの音声認識結果を、所定の伝送手段を介して音声認識処理サーバから受信する第1の受信手段と、映像信号記録再生装置を赤外線リモコン信号により遠隔操作して所望の動作を行わせると共に、第1の受信手段により受信した音声認識結果を映像信号記録再生装置へ赤外線リモコン信号の形態で送信して、映像信号記録再生装置に音声認識結果に応じた動作を行わせる第2の送信手段とを有し、
音声認識処理サーバは、リモコン装置から所定の伝送手段を介して送信されたディジタル音声データを受信する第2の受信手段と、第2の受信手段により受信したディジタル音声データの音声認識処理を行い、得られた音声認識結果を、所定の伝送手段を介してリモコン装置へ送信する音声認識結果送信手段とを有する構成としたものである。
この発明では、リモコン装置は音声認識処理機能を有しておらず、外部の音声認識処理サーバに所定の伝送手段を介して接続し、リモコン装置にて映像信号記録再生装置の動作制御に関する音声を入力して得たディジタル音声データを音声認識処理サーバにより音声認識処理させ、これにより得られた音声認識処理結果を受けて、リモコン装置がリモコン信号の形態で映像信号記録再生装置へ送信する。
また、上記の目的を達成するため、第2の発明の音声認識処理システムは、リモコン装置が、第1の受信手段により受信した音声認識結果をリモコン信号送信手段により映像信号記録再生装置へ赤外線リモコン信号の形態で送信する際に、少なくとも映像信号記録再生装置のシリアル番号とリモコン装置固有の所定の番号とを送信すると共に、映像信号記録再生装置のシリアル番号とリモコン装置固有の所定の番号とを組み合わせID番号として記憶する不揮発性の外部記憶装置を有することを特徴とする。
また、上記の目的を達成するため、第3の発明の音声認識処理システムは、音声認識処理サーバを複数のリモコン装置に共通に設け、所定の伝送手段は、音声認識処理サーバに接続される通信ネットワークと、通信ネットワークとリモコン装置とを個別に接続する無線通信網とからなることを特徴とする。この発明では、リモコン装置がリモコン信号の伝送路とは異なる伝送路で音声認識処理サーバに接続して音声認識処理結果を得ることができる。
また、上記の目的を達成するため、第4の発明の映像信号記録再生装置は、第1の発明の音声認識処理システムにおいて用いられる映像信号記録再生装置であって、リモコン装置から送信される赤外線リモコン信号を受信するリモコン信号受信手段と、初期設定時にリモコン装置から送信された、リモコン装置固有の所定の番号と映像信号記録再生装置自身のシリアル番号を記憶するID番号記憶用外部記憶装置と、リモコン信号受信手段により受信した信号が、映像信号記録再生装置自身のシリアル番号及びリモコン装置固有の所定の番号からなる組み合わせID番号と音声認識結果であるときは、ID番号記憶用外部記憶装置に記憶されているリモコン装置固有の所定の番号と映像信号記録再生装置自身のシリアル番号を、受信した組み合わせID番号と比較し、両者が一致するときにのみ音声認識結果に基づく文字列を表示し、両者が不一致のときは音声認識結果を破棄する処理手段とを有することを特徴とする。
この発明では、リモコン装置から受信した映像信号記録再生装置自身のシリアル番号及びリモコン装置固有の所定の番号からなる組み合わせID番号と、映像信号記録再生装置が予め記憶している組み合わせ番号とが一致するときにのみ、音声認識結果の文字列を表示する。
第1の発明によれば、リモコン装置にて映像信号記録再生装置の動作制御に関する音声を入力して得たディジタル音声データを音声認識処理サーバにより音声認識処理させ、これにより得られた音声認識処理結果を受けて、リモコン装置がリモコン信号の形態で映像信号記録再生装置へ送信するようにしたため、リモコン装置のボタンを押す操作を非常に少なくできると共に、自由なキーワード入力の操作性を改善することができる。
また、第1の発明によれば、リモコン装置の音声入力時には音声認識処理サーバと所定の伝送手段で接続されており、利用者が発声時に口元に音声入力手段を近付けることが可能なため、周囲の雑音の少ない音声入力ができる。
更に、第1の発明によれば、リモコン装置とは別に設けた音声認識処理サーバにより、音声認識処理を行い、得られた音声認識処理結果をオンラインでリモコン装置に伝送するようにしているため、オフライン用の音声データ保持用バッファメモリをリモコン装置に搭載する必要が無く、音声認識処理回路を内蔵するリモコン装置に比べてリモコン装置のコストを大幅に低減できると共に、音声認識処理サーバにより語彙辞書の更新を頻繁に行うことが可能で音声認識精度を向上させることができる。
また、第2の発明によれば、映像信号記録再生装置に対して組み合わせID番号が一致するリモコン装置からの音声認識処理結果による操作のみを可能にできる。
また、第3の発明によれば、リモコン装置がリモコン信号の伝送路とは異なる伝送路で音声認識処理サーバに接続して音声認識処理結果を得るようにしたため、リモコン装置の音声入力時に、リモコン装置の赤外線発光部を映像信号記録再生装置の赤外線受光部に向けてリモコン装置を保持する必要が無く、音声入力の自由度を向上でき、また、音声認識処理サーバを多くのリモコン装置に共用することができ、リモコン装置自体のコスト低減と共に、音声認識処理システム全体も安価に構築できる。
更に、第4の発明によれば、リモコン装置から受信した映像信号記録再生装置自身のシリアル番号及びリモコン装置固有の所定の番号からなる組み合わせID番号と、映像信号記録再生装置が予め記憶している組み合わせ番号とが一致するときにのみ、音声認識結果の文字列を表示するようにしたため、正当権利者のリモコン装置の音声認識結果のみを映像信号記録再生装置の録画予約時や再生時の検索ワードなどに使用できる。
次に、本発明を実施するための最良の形態について図面と共に説明する。図1は本発明になる音声認識処理システムの一実施の形態のブロック図を示す。同図において、音声認識処理システムは、赤外線リモコン信号送信機能と共に無線通信機能を備えたリモコン装置20と、音声認識処理を行う音声認識処理サーバ30と、音声認識処理サーバ30に接続されるインターネット35と、リモコン装置20との間で無線通信する無線アクセスポイント37と、インターネット35と無線アクセスポイント37を接続するインターネット接続装置36と、リモコン装置20により遠隔制御されるテレビ(TV)放送録画機40と、画像表示装置50からなる。
本実施の形態では、テレビ放送録画機40を操作するリモコン装置20に、中央処理装置21、メモリ装置22、不揮発性の外部記憶装置23、操作ボタン24、赤外線発光部25、マイク26、スピーカ27、音声ディジタル変換部28及び無線通信部29を持ち、無線通信部29から無線アクセスポイント37、インターネット接続装置36、インターネット35からなる双方向の伝送路を経由して接続された音声認識処理サーバ30に対して、マイク26から入力した音声をディジタル化したデータを、上記の伝送路を経由して音声認識処理サーバ30に送信し、この音声認識処理サーバ30で音声認識処理を行った音声認識結果を、上記の伝送路を経由してリモコン装置20に返送し、その音声認識結果を赤外線通信により、テレビ放送録画機40に送信してその動作を制御する点に特徴がある。ここでは、テレビ放送録画機40として、録画媒体にハードディスク装置(HDD)45を利用するハードディスクレコーダ(以下VDR)を例にとって説明する。
リモコン装置20、テレビ放送録画機(VDR)40、画像表示装置50、無線アクセスポイント37及びインターネット接続装置36は家庭内に設けられており、音声認識処理サーバ30とインターネット35は屋外に設けられている。音声認識処理サーバ30は、音声認識処理を行う中央処理装置31と、プログラム等を記憶するメモリ装置32と、認識処理用参照辞書データを記憶する外部記憶装置33と、インターネット35に接続するためのイーサネット(登録商標)端子34を有している。
また、無線アクセスポイント37は、リモコン装置20と無線通信するための無線通信部38と、インターネット35に接続するためのイーサネット(登録商標)端子39を有している。この無線アクセスポイント37は、一般のパーソナルコンピュータ用に利用しているものと共用可能である。
リモコン装置20は、一般に複数のビデオ装置(VDRを含む)が1台のテレビジョン受像機(TV装置)に接続される場合を想定しており、同一メーカーのビデオ装置に対して、赤外線リモコン信号を複数の体系で準備している。具体的には、「ビデオコードA」、「ビデオコードB」のような形で2台のビデオ装置本体と単一のリモコン装置の設定が可能になっている。このリモコン装置20の操作ボタン24は、図2に示すように、装置本体の正面パネルに設けられた多数のボタン24−1〜21−38からなる。
例えば、電源ボタン24−1は、VDR40の電源のオン/オフに用いられ、TVボタン24−2はTV装置の制御に用いられ、ボタン24−3、24−4は2台のビデオ装置の制御に用いられ、ボタン24−5〜24−16は選局するチャンネル指定や数字入力に用いられ、ボタン24−18、24−19は、それぞれ選局するチャンネルを上昇方向または下降方向に変化させるために用いられる。また、本実施の形態では、リモコン装置20に音声入力機能が搭載されているので、音声入力ボタン24−37とマイク26が設けられている。
例えば、リモコン装置20の「VTR1」ボタン24−3に、前述した「ビデオコードA」を割り当てる操作は、VDR40本体の電源が入った状態で、転送ボタン24−28を3秒以上押し、続いて数字の1(リモコンコードAの場合)のボタン24−5を押し、続いてVTR1のボタン24−3を押し、最後に電源ボタン24−1を押すことで行われる。本体の電源が正常に切れればリモコンVTR1の「ビデオコード」切り替えが正常に終了したことになる。
図1のVDR(TV放送録画機)40は、中央処理装置41を有すると共に、テレビ放送受信用のチューナ装置42にて外部のアンテナ(図示せず)により受信したテレビ放送波から所望の放送局の放送信号を選局受信し、更に選局受信した放送信号から映像信号と音声信号に変換して、画像出力端子46と音声出力端子47から出力する。
また、利用者の操作により、受信した放送波の映像信号と音声信号はハードディスク装置45に記録することができる。ハードディスク装置45に記録された映像信号と音声信号は、利用者の操作により再生され、映像出力端子46と音声出力端子47から出力できる。また、この録画動作は、事前の録画指示による、タイマー録画を行うことも可能である。更に、VDR40は、画像出力端子46から出力した映像信号を画像表示装置50に表示し、また、音声出力端子47から出力した音声信号を音声出力装置(図示せず)から出力する。
なお、画像表示装置50には後述するように、音声認識処理結果の候補文字列なども表示される。また、画像表示装置50に代えて、モニタ装置を設け、これに画像出力端子46と音声出力端子47とを接続してVDRからの画像と音声の両方を表示及び発音できる構成としてもよい。
中央処理装置41は外部記憶装置44に蓄積された制御プログラムに従い、VDR40全体の制御を行う。その制御の一つとして、タイマー録画がある。タイマー録画は、所望の放送番組の録画開始時刻、録画終了時刻、放送チャンネル、録画品質の指定を予め設定し、VDR40内のメモリ装置43または外部記憶装置44上に保持しておく。VDR40内の時計機能(図示せず)が前述の録画開始時刻になると、中央処理装置41が設定に従い、チューナ装置42のチャンネル切り替え、録画品質の設定、録画開始、および録画停止を行う。
前述したVDR40の録画予約の設定には、電子番組表(EPG)のデータを利用することも可能になっている。EPGデータは、放送波に重畳されて、VDR40内に取り組む方法や、コンピュータとネットワーク接続する機能を持つVDRであれば、ネットワーク経由で取り込むことも可能である。放送波に重畳されたEPGデータを取り込む場合、チューナ装置42で受信した放送波から、EPGデータを抽出し、外部記憶装置44に記録保持することになる。このEPGデータには、放送日、放送開始時刻、放送終了時刻、放送局名、放送番組名、副番組名、番組内容の解説、番組のジャンル、副ジャンル、出演者名、出演者の属性情報などが含まれる。
図3(A)にEPGの標準的な表示例を示す。ここでは特定の放送局の放送番組を放送時間で表示している。番組名が選択状態(ここでは番組名の文字に下線を伏している)であると、その詳細情報が画面下部に表示される。また、特定のジャンル、出演者などの条件設定により、番組表示を行う場合、検索条件を設定することで可能である。
次に、図1の本実施の形態の動作について説明する。まず、本実施の形態のリモコン装置20の初期設定時の動作について図2〜図6を併せ参照して説明する。リモコン装置20は音声入力機能を搭載しており、この音声入力機能にビデオコードAに設定されたVDR機能が対応しているかを確認する手順が必要となるので、この確認手順及びリモコン装置20とVDR40の組み合わせ登録、更にはリモコン装置20と音声認識処理サーバ30との間の接続テストが初期設定時に行われる。
まず、画像表示装置50にVDR40の画像が表示されている状態で、リモコン装置20の「メニュー」ボタン24−36を押し、矢印キー(図2のボタン24−31から24−34)を操作し、画像表示装置50にオプション設定画面を表示させる(図4のステップS1)。続いて、図2の矢印キー(ボタン24−31から24−34)と決定ボタン24−35を操作して、リモコン装置20の登録設定の項目を選択し(図4のステップS2)、リモコンタイプとして「音声認識機能付き」を、リモコンコードとして「A」を指定し(図4のステップS3)、更に音声認識機能付きリモコンの設定項目として、「音声認識機能を有効」に設定する(図4のステップS4)。
続いて、音声認識処理サーバ30を指定する(図4のステップS5)。この場合は、予め登録されている「日本ビクターサーバ」を選択する。続いて、リモコン装置20に内蔵している無線通信部29による無線接続の設定を指定する(図4のステップS6)。この無線接続の設定は家庭内の無線ネットワークとして一般的な無線LAN「IEEE802.11b規格」を利用する。この設定は、IETF(Internet Engineering Task Force)が標準プロトコル「zero configuration」に準拠することで自動的に設定される。
あるいは、図5のフローチャートの手順で手動設定することも可能である。すなわち、「音声入力」ボタン24−37を押した後、3秒程度の一定時間内に「一覧リスト」ボタン24−30を押す(図5のステップS6−1)。この操作により、リモコン装置20内で無線通信設定の変更処理が開始する(図5のステップS6−2)。続いてネットワーク名(ESS−ID)を設定する(図5のステップS6−3)。英数字の入力は、「入力切替」ボタン24−17で英数字の切り替えを行い、数字キー(ボタン24−5から24−16)を使って入力する(図5のステップS6−4)。
続いて、すべて入力したかどうか判断し(図5のステップS6−5)、入力されていなければ入力ミスがあるかどうか判断し(図5のステップS6−6)、入力ミスがあるときには、「戻る」ボタン24−38で修正する(図5のステップS6−7)。このようにしてすべて入力が終わると、続いて暗号キーを入力するかどうか判定する(図5のステップS6−8)。暗号キーを入力する場合は、暗号キーを設定した後(図5のステップS6−9)、「入力切替」ボタン24−17と数字キー(ボタン24−5から24−16)を使って暗号キーを入力する(図5のステップS6−10)。
入力が完了すると、VDR40から「決定」ボタン24−35を押すように指示され(図5のステップS6−11)、当該「決定」ボタン24−35を押すことにより設定を終了する(図5のステップS6−12)。
再び図4に戻って説明するに、ステップS6での無線通信設定が完了すると、続いて、VDR40のシリアル番号を入力し、リモコン装置20とVDR40の組み合わせ登録を行う(図4のステップS7)。次に、このステップS7の処理について、図6のフローチャートと共に詳細に説明する。
まず、「音声入力」24−37ボタンを押した後、3秒程度の一定時間内に「録画モード」ボタン24−29を押す(図6のステップS7−1)。この操作により、リモコン装置20とVDR40の組み合わせ登録動作が開始する(図6のステップS7−2)。条件を満たすと数字キー(図2のボタン24−5から24−16)を使ってVDR40のシリアル番号を入力する(図6のステップS7−3)。入力された数字はリモコン装置20内のメモリ装置22に登録し、リモコン装置20内の赤外線発光部25から赤外線でVDR40へ送信する(図6のステップS7−4)。
続いて、すべての入力が終わったかどうか判定し(図6のステップS7−5)、終わっていなければ入力ミスをしたかどうか判定し(図6のステップS7−6)、入力ミスをしていなければステップS7−3の入力を継続し、入力ミスがあれば、「戻る」ボタン24−38で一文字を修正してから(図6のステップS7−7)、ステップS7−3の入力を継続する。
図7(A)はVDR40のシリアル番号が5桁であり、そのうちの上位3桁を入力した時点のVDR40に接続された画像表示装置50の表示画面を示す。また、図7(B)は5桁のシリアル番号をすべて入力し終った状態の画像表示装置50の表示画面を示す。この表示画面に従い、リモコン装置20の「決定」ボタン24−35を押すことにより、シリアル番号の入力が終了する。
シリアル番号を入力し終わると(図6のステップS7−5)、リモコン装置20は内部の中央処理装置21により、リモコン装置20特有の数値として乱数を発生させる(図6のステップS7−8)。この乱数は工場出荷時に予めリモコン装置20の外部記憶装置23に記憶されている、リモコン装置20の固有のシリアル番号と合成することも可能である。
具体的には、リモコン装置20のシリアル番号が例えば、「1210001234」の10桁の数字であった場合に、5桁の乱数「98760」を合成すると、図8(A)に示すように、「121000123498760」と15桁の数字となる。また、他の合成列として、製品識別番号を含むシリアル番号が「1210001234」であり、製品識別番号がその上位4桁の数字であれば、5桁の乱数「98760」を合成すると、図8(B)に示すように、製品識別番号、乱数及びシリアル番号の順で合成され、15桁の数字「121098760001234」となる。
なお、上記の乱数は、リモコン装置20と外部の音声認識処理サーバ30(外部のサービス)と接続するため、サービスの有効なID確認への応用として導入されている。外部サービスが有料の場合、サービスを有効にする際に、(シリアル番号+乱数)をIDに含めておけば、サービス利用の権利を多様化させられるからである。シリアル番号からは無料のサービス提供を受ける権利の有無を識別させる。また、有料サービスの契約時に乱数を設定し、リモコン装置20の外部記憶装置23と音声認識処理サーバ30の外部記憶装置33に記憶させておく。
続いて、VDR40の画面表示で「決定」ボタン24−35を押すように指示する(図6のステップS7−9)。その画面指示に従い利用者が「決定」ボタン24−35を押すと、リモコン装置20内で発生された乱数と、VDR40のシリアル番号がVDR40本体に赤外線発光部25から赤外線リモコン信号で送信される(図6のステップS7−10)。
VDR40はこの赤外線リモコン信号を赤外線受光部48で受光して電気信号に変換し、中央処理装置41の制御に従い、受信したシリアル番号とリモコンの乱数をセットにして「組み合わせID番号」として不揮発性の外部記憶装置44に記憶しておく(図6のステップS7−11)。一方、リモコン装置20はこの「組み合わせID番号」を不揮発性の外部記憶装置23に記憶しておく(図6のステップS7−12)。
再び図4に戻って説明するに、ステップS8にて図6のフローチャートに従ってリモコン装置20とVDR40の組み合わせ登録が行われると、続いてリモコン装置20は音声認識処理サーバ30との間で無線通信及びインターネット35を利用して接続テストを行う(図4のステップS8)。この接続テストに成功すると、初期設定を終了する(図4のステップS9)。
次に、利用者が実際にEPGを利用して録画予約を行う場合の動作について、図1〜図3、図9と共に説明する。利用者は、EPGを利用して録画予約を行う場合、画像表示装置50にVDR40の画像が表示されている状態で、まず、リモコン装置20の図2に示した「メニュー」ボタン24−36を押して、「EPG予約」の項目を、矢印キー(図2のボタン24−31から24−34)と「決定」ボタン24−35を使って選択する。標準的なEPG表示は図3(A)に示すように、放送チャンネル毎に放送時間順に表示された形式である。一覧表示されている項目を選択すると、その番組の出演者名などの詳細情報を欄外に表示したり、詳細表示画面に表示切替することが可能である。
特定の条件で検索する場合は、EPG表示画面表示の代わりに、図3(B)に示すような検索条件設定画面を画像表示装置50に表示させる。この場合、検索条件は図3(B)に示すように、ジャンル、出演者名、番組名などを指定することが可能である。検索条件の指定は、画面表示上の、対象となる項目の入力欄を矢印キー(図2のボタン24−31から24−34)で指定する(図9のステップS11)。図3(B)ではジャンルとしてスポーツを、番組名としてチーム○○○を指定している。
その状態で、利用者がリモコン装置20の音声入力ボタン24−37を押してリモコン装置20の音声入力機能を有効にする(図9のステップS12)。すると、リモコン装置20は、無線通信部29から音声認識処理サーバ30と回線接続することを要求する無線信号を送信し、その無線信号が無線アクセスポイント37の無線通信部38で受信された後、イーサネット(登録商標)端子39、インターネット35を介して予め設定されている音声認識処理サーバ30に伝送して双方向の伝送路の回線接続をする(図9のステップS13)。
この回線接続状態でマイク26に向かって、利用者がVDR40を遠隔操作する内容の音声を発声して入力する。その際、利用者は赤外線発光部25を一定の向きとなるようにリモコン装置20を保持する必要はなく、マイク26を口元に近付けて発声することができる。赤外線通信で外部の音声認識処理サーバとオンライン状態を保つのではなく、本実施の形態では無線通信路及びネットワーク通信路を介して音声認識処理サーバ30と回線接続状態にあるからである。マイク26を口元に近付けて発声することにより、周囲の雑音による外乱の少ない音声入力が可能となる。
マイク26により利用者の音声は電気信号に変換され、更に音声ディジタル変換部28によりディジタル音声データに変換され、そのディジタル音声データが無線通信部29から上記の無線アクセスポイント37へ無線送信され、更にこれよりインターネット接続装置36及びインターネット35からなる回線接続状態の伝送路を通して音声認識処理サーバ30に送出される(図9のステップS14)。
音声入力の終了部分は、リモコン装置20が発声の所定時間以上の無音部分を自動的に検出することで認識する(図9のステップS15)。あるいは、利用者が、自らリモコン装置20の所定のボタンを押すことで、入力終了を音声認識処理サーバ30に通知することも可能である。ディジタル音声データは音声認識処理サーバ30で音声認識処理される(図9のステップS16)。
音声認識処理サーバ30は、音声認識処理により得た最上位の候補と、それに続く候補文字列を、音声認識結果として上記の伝送路を通してリモコン装置20に送信する(図9のステップS17)。リモコン装置20は、音声認識結果を受信すると、その受信した音声認識結果を一時的にメモリ装置22に蓄積すると同時に、不揮発性の外部記憶装置23に受信データの履歴データとして蓄積した後、利用者に対して、音声認識処理が終了したことを知らせるために、スピーカ27から処理終了を知らせるブザー音を発音する(図9のステップS18)。このブザー音は、単純な電子音でも、事前に録音した音声や合成音声を利用することも可能である。
利用者は、リモコン装置20の上記のブザー音により音声認識処理終了を確認すると、転送ボタン24−28を押すことで、音声認識結果をVDR40本体に赤外線発光部25から赤外線リモコン信号で転送する(図9のステップS19)。このとき、組み合わせID番号を音声認識結果に付加してVDR40に赤外線で送信してもよい。
VDR40は上記の赤外線リモコン信号を赤外線受光部48で受光して電気信号に変換し、得られた音声認識結果を中央処理装置41の制御により画像信号に変換し、画像表示装置50の検索条件設定画面に、受信した音声認識結果の候補を列挙する(図9のステップS20)。図3(C)は図3(B)に示した画面で検索指定したジャンルがスポーツで番組名がチーム○○○の検索結果が表示されている。利用者は、上記の表示されている音声認識結果の候補の中から図2に示した矢印キー(ボタン24−31から24−34)と「決定」ボタン24−35で、希望する音声認識結果を指定して、入力を確定する(図9のステップS21)。
利用者は更に別の検索条件を選択し、同様の音声認識を行って条件設定することも可能である。検索条件設定が終了したら、矢印キー(図2のボタン24−31から24−34)と図2の「決定」ボタン24−35で検索開始の指示を出す。このときVDR40では、音声認識結果と共に受信した組み合わせID番号が、外部記憶装置44に登録されているID番号と一致していない場合、利用者に警告を提示して、音声認識結果を破棄することもできる。VDR40の本体内のEPGデータから指定検索条件に適応した番組が抽出され、画面に図3(C)に示すように表示される。抽出された番組を選択して、「決定」ボタン24−35を押すことで、EPG予約が設定される。
次に、録画済みの番組一覧から、希望の番組を検索、選択、再生する場合について、図9のフローチャート及び図10の画面例等を併せ参照して説明する。利用者がリモコン装置20の図2に示した「一覧リスト」ボタン24−30を押すと、これによりリモコン装置20からVDR40に赤外線リモコン信号が送信され、VDR40の赤外線受光部48が受光して電気信号の一覧リスト信号を受信する。この一覧リスト信号の受信に基づき、中央処理装置41はハードディスク装置45に録画されている番組情報を読み出して、画像表示装置50に図10(A)に示すような、録画順に放送局、番組名、録画日時、録画時間等が一覧表示された形式の録画順一覧表示画面を表示する。
続いて、図10(A)の録画順一覧表示画面中の表示順項目「録画順」をリモコン装置20の矢印キー(図2のボタン24−31から24−34)で選択し、図2の「決定」ボタン24−35を押すことで、表示順項目が切り替わる。表示順項目として「検索条件指定」を選ぶと、図10(B)に示すような条件設定画面が表示される。ここで、条件設定対象を選択し(図9のステップS11)、リモコンの音声入力ボタン24−37を押して、リモコン装置20の音声入力機能を有効にすると(図9のステップS12)、リモコン装置20は、予め設定されている音声認識処理サーバ30との間で前述した双方向の伝送路を回線接続する(図9のステップS13)。
この状態で、リモコン装置20のマイク26に利用者が口元を近付けて発声した音声を入力すると、その音声はマイク26により電気信号に変換され、音声ディジタル変換部28によりディジタル化されてディジタル音声データとされ、上記の伝送路を通して音声認識処理サーバ30に送出される(図9のステップS14)。音声入力の終了部分は、リモコン装置20で発声の所定時間以上の無音部分を自動認識する(図9のステップS15)。あるいは、利用者が、自らリモコン装置20の所定のボタンを押すことで、入力終了を音声認識処理サーバ30に通知することも可能である。
上記のディジタル音声データは、音声認識処理サーバ30で音声認識処理される(図9のステップST16)。音声認識処理サーバ30は、音声認識処理により得た最上位の候補と、それに続く候補文字列を、音声認識結果として上記の伝送路を通してリモコン装置20に送信する(図9のステップS17)。リモコン装置20は、音声認識結果を受信すると、その受信した音声認識結果を一時的にメモリ装置22に蓄積すると同時に、不揮発性の外部記憶装置23に受信データの履歴データとして蓄積した後、利用者に対して、音声認識処理が終了したことを知らせるために、スピーカ27から処理終了を知らせるブザー音を発音する(図9のステップS18)。このブザー音は、前述したように、単純な電子音でも、事前に録音した音声や合成音声を利用することも可能である。
利用者は、リモコン装置20の上記のブザー音により音声認識処理終了を確認すると、転送ボタン24−28を押すことで、音声認識結果をVDR40本体に赤外線発光部25から赤外線リモコン信号で転送する(図9のステップS19)。このとき、組み合わせID番号を音声認識結果に付加してVDR40に赤外線で送信してもよい。
VDR40は上記の赤外線リモコン信号を赤外線受光部48で受光して電気信号に変換し、得られた音声認識結果を中央処理装置41の制御により画像信号に変換し、画像表示装置50の検索条件設定画面に、受信した音声認識結果の候補を列挙する(図9のステップS20)。利用者は、表示されている音声認識結果の候補の中から図2に示した矢印キー(ボタン24−31から24−34)と「決定」ボタン24−35で、希望する音声認識結果を指定して、入力を確定する(図9のステップS21)。
検索条件設定が終了したら、矢印キー(図2のボタン24−31から24−34)と図2の「決定」ボタン24−35で検索開始の指示を出す。このときVDR40では、音声認識結果と共に受信した組み合わせID番号が、外部記憶装置44に登録されているID番号と一致していない場合、利用者に警告を提示して、音声認識結果を破棄することもできる。VDR40の本体内の録画済番組データから指定検索条件に適応した番組が抽出され、画面に図10(C)に示すように表示される。抽出された番組を選択して、「決定」ボタン24−35を押すことで、指定番組の再生が開始される。
次に、利用者が履歴データを用いて再生する録画番組を選択する場合の動作について、図1、図2及び図11と共に説明する。利用者は、まず、リモコン装置20の操作ボタン24を操作して、VDR40を検索キーワード入力受付状態とする(図11のステップS31)。続いて、この検索キーワード入力受付状態で、利用者がリモコン装置20の転送ボタン24−28を押すと、中央処理装置21が再利用のために外部記憶装置23に蓄積されていた音声認識結果の履歴データを読み出して赤外線発光部25からVDR40に赤外線リモコン信号を送信する(図11のステップS32)。
VDR40はこの赤外線リモコン信号を赤外線受光部48で受光して電気信号である音声認識結果の履歴データに変換し、それを候補文字列として画像表示装置50の検索条件設定画面に列挙する(図11のステップS33)。利用者はその検索条件表示画面を見ながら、リモコン装置20の矢印キー(図2のボタン24−31から24−34)で希望する文字列を選択したあと、図2の「決定」ボタン24−35で入力を確定する(図11のステップS34)。
利用者は更に別の検索条件を選択し、同様の音声認識を行って条件設定することも可能である。検索条件設定が終了したら、矢印キー(図2のボタン24−31から24−34)と「決定」ボタン24−35で再生開始の指示を出す。このときVDR40では、音声認識結果と共に受信した組み合わせID番号が、外部記憶装置44に登録されているID番号と一致していない場合、利用者に警告を提示して、音声認識結果を破棄することもできる。上記の再生開始の指示に従い、VDR40は選択された履歴データから指定検索条件に適合した番組が抽出され、画面に表示される。抽出された番組を選択して、「決定」ボタン24−35を押すことで、指定番組の再生が開始される。
以上説明した本実施の形態によれば、利用者がマイク26に口元を近付けて発声することができるため、周囲の雑音が入力されることが殆ど無く、マイク26から入力される雑音を低減できる。また、本実施の形態では、リモコン装置20内には音声認識処理回路を搭載しておらず、そのための高性能なCPU、作業用メモリ、音素解析辞書や語彙辞書用のメモリ、更には追加辞書用のメモリなどが不要であり、しかもリモコン装置20は外部の音声認識処理サーバ30とのオンライン接続により音声認識処理結果を得るようにしているので、オフライン用の音声データ保持用バッファメモリも不要であるため、リモコン装置20のコストを音声認識処理回路を搭載したリモコン装置に比べて低減することができる。
更に、本実施の形態では、屋外の音声認識処理サーバ30を、多くの利用者が個別に有するリモコン装置20で共用できるため、音声認識処理サーバ30のコストを利用者数(リモコン装置20の出荷数)で分担できることとなり、安価な音声認識処理システムを構築することができる。
なお、本発明は上記の実施の形態に限定されるものではなく、例えば図1の実施の形態では1台のVDR40の検索キーワードを音声を使って入力する例を示しているが、例えば2台のVDRのうち所望の1台のVDRの検索キーワードを入力することも可能である。この場合、図1に2台目のVDRを追加すると共に、図4のステップS3でビデオコードAにより1台目のVDRを指定するか、ビデオコードBにより2台目のVDRを指定することができる。ビデオコードA,Bはリモコン装置20のVTRボタン24−3、24−4で切り替えることができる。
また、上記の実施の形態では、無線通信装置として、無線LAN「IEEE802.11b」を例に説明したが、他の無線規格である近距離無線「Bluetooth規格」、UWB(Ultra Wide Band)を利用することも可能である。また、上記の実施の形態ではインターネットを利用して音声認識処理サーバ30とリモコン装置20とを接続するようにしたが、本発明は、携帯電話網などの無線公衆回線や専用回線を利用することも可能である。
更に、音声認識処理サーバ30として「日本ビクターサーバ」を例にあげたが、これは一例に過ぎず仮想的に1台のサーバとして動作する複数の処理装置群で構成することも可能である。また、上記の実施の形態では、検索キーワードを音声入力する対象機器としてテレビ放送録画機40について説明したが、本発明はこれに限定されるものではなく、ハードディスク装置以外の記録媒体に映像信号及び音声信号を記録し再生する映像信号記録再生装置にも適用でき、また、テレビ放送波の録画機能を有していない映像信号記録再生装置にも本発明を適用することができる。
本発明の一実施の形態のシステム構成図である。 図1中のリモコン装置の操作ボタンの一例の配置図である。 EPGの標準的な表示、検索指定、検索結果の画面表示例を示す図である。 本発明の一実施の形態の初期設定動作説明用フローチャートである。 本発明システムにおけるリモコン装置と音声認識処理サーバとの接続を手動で行うときのフローチャートである。 本発明システムにおけるリモコン装置とVDRの組み合わせ登録説明用フローチャートである。 VDRのシリアル番号の入力時の画面例である。 リモコン装置のシリアル番号とリモコン装置で発生した乱数の合成例である。 本発明システムの録画予約時、及び録画済み番組の検索、選択、再生時の動作説明用フローチャートである。 本発明システムにおける録画済み番組の一覧表示画面、検索条件指定画面及び検索結果表示画面の各例を示す図である。 本発明システムにおける音声認識結果の履歴データを選択するときの動作説明用フローチャートである。 従来システムの一例のシステム構成図である。 図12の従来システムの動作説明用フローチャートである。 従来システムの他の例のシステム構成図である。 図14の従来システムの動作説明用フローチャートである。
符号の説明
20 リモコン装置
21、31、41 中央処理装置
22、32、43 メモリ装置
23、33、44 外部記憶装置
24 操作ボタン
25 赤外線発光部
26 マイク
27 スピーカ
28 音声ディジタル変換部
29、38 無線通信部
30 音声認識処理サーバ
34、39 イーサネット(登録商標)端子
35 インターネット
36 インターネット接続装置
37 無線アクセスポイント
40 TV放送録画機(VDR)
42 チューナ装置
45 ハードディスク装置
46 画像出力端子
47 音声出力端子
48 赤外線受光部
50 画像表示装置

Claims (4)

  1. 映像信号記録再生装置を遠隔操作する機能と音声入出力機能を備えたリモコン装置と、入力された音声信号の音声認識処理を行う音声認識処理サーバと、前記リモコン装置及び前記音声認識処理サーバ間を回線接続する所定の伝送手段とよりなる音声認識処理システムであって、
    前記リモコン装置は、
    入力された前記映像信号記録再生装置の動作制御に関する音声を収音して、ディジタル音声データに変換する音声入力手段と、
    前記ディジタル音声データを前記所定の伝送手段を介して前記音声認識処理サーバに送信する第1の送信手段と、
    前記音声認識処理サーバによる前記ディジタル音声データの音声認識結果を、前記所定の伝送手段を介して前記音声認識処理サーバから受信する第1の受信手段と、
    前記映像信号記録再生装置を赤外線リモコン信号により遠隔操作して所望の動作を行わせると共に、前記第1の受信手段により受信した前記音声認識結果を前記映像信号記録再生装置へ前記赤外線リモコン信号の形態で送信して、該映像信号記録再生装置に該音声認識結果に応じた動作を行わせる第2の送信手段とを有し、
    前記音声認識処理サーバは、
    前記リモコン装置から前記所定の伝送手段を介して送信された前記ディジタル音声データを受信する第2の受信手段と、
    前記第2の受信手段により受信した前記ディジタル音声データの音声認識処理を行い、得られた前記音声認識結果を、前記所定の伝送手段を介して前記リモコン装置へ送信する音声認識結果送信手段とを有することを特徴とする音声認識処理システム。
  2. 前記リモコン装置は、前記第1の受信手段により受信した前記音声認識結果を前記リモコン信号送信手段により前記映像信号記録再生装置へ前記赤外線リモコン信号の形態で送信する際に、少なくとも前記映像信号記録再生装置のシリアル番号と該リモコン装置固有の所定の番号とを送信すると共に、該映像信号記録再生装置のシリアル番号と該リモコン装置固有の所定の番号とを組み合わせID番号として記憶する不揮発性の外部記憶装置を有することを特徴とする請求項1記載の音声認識処理システム。
  3. 前記音声認識処理サーバは複数の前記リモコン装置に共通に設けられ、前記所定の伝送手段は、前記音声認識処理サーバに接続される通信ネットワークと、該通信ネットワークと前記リモコン装置とを個別に接続する無線通信網とからなることを特徴とする請求項1又は2記載の音声認識処理システム。
  4. 請求項1記載の音声認識処理システムにおいて用いられる映像信号記録再生装置であって、
    前記リモコン装置から送信される前記赤外線リモコン信号を受信するリモコン信号受信手段と、
    初期設定時に前記リモコン装置から送信された、該リモコン装置固有の所定の番号と該映像信号記録再生装置自身のシリアル番号を記憶するID番号記憶用外部記憶装置と、
    前記リモコン信号受信手段により受信した信号が、該映像信号記録再生装置自身のシリアル番号及び前記リモコン装置固有の所定の番号からなる組み合わせID番号と前記音声認識結果であるときは、前記ID番号記憶用外部記憶装置に記憶されている該リモコン装置固有の所定の番号と該映像信号記録再生装置自身のシリアル番号を、受信した前記組み合わせID番号と比較し、両者が一致するときにのみ前記音声認識結果に基づく文字列を表示し、両者が不一致のときは前記音声認識結果を破棄する処理手段と
    を有することを特徴とする映像信号記録再生装置。
JP2003295969A 2003-08-20 2003-08-20 音声認識処理システム及びそれに用いる映像信号記録再生装置 Pending JP2005065156A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003295969A JP2005065156A (ja) 2003-08-20 2003-08-20 音声認識処理システム及びそれに用いる映像信号記録再生装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003295969A JP2005065156A (ja) 2003-08-20 2003-08-20 音声認識処理システム及びそれに用いる映像信号記録再生装置

Publications (1)

Publication Number Publication Date
JP2005065156A true JP2005065156A (ja) 2005-03-10

Family

ID=34372023

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003295969A Pending JP2005065156A (ja) 2003-08-20 2003-08-20 音声認識処理システム及びそれに用いる映像信号記録再生装置

Country Status (1)

Country Link
JP (1) JP2005065156A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007249035A (ja) * 2006-03-17 2007-09-27 Yamaha Corp 電子楽器、その制御方法を実現するためのプログラムおよびサーバ
JP2012133243A (ja) * 2010-12-22 2012-07-12 Toshiba Corp 音声認識装置、音声認識方法および音声認識装置を搭載したテレビ受像機
JP2014011803A (ja) * 2012-06-29 2014-01-20 Samsung Electronics Co Ltd ディスプレイ装置、電子装置、対話型システム及びそれらの制御方法
US9396737B2 (en) 2013-01-07 2016-07-19 Samsung Electronics Co., Ltd. Display apparatus and method for controlling the display apparatus
CN107564519A (zh) * 2013-01-07 2018-01-09 三星电子株式会社 交互服务器及其控制方法和交互系统
CN109599100A (zh) * 2017-10-02 2019-04-09 东芝视频解决方案株式会社 交互式电子设备控制系统、交互式电子设备及其控制方法
JP2021005413A (ja) * 2014-05-15 2021-01-14 ソニー株式会社 システムおよび装置

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007249035A (ja) * 2006-03-17 2007-09-27 Yamaha Corp 電子楽器、その制御方法を実現するためのプログラムおよびサーバ
JP2012133243A (ja) * 2010-12-22 2012-07-12 Toshiba Corp 音声認識装置、音声認識方法および音声認識装置を搭載したテレビ受像機
USRE48423E1 (en) 2012-06-29 2021-02-02 Samsung Electronics Co., Ltd. Display apparatus, electronic device, interactive system, and controlling methods thereof
JP2014011803A (ja) * 2012-06-29 2014-01-20 Samsung Electronics Co Ltd ディスプレイ装置、電子装置、対話型システム及びそれらの制御方法
USRE49493E1 (en) 2012-06-29 2023-04-11 Samsung Electronics Co., Ltd. Display apparatus, electronic device, interactive system, and controlling methods thereof
EP3833036A1 (en) * 2012-06-29 2021-06-09 Samsung Electronics Co., Ltd. Display apparatus, electronic device, interactive system, and controlling methods thereof
USRE47168E1 (en) 2012-06-29 2018-12-18 Samsung Electronics Co., Ltd. Display apparatus, electronic device, interactive system, and controlling methods thereof
US9520133B2 (en) 2013-01-07 2016-12-13 Samsung Electronics Co., Ltd. Display apparatus and method for controlling the display apparatus
US10891968B2 (en) 2013-01-07 2021-01-12 Samsung Electronics Co., Ltd. Interactive server, control method thereof, and interactive system
CN107564519A (zh) * 2013-01-07 2018-01-09 三星电子株式会社 交互服务器及其控制方法和交互系统
US9396737B2 (en) 2013-01-07 2016-07-19 Samsung Electronics Co., Ltd. Display apparatus and method for controlling the display apparatus
US11854570B2 (en) 2013-01-07 2023-12-26 Samsung Electronics Co., Ltd. Electronic device providing response to voice input, and method and computer readable medium thereof
JP2021005413A (ja) * 2014-05-15 2021-01-14 ソニー株式会社 システムおよび装置
US11216153B2 (en) 2014-05-15 2022-01-04 Sony Corporation Information processing device, display control method, and program
JP7088253B2 (ja) 2014-05-15 2022-06-21 ソニーグループ株式会社 システムおよび装置
US11693530B2 (en) 2014-05-15 2023-07-04 Sony Corporation Information processing device, display control method, and program
JP2019066702A (ja) * 2017-10-02 2019-04-25 東芝映像ソリューション株式会社 対話型電子装置制御システム、対話型電子装置、対話型電子装置制御方法
CN109599100A (zh) * 2017-10-02 2019-04-09 东芝视频解决方案株式会社 交互式电子设备控制系统、交互式电子设备及其控制方法
CN109599100B (zh) * 2017-10-02 2023-08-01 海信视像科技股份有限公司 交互式电子设备控制系统、交互式电子设备及其控制方法

Similar Documents

Publication Publication Date Title
US8000972B2 (en) Remote controller with speech recognition
US6697467B1 (en) Telephone controlled entertainment
EP1641134A2 (en) Integrated remote control device and method for controlling multiple devices
JP2004507936A (ja) ダウンロード可能な音声命令の集合による音声制御型遠隔制御装置
KR20060112531A (ko) 통합 리모콘의 기능을 제공하는 디스플레이 장치 및 방법
JP2004173241A (ja) リモコン機能付き携帯電話機、そのリモートコントロール方法及びシステム
WO2007133716A2 (en) Multimodal communication and command control systems and related methods
JP2001197379A (ja) 機器設定装置、機器設定システムおよび機器設定処理プログラムを記録した記録媒体
KR20170083360A (ko) 디스플레이 장치 및 그의 동작 방법
US7940338B2 (en) Voice-controlled TV set
EP1014710B9 (en) System and method for selecting a program in a broadcast
JP2000236585A (ja) 機器制御方法及び装置並びに制御サーバ
JP2005065156A (ja) 音声認識処理システム及びそれに用いる映像信号記録再生装置
KR102511385B1 (ko) 디스플레이 장치
KR20100081186A (ko) 제어데이터 전송방법, 피제어장치, 원격제어 중개장치, 통합 원격제어장치, 서버, 그리고, 원격제어 시스템
JP6227236B2 (ja) 記録装置および再生装置
US20240007698A1 (en) System and method for generating a voice prompt in response to remote control actuation
CN112243588B (zh) 电子设备、非易失性存储介质及声音识别方法
US20240015814A1 (en) Display device and audio output system
WO2021004309A1 (zh) 电子设备及检索服务选定方法
JP2000285647A (ja) 情報処理装置および方法、並びに提供媒体
US20240105172A1 (en) Display device and operating method thereof
EP4116968A1 (en) Natural language processing device
KR102112931B1 (ko) Tv 제어 시스템
KR20030034443A (ko) 음성 인식 사용자 인터페이스 제어 장치 및 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060331

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080514

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080520

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080924