JP2007533235A - メディアコンテンツ処理装置の制御方法及びメディアコンテンツ処理装置 - Google Patents
メディアコンテンツ処理装置の制御方法及びメディアコンテンツ処理装置 Download PDFInfo
- Publication number
- JP2007533235A JP2007533235A JP2007507887A JP2007507887A JP2007533235A JP 2007533235 A JP2007533235 A JP 2007533235A JP 2007507887 A JP2007507887 A JP 2007507887A JP 2007507887 A JP2007507887 A JP 2007507887A JP 2007533235 A JP2007533235 A JP 2007533235A
- Authority
- JP
- Japan
- Prior art keywords
- media content
- content
- processed
- content processing
- descriptor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/84—Generation or processing of descriptive data, e.g. content descriptors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/235—Processing of additional data, e.g. scrambling of additional data or processing content descriptors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/435—Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/443—OS processes, e.g. booting an STB, implementing a Java virtual machine in an STB or power management in an STB
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/485—End-user interface for client configuration
Abstract
本発明は、メディアコンテンツ処理装置を制御するための方法を記載する。これにより、処理対象となるメディアコンテンツは、いくつかの所定のコンテンツ記述子からの所定のコンテンツ記述子により記述されているか判断される。装置制御パラメータが、処理対象となるメディアコンテンツを記述するコンテンツ記述子に基づき自動調整される。その後、メディアコンテンツ処理装置は、装置制御パラメータに基づき自動制御される。
Description
本発明は、メディアコンテンツ処理装置の制御方法及びメディアコンテンツ処理装置に関する。本発明は、特にテレビ、パーソナルコンピュータ、ラジオなどのメディアレンダリング装置による、又はビデオレコーダ又はオーディオレコーダなどのメディア記憶装置によるメディアコンテンツの処理に関する。
「メディアコンテンツ」という用語は、好ましくは、映画、演劇、ニュース放送、音楽チャート番組、スポーツ放送、ドキュメンタリーなどのラジオ及び/又はテレビプログラムを表し、例えば、映画全体、ニュース放送全体などの全体ユニット、又はニュース放送の地域ニュース、音楽チャートのトップスリーのみなどの全体ユニットの抜粋などを意味する可能性もある。メディアコンテンツは、任意のタイプのフォーマット、ジャンル、時間及び分類を有するかもしれない。
ここ数年の間に、ビデオレコーダ、テレビなどのコンテンツ処理装置が、我々の日常生活の不可欠な部分となってきている。メモリ容量、表示特徴などの技術的パラメータがこの数年間に継続的に向上されてきたが、このような装置を制御可能とするための容易さの満足できるレベルには依然として到達していない。
装置の制御に必要なユーザと装置との間のやりとりがかなり簡単化又は抑制されるような方法により、自らを自動的に制御及び構成することが可能なインテリジェント装置としてコンテンツ処理装置を実現するための観点によるいくつかの有望な示唆がなされてきた。しかしながら、示唆された手段はしばしば、家庭環境において通常使用される装置が、一般にはそれらの実現に要する必要な処理パワーを処理していないという事実に屈する。
従って、本発明の課題は、ユーザとコンテンツ処理装置との快適なやりとりを可能にするコンテンツ処理装置制御方法及びコンテンツ処理装置を提供することである。
本発明の課題は、独立クレームの特徴によって達成される。本発明の適切かつ効果的な発展型が、従属クレームの特徴によって規定される。方法クレームの従属クレームによる装置クレームのさらなる発展型がまた、本発明の範囲に含まれる。
本発明による方法では、処理対象となるメディアコンテンツがいくつかの所定のコンテンツ記述子からの所定のコンテンツ記述子により記述されているか判断される。その後、処理対象となるメディアコンテンツを記述するコンテンツ記述子に応じて、装置制御パラメータが調整される。メディアコンテンツ処理装置の制御が、装置制御パラメータに従って実行される。
本発明は、メディアコンテンツ処理装置が、処理中又は処理予定のメディアコンテンツのコンテンツタイプに自動調整されることを可能にし、これにより、メディアコンテンツ処理装置の制御は大きく簡単化することができる。
メディアコンテンツ処理装置は、一般には多数の制御シーケンスを実行することが可能である。可能な制御シーケンスの個数が大きくなるほど、このようなメディアコンテンツ処理装置の制御はより複雑となる。本発明は、すべての可能な制御シーケンスの何れが当該コンテンツタイプを処理するのに最も適しているか予め決定するため、それのコンテンツタイプに関する処理対象となるメディアコンテンツの知識の利用を可能にする。従って、残りの制御シーケンスに基づくメディアコンテンツ処理装置の制御は、使用するのにより簡単にされる。本発明によると、許容される制御シーケンスの選択は、特に適切な制御パラメータの設定により有効にすることが可能である。
さらに、本発明は、コンテンツレンダリング装置の制御に使用される複雑なアルゴリズムが、メディアコンテンツ処理装置の制御用の付加的又は補足的情報として、コンテンツタイプに関するメディアコンテンツにすでにある情報を有するコンテンツ記述子を利用して大きく簡単化することを可能にする。この簡単化は、より小さな処理パワーやより小さなメモリなどの複雑なハードウェアが、ユーザとコンテンツレンダリング装置との間の満足いくやりとりを維持するため必要とされる。
「コンテンツ記述子」という用語は、
・俳優、ニュースキャスター、プレゼンター、トークショーゲストの名前
・俳優、ニュースキャスター、プレゼンター、トークショーゲストの声
・俳優、ニュースキャスター、プレゼンター、トークショーゲストの言語
・ドキュメンタリー、政治討論、スポーツ番組のトピック
・配信コンテンツの話題性又は制作年
・配信コンテンツに与えられるキーワード又は画像
・ドキュメンタリー、映画、政治討論又はスポーツ番組のタイトル
・サッカーの試合、ロック音楽ショーなどの特定のプログラム説明、Julia Robertsによる映画、Dianne Sawyerによるニュース番組などのプログラム詳細、コンテンツのジャンル(スポーツ、ニュース、映画、音楽番組、ジャズ、50年代の映画など)
などのメディアコンテンツを記述するのに適したすべての情報をカバーする。
・俳優、ニュースキャスター、プレゼンター、トークショーゲストの名前
・俳優、ニュースキャスター、プレゼンター、トークショーゲストの声
・俳優、ニュースキャスター、プレゼンター、トークショーゲストの言語
・ドキュメンタリー、政治討論、スポーツ番組のトピック
・配信コンテンツの話題性又は制作年
・配信コンテンツに与えられるキーワード又は画像
・ドキュメンタリー、映画、政治討論又はスポーツ番組のタイトル
・サッカーの試合、ロック音楽ショーなどの特定のプログラム説明、Julia Robertsによる映画、Dianne Sawyerによるニュース番組などのプログラム詳細、コンテンツのジャンル(スポーツ、ニュース、映画、音楽番組、ジャズ、50年代の映画など)
などのメディアコンテンツを記述するのに適したすべての情報をカバーする。
コンテンツ記述子に応じた装置制御パラメータの調整は、直接解釈可能なルール又は計算による評価を要するアルゴリズムを介して実際には実行することができる。
好ましくは、処理対象又は格納対象となるメディアコンテンツは、好ましくは、メディアコンテンツの受信又はアクセスにより決定又は識別されるいくつかのコンテンツ記述子を有する。コンテンツ記述子は、例えば、テレビ配信プロバイダなどのプロバイダによってメディアコンテンツ共に供給することが可能である。同様に、コンテンツ記述子は、例えば、サービスプロバイダによってメディアコンテンツ処理装置に配信可能であり、これにより、コンテンツ記述子は、適切なメディアコンテンツに明確に割り当てられる。
さらに、又は代わりに、コンテンツ記述子が、例えば、ユーザインタフェースによりメディアコンテンツ処理装置にユーザによって入力することができる。ユーザは、スタート時間、日付及びチャンネルを指定するためユーザのビデオレコーダをプログラムするとき、例えば、コンテンツ記述子の形式によりコンテンツタイプに関する補足的情報を入力することができる。これは、ビデオレコーダによって予め規定されるいくつかのコンテンツ記述子の1つのメニュー制御された選択によって実行することが可能であり、あるいは、ユーザはコンテンツ記述子を自ら入力することも可能である。
このように入力されたコンテンツ記述子は、さらに、又はその代わりに、プログラムがNexTViewなどのコンテンツタイプに従って分類されるとき、電子番組ガイドに基づくものとすることが可能である。
特に好適な実施例では、コンテンツ記述子は、既知の解析方法を利用してメディアコンテンツから抽出される。例えば、音声認識方法を利用してメディアコンテンツからキーワードが抽出可能であり、あるいは、特定の声が、発話者識別方法を利用することによりメディアコンテンツにおいて識別することが可能である。
メディアコンテンツ処理装置は、好ましくは、コンテンツレンダリング装置を有し、又はそれ自体、装置制御パラメータがコンテンツのレンダリングを制御するテレビなどのコンテンツレンダリング装置である。ここで、コンテンツのレンダリングとは、画面上の映像画像などの映像コンテンツの提示、又は音声コンテンツの可聴音声への変換を意味する。
装置制御パラメータは、好ましくは、テレビ装置のボリュームなどのコンテンツレンダリング装置のボリュームを制御する。例えば、このボリュームは、スポーツ番組がスタジアムの雰囲気を生成するためより大きく、音楽番組が隣人に迷惑をかけることを回避するためより小さく、多数の対話を特徴とする映画についてはより大きく、大きな音楽のサウンドトラックを伴う爆発や衝突など、大きな、おそらくうるさいサウンド効果を備えたアクション映画やアクションシーンについてはより小さくされるかもしれない。
特に好適な実施例では、コンテンツ処理装置のユーザインタフェース、自動音声又は発話者認識ユニットなどの機能ユニットが、装置制御パラメータを利用して構成される。特定の入力パラメータに応答した当該機能ユニットの応答(又は動作)、特に出力パラメータ又は出力パラメータの組み合わせの入力パラメータ又は入力パラメータの組み合わせの関数としての出力は、当該機能ユニットの設定により影響を受ける。このように、機能ユニットの出力パラメータは、コンテンツ記述子に基づく制御パラメータによって「間接的に」制御される。
この機能ユニットは、好ましくは、適切な制御ユニットを設定することによって、装置制御パラメータがユーザとコンテンツレンダリング装置との間のやりとりを制御できるように、ユーザインタフェースを有するか、又はユーザインタフェースの一部となる。
例えば、テレビ装置のオフスイッチの機能は、コンテンツタイプに適用されるかもしれない。「通常の」番組中には、オフスイッチが押下されると、テレビ装置がすぐにオフに切り替えられるが、オフスイッチがニュース番組中に押下されると、テレビ装置はニュース番組の終わりまでオンに維持され、終了時に自動的にオフに切り替えられる。ユーザは、異なるコンテンツタイプに応じて、テレビ装置のオフスイッチに対する所望の応答を規定するようにしてもよい。
本発明のさらなる好適な実施例では、プログラムタイプは、システム又はシステムのユーザインタフェースがユーザとやりとりするのに使用する出力モダリティを規定する。映像指向型の番組中には(スポーツ、アクション映画など)、システムは、より重要な映像部分を中断することがないように、音声信号(音声又は発話合成)を介しユーザとやりとりすることを選択する。音声指向型の番組中には(ニュース、コメディなど)、システムは、より重要な音声部分を中断することがないように、映像出力(画面表示)を介しユーザとやりとりすることを選択するかもしれない。
本発明の特に好適な実施例では、装置制御パラメータは、コンテンツレンダリング装置のリモコンコマンドに対する応答を制御する。この実施例は、装置制御パラメータがリモコン上のボタンとメディアコンテンツ処理装置の機能との関連付けを制御し、すなわち、それはメディアコンテンツ処理装置がリモート制御される方法を設定し、これにより、本実施例はまた本発明の範囲内に属することとなる。
以下において、コンテンツタイプに依存したテレビ装置のリモコンコマンドに対する応答についての3つの好適な具体例が説明される。
・ニュース番組中には、音声情報で十分かもしれない。従って、チャンネルの切り替えは映像のみ切り替え、音声は依然としてニュースチャンネルに維持される。これは、ニュースを聴きながら、他のチャンネルをブラウズすることを可能にする。
・スポーツ番組中には、映像情報で十分かもしれない。従って、チャンネルの切り替えは音声のみを切り替え、映像は依然としてスポーツチャンネルに維持される。これは、進行中の試合に関するすべての情報を依然として取得しながら、他のチャンネルをブラウズすることを可能にする(チャンネルが切り替えられるとき、スポーツ番組の他の替わりのものが、「ピクチャ・イン・ピクチャ(picture−in−picture)」機能を自動的に起動する)。
・「コンテキスト」ボタンは、付加情報の準備を起動する。付加情報のタイプは、視聴されるコンテンツのタイプに依存する。ニュース番組については、「コンテキスト」ボタンは、現在のニュースアイテムに関する追加的な背景を提供する。映画中には、「コンテキスト」ボタンは、俳優に関する情報を提供する。スポーツ番組中には、「コンテキスト」ボタンは、他の進行中のゲームに関する更新された情報を提供する。
・ニュース番組中には、音声情報で十分かもしれない。従って、チャンネルの切り替えは映像のみ切り替え、音声は依然としてニュースチャンネルに維持される。これは、ニュースを聴きながら、他のチャンネルをブラウズすることを可能にする。
・スポーツ番組中には、映像情報で十分かもしれない。従って、チャンネルの切り替えは音声のみを切り替え、映像は依然としてスポーツチャンネルに維持される。これは、進行中の試合に関するすべての情報を依然として取得しながら、他のチャンネルをブラウズすることを可能にする(チャンネルが切り替えられるとき、スポーツ番組の他の替わりのものが、「ピクチャ・イン・ピクチャ(picture−in−picture)」機能を自動的に起動する)。
・「コンテキスト」ボタンは、付加情報の準備を起動する。付加情報のタイプは、視聴されるコンテンツのタイプに依存する。ニュース番組については、「コンテキスト」ボタンは、現在のニュースアイテムに関する追加的な背景を提供する。映画中には、「コンテキスト」ボタンは、俳優に関する情報を提供する。スポーツ番組中には、「コンテキスト」ボタンは、他の進行中のゲームに関する更新された情報を提供する。
本発明の同様に好適な実施例では、関連付けされた装置制御パラメータによって設定された機能ユニットは、音声認識装置又は発話者識別装置を有し、又は音声認識装置又は発話者識別装置の一部であり、これにより、装置制御パラメータは最終的に音声認識方法又は発話者識別方法を制御することが可能である。装置制御パラメータは、例えば、音声認識ボキャブラリ又は音声認識パラメータを規定することが可能である。音声認識装置又は発話者識別装置の設定を現在処理されているメディアコンテンツに適応させることによって、音声認識方法又は発話者識別方法をより効果的に実行することが可能であり、すなわち、比較的シンプルなハードウェア構成により良好な認識パフォーマンスを達成することが可能となる。
本発明の好適な実施例では、装置制御パラメータは、認識ボキャブラリ又は認識文法に加えて、又はその代わりに、音声認識又は発話者認識方法の以下の特徴の1以上を決定する。
・発話理解文法
・対話記述(ユーザと装置の間のやりとりのため)
・発話者認識装置のための音響モデル
・発話者認識装置のための言語モデル
・プルーニング(pruning)閾値(音声認識復号化プロセスのため)
・信頼度閾値(装置内のプロセスを行う決定のため)
音声認識処理又は発話者識別処理が、処理対象となる現在のメディアコンテンツの音声情報からキーワード又は所定の発話者を検索し、例えば、適切に分類されたメディアコンテンツを格納することによって、適切に分類されたコンテンツをさらに処理するのに適用することができる。
・発話理解文法
・対話記述(ユーザと装置の間のやりとりのため)
・発話者認識装置のための音響モデル
・発話者認識装置のための言語モデル
・プルーニング(pruning)閾値(音声認識復号化プロセスのため)
・信頼度閾値(装置内のプロセスを行う決定のため)
音声認識処理又は発話者識別処理が、処理対象となる現在のメディアコンテンツの音声情報からキーワード又は所定の発話者を検索し、例えば、適切に分類されたメディアコンテンツを格納することによって、適切に分類されたコンテンツをさらに処理するのに適用することができる。
本発明によるメディアコンテンツ処理装置は、処理対象となるメディアコンテンツが所定のコンテンツ記述子又は複数の所定のコンテンツ記述子によって記述されているか検出するように構成されるコンテンツ記述子検出装置を有する。制御ユニットは、装置制御パラメータが、処理対象となるメディアコンテンツを記述するコンテンツ記述子に応じて調整されるように構成される。メディアコンテンツ処理装置の制御は、当該装置制御パラメータに従って実行される。
コンテンツ記述子検出装置は、処理対象となるメディアコンテンツから1以上のコンテンツ記述子を抽出するコンテンツ解析ユニットとして実現することが可能であり、あるいは、受信機又はストレージアクセス装置の一部とすることも可能であり、あるいは、付属信号などとしてメディアコンテンツに係るコンテンツ記述子を検出することが可能な受信機又はメモリアクセス装置と共に動作するようにしてもよい。しかしながら、コンテンツ記述子検出装置はまた、ユーザインタフェースと共に動作することが可能であり、あるいは、ユーザ入力を対応するコンテンツ記述子に変換するユーザインタフェースの一部とすることも可能である。
本発明の他の課題及び特徴は、添付した図面と共に検討される以下の詳細な説明から明らかとなるであろう。しかしながら、図面は単に説明のためのものであって、本発明の範囲を規定するものとして構成されていないということは、理解されるべきである。
メディアコンテンツ処理装置1の各コンポーネントが、メディアコンテンツ処理装置1を制御する一例となる方法の各ステップと共に、図面を利用してより詳細に説明される。
簡単化のため、本発明の理解に必要なメディアコンテンツ処理装置1のコンポーネントのみが、図面に示される。メディアコンテンツ処理装置1が、例えば、何れか必要なケーブルや接続、プロセッサ、電源、スイッチ要素又はバスシステムなどの当該処理システムに通常見つけることができる任意のコンポーネントを有することは言うまでもない。
図1は、インテリジェントホームエンターテイメントセンターと、それに属する赤外線インタフェースなどの適切なインタフェースを備えたリモコン9とを示す。
図1に示されるメディアコンテンツ処理装置1は、配信チャネル10を介し入力されるメディアコンテンツを受信するのに適した方法により構成される受信装置2を含む。
プログラマブルプロセッサにより実現可能な発話者認識装置又は音声認識装置3は、受信したメディアコンテンツにおける所定のキーワード又は特定の声を認識することが可能である。
ハードディスクの形式などにより実現されるコンテンツ格納ユニット4は、おそらく所定のルールに従って、メディアコンテンツを格納するのに利用可能である。
コンテンツレンダリング装置5は、受信又は格納されたメディアコンテンツをレンダリング又は再生するための表示ユニット又はラウドスピーカー装置を有することが可能である。
概略されたメディアコンテンツ処理装置1のコンポーネント2、3、4、5は、何れかの方法によりプログラマブルプロセッサを有するコンテンツ記述子検出ユニット6に接続される。これは、現在処理されているメディアコンテンツを記述するコンテンツ記述子を検出するよう構成される。コンテンツ記述子は、メディアコンテンツから、受信信号に付属した信号から、ユーザインタフェース7を介しユーザにより入力される情報から、適切な解析方法を利用して抽出される。
一実現によると、コンテンツ記述子検出ユニット6の一部として、音声認識装置又は発話者認識装置3が、処理されているメディアコンテンツからキーワードや発話者の声などのコンテンツ記述子を抽出するのに適用可能である。
コンテンツ記述子検出ユニット6によって検出され、処理対象となる現在のメディアコンテンツを記述するコンテンツ記述子が、制御ユニット8に転送される。プログラマブルプロセッサとして実現可能な制御ユニット8は、メディアコンテンツ処理装置1、メディアコンテンツ処理装置1の各種コンポーネント2、3、4、5及び当該コンポーネント2、3、4、5の間のやりとりを制御する。
例えば、制御ユニット8のコンポーネントであるが、図面には図示されないメモリユニットには、コンテンツ記述子CD1、CD2と各種パラメータ値P11、P12、P21、P22との間の関連付けが格納されている。検出されたコンテンツ記述子CDは、これらの関連付けに従って、適切な制御パラメータP又は制御ユニット8の制御パラメータに変換される。
その後、制御パラメータP又は導出された制御信号が、メディアコンテンツ処理装置1のコンポーネント2、3、4、5を制御し、これにより、メディアコンテンツ処理装置1を制御するため、制御ユニット8により上述したコンポーネント2、3、4、5に転送される。
上述したアプローチは、例えば、以下のアプリケーションを可能にする。
・処理対象となるメディアコンテンツによる音声認識装置3の制御:何れのコンテンツ記述子が検出されるかに応じて、音声認識装置がコンテンツタイプに従って構成されるように、プルーニング(pruning)閾値などの制御パラメータが音声認識装置3に対して調整される。処理対象となるメディアコンテンツは、受信装置2によって受信可能であるか、あるいは、コンテンツ格納ユニット4から読み出し可能である。
・処理対象となるメディアコンテンツによるコンテンツ格納ユニット4の制御:何れのコンテンツ記述子が検出されるかに応じて、コンテンツ格納ユニット4を制御するため制御パラメータが調整される。
・処理対象となるメディアコンテンツによるコンテンツレンダリング装置5の制御:何れのコンテンツ記述子が検出されるかに応じて、コンテンツレンダリング装置5のリモコン装置9に対する応答に影響を与えるため、装置5の適切な機能ユニットを構成し、又はボリュームレベルを直接制御などするため、制御パラメータがコンテンツレンダリング装置5について調整される。
・処理対象となるメディアコンテンツによる音声認識装置3の制御:何れのコンテンツ記述子が検出されるかに応じて、音声認識装置がコンテンツタイプに従って構成されるように、プルーニング(pruning)閾値などの制御パラメータが音声認識装置3に対して調整される。処理対象となるメディアコンテンツは、受信装置2によって受信可能であるか、あるいは、コンテンツ格納ユニット4から読み出し可能である。
・処理対象となるメディアコンテンツによるコンテンツ格納ユニット4の制御:何れのコンテンツ記述子が検出されるかに応じて、コンテンツ格納ユニット4を制御するため制御パラメータが調整される。
・処理対象となるメディアコンテンツによるコンテンツレンダリング装置5の制御:何れのコンテンツ記述子が検出されるかに応じて、コンテンツレンダリング装置5のリモコン装置9に対する応答に影響を与えるため、装置5の適切な機能ユニットを構成し、又はボリュームレベルを直接制御などするため、制御パラメータがコンテンツレンダリング装置5について調整される。
メディアコンテンツ処理装置1は、ユーザの近傍の独立した装置の一部として実現可能であり、あるいは、受信装置2、音声認識装置3又は発話者認識装置3及びコンテンツ格納ユニットなどが配信プロバイダ又は他のプロバイダのネットワーク要素として実現され、コンテンツレンダリング装置5がユーザの近傍に配置されるように分散されてもよい。メディアコンテンツ処理装置1の各コンポーネント2、3、4、5、6、7はそれぞれ、いくつかのプロセッサを有することが可能であり、あるいは、1以上のプロセッサを共有することが可能である。
図2は、メディアコンテンツ処理装置1とユーザとの間のコンテンツタイプにより制御されるやりとりのための方法のフローチャートを示す。
第1ステップにおいて、メディアコンテンツ検出装置6は、映画やニュースプログラムなどの音声/映像入力VIが主として映像ベースであるか、又は主として音声ベースであるか、すなわち、メディアコンテンツ自体が伝送する情報において、主として映像情報(スポーツプログラム、アクション映画など)を利用しているか、又は主として音声情報(ニュースプログラム、コメディーショーなど)を利用しているか判断するため、コンテンツ記述子CDを検出する。コンテンツ記述子CDは、制御ユニットに送信される。
メディアコンテンツが映像ベースであるか、音声ベースであるかに応じて、制御ユニット8は、テレビ装置などの情報出力レンダリングモジュール11に制御パラメータA、Vを送信する。
ここで、ユーザは、例えば、メディアコンテンツ処理装置1をプログラムするため、リモコン9から構成されるユーザインタフェースを介しメディアコンテンツ処理装置1からユーザが求める情報の出力を要求する。ユーザインタフェースの内部パーツである情報出力レンダリングモジュール11又は他の機能ユニット(図示せず)は、制御パラメータA、Vに基づき構成される。このように、主として音声ベースのコンテンツが存在することにより、テレビ画面などにより要求された情報の映像ベース出力VOが生成され、入力メディアコンテンツの音声部分はさらに、中断することなくユーザに提示される。主として映像ベースのメディアコンテンツが存在することにより、テレビ装置のラウドスピーカーを介し要求された情報の音声ベース出力AOが生成され、入力メディアコンテンツの映像部分はさらに、中断することなくユーザに提示される。
このような例では、ユーザはまた他のチャンネルでニュース放送を聴きながら、1つのチャンネルでスポーツ番組放送を、何れのアクションも見逃すことなく視聴し続けることが可能である。
上述の例は、コンテンツ記述子検出ユニット6が、適切な制御ユニットを有する出力レンダリングモジュール11に検出されたコンテンツ記述子を直接転送するようにして、実現することが可能である。その後、コンテンツ記述子は、制御ユニットにおいて適切な制御パラメータに変換される。次に、制御パラメータは、ユーザによって要求された情報が現在処理又はレンダリングされているメディアコンテンツに適応させることによりレンダリングされるように、出力レンダリングモジュール11を制御する。
本発明がそれの好適な実施例及び変形の形式により開示されたが、本発明の範囲から逸脱することなく、当業者により多数のさらなる改良及び変形が可能であるということは理解されるであろう。例えば、コンテンツ処理装置1は、上述されたコンポーネント2、3、4、5の1つしか有しなくてもよいし、あるいは、上述したコンポーネント2、3、4、5の何れかの組み合わせを有するようにしてもよい。また、コンテンツ処理装置1は、パーソナルコンピュータに部分的又は完全に搭載されてもよい。
簡単化のため、本出願を通じて「ある」という用語は複数を排除するものでなく、「有する」という用語は他のステップ又は要素を排除するものでないということは理解されるであろう。「ユニット」又は「モジュール」という用語は、単体として明示的に記述されない場合、いくつかのブロック又は装置を有するかもしれない。「ハードウェア」という用語は、デジタル又はアナログハードウェアを意味する可能性があり、基板、集積回路、オフ・ザ・シェルフモジュール、カスタムモジュールなどの任意のタイプの回路を意味するかもしれない。
Claims (12)
- メディアコンテンツ処理装置を制御するための方法であって、
いくつかのコンテンツ記述子が予め規定され、
処理対象となるメディアコンテンツが、所定のコンテンツ記述子により記述されているか判断され、
装置制御パラメータが、前記処理対象となるメディアコンテンツを記述するコンテンツ記述子に基づき自動調整され、
前記メディアコンテンツ処理装置は、前記装置制御パラメータに基づき自動制御される、
ことを特徴とする方法。 - 請求項1記載の方法であって、
処理対象となるメディアコンテンツを記述するコンテンツ記述子は、ユーザにより入力されることを特徴とする方法。 - 請求項1又は2記載の方法であって、
処理対象となるメディアコンテンツは、該処理対象となるメディアコンテンツを記述するコンテンツ記述子を付属信号として有することを特徴とする方法。 - 請求項1乃至3何れか一項記載の方法であって、
前記処理対象となるメディアコンテンツを記述するコンテンツ記述子は、処理対象となるメディアコンテンツから抽出されることを特徴とする方法。 - 請求項1乃至4何れか一項記載の方法であって、
前記メディアコンテンツ処理装置は、コンテンツレンダリング装置を有し、
前記装置制御パラメータは、前記コンテンツレンダリングを制御する、
ことを特徴とする方法。 - 請求項5記載の方法であって、
前記装置制御パラメータは、前記コンテンツレンダリング装置のボリュームを制御することを特徴とする方法。 - 請求項1乃至6何れか一項記載の方法であって、
前記装置制御パラメータは、特定の入力パラメータに応答して、前記メディアコンテンツ処理装置の機能ユニットの応答を制御するよう該機能ユニットを設定することを特徴とする方法。 - 請求項7記載の方法であって、
前記機能ユニットは、ユーザインタフェースを有するか、又はユーザインタフェースの一部であり、
前記装置制御パラメータは、前記ユーザと前記メディア処理装置との間のやりとりを制御する、
ことを特徴とする方法。 - 請求項8記載の方法であって、
前記装置制御パラメータは、前記メディアコンテンツ処理装置のリモコンコマンドに対する応答を制御することを特徴とする方法。 - 請求項7乃至9何れか一項記載の方法であって、
前記機能ユニットは、音声認識装置又は発話者識別装置を有するか、又は音声認識装置若しくは発話者識別装置の一部であり、
前記装置制御パラメータは、音声認識処理又は発話者識別処理を制御する、
ことを特徴とする方法。 - 請求項1乃至10何れか一項記載の方法であって、
装置制御パラメータとコンテンツ記述子との間の関係は、前記ユーザにより設定可能であることを特徴とする方法。 - 処理対象となるメディアコンテンツが、いくつかの所定のコンテンツ記述子の所定のコンテンツ記述子によって記述されているか判断するよう構成されるコンテンツ記述子検出装置と、
装置制御パラメータが、前記処理対象となるメディアコンテンツを記述するコンテンツ記述子に基づき調整されるように、かつ、当該メディアコンテンツ処理装置が、前記装置制御パラメータに基づき自動制御されるように構成される制御ユニットと、
を有することを特徴とするメディアコンテンツ処理装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP04101535 | 2004-04-15 | ||
PCT/IB2005/051126 WO2005101808A1 (en) | 2004-04-15 | 2005-04-06 | A method for controlling a media content processing device, and a media content processing device |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007533235A true JP2007533235A (ja) | 2007-11-15 |
Family
ID=34963012
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007507887A Pending JP2007533235A (ja) | 2004-04-15 | 2005-04-06 | メディアコンテンツ処理装置の制御方法及びメディアコンテンツ処理装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20070216538A1 (ja) |
EP (1) | EP1738577A1 (ja) |
JP (1) | JP2007533235A (ja) |
CN (1) | CN1943222A (ja) |
TW (1) | TW200604850A (ja) |
WO (1) | WO2005101808A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009118894A1 (ja) * | 2008-03-28 | 2009-10-01 | パイオニア株式会社 | 出力データ切替装置、出力データ切替方法、出力データ切替システムおよび出力データ切替装置用プログラム |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE60320414T2 (de) * | 2003-11-12 | 2009-05-20 | Sony Deutschland Gmbh | Vorrichtung und Verfahren zur automatischen Extraktion von wichtigen Ereignissen in Audiosignalen |
US20070016530A1 (en) * | 2005-07-15 | 2007-01-18 | Christopher Stasi | Multi-media file distribution system and method |
US8682654B2 (en) * | 2006-04-25 | 2014-03-25 | Cyberlink Corp. | Systems and methods for classifying sports video |
US9130684B2 (en) * | 2008-06-23 | 2015-09-08 | Echostar Technologies L.L.C. | Systems and methods for conserving energy in an entertainment system |
JP5772069B2 (ja) * | 2011-03-04 | 2015-09-02 | ソニー株式会社 | 情報処理装置、情報処理方法およびプログラム |
CN103226961B (zh) * | 2013-04-01 | 2016-09-14 | 小米科技有限责任公司 | 一种播放方法和装置 |
GB2548152A (en) | 2016-03-11 | 2017-09-13 | Sony Corp | Apparatus, method and computer program |
CN106375799A (zh) * | 2016-08-31 | 2017-02-01 | 广州华多网络科技有限公司 | 直播间广播信息定制推送方法及装置、服务器 |
CN108363557B (zh) * | 2018-02-02 | 2020-06-12 | 刘国华 | 人机交互方法、装置、计算机设备和存储介质 |
US10567314B1 (en) * | 2018-12-03 | 2020-02-18 | D8AI Inc. | Programmable intelligent agents for human-chatbot communication |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003016080A (ja) * | 2001-06-29 | 2003-01-17 | Sony Corp | ネットワークシステム、情報処理装置および方法、記録媒体、並びにプログラム |
WO2004025623A2 (en) * | 2002-09-16 | 2004-03-25 | Matsushita Electric Industrial Co., Ltd. | System and method of media file access and retrieval using speech recognition |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2000201A (en) * | 1931-10-23 | 1935-05-07 | Electromatic Typewriters Inc | Apparatus for writing checks |
US4305101A (en) * | 1979-04-16 | 1981-12-08 | Codart, Inc. | Method and apparatus for selectively recording a broadcast |
US5684918A (en) * | 1992-02-07 | 1997-11-04 | Abecassis; Max | System for integrating video and communications |
US5661526A (en) * | 1993-08-25 | 1997-08-26 | Sony Corporation | Broadcast signal receiver and tape recorder and, method of detecting additional information channel |
US6115057A (en) * | 1995-02-14 | 2000-09-05 | Index Systems, Inc. | Apparatus and method for allowing rating level control of the viewing of a program |
US5969748A (en) * | 1996-05-29 | 1999-10-19 | Starsight Telecast, Inc. | Television schedule system with access control |
US5973683A (en) * | 1997-11-24 | 1999-10-26 | International Business Machines Corporation | Dynamic regulation of television viewing content based on viewer profile and viewing history |
CA2430019A1 (en) * | 2000-11-27 | 2002-05-30 | Intellocity Usa, Inc. | System and method for providing an omnimedia package |
US20020116471A1 (en) * | 2001-02-20 | 2002-08-22 | Koninklijke Philips Electronics N.V. | Broadcast and processing of meta-information associated with content material |
US7617511B2 (en) * | 2002-05-31 | 2009-11-10 | Microsoft Corporation | Entering programming preferences while browsing an electronic programming guide |
-
2005
- 2005-04-06 US US10/599,882 patent/US20070216538A1/en not_active Abandoned
- 2005-04-06 CN CNA2005800112542A patent/CN1943222A/zh active Pending
- 2005-04-06 JP JP2007507887A patent/JP2007533235A/ja active Pending
- 2005-04-06 WO PCT/IB2005/051126 patent/WO2005101808A1/en active Application Filing
- 2005-04-06 EP EP05718643A patent/EP1738577A1/en not_active Withdrawn
- 2005-04-12 TW TW094111510A patent/TW200604850A/zh unknown
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003016080A (ja) * | 2001-06-29 | 2003-01-17 | Sony Corp | ネットワークシステム、情報処理装置および方法、記録媒体、並びにプログラム |
WO2004025623A2 (en) * | 2002-09-16 | 2004-03-25 | Matsushita Electric Industrial Co., Ltd. | System and method of media file access and retrieval using speech recognition |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009118894A1 (ja) * | 2008-03-28 | 2009-10-01 | パイオニア株式会社 | 出力データ切替装置、出力データ切替方法、出力データ切替システムおよび出力データ切替装置用プログラム |
JPWO2009118894A1 (ja) * | 2008-03-28 | 2011-07-21 | パイオニア株式会社 | 出力データ切替装置、出力データ切替方法、出力データ切替システムおよび出力データ切替装置用プログラム |
Also Published As
Publication number | Publication date |
---|---|
CN1943222A (zh) | 2007-04-04 |
EP1738577A1 (en) | 2007-01-03 |
TW200604850A (en) | 2006-02-01 |
WO2005101808A1 (en) | 2005-10-27 |
US20070216538A1 (en) | 2007-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2007533235A (ja) | メディアコンテンツ処理装置の制御方法及びメディアコンテンツ処理装置 | |
US10720162B2 (en) | Display apparatus capable of releasing a voice input mode by sensing a speech finish and voice control method thereof | |
KR100845476B1 (ko) | 가전제품에 속하는 디바이스의 음성제어를 위한 방법 및장치 | |
US9338513B2 (en) | Apparatus, systems and methods for automatically presenting stored media content at its beginning | |
CN107958668B (zh) | 智能电视的声控选播方法、声控选播系统 | |
CN111541921A (zh) | 利用语音命令控制电子设备的系统和远程控制器 | |
KR20130016025A (ko) | 음성 인식 및 모션 인식을 이용한 전자 장치의 제어 방법 및 이를 적용한 전자 장치 | |
US8798311B2 (en) | Scrolling display of electronic program guide utilizing images of user lip movements | |
CN101569092A (zh) | 用于处理音频数据的系统 | |
US20230186938A1 (en) | Audio signal processing device and operating method therefor | |
CA3095406A1 (en) | Systems and methods for adjusting a media consumption environment based on changes in status of an object | |
JP2002051300A (ja) | 放送受信機,放送制御方法,コンピュータ読み取り可能な記録媒体,及びコンピュータプログラム | |
KR102429582B1 (ko) | 전자 장치 및 그 제어 방법 | |
TW201408050A (zh) | 控制方法與影音播放系統 | |
JP6560503B2 (ja) | 盛り上がり通知システム | |
EP2568471A1 (en) | A method for playing multimedia content, a related system and related playback module | |
US20140075471A1 (en) | Apparatus, systems and methods for accessing supplemental information pertaining to a news segment | |
JP6351987B2 (ja) | 発話制御装置、発話装置、発話制御システム、発話制御方法、発話装置の制御方法、および制御プログラム | |
KR101500061B1 (ko) | 복수의 미디어 채널에 적용가능한 신 스위칭 시스템 및 방법, 그리고 그 기록매체 | |
KR100499032B1 (ko) | 텔레비젼 수신기를 기반으로 하는 오디오 및 비디오 합성편집장치 | |
US10264233B2 (en) | Content reproducing apparatus and content reproducing method | |
TWI524747B (zh) | 播放方法與播放裝置 | |
KR20050077117A (ko) | 채널별 오디오/비디오 환경 설정 방법 | |
JP2021092612A (ja) | コマンド制御装置、制御方法および制御プログラム | |
JP2021506187A (ja) | メディアアセットの再生に無関係である口頭コマンドに応答して、メディアアセットの再生を修正するためのシステムおよび方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080403 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20080919 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100511 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20101019 |