JP2021527969A

JP2021527969A - 音声およびビデオ・マルチメディアの修正および提示

Info

Publication number: JP2021527969A
Application number: JP2020557308A
Authority: JP
Inventors: ホイットマン、トッド、ルッセル; ボウマン、アーロン; バスチアン、デイヴィッド; マクローリー、ニコラス
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 2018-06-19
Filing date: 2019-06-13
Publication date: 2021-10-14
Anticipated expiration: 2039-06-13
Also published as: GB2587584A; DE112019001822B4; GB2587584B; CN112088369B; GB202100132D0; US10666954B2; CN112088369A; DE112019001822T5; US20190387235A1; WO2019243961A1; JP7416718B2

Abstract

音声およびビデオ・マルチメディアの修正および提示を改善する方法、システム、およびプログラムが、提供される。方法は、音声／ビデオ・ストリームを受信することと、オブジェクトに関する予測を生成するために音声／ビデオ・ストリームのオブジェクトを分析することと、を含む。成分分析コードが、音声／ビデオ・ストリームに関して実行され、オブジェクトは、音声／ビデオ・ストリームから除去されて、修正済み音声／ビデオ・ストリームが生成され、それによって音声／ビデオ・ストリームのハードウェア・ストレージおよび移送サイズ要件を減少させることをもたらす。修正済み音声／ビデオ・ストリームが、グラフィカル・ユーザ・インターフェースを介してユーザに提示される。

Description

本発明は、概して、音声およびビデオ・マルチメディアを修正する方法に関し、特に、音声／ビデオ・ストリームのハードウェア・ストレージおよび移送サイズ要件の減少をもたらす、音声／ビデオ・ストリームからのオブジェクトのハードウェア・デバイス除去に関連する音声およびビデオ・マルチメディア技術を改善する方法および関連システムに関する。

典型的には所与の一日の間に複数時間見られるブロードキャスト・ビデオ・ストリームは、周知のプロセスに関連している。同様に、モバイル・デバイスに関するインターネットの現在のアクセス可能性を伴うモバイル・デバイス市場の成長は、任意の時間に任意の場所についてマルチメディア・コンテンツに容易にアクセスすることを可能にする。現在の予測では、マルチメディア・コンテンツのレベルが、将来的に数百万テラバイトを超えて成長すると推定される。送信されている大量のデータを考慮するようにマルチメディアのサイズを減少させることに関して、現在多数の解決策が存在する。視覚的シーン全体を通してオブジェクトの動きに基づいて判断されるキャプチャまたはフレーム・レートに関連するプロセスは、より少量の帯域幅が利用される結果をもたらし得る。マルチメディア・データの移送中にネットワーク・リソースを割り当てること、または画像を圧縮することは、より高速のビデオ信号の送信を可能にし得る。同様に、動画内の画素を検出するプロセスは、ユーザがあるオブジェクトを見ることを可能にし得る。

しかしながら、前述した解決策は、マルチメディア・ストリームの送信のための不正確で複雑なシステムの使用を必要とし得る。さらに、前述した解決策は、より低速のデータ送信レートをもたらし得る。結果として、現在の解決策は、送信サイズ要件を減少させる有効な手段を含まない。

したがって、当技術分野において、マルチメディア・コンテンツを送信する有効な手段を可能にする必要性が存在する。

発明の第１の態様は、ハードウェア・デバイスのプロセッサによってローカル・ソースまたはリモート・ソースから、音声／ビデオ・ストリームを受信することと、主要注目オブジェクトおよび非主要注目オブジェクトが、非主要注目オブジェクトに対する主要注目オブジェクトの移動を検出することによって関連する相互作用を判断するために識別されタグ付けされるように、プロセッサがＲ^２統計的回帰コードを実行することによって、音声／ビデオ・ストリームのオブジェクトに関する予測を生成するために音声／ビデオ・ストリームのオブジェクトを分析することと、非主要注目オブジェクトに対する変更が主要注目オブジェクトに対する変更に基づいて予測されるように、プロセッサによって、特定期間に従って音声／ビデオ・ストリームの個々のフレームに関して各オブジェクトを解析するためのプロセスをもたらす、音声／ビデオ・ストリームに関する成分分析コードを実行することと、プロセッサによって実行することに応答して、修正済み音声／ビデオ・ストリームが生成されて、その結果音声／ビデオ・ストリームのハードウェア・ストレージおよび移送サイズ要件が減少されることをもたらす、音声／ビデオ・ストリームからオブジェクトのうちのあるオブジェクトを除去することと、プロセッサによってグラフィカル・ユーザ・インターフェース（ＧＵＩ）を介して、修正済み音声／ビデオ・ストリームを提示することと、を含む、音声およびビデオ・マルチメディア部分除去に基づく修正および提示改善方法を提供する。

発明のいくつかの実施形態は、追加オブジェクトがＧＵＩ内で元のオブジェクトよりも中心に位置すると判断するため、音声／ビデオ・ストリームの追加ビューを検索するため、追加オブジェクトを修正済み音声／ビデオ・ストリームに追加するため、およびＧＵＩを介して追加オブジェクトを含む修正済み音声／ビデオ・ストリームを提示するための、プロセスをさらに提供する。これらの実施形態は、画像内の音声／ビデオ・オブジェクト間の相互作用に基づいて（マルチメディア・ストリーム内で）視覚的コア・アクションに対してユーザの注意を集中させるために音声およびビデオ・フィードの主要成分を隔離するための有効な手段を有利に提供する。追加的に、本発明のこれらの実施形態は、ユーザがコア・オブジェクトの周囲の余分なオブジェクトではなく各音声／ビデオ・フレーム内の最高潮のアクションに集中するように、音声／ビデオ・オブジェクトの動きに基づいて意味的プルーニング・プロセスが実施されることを有利に可能にし、近隣画素を平滑化することによってマルチメディア・ストリームのサイズを減少させるように構成され得る。

発明の第２の態様は、コンピュータ可読プログラム・コードを記憶するコンピュータ可読ハードウェア・ストレージ・デバイスを含む、コンピュータ・プログラム製品を提供し、コンピュータ可読プログラム・コードが、ハードウェア・デバイスのプロセッサによって実行されるときに音声およびビデオ・マルチメディア部分除去に基づく修正および提示改善方法を実施するアルゴリズムを含み、方法が、プロセッサによってローカル・ソースまたはリモート・ソースから、音声／ビデオ・ストリームを受信することと、主要注目オブジェクトおよび非主要注目オブジェクトが、非主要注目オブジェクトに対する主要注目オブジェクトの移動を検出することによって関連する相互作用を判断するために識別されタグ付けされるように、プロセッサがＲ^２統計的回帰コードを実行することによって、音声／ビデオ・ストリームのオブジェクトに関する予測を生成するために音声／ビデオ・ストリームのオブジェクトを分析することと、非主要注目オブジェクトに対する変更が主要注目オブジェクトに対する変更に基づいて予測されるように、プロセッサによって、特定期間に従って音声／ビデオ・ストリームの個々のフレームに関する各オブジェクトを解析するためのプロセスをもたらす、音声／ビデオ・ストリームに関する成分分析コードを実行することと、プロセッサによって実行することに応答して、修正済み音声／ビデオ・ストリームが生成されて、その結果音声／ビデオ・ストリームのハードウェア・ストレージおよび移送サイズ要件が減少されることをもたらす、音声／ビデオ・ストリームからオブジェクトのうちのあるオブジェクトを除去することと、プロセッサによってグラフィカル・ユーザ・インターフェース（ＧＵＩ）を介して、修正済み音声／ビデオ・ストリームを提示することと、を含む。

発明の第３の態様は、コンピュータ可読メモリ・ユニットに連結されたプロセッサを含むハードウェア・デバイスを提供し、メモリ・ユニットが、プロセッサによってローカル・ソースまたはリモート・ソースから、音声／ビデオ・ストリームを受信することと、主要注目オブジェクトおよび非主要注目オブジェクトが、非主要注目オブジェクトに対する主要注目オブジェクトの移動を検出することによって関連する相互作用を判断するために識別されタグ付けされるように、プロセッサがＲ^２統計的回帰コードを実行することによって、音声／ビデオ・ストリームのオブジェクトに関する予測を生成するために音声／ビデオ・ストリームのオブジェクトを分析することと、非主要注目オブジェクトに対する変更が主要注目オブジェクトに対する変更に基づいて予測されるように、プロセッサによって、特定期間に従って音声／ビデオ・ストリームの個々のフレームに関する各オブジェクトを解析するためのプロセスをもたらす、音声／ビデオ・ストリームに関する成分分析コードを実行することと、プロセッサによって実行することに応答して、修正済み音声／ビデオ・ストリームが生成されて、その結果音声／ビデオ・ストリームのハードウェア・ストレージおよび移送サイズ要件が減少されることをもたらす、音声／ビデオ・ストリームからオブジェクトのうちのあるオブジェクトを除去することと、プロセッサによってグラフィカル・ユーザ・インターフェース（ＧＵＩ）を介して、修正済み音声／ビデオ・ストリームを提示することと、を含む、音声およびビデオ・マルチメディア部分除去に基づく修正および提示改善方法を、プロセッサによって実行されるときに実施する命令を含む。

発明のいくつかの実施形態は、追加オブジェクトがＧＵＩ内で元のオブジェクトよりも中心に位置すると判断するため、音声／ビデオ・ストリームの追加ビューを検索するため、追加オブジェクトを修正済み音声／ビデオ・ストリームに追加するため、およびＧＵＩを介して追加オブジェクトを含む修正済み音声／ビデオ・ストリームを提示するための、プロセスをさらに提供する。これらの実施形態は、画像内の音声／ビデオ・オブジェクト間の相互作用に基づいて（マルチメディア・ストリーム内で）視覚的コア・アクションに対してユーザの注意を集中させるために音声およびビデオ・フィードの主要成分を隔離するための有効な手段を有利に提供する。追加的に、これらの実施形態は、ユーザがコア・オブジェクトの周囲の余分なオブジェクトではなく各音声／ビデオ・フレーム内の最高潮のアクションに集中するように、音声／ビデオ・オブジェクトの動きに基づいて意味的プルーニング・プロセスが実施されることを有利に可能にし、近隣画素を平滑化することによってマルチメディア・ストリームのサイズを減少させるように構成され得る。

発明の第４の態様は、ハードウェア・デバイスのプロセッサによってローカル・ソースまたはリモート・ソースから、音声／ビデオ・ストリームを受信することと、プロセッサがＲ^２統計的回帰コードを実行することによって、音声／ビデオ・ストリームのオブジェクトに関する予測を生成するために音声／ビデオ・ストリームの音声またはビデオ・オブジェクトを分析することと、プロセッサによって、音声／ビデオ・ストリームに関する成分分析コードを実行することと、プロセッサによって実行することに応答して、修正済み音声／ビデオ・ストリームが生成されて、その結果音声／ビデオ・ストリームのハードウェア・ストレージおよび移送サイズ要件が減少されることをもたらす、オブジェクトの少なくとも１つの追加オブジェクトに関してオブジェクトのうちのあるオブジェクトを修正することと、プロセッサによってグラフィカル・ユーザ・インターフェース（ＧＵＩ）を介して、修正済み音声／ビデオ・ストリームを提示することと、を含む、音声およびビデオ・マルチメディア修正および提示改善方法を提供する。

発明のいくつかの実施形態は、ビデオ・オブジェクトを修正することが、オブジェクトのサイズを減少させること、オブジェクトのビューを不鮮明にすること、またはオブジェクトのビューを拡張することを含み得るような方法をさらに提供する。発明のさらなる態様は、音声オブジェクトを修正することが、オブジェクトの可聴レベルを上昇させることまたは低下させることを含み得るような方法を提供する。これらの実施形態は、画像内の音声／ビデオ・オブジェクト間の相互作用に基づいて（マルチメディア・ストリーム内で）視覚的コア・アクションに対してユーザの注意を集中させるために音声およびビデオ・フィードの主要成分を隔離するための有効な手段を、有利に提供する。追加的に、本発明のこれらの実施形態は、ユーザがコア・オブジェクトの周囲の余分なオブジェクトではなく各音声／ビデオ・フレーム内の最高潮のアクションに集中するように、音声／ビデオ・オブジェクトの動きに基づいて意味的プルーニング・プロセスが実施されることを有利に可能にし、近隣画素を平滑化することによってマルチメディア・ストリームのサイズを減少させるように構成され得る。

発明の第５の態様は、コンピュータ可読プログラム・コードを記憶するコンピュータ可読ハードウェア・ストレージ・デバイスを含む、コンピュータ・プログラム製品を提供し、コンピュータ可読プログラム・コードが、ハードウェア・デバイスのプロセッサによって実行されるときに音声およびビデオ・マルチメディア修正および提示改善方法を実施するアルゴリズムを含み、方法が、プロセッサによってローカル・ソースまたはリモート・ソースから、音声／ビデオ・ストリームを受信することと、プロセッサがＲ^２統計的回帰コードを実行することによって、音声／ビデオ・ストリームのオブジェクトに関する予測を生成するために音声／ビデオ・ストリームの音声またはビデオ・オブジェクトを分析することと、プロセッサによって、音声／ビデオ・ストリームに関する成分分析コードを実行することと、プロセッサによって実行することに応答して、修正済み音声／ビデオ・ストリームが生成されて、その結果音声／ビデオ・ストリームのハードウェア・ストレージおよび移送サイズ要件が減少されることをもたらす、オブジェクトの少なくとも１つの追加オブジェクトに関してオブジェクトのうちのあるオブジェクトを修正することと、プロセッサによってグラフィカル・ユーザ・インターフェース（ＧＵＩ）を介して、修正済み音声／ビデオ・ストリームを提示することと、を含む。

発明のいくつかの実施形態は、ビデオ・オブジェクトを修正することが、オブジェクトのサイズを減少させること、オブジェクトのビューを不鮮明にすること、またはオブジェクトのビューを拡張することを含み得るような方法をさらに提供する。発明のさらなる態様は、音声オブジェクトを修正することが、オブジェクトの可聴レベルを上昇させることまたは低下させることを含み得るような方法を提供する。これらの実施形態は、画像内の音声／ビデオ・オブジェクト間の相互作用に基づいて（マルチメディア・ストリーム内で）視覚的コア・アクションに対してユーザの注意を集中させるために音声およびビデオ・フィードの主要成分を隔離するための有効な手段を有利に提供する。追加的に、本発明のこれらの実施形態は、ユーザがコア・オブジェクトの周囲の余分なオブジェクトではなく各音声／ビデオ・フレーム内の最高潮のアクションに集中するように、音声／ビデオ・オブジェクトの動きに基づいて意味的プルーニング・プロセスが実施されることを有利に可能にし、近隣画素を平滑化することによってマルチメディア・ストリームのサイズを減少させるように構成され得る。

本発明は、ビデオ・ストリームを正確にブロードキャストすることが可能な簡単な方法および関連システムを有利に提供する。

本発明の実施形態による、音声／ビデオ・ストリームのハードウェア・ストレージおよび移送サイズ要件の減少をもたらす音声／ビデオ・ストリームからのオブジェクトのハードウェア・デバイス除去に関連する音声およびビデオ・マルチメディア技術を改善するシステムを示す。本発明の実施形態による、音声およびビデオ・マルチメディア技術を改善するための、図１のシステムによって作動されるプロセス・フローを詳細化したアルゴリズムを示す。本発明の実施形態による、音声およびビデオ・マルチメディア技術を改善するための、図２のプロセス・フローをさらに詳細化したアルゴリズムを示す。本発明の実施形態による、図３のアルゴリズムに関する代替アルゴリズムを示す。本発明の実施形態による、図１のソフトウェア／ハードウェア構造の内部構造図を示す。本発明の実施形態による、修正済み音声／ビデオ・ストリームを提示するＧＵＩの構造図を示す。本発明の実施形態による、音声／ビデオ・ストリームのハードウェア・ストレージおよび移送サイズ要件の減少をもたらす音声／ビデオ・ストリームからのオブジェクトのハードウェア・デバイス除去に関連する音声およびビデオ・マルチメディア技術を改善するための、図１のシステムによって使用されるコンピュータ・システムを示す。本発明の実施形態による、クラウド・コンピューティング環境を示す。本発明の実施形態による、クラウド・コンピューティング環境によって提供される機能抽象レイヤのセットを示す。

図１は、本発明の実施形態による、音声／ビデオ・ストリームのハードウェア・ストレージおよび移送サイズ要件の減少をもたらす音声／ビデオ・ストリームからのオブジェクトのハードウェア・デバイス除去に関連する音声およびビデオ・マルチメディア技術を改善するためのシステム１００を示す。現在のマルチメディア・コンテンツの激増は、マルチメディア・コンテンツのサイズを減少させることに関してより効率的な集中を必要とする。追加的に、ユーザの注意は、多種多様な選択に起因してマルチメディア・コンテンツに関する追加的な注目を必要とし得る。典型的なシステムは、現在、ＰＣＡ変換にパラメータ化されるマルチチャネル音声のスケーラブル符号化を使用する。さらにシステムは、画像のシーケンスを疎な前景成分に分解し得る。分解された画像は、画像のシーケンスにおいて検出された動きに基づいて圧縮される。これに対して、システム１００は、オブジェクトの依存関係を表すためにフレームの相互作用によってフレームを介してマルチメディア・コンテンツを検査する。追加的に、システム１００は、密な視覚的領域をビデオ内に位置させるために視覚的シーンが分析されることを可能にし得る。システム１００は、画像内の音声／ビデオ・オブジェクト間の相互作用に基づいて（マルチメディア・ストリーム内で）視覚的コア・アクションに対してユーザの注意を集中させるための有効な手段を提供する。追加的に、システム１００は、ユーザがコア・オブジェクトの周囲の余分なオブジェクトではなく各音声／ビデオ・フレーム内の最高潮のアクションに集中するように、音声／ビデオ・オブジェクトの動きに基づいて意味的プルーニング・プロセスが実施されることを可能にし、近隣画素を平滑化することによってマルチメディア・ストリームのサイズを減少させるように構成され得る。

システム１００は、以下のように、ビデオ表示に描かれたオブジェクトを修正するためのプロセスを可能にする。

（ストリーミング）マルチメディア表示のフレームは、マルチメディア表示の各ビデオ・フレーム内のオブジェクトのセットの検索のために解析される。これに応答して、デジタル意味タグが、各ビデオ・フレーム内の各オブジェクトに個々に適用される。意味タグは、オブジェクトの相対運動特性を記述する。タグは、ビデオ・フレーム内の中央に位置するオブジェクトに対して増加する重み値を用いて、かつ増加する相対運動の度合いに関して、修正され得る。（オブジェクトの）主要オブジェクトのセットは、オブジェクトに関連付けられた重み値に基づいて決定される。これに依って、主要オブジェクトのセットの外観が、オブジェクトのセット内の追加オブジェクトに対して修正される。オブジェクトの外観を修正することは、関連ビデオ・フレームから追加オブジェクトを除去することを含み得る。追加的に、背景画像は、関連ビデオ・フレームから除去された任意のオブジェクトを置換するために生成され得る。さらに、追加オブジェクトに対する変更は、主成分分析（ＰＣＡ）コードの実行を介して予測され得る。

システム１００は、表示された画像内の異なる音声／ビデオ・オブジェクトの相互作用に基づいて、ビデオ表示内のコア・アクションに関してユーザの注意を集中させるためにハードウェア／ソフトウェアを介して作動される探索特徴を可能にする。音声／ビデオ・オブジェクトは、主要オブジェクトに近接する画素を平滑化するためのプロセスを介して、主要オブジェクトの動きに基づいて意味的にプルーニングされる。追加的に、システム１００は、各ビデオ・フレーム内のアクションの頂点に向かってユーザの注意を集中させるための手段を提供する。

図１のシステム１００は、ネットワーク１１７を通して相互接続される、サーバ・ハードウェア・デバイス１０４（即ち、専用ハードウェア・デバイス）、マルチメディア・ハードウェア・デバイス１０５ａ．．．１０５ｎ（即ち、特にモバイル・デバイス、ＰＤＡなどの専用ハードウェア・デバイス）、およびデータベース１０７（例えば、クラウド・ベース・システム）を含む。サーバ・データベース・システム１０４は、専用回路１２７（専用ソフトウェアを含み得る）、およびソフトウェア／ハードウェア構造１２１を含む。マルチメディア・ハードウェア・デバイス１０５ａ．．．１０５ｎは、各ユーザに提供される個人デバイスを含み得る。マルチメディア・ハードウェア・デバイス１０５ａ．．．１０５ｎは、Ｂｌｕｅｔｏｏｔｈまたは任意の種類のシステムへの接続性を提供することが可能な無線であってもよい。マルチメディア・ハードウェア・デバイス１０５ａ．．．１０５ｎは、専用回路１２５ａ．．．１２５ｎ（専用ソフトウェアを含み得る）、音声／ビデオ検索デバイス１３２ａ．．．１３２ｎ、音声／ビデオ・センサ１１０ａ．．．１１０ｎ、ならびにコード１１２ａ．．．１１２ｎ（統計的回帰コードおよび成分分析コードを含む）を含む。音声／ビデオ・センサ１１０ａ．．．１１０ｎは、特に、心拍数モニタ、血圧モニタ、温度センサ、脈拍数モニタ、超音波センサ、光センサ、ビデオ検索デバイス、音声検索デバイス、湿度センサなどを含む、任意の種類の内部または外部センサ（または生体センサ）を含み得る。サーバ・ハードウェア・デバイス１０４、マルチメディア・ハードウェア・デバイス１０５ａ．．．１０５ｎ、およびデータベース１０７はそれぞれ、組み込み型デバイスを含み得る。組み込み型デバイスは、本明細書において、専用機能を実行するために特別に設計された（ケイパビリティ固定の、またはプログラマブル）コンピュータ・ハードウェアおよびソフトウェアの組合せを含む専用デバイスまたはコンピュータとして定義される。プログラマブル組み込み型コンピュータまたはデバイスは、専用プログラミング・インターフェースを含んでもよい。１つの実施形態において、サーバ・ハードウェア・デバイス１０４、マルチメディア・ハードウェア・デバイス１０５ａ．．．１０５ｎ、およびデータベース１０７は、各々が、図１〜図９に関して説明されるプロセスを（独立して、または組み合わせて）実行するための、専用（汎用ではない）ハードウェアおよび回路（即ち、専用の個別非汎用アナログ、デジタル、およびロジック・ベース回路）を含む専用ハードウェア・デバイスを含み得る。専用の個別非汎用アナログ、デジタル、およびロジック・ベース回路は、独自の専用設計されたコンポーネント（例えば、音声／ビデオ・ストリームのハードウェア・ストレージおよび移送サイズ要件の減少をもたらす、音声／ビデオ・ストリームからのオブジェクトのハードウェア・デバイス除去に関連する音声およびビデオ・マルチメディア技術を改善するための自動プロセスを実施するためだけに設計された、特定用途向け集積回路（ＡＳＩＣ）などの専用集積回路）を含み得る。音声／ビデオ検索デバイス１３２ａ．．．１３２ｎは、特にカメラ、ビデオ・カメラ、スチール・ショット・カメラ、マイクロフォンなどを含む、任意の種類の音声／ビデオ・デバイスを含み得る。ネットワーク１１７は、特に、ローカル・エリア・ネットワーク（ＬＡＮ）、ワイド・エリア・ネットワーク（ＷＡＮ）、インターネット、ワイヤレス・ネットワークなどを含む任意の種類のネットワークを含み得る。代替的に、ネットワーク１１７は、アプリケーション・プログラミング・インターフェース（ＡＰＩ）を含み得る。

システム１００は、以下のビデオ・オブジェクト・ベースの機能を提供するためのハードウェア／ソフトウェア・モジュールを含む。
１．どのビデオ・フレームが互いに相互作用しているかを判断するために時間に対してフレーム・ベースの相互作用表現を生成するために、各ビデオ・フレーム内のビデオ・オブジェクトの画像を解析すること。
２．意味タグが追加ビデオ・オブジェクトに対するビデオ・オブジェクトの動きを記述するために使用され得るかどうかを判断するために、各ビデオ・オブジェクトについての意味タグを判断すること。
３．ＧＵＩのディスプレイに対して中心に位置するビデオ・オブジェクトに関連する意味的動作重みを拡散すること。
４．中心性および意味的動作重みの組合せに基づいて主要画像を判断すること。
５．主要ビデオ・オブジェクトの変更に基づいて非主要ビデオ・オブジェクトに対する変更を予測するための主成分分析（ＰＣＡ）の使用。
６．ビデオ・オブジェクトがコア・アクションに追加される場合に、ビデオ・オブジェクトおよびサウンドをプルーニングすること、ならびにマルチメディア・ビデオ・ストリームからのビデオ・オブジェクトに基づいて新たな背景ビデオ・オブジェクトを追加カメラ角度または近接画素から補間すること。

図２は、本発明の実施形態による、音声およびビデオ・マルチメディア技術を改善するための、図１のシステム１００によって作動されるプロセス・フローを詳細化したアルゴリズムを示す。図２のアルゴリズム内の各ステップは、コンピュータ・コードを実行するコンピュータ・プロセッサによって、任意の順序で作動され、実行され得る。追加的に、図２のアルゴリズム内の各ステップは、サーバ・ハードウェア・デバイス１０４およびマルチメディア・ハードウェア・デバイス１０５ａ．．．１０５ｎにより組み合わせて作動され、実行され得る。ステップ２００において、音声ビデオ入力ストリームが、特にデータベース、ファイル・システム、クラウド・ベース・ストレージ・システムなどを含む、複数のソースから受信される。ステップ２０２において、音声ビデオ入力ストリームが、分析される。分析は、関連する主要音声／ビデオ・オブジェクト成分を識別し、タグ付けすることを含み得る。ステップ２０４において、音声ビデオ入力ストリームは、Ｒ二乗統計的回帰プロセスを介してさらに分析される。Ｒ二乗統計的回帰プロセスは、適合される回帰直線（例えば、判断の係数）に（ビデオ）データがどのくらい近いかの統計的測定値として本明細書では定義されている。したがって、Ｒ二乗統計的回帰プロセスは、Ｒ二乗＝説明された変数／合計変数などの線形モデルによって定義される応答可変変量のパーセンテージを含む。Ｒ二乗統計的回帰プロセスは、周囲の非主要音声／ビデオ・オブジェクト成分に対して追跡する主要音声／ビデオ・オブジェクト成分の移動および音声／ビデオ・ストリーム・フレーム間の関連する相互作用を予測するために実行される。ステップ２０８において、主成分分析コードは、音声／ビデオ・ストリームをセグメント化するために適用されて、その結果主要音声／ビデオ・オブジェクト成分が鮮明な、明瞭な、または可聴構造、あるいはそれらの組合せとして提示されることをもたらす。同様に、全ての非主要音声／ビデオ・オブジェクト成分が、不鮮明な、プルーニングされた、または非可聴構造である。ステップ２１０において、（ステップ２０８に基づく）修正された結果の音声／ビデオ・ストリームが、（出力デバイスを介して）提示され、または（ローカル・データ・ストレージに）記憶され、あるいはその両方が行われ、ステップ２００が繰り返される。

図３は、本発明の実施形態による、音声およびビデオ・マルチメディア技術を改善するための、図２のプロセス・フローをさらに詳細化したアルゴリズムを示す。図３のアルゴリズム内の各ステップは、コンピュータ・コードを実行するコンピュータ・プロセッサによって、任意の順序で作動され、実行され得る。追加的に、図３のアルゴリズム内の各ステップは、サーバ・ハードウェア・デバイス１０４およびマルチメディア・ハードウェア・デバイス１０５ａ．．．１０５ｎにより組み合わせて作動され、実行され得る。ステップ３００において、音声／ビデオ・ストリームが、ローカル・ソースまたはリモート・ソースから（マルチメディア・デバイスによって）受信される。ステップ３０２において、音声／ビデオ・ストリームの（音声またはビデオあるいはその両方の）オブジェクトが、Ｒ二乗（Ｒ^２）統計的回帰コードの実行を介して分析される。分析は、音声／ビデオ・ストリームのオブジェクトに関する予測の生成をもたらす。音声／ビデオ・ストリームのオブジェクトを分析することは、以下を含み得る。
１．オブジェクトの主要注目オブジェクトを識別すること。
２．オブジェクトの非主要注目オブジェクトを識別すること。
３．主要注目オブジェクトおよび非主要注目オブジェクトにタグ付けすること。
４．音声／ビデオ・ストリームの個々のフレームに関する主要注目オブジェクトおよび非主要注目オブジェクト間の相互作用を（タグ付けの結果に基づいて）判断すること。相互作用を判断することは、個々のフレーム内の非主要注目オブジェクトに対する主要注目オブジェクトの移動を検出することを含み得る。

ステップ３０４において、成分分析コードが、音声／ビデオ・ストリームに関して実行される。ステップ３０４の実行は、特定期間に従って音声／ビデオ・ストリームの個々のフレームに関してオブジェクトのそれぞれを解析するためのプロセスをもたらし得る。ステップ３０４の実行は、以下を含み得る。
１．主要注目オブジェクトを識別すること。
２．非主要注目オブジェクトを識別すること。
３．主要注目オブジェクトと非主要注目オブジェクトとの間の相互作用を判断すること。
４．主要注目オブジェクトに対する変更に基づいて非主要注目オブジェクトに対する変更を予測すること。

ステップ３０８において、オブジェクトが、（ステップ３０４の結果に基づいて）音声／ビデオ・ストリームから除去されて、修正済み音声／ビデオ・ストリームが生成されることをもたらす。修正済み音声／ビデオ・ストリームは、音声／ビデオ・ストリームのハードウェア・ストレージおよび移送サイズ要件が減少される結果をもたらす。オブジェクトを除去することは、ステップ３０２の判断された相互作用に基づいて実行され得る。オブジェクトを除去することは、主要注目オブジェクトの方にユーザの注目が向けられることをもたらし得る。ステップ３１０において、修正済み音声／ビデオ・ストリームが、グラフィカル・ユーザ・インターフェース（ＧＵＩ）を介して提示される。ステップ３１２において、修正済み音声／ビデオ・ストリームが、遠隔に位置するデータベース内に記憶される。ステップ３１４において、オブジェクトのうちの追加オブジェクトが、ＧＵＩ内で元のオブジェクトよりも中心に位置すると判断される。ステップ３１７において、音声／ビデオ・ストリームの追加ビューが、ローカル・ソースまたはリモート・ソースから検索される。ステップ３１８において、追加オブジェクトが、修正済み音声／ビデオ・ストリームに追加される。ステップ３２０において、追加オブジェクトを含む修正済み音声／ビデオ・ストリームが、ＧＵＩを介して提示される。

図４は、本発明の実施形態による、図３のアルゴリズムに関する代替アルゴリズムを示す。図４のアルゴリズム内の各ステップは、コンピュータ・コードを実行するコンピュータ・プロセッサによって、任意の順序で作動され、実行され得る。追加的に、図４のアルゴリズム内の各ステップは、サーバ・ハードウェア・デバイス１０４およびマルチメディア・ハードウェア・デバイス１０５ａ．．．１０５ｎにより組み合わせて作動され、実行され得る。ステップ４００において、音声／ビデオ・ストリームが、ローカル・ソースまたはリモート・ソースから（マルチメディア・デバイスによって）受信される。ステップ４０２において、音声／ビデオ・ストリームの（音声またはビデオあるいはその両方の）オブジェクトが、Ｒ二乗（Ｒ^２）統計的回帰コードの実行を介して分析される。分析は、音声／ビデオ・ストリームのオブジェクトに関する予測の生成をもたらす。ステップ４０４において、成分分析コードが、音声／ビデオ・ストリームに関して実行される。ステップ４０４の実行は、特定期間に従って音声／ビデオ・ストリームの個々のフレームに関してオブジェクトのそれぞれを解析するためのプロセスをもたらし得る。ステップ４０８において、オブジェクトが、（ステップ４０４の実行に応答して）少なくとも１つの追加オブジェクトに関して修正されて、修正済み音声／ビデオ・ストリームが生成されることをもたらす。修正済み音声／ビデオ・ストリームは、音声／ビデオ・ストリームのハードウェア・ストレージおよび移送サイズ要件が減少される結果をもたらす。ビデオ・オブジェクトを修正することは、以下を含み得る。
１．少なくとも１つの追加ビデオ・オブジェクトに関してオブジェクトのサイズを減少させること。
２．少なくとも１つの追加ビデオ・オブジェクトに関してオブジェクトのビューを不鮮明にすること。
３．少なくとも１つの追加ビデオ・オブジェクトに関してオブジェクトのビューを拡張すること。

音声オブジェクトを修正することは、以下を含み得る。
１．少なくとも１つの追加音声オブジェクトに関してオブジェクトの可聴レベルを低下させること。
２．少なくとも１つの追加音声オブジェクトに関してオブジェクトの可聴レベルを上昇させること。

ステップ４１０において、修正済み音声／ビデオ・ストリームが、グラフィカル・ユーザ・インターフェース（ＧＵＩ）を介して提示される。ステップ４１２において、修正済み音声／ビデオ・ストリームが、遠隔に位置するデータベース内に記憶される。

図５は、本発明の実施形態による、図１のソフトウェア／ハードウェア構造１２１の内部構造図を示す。ソフトウェア／ハードウェア構造１２１は、音声／ビデオ（Ａ／Ｖ）センサ・インターフェース・モジュール５０４、Ａ／Ｖ制御モジュール５１０、分析モジュール５０８、コード生成モジュール５１４、および通信コントローラ５０２を含む。Ａ／Ｖセンサ・インターフェース・モジュール５０４は、図１の音声／ビデオ・センサ１１０ａ．．．１１０ｎに関する全ての機能を制御するための専用ハードウェアおよびソフトウェアを含む。Ａ／Ｖ制御モジュール５１０は、音声／ビデオ・ストリームを検索するため、および図２〜図４のアルゴリズムに関して説明されるプロセスを実施するために、音声ビデオ検索デバイス１３２ａ．．．１３２ｎに関する全ての機能を制御するための専用ハードウェアおよびソフトウェアを含む。分析モジュール５０８は、マルチメディア・ストリームの音声／ビデオ・オブジェクトの除去または修正のためにＲ二乗回帰分析および成分分析に関する全ての機能を制御するための専用ハードウェアおよびソフトウェアを含む。コード生成モジュール５１４は、Ｒ二乗統計的回帰コードまたは成分分析コードあるいはその両方を生成することまたは修正することに関する全ての機能を制御するための専用ハードウェアおよびソフトウェアを含む。通信コントローラ５０２は、Ａ／Ｖセンサ・インターフェース・モジュール５０４、Ａ／Ｖ制御モジュール３１０、分析モジュール５０８、およびコード生成モジュール５１４の間の全ての通信を制御するために作動される。

図６は、本発明の実施形態による、修正済み音声／ビデオ・ストリームを提示するＧＵＩ６００の構造図を示す。ＧＵＩ６００は、メイン・ビューイング部分６００ａ、Ａ／Ｖストリームから平滑化され、またはプルーニングされた第１の非注目オブジェクトを含む第１のストリーミングされた音声／ビデオ部分６００ｂ、Ａ／Ｖストリームから平滑化され、またはプルーニングされた第２の（およびそれより小さい）非注目オブジェクトを含む第２のストリーミングされた音声／ビデオ部分６００ｃ、ならびに単一の主要（音声もしくはビデオまたはその両方の）オブジェクトあるいは複数の関連する主要（音声もしくはビデオまたはその両方の）オブジェクトを含み得る主要注目オブジェクト６０２を含む。ＧＵＩ６００は、ライブ・ビデオ・カメラ・フィードをセグメント化するため、およびストリーミングされている可視領域全体の部分的ビューを提示するためのプロセスを介して生成される一方で、残りの可視領域が、予測対象およびカメラ移動について分析される。ストリーミングされているオブジェクトは、主要重要オブジェクトへの可能な遷移を判断するためにタグ付けされ、モニタリングされている。主要オブジェクトの移動を検出することによって、他のオブジェクトがＡ／Ｖストリームからプルーニングされる（例えば、除去される）ことが可能となる。同様に、非主要オブジェクトの移動が、主要オブジェクトの移動に基づいて予測される。例えば、監視ビデオのストリームを見直すためのプロセスに関して、ビデオ・ストリームの必須の成分は、人々の移動に関連する画像をビデオ・ストリーム内に含むこともできる。同様に、ビデオの非必須成分は、動物の移動に関連する画像をビデオ・ストリーム内に含むこともできる。したがって、監視ビデオを見直すユーザが彼／彼女の注意をビデオ内の人々に集中させるように、ビデオ・ストリーム内の動物の移動の画像が、監視ビデオからプルーニングされ、または不鮮明にされてもよく、それによって、ユーザは、対処しなければならない問題があるかどうかを判断することがより良く可能となる。追加的な例は、モバイル・デバイスによってアクセス可能な限られた帯域幅に関連するシナリオを含むこともできる。したがって、任意の非必須音声、ビデオ、またはデータ・オブジェクトが、データ・ストリームから除去されてもよく、それによって、データ・ストリームのコンテンツの必須部分を保持しつつ、データ・ストリームが消費し得る帯域幅がより小さくなる。

ＧＵＩ６００は、予測された主要な対象もしくは複数の主要な対象を有する（データ・ストリームの）ストリーミングされたライブ・フレームまたは関連アクションを実施するカメラ内の識別された非必須かつ非主要可視オブジェクトをディザリングする／平滑化する／プルーニングするためのプロセスを可能にする。したがって、ライブ・ビデオ・ストリームの送信データ・ボリューム減少が、単一または複数対象のハイライトを保持しつつ達成される。同様に、ストレージ・ボリューム減少が、ライブ・ビデオ・フィード・キャプチャから達成され、結果として生じるビデオが、より少ない全体ストレージ空間を必要とし、ポスト処理の必要性が低下する。

図７は、本発明の実施形態による、音声／ビデオ・ストリームのハードウェア・ストレージおよび移送サイズ要件の減少をもたらす音声／ビデオ・ストリームからのオブジェクトのハードウェア・デバイス除去に関連する音声およびビデオ・マルチメディア技術を改善するための、図１のシステムによって使用され、または含まれるコンピュータ・システム９０（例えば、図１のマルチメディア・ハードウェア１０５ａ．．．１０５ｎまたはサーバ・ハードウェア・デバイス１０４あるいはその両方）を示す。

本発明の態様は、完全なハードウェア実施形態、完全なソフトウェア実施形態（ファームウェア、常駐ソフトウェア、マイクロコードなどを含む）、または本明細書で「回路」、「モジュール」、もしくは「システム」と全て概して呼ばれ得るソフトウェアおよびハードウェア態様を組み合わせた実施形態の形態を取ってもよい。

本発明は、システム、方法、またはコンピュータ・プログラム製品、あるいはそれらの組合せであってもよい。コンピュータ・プログラム製品は、プロセッサに本発明の態様を実行させるためのコンピュータ可読プログラム命令をその上に有するコンピュータ可読記憶媒体（または複数の媒体）を含んでもよい。

コンピュータ可読記憶媒体は、命令実行デバイスによる使用のための命令を保持し、記憶し得る有形デバイスであり得る。コンピュータ可読記憶媒体は、例えば、電子記憶デバイス、磁気記憶デバイス、光学記憶デバイス、電磁気記憶デバイス、半導体記憶デバイス、または前述したものの任意の適当な組合せであってもよいが、これらに限定されない。コンピュータ可読記憶媒体のより具体的な例の非網羅的リストは、ポータブル・コンピュータ・ディスケット、ハード・ディスク、ランダム・アクセス・メモリ（ＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、消去可能プログラマブル読み取り専用メモリ（ＥＰＲＯＭまたはフラッシュ・メモリ）、静的ランダム・アクセス・メモリ（ＳＲＡＭ）、ポータブル・コンパクト・ディスク読み取り専用メモリ（ＣＤ−ＲＯＭ）、デジタル・バーサタイル・ディスク（ＤＶＤ）、メモリ・スティック、フロッピー（Ｒ）・ディスク、パンチカードまたはその上に記録された命令を有する溝内の隆起構造などの機械的に符号化されたデバイス、および前述したものの任意の適当な組合せを含む。本明細書で用いられるコンピュータ可読記憶媒体は、本来、電波もしくは他の自由伝播する電磁波、導波管もしくは他の送信媒体を通って伝播する電磁波（例えば、光ファイバ・ケーブルを通過する光パルス）、または電線を通って送信される電気信号などの、一過性信号であると解釈されるべきではない。

本明細書で説明されるコンピュータ可読プログラム命令は、コンピュータ可読記憶媒体からそれぞれのコンピューティング／処理デバイスに、あるいはネットワーク、例えば、インターネット、ローカル・エリア・ネットワーク、ワイド・エリア・ネットワーク、もしくはワイヤレス・ネットワーク、またはそれらの組合せを介して外部コンピュータまたは外部ストレージ・デバイスに、ダウンロードされ得る。ネットワークは、銅伝送ケーブル、光伝送ファイバ、ワイヤレス伝送、ルータ、ファイアウォール、スイッチ、ゲートウェイ・コンピュータ、またはエッジ・サーバ、あるいはそれらの組合せを含むこともできる。各コンピューティング／処理装置内のネットワーク・アダプタ・カードまたはネットワーク・インターフェースは、コンピュータ可読プログラム命令をネットワークから受信し、それぞれのコンピューティング／処理デバイス内のコンピュータ可読記憶媒体内の記憶用にコンピュータ可読プログラム命令を転送する。

本発明の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、命令セット・アーキテクチャ（ＩＳＡ）命令、機械命令、機械依存命令、マイクロコード、ファームウェア命令、状態設定データ、またはＳｍａｌｌｔａｌｋ（Ｒ）、Ｃ＋＋などのオブジェクト指向プログラミング言語、および「Ｃ」プログラミング言語もしくは類似のプログラミング言語などの従来の手続き型プログラミング言語を含む、１つもしくは複数のプログラミング言語の任意の組合せで書かれたソース・コードもしくはオブジェクト・コードのいずれかであってもよい。コンピュータ可読プログラム命令は、ユーザのコンピュータ上で完全に、ユーザのコンピュータ上で部分的に、スタンドアロン・ソフトウェア・パッケージとして、ユーザのコンピュータ上で部分的に、かつリモート・コンピュータ上で部分的に、またはリモート・コンピュータもしくはサーバ上で完全に、実行してもよい。後者のシナリオでは、リモート・コンピュータは、ローカル・エリア・ネットワーク（ＬＡＮ）またはワイド・エリア・ネットワーク（ＷＡＮ）を含む任意の種類のネットワークを通して、ユーザのコンピュータに接続されてもよい。あるいは、接続は、（例えば、インターネット・サービス・プロバイダを使用してインターネットを通して）外部コンピュータに対して行われてもよい。いくつかの実施形態では、例えば、プログラマブル・ロジック回路、フィールド・プログラマブル・ゲート・アレイ（ＦＰＧＡ）、またはプログラマブル・ロジック・アレイ（ＰＬＡ）を含む電子回路は、本発明の態様を実行するために、コンピュータ可読プログラム命令の状態情報を利用して電子回路を個別化することによって、コンピュータ可読プログラム命令を実行し得る。

本発明の態様は、発明の実施形態による、方法、デバイス（システム）、およびコンピュータ・プログラム製品のフローチャート図またはブロック図あるいはその両方を参照して、本明細書において説明される。フローチャート図またはブロック図あるいはその両方の各ブロック、およびフローチャート図またはブロック図あるいはその両方のブロックの組合せが、コンピュータ可読プログラム命令によって実施され得ると理解されたい。

コンピュータまたは他のプログラマブル・データ処理デバイスのプロセッサによって実行する命令が、フローチャートまたはブロック図あるいはその両方の１つまたは複数のブロックにおいて指定される機能／動作を実施する手段を作成するように、これらのコンピュータ可読プログラム命令は、汎用コンピュータ、専用コンピュータ、または機械を製造するための他のプログラマブル・データ処理デバイスのプロセッサに提供されてもよい。コンピュータ可読記憶媒体に記憶される命令を有するコンピュータ可読記憶媒体が、フローチャートまたはブロック図あるいはその両方の１つまたは複数のブロックにおいて指定される機能／動作の態様を実施する命令を含む製品を含むように、これらのコンピュータ可読プログラム命令は、また、コンピュータ、プログラマブル・データ処理デバイス、または他のデバイス、あるいはその組合せが特定の方法で機能するように指示し得る、コンピュータ可読記憶媒体に記憶されてもよい。

コンピュータ、他のプログラマブル・デバイス、または他のデバイス上で実行する命令が、フローチャートまたはブロック図あるいはその両方の１つまたは複数のブロックにおいて指定される機能／動作を実施するように、コンピュータ可読プログラム命令は、また、コンピュータ実施されたプロセスを生成するために一連の動作ステップをコンピュータ、他のプログラマブル・デバイス、または他のデバイス上で実行させるために、コンピュータ、他のプログラマブル・データ処理デバイス、または他のデバイス上にロードされてもよい。

図面中のフローチャートおよびブロック図は、本発明の様々な実施形態によるシステム、方法、およびコンピュータ・プログラム製品の可能な実施のアーキテクチャ、機能、および動作を例示する。この点に関して、フローチャートまたはブロック図の各ブロックは、指定されたロジック機能を実施するための１つまたは複数の実行可能命令を含む、モジュール、セグメント、または命令の一部を表し得る。いくつかの代替的な実施において、ブロック内に記載された機能は、図面中に記載された順序以外で発生してもよい。例えば、連続して示される２つのブロックが、実際には、実質的に同時に実行されてもよく、または、ブロックが、関係する機能次第で逆の順序で実行されることがあってもよい。ブロック図またはフローチャート図あるいはその両方の各ブロック、およびブロック図またはフローチャート図あるいはその両方におけるブロックの組合せが、指定された機能もしくは動作を実行し、または専用ハードウェアおよびコンピュータ命令の組合せを実行する専用ハードウェア・ベース・システムによって実施され得ることにも留意されたい。

図７に示されるコンピュータ・システム９０は、プロセッサ９１、プロセッサ９１に連結された入力デバイス９２、プロセッサ９１に連結された出力デバイス９３、ならびにプロセッサ９１に各々が連結されたメモリ・デバイス９４および９５を含む。入力デバイス９２は、特に、キーボード、マウス、カメラ、タッチスクリーンなどであってもよい。出力デバイス９３は、特に、プリンタ、プロッタ、コンピュータ・スクリーン、磁気テープ、リムーバブル・ハード・ディスク、フロッピー（Ｒ）・ディスクなどであってもよい。メモリ・デバイス９４および９５は、特に、ハード・ディスク、フロッピー（Ｒ）・ディスク、磁気テープ、コンパクト・ディスク（ＣＤ）またはデジタル・ビデオ・ディスク（ＤＶＤ）などの光学ストレージ、ダイナミック・ランダム・アクセス・メモリ（ＤＲＡＭ）、読み出し専用メモリ（ＲＯＭ）などであってもよい。メモリ・デバイス９５は、コンピュータ・コード９７を含む。コンピュータ・コード９７は、音声／ビデオ・ストリームのハードウェア・ストレージおよび移送サイズ要件の減少をもたらす音声／ビデオ・ストリームからのオブジェクトのハードウェア・デバイス除去に関連する音声およびビデオ・マルチメディア技術を改善するためのアルゴリズム（例えば、図２〜図４のアルゴリズム）を含む。プロセッサ９１は、コンピュータ・コード９７を実行する。メモリ・デバイス９４は、入力データ９６を含む。入力データ９６は、コンピュータ・コード９７により必要な入力を含む。出力デバイス９３は、コンピュータ・コード９７からの出力を表示する。メモリ・デバイス９４および９５のいずれかもしくは両方（または、読み出し専用メモリ・デバイス９６などの１つもしくは複数の追加メモリ・デバイス）は、アルゴリズム（例えば、図２〜４のアルゴリズム）を含んでもよく、そこに具現化されたコンピュータ可読プログラム・コードを有する、またはそこに記憶された他のデータを有する、あるいはその両方であるコンピュータ使用可能媒体（または、コンピュータ可読媒体もしくはプログラム・ストレージ・デバイス）として使用されてもよい。コンピュータ可読プログラム・コードは、コンピュータ・コード９７を含む。概して、コンピュータ・システム９０のコンピュータ・プログラム製品（または代替的には、製品）は、コンピュータ使用可能媒体（または、プログラム・ストレージ・デバイス）を含むこともできる。

いくつかの実施形態では、ハード・ドライブ、光学ディスク、または他の書き込み可能、書き換え可能、もしくはリムーバブル・ハードウェア・メモリ・デバイス９５から記憶およびアクセスされるのではなく、記憶されたコンピュータ・プログラム・コード８４（例えば、アルゴリズムを含む）は、読み出し専用メモリ（ＲＯＭ）デバイス８５などの静的非リムーバブル読み出し専用記憶媒体上に記憶されてもよく、またはそのような静的非リムーバブル読み出し専用媒体８５から直接プロセッサ９１によってアクセスされてもよい。同様に、いくつかの実施形態において、記憶されたコンピュータ・プログラム・コード９７は、コンピュータ可読ファームウェア８５として記憶されてもよく、またはハード・ドライブもしくは光学ディスクなどの、より動的なもしくはリムーバブルなハードウェア・データ記憶デバイス９５からではなく、そのようなファームウェア８５から直接プロセッサ９１によってアクセスされてもよい。

さらに、本発明のコンポーネントのうちのいずれかが、音声／ビデオ・ストリームのハードウェア・ストレージおよび移送サイズ要件の減少をもたらす音声／ビデオ・ストリームからのオブジェクトのハードウェア・デバイス除去に関連する音声およびビデオ・マルチメディア技術を改善するように提案するサービス供給者によって、生成され、統合され、ホストされ、維持され、配備され、管理され、サービスされるなどであり得る。したがって、本発明は、コンピュータ可読コードをコンピュータ・システム９０に統合することを含む、コンピューティング・インフラを配備し、生成し、統合し、ホストし、維持し、または統合し、あるいはそれらの組合せを行うためのプロセスを開示する。コンピュータ・システム９０と組み合わせたコードが、音声／ビデオ・ストリームのハードウェア・ストレージおよび移送サイズ要件の減少をもたらす音声／ビデオ・ストリームからのオブジェクトのハードウェア・デバイス除去に関連する音声およびビデオ・マルチメディア技術を改善するためのプロセスを可能にする方法を実行することが可能である。別の実施形態において、発明は、予約購読、広告、または料金、あるいはその組合せ単位で、発明のプロセス・ステップを実行するビジネス方法を提供する。即ち、ソリューション・インテグレータなどのサービス供給者は、音声／ビデオ・ストリームのハードウェア・ストレージおよび移送サイズ要件の減少をもたらす音声／ビデオ・ストリームからのオブジェクトのハードウェア・デバイス除去に関連する音声およびビデオ・マルチメディア技術を改善するためのプロセスを作動させるように提案し得る。この場合、サービス供給者は、１つまたは複数の顧客に対し発明のプロセス・ステップを実行するコンピュータ・インフラを生成し、維持し、サポートするなどし得る。これと引き換えに、サービス供給者は、予約購読もしくは料金またはその両方の合意のもとに顧客から支払いを受けることができ、あるいはサービス供給者は、１つまたは複数の第三者への広告コンテンツ販売から支払いを受けることができる。

図７は、ハードウェアおよびソフトウェアの特定の構成として、コンピュータ・システム９０を示しているが、当業者には既知であるハードウェアおよびソフトウェアの任意の構成は、図７の特定のコンピュータ・システム９０と併せて、上述した目的に使用されてもよい。例えば、メモリ・デバイス９４および９５は、別々のメモリ・デバイスではなく単一のメモリ・デバイスの一部であってもよい。

クラウド・コンピューティング環境
本開示は、クラウド・コンピューティングについての詳細な説明を含むが、本明細書に列挙される教示の実施は、クラウド・コンピューティング環境に限定されないと理解されるべきである。むしろ、本発明の実施形態は、現在既知の、または今後に開発される任意の他の種類のコンピューティング環境と併せて実施されることが可能である。

クラウド・コンピューティングは、最小の管理労力またはサービス・プロバイダとの対話で迅速に供給され、リリースされ得る、構成可能なコンピューティング・リソース（例えば、ネットワーク、ネットワーク帯域幅、サーバ、処理、メモリ、ストレージ、アプリケーション、仮想機械、およびサービス）の共有プールへの便利なオンデマンド・ネットワーク・アクセスを可能にするためのサービス配信のモデルである。このクラウド・モデルは、少なくとも５つの特性、少なくとも３つのサービス・モデル、および少なくとも４つの配置モデルを含むこともできる。

特性は、以下の通りである。
オンデマンド・セルフサービス：クラウド消費者は、サービス・プロバイダと人との対話を必要とすることなく、必要に応じて自動的に、サーバ時間およびネットワーク・ストレージなどのコンピューティング・ケイパビリティを一方的に供給し得る。
幅広いネットワーク・アクセス：ケイパビリティは、ネットワーク上で利用可能であり、異種シン・クライアントまたはシック・クライアント・プラットフォーム（例えば、携帯電話、ラップトップ、およびＰＤＡ）による使用を促進する標準的なメカニズムを通してアクセスされる。
リソースの共用：プロバイダのコンピューティング・リソースが、マルチテナント型モデルを使用して複数の消費者にサービスするためにプールされ、異なる物理リソースおよび仮想リソースが要求に従って動的に割り当ておよび再割り当てされる。消費者は、概して、提供されるリソースの正確な場所に対する制御または知識を有しないが、より抽象度の高いレベル（例えば、国、州、またはデータセンタ）において場所を指定することが可能であり得るという点において、位置独立の意味がある。
スピーディな拡張性：ケイパビリティは、場合によっては自動的に、即座にスケール・アウトするようにスピーディかつ弾力的に供給され、即座にスケール・インするようにスピーディに解放され得る。消費者に対しては、供給に利用可能なケイパビリティが、多くの場合無制限であるように見え、いつでも任意の量で購入可能である。
サービスが計測可能であること：クラウド・システムは、サービスの種類（例えば、ストレージ、処理、帯域幅、アクティブなユーザ・アカウント）に適したある抽象度レベルにおいて計測ケイパビリティを活用することによって、リソース使用を自動的に制御し、最適化する。リソース使用量は、モニタリングされ、制御され、報告されて、利用サービスのプロバイダおよび消費者の両方に透明性をもたらし得る。

サービス・モデルは、以下の通りである。
サービスとしてのソフトウェア（ＳａａＳ）：消費者に提供されるケイパビリティは、クラウド・インフラ上で実行中のプロバイダのアプリケーションを使用することである。アプリケーションは、ウェブ・ブラウザなどのシン・クライアント・インターフェース（例えば、ウェブ・ベースの電子メール）を通して、様々なクライアント・デバイスからアクセス可能である。消費者は、限定されたユーザ固有アプリケーションの構成設定は例外である可能性があるが、ネットワーク、サーバ、オペレーティング・システム、ストレージ、または個々のアプリケーション・ケイパビリティですら含む、基礎的なクラウド・インフラを管理または制御しない。
サービスとしてのプラットフォーム（ＰａａＳ）：消費者に提供されるケイパビリティは、プロバイダによってサポートされるプログラミング言語およびツールを使用して生成された、消費者が作成したアプリケーションまたは消費者が取得したアプリケーションを、クラウド・インフラ上に配備することである。消費者は、ネットワーク、サーバ、オペレーティング・システム、またはストレージを含む基礎的なクラウド・インフラを管理または制御しないが、配備されたアプリケーション、および、可能な限りアプリケーション・ホスティング環境構成に対して制御を行う。
サービスとしてのインフラ（ＩａａＳ）：消費者に提供されるケイパビリティは、処理、ストレージ、ネットワーク、ならびに消費者がオペレーティング・システムおよびアプリケーションを含み得る任意のソフトウェアを配備および実行することが可能な、他の基本コンピューティング・リソースを供給することである。消費者は、基礎となるクラウド・インフラを管理または制御しないが、オペレーティング・システム、ストレージ、配備されたアプリケーションに対して制御を行い、かつ可能な限り選択ネットワーキング・コンポーネント（例えば、ホスト・ファイアウォール）の限定的な制御を行う。

配置モデルは、以下の通りである。
プライベート・クラウド：クラウド・インフラは、組織のためだけに動作される。クラウド・インフラは、その組織または第三者によって管理されてもよく、構内または構外に存在し得る。
コミュニティ・クラウド：クラウド・インフラは、複数の組織によって共有され、共有の関心事（例えば、任務、セキュリティ要件、ポリシー、およびコンプライアンスの考慮事項）を有する特定のコミュニティをサポートする。クラウド・インフラは、組織または第三者によって管理されてもよく、構内または構外に存在し得る。
パブリック・クラウド：クラウド・インフラは、一般公衆または大きい業界団体に利用可能とされ、クラウド・サービスを販売する組織によって所有される。
ハイブリッド・クラウド：クラウド・インフラは、一意なエンティティのままであるが、データおよびアプリケーション・ポータビリティを可能にする標準化技術または独自技術（例えば、クラウド間のロード・バランシングのためのクラウド・バースティング）によって結合された、２つ以上のクラウド（プライベート、コミュニティ、またはパブリック）の合成物である。

クラウド・コンピューティング環境は、無国籍、低結合、モジュール性、および意味相互運用性を中心としたサービス指向型である。クラウド・コンピューティングの中心は、相互接続されたノードのネットワークを含むインフラである。

ここで図８を参照すると、例示的なクラウド・コンピューティング環境５０が示されている。図示するように、クラウド・コンピューティング環境５０は、クラウド消費者によって使用されるローカル・コンピューティング・デバイス、例えば、携帯情報端末（ＰＤＡ）もしくは携帯電話５４Ａ、デスクトップ・コンピュータ５４Ｂ、ラップトップ・コンピュータ５４Ｃ、または自動車コンピュータ・システム５４Ｎ、あるいはそれらの組合せが通信し得る、１つまたは複数のクラウド・コンピューティング・ノード１０を含む。ノード１０は、互いに通信し得る。それらは、上述のようなプライベート、コミュニティ、パブリック、もしくはハイブリッド・クラウド、またはそれらの組合せなどの、１つまたは複数のネットワーク内で物理的または仮想的にグループ化されてもよい（図示せず）。これによって、クラウド・コンピューティング環境５０が、インフラ、プラットフォーム、またはソフトウェア、あるいはそれらの組合せを、クラウド消費者がローカル・コンピューティング・デバイス上でリソースを維持する必要がないサービスとして提案することが可能となる。図５に示されるコンピューティング・デバイス５４Ａ、５４Ｂ、５４Ｃ、および５４Ｎの種類は、単なる例示であるように意図され、コンピューティング・ノード１０およびクラウド・コンピューティング環境５０は、任意の種類のネットワークまたはネットワーク・アドレス可能な接続あるいはその組合せを経て（例えば、ウェブ・ブラウザを用いて）、任意の種類のコンピュータ化デバイスと通信し得ると理解される。

ここで図９を参照すると、クラウド・コンピューティング環境５０（図８を参照）によって提供される機能抽象レイヤのセットが示されている。図９に示されるコンポーネント、レイヤ、および機能は、単なる例示であるように意図され、発明の実施形態は、それらに限定されないと、予め理解されるべきである。図示するように、以下のレイヤおよび対応する機能が、提供される。

ハードウェアおよびソフトウェア・レイヤ６０は、ハードウェアおよびソフトウェア・コンポーネントを含む。ハードウェア・コンポーネントの例は、メインフレーム６１、ＲＩＳＣ（Reduced Instruction Set Computer）アーキテクチャ・ベース・サーバ６２、サーバ６３、ブレード・サーバ６４、ストレージ・デバイス６５、ならびにネットワークおよびネットワーキング・コンポーネント６６を含む。いくつかの実施形態において、ソフトウェア・コンポーネントは、ネットワーク・アプリケーション・サーバ・ソフトウェア６７およびデータベース・ソフトウェア６８を含む。

仮想化レイヤ７０は、仮想エンティティの以下の例、仮想サーバ７１、仮想ストレージ７２、仮想プライベート・ネットワークを含む仮想ネットワーク７３、仮想アプリケーションおよびオペレーティング・システム７４、ならびに仮想クライアント７５が提供され得る、抽象レイヤを提供する。

１つの例では、管理レイヤ８０は、後述する機能を提供し得る。リソース供給８１は、クラウド・コンピューティング環境内でタスクを実行するために利用される、コンピューティング・リソースおよび他のリソースの動的な調達を提供する。測定および価格設定８２は、クラウド・コンピューティング環境内でリソースが利用されるときにコスト追跡を、これらのリソースの消費に対する課金または請求を提供する。１つの例では、これらのリソースは、アプリケーション・ソフトウェア・ライセンスを含むこともできる。セキュリティは、データおよび他のリソースについての保護だけでなく、クラウド消費者およびタスクの本人確認を提供する。ユーザ・ポータル８３は、消費者およびシステム管理者にクラウド・コンピューティング環境へのアクセスを提供する。サービス・レベル管理８４は、要求されるサービス・レベルが満たされるように、クラウド・コンピューティング・リソース割り当ておよび管理を提供する。サービス水準合意（ＳＬＡ）計画および遂行８５は、ＳＬＡに従って将来の要件が予期されるクラウド・コンピューティング・リソースの事前配置および調達を提供する。

ワークロード・レイヤ８９は、クラウド・コンピューティング環境が利用され得る機能の例を提供する。このレイヤから提供され得るワークロードおよび機能の例は、マッピングおよびナビゲーション９１、ソフトウェア開発およびライフサイクル管理９２、仮想クラスルーム教育配信９３、データ分析処理９４、トランザクション処理９５、ならびに特定の可視データを提示するため、関連フィードバックを検索するため、および音声／ビデオ・ストリームのハードウェア・ストレージおよび移送サイズ要件の減少をもたらす音声／ビデオ・ストリームからのオブジェクトを除去するために複数ビデオ・ストリームを分析することに関連する表示生成および提示技術を改善するためのもの９６を含む。

本発明の実施形態が、本明細書において例示の目的で説明されてきたが、多くの修正および変更が、当業者には明らかとなるであろう。したがって、添付の特許請求の範囲は、本発明の範囲内に入るものとしてそのような修正および変更の全てを包含するように意図される。

Claims

音声およびビデオ・マルチメディア部分除去に基づく修正および提示改善方法であって、
ハードウェア・デバイスのプロセッサによってローカル・ソースまたはリモート・ソースから、音声／ビデオ・ストリームを受信することと、
前記プロセッサがＲ^２統計的回帰コードを実行することによって、前記音声／ビデオ・ストリームのオブジェクトに関する予測を生成するために前記音声／ビデオ・ストリームの前記オブジェクトを分析することと、
前記プロセッサによって、前記音声／ビデオ・ストリームに関する成分分析コードを実行することと、
前記プロセッサによって前記実行することに応答して、修正済み音声／ビデオ・ストリームが生成されて、その結果前記音声／ビデオ・ストリームのハードウェア・ストレージおよび移送サイズ要件が減少されることをもたらす、前記音声／ビデオ・ストリームから前記オブジェクトのうちのあるオブジェクトを除去することと、
前記プロセッサによってグラフィカル・ユーザ・インターフェース（ＧＵＩ）を介して、前記修正済み音声／ビデオ・ストリームを提示することと、
を含む、方法。
前記音声／ビデオ・ストリームの前記オブジェクトを前記分析することが、
前記オブジェクトの主要注目オブジェクトを識別することと、
前記オブジェクトの非主要注目オブジェクトを識別することと、
前記主要注目オブジェクトおよび前記非主要注目オブジェクトにタグ付けすることと、
前記タグ付けの結果に基づいて、前記音声／ビデオ・ストリームの個々のフレームに関して前記主要注目オブジェクトと前記非主要注目オブジェクトとの間の相互作用を判断することであって、前記除去することが、前記相互作用に基づいて実行され、前記除去することが、ユーザの注目を前記主要注目オブジェクトに向けることをもたらす、前記判断することと、
を含む、請求項１に記載の方法。
前記相互作用を前記判断することが、前記個々のフレーム内で前記非主要注目オブジェクトに関する前記主要注目オブジェクトの移動を検出することを含む、請求項２に記載の方法。
前記オブジェクトが、ビデオ・オブジェクトを含む、請求項１に記載の方法。
前記オブジェクトが、音声オブジェクトを含む、請求項１に記載の方法。
前記オブジェクトが、ビデオ・オブジェクトおよび関連する音声オブジェクトを含む、請求項１に記載の方法。
前記プロセッサによって遠隔に位置するデータベース内に、前記修正済み音声／ビデオ・ストリームを記憶することをさらに含む、請求項１に記載の方法。
前記音声／ビデオ・ストリームに関する前記成分分析コードを前記実行することが、特定期間に従って前記音声／ビデオ・ストリームの個々のフレームに関する前記オブジェクトのそれぞれを解析することをもたらす、請求項１に記載の方法。
前記プロセッサによって前記実行することに応答して、前記オブジェクトの追加オブジェクトが前記ＧＵＩ内で前記オブジェクトよりも中心に位置すると判断することであって、前記除去することが、前記判断することの結果にさらに基づく、前記判断することをさらに含む、請求項１に記載の方法。
前記音声／ビデオ・ストリームに関する前記成分分析コードを前記実行することが、
前記オブジェクトの主要注目オブジェクトを識別することと、
前記オブジェクトの非主要注目オブジェクトを識別することと、
前記主要注目オブジェクトと前記非主要注目オブジェクトとの間の相互作用を判断することと、
前記主要注目オブジェクトに対する変更に基づいて前記非主要注目オブジェクトに対する変更を予測することと、
を含む、請求項１に記載の方法。
前記プロセッサによって前記ローカル・ソースまたはリモート・ソースから、前記音声／ビデオ・ストリームの追加ビューを検索することと、
前記プロセッサによって前記実行することに応答して、前記オブジェクトの追加オブジェクトを前記修正済み音声／ビデオ・ストリームに追加することと、
前記プロセッサによって前記ＧＵＩを介して、前記追加オブジェクトを含む前記修正済み音声／ビデオ・ストリームを提示することと、
をさらに含む、請求項１に記載の方法。
制御ハードウェアにおいてコンピュータ可読コードを生成すること、統合すること、ホストすること、維持すること、および配備することのうちの少なくとも１つのための少なくとも１つのサポート・サービスを提供することであって、前記コードが、前記受信すること、前記分析すること、前記実行すること、前記除去すること、および前記提示することを実施するために前記コンピュータ・プロセッサによって実行される、前記提供することをさらに含む、請求項１に記載の方法。
コンピュータ可読プログラム・コードを記憶するコンピュータ可読ハードウェア・ストレージ・デバイスを含む、コンピュータ・プログラム製品であって、前記コンピュータ可読プログラム・コードが、ハードウェア・デバイスのプロセッサによって実行されるときに、音声およびビデオ・マルチメディア部分除去に基づく修正および提示改善方法を実施するアルゴリズムを含み、前記方法が、
前記プロセッサによってローカル・ソースまたはリモート・ソースから、音声／ビデオ・ストリームを受信することと、
前記プロセッサがＲ^２統計的回帰コードを実行することによって、前記音声／ビデオ・ストリームのオブジェクトに関する予測を生成するために前記音声／ビデオ・ストリームの前記オブジェクトを分析することと、
前記プロセッサによって、前記音声／ビデオ・ストリームに関する成分分析コードを実行することと、
前記プロセッサによって前記実行することに応答して、修正済み音声／ビデオ・ストリームが生成されて、その結果前記音声／ビデオ・ストリームのハードウェア・ストレージおよび移送サイズ要件が減少されることをもたらす、前記音声／ビデオ・ストリームから前記オブジェクトのうちのあるオブジェクトを除去することと、
前記プロセッサによってグラフィカル・ユーザ・インターフェース（ＧＵＩ）を介して、前記修正済み音声／ビデオ・ストリームを提示することと、
を含む、コンピュータ・プログラム製品。
コンピュータ可読メモリ・ユニットに連結されたプロセッサを含むハードウェア・デバイスであって、前記メモリ・ユニットが、
前記プロセッサによってローカル・ソースまたはリモート・ソースから、音声／ビデオ・ストリームを受信することと、
前記プロセッサがＲ^２統計的回帰コードを実行することによって、前記音声／ビデオ・ストリームのオブジェクトに関する予測を生成するために前記音声／ビデオ・ストリームの前記オブジェクトを分析することと、
前記プロセッサによって、前記音声／ビデオ・ストリームに関する成分分析コードを実行することと、
前記プロセッサによって前記実行することに応答して、修正済み音声／ビデオ・ストリームが生成されて、その結果前記音声／ビデオ・ストリームのハードウェア・ストレージおよび移送サイズ要件が減少されることをもたらす、前記音声／ビデオ・ストリームから前記オブジェクトのうちのあるオブジェクトを除去することと、
前記プロセッサによってグラフィカル・ユーザ・インターフェース（ＧＵＩ）を介して、前記修正済み音声／ビデオ・ストリームを提示することと、
を含む音声およびビデオ・マルチメディア部分除去に基づく修正および提示改善方法を、前記プロセッサによって実行されるときに実施する命令を含む、ハードウェア・デバイス。
音声およびビデオ・マルチメディア修正および提示改善方法であって、
ハードウェア・デバイスのプロセッサによってローカル・ソースまたはリモート・ソースから、音声／ビデオ・ストリームを受信することと、
前記プロセッサがＲ^２統計的回帰コードを実行することによって、前記音声／ビデオ・ストリームのオブジェクトに関する予測を生成するために前記音声／ビデオ・ストリームの前記オブジェクトを分析することと、
前記プロセッサによって、前記音声／ビデオ・ストリームに関する成分分析コードを実行することと、
前記プロセッサによって前記実行することに応答して、修正済み音声／ビデオ・ストリームが生成されて、その結果前記音声／ビデオ・ストリームのハードウェア・ストレージおよび移送サイズ要件が減少されることをもたらす、前記オブジェクトの少なくとも１つの追加オブジェクトに関して前記オブジェクトのうちのあるオブジェクトを修正することと、
前記プロセッサによってグラフィカル・ユーザ・インターフェース（ＧＵＩ）を介して、前記修正済み音声／ビデオ・ストリームを提示することと、
を含む、方法。
前記オブジェクトが、ビデオ・オブジェクトを含み、前記オブジェクトを前記修正することが、前記少なくとも１つの追加ビデオ・オブジェクトに関して、前記ＧＵＩを介して投影される前記オブジェクトのサイズを減少させることを含む、請求項１５に記載の方法。
前記オブジェクトが、ビデオ・オブジェクトを含み、前記オブジェクトを前記修正することが、前記少なくとも１つの追加ビデオ・オブジェクトに関して、前記ＧＵＩを介して投影される前記オブジェクトのビューを不鮮明にすることを含む、請求項１５に記載の方法。
前記オブジェクトが、ビデオ・オブジェクトを含み、前記オブジェクトを前記修正することが、前記少なくとも１つの追加ビデオ・オブジェクトに関して、前記ＧＵＩを介して投影される前記オブジェクトのビューを拡張することを含む、請求項１５に記載の方法。
前記オブジェクトが、音声オブジェクトを含み、前記オブジェクトを前記修正することが、前記少なくとも１つの追加音声オブジェクトに関して、前記ＧＵＩを介して投影される前記オブジェクトの可聴レベルを低下させることを含む、請求項１５に記載の方法。
前記オブジェクトが、音声オブジェクトを含み、前記オブジェクトを前記修正することが、前記少なくとも１つの追加音声オブジェクトに関して、前記ＧＵＩを介して投影される前記オブジェクトの可聴レベルを上昇させることを含む、請求項１５に記載の方法。
コンピュータ可読プログラム・コードを記憶するコンピュータ可読ハードウェア・ストレージ・デバイスを含む、コンピュータ・プログラム製品であって、前記コンピュータ可読プログラム・コードが、ハードウェア・デバイスのプロセッサによって実行されるときに、音声およびビデオ・マルチメディア修正および提示改善方法を実施するアルゴリズムを含み、前記方法が、
前記プロセッサによってローカル・ソースまたはリモート・ソースから、音声／ビデオ・ストリームを受信することと、
前記プロセッサがＲ^２統計的回帰コードを実行することによって、前記音声／ビデオ・ストリームのオブジェクトに関する予測を生成するために前記音声／ビデオ・ストリームの前記オブジェクトを分析することと、
前記プロセッサによって、前記音声／ビデオ・ストリームに関する成分分析コードを実行することと、
前記プロセッサによって前記実行することに応答して、修正済み音声／ビデオ・ストリームが生成されて、その結果前記音声／ビデオ・ストリームのハードウェア・ストレージおよび移送サイズ要件が減少されることをもたらす、前記オブジェクトの少なくとも１つの追加オブジェクトに関して前記オブジェクトのうちのあるオブジェクトを修正することと、
前記プロセッサによってグラフィカル・ユーザ・インターフェース（ＧＵＩ）を介して、前記修正済み音声／ビデオ・ストリームを提示することと、
を含む、コンピュータ・プログラム製品。
前記オブジェクトが、ビデオ・オブジェクトを含み、前記オブジェクトを前記修正することが、前記少なくとも１つの追加ビデオ・オブジェクトに関して、前記ＧＵＩを介して投影される前記オブジェクトのサイズを減少させることを含む、請求項２１に記載のコンピュータ・プログラム製品。
前記オブジェクトが、ビデオ・オブジェクトを含み、前記オブジェクトを前記修正することが、前記少なくとも１つの追加ビデオ・オブジェクトに関して、前記ＧＵＩを介して投影される前記オブジェクトのビューを不鮮明にすることを含む、請求項２１に記載のコンピュータ・プログラム製品。
前記オブジェクトが、ビデオ・オブジェクトを含み、前記オブジェクトを前記修正することが、前記少なくとも１つの追加ビデオ・オブジェクトに関して、前記ＧＵＩを介して投影される前記オブジェクトのビューを拡張することを含む、請求項２１に記載のコンピュータ・プログラム製品。
前記オブジェクトが、音声オブジェクトを含み、前記オブジェクトを前記修正することが、前記少なくとも１つの追加音声オブジェクトに関して、前記ＧＵＩを介して投影される前記オブジェクトの可聴レベルを低下させることを含む、請求項２１に記載のコンピュータ・プログラム製品。