JP2021527969A - 音声およびビデオ・マルチメディアの修正および提示 - Google Patents
音声およびビデオ・マルチメディアの修正および提示 Download PDFInfo
- Publication number
- JP2021527969A JP2021527969A JP2020557308A JP2020557308A JP2021527969A JP 2021527969 A JP2021527969 A JP 2021527969A JP 2020557308 A JP2020557308 A JP 2020557308A JP 2020557308 A JP2020557308 A JP 2020557308A JP 2021527969 A JP2021527969 A JP 2021527969A
- Authority
- JP
- Japan
- Prior art keywords
- audio
- video
- video stream
- processor
- computer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000004048 modification Effects 0.000 title claims abstract description 13
- 238000012986 modification Methods 0.000 title claims abstract description 13
- 238000000034 method Methods 0.000 claims abstract description 89
- 238000003860 storage Methods 0.000 claims abstract description 58
- 238000004458 analytical method Methods 0.000 claims abstract description 25
- 230000002829 reductive effect Effects 0.000 claims abstract description 22
- 230000033001 locomotion Effects 0.000 claims description 26
- 230000003993 interaction Effects 0.000 claims description 23
- 238000004590 computer program Methods 0.000 claims description 17
- 230000004044 response Effects 0.000 claims description 14
- 230000006872 improvement Effects 0.000 claims description 10
- 238000012937 correction Methods 0.000 claims description 8
- 230000036961 partial effect Effects 0.000 claims description 7
- 230000008569 process Effects 0.000 description 37
- 230000009471 action Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 16
- 238000005516 engineering process Methods 0.000 description 13
- 238000012545 processing Methods 0.000 description 12
- 230000000007 visual effect Effects 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 8
- 238000009499 grossing Methods 0.000 description 8
- 238000013138 pruning Methods 0.000 description 8
- 230000003287 optical effect Effects 0.000 description 7
- 238000000513 principal component analysis Methods 0.000 description 6
- 238000007726 management method Methods 0.000 description 5
- 230000008520 organization Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 229920001690 polydopamine Polymers 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000011038 discontinuous diafiltration by volume reduction Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000006855 networking Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000012384 transportation and delivery Methods 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 230000000454 anti-cipatory effect Effects 0.000 description 1
- 230000036772 blood pressure Effects 0.000 description 1
- 230000009172 bursting Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/20—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/20—Processor architectures; Processor configuration, e.g. pipelining
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/60—Memory management
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/149—Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/423—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
- H04N19/426—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements using memory downsizing methods
- H04N19/427—Display on the fly, e.g. simultaneous writing to and reading from decoding memory
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/433—Content storage operation, e.g. storage operation in response to a pause request, caching operations
- H04N21/4334—Recording operations
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/435—Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4394—Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/4402—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
- H04N21/440227—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by decomposing into layers, e.g. base layer and one or more enhancement layers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/4402—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
- H04N21/440245—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display the reformatting operation being performed only on part of the stream, e.g. a region of the image or a time segment
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Algebra (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Description
1.どのビデオ・フレームが互いに相互作用しているかを判断するために時間に対してフレーム・ベースの相互作用表現を生成するために、各ビデオ・フレーム内のビデオ・オブジェクトの画像を解析すること。
2.意味タグが追加ビデオ・オブジェクトに対するビデオ・オブジェクトの動きを記述するために使用され得るかどうかを判断するために、各ビデオ・オブジェクトについての意味タグを判断すること。
3.GUIのディスプレイに対して中心に位置するビデオ・オブジェクトに関連する意味的動作重みを拡散すること。
4.中心性および意味的動作重みの組合せに基づいて主要画像を判断すること。
5.主要ビデオ・オブジェクトの変更に基づいて非主要ビデオ・オブジェクトに対する変更を予測するための主成分分析(PCA)の使用。
6.ビデオ・オブジェクトがコア・アクションに追加される場合に、ビデオ・オブジェクトおよびサウンドをプルーニングすること、ならびにマルチメディア・ビデオ・ストリームからのビデオ・オブジェクトに基づいて新たな背景ビデオ・オブジェクトを追加カメラ角度または近接画素から補間すること。
1.オブジェクトの主要注目オブジェクトを識別すること。
2.オブジェクトの非主要注目オブジェクトを識別すること。
3.主要注目オブジェクトおよび非主要注目オブジェクトにタグ付けすること。
4.音声/ビデオ・ストリームの個々のフレームに関する主要注目オブジェクトおよび非主要注目オブジェクト間の相互作用を(タグ付けの結果に基づいて)判断すること。相互作用を判断することは、個々のフレーム内の非主要注目オブジェクトに対する主要注目オブジェクトの移動を検出することを含み得る。
1.主要注目オブジェクトを識別すること。
2.非主要注目オブジェクトを識別すること。
3.主要注目オブジェクトと非主要注目オブジェクトとの間の相互作用を判断すること。
4.主要注目オブジェクトに対する変更に基づいて非主要注目オブジェクトに対する変更を予測すること。
1.少なくとも1つの追加ビデオ・オブジェクトに関してオブジェクトのサイズを減少させること。
2.少なくとも1つの追加ビデオ・オブジェクトに関してオブジェクトのビューを不鮮明にすること。
3.少なくとも1つの追加ビデオ・オブジェクトに関してオブジェクトのビューを拡張すること。
1.少なくとも1つの追加音声オブジェクトに関してオブジェクトの可聴レベルを低下させること。
2.少なくとも1つの追加音声オブジェクトに関してオブジェクトの可聴レベルを上昇させること。
本開示は、クラウド・コンピューティングについての詳細な説明を含むが、本明細書に列挙される教示の実施は、クラウド・コンピューティング環境に限定されないと理解されるべきである。むしろ、本発明の実施形態は、現在既知の、または今後に開発される任意の他の種類のコンピューティング環境と併せて実施されることが可能である。
オンデマンド・セルフサービス:クラウド消費者は、サービス・プロバイダと人との対話を必要とすることなく、必要に応じて自動的に、サーバ時間およびネットワーク・ストレージなどのコンピューティング・ケイパビリティを一方的に供給し得る。
幅広いネットワーク・アクセス:ケイパビリティは、ネットワーク上で利用可能であり、異種シン・クライアントまたはシック・クライアント・プラットフォーム(例えば、携帯電話、ラップトップ、およびPDA)による使用を促進する標準的なメカニズムを通してアクセスされる。
リソースの共用:プロバイダのコンピューティング・リソースが、マルチテナント型モデルを使用して複数の消費者にサービスするためにプールされ、異なる物理リソースおよび仮想リソースが要求に従って動的に割り当ておよび再割り当てされる。消費者は、概して、提供されるリソースの正確な場所に対する制御または知識を有しないが、より抽象度の高いレベル(例えば、国、州、またはデータセンタ)において場所を指定することが可能であり得るという点において、位置独立の意味がある。
スピーディな拡張性:ケイパビリティは、場合によっては自動的に、即座にスケール・アウトするようにスピーディかつ弾力的に供給され、即座にスケール・インするようにスピーディに解放され得る。消費者に対しては、供給に利用可能なケイパビリティが、多くの場合無制限であるように見え、いつでも任意の量で購入可能である。
サービスが計測可能であること:クラウド・システムは、サービスの種類(例えば、ストレージ、処理、帯域幅、アクティブなユーザ・アカウント)に適したある抽象度レベルにおいて計測ケイパビリティを活用することによって、リソース使用を自動的に制御し、最適化する。リソース使用量は、モニタリングされ、制御され、報告されて、利用サービスのプロバイダおよび消費者の両方に透明性をもたらし得る。
サービスとしてのソフトウェア(SaaS):消費者に提供されるケイパビリティは、クラウド・インフラ上で実行中のプロバイダのアプリケーションを使用することである。アプリケーションは、ウェブ・ブラウザなどのシン・クライアント・インターフェース(例えば、ウェブ・ベースの電子メール)を通して、様々なクライアント・デバイスからアクセス可能である。消費者は、限定されたユーザ固有アプリケーションの構成設定は例外である可能性があるが、ネットワーク、サーバ、オペレーティング・システム、ストレージ、または個々のアプリケーション・ケイパビリティですら含む、基礎的なクラウド・インフラを管理または制御しない。
サービスとしてのプラットフォーム(PaaS):消費者に提供されるケイパビリティは、プロバイダによってサポートされるプログラミング言語およびツールを使用して生成された、消費者が作成したアプリケーションまたは消費者が取得したアプリケーションを、クラウド・インフラ上に配備することである。消費者は、ネットワーク、サーバ、オペレーティング・システム、またはストレージを含む基礎的なクラウド・インフラを管理または制御しないが、配備されたアプリケーション、および、可能な限りアプリケーション・ホスティング環境構成に対して制御を行う。
サービスとしてのインフラ(IaaS):消費者に提供されるケイパビリティは、処理、ストレージ、ネットワーク、ならびに消費者がオペレーティング・システムおよびアプリケーションを含み得る任意のソフトウェアを配備および実行することが可能な、他の基本コンピューティング・リソースを供給することである。消費者は、基礎となるクラウド・インフラを管理または制御しないが、オペレーティング・システム、ストレージ、配備されたアプリケーションに対して制御を行い、かつ可能な限り選択ネットワーキング・コンポーネント(例えば、ホスト・ファイアウォール)の限定的な制御を行う。
プライベート・クラウド:クラウド・インフラは、組織のためだけに動作される。クラウド・インフラは、その組織または第三者によって管理されてもよく、構内または構外に存在し得る。
コミュニティ・クラウド:クラウド・インフラは、複数の組織によって共有され、共有の関心事(例えば、任務、セキュリティ要件、ポリシー、およびコンプライアンスの考慮事項)を有する特定のコミュニティをサポートする。クラウド・インフラは、組織または第三者によって管理されてもよく、構内または構外に存在し得る。
パブリック・クラウド:クラウド・インフラは、一般公衆または大きい業界団体に利用可能とされ、クラウド・サービスを販売する組織によって所有される。
ハイブリッド・クラウド:クラウド・インフラは、一意なエンティティのままであるが、データおよびアプリケーション・ポータビリティを可能にする標準化技術または独自技術(例えば、クラウド間のロード・バランシングのためのクラウド・バースティング)によって結合された、2つ以上のクラウド(プライベート、コミュニティ、またはパブリック)の合成物である。
Claims (25)
- 音声およびビデオ・マルチメディア部分除去に基づく修正および提示改善方法であって、
ハードウェア・デバイスのプロセッサによってローカル・ソースまたはリモート・ソースから、音声/ビデオ・ストリームを受信することと、
前記プロセッサがR2統計的回帰コードを実行することによって、前記音声/ビデオ・ストリームのオブジェクトに関する予測を生成するために前記音声/ビデオ・ストリームの前記オブジェクトを分析することと、
前記プロセッサによって、前記音声/ビデオ・ストリームに関する成分分析コードを実行することと、
前記プロセッサによって前記実行することに応答して、修正済み音声/ビデオ・ストリームが生成されて、その結果前記音声/ビデオ・ストリームのハードウェア・ストレージおよび移送サイズ要件が減少されることをもたらす、前記音声/ビデオ・ストリームから前記オブジェクトのうちのあるオブジェクトを除去することと、
前記プロセッサによってグラフィカル・ユーザ・インターフェース(GUI)を介して、前記修正済み音声/ビデオ・ストリームを提示することと、
を含む、方法。 - 前記音声/ビデオ・ストリームの前記オブジェクトを前記分析することが、
前記オブジェクトの主要注目オブジェクトを識別することと、
前記オブジェクトの非主要注目オブジェクトを識別することと、
前記主要注目オブジェクトおよび前記非主要注目オブジェクトにタグ付けすることと、
前記タグ付けの結果に基づいて、前記音声/ビデオ・ストリームの個々のフレームに関して前記主要注目オブジェクトと前記非主要注目オブジェクトとの間の相互作用を判断することであって、前記除去することが、前記相互作用に基づいて実行され、前記除去することが、ユーザの注目を前記主要注目オブジェクトに向けることをもたらす、前記判断することと、
を含む、請求項1に記載の方法。 - 前記相互作用を前記判断することが、前記個々のフレーム内で前記非主要注目オブジェクトに関する前記主要注目オブジェクトの移動を検出することを含む、請求項2に記載の方法。
- 前記オブジェクトが、ビデオ・オブジェクトを含む、請求項1に記載の方法。
- 前記オブジェクトが、音声オブジェクトを含む、請求項1に記載の方法。
- 前記オブジェクトが、ビデオ・オブジェクトおよび関連する音声オブジェクトを含む、請求項1に記載の方法。
- 前記プロセッサによって遠隔に位置するデータベース内に、前記修正済み音声/ビデオ・ストリームを記憶することをさらに含む、請求項1に記載の方法。
- 前記音声/ビデオ・ストリームに関する前記成分分析コードを前記実行することが、特定期間に従って前記音声/ビデオ・ストリームの個々のフレームに関する前記オブジェクトのそれぞれを解析することをもたらす、請求項1に記載の方法。
- 前記プロセッサによって前記実行することに応答して、前記オブジェクトの追加オブジェクトが前記GUI内で前記オブジェクトよりも中心に位置すると判断することであって、前記除去することが、前記判断することの結果にさらに基づく、前記判断することをさらに含む、請求項1に記載の方法。
- 前記音声/ビデオ・ストリームに関する前記成分分析コードを前記実行することが、
前記オブジェクトの主要注目オブジェクトを識別することと、
前記オブジェクトの非主要注目オブジェクトを識別することと、
前記主要注目オブジェクトと前記非主要注目オブジェクトとの間の相互作用を判断することと、
前記主要注目オブジェクトに対する変更に基づいて前記非主要注目オブジェクトに対する変更を予測することと、
を含む、請求項1に記載の方法。 - 前記プロセッサによって前記ローカル・ソースまたはリモート・ソースから、前記音声/ビデオ・ストリームの追加ビューを検索することと、
前記プロセッサによって前記実行することに応答して、前記オブジェクトの追加オブジェクトを前記修正済み音声/ビデオ・ストリームに追加することと、
前記プロセッサによって前記GUIを介して、前記追加オブジェクトを含む前記修正済み音声/ビデオ・ストリームを提示することと、
をさらに含む、請求項1に記載の方法。 - 制御ハードウェアにおいてコンピュータ可読コードを生成すること、統合すること、ホストすること、維持すること、および配備することのうちの少なくとも1つのための少なくとも1つのサポート・サービスを提供することであって、前記コードが、前記受信すること、前記分析すること、前記実行すること、前記除去すること、および前記提示することを実施するために前記コンピュータ・プロセッサによって実行される、前記提供することをさらに含む、請求項1に記載の方法。
- コンピュータ可読プログラム・コードを記憶するコンピュータ可読ハードウェア・ストレージ・デバイスを含む、コンピュータ・プログラム製品であって、前記コンピュータ可読プログラム・コードが、ハードウェア・デバイスのプロセッサによって実行されるときに、音声およびビデオ・マルチメディア部分除去に基づく修正および提示改善方法を実施するアルゴリズムを含み、前記方法が、
前記プロセッサによってローカル・ソースまたはリモート・ソースから、音声/ビデオ・ストリームを受信することと、
前記プロセッサがR2統計的回帰コードを実行することによって、前記音声/ビデオ・ストリームのオブジェクトに関する予測を生成するために前記音声/ビデオ・ストリームの前記オブジェクトを分析することと、
前記プロセッサによって、前記音声/ビデオ・ストリームに関する成分分析コードを実行することと、
前記プロセッサによって前記実行することに応答して、修正済み音声/ビデオ・ストリームが生成されて、その結果前記音声/ビデオ・ストリームのハードウェア・ストレージおよび移送サイズ要件が減少されることをもたらす、前記音声/ビデオ・ストリームから前記オブジェクトのうちのあるオブジェクトを除去することと、
前記プロセッサによってグラフィカル・ユーザ・インターフェース(GUI)を介して、前記修正済み音声/ビデオ・ストリームを提示することと、
を含む、コンピュータ・プログラム製品。 - コンピュータ可読メモリ・ユニットに連結されたプロセッサを含むハードウェア・デバイスであって、前記メモリ・ユニットが、
前記プロセッサによってローカル・ソースまたはリモート・ソースから、音声/ビデオ・ストリームを受信することと、
前記プロセッサがR2統計的回帰コードを実行することによって、前記音声/ビデオ・ストリームのオブジェクトに関する予測を生成するために前記音声/ビデオ・ストリームの前記オブジェクトを分析することと、
前記プロセッサによって、前記音声/ビデオ・ストリームに関する成分分析コードを実行することと、
前記プロセッサによって前記実行することに応答して、修正済み音声/ビデオ・ストリームが生成されて、その結果前記音声/ビデオ・ストリームのハードウェア・ストレージおよび移送サイズ要件が減少されることをもたらす、前記音声/ビデオ・ストリームから前記オブジェクトのうちのあるオブジェクトを除去することと、
前記プロセッサによってグラフィカル・ユーザ・インターフェース(GUI)を介して、前記修正済み音声/ビデオ・ストリームを提示することと、
を含む音声およびビデオ・マルチメディア部分除去に基づく修正および提示改善方法を、前記プロセッサによって実行されるときに実施する命令を含む、ハードウェア・デバイス。 - 音声およびビデオ・マルチメディア修正および提示改善方法であって、
ハードウェア・デバイスのプロセッサによってローカル・ソースまたはリモート・ソースから、音声/ビデオ・ストリームを受信することと、
前記プロセッサがR2統計的回帰コードを実行することによって、前記音声/ビデオ・ストリームのオブジェクトに関する予測を生成するために前記音声/ビデオ・ストリームの前記オブジェクトを分析することと、
前記プロセッサによって、前記音声/ビデオ・ストリームに関する成分分析コードを実行することと、
前記プロセッサによって前記実行することに応答して、修正済み音声/ビデオ・ストリームが生成されて、その結果前記音声/ビデオ・ストリームのハードウェア・ストレージおよび移送サイズ要件が減少されることをもたらす、前記オブジェクトの少なくとも1つの追加オブジェクトに関して前記オブジェクトのうちのあるオブジェクトを修正することと、
前記プロセッサによってグラフィカル・ユーザ・インターフェース(GUI)を介して、前記修正済み音声/ビデオ・ストリームを提示することと、
を含む、方法。 - 前記オブジェクトが、ビデオ・オブジェクトを含み、前記オブジェクトを前記修正することが、前記少なくとも1つの追加ビデオ・オブジェクトに関して、前記GUIを介して投影される前記オブジェクトのサイズを減少させることを含む、請求項15に記載の方法。
- 前記オブジェクトが、ビデオ・オブジェクトを含み、前記オブジェクトを前記修正することが、前記少なくとも1つの追加ビデオ・オブジェクトに関して、前記GUIを介して投影される前記オブジェクトのビューを不鮮明にすることを含む、請求項15に記載の方法。
- 前記オブジェクトが、ビデオ・オブジェクトを含み、前記オブジェクトを前記修正することが、前記少なくとも1つの追加ビデオ・オブジェクトに関して、前記GUIを介して投影される前記オブジェクトのビューを拡張することを含む、請求項15に記載の方法。
- 前記オブジェクトが、音声オブジェクトを含み、前記オブジェクトを前記修正することが、前記少なくとも1つの追加音声オブジェクトに関して、前記GUIを介して投影される前記オブジェクトの可聴レベルを低下させることを含む、請求項15に記載の方法。
- 前記オブジェクトが、音声オブジェクトを含み、前記オブジェクトを前記修正することが、前記少なくとも1つの追加音声オブジェクトに関して、前記GUIを介して投影される前記オブジェクトの可聴レベルを上昇させることを含む、請求項15に記載の方法。
- コンピュータ可読プログラム・コードを記憶するコンピュータ可読ハードウェア・ストレージ・デバイスを含む、コンピュータ・プログラム製品であって、前記コンピュータ可読プログラム・コードが、ハードウェア・デバイスのプロセッサによって実行されるときに、音声およびビデオ・マルチメディア修正および提示改善方法を実施するアルゴリズムを含み、前記方法が、
前記プロセッサによってローカル・ソースまたはリモート・ソースから、音声/ビデオ・ストリームを受信することと、
前記プロセッサがR2統計的回帰コードを実行することによって、前記音声/ビデオ・ストリームのオブジェクトに関する予測を生成するために前記音声/ビデオ・ストリームの前記オブジェクトを分析することと、
前記プロセッサによって、前記音声/ビデオ・ストリームに関する成分分析コードを実行することと、
前記プロセッサによって前記実行することに応答して、修正済み音声/ビデオ・ストリームが生成されて、その結果前記音声/ビデオ・ストリームのハードウェア・ストレージおよび移送サイズ要件が減少されることをもたらす、前記オブジェクトの少なくとも1つの追加オブジェクトに関して前記オブジェクトのうちのあるオブジェクトを修正することと、
前記プロセッサによってグラフィカル・ユーザ・インターフェース(GUI)を介して、前記修正済み音声/ビデオ・ストリームを提示することと、
を含む、コンピュータ・プログラム製品。 - 前記オブジェクトが、ビデオ・オブジェクトを含み、前記オブジェクトを前記修正することが、前記少なくとも1つの追加ビデオ・オブジェクトに関して、前記GUIを介して投影される前記オブジェクトのサイズを減少させることを含む、請求項21に記載のコンピュータ・プログラム製品。
- 前記オブジェクトが、ビデオ・オブジェクトを含み、前記オブジェクトを前記修正することが、前記少なくとも1つの追加ビデオ・オブジェクトに関して、前記GUIを介して投影される前記オブジェクトのビューを不鮮明にすることを含む、請求項21に記載のコンピュータ・プログラム製品。
- 前記オブジェクトが、ビデオ・オブジェクトを含み、前記オブジェクトを前記修正することが、前記少なくとも1つの追加ビデオ・オブジェクトに関して、前記GUIを介して投影される前記オブジェクトのビューを拡張することを含む、請求項21に記載のコンピュータ・プログラム製品。
- 前記オブジェクトが、音声オブジェクトを含み、前記オブジェクトを前記修正することが、前記少なくとも1つの追加音声オブジェクトに関して、前記GUIを介して投影される前記オブジェクトの可聴レベルを低下させることを含む、請求項21に記載のコンピュータ・プログラム製品。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/011,905 | 2018-06-19 | ||
US16/011,905 US10666954B2 (en) | 2018-06-19 | 2018-06-19 | Audio and video multimedia modification and presentation |
PCT/IB2019/054946 WO2019243961A1 (en) | 2018-06-19 | 2019-06-13 | Audio and video multimedia modification and presentation |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021527969A true JP2021527969A (ja) | 2021-10-14 |
JP7416718B2 JP7416718B2 (ja) | 2024-01-17 |
Family
ID=68840757
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020557308A Active JP7416718B2 (ja) | 2018-06-19 | 2019-06-13 | 音声およびビデオ・マルチメディアの修正および提示 |
Country Status (6)
Country | Link |
---|---|
US (1) | US10666954B2 (ja) |
JP (1) | JP7416718B2 (ja) |
CN (1) | CN112088369B (ja) |
DE (1) | DE112019001822B4 (ja) |
GB (1) | GB2587584B (ja) |
WO (1) | WO2019243961A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10862938B1 (en) * | 2018-06-21 | 2020-12-08 | Architecture Technology Corporation | Bandwidth-dependent media stream compression |
EP4187906A1 (en) * | 2021-11-30 | 2023-05-31 | Nokia Technologies Oy | Playback |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04273687A (ja) * | 1991-02-28 | 1992-09-29 | Hitachi Ltd | 動画像符号化装置 |
JP2003242252A (ja) * | 2002-02-18 | 2003-08-29 | Nec Soft Ltd | 病室用支援システム、病室用テレビ、病室用支援プログラム |
JP2005295133A (ja) * | 2004-03-31 | 2005-10-20 | Victor Co Of Japan Ltd | 情報配信装置 |
JP2006514451A (ja) * | 2003-01-06 | 2006-04-27 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 類似のビデオコンテンツへの乗り換えのための方法および装置 |
JP2006197321A (ja) * | 2005-01-14 | 2006-07-27 | Sony Corp | 画像処理方法および装置、並びにプログラム |
US20080059665A1 (en) * | 2006-08-30 | 2008-03-06 | Qiang Cheng | Systems and methods of inter-frame compression |
JP2010226594A (ja) * | 2009-03-25 | 2010-10-07 | Sanyo Electric Co Ltd | 画像送信装置、およびそれを搭載した撮像装置 |
US20120069131A1 (en) * | 2010-05-28 | 2012-03-22 | Abelow Daniel H | Reality alternate |
US20150334398A1 (en) * | 2014-05-15 | 2015-11-19 | Daniel Socek | Content adaptive background foreground segmentation for video coding |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9004978D0 (en) | 1990-03-06 | 1990-05-02 | Crosfield Electronics Ltd | Image compression |
US6154754A (en) | 1997-09-25 | 2000-11-28 | Siemens Corporate Research, Inc. | Automatic synthesis of semantic information from multimedia documents |
US6324217B1 (en) | 1998-07-08 | 2001-11-27 | Diva Systems Corporation | Method and apparatus for producing an information stream having still images |
US6665423B1 (en) | 2000-01-27 | 2003-12-16 | Eastman Kodak Company | Method and system for object-oriented motion-based video description |
US6947378B2 (en) | 2001-02-28 | 2005-09-20 | Mitsubishi Electric Research Labs, Inc. | Dynamic network resource allocation using multimedia content features and traffic features |
EP1367505A1 (en) | 2002-05-30 | 2003-12-03 | Thomson Licensing S.A. | Method and device for creating semantic browsing options |
US8055783B2 (en) | 2005-08-22 | 2011-11-08 | Utc Fire & Security Americas Corporation, Inc. | Systems and methods for media stream processing |
FR2898725A1 (fr) | 2006-03-15 | 2007-09-21 | France Telecom | Dispositif et procede de codage gradue d'un signal audio multi-canal selon une analyse en composante principale |
MX2010005929A (es) | 2007-12-04 | 2010-06-15 | Ge Healthcare Ltd | Analisis de imagen. |
US8515258B2 (en) | 2009-02-20 | 2013-08-20 | Indian Institute Of Technology, Bombay | Device and method for automatically recreating a content preserving and compression efficient lecture video |
US8179466B2 (en) | 2009-03-11 | 2012-05-15 | Eastman Kodak Company | Capture of video with motion-speed determination and variable capture rate |
US8306283B2 (en) * | 2009-04-21 | 2012-11-06 | Arcsoft (Hangzhou) Multimedia Technology Co., Ltd. | Focus enhancing method for portrait in digital image |
WO2012094042A1 (en) * | 2011-01-07 | 2012-07-12 | Intel Corporation | Automated privacy adjustments to video conferencing streams |
US20140002639A1 (en) * | 2011-03-25 | 2014-01-02 | Joseph M. Cheben | Autonomous Detection of Chemical Plumes |
US8885706B2 (en) | 2011-09-16 | 2014-11-11 | Google Inc. | Apparatus and methodology for a video codec system with noise reduction capability |
US10678225B2 (en) * | 2013-03-04 | 2020-06-09 | Fisher-Rosemount Systems, Inc. | Data analytic services for distributed industrial performance monitoring |
CN103559402A (zh) * | 2013-11-07 | 2014-02-05 | 大连东方之星信息技术有限公司 | 一种应用线性回归方法的统计分析方法 |
US9349193B2 (en) | 2014-03-31 | 2016-05-24 | National Taipei University Of Technology | Method and apparatus for moving object detection using principal component analysis based radial basis function network |
CN103957389B (zh) | 2014-05-13 | 2017-02-22 | 重庆大学 | 基于压缩感知的3g视频传输方法及系统 |
US20160142672A1 (en) * | 2014-11-17 | 2016-05-19 | International Business Machines Corporation | Automatic screen adjustment for multi location video conferencing |
US9237307B1 (en) * | 2015-01-30 | 2016-01-12 | Ringcentral, Inc. | System and method for dynamically selecting networked cameras in a video conference |
US9679387B2 (en) | 2015-02-12 | 2017-06-13 | Mitsubishi Electric Research Laboratories, Inc. | Depth-weighted group-wise principal component analysis for video foreground/background separation |
-
2018
- 2018-06-19 US US16/011,905 patent/US10666954B2/en active Active
-
2019
- 2019-06-13 WO PCT/IB2019/054946 patent/WO2019243961A1/en active Application Filing
- 2019-06-13 CN CN201980030872.3A patent/CN112088369B/zh active Active
- 2019-06-13 JP JP2020557308A patent/JP7416718B2/ja active Active
- 2019-06-13 DE DE112019001822.1T patent/DE112019001822B4/de active Active
- 2019-06-13 GB GB2100132.6A patent/GB2587584B/en active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04273687A (ja) * | 1991-02-28 | 1992-09-29 | Hitachi Ltd | 動画像符号化装置 |
JP2003242252A (ja) * | 2002-02-18 | 2003-08-29 | Nec Soft Ltd | 病室用支援システム、病室用テレビ、病室用支援プログラム |
JP2006514451A (ja) * | 2003-01-06 | 2006-04-27 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 類似のビデオコンテンツへの乗り換えのための方法および装置 |
JP2005295133A (ja) * | 2004-03-31 | 2005-10-20 | Victor Co Of Japan Ltd | 情報配信装置 |
JP2006197321A (ja) * | 2005-01-14 | 2006-07-27 | Sony Corp | 画像処理方法および装置、並びにプログラム |
US20080059665A1 (en) * | 2006-08-30 | 2008-03-06 | Qiang Cheng | Systems and methods of inter-frame compression |
JP2010226594A (ja) * | 2009-03-25 | 2010-10-07 | Sanyo Electric Co Ltd | 画像送信装置、およびそれを搭載した撮像装置 |
US20120069131A1 (en) * | 2010-05-28 | 2012-03-22 | Abelow Daniel H | Reality alternate |
US20150334398A1 (en) * | 2014-05-15 | 2015-11-19 | Daniel Socek | Content adaptive background foreground segmentation for video coding |
Also Published As
Publication number | Publication date |
---|---|
GB2587584A (en) | 2021-03-31 |
DE112019001822B4 (de) | 2021-12-23 |
GB2587584B (en) | 2021-10-27 |
CN112088369B (zh) | 2024-04-16 |
GB202100132D0 (en) | 2021-02-17 |
US10666954B2 (en) | 2020-05-26 |
CN112088369A (zh) | 2020-12-15 |
DE112019001822T5 (de) | 2021-04-01 |
US20190387235A1 (en) | 2019-12-19 |
WO2019243961A1 (en) | 2019-12-26 |
JP7416718B2 (ja) | 2024-01-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11036796B2 (en) | Video clips generation system | |
US10931612B2 (en) | Integration of social interactions into media sharing | |
US11159631B2 (en) | Integration of social interactions into media sharing | |
GB2536351A (en) | Creating sustainable innovation platforms based on service first and service now approach | |
US9929983B2 (en) | Autonomous agent system | |
US20210174189A1 (en) | Optimization Framework for Real-Time Rendering of Media Using Machine Learning Techniques | |
US10547582B1 (en) | Methods and systems for enhancing viewer engagement with content portions | |
US20170262869A1 (en) | Measuring social media impact for brands | |
JP7416718B2 (ja) | 音声およびビデオ・マルチメディアの修正および提示 | |
AU2021269911B2 (en) | Optimized deployment of analytic models in an edge topology | |
US20200409451A1 (en) | Personalized content for augemented reality based on past user experience | |
US20210216774A1 (en) | Cloud based active commissioning system for video analytics | |
US11843569B2 (en) | Filtering group messages | |
US11900078B2 (en) | Tuning a container orchestrator | |
US11374986B1 (en) | Collaborative meeting interest analyzer based on capture attempts | |
WO2021228094A1 (en) | Remote resource capacity and utilization management | |
US10795671B2 (en) | Audiovisual source code documentation | |
US11729481B2 (en) | Providing customized abridged versions of media items based on available user time | |
US11240118B2 (en) | Network mixing patterns | |
US20230145700A1 (en) | Method for streaming multimedia based on user preferences | |
US10986422B2 (en) | Hyper video navigation | |
US20200394532A1 (en) | Detaching Social Media Content Creation from Publication | |
WO2023041522A1 (en) | Automatic replacement of media content associated with a real-time broadcast |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210519 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20211228 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220406 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220411 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230516 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230606 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230714 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231010 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231030 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231226 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240104 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7416718 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |