JP6884856B2 - コンテンツに基づいた映像データのストリーム分割 - Google Patents
コンテンツに基づいた映像データのストリーム分割 Download PDFInfo
- Publication number
- JP6884856B2 JP6884856B2 JP2019516408A JP2019516408A JP6884856B2 JP 6884856 B2 JP6884856 B2 JP 6884856B2 JP 2019516408 A JP2019516408 A JP 2019516408A JP 2019516408 A JP2019516408 A JP 2019516408A JP 6884856 B2 JP6884856 B2 JP 6884856B2
- Authority
- JP
- Japan
- Prior art keywords
- video
- image
- scene
- region cross
- viewport
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims description 73
- 230000000007 visual effect Effects 0.000 claims description 31
- 238000003860 storage Methods 0.000 claims description 22
- 238000004458 analytical method Methods 0.000 claims description 15
- 230000006399 behavior Effects 0.000 claims description 11
- 230000005540 biological transmission Effects 0.000 claims description 8
- 238000010801 machine learning Methods 0.000 claims description 5
- 230000003542 behavioural effect Effects 0.000 claims description 3
- 238000004519 manufacturing process Methods 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims 1
- 238000004891 communication Methods 0.000 description 18
- 238000012545 processing Methods 0.000 description 18
- 230000000875 corresponding effect Effects 0.000 description 14
- 230000003068 static effect Effects 0.000 description 11
- 230000006835 compression Effects 0.000 description 10
- 238000007906 compression Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 9
- 238000001514 detection method Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 238000007726 management method Methods 0.000 description 6
- 230000002123 temporal effect Effects 0.000 description 6
- 238000011144 upstream manufacturing Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 238000013507 mapping Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 230000003190 augmentative effect Effects 0.000 description 4
- 230000002457 bidirectional effect Effects 0.000 description 4
- 238000013500 data storage Methods 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 230000033001 locomotion Effects 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 238000010191 image analysis Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000005202 decontamination Methods 0.000 description 1
- 230000003588 decontaminative effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/472—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
- H04N21/4728—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for selecting a Region Of Interest [ROI], e.g. for requesting a higher resolution version of a selected region
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/111—Transformation of image signals corresponding to virtual viewpoints, e.g. spatial image interpolation
- H04N13/117—Transformation of image signals corresponding to virtual viewpoints, e.g. spatial image interpolation the virtual viewpoint locations being selected by the viewers or determined by viewer tracking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/21—Server components or server architectures
- H04N21/218—Source of audio or video content, e.g. local disk arrays
- H04N21/21805—Source of audio or video content, e.g. local disk arrays enabling multiple viewpoints, e.g. using a plurality of cameras
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/431—Generation of visual interfaces for content selection or interaction; Content or additional data rendering
- H04N21/4312—Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/431—Generation of visual interfaces for content selection or interaction; Content or additional data rendering
- H04N21/4318—Generation of visual interfaces for content selection or interaction; Content or additional data rendering by altering the content in the rendering process, e.g. blanking, blurring or masking an image region
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/4402—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
- H04N21/440263—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by altering the spatial resolution, e.g. for displaying on a connected PDA
- H04N21/440272—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by altering the spatial resolution, e.g. for displaying on a connected PDA for performing aspect ratio conversion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/84—Generation or processing of descriptive data, e.g. content descriptors
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Human Computer Interaction (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Information Transfer Between Computers (AREA)
Description
本発明は、画像の符号化および描画全般に関し、特に、コンテンツに基づいた映像データのストリーム分割に関する。
ニアアイディスプレイなどによる仮想現実用途において、人間の視覚が、あらゆる可能な鑑賞角度において常にピクセル化効果(pixilation effects)を知覚することを妨げるような空間解像度で画像を鑑賞する際にシームレスな体験を得るためには、望まれる映像データの量は、4K解像度の18ビュー分(eighteen 4K resolution views)と同等であり得る。望まれる映像データとしてこの量は膨大であり、映像データを圧縮および展開するのに必要な帯域幅の量および計算能力を考慮すると、現在のネットワークインフラストラクチャにおけるニアアイディスプレイなどの広範なディスプレイデバイスによってサポートされるには現在のところ実用的ではない。
コンテンツに基づいた映像データのストリーム分割に関連する実施形態例を、本明細書に記載する。以下の説明においては、便宜上、本発明を完全に理解できるように、多数の詳細事項を説明する。ただし、これらの詳細事項が無くても本発明を実施可能であることは明白であろう。他方、本発明の説明を不必要に煩雑にしたり、不明瞭にしたり、難読化したりしないように、周知の構造およびデバイスの細かな詳細までは説明しない。
1.一般的概要
2.ビデオ画像
3.領域断面および関心のシーン
4.ビデオ画像からのシーン検出
5.シーン、領域断面、およびビデオサブストリームの例
6.ビデオストリーミングサーバーおよびクライアントの例
7.プロセスフローの例
8.実装メカニズム−ハードウェア概要
9.均等物、拡張物、代替物、その他
本概要は、本発明の一実施形態例が有するいくつかの側面につき、基本的説明を提示する。本概要は、実施形態例が有する諸側面についての広範かつ網羅的な要約ではない、ということに留意すべきである。さらに留意すべきは、本概要は、実施形態例が有する任意の特に重要な側面や要素を示すものとして理解されるようには意図されておらず、また、その特定の実施形態例のあるいは広く本発明の何らの範囲を、規程するものとして理解されるようにも意図されていない。本概要は、単に、実施形態例に関するいくつかの概念を凝縮された簡素な形式で提示するものであって、以下に続く、諸実施形態例についてのより詳細な説明に対する単なる概念的な前置きとして理解されるべきである。別個の実施形態を本明細書において述べているが、本明細書に述べた実施形態の任意の組み合わせおよび/または部分的な実施形態は、組み合わせられてさらなる実施形態を形成し得ることに留意されたい。
いくつかの実施形態において、本明細書に記載のビデオ画像は、1つ以上の空間環境において用いられる1つ以上のカメラシステムによって撮像され得る。空間環境の例としては、これらのみに限定されないが、物理的空間環境、シミュレーションされた空間環境、映画スタジオ、屋外シーン、屋内シーン、トンネル、通り、乗り物、船、飛行機、大気圏外空間などがある。カメラシステムの例としては、これらのみに限定されないが、ライトフィールドカメラ、重複するおよび/または重複しない視野を有する複数のカメラ、デジタルカメラ、アナログカメラ、ウェブカメラなどがある。
本明細書において、ビデオ画像(100)中の1つの領域断面(regional cross section)とは、空間面積部分または空間体積部分を指し、ビデオ画像(100)中の、空間的位置(例えば連続する(contiguous)、またはばらばら(disjoint)、など)の集合によって形成され得る。ビデオ画像(100)中のある特定の領域断面は、以下のうち1つ以上によって表され得る。すなわち、ビデオ画像(100)上の、面積部分、空間形状、空間領域などである。
高関心のシーン(例えば110−2など)、低関心のシーン(例えば110−2、110−3など)などの様々なユーザー関心レベルにある、ビデオ画像(100)中のシーンは、ビデオ画像(単数または複数)内の領域断面の画像部分の符号化よりも前および/またはその最中において、ビデオ画像(単数または複数)(例えば100など)について決定され得る。
図2Aは、VR用途、AR用途、リモートプレゼンス用途、ディスプレイ用途などの映像関連用途において、論理的に表現された空間的位置202にいるユーザーに鑑賞されているビデオ画像(単数または複数)の領域断面の例を示す。論理的に表現された空間的位置(202)にいるユーザーは、ビデオ画像(単数または複数)によって形成される球体(または球)中に論理的に存在しているものと見なし得る。ユーザーの論理的に表現された空間的位置(202)は、これのみに限定されないが、球体の中央位置にあってもよい。ある所与の時刻において、ユーザーは、例えば、HMD、モバイルデバイス、ディスプレイデバイスなど(ビデオストリーミングクライアントの一部であるか、これと協働して動作している)により提供されるビューポート108−2を介して、ビデオ画像(単数または複数)中の各ビデオ画像の画像部分を鑑賞し得る。
図3Aは、画像処理装置302およびマルチ解像度画像生成器312などを含む一例としてのビデオストリーミングサーバー300を示す。いくつかの実施形態において、画像処理装置(302)は、画像受信器306、領域断面分類器308、データリポジトリ310などを備える。ビデオストリーミングサーバー(300)のコンポーネントの一部または全部は、1つ以上のデバイス、モジュール、ユニットなどによって、ソフトウェア、ハードウェア、ソフトウェアおよびハードウェアの組み合わせなどとして実装し得る。
図4Aは、本発明の一実施形態例によるプロセスフロー例を示す。いくつかの実施形態例において、1つ以上の計算装置またはコンポーネントによりこのプロセスフローを実行し得る。ブロック402において、画像処理装置(例えば図3A〜図3Cのビデオストリーミングサーバーまたはビデオストリーミングクライアントなど)が、1つ以上のビデオ画像の画像内容に基づき、前記1つ以上のビデオ画像中の複数のシーンを識別する。
一実施形態によれば、本明細書に説明されている技術は、1つ以上の専用の計算装置により実施される。専用の計算装置は、技術を実行するようハードワイヤードで接続され得るか、または、技術を実行するよう持続的にプログラムされた1つ以上の特定用途向け集積回路(ASIC)またはフィールドプログラマブルゲートアレイ(FPGA)のようなデジタル電子デバイスを含み得るか、または、ファームウェア、メモリ、その他の格納装置、または何らかの組み合わせにおけるプログラム指令に従って技術を実行するようプログラムされた、1つ以上の汎用のハードウェアプロセッサを含み得る。そのような専用の計算装置はまた、カスタムハードワイヤード論理、ASIC,またはFPGAとカスタムプログラミングとを組み合わせることにより、技術を達成し得る。専用の計算装置は、デスクトップコンピュータシステム、ポータブルコンピュータシステム、携帯用のデバイス、ネットワーキングデバイス、またはハードワイヤードおよび/またはプログラム論理を組み込むことにより技術を実施する、任意の他のデバイスであり得る。
この明細書中において、態様毎に異なり得る多数の詳細事項に言及しながら本発明の実施形態を説明した。従って、本発明が何たるか、また、本出願人が本発明であると意図するものを示す唯一且つ排他的な指標は、本願が特許になった際の請求の範囲(今後出されるあらゆる訂正を含む、特許となった特定請求項)である。当該請求項に含まれる用語に対して本明細書中に明示したあらゆる定義が、請求項内で使用される当該用語の意味を決定するものとする。よって、請求項において明示されていない限定事項、要素、性質、特徴、利点または属性は、その請求項の範囲をいかなる意味においても限定すべきではない。従って、本明細書および図面は、限定的ではなく、例示的であるとみなされるものである。
EEE1.1つ以上のビデオ画像の画像内容に基づき、前記1つ以上のビデオ画像中の複数のシーンを識別することと、
前記1つ以上のビデオ画像中の前記複数のシーンに基づき、前記1つ以上のビデオ画像における複数の領域断面を決定することと、
前記複数の領域断面中にある前記1つ以上のビデオ画像の複数の画像部分を、2つ以上の異なる時空間解像度にある2つ以上のビデオサブストリームに符号化することと、
ストリーミングクライアントデバイスに、前記2つ以上のビデオサブストリームを含む総合ビデオストリームを送信することと、
を包含する映像データをストリーミングする方法であって、
1つ以上の計算装置によって行われる、方法。
EEE2.前記複数の領域断面は、鑑賞者のビューポート内にある第1の領域断面を含み、前記複数の領域断面は、鑑賞者のビューポート内に無い第2の領域断面を含む、EEE1に記載の方法。
EEE3.前記第1の領域断面は、前記複数のシーンにおいて高関心のシーンを有していず、前記第2の領域断面は、前記複数のシーンのうち少なくとも1つの高関心のシーンと重なり、前記第1の領域断面の画像データは、第2の領域断面の画像データが符号化される第2の時空間解像度よりもスローな第1の時空間解像度で符号化される、EEE2に記載の方法。
EEE4.前記複数の領域断面のうちいかなる2つの領域断面も、互いに重ならない、EEE1に記載の方法。
EEE5.前記複数の領域断面のうち少なくとも2つの領域断面が、互いに重なる、EEE1に記載の方法。
EEE6.前記複数の領域断面のうち少なくとも2つの領域断面は、異なる空間形状、異なるサイズ、または異なるアスペクト比のうち1つ以上を有する、EEE1に記載の方法。
EEE7.前記複数の領域断面のうち少なくとも1つの領域断面は、前記1つ以上のビデオ画像とともに受け取られた画像メタデータに部分的に基づいて識別される、EEE1に記載の方法。
EEE8.前記複数の領域断面のうち少なくとも1つの領域断面は、前記1つ以上のビデオ画像に対し画像コンテンツ解析を行うことに部分的に基づいて識別される、EEE1に記載の方法。
EEE9.前記複数の領域断面のうち少なくとも1つの領域断面は、あるユーザー母集団のユーザー群が前記1つ以上のビデオ画像を鑑賞している間に集められたユーザー鑑賞行動データに部分的に基づいて識別される、EEE1に記載の方法。
EEE10.鑑賞者の中心視野を包含するシーンの画像データに対しブラーフィルタを適用することをさらに包含する、EEE1に記載の方法。
EEE11.前記複数のシーンは、鑑賞者のビューポートに包含される高関心のシーンを含んでいる、EEE1に記載の方法。
EEE12.鑑賞者のビューポートは、前記1つ以上のビデオ画像から検出された複数のシーンのうち高関心のシーンを含んでいない、EEE1に記載の方法。
EEE13.前記2つ以上のビデオサブストリームのうち少なくとも1つのビデオサブストリームは、アンカーフレームのみを含んでいる、EEE1に記載の方法。
EEE14.前記2つ以上のビデオサブストリームのうち少なくとも1つのビデオサブストリームは、アンカーフレームおよび非アンカーフレームの両方を含んでいる、EEE1に記載の方法。
EEE15.前記複数のシーン中のシーン群または前記複数の領域断面中の領域断面群のうち1つ以上を識別する映像メタデータを生成することと、
前記2つ以上のビデオサブストリームを含む前記総合ビデオストリーム中の前記映像メタデータを、前記ストリーミングクライアントデバイスに送信することと、
をさらに包含する、EEE1に記載の方法。
EEE16.映像データを鑑賞者に提示する方法であって、
ストリーミングサーバーから、2つ以上の異なる時空間解像度にある2つ以上のビデオサブストリームを含む総合ビデオストリームを受け取ることと、
前記2つ以上のビデオサブストリームを1つ以上のビデオ画像の1つ以上の画像部分に復号化することであって、前記1つ以上の画像部分は、複数の領域断面のうち1つ以上の領域断面中にあり、前記複数の領域断面複数の領域断面は、複数のシーンに少なくとも部分的に基づいて決定され、前記複数のシーンは、前記1つ以上のビデオ画像の画像内容に基づいて検出され、
前記1つ以上のビデオ画像の前記1つ以上の画像部分に基づき、ビデオコンテンツを生成することと、
前記ビデオコンテンツをディスプレイに描画させることと、を包含し、
1つ以上の計算装置によって行われる、方法。
EEE17.ビューポート情報を前記ストリーミングサーバーに送ることをさらに包含し、前記ビューポート情報は、前記1つ以上のビデオ画像に関して鑑賞者のビューポートを導出するために用いられる、EEE16に記載の方法。
EEE18.前記ビューポート情報はさらに、前記1つ以上のビデオ画像に関して前記鑑賞者の中心視野を導出するために用いられる、EEE17に記載の方法。
EEE19.映像メタデータを前記総合ビデオストリームから復号化することをさらに包含し、前記映像メタデータは、前記複数のシーン中のシーン群または前記複数の領域断面中の領域断面群のうち1つ以上を識別する、EEE16に記載の方法。
EEE20.前記ディスプレイに描画される前記ビデオコンテンツを生成することの一部として、非ブロック化操作、輪郭除去操作、またはぼかし操作のうち1つ以上を適用することをさらに包含する、EEE16に記載の方法。
EEE21.鑑賞者のビューポートの変化を検出することと、
前記鑑賞者のビューポートの変化に応答して、前記総合ビデオストリーム中の前記2つ以上のビデオサブストリームのうち少なくとも1つにおいて既に送信された周辺映像データに基づき、新たなビデオコンテンツを生成することと、
をさらに包含する、EEE16に記載の方法。
EEE22.EEE1〜21のいずれかに記載の方法を行う、装置。
EEE23.EEE1〜21のいずれかに記載の方法を行う、システム。
EEE24.1つ以上のプロセッサにより実行されたとき、EEE1〜21のうちいずれかに記載の方法を実行させるソフトウェア命令を格納した、非一時的なコンピュータ読み取り可能な記憶媒体。
EEE25.1つ以上のプロセッサと、1つ以上のプロセッサにより実行されたとき、EEE1〜21のうちいずれかに記載の方法を実行させる、1組の命令を格納した1つ以上の記憶媒体とを備えた、計算装置。
Claims (13)
- 1つ以上のビデオ画像の画像内容に基づき、前記1つ以上のビデオ画像中の複数のシーンを識別することであって、前記複数のシーンは、映像メタデータによって識別される少なくとも1つの高関心のシーンおよび少なくとも1つの低関心のシーンを含み、前記少なくとも1つの高関心のシーンは、前記1つ以上のビデオ画像の鑑賞者の母集団から集められた鑑賞行動データに基づいて生成される、前記映像メタデータに関連するヒートマップによって決定され、
前記1つ以上のビデオ画像の鑑賞者のビューポートを追跡することと、
前記1つ以上のビデオ画像中の前記複数のシーンに基づき、かつ前記鑑賞者のビューポートに基づき、前記1つ以上のビデオ画像における複数の領域断面を決定することであって、前記複数の領域断面は、前記鑑賞者のビューポート内の高関心のシーンに対応する第1の領域断面と、前記鑑賞者のビューポート外の高関心のシーンに対応する第2の領域断面と、前記鑑賞者のビューポート外の低関心のシーンに対応する第3の領域断面とを含み、
可変空間解像度を有するブラーフィルタを鑑賞者の中心視野を包含するシーンの画像データに対し適用することであって、前記鑑賞者の中心視野を包含するシーン部分にはゼロまたは少ないぼかしを与え、前記鑑賞者の中心視野外のシーン部分にはより強いぼかしを与え、前記ぼかしの強度は、ある空間的位置と鑑賞者の中心視野の中心との空間的距離に少なくとも部分的に基づいており、
前記複数の領域断面中にある前記1つ以上のビデオ画像の複数の画像部分を、2つ以上の異なる時空間解像度にある2つ以上のビデオサブストリームに符号化することであって、前記2つ以上のビデオサブストリームは、前記第1の領域断面に対し第1の時空間解像度を有する第1のビデオサブストリームと、前記第2の領域断面に対し第2の時空間解像度を有する第2のビデオサブストリームと、前記第3の領域断面に対し第3の時空間解像度を有する第3のビデオサブストリームとを含み、前記第3の時空間解像度は前記第2の時空間解像度より低く、前記第2の時空間解像度は前記第1の時空間解像度より低く、
ストリーミングクライアントデバイスに、前記2つ以上のビデオサブストリームを含む総合ビデオストリームを送信することと、
を包含する映像データをストリーミングする方法であって、
1つ以上の計算装置によって行われる、方法。 - 1つ以上のビデオ画像の画像内容に基づき、前記1つ以上のビデオ画像中の複数のシーンを識別することであって、前記複数のシーンは、少なくとも1つの高関心のシーンおよび少なくとも1つの低関心のシーンを含み、前記少なくとも1つの高関心のシーンは、ディレクター、カラーリスト、映像技師、または、コンテンツ制作アーティストからのユーザー入力によって決定され、
前記1つ以上のビデオ画像の鑑賞者のビューポートを追跡することと、
前記1つ以上のビデオ画像中の前記複数のシーンに基づき、かつ前記鑑賞者のビューポートに基づき、前記1つ以上のビデオ画像における複数の領域断面を決定することであって、前記複数の領域断面は、前記鑑賞者のビューポート内の高関心のシーンに対応する第1の領域断面と、前記鑑賞者のビューポート外の高関心のシーンに対応する第2の領域断面と、前記鑑賞者のビューポート外の低関心のシーンに対応する第3の領域断面とを含み、
可変空間解像度を有するブラーフィルタを鑑賞者の中心視野を包含するシーンの画像データに対し適用することであって、前記鑑賞者の中心視野を包含するシーン部分にはゼロまたは少ないぼかしを与え、前記鑑賞者の中心視野外のシーン部分にはより強いぼかしを与え、前記ぼかしの強度は、ある空間的位置と鑑賞者の中心視野の中心との空間的距離に少なくとも部分的に基づいており、
前記複数の領域断面中にある前記1つ以上のビデオ画像の複数の画像部分を、2つ以上の異なる時空間解像度にある2つ以上のビデオサブストリームに符号化することであって、前記2つ以上のビデオサブストリームは、前記第1の領域断面に対し第1の時空間解像度を有する第1のビデオサブストリームと、前記第2の領域断面に対し第2の時空間解像度を有する第2のビデオサブストリームと、前記第3の領域断面に対し第3の時空間解像度を有する第3のビデオサブストリームとを含み、前記第3の時空間解像度は前記第2の時空間解像度より低く、前記第2の時空間解像度は前記第1の時空間解像度より低く、
ストリーミングクライアントデバイスに、前記2つ以上のビデオサブストリームを含む総合ビデオストリームを送信することと、
を包含する映像データをストリーミングする方法であって、
1つ以上の計算装置によって行われる、方法。 - 前記複数の領域断面は、鑑賞者の中心視野内にある高関心のシーンに対応する第4の領域断面を含み、前記2つ以上のビデオサブストリームは、前記第4の領域断面に対し第4の時空間解像度を有する第4のビデオサブストリームを含み、前記第4の時空間解像度は前記第1の時空間解像度より高い、請求項1または2に記載の方法。
- 前記複数の領域断面のうち少なくとも1つの領域断面は、前記1つ以上のビデオ画像に対し画像コンテンツ解析を行うことに部分的に基づいて識別される、請求項1から3のいずれかに記載の方法。
- 前記複数の領域断面のうち少なくとも2つの領域断面は、異なる空間形状、異なるサイズ、または異なるアスペクト比のうち1つ以上を有する、請求項1から4のいずれかに記載の方法。
- 前記2つ以上のビデオサブストリームのうち少なくとも1つのビデオサブストリームは、アンカーフレームのみを含んでいる、請求項1から5のいずれかに記載の方法。
- 前記複数のシーン中のシーン群または前記複数の領域断面中の領域断面群のうち1つ以上を識別する前記映像メタデータを生成することと、
前記2つ以上のビデオサブストリームを含む前記総合ビデオストリーム中の前記映像メタデータを、前記ストリーミングクライアントデバイスに送信することと、
をさらに包含する、請求項1に記載の方法。 - 前記第3のビデオサブストリームは非アンカーフレームを含まない、請求項1から7のいずれかに記載の方法。
- 機械学習を適用して前記鑑賞行動データを解析することをさらに包含し、
前記ヒートマップは、解析した前記鑑賞行動データに基づいて生成される、請求項1に記載の方法。 - 請求項1から9のいずれかに記載の方法を行う、装置。
- 請求項1から9のいずれかに記載の方法を行う、システム。
- 1つ以上のプロセッサにより実行されたとき、請求項1から9のうちいずれかに記載の方法を実行させるソフトウェア命令を含むコンピュータプログラム。
- 1つ以上のプロセッサと、1つ以上のプロセッサにより実行されたとき、請求項1から9のうちいずれかに記載の方法を実行させる、1組の命令を格納した1つ以上の記憶媒体とを備えた、計算装置。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662399574P | 2016-09-26 | 2016-09-26 | |
US62/399,574 | 2016-09-26 | ||
EP16190623 | 2016-09-26 | ||
EP16190623.5 | 2016-09-26 | ||
PCT/US2017/052110 WO2018057472A1 (en) | 2016-09-26 | 2017-09-18 | Content based stream splitting of video data |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019534614A JP2019534614A (ja) | 2019-11-28 |
JP6884856B2 true JP6884856B2 (ja) | 2021-06-09 |
Family
ID=59914544
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019516408A Active JP6884856B2 (ja) | 2016-09-26 | 2017-09-18 | コンテンツに基づいた映像データのストリーム分割 |
Country Status (6)
Country | Link |
---|---|
US (2) | US11303966B2 (ja) |
EP (2) | EP3516882B1 (ja) |
JP (1) | JP6884856B2 (ja) |
KR (1) | KR102218519B1 (ja) |
CN (2) | CN109792562B (ja) |
WO (1) | WO2018057472A1 (ja) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10779014B2 (en) | 2018-10-18 | 2020-09-15 | At&T Intellectual Property I, L.P. | Tile scheduler for viewport-adaptive panoramic video streaming |
KR102154323B1 (ko) * | 2019-01-11 | 2020-09-09 | 한국항공대학교산학협력단 | 360도 비디오 시퀀스를 이용한 서브 비디오 시퀀스 생성 장치 및 방법 |
US10554940B1 (en) | 2019-03-29 | 2020-02-04 | Razmik Ghazaryan | Method and apparatus for a variable-resolution screen |
US10466489B1 (en) | 2019-03-29 | 2019-11-05 | Razmik Ghazaryan | Methods and apparatus for a variable-resolution screen |
US11284053B2 (en) | 2019-03-29 | 2022-03-22 | Razmik Ghazaryan | Head-mounted display and projection screen |
US11307655B2 (en) | 2019-09-19 | 2022-04-19 | Ati Technologies Ulc | Multi-stream foveal display transport |
CN110519607B (zh) | 2019-09-27 | 2022-05-20 | 腾讯科技(深圳)有限公司 | 视频解码方法及装置,视频编码方法及装置 |
US20220368946A1 (en) * | 2019-11-07 | 2022-11-17 | Intel Corporation | Heterogeneous real-time streaming and decoding of ultra-high resolution video content |
CN111127478B (zh) * | 2019-12-13 | 2023-09-05 | 上海众源网络有限公司 | 一种视图块分割方法及装置 |
CN111614975B (zh) * | 2020-05-08 | 2022-07-12 | 深圳拙河科技有限公司 | 一种亿级像素视频播放方法、装置、介质及设备 |
US11276206B2 (en) * | 2020-06-25 | 2022-03-15 | Facebook Technologies, Llc | Augmented reality effect resource sharing |
EP4189968A1 (en) * | 2020-08-03 | 2023-06-07 | Dolby Laboratories Licensing Corporation | Dual stream dynamic gop access based on viewport change |
US20220044132A1 (en) * | 2020-08-07 | 2022-02-10 | International Business Machines Corporation | Displaying contextual information of media |
US11800184B2 (en) * | 2021-01-06 | 2023-10-24 | Tencent America LLC | Method and apparatus for media scene description |
US11936975B2 (en) * | 2021-05-12 | 2024-03-19 | Nio Technology (Anhui) Co., Ltd. | Combined computer vision and human vision camera system |
CN113810755B (zh) * | 2021-09-15 | 2023-09-05 | 北京百度网讯科技有限公司 | 全景视频预览的方法、装置、电子设备及存储介质 |
CN116761019A (zh) * | 2023-08-24 | 2023-09-15 | 瀚博半导体(上海)有限公司 | 视频处理方法、系统、计算机设备及计算机可读存储介质 |
CN118283241B (zh) * | 2024-06-03 | 2024-08-13 | 中宜墨彩(成都)文化创意发展集团有限公司 | 一种沉浸式vr视频系统及数据处理方法 |
Family Cites Families (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5703604A (en) | 1995-05-22 | 1997-12-30 | Dodeca Llc | Immersive dodecaherdral video viewing system |
WO2001095513A1 (en) | 2000-06-09 | 2001-12-13 | Imove Inc. | Streaming panoramic video |
EP1359722A1 (en) | 2002-03-27 | 2003-11-05 | BRITISH TELECOMMUNICATIONS public limited company | Data streaming system and method |
CN1860791A (zh) * | 2003-09-29 | 2006-11-08 | 皇家飞利浦电子股份有限公司 | 结合高级数据分割和精确粒度可分级以用于有效时空信噪比的可分级视频编码和流式传输的系统和方法 |
JP4305752B2 (ja) * | 2003-10-24 | 2009-07-29 | ソニー株式会社 | 映像配信システム、映像配信装置、映像配信方法及び映像配信プログラム |
US20050094732A1 (en) * | 2003-10-30 | 2005-05-05 | Debargha Mukherjee | Data communications methods, compressed media data decoding methods, compressed media data decoders, articles of manufacture, and data communications systems |
US8848053B2 (en) | 2006-03-28 | 2014-09-30 | Objectvideo, Inc. | Automatic extraction of secondary video streams |
US8446509B2 (en) * | 2006-08-09 | 2013-05-21 | Tenebraex Corporation | Methods of creating a virtual window |
CN101115200B (zh) * | 2007-04-20 | 2010-05-19 | 西安交通大学 | 一种有效的运动矢量可伸缩编码方法 |
JP4895042B2 (ja) | 2007-07-20 | 2012-03-14 | 富士フイルム株式会社 | 画像圧縮装置、画像圧縮方法、及びプログラム |
CA2714362A1 (en) | 2008-01-29 | 2009-08-06 | Enforcement Video, Llc | Omnidirectional camera for use in police car event recording |
JP5109697B2 (ja) * | 2008-02-07 | 2012-12-26 | ソニー株式会社 | 画像送信装置、画像受信装置、画像送受信システム、画像送信プログラムおよび画像受信プログラム |
US20100050221A1 (en) | 2008-06-20 | 2010-02-25 | Mccutchen David J | Image Delivery System with Image Quality Varying with Frame Rate |
US8264524B1 (en) | 2008-09-17 | 2012-09-11 | Grandeye Limited | System for streaming multiple regions deriving from a wide-angle camera |
WO2010057170A1 (en) | 2008-11-17 | 2010-05-20 | Cernium Corporation | Analytics-modulated coding of surveillance video |
US8633984B2 (en) | 2008-12-18 | 2014-01-21 | Honeywell International, Inc. | Process of sequentially dubbing a camera for investigation and review |
US20110067072A1 (en) * | 2009-09-14 | 2011-03-17 | Shyam Parekh | Method and apparatus for performing MPEG video streaming over bandwidth constrained networks |
KR20110105710A (ko) * | 2010-03-19 | 2011-09-27 | 삼성전자주식회사 | 복수의 챕터를 포함하는 콘텐트를 적응적으로 스트리밍하는 방법 및 장치 |
US9690099B2 (en) * | 2010-12-17 | 2017-06-27 | Microsoft Technology Licensing, Llc | Optimized focal area for augmented reality displays |
ES2675802T3 (es) | 2011-02-18 | 2018-07-12 | Alcatel Lucent | Procedimiento y aparato para transmitir y recibir un flujo de video panorámico |
US8885882B1 (en) * | 2011-07-14 | 2014-11-11 | The Research Foundation For The State University Of New York | Real time eye tracking for human computer interaction |
US8789095B2 (en) * | 2012-05-15 | 2014-07-22 | At&T Intellectual Property I, Lp | Apparatus and method for providing media content |
JP6106967B2 (ja) * | 2012-06-04 | 2017-04-05 | ソニー株式会社 | 情報処理装置、情報処理方法、プログラム及び画像表示装置 |
US9996150B2 (en) * | 2012-12-19 | 2018-06-12 | Qualcomm Incorporated | Enabling augmented reality using eye gaze tracking |
US20140199050A1 (en) | 2013-01-17 | 2014-07-17 | Spherical, Inc. | Systems and methods for compiling and storing video with static panoramic background |
GB2509953B (en) * | 2013-01-18 | 2015-05-20 | Canon Kk | Method of displaying a region of interest in a video stream |
US10438633B2 (en) | 2013-05-26 | 2019-10-08 | Pixellot Ltd. | Method and system for low cost television production |
US10721530B2 (en) | 2013-07-29 | 2020-07-21 | Koninklijke Kpn N.V. | Providing tile video streams to a client |
EP2874396A1 (en) | 2013-11-15 | 2015-05-20 | Everseen Ltd. | Method and system for securing a stream of data |
JP6178705B2 (ja) * | 2013-11-15 | 2017-08-09 | 日本電信電話株式会社 | 映像配信システム、映像配信装置及び映像配信プログラム |
US20150271571A1 (en) * | 2014-03-18 | 2015-09-24 | Vixs Systems, Inc. | Audio/video system with interest-based recommendations and methods for use therewith |
US20150373341A1 (en) | 2014-06-23 | 2015-12-24 | Cisco Technology, Inc. | Techniques for Interactive Region-Based Scalability |
WO2015197815A1 (en) | 2014-06-27 | 2015-12-30 | Koninklijke Kpn N.V. | Determining a region of interest on the basis of a hevc-tiled video stream |
JP2016019248A (ja) * | 2014-07-10 | 2016-02-01 | キヤノン株式会社 | 動画表示制御装置、動画表示制御方法及びプログラム |
US10204658B2 (en) | 2014-07-14 | 2019-02-12 | Sony Interactive Entertainment Inc. | System and method for use in playing back panorama video content |
US10750153B2 (en) | 2014-09-22 | 2020-08-18 | Samsung Electronics Company, Ltd. | Camera system for three-dimensional video |
GB2536025B (en) * | 2015-03-05 | 2021-03-03 | Nokia Technologies Oy | Video streaming method |
-
2017
- 2017-09-18 JP JP2019516408A patent/JP6884856B2/ja active Active
- 2017-09-18 EP EP17769175.5A patent/EP3516882B1/en active Active
- 2017-09-18 CN CN201780058804.9A patent/CN109792562B/zh active Active
- 2017-09-18 US US16/336,628 patent/US11303966B2/en active Active
- 2017-09-18 EP EP20200471.9A patent/EP3793205B1/en active Active
- 2017-09-18 KR KR1020197008531A patent/KR102218519B1/ko active IP Right Grant
- 2017-09-18 WO PCT/US2017/052110 patent/WO2018057472A1/en active Application Filing
- 2017-09-18 CN CN202110363141.XA patent/CN113301439B/zh active Active
-
2022
- 2022-03-15 US US17/695,823 patent/US11653065B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20210314670A1 (en) | 2021-10-07 |
US20220210512A1 (en) | 2022-06-30 |
KR20190038664A (ko) | 2019-04-08 |
EP3516882B1 (en) | 2020-10-28 |
WO2018057472A1 (en) | 2018-03-29 |
US11303966B2 (en) | 2022-04-12 |
CN109792562B (zh) | 2021-04-13 |
CN113301439B (zh) | 2023-06-30 |
CN109792562A (zh) | 2019-05-21 |
KR102218519B1 (ko) | 2021-02-22 |
EP3793205A1 (en) | 2021-03-17 |
EP3793205B1 (en) | 2023-09-13 |
CN113301439A (zh) | 2021-08-24 |
JP2019534614A (ja) | 2019-11-28 |
US11653065B2 (en) | 2023-05-16 |
EP3516882A1 (en) | 2019-07-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6884856B2 (ja) | コンテンツに基づいた映像データのストリーム分割 | |
US12015787B2 (en) | Predicting and verifying regions of interest selections | |
Fan et al. | A survey on 360 video streaming: Acquisition, transmission, and display | |
Chiariotti | A survey on 360-degree video: Coding, quality of experience and streaming | |
US10440407B2 (en) | Adaptive control for immersive experience delivery | |
EP3466091B1 (en) | Method, device, and computer program for improving streaming of virtual reality media content | |
WO2019202207A1 (en) | Processing video patches for three-dimensional content | |
US11748870B2 (en) | Video quality measurement for virtual cameras in volumetric immersive media | |
US11941748B2 (en) | Lightweight view dependent rendering system for mobile devices | |
US20130321586A1 (en) | Cloud based free viewpoint video streaming | |
US20190335166A1 (en) | Deriving 3d volumetric level of interest data for 3d scenes from viewer consumption data | |
US11120615B2 (en) | Dynamic rendering of low frequency objects in a virtual reality system | |
JP7447266B2 (ja) | ボリュメトリック画像データに関するビューの符号化及び復号 | |
Rossi et al. | Streaming and user behavior in omnidirectional videos | |
JP2016012920A (ja) | 超高解像度ビデオコンテンツ内をナビゲートするための方法、システムおよび関連する選択デバイス | |
Alain et al. | Introduction to immersive video technologies | |
Huang et al. | Low-Complexity 3D-Vision Conferencing System based on Accelerated RIFE Model | |
CN106406508A (zh) | 一种信息处理方法及中继设备 | |
Wang | Low-Latency Adaptive Media Streaming: From 2D to 6-DoF | |
Niamut et al. | Advanced visual rendering, gesture-based interaction and distributed delivery for immersive and interactive media services |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A529 | Written submission of copy of amendment under article 34 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A529 Effective date: 20190524 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190524 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200324 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20200622 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20200821 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200923 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201222 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210319 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210413 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210512 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6884856 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |