JP2019512969A - ビデオの符号化方法及び装置、機器、記憶媒体 - Google Patents

ビデオの符号化方法及び装置、機器、記憶媒体 Download PDF

Info

Publication number
JP2019512969A
JP2019512969A JP2018549490A JP2018549490A JP2019512969A JP 2019512969 A JP2019512969 A JP 2019512969A JP 2018549490 A JP2018549490 A JP 2018549490A JP 2018549490 A JP2018549490 A JP 2018549490A JP 2019512969 A JP2019512969 A JP 2019512969A
Authority
JP
Japan
Prior art keywords
viewing angle
encoded data
video
video sequence
horizontal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018549490A
Other languages
English (en)
Other versions
JP6718976B2 (ja
Inventor
曜 王
曜 王
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Publication of JP2019512969A publication Critical patent/JP2019512969A/ja
Application granted granted Critical
Publication of JP6718976B2 publication Critical patent/JP6718976B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • H04N21/21805Source of audio or video content, e.g. local disk arrays enabling multiple viewpoints, e.g. using a plurality of cameras
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234336Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by media transcoding, e.g. video is transformed into a slideshow of still pictures or audio is converted into text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • H04N21/2187Live feed
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234309Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by transcoding between formats or standards, e.g. from MPEG-2 to MPEG-4 or from Quicktime to Realvideo
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440218Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by transcoding between formats or standards, e.g. from MPEG-2 to MPEG-4
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440236Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by media transcoding, e.g. video is transformed into a slideshow of still pictures, audio is converted into text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • H04N21/6587Control parameters, e.g. trick play commands, viewpoint selection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/816Monomedia components thereof involving special video data, e.g 3D video
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/698Control of cameras or camera modules for achieving an enlarged field of view, e.g. panoramic image capture

Abstract

本発明はビデオ符号化方法及び装置、機器、記憶媒体を提供し、符号化技術分野に関する。前記方法は、パノラマ画像フレームからなるパノラマビデオを取得することと、パノラマビデオを、それぞれパノラマビデオ中の全てのパノラマ画像フレームにおける同一の水平視角を有する領域からなり、水平視角の総和がパノラマ画像フレームの総水平視角であるN(Nは正整数である。)個の視角ビデオシーケンスに分割することと、N個の視角ビデオシーケンスにそれぞれ符号化を行って、N組の符号化データを得ることと、ユーザの観賞視角を確定することと、水平視角が観賞視角を含む視角ビデオシーケンスを選択し、視角ビデオシーケンスの符号化データをユーザに提供することと、を含み、一つのパノラマ画像フレーム中の各領域は互いに重ならない。

Description

本特許出願は、2016年03月22日に出願した中国特許出願番号201610163645.6で、出願人がテンセント科学技術(深セン)有限会社で、発明名称が「ビデオの符号化方法及び装置」を基礎とする優先権を主張し、その開示のすべてをここに取り込む。
本発明は、符号化技術分野に関し、特に、ビデオ符号化方法及び装置、機器、記憶媒体に関する。
パノラマビデオは、一連のパノラマ画像フレームからなるビデオで、パノラマ画像フレームは、所定の視角の風物を記録して形成された画像フレームで、例えば、所定の視角は水平360°、鉛直180°であって、又は所定の視角は水平360°、鉛直270°などである。エンコーダは、パノラマカメラによってパノラマビデオを得た後、パノラマビデオを符号化し、符号化後のパノラマビデオをデコーダに送信して復号化して、ユーザに復号化後に得たパノラマビデオを見せる。
既存技術で提供したビデオを符号化する方法は、エンコーダがパノラマビデオ中の全てのパノラマ画像フレームを取得することと、各パノラマ画像フレームについて、該パノラマ画像フレームをH.264/AVC(Advanced Video Coding、高級ビデオ符号化)に定義されたシンタックス構成に従って符号化して、下付き文字が連続するマクロブロック集合を得る、即ち、該パノラマ画像フレームの符号化データを得ることと、又は、各パノラマ画像フレームをH.265/HEVC(High Efficiency Video Coding、効率的ビデオ符号化)に定義されたシンタックス構成に従って符号化して、ブロック単位の矩形領域集合を得る、即ち、該パノラマ画像フレームの符号化データであることと、各パノラマ画像フレームに対応する符号化データをデコーダに送信することと、を含む。
ユーザの視角は通常、150°程度であるので、パノラマ画像フレーム中の150°程度の視角の符号化データのみが有効で、その他の符号化データはすべて無効であって、これらの無効の符号化データを受信して復号化するとリソースを浪費しています。
本発明の実施例は、パノラマビデオ中の全てのパノラマ画像フレームの符号化データを受信して復号化してリソースを浪費する問題を解決するため、ビデオの符号化方法及び装置、機器、記憶媒体を提供する。
本発明の実施例の技術案は以下のとおりである。
一態様によると、本発明の実施例は、
所定の視角の風物を記録して形成された画像フレームであるパノラマ画像フレームからなるパノラマビデオを取得することと、
前記パノラマビデオを、それぞれ前記パノラマビデオ中の全てのパノラマ画像フレームにおける同一の水平視角を有する領域からなり、水平視角の総和が前記パノラマ画像フレームの総水平視角であるN(Nは正整数である。)個の視角ビデオシーケンスに分割することと、
前記N個の視角ビデオシーケンスにそれぞれ符号化を行って、N組の符号化データを得ることと、
ユーザの観賞視角を確定することと、
水平視角が前記観賞視角を含む視角ビデオシーケンスを選択して、前記視角ビデオシーケンスの符号化データを前記ユーザに提供することと、を含み、
一つのパノラマ画像フレーム中の各領域は互いに重ならない、ビデオ符号化方法を提供する。
一方、本発明の実施例で、
所定の視角の風物を記録して形成された画像フレームであるパノラマ画像フレームからなるパノラマビデオを取得し、前記パノラマビデオを、それぞれ前記パノラマビデオ中の全てのパノラマ画像フレームにおける同一の水平視角を有する領域からなり、水平視角の総和が前記パノラマ画像フレームの総水平視角であるN(Nは正整数である。)個の視角ビデオシーケンスに分割し、前記N個の視角ビデオシーケンスにそれぞれ符号化を行ってN組の符号化データを得、水平視角が観賞視角を含む視角ビデオシーケンスを選択して前記視角ビデオシーケンスの符号化データをユーザに提供するように構成されたエンコーダに前記ユーザの前記観賞視角を提供することと、
前記エンコーダから送信された前記符号化データを受信することと、
前記符号化データに復号化を行うことと、を含み、
一つのパノラマ画像フレーム中の各領域は互いに重ならない、ビデオ符号化方法を提供する。
本発明の実施例はさらに、
所定の視角の風物を記録して形成された画像フレームであるパノラマ画像フレームからなるパノラマビデオを取得するように構成されたビデオ取得モジュールと、
前記ビデオ取得モジュールが取得した前記パノラマビデオを、それぞれ前記パノラマビデオ中の全てのパノラマ画像フレームにおける同一の水平視角を有する領域からなり、水平視角の総和が前記パノラマ画像フレームの総水平視角であるN(Nは正整数である。)個の視角ビデオシーケンスに分割するように構成されたビデオ分割モジュールと、
前記ビデオ分割モジュールで得た前記N個の視角ビデオシーケンスにそれぞれ符号化を行って、N組の符号化データを得るように構成されたビデオ符号化モジュールと、
ユーザの観賞視角を確定するように構成された視角確定モジュールと、
水平視角が前記視角確定モジュールによって確定された前記観賞視角を含む視角ビデオシーケンスを選択して、前記視角ビデオシーケンスの符号化データを前記ユーザに提供するように構成された第1の提供モジュールと、を含み、
一つのパノラマ画像フレーム中の各領域は互いに重ならない、ビデオ符号化装置を提供する。
本発明の実施例はさらに、
所定の視角の風物を記録して形成された画像フレームであるパノラマ画像フレームからなるパノラマビデオを取得し、前記パノラマビデオを、それぞれ前記パノラマビデオ中の全てのパノラマ画像フレームにおける同一の水平視角を有する領域からなり、水平視角の総和が前記パノラマ画像フレームの総水平視角であるN(Nは正整数である。)個の視角ビデオシーケンスに分割し、前記N個の視角ビデオシーケンスにそれぞれ符号化を行ってN組の符号化データを得、水平視角が観賞視角を含む視角ビデオシーケンスを選択して前記視角ビデオシーケンスの符号化データをユーザに提供するように構成されたエンコーダに前記ユーザの前記観賞視角を提供するように構成された視角提供モジュールと、
前記エンコーダから送信された前記符号化データを受信するように構成された第1の受信モジュールと、
前記第1の受信モジュールが受信した前記符号化データに復号化を行うように構成されたデータ復号化モジュールと、を含み、
一つのパノラマ画像フレーム中の各領域は互いに重ならない、ビデオ符号化装置を提供する。
本発明の実施例は、本発明の第1の態様又は第2の態様の実施例で提供するビデオ符号化方法を実行するためのコンピューターが実行可能な命令を記憶したコンピューター記憶媒体を提供する。
本発明の実施例は、
所定の視角の風物を記録して形成された画像フレームであるパノラマ画像フレームからなるパノラマビデオを取得することと、
前記パノラマビデオを、それぞれ前記パノラマ画像フレームにおける同一の水平視角を有する領域からなり、水平視角の総和が前記パノラマ画像フレームの総水平視角であるN(Nは正整数である。)個の視角ビデオシーケンスに分割することと、
前記N個の視角ビデオシーケンスにそれぞれ符号化を行って、N組の符号化データを得ることと、
ユーザの観賞視角を確定することと、
水平視角が前記観賞視角を含む視角ビデオシーケンスを選択し、前記視角ビデオシーケンスの符号化データを前記ユーザに提供することと、
を実行するための実行可能な命令を記憶するための第1の記憶媒体と、
記憶された実行可能な命令を実行するように構成された第1のプロセッサと、を含み、
一つのパノラマ画像フレーム中の各領域は互いに重ならない、エンコーダを提供する。
本発明の実施例で提供する技術案によると、パノラマビデオをN個の視角ビデオシーケンスに分割し、該N個の視角ビデオシーケンスにそれぞれ符号化を行って、N組の符号化データを得て、また、ユーザの観賞視角を確定し、水平視角が観賞視角を含む視角ビデオシーケンスを選択して、視角ビデオシーケンスの符号化データをユーザを提供することで、ユーザの観賞視角内の視角ビデオシーケンスの符号化データのみをユーザを提供して、観賞視角外の視角ビデオシーケンスの符号化データの伝送や復号化を回避し、パノラマビデオ中の全てのパノラマ画像フレームの符号化データを受信して復号化してリソースを浪費する問題を解決し、リソースを節約する効果を実現できる。
本発明の実施例の技術案をさらに明確に説明するため、以下、実施例の説明で必要な図面を簡単に説明し、以下で説明する図面が本発明の実施例の一部で、当業者は創造性のある行為を必要とせずにこれらの図面を基に他の図面を得られることはいうまでもない。
本発明の各実施例に係わるビデオ符号化方法を実施する環境を示す図である。 本発明の一実施例で提供するビデオ符号化方法を示すフローチャートである。 本発明の他の実施例で提供するビデオ符号化方法を示すフローチャートである。 本発明の他の実施例で提供する領域の分割を示す図である。 本発明の他の実施例で提供する視角ビデオシーケンスを示す図である。 本発明の他の実施例で提供する伝送する視角ビデオシーケンス中の各領域を示す図である。 本発明の他の実施例で提供するビデオ符号化方法を示す図である。 本発明の一実施例で提供するビデオ符号化装置の構成を示すブロック図である。 本発明の更なる他の実施例で提供するビデオ符号化装置の構成を示すブロック図である。 本発明の一実施例で提供するビデオ符号化装置の構成を示すブロック図である。 本発明の更なる他の実施例で提供するビデオ符号化装置の構成を示すブロック図である。
本発明の目的、技術案とメリットが明確になるように、以下、図面を結合して本発明の実施形態をさらに詳しく説明する。
図1は本発明の各実施例に係わるビデオ符号化方法を実施する環境を示す図で、図1のA図において、パノラマカメラ101と、ユーザ機器102とを含み、この時、エンコーダはパノラマカメラ101に設置され、デコーダはユーザ機器102に設置される。ここで、ユーザ機器102はバーチャルリアリティヘルメット、TV、コンピューター、携帯電話等であることができ、本実施例では限定しない。
パノラマカメラ101は、撮影してパノラマビデオを得た後、エンコーダによってパノラマビデオをN個の視角ビデオシーケンスに分割し、各視角ビデオシーケンスに符号化を行って、N組の符号化データを得る。また、ユーザの観賞視角に応じて、対応する符号化データをユーザ機器102に送信し、ユーザ機器102はデコーダによって該符号化データに復号化を行って、復号化して得た視角ビデオシーケンスを放送する。
本実施例において、図1のB図において、パノラマカメラ101と、サーバー102と、ユーザ機器103と、を含み、ここで、エンコーダはサーバー102に設置され、デコーダはユーザ機器103に設置される。
パノラマカメラ101は、撮影してパノラマビデオを得た後、パノラマビデオをサーバー102に送信し、サーバー102はエンコーダによってパノラマビデオをN個の視角ビデオシーケンスに分割し、各視角ビデオシーケンスに符号化を行って、N組の符号化データを得る。また、ユーザの観賞視角に応じて、対応する符号化データをユーザ機器103に送信し、ユーザ機器103はデコーダによって該符号化データに復号化を行って、復号化して得た視角ビデオシーケンスを放送する。
本発明の他の実施例において、図1の下図において、パノラマカメラ101と、サーバー102と、ユーザ機器103と、を含み、ここで、エンコーダはパノラマカメラ101に設置され、デコーダはユーザ機器103に設置される。
パノラマカメラ101は、撮影してパノラマビデオを得た後、エンコーダによってパノラマビデオをN個の視角ビデオシーケンスに分割し、各視角ビデオシーケンスに符号化を行って、N組の符号化データをえて、N組の符号化データをサーバー102に送信する。サーバー102はユーザの観賞視角に応じて、対応する符号化データをユーザ機器103に送信し、ユーザ機器103はデコーダによって該符号化データに復号化を行って、復号化して得た視角ビデオシーケンスを放送する。
図2を参照すると、本発明の一実施例で提供するビデオ符号化方法を示すフローチャートで、該ビデオ符号化方法を図1に示す実施環境に応用できる。該ビデオ符号化方法は、ステップ201〜ステップ208を含む。
ステップ201において、エンコーダが、パノラマビデオを取得し、該パノラマビデオはパノラマ画像フレームからなり、該パノラマ画像フレームは所定の視角の風物を記録して形成された画像フレームである。
ステップ202において、エンコーダが、パノラマビデオをN(Nは正整数である。)個の視角ビデオシーケンスに分割し、各視角ビデオシーケンスはパノラマビデオ中の全てのパノラマ画像フレームにおける同一の水平視角を有する領域からなり、且つN個の視角ビデオシーケンスの水平視角の総和はパノラマ画像フレームの総水平視角であり、ここで、一つのパノラマ画像フレーム中の各領域は互いに重ならない。
ステップ203において、エンコーダが、N個の視角ビデオシーケンスにそれぞれ符号化を行って、N組の符号化データを得る。
ステップ204において、デコーダが、エンコーダにユーザの観賞視角を提供する。
ステップ205において、エンコーダが、ユーザの観賞視角を確定する。
ステップ206において、エンコーダが、水平視角が観賞視角を含む視角ビデオシーケンスを選択し、該視角ビデオシーケンスの符号化データをユーザに提供する。
ステップ207において、デコーダが、エンコーダから送信された符号化データを受信する。
ステップ208において、デコーダが、符号化データに復号化を行う。
ここで、ステップ201、202、203、205、206をエンコーダ側の実施例として単独に実現することができ、ステップ204、207、208をデコーダ側の実施例として単独に実現するとができる。
上記のように、本発明の実施例で提供するビデオ符号化方法によると、パノラマビデオをN個の視角ビデオシーケンスに分割し、該N個の視角ビデオシーケンスにそれぞれ符号化を行って、N組の符号化データを得て、ユーザの観賞視角を確定し、水平視角が観賞視角を含む視角ビデオシーケンスを選択して、視角ビデオシーケンスの符号化データをユーザに提供することで、ユーザの観賞視角内の視角ビデオシーケンスの符号化データのみをユーザに提供し、観賞視角外の視角ビデオシーケンスの符号化データの伝送や復号化を回避し、パノラマビデオ中の全てのパノラマ画像フレームの符号化データを受信して復号化してリソースを浪費する問題を解決し、リソースを節約する効果を実現できる。
図3Aを参照すると、本発明の他の実施例で提供するビデオ符号化方法を示すフローチャートで、該ビデオ符号化方法を図1に示す実施環境に応用できる。該ビデオ符号化方法、ステップ301〜ステップ3011を含む。
ステップ301において、エンコーダが、パノラマビデオを取得し、該パノラマビデオはパノラマ画像フレームからなり、該パノラマ画像フレームは所定の視角の風物を記録して形成された画像フレームである。
エンコーダがパノラマカメラに位置する場合、パノラマカメラはまず、異なる方位のカメラによってビデオを撮影して、全てのカメラが同時刻で撮影して得た各画像フレームをスティッチングして、各パノラマ画像フレームを得て、さらに、各パノラマ画像フレームでパノラマビデオを構成して、該パノラマビデオをエンコーダに提供する。エンコーダがサーバーに位置する場合、パノラマカメラは、上記フローでパノラマビデオを得た後、該パノラマビデオをサーバーに送信し、サーバーが該パノラマビデオをエンコーダに送信する。ここで、パノラマ画像フレームは所定の視角の風物を記録して形成された画像フレームで、例えば、所定の視角は水平360°、鉛直180°であるか、或いは、所定の視角は水平360°、鉛直270°等である。
ステップ302において、予め設定された視角分割ルールに従って、エンコーダがパノラマビデオ中の各パノラマ画像フレームを水平視角に基づいてN個の領域に分割し、Nは正整数である。
視角分割ルールはエンコーダに水平視角に基づいてパノラマ画像フレームに領域分割を行うことを指示し、一つのパノラマビデオ中の全てのパノラマ画像フレームの視角分割ルールは同じである。ここで、N個の視角ビデオシーケンスの水平視角の総和はパノラマ画像フレームの総水平視角で、且つ一つのパノラマ画像フレーム中の各領域は互いに重ならない。例えば、パノラマ画像フレームの総水平視角が360°である場合、N個の視角ビデオシーケンスの水平視角の総和は360°である。
本実施例において、一つのパノラマ画像フレーム中の各領域の水平視角の区間範囲は同じであることができれば、異なることもでき、本実施例において限定しない。例えば、視角分割ルールが4個の水平視角に均一に分割することであると、この時、各水平視角の区間範囲は90°であって、即ち、0°〜90°を一つの水平視角とし、90°〜180°を一つの水平視角とし、180°〜270°を一つの水平視角とし、270°〜360°を一つの水平視角とする。又は、実現する場合、ユーザの常用の観賞視角に基づいて視角分割ルールを確定して、領域分割の正確性を向上させることもできる。例えば、ユーザの常用の観賞視角が15°〜165°であると、視角分割ルールは、0°〜15°を一つの水平視角とし、15°〜165°を一つの水平視角とし、165°〜360°を一つの水平視角とする。
視角分割ルールに従って領域を分割する場合、視角分割ルールが3個の水平視角に均一に分割することであると、パノラマ画像フレーム0について、水平視角0°〜120°の領域をview0とし、120°〜240°の領域をview1とし、240°〜360°の領域をview2とする。パノラマ画像フレーム1については、水平視角0°〜120°の領域をview0とし、120°〜240°の領域をview1とし、240°〜360°の領域をview2とし、その他も類似で、パノラマ画像フレームMについて、水平視角0°〜120°の領域をview0とし、120°〜240°の領域をview1とし、240°〜360°の領域をview2とし、図3Bの領域の分割を示す図を参照することができる。
尚、領域はマクロブロックからなる。マクロブロックは、ビデオ符号化アルゴリズムにおける単位で、一つのマクロブロックは一つの輝度画素ブロックと付加的な二つのクロマ画素ブロックからなる。一般的に、輝度画素ブロックは16×16大きさの画素ブロックで、二つのクロマ画素ブロックの大きさはその画像のサンプリング方式によって決められる。
一つの領域が少なくとも二つのマクロブロックを含む場合、各領域内のマクロブロックは空間領域において互いに依存する。即ち、各領域において、一つのマクロブロックの符号化データはそれと空間領域で隣接するマクロブロックの符号化データに基づいて生成したものである。
例えば、エンコーダがF0V1中のマクロブロック1とマクロブロック2が互いに依存すると定義すると、この時、マクロブロック1とマクロブロック2は空間領域で隣接で、且つマクロブロック1の符号化データはマクロブロック2の符号化データに基づいて生成したものである。
エンコーダが異なる領域間マクロブロックが空間領域内で互いに独立すると定義する。即ち、異なる領域間において、空間領域内で隣り合う二つのマクロブロックの符号化データは関係ない。
例えば、エンコーダがF0V1中のマクロブロック1とF0V2中のマクロブロック2が互いに依存しないと定義すると、この時、マクロブロック1とマクロブロック2は空間領域で隣り合い、マクロブロック1の符号化データの生成はマクロブロック2の符号化データに基づくものではない。
ステップ303において、エンコーダが全てのパノラマ画像フレームにおける同一の水平視角を有する領域で一つの視角ビデオシーケンスを構成して、N個の視角ビデオシーケンスを得る。
依然として上記実例で説明すると、図3Cの視角ビデオシーケンスを示す図を参照すると、図3Cにおいて、パノラマ画像フレームをFと表し、領域をVと表し、この時、M個のパノラマ画像フレームにおける水平視角が0°〜120°である領域を組み合せして、視角ビデオシーケンスF0V0、F1V0…FMV0を得ることができ、M個のパノラマ画像フレームにおける水平視角が120°〜240°である領域を組み合せして、視角ビデオシーケンスF0V1、F1V1…FMV1を得ることができ、M個のパノラマ画像フレームにおける水平視角が240°〜360°である領域を組み合せして、視角ビデオシーケンスF0V2、F1V2…FMV2を得ることができる。
ここで、各視角ビデオシーケンス内の各領域は時間領域で互いに依存する。即ち、各視角ビデオシーケンスにおいて、第j個の領域の符号化データは第j−1個の領域の符号化データに基づいて生成したものであるか、或いは、第j個の領域の符号化データは第j−1個の領域の符号化データと第l個の領域の符号化データに基づいて生成したものであり、jとlはいずれも正整数で、且つl>j≧2である。
例えば、エンコーダがF0V1とF1V1が互いに依存すると定義すると、この時、F1V1の符号化データはF0V1の符号化データに基づいて生成される。
ここで、異なる視角ビデオシーケンス間の各領域は時間領域で互いに独立する。即ち、異なる視角ビデオシーケンスにおいて、任意の二つの領域の符号化データは時間領域で関係ない。
例えば、エンコーダがF0V1とF1V2が互いに依存しないと定義し、この時、F1V2の符号化データの生成はF0V1の符号化データに基づく必要がない。
ステップ304において、エンコーダがN個の視角ビデオシーケンスにそれぞれ符号化を行って、N組の符号化データを得る。
エンコーダが各視角ビデオシーケンスに符号化を行って、対応する1組の符号化データを得る。例えば、エンコーダが視角ビデオシーケンスF0V0、F1V0…FMV0に符号化を行って、1組の符号化データを得て、視角ビデオシーケンスF0V1、F1V1…FMV1に符号化を行って、1組の符号化データを得て、視角ビデオシーケンスF0V2、F1V2…FMV2に符号化を行って、1組の符号化データを得る。
尚、エンコーダが複数のユーザにパノラマビデオの符号化データを提供する場合、エンコーダはN個の視角ビデオシーケンスの符号化データを予めて全部得て、異なるユーザの観賞視角に応じて、対応する視角ビデオシーケンスの符号化データを異なるユーザに提供することができる。エンコーダが一つのユーザのみにパノラマビデオの符号化データを提供する場合、該ユーザの観賞視角に応じて、エンコーダが対応する視角ビデオシーケンスのみに符号化を行って、符号化したデータを該ユーザに提供することで、リソースを節約することもできる。
ステップ305において、デコーダがエンコーダにユーザの観賞視角を提供する。
デコーダがまず、ユーザの観賞視角を取得して、該観賞視角をエンコーダを送信する。ここで、デコーダがユーザ機器における姿勢センサーによって得たユーザの頭部の回転角度に基づいて観賞視角を取得することができ、ユーザが入力した観賞視角を取得することもでき、本実施例において限定しない。
ステップ306において、エンコーダが、ユーザの観賞視角を確定する。
エンコーダが、デフォルトの観賞視角を取得して、該観賞視角をユーザの観賞視角とすることができ、この時、ステップ305を実行しないことができ、又は、エンコーダがデコーダから送信の観賞視角を受信することもでき、この時、ステップ305を実行しなければならない。
ステップ307において、エンコーダが、水平視角が観賞視角を含む視角ビデオシーケンスを選択し、該視角ビデオシーケンスの符号化データをユーザに提供する。
エンコーダが、観賞視角を含む一つの水平視角のみを選択することができる。例えば、ユーザの観賞視角が15°〜165°である場合、水平視角が15°〜165°である視角ビデオシーケンスがあると、水平視角が15°〜165°である視角ビデオシーケンスを選択することができ、水平視角が15°〜165°である視角ビデオシーケンスがなく、水平視角が10°〜180°であるビデオシーケンスのみであると、水平視角が10°〜180°である視角ビデオシーケンスを選択することができる。
エンコーダが少なくとも二つの隣接する水平視角を選択することもでき、該少なくとも二つの隣接する水平視角を組み合わせた水平視角は観賞視角を含む。例えば、ユーザの観賞視角が15°〜165°である場合、水平視角が10°〜95°である視角ビデオシーケンスと水平視角が95°〜170°である視角ビデオシーケンスがあると、当該二つの視角ビデオシーケンスを選択することができ、ここで、組み合わせた水平視角は10°〜170°で、15°〜165°の観賞視角を含む。
エンコーダは、視角ビデオシーケンスを確定した後、該視角ビデオシーケンスに対応する符号化データを取得して、該符号化データをユーザに提供する。
本実施例において、エンコーダは、符号化データの生成時刻の早い順で、各組の符号化データを順にユーザに提供することができる。例えば、視角ビデオシーケンスがF0V0、F1V0…FMV0である場合、エンコーダは時刻TでF0V0の符号化データをユーザに提供し、時刻TでF1V0の符号化データをユーザに提供し、…、時刻TでFMV0の符号化データをユーザに提供する。
ステップ308において、デコーダが、エンコーダから送信された符号化データを受信する。
エンコーダによる符号化データの送信形態に対応して、デコーダは符号化データの送信順で、視角ビデオシーケンス中の各領域の符号化データを順に受信することができる。
例えば、視角ビデオシーケンスがF0V0、F1V0…FMV0である場合、デコーダは、時刻TでF0V0の符号化データを受信し、時刻TでF1V0の符号化データを受信し、…、時刻TでFMV0の符号化データを受信することができる。
ユーザが観賞中に頭部を回転して、観賞視角が変化する場合があって、この時、エンコーダは、変化後の観賞視角を確定して、変化後の観賞視角に基づいて送信する符号化データを調整しなければならない。具体的に、本実施例で提供するビデオ符号化方法は、
1)時刻T(iは正整数である。)でユーザの観賞視角が変化したと確定した場合、視角ビデオシーケンス中の第i個の領域の符号化データの送信を禁止することと、
2)水平視角が変化後の観賞視角に合う視角ビデオシーケンスである更新視角ビデオシーケンスを選択し、更新視角ビデオシーケンス中の第i個の領域の符号化データをユーザに提供することと、
3)iをi+1に更新し、時刻Tで、更新視角ビデオシーケンス中の第i個の領域の符号化データをユーザに提供するステップを循環的に実行することとを更に含む。
ここで、時刻Tはエンコーダがユーザの観賞時間が変更されたと確定した時刻で、観賞視角の変化をエンコーダに通知するに時間が必要があるので、実際にユーザの観賞視角が変化した時刻は時刻Tより早いことがあり、時刻Ti−1、時刻Ti−2等であることができ、これは通知の伝送遅延によって決められる。例えば、ユーザが時刻Ti−1で観賞視角を調整すると、デコーダは時刻Ti−1で観賞視角の変化を確定し、この時、エンコーダに通知し、エンコーダは時刻Tで観賞視角が変化したと確定する。
実際に実現する場合、T時刻でユーザの観賞視角に基づいて確定した視角ビデオシーケンスがF0V0、F1V0…FMV0であると、エンコーダは各領域の符号化データを順に送信し、エンコーダが時刻Tでユーザの観賞視角が変化したと確定し、変化後の観賞視角に基づいて確定した更新視角ビデオシーケンスがF0V1、F1V1…FMV1であると、順に送信された符号化データに対応する領域は、F0V0、F1V0、F2V0、F3V1、F4V1…FMV1である。
本実施例において、各視角ビデオシーケンス内の各領域は時間領域で互いに依存し、即ち、視角ビデオシーケンスにおける後ろの領域の復号化はIDR(Instantaneous Decoding Refresh、即時的復号化リフレッシュ)フレームから開始する全ての前方向領域に依存する。観賞視角が変化した場合、デコーダは更新視角ビデオシーケンス中の一つの領域の符号化データのみを受信し、該領域の復号化を前方向領域に依存して行わなければならないので、エンコーダは該領域の全ての前方向領域の符号化データをデコーダに送信しなければならない。該前方向領域を伝送する時間を節約し、放送途切れ問題を回避するため、エンコーダはさらに、観賞視角が変化する時の可能な更新視角ビデオシーケンスを予測し、該予測した更新視角ビデオシーケンスの符号化データをデコーダに送信することもできる。
ユーザは通常ゆっくり頭部を回転して観賞視角を調整するので、ステップ307で選択した視角ビデオシーケンスに隣り合う視角ビデオシーケンスを予測した更新視角ビデオシーケンスとすることができ、この時、ステップ309を実行する。
ステップ309において、エンコーダが、該水平視角に隣り合い、且つ該水平視角未満の連続するn個の水平視角に対応する視角ビデオシーケンスを取得し、該水平視角に隣り合い、且つ該水平視角よりも大きい連続するm(nとmはいずれも正整数で、且つn+m≦N−1である。)個の水平視角に対応する視角ビデオシーケンスを取得し、該n+m個の視角ビデオシーケンス中の同一のパノラマ画像フレームに属する各n+m個の領域の符号化データを順にユーザを提供する。
例えば、4個の視角ビデオシーケンスの水平視角がそれぞれ0°〜15°、15°〜165°、165°〜180°、180°〜360°で、且つステップ307で水平視角が15°〜165°である視角ビデオシーケンスF0V1、F1V1…FMV1を選択したとすると、この時、15°〜165°未満であって、且つ15°〜165°に隣り合う水平視角が0°〜15°であると確定して、水平視角が0°〜15°である視角ビデオシーケンスF0V0、F1V0…FMV0を取得し、さらに、15°〜165°を超えて、且つ15°〜165°に隣り合う水平視角が165°〜180°であると確定して、水平視角が165°〜180°である視角ビデオシーケンスF0V2、F1V2…FMV2を取得することができる。
n+m個の視角ビデオシーケンスを確定した後、エンコーダは、各時刻において、n+m個の視角ビデオシーケンス中の同一のパノラマ画像フレームに属するn+m個の領域の符号化データをユーザに提供する。例えば、時刻Tで、パノラマ画像フレーム0に属するn+m個の領域の符号化データ、即ち、F0V0とF0V2の符号化データををユーザに提供し、時刻Tで、パノラマ画像フレーム1に属するn+m個の領域の符号化データ、即ち、F1V0とF1V2の符号化データをユーザに提供し、…、時刻Tで、パノラマ画像フレームMに属するn+m個の領域の符号化データ、即ち、FMV0とFMV2の符号化データをユーザに提供する。
尚、エンコーダは、n+m個の視角ビデオシーケンスの符号化データとステップ307中の符号化データとを一緒にユーザに提供して、視角変換時の途切れを回避することもできる。例えば、時刻Tで、F0V0、F0V1、F0V2の符号化データをユーザに提供し、時刻Tで、F1V0、F1V1、F1V2の符号化データをユーザに提供し、…、時刻Tで、FMV0、FMV1、FMV2の符号化データをユーザに提供する。
本実施例において、エンコーダが観賞視角に合う視角ビデオシーケンスの符号化データのみを提供すると、この時、伝送が占める帯域幅リソースが少なく、ユーザの観賞視角が変化すると、他の視角ビデオシーケンスも伝送しなければならないので、放送が途切れる問題が発生する。エンコーダが観賞視角に合う視角ビデオシーケンスの符号化データを伝送しつつ、n+m個の他の視角ビデオシーケンスの符号化データも伝送すると、伝送が占める帯域幅リソースは多くなるが、ユーザの観賞視角が変化した時、直ちにバッファリングした視角ビデオシーケンスを放送して、ビデオの放送がスムーズになる。
n+m<N−1である場合、全てのパノラマビデオの符号化データを伝送する必要がないので、帯域幅リソースを節約できる。
図3Dの伝送する視角ビデオシーケンス中の各領域を示す図を参照すると、図3Dにおいて、T時刻で観賞視角に対応する視角ビデオシーケンスはVで、T時刻でバッファリングした視角ビデオシーケンスはVn−1とVn+1である。T時刻でエンコーダがユーザの観賞視角が変化したと確定すると、この時、観賞視角に対応する視角ビデオシーケンスはVn−1で、T時刻でバッファリングした視角ビデオシーケンスはVn−2とVである。
ステップ310において、デコーダが、n+m個の視角ビデオシーケンス中の同一のパノラマ画像フレームに属する各n+m個の領域の符号化データを順に受信する。
エンコーダによる符号化データの送信形態に対応して、デコーダは、符号化データの送信順に応じて、n+m個の視角ビデオシーケンス中の同一のパノラマ画像フレームに属する各n+m個の領域の符号化データを順に受信する。
例えば、デコーダは、時刻TでF0V0とF0V2の符号化データを受信し、時刻TでF1V0とF1V2の符号化データを受信し、…、時刻TでFMV0とFMV2の符号化データを受信する。
エンコーダが、n+m個の視角ビデオシーケンスの符号化データとステップ307中の符号化データとを一緒にユーザに提供する場合、ステップ310をステップ308と合併することができる。即ち、デコーダは、時刻TでF0V0、F0V1とF0V2の符号化データを受信し、時刻TでF1V0、F1V1とF1V2の符号化データを受信し、…、時刻Tで受信FMV0、FMV1とFMV2の符号化データを受信することができる。
ステップ311において、デコーダは、符号化データに復号化を行う。
本実施例において、n+m個の視角ビデオシーケンス中の同一のパノラマ画像フレームに属する各n+m個の領域の符号化データを順に受信した後、エンコーダは2種類の符号化データの処理方式を提供し、以下、2種類の処理方式をそれぞれ説明する。
第1種の処理方式において、現在時刻で受信した水平視角が観賞視角に合う視角ビデオシーケンス中の領域の符号化データに復号化を行い、得られた領域を放送し、現在時刻で受信したn+m個の視角ビデオシーケンス中のn+m個の領域の符号化データをバッファリングする。
観賞視角に対応する領域の符号化データのみに復号化を行い、他の領域の符号化データには復号化を行う必要がないので、リソースを節約することができ、当該処理方式は、観賞視角の変化が少ないシーンに応用できる。
例えば、現在時刻はT時刻で、且つ観賞視角に対応する領域がF0V1であると、デコーダは、F0V1の符号化データを復号化して放送し、F0V0とF0V2の領域の符号化データをバッファリングする。この時、F0V0とF0V2の領域の符号化データの復号化を行う必要がないので、リソースを節約できる。
時刻Tで、デコーダがユーザの観賞視角が変化したと確定すると、第1種の処理方式に対応して、デコーダは、バッファリングしたn+m個の領域の符号化データから、更新視角ビデオシーケンス中の第i個の領域の符号化データを選択して、符号化データに復号化を行って、得られた第i個の領域を放送する。
例えば、T時刻で、観賞視角に対応する視角ビデオシーケンスがVであると、この時、デコーダはF0V1、F0V2とF0V3の符号化データを受信し、F0V2を放送する。T時刻で、デコーダはユーザの観賞視角が変化したと確定し、この時エンコーダはユーザの観賞視角の変化が知らないので、F1V1、F1V2とF1V3の符号化データを伝送し、この時、デコーダはF1V1、F1V2とF1V3の符号化データを受信し、F1V1の復号化がF0V1に基づいて行わなければならないので、デコーダはまずF0V1の符号化データを復号化し、その後得られたF0V1に基づいてF1V1の符号化データを復号化して、得られたF1V1を放送する。T時刻で、エンコーダはユーザの観賞視角が変化したと確し、F2V0、F2V1とF2V2の符号化データを伝送し、この時、デコーダはF2V0、F2V1とF2V2の符号化データを受信し、その前に復号化して得たF1V1に基づいてF2V1の符号化データを復号化して、得られたF2V1を放送し、その後も類似に処理する。
第2種の処理方式において、現在時刻で受信した、水平視角が観賞視角に合う視角ビデオシーケンス中の領域の符号化データに復号化を行って、得られた領域を放送し、現在時刻で受信したn+m個の視角ビデオシーケンス中のn+m個の領域の符号化データに復号化を行って、得られたn+m個の領域をバッファリングする。
例えば、現在時刻がT時刻で、且つ観賞視角に対応する領域がF0V1であると、デコーダは、F0V1の符号化データを復号化して放送し、F0V0とF0V2の符号化データを復号化してバッファリングする。
時刻Tでユーザの観賞視角が変化すると、第2種の処理方式に対応して、デコーダが、バッファリングしたn+m個の領域から更新視角ビデオシーケンス中の第i個の領域を選択して、第i個の領域を放送する。
例えば、T時刻で観賞視角に対応する視角ビデオシーケンスがVであると、この時、デコーダは、F0V1、F0V2とF0V3の符号化データを受信して復号化し、F0V2を放送する。T時刻で、デコーダがユーザの観賞視角が変化したと確定し、この時エンコーダはまだユーザの観賞視角の変化を知らないので、F1V1、F1V2とF1V3の符号化データを伝送し、この時、デコーダはF1V1、F1V2とF1V3の符号化データを受信し、F1V1の復号化にF0V1が必要であって、すでに復号化してF0V1を得たので、デコーダは直接にF0V1に基づいてF1V1の符号化データを復号化して、得られたF1V1を放送することができる。T時刻で、エンコーダはユーザの観賞視角が変化したと確定し、F2V0、F2V1とF2V2の符号化データを伝送し、この時、デコーダはF2V0、F2V1とF2V2の符号化データを受信し、F1V1に基づいてF2V1の符号化データを復号化して、得られたF2V1を放送し、その後も類似に処理する。
全ての領域の符号化データをリアルタイムに復号化して放送の流暢性を向上させるので、このような実現方式は観賞視角の変化が多いシーンに応用できる。
ここで、ステップ301、302、303、304、306、307、309をエンコーダ側の実施例として単独に実現することができ、ステップ305、308、310、311をデコーダ側の実施例として単独に実現することができる。
簡単に理解するように、本実施例でエンコーダがパノラマカメラに位置し、デコーダがユーザ機器に位置し、且つサーバーがある場合を例に説明し、図3Eのビデオ符号化方法を示す図でを参照すると、具体的な実現フローはステップ3011〜ステップ3020を含む。
ステップ3011において、パノラマカメラが、カメラによってパノラマビデオを撮影する。
ステップ3012において、パノラマカメラが、エンコーダによってパノラマビデオをN個の視角ビデオシーケンスに分割して符号化を行って、N組の符号化データを得る。
ステップ3013において、パノラマカメラが、N組の符号化データをサーバーに送信する。
ステップ3014において、サーバーが、N組の符号化データを受信する。
ステップ3015において、ユーザ機器が、サーバーにユーザの観賞視角を送信する。
ステップ3016において、サーバーが、ユーザの観賞視角を受信する。
ステップ3017において、サーバーが、水平視角が観賞視角を含む視角ビデオシーケンスを選択し、その他のn+m個の視角ビデオシーケンスを取得する。
ここで、n+m個の視角ビデオシーケンスを取得するプロセスはステップ309での説明を参照できる。
ステップ3018において、サーバーが、該視角ビデオシーケンスと該n+m個の視角ビデオシーケンスの符号化データをユーザ機器に送信する。
ステップ3019において、ユーザ機器が、該視角ビデオシーケンスと該n+m個の視角ビデオシーケンスの符号化データを受信する。
ステップ3020において、ユーザ機器が、デコーダによって水平視角が観賞視角に合う視角ビデオシーケンスの符号化データを復号化し、得られた視角ビデオシーケンスを放送し、n+m個の視角ビデオシーケンスの符号化データをバッファリングする。
上述のように、本発明の実施例で提供するビデオ符号化方法によると、パノラマビデオをN個の視角ビデオシーケンスに分割し、該N個の視角ビデオシーケンスにそれぞれ符号化を行って、N組の符号化データを得て、ユーザの観賞視角を確定し、水平視角が観賞視角を含む視角ビデオシーケンスを選択し、視角ビデオシーケンスの符号化データをユーザに提供することで、ユーザの観賞視角内の視角ビデオシーケンスの符号化データのみをユーザに提供し、観賞視角外の視角ビデオシーケンスの符号化データの伝送や復号化を回避し、パノラマビデオ中の全てのパノラマ画像フレームの符号化データを受信して復号化してリソースを浪費する問題を解決し、リソースを節約する効果を実現できる。
そして、水平視角に隣り合い、且つ水平視角未満の連続するn個の水平視角に対応する視角ビデオシーケンスを取得し、また、水平視角に隣り合い、且つ水平視角よりも大きい連続するm個の水平視角に対応する視角ビデオシーケンスを取得し、前記n+m個の視角ビデオシーケンス中の同一のパノラマ画像フレームに属するの各n+m個の領域の符号化データを順にユーザに提供することで、水平視角が観賞視角に隣り合う視角ビデオシーケンスの符号化データをユーザに提供して、観賞視角が変化する時、デコーダが直ちに、バッファリングされた符号化データから対応する符号化データを取得することができ、観賞視角が変化した時、エンコーダが水平視角が変化後の観賞視角に合う視角ビデオシーケンスの符号化データをデコーダに伝送しなければならないので放送に途切れが発生する問題を解決し、ビデオの放送の流暢性を向上させる効果を実現できる。
図4を参照すると、本発明の一実施例で提供するビデオ符号化装置の構成を示すブロック図で、該ビデオ符号化方法を図1に示す実施環境に応用できる。該ビデオ符号化装置は、ビデオ取得モジュール410と、ビデオ分割モジュール420と、ビデオ符号化モジュール430と、第1の提供モジュール450と、を含む。
ビデオ取得モジュール410は、パノラマビデオを取得するように構成され、パノラマビデオはパノラマ画像フレームからなり、パノラマ画像フレームは所定の視角の風物を記録して形成された画像フレームである。
ビデオ分割モジュール420は、ビデオ取得モジュール410が取得したパノラマビデオをN個の視角ビデオシーケンスに分割するように構成され、各視角ビデオシーケンスはパノラマビデオ中の全てのパノラマ画像フレームにおける同一の水平視角を有する領域からなり、且つN個の視角ビデオシーケンスの水平視角の総和はパノラマ画像フレームの総水平視角で、Nは正整数であって、ここで、一つのパノラマ画像フレーム中の各領域は互いに重ならない。
ビデオ符号化モジュール430は、ビデオ分割モジュール420で得たN個の視角ビデオシーケンスにそれぞれ符号化を行って、N組の符号化データを得るように構成される。
視角確定モジュール440は、ユーザの観賞視角を確定するように構成される。
第1の提供モジュール450は、水平視角が視角確定モジュール440が確定した観賞視角を含む視角ビデオシーケンスを選択し、視角ビデオシーケンスの符号化データをユーザに提供するように構成される。
上述のように、本発明の実施例で提供するビデオ符号化装置によると、パノラマビデオをN個の視角ビデオシーケンスに分割し、該N個の視角ビデオシーケンスにそれぞれ符号化を行って、N組の符号化データを得て、ユーザの観賞視角を確定し、水平視角が観賞視角を含む視角ビデオシーケンスを選択し、視角ビデオシーケンスの符号化データをユーザに提供することで、ユーザの観賞視角内の視角ビデオシーケンスの符号化データのみをユーザに提供して、観賞視角外の視角ビデオシーケンスの符号化データの伝送や復号化を回避し、パノラマビデオ中の全てのパノラマ画像フレームの符号化データを受信して復号化してリソースを浪費する問題を解決し、リソースを節約する効果を実現できる。
図5を参照すると、本発明の他の一実施例で提供するビデオ符号化装置の構成を示すブロック図で、該ビデオ符号化方法を図1に示す実施環境に応用できる。該ビデオ符号化装置は、ビデオ取得モジュール510と、ビデオ分割モジュール520と、ビデオ符号化モジュール530と、視角確定モジュール540と、第1の提供モジュール550と、を含む。
ビデオ取得モジュール510は、パノラマビデオを取得するように構成され、パノラマビデオはパノラマ画像フレームからなり、パノラマ画像フレームは所定の視角の風物を記録して形成された画像フレームである。
ビデオ分割モジュール520は、ビデオ取得モジュール510が取得したパノラマビデオをN個の視角ビデオシーケンスに分割するように構成され、各視角ビデオシーケンスはパノラマビデオ中の全てのパノラマ画像フレームにおける同一の水平視角を有する領域からなり、且つN個の視角ビデオシーケンスの水平視角の総和はパノラマ画像フレームの総水平視角で、Nは正整数であって、ここで、一つのパノラマ画像フレーム中の各領域は互いに重ならない。
ビデオ符号化モジュール530は、ビデオ分割モジュール520で得たN個の視角ビデオシーケンスにそれぞれ符号化を行って、N組の符号化データを得るように構成される。
視角確定モジュール540は、ユーザの観賞視角を確定するように構成される。
第1の提供モジュール550は、水平視角が視角確定モジュール540が確定した観賞視角を含む視角ビデオシーケンスを選択し、視角ビデオシーケンスの符号化データをユーザに提供するように構成される。
本発明の他の実施例において、ビデオ分割モジュール520は、領域分割ユニット521と、シーケンス生成ユニット522と、を含む。
領域分割ユニット521は、予め設定された視角分割ルールに従って、パノラマビデオ中の各パノラマ画像フレームを水平視角に基づいてN個の領域に分割するように構成される。
シーケンス生成ユニット522は、領域分割ユニット521が分割した全てのパノラマ画像フレームにおける同一の水平視角を有する領域で一つの視角ビデオシーケンスを構成して、N個の視角ビデオシーケンスを得るように構成される。
本発明の他の実施例において、第1の提供モジュール540はさらに、
時刻T(iは正整数である。)でユーザの観賞視角が変化したと確定すると、視角ビデオシーケンス中の第i個の領域の符号化データの送信を禁止し、
水平視角が変化後の観賞視角に合う視角ビデオシーケンスである更新視角ビデオシーケンスを選択し、更新視角ビデオシーケンス中の第i個の領域の符号化データをユーザに提供し、
iをi+1に更新し、時刻Tで、更新視角ビデオシーケンス中の第i個の領域の符号化データをユーザに提供するステップを循環的に実行するように構成される。
本発明の他の実施例において、本実施例で提供するビデオ符号化装置は、シーケンス選択モジュール560と、第2の提供モジュール570と、をさらに含む。
シーケンス選択モジュール560は、第1の提供モジュール550が水平視角が観賞視角に合う視角ビデオシーケンスを選択した後、水平視角に隣り合い、且つ水平視角未満の連続するn個の水平視角に対応する視角ビデオシーケンスを取得し、水平視角に隣り合い、且つ水平視角よりも大きい連続するm個の水平視角に対応する視角ビデオシーケンスを取得するように構成され、nとmはいずれも正整数で、且つn+m≦N−1である。
第2の提供モジュール570は、シーケンス選択モジュール560が選択したn+m個の視角ビデオシーケンス中の同一のパノラマ画像フレームに属する各n+m個の領域の符号化データをユーザに提供するように構成される。
本発明の他の実施例において、各視角ビデオシーケンスにおいて、第j個の領域の符号化データは第j−1個の領域の符号化データに基づいて生成されるものであって、又は、第j個の領域の符号化データは第j−1個の領域の符号化データと第l個の領域の符号化データに基づいて生成されるものであって、jとlはいずれも正整数で、且つl>j≧2である。
異なる視角ビデオシーケンスにおいて、任意の二つの領域の符号化データは時間領域で関係ない。
本発明の他の実施例において、領域が少なくとも二つのマクロブロックを含む場合、
各領域において、一つのマクロブロックの符号化データはそれと空間領域内で隣り合うマクロブロックの符号化データに基づいて生成される。
異なる領域において、空間領域内で隣り合う二つのマクロブロックの符号化データは関係ない。
上述のように、本発明の実施例で提供するビデオ符号化装置によると、パノラマビデオをN個の視角ビデオシーケンスに分割し、該N個の視角ビデオシーケンスにそれぞれ符号化を行って、N組の符号化データを得て、ユーザの観賞視角を確定し、水平視角が観賞視角を含む視角ビデオシーケンスを選択し、視角ビデオシーケンスの符号化データをユーザに提供することで、ユーザの観賞視角内の視角ビデオシーケンスの符号化データのみをユーザに提供して、観賞視角外の視角ビデオシーケンスの符号化データの伝送や復号化を回避し、パノラマビデオ中の全てのパノラマ画像フレームの符号化データを受信して復号化してリソースを浪費する問題を解決し、リソースを節約する効果を実現できる。
そして、水平視角に隣り合い、且つ水平視角未満の連続するn個の水平視角に対応する視角ビデオシーケンスを取得し、水平視角に隣り合い、且つ水平視角よりも大きい連続するm個の水平視角に対応する視角ビデオシーケンスを取得し、前記n+m個の視角ビデオシーケンス中の同一のパノラマ画像フレームに属する各n+m個の領域の符号化データを順にユーザに提供することで、水平視角が観賞視角に隣り合う視角ビデオシーケンスの符号化データをユーザに提供し、観賞視角が変化する時、デコーダが直ちにバッファリングされた符号化データから対応する符号化データを取得し、観賞視角が変化した時、エンコーダが水平視角が変化後の観賞視角に合う視角ビデオシーケンスの符号化データをデコーダに伝送しなければならないので放送に途切れが発生する問題を解決し、ビデオの放送の流暢性を向上させる効果を実現できる。
図6を参照すると、本発明の一実施例で提供するビデオ符号化装置の構成を示すブロック図で、該ビデオ符号化方法を図1に示す実施環境に応用できる。該ビデオ符号化装置は、視角提供モジュール610と、第1の受信モジュール620と、データ復号化モジュール630と、を含む。
視角提供モジュール610は、所定の視角の風物を記録して形成された画像フレームであるパノラマ画像フレームからなるパノラマビデオを取得し、パノラマビデオを、それぞれパノラマビデオ中の全てのパノラマ画像フレームにおける同一の水平視角を有する領域からなり、水平視角の総和がパノラマ画像フレームの総水平視角であるN(Nは正整数である。)個の視角ビデオシーケンスに分割し、前記N個の視角ビデオシーケンスにそれぞれ符号化を行ってN組の符号化データを得、水平視角が観賞視角を含む視角ビデオシーケンスを選択して視角ビデオシーケンスの符号化データをユーザに提供するように構成されたエンコーダにユーザの観賞視角を提供するように構成され、ここで、一つのパノラマ画像フレーム中の各領域は互いに重ならない。
第1の受信モジュール620は、エンコーダから送信された符号化データを受信するように構成される
データ復号化モジュール630は、第1の受信モジュール620が受信した前記符号化データに復号化を行うように構成される。
上述のように、本発明の実施例で提供するビデオ符号化装置によると、エンコーダにユーザの観賞視角を提供して、エンコーダがパノラマビデオをN個の視角ビデオシーケンスに分割し、該N個の視角ビデオシーケンスにそれぞれ符号化を行って、N組の符号化データを得て、水平視角が観賞視角を含む視角ビデオシーケンスを選択し、視角ビデオシーケンスの符号化データをユーザに提供することで、観賞視角外の視角ビデオシーケンスの符号化データの伝送や復号化を回避し、パノラマビデオ中の全てのパノラマ画像フレームの符号化データを受信して復号化してリソースを浪費する問題を解決し、リソースを節約する効果を実現できる。
図7を参照すると、本発明の他の一実施例で提供するビデオ符号化装置の構成を示すブロック図で、該ビデオ符号化方法を図1に示す実施環境に応用できる。該ビデオ符号化装置は、視角提供モジュール710と、第1の受信モジュール720と、データ復号化モジュール730と、第2の受信モジュール740と、を含む。
視角提供モジュール710は、所定の視角の風物を記録して形成された画像フレームであるパノラマ画像フレームからなるパノラマビデオを取得し、パノラマビデオを、それぞれパノラマビデオ中の全てのパノラマ画像フレームにおける同一の水平視角を有する領域からなり、水平視角の総和がパノラマ画像フレームの総水平視角であるN(Nは正整数である。)個の視角ビデオシーケンスに分割し、N個の視角ビデオシーケンスにそれぞれ符号化を行ってN組の符号化データを得、水平視角が観賞視角を含む視角ビデオシーケンスを選択して視角ビデオシーケンスの符号化データをユーザに提供するように構成されたエンコーダにユーザの観賞視角を提供するように構成され、ここで、一つのパノラマ画像フレーム中の各領域は互いに重ならない。
第1の受信モジュール720は、エンコーダから送信された符号化データを受信するように構成される。
データ復号化モジュール730は、第1の受信モジュール720が受信した前記符号化データに復号化を行うように構成される。
本発明の他の実施例において、本実施例で提供するビデオ符号化装置は、第2の受信モジュール740をさらに含む。
第2の受信モジュール740は、n+m個の視角ビデオシーケンス中の同一のパノラマ画像フレームに属する各n+m個の符号化データを順に受信するように構成され、n+m個の視角ビデオシーケンスは水平視角に隣り合い、且つ水平視角未満の連続するn個の水平視角に対応する視角ビデオシーケンス、及び、水平視角に隣り合い、且つ水平視角よりも大きい連続するm個の水平視角に対応する視角ビデオシーケンスであって、nとmはいずれも正整数で、且つn+m≦N−1である。
本発明の他の実施例において、データ復号化モジュール730は、第1の処理ユニット731を含む。
第1の処理ユニット731は、現在時刻で受信した水平視角が観賞視角に合う視角ビデオシーケンス中の領域の符号化データに復号化を行って、得られた領域を放送し、現在時刻で受信したn+m個の視角ビデオシーケンス中のn+m個の領域の符号化データをバッファリングするように構成される。
本発明の他の実施例において、データ復号化モジュール730は、第2の処理ユニット732をさらに含む。
第2の処理ユニット732は、時刻Tでユーザの観賞視角が変化すると、第1の処理ユニット731がバッファリングしたn+m個の領域の符号化データから、更新視角ビデオシーケンス中の第i個の領域の符号化データを選択して、符号化データに復号化を行って、得られた第i個の領域を放送するように構成される。
ここで、更新視角ビデオシーケンスは水平視角が変化後の観賞視角に合う視角ビデオシーケンスである。
本発明の他の実施例において、データ復号化モジュール730は、第3の処理ユニット733を含む。
第3の処理ユニット733は、現在時刻で受信した水平視角が観賞視角に合う視角ビデオシーケンス中の領域の符号化データに復号化を行って、得られた領域を放送し、現在時刻で受信したn+m個の視角ビデオシーケンス中のn+m個の領域の符号化データに復号化を行って、得られたn+m個の領域をバッファリングするように構成される。
本発明の他の実施例において、データ復号化モジュール730は第4の処理ユニット734を含む。
第4の処理ユニット734は、時刻Tでユーザの観賞視角が変化すると、第3の処理ユニット733がバッファリングしたn+m個の領域から、更新視角ビデオシーケンス中の第i個の領域を選択して、第i個の領域を放送するように構成される。
ここで、更新視角ビデオシーケンスは水平視角が変化後の観賞視角に合う視角ビデオシーケンスである。
上述のように、本発明の実施例で提供するビデオ符号化装置によると、エンコーダにユーザの観賞視角を提供して、エンコーダがパノラマビデオをN個の視角ビデオシーケンスに分割し、該N個の視角ビデオシーケンスにそれぞれ符号化を行って、N組の符号化データを得て、水平視角が観賞視角を含む視角ビデオシーケンスを選択し、視角ビデオシーケンスの符号化データをユーザに提供することで、観賞視角外の視角ビデオシーケンスの符号化データの伝送や復号化を回避し、パノラマビデオ中の全てのパノラマ画像フレームの符号化データを受信して復号化してリソースを浪費する問題を解決し、リソースを節約する効果を実現できる。
そして、n+m個の視角ビデオシーケンス中の同一のパノラマ画像フレームに属する各n+m個の領域の符号化データを順に受信し、n+m個の視角ビデオシーケンスはエンコーダが取得した水平視角に隣り合い且つ水平視角未満の連続するn個の水平視角に対応する視角ビデオシーケンス、及び、エンコーダが取得した水平視角に隣り合い且つ水平視角よりも大きい連続するm個の水平視角に対応する視角ビデオシーケンスであって、エンコーダが水平視角が観賞視角に隣り合う視角ビデオシーケンスの符号化データをユーザに提供することで、観賞視角が変化した場合、デコーダが直ちにバッファリングされた符号化データから対応する符号化データを取得して、観賞視角が変化した時、エンコーダが水平視角が変化後の観賞視角に合う視角ビデオシーケンスの符号化データをデコーダに伝送しなければならないので放送に途切れが発生する問題を解決し、ビデオの放送の流暢性を向上させる効果を実現できる。
本発明の実施例においてビデオ符号化装置が含むビデオ取得モジュール、ビデオ分割モジュール、ビデオ符号化モジュール、視角確定モジュール、第1の提供モジュール等手段、及び各手段に含まれる各ユニットをすべてエンコーダ中のプロセッサによって実現することができる。本発明の実施例においてビデオ符号化装置が含む視角提供モジュール、第1の受信モジュールとデータ復号化モジュール等手段及び各手段に含まれる各ユニットをすべてデコーダ中のプロセッサによって実現することができる。ここで、プロセッサで実現する機能を論理回路によって実現することができ、実施中において、プロセッサは中央処理装置(CPU)、マイクロプロセッサ(MPU)、デジタルシグナルプロセッサ(DSP)又は現場でプログラム可能なゲートアレイ(FPGA)等であることができる。
尚、本発明の実施例において、ソフトウェア機能モジュールの形態で上述したビデオ符号化方法を実現し、単独の製品として販売又は使用する場合、コンピューターが読み取り可能な記憶媒体に記憶することもできる。従って、本発明の実施例の技術案の実質又は既存技術に対する貢献のある部分をソフトウェア製品の形態で実現することができ、該コンピューターソフトウェア製品を記憶媒体に記憶し、一つのコンピューター機器(パーソナルコンピュータ、サーバ又はネットワーク機器等)に本発明の各実施例で説明した方法の全部又は一部を実行させる命令を含むことができる。上述した記憶媒体は、USB、モバイルハードディスク、読み出し専用メモリ(ROM:Read−Only Memory)、磁気ディスク又は光ディスク等のプログラムコードを記憶できるさまざまな媒体を含む。これにより、本発明の実施例は如何なる特定のハードウェアとソフトウェアの結合に限定されない。
対応して、本発明の実施例でさらにコンピューター記憶媒体を提供し、前記コンピューター記憶媒体に本発明の実施例におけるビデオ符号化方法を実行するためのコンピューターが実行可能な命令が記憶される。
対応して、本発明の実施例によると、所定の視角の風物を記録して形成された画像フレームであるパノラマ画像フレームからなるパノラマビデオを取得することと、
前記パノラマビデオを、それぞれ前記パノラマ画像フレームにおける同一の水平視角を有する領域からなり、水平視角の総和が前記パノラマ画像フレームの総水平視角であるN(Nは正整数である。)個の視角ビデオシーケンスに分割することと、
前記N個の視角ビデオシーケンスにそれぞれ符号化を行って、N組の符号化データを得ることと、
ユーザの観賞視角を確定することと、
水平視角が前記観賞視角を含む視角ビデオシーケンスを選択し、前記視角ビデオシーケンスの符号化データを前記ユーザに提供することと、
を実行するための実行可能な命令を記憶するための第1の記憶媒体と、
記憶された実行可能な命令を実行するように構成された第1のプロセッサと、を含み、
一つのパノラマ画像フレーム中の各領域は互いに重ならないエンコーダを提供する。
対応して、本発明の実施例で符号化・復号化システムを提供し、前記システムは、エンコーダとデコーダとを含み、ここで、前記エンコーダは、
所定の視角の風物を記録して形成された画像フレームであるパノラマ画像フレームからなるパノラマビデオを取得することと、
前記パノラマビデオを、それぞれ前記パノラマ画像フレームにおける同一の水平視角を有する領域からなり、水平視角の総和が前記パノラマ画像フレームの総水平視角であるN(Nは正整数である。)個の視角ビデオシーケンスに分割することと、
前記N個の視角ビデオシーケンスにそれぞれ符号化を行って、N組の符号化データを得ることと、
ユーザの観賞視角を確定することと、
水平視角が前記観賞視角を含む視角ビデオシーケンスを選択し、前記視角ビデオシーケンスの符号化データを前記ユーザに提供することと、
を実行するための実行可能な命令を記憶するための第1の記憶媒体と、
記憶された実行可能な命令を実行するように構成された第1のプロセッサと、を含み、
ここで、一つのパノラマ画像フレーム中の各領域は互いに重ならなく、
デコーダは、所定の視角の風物を記録して形成された画像フレームであるパノラマ画像フレームからなるパノラマビデオを取得し、前記パノラマビデオを、それぞれ前記パノラマビデオ中の全てのパノラマ画像フレームにおける同一の水平視角を有する領域からなり、水平視角の総和が前記パノラマ画像フレームの総水平視角であるN(Nは正整数である。)個の視角ビデオシーケンスに分割し、前記N個の視角ビデオシーケンスにそれぞれ符号化を行ってN組の符号化データを得、水平視角が観賞視角を含む視角ビデオシーケンスを選択して前記視角ビデオシーケンスの符号化データをユーザに提供するように構成されたエンコーダに前記ユーザの前記観賞視角を提供することと、
前記エンコーダから送信された前記符号化データを受信することと、
前記符号化データに復号化を行うことと、
を実行するための実行可能な命令を記憶するための第2の記憶媒体と、
記憶された実行可能な命令を実行するように構成された第2のプロセッサと、を含み、
ここで、一つのパノラマ画像フレーム中の各領域は互いに重ならない。
尚、上記実施例で提供するビデオ符号化装置によるビデオ符号化は、上述した各機能モジュールの分割のみを例に説明したが、実際の応用において、需要に応じて上記機能を異なる機能モジュールに配分して完成させることができ、即ち、ビデオ符号化装置の内部構成を異なる機能モジュールに分割して、上述した機能の全部又は一部を完成することができる。そして、上記実施例で提供するビデオ符号化装置はビデオ符号化方法実施例と同一の構想に属し、その具体的な実現プロセスについては方法実施例を参照することができ、ここでは詳細な説明を省略する。
上記本発明の実施例の番号は説明の便利を図るためのもので、実施例の優劣を示すものではない。
上記実施例中のステップの全部又は一部をハードウェアによって実現することもでき、プログラムによって関連するハードウェアに完成を命令することもでき、当該プログラムをコンピューター読み取り可能な記憶媒体に記憶することができ、上述した記憶媒体は、読み取り専用メモリ、磁気ディスク又は光ディスク等であることができることを当業者は理解できる。
以上は本発明の好適な実施例に過ぎず、本発明を限定するものではなく、本発明の精神や原則内で行う全ての修正、同等置換、改善等はすべて本発明の保護範囲内に含まれる。
本発明の実施例において、パノラマビデオをN個の視角ビデオシーケンスに分割し、該N個の視角ビデオシーケンスにそれぞれ符号化を行って、N組の符号化データを得て、ユーザの観賞視角を確定し、水平視角が観賞視角を含む視角ビデオシーケンスを選択し、視角ビデオシーケンスの符号化データをユーザに提供することで、ユーザの観賞視角内の視角ビデオシーケンスの符号化データのみをユーザに提供し、観賞視角外の視角ビデオシーケンスの符号化データの伝送や復号化を回避し、パノラマビデオ中の全てのパノラマ画像フレームの符号化データを受信して復号化してリソースを浪費する問題を解決し、リソースを節約する効果を実現できる。
101 パノラマカメラ
102 ユーザ機器
103 ユーザ機器
410 ビデオ取得モジュール
420 ビデオ分割モジュール
430 ビデオ符号化モジュール
440 視角確定モジュール
450 視角確定モジュール
510 ビデオ取得モジュール
520 ビデオ分割モジュール
521 領域分割ユニット
522 シーケンス生成ユニット
530 ビデオ符号化モジュール
540 視角確定モジュール
550 第1の提供モジュール
560 シーケンス選択モジュール
570 第2の提供モジュール
610 視角提供モジュール
620 第1の受信モジュール
630 データ復号化モジュール
710 視角提供モジュール
720 第1の受信モジュール
730 データ復号化モジュール
731 第1の処理ユニット
732 第2の処理ユニット
733 第3の処理ユニット
734 第4の処理ユニット
740 第2の受信モジュール

Claims (26)

  1. 所定の視角の風物を記録して形成された画像フレームであるパノラマ画像フレームからなるパノラマビデオを取得することと、
    前記パノラマビデオを、それぞれ前記パノラマ画像フレームにおける同一の水平視角を有する領域からなり、水平視角の総和が前記パノラマ画像フレームの総水平視角であるN(Nは正整数である。)個の視角ビデオシーケンスに分割することと、
    前記N個の視角ビデオシーケンスにそれぞれ符号化を行って、N組の符号化データを得ることと、
    ユーザの観賞視角を確定することと、
    水平視角が前記観賞視角を含む視角ビデオシーケンスを選択して、前記視角ビデオシーケンスの符号化データを前記ユーザに提供することと、を含み、
    一つのパノラマ画像フレーム中の各領域は互いに重ならない、ビデオ符号化方法。
  2. 前記パノラマビデオをN個の視角ビデオシーケンスに分割することは、
    予め設定された視角分割ルールに従って、前記パノラマビデオ中の各パノラマ画像フレームを水平視角に基づいてN個の領域に分割することと、
    全てのパノラマ画像フレームにおける同一の水平視角を有する領域で一つの視角ビデオシーケンスを構成して、前記N個の視角ビデオシーケンスを得ることと、を含む請求項1に記載の方法。
  3. 時刻T(iは正整数である)で前記ユーザの観賞視角が変化したと確定すると、前記視角ビデオシーケンス中の第i個の領域の符号化データの送信を禁止することと、
    水平視角が変化後の前記観賞視角に合う視角ビデオシーケンスである更新視角ビデオシーケンスを選択し、前記更新視角ビデオシーケンス中の第i個の領域の符号化データを前記ユーザに提供することと、
    iをi+1に更新し、時刻Tで、前記更新視角ビデオシーケンス中の第i個の領域の符号化データを前記ユーザに提供するステップを循環的に実行することと、をさらに含む請求項1に記載の方法。
  4. 前記水平視角が前記観賞視角を含む視角ビデオシーケンスを選択した後、
    前記水平視角に隣り合い、且つ前記水平視角未満の連続するn個の水平視角に対応する視角ビデオシーケンスを取得し、前記水平視角に隣り合い、且つ前記水平視角よりも大きい連続するm(nとmはいずれも正整数で、且つn+m≦N−1である。)個の水平視角に対応する視角ビデオシーケンスを取得することと、
    前記n+m個の視角ビデオシーケンス中の、同一のパノラマ画像フレームに属する各n+m個の領域の符号化データを順に前記ユーザに提供することと、をさらに含む請求項1乃至3の中のいずれかに記載の方法。
  5. 各視角ビデオシーケンスにおいて、第j個の領域の符号化データは第j−1個の領域の符号化データに基づいて生成されるか、或いは、第j個の領域の符号化データは第j−1(jとlはいずれも正整数で、且つl>j≧2である)個の領域の符号化データと第l個の領域の符号化データに基づいて生成され、
    異なる視角ビデオシーケンス間で、任意の二つの領域の符号化データは時間領域で関係ない請求項1に記載の方法。
  6. 前記領域が少なくとも二つのマクロブロックを含む場合、
    各領域において、一つのマクロブロックの符号化データは空間領域内で隣り合うマクロブロックの符号化データに基づいて生成され、
    異なる領域間において、空間領域内で隣り合う二つのマクロブロックの符号化データは関係ない請求項1に記載の方法。
  7. 所定の視角の風物を記録して形成された画像フレームであるパノラマ画像フレームからなるパノラマビデオを取得し、前記パノラマビデオを、それぞれ前記パノラマビデオ中の全てのパノラマ画像フレームにおける同一の水平視角を有する領域からなり、水平視角の総和が前記パノラマ画像フレームの総水平視角であるN(Nは正整数である。)個の視角ビデオシーケンスに分割し、前記N個の視角ビデオシーケンスにそれぞれ符号化を行ってN組の符号化データを得、水平視角が観賞視角を含む視角ビデオシーケンスを選択して前記視角ビデオシーケンスの符号化データをユーザに提供するように構成されたエンコーダに前記ユーザの前記観賞視角を提供することと、
    前記エンコーダから送信された前記符号化データを受信することと、
    前記符号化データに復号化を行うことと、を含み、
    一つのパノラマ画像フレーム中の各領域は互いに重ならないビデオ符号化方法。
  8. n+m(nとmはいずれも正整数で、且つn+m≦N−1である。)個の視角ビデオシーケンス中の、同一のパノラマ画像フレームに属する各n+m個の領域の符号化データを順に受信することをさらに含み、
    前記n+m個の視角ビデオシーケンスは前記水平視角に隣り合い、且つ前記水平視角未満の連続するn個の水平視角に対応する視角ビデオシーケンス、及び、前記水平視角に隣り合い、且つ前記水平視角よりも大きい連続するm個の水平視角に対応する視角ビデオシーケンスである請求項7に記載の方法。
  9. 前記符号化データに復号化を行うことは、
    現在時刻で受信された、水平視角が前記観賞視角に合う視角ビデオシーケンス中の領域の符号化データに復号化を行って、得られた前記領域を放送することと、
    前記現在時刻で受信された前記n+m個の視角ビデオシーケンス中のn+m個の領域の符号化データをバッファリングすることと、を含む請求項8に記載の方法。
  10. 時刻Tで前記ユーザの観賞視角が変化すると、
    バッファリングされた前記n+m個の領域の符号化データから、更新視角ビデオシーケンス中の第i個の領域の符号化データを選択し、前記符号化データに復号化を行って、得られた前記第i個の領域を放送することをさらに含み、
    前記更新視角ビデオシーケンスは水平視角が変化後の前記観賞視角に合う視角ビデオシーケンスである請求項9に記載の方法。
  11. 前記符号化データに復号化を行うことは、
    現在時刻で受信された、水平視角が前記観賞視角に合う視角ビデオシーケンス中の領域の符号化データに復号化を行って、得られた前記領域を放送することと、
    前記現在時刻で受信された前記n+m個の視角ビデオシーケンス中のn+m個の領域の符号化データに復号化を行って、得られた前記n+m個の領域をバッファリングすることと、を含む請求項8に記載の方法。
  12. 時刻Tで前記ユーザの観賞視角が変化すると、
    バッファリングされた前記n+m個の領域から、更新視角ビデオシーケンス中の第i個の領域を選択して、前記第i個の領域を放送することをさらに含み、
    前記更新視角ビデオシーケンスは水平視角が変化後の前記観賞視角に合う視角ビデオシーケンスである請求項11に記載の方法。
  13. 所定の視角の風物を記録して形成された画像フレームであるパノラマ画像フレームからなるパノラマビデオを取得するように構成されたビデオ取得モジュールと、
    前記ビデオ取得モジュールが取得した前記パノラマビデオを、それぞれ前記パノラマビデオ中の全てのパノラマ画像フレームにおける同一の水平視角を有する領域からなり、水平視角の総和が前記パノラマ画像フレームの総水平視角であるN(Nは正整数である。)個の視角ビデオシーケンスに分割するように構成されたビデオ分割モジュールと、
    前記ビデオ分割モジュールで得た前記N個の視角ビデオシーケンスにそれぞれ符号化を行って、N組の符号化データを得るように構成されたビデオ符号化モジュールと、
    ユーザの観賞視角を確定するように構成された視角確定モジュールと、
    水平視角が前記視角確定モジュールによって確定された前記観賞視角を含む視角ビデオシーケンスを選択して、前記視角ビデオシーケンスの符号化データを前記ユーザに提供するように構成された第1の提供モジュールと、を含み、
    一つのパノラマ画像フレーム中の各領域は互いに重ならないビデオ符号化装置。
  14. 前記ビデオ分割モジュールは、
    予め設定された視角分割ルールに従って、前記パノラマビデオ中の各パノラマ画像フレームを水平視角に基づいてN個の領域に分割するように構成された領域分割ユニットと、
    前記領域分割ユニットが分割した全てのパノラマ画像フレームにおける同一の水平視角を有する領域で一つの視角ビデオシーケンスを構成して、前記N個の視角ビデオシーケンスを得るように構成されたシーケンス生成ユニットと、を含む請求項13に記載の装置。
  15. 前記第1の提供モジュールは、さらに、
    時刻T(iは正整数である。)で前記ユーザの観賞視角が変化したと確定すると、前記視角ビデオシーケンス中の第i個の領域の符号化データの送信を禁止し、
    水平視角が変化後の前記観賞視角に合う視角ビデオシーケンスである更新視角ビデオシーケンスを選択し、前記更新視角ビデオシーケンス中の第i個の領域の符号化データを前記ユーザに提供し、
    iをi+1に更新し、時刻Tで、前記更新視角ビデオシーケンス中の第i個の領域の符号化データを前記ユーザに提供するステップを循環的に実行するように構成される請求項13に記載の装置。
  16. 前記第1の提供モジュールが水平視角が前記観賞視角に合う視角ビデオシーケンスを選択した後、前記水平視角に隣り合い、且つ前記水平視角未満の連続するn個の水平視角に対応する視角ビデオシーケンスを取得し、また、前記水平視角に隣り合い、且つ前記水平視角よりも大きい連続するm(nとmはいずれも正整数で、且つn+m≦N−1である。)個の水平視角に対応する視角ビデオシーケンスを取得するように構成されたシーケンス選択モジュールと、
    前記シーケンス選択モジュールが選択したn+m個の視角ビデオシーケンス中の、同一のパノラマ画像フレームに属する各n+m個の領域の符号化データを順に前記ユーザに提供するように構成された第2の提供モジュールと、をさらに含む請求項13乃至15の中のいずれかに記載の装置。
  17. 各視角ビデオシーケンスにおいて、第j個の領域の符号化データは第j−1個の領域の符号化データに基いて生成されるか、或いは、第j個の領域の符号化データは第j−1(jとlはいずれも正整数で、且つl>j≧2である。)個の領域の符号化データと第l個の領域の符号化データに基いて生成され、
    異なる視角ビデオシーケンス間において、任意の二つの領域の符号化データは時間領域で関係ない請求項13に記載の装置。
  18. 前記領域が少なくとも二つのマクロブロックを含む場合、
    各領域において、一つのマクロブロックの符号化データは空間領域内で隣り合うマクロブロックの符号化データに基いて生成され、
    異なる領域間において、空間領域内で隣り合う二つのマクロブロックの符号化データは関係ない請求項13に記載の装置。
  19. 所定の視角の風物を記録して形成された画像フレームであるパノラマ画像フレームからなるパノラマビデオを取得し、前記パノラマビデオを、それぞれ前記パノラマビデオ中の全てのパノラマ画像フレームにおける同一の水平視角を有する領域からなり、水平視角の総和が前記パノラマ画像フレームの総水平視角であるN(Nは正整数である。)個の視角ビデオシーケンスに分割し、前記N個の視角ビデオシーケンスにそれぞれ符号化を行ってN組の符号化データを得、水平視角が観賞視角を含む視角ビデオシーケンスを選択して前記視角ビデオシーケンスの符号化データをユーザに提供するように構成されたエンコーダに前記ユーザの前記観賞視角を提供するように構成された視角提供モジュールと、
    前記エンコーダから送信された前記符号化データを受信するように構成された第1の受信モジュールと、
    前記第1の受信モジュールが受信した前記符号化データに復号化を行うように構成されたデータ復号化モジュールと、を含み、
    一つのパノラマ画像フレーム中の各領域は互いに重ならないビデオ符号化装置。
  20. n+m(nとmはいずれも正整数で、且つn+m≦N−1である。)個の視角ビデオシーケンス中の、同一のパノラマ画像フレームに属する各n+m個の符号化データを順に受信するように構成された第2の受信モジュールをさらに含み、
    前記n+m個の視角ビデオシーケンスは前記水平視角に隣り合い、且つ前記水平視角未満の連続するn個の水平視角に対応する視角ビデオシーケンス、及び、前記水平視角に隣り合い、且つ前記水平視角よりも大きい連続するm個の水平視角に対応する視角ビデオシーケンスである請求項19に記載の装置。
  21. 前記データ復号化モジュールは、
    現在時刻で受信された、水平視角が前記観賞視角に合う視角ビデオシーケンス中の領域の符号化データに復号化を行い、得られた前記領域を放送し、前記現在時刻で受信された前記n+m個の視角ビデオシーケンス中のn+m個の領域の符号化データをバッファリングするように構成された第1の処理ユニットを含む請求項20に記載の装置。
  22. 前記データ復号化モジュールは、
    時刻Tで前記ユーザの観賞視角が変化すると、前記第1の処理ユニットによってバッファリングされた前記n+m個の領域の符号化データから、更新視角ビデオシーケンス中の第i個の領域の符号化データを選択し、前記符号化データに復号化を行って、得られた前記第i個の領域を放送するように構成された第2の処理ユニットをさらに含み、
    前記更新視角ビデオシーケンスは水平視角が変化後の前記観賞視角に合う視角ビデオシーケンスである請求項21に記載の装置。
  23. 前記データ復号化モジュールは、
    現在時刻で受信された、水平視角が前記観賞視角に合う視角ビデオシーケンス中の領域の符号化データに復号化を行い、得られた前記領域を放送し、前記現在時刻で受信された前記n+m個の視角ビデオシーケンス中のn+m個の領域の符号化データに復号化を行って、得られた前記n+m個の領域をバッファリングするように構成された第3の処理ユニットをさらに含む請求項20に記載の装置。
  24. 前記データ復号化モジュールは、
    時刻Tで前記ユーザの観賞視角が変化すると、前記第2の処理ユニットによってバッファリングされた前記n+m個の領域から、更新視角ビデオシーケンス中の第i個の領域を選択して、前記第i個の領域を放送するように構成された第4の処理ユニットをさらに含み、
    前記更新視角ビデオシーケンスは水平視角が変化後の前記観賞視角に合う視角ビデオシーケンスである請求項23に記載の装置。
  25. 請求項1乃至6の中のいずれかに記載のビデオ符号化方法又は請求項7乃至12の中のいずれかに記載のビデオ符号化方法を実行するためのコンピューターが実行可能な命令を記憶したコンピューター記憶媒体。
  26. 所定の視角の風物を記録して形成された画像フレームであるパノラマ画像フレームからなるパノラマビデオを取得することと、
    前記パノラマビデオを、それぞれ前記パノラマ画像フレームにおける同一の水平視角を有する領域からなり、水平視角の総和が前記パノラマ画像フレームの総水平視角であるN(Nは正整数である。)個の視角ビデオシーケンスに分割することと、
    前記N個の視角ビデオシーケンスにそれぞれ符号化を行って、N組の符号化データを得ることと、
    ユーザの観賞視角を確定することと、
    水平視角が前記観賞視角を含む視角ビデオシーケンスを選択し、前記視角ビデオシーケンスの符号化データを前記ユーザに提供することと、
    を実行するための実行可能な命令を記憶するための第1の記憶媒体と、
    記憶された実行可能な命令を実行するように構成された第1のプロセッサと、を含み、
    一つのパノラマ画像フレーム中の各領域は互いに重ならないエンコーダ。
JP2018549490A 2016-03-22 2016-11-23 ビデオの符号化方法及び装置、機器、記憶媒体 Active JP6718976B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201610163645.6 2016-03-22
CN201610163645.6A CN105791882B (zh) 2016-03-22 2016-03-22 视频编码方法及装置
PCT/CN2016/107002 WO2017161907A1 (zh) 2016-03-22 2016-11-23 视频编码方法及装置、设备、存储介质

Publications (2)

Publication Number Publication Date
JP2019512969A true JP2019512969A (ja) 2019-05-16
JP6718976B2 JP6718976B2 (ja) 2020-07-08

Family

ID=56390450

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018549490A Active JP6718976B2 (ja) 2016-03-22 2016-11-23 ビデオの符号化方法及び装置、機器、記憶媒体

Country Status (6)

Country Link
US (1) US10951818B2 (ja)
EP (1) EP3435677A4 (ja)
JP (1) JP6718976B2 (ja)
KR (1) KR102109510B1 (ja)
CN (1) CN105791882B (ja)
WO (1) WO2017161907A1 (ja)

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105791882B (zh) * 2016-03-22 2018-09-18 腾讯科技(深圳)有限公司 视频编码方法及装置
CN108322763A (zh) * 2016-08-23 2018-07-24 深圳市掌网科技股份有限公司 一种编解码全景视频的方法和系统
CN106162207B (zh) * 2016-08-25 2019-02-12 北京字节跳动科技有限公司 一种全景视频并行编码方法和装置
CN106358033B (zh) * 2016-08-25 2018-06-19 北京字节跳动科技有限公司 一种全景视频关键帧编码方法和装置
CN107888939A (zh) * 2016-09-30 2018-04-06 华为技术有限公司 一种视频数据的处理方法及装置
CN109644296A (zh) * 2016-10-10 2019-04-16 华为技术有限公司 一种视频流传输方法、相关设备及系统
CN107945101B (zh) 2016-10-13 2021-01-29 华为技术有限公司 图像处理方法和装置
CN106454314A (zh) * 2016-10-24 2017-02-22 传线网络科技(上海)有限公司 全景视频解码方法及装置
CN106791886B (zh) * 2016-11-16 2020-03-17 深圳市梦网百科信息技术有限公司 一种基于视觉特性的全景视频分发方法和系统
KR20180059210A (ko) * 2016-11-25 2018-06-04 삼성전자주식회사 영상 처리 장치 및 그 영상 처리 방법
CN106604041B (zh) * 2016-12-01 2020-05-22 深圳市梦网视讯有限公司 一种基于视觉连续性的全景视频分发方法和系统
CN108156484B (zh) * 2016-12-05 2022-01-14 奥多比公司 利用自适应速率分配优先处理基于图块的虚拟现实视频流
US10595069B2 (en) 2016-12-05 2020-03-17 Adobe Inc. Prioritizing tile-based virtual reality video streaming using adaptive rate allocation
CN108289228B (zh) 2017-01-09 2020-08-28 阿里巴巴集团控股有限公司 一种全景视频转码方法、装置和设备
CN108462825A (zh) * 2017-02-21 2018-08-28 阿里巴巴集团控股有限公司 视频处理方法及装置
CN108513119A (zh) 2017-02-27 2018-09-07 阿里巴巴集团控股有限公司 图像的映射、处理方法、装置和机器可读介质
CN106851212B (zh) * 2017-03-03 2020-03-17 深圳市梦网百科信息技术有限公司 一种基于用户特性的全景视频分发方法和系统
CN108632631B (zh) * 2017-03-16 2020-08-07 华为技术有限公司 一种全景视频中视频分片的下载方法和装置
CN107027041B (zh) * 2017-04-18 2019-12-27 深圳市智能现实科技有限公司 场景展示方法及装置
CN108810574B (zh) * 2017-04-27 2021-03-12 腾讯科技(深圳)有限公司 一种视频信息处理方法及终端
CN108810636B (zh) 2017-04-28 2020-04-14 华为技术有限公司 视频播放方法、虚拟现实设备、服务器、系统及存储介质
CN108933920B (zh) * 2017-05-25 2023-02-17 中兴通讯股份有限公司 一种视频画面的输出、查看方法及装置
CN108965917B (zh) * 2017-05-27 2021-07-20 华为技术有限公司 视频图像的呈现、封装方法和视频图像的呈现、封装装置
CN110945873B (zh) * 2017-06-02 2022-11-04 Vid拓展公司 下一代网络上的360度视频递送
CN109218848A (zh) * 2017-07-06 2019-01-15 阿里巴巴集团控股有限公司 视频流的视角切换方法、装置、设备和计算机存储介质
CN107484004B (zh) * 2017-07-24 2020-01-03 北京奇艺世纪科技有限公司 一种视频处理方法及装置
WO2019041179A1 (zh) * 2017-08-30 2019-03-07 华为技术有限公司 Vr视频播放处理方法及设备
CN109698949B (zh) * 2017-10-20 2020-08-21 腾讯科技(深圳)有限公司 基于虚拟现实场景的视频处理方法、装置和系统
CN109862340A (zh) * 2017-11-30 2019-06-07 宏碁股份有限公司 视频装置及其三维物件编解码方法
KR20200122323A (ko) * 2018-02-17 2020-10-27 드림뷰, 인크. 멀티 센서를 사용하여 옴니 스테레오 비디오를 캡처하는 시스템 및 방법
USD931355S1 (en) 2018-02-27 2021-09-21 Dreamvu, Inc. 360 degree stereo single sensor camera
USD943017S1 (en) 2018-02-27 2022-02-08 Dreamvu, Inc. 360 degree stereo optics mount for a camera
CN108650460B (zh) * 2018-05-10 2021-03-30 深圳视点创新科技有限公司 服务器、全景视频的存储和传输方法和计算机存储介质
CN109672897B (zh) * 2018-12-26 2021-03-16 北京数码视讯软件技术发展有限公司 全景视频编码方法及装置
CN109672867A (zh) * 2018-12-28 2019-04-23 上海上实龙创智慧能源科技股份有限公司 一种全景摄像在vr头显中的显示方法
EP4046389A1 (en) * 2019-10-14 2022-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Immersive viewport dependent multiparty video communication
CN111711859A (zh) * 2020-06-28 2020-09-25 北京奇艺世纪科技有限公司 一种视频图像处理方法、系统及终端设备
CN115134574B (zh) * 2022-06-24 2023-08-01 咪咕视讯科技有限公司 动态元数据生成方法、装置、设备及存储介质

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100760171B1 (ko) * 1999-03-12 2007-09-20 소니 가부시끼 가이샤 화상 제공 장치 및 그 제공 방법, 화상 처리 장치 및 그 처리 방법, 및 기억 매체
JP3906685B2 (ja) 2001-12-25 2007-04-18 日本電気株式会社 ビデオ映像提示システム、ビデオ映像送出装置、ビデオ映像提示装置、ビデオ映像処理プログラム
JP2004072694A (ja) * 2002-08-09 2004-03-04 Sony Corp 情報提供システムおよび方法、情報提供装置および方法、記録媒体、並びにプログラム
DE602004010363T2 (de) * 2003-01-17 2008-10-23 Nippon Telegraph And Telephone Corp. Fernvideoanzeigeverfahren, videoerfassungseinrichtung, verfahren dafür und programm dafür
US7428000B2 (en) * 2003-06-26 2008-09-23 Microsoft Corp. System and method for distributed meetings
JP4345829B2 (ja) 2007-03-09 2009-10-14 ソニー株式会社 画像表示システム、画像表示装置、画像表示方法およびプログラム
US8477175B2 (en) * 2009-03-09 2013-07-02 Cisco Technology, Inc. System and method for providing three dimensional imaging in a network environment
CN101673473A (zh) * 2009-09-24 2010-03-17 浙江大学 基于dsp的全景视觉泊车辅助装置及生成全景视觉图像的方法
CN101916163B (zh) * 2010-08-02 2012-02-08 周寅 一种在时空变换下保持协同渐变的全景视频互动播放的方法
US8988512B2 (en) * 2011-04-14 2015-03-24 Mediatek Inc. Method for adjusting playback of multimedia content according to detection result of user status and related apparatus thereof
KR101282955B1 (ko) * 2011-08-31 2013-07-17 한국과학기술연구원 실시간 고해상도 파노라마 영상 스트리밍 시스템 및 방법
US20130089301A1 (en) * 2011-10-06 2013-04-11 Chi-cheng Ju Method and apparatus for processing video frames image with image registration information involved therein
US9225942B2 (en) * 2012-10-11 2015-12-29 GM Global Technology Operations LLC Imaging surface modeling for camera modeling and virtual view synthesis
EP3562170A1 (en) * 2013-07-29 2019-10-30 Koninklijke KPN N.V. Providing tile video streams to a client
EP3055763A1 (en) * 2013-10-07 2016-08-17 VID SCALE, Inc. User adaptive 3d video rendering and delivery
US9699437B2 (en) * 2014-03-03 2017-07-04 Nextvr Inc. Methods and apparatus for streaming content
CN105519098A (zh) * 2014-05-27 2016-04-20 联发科技股份有限公司 投射处理器和相关方法
KR102407283B1 (ko) * 2014-05-29 2022-06-10 네버마인드 캐피탈 엘엘씨 콘텐트를 전달 및/또는 콘텐트를 재생하기 위한 방법들 및 장치
US20150346812A1 (en) * 2014-05-29 2015-12-03 Nextvr Inc. Methods and apparatus for receiving content and/or playing back content
CN104469340B (zh) * 2014-12-01 2017-03-15 深圳凯澳斯科技有限公司 一种立体视频共光心成像系统及其成像方法
CN104735464A (zh) * 2015-03-31 2015-06-24 华为技术有限公司 一种全景视频交互传输方法、服务器和客户端
CN105323552B (zh) * 2015-10-26 2019-03-12 北京时代拓灵科技有限公司 一种全景视频播放方法及系统
CN105791882B (zh) * 2016-03-22 2018-09-18 腾讯科技(深圳)有限公司 视频编码方法及装置
US10148875B1 (en) * 2016-05-17 2018-12-04 Scott Zhihao Chen Method and system for interfacing multiple channels of panoramic videos with a high-definition port of a processor
JP6330987B2 (ja) * 2016-06-17 2018-05-30 日本電気株式会社 画像処理装置、画像処理方法、及び記憶媒体

Also Published As

Publication number Publication date
EP3435677A4 (en) 2019-08-07
WO2017161907A1 (zh) 2017-09-28
KR20180081128A (ko) 2018-07-13
JP6718976B2 (ja) 2020-07-08
KR102109510B1 (ko) 2020-05-12
CN105791882B (zh) 2018-09-18
CN105791882A (zh) 2016-07-20
US10951818B2 (en) 2021-03-16
US20180324355A1 (en) 2018-11-08
EP3435677A1 (en) 2019-01-30

Similar Documents

Publication Publication Date Title
JP6718976B2 (ja) ビデオの符号化方法及び装置、機器、記憶媒体
US10225546B2 (en) Independent multi-resolution coding
US10484682B2 (en) Reference picture derivation and motion compensation for 360-degree video coding
ES2866894T3 (es) Predicción de coeficientes de filtro a partir de filtros fijos para codificación de video
ES2874848T3 (es) Restricción de unidades de predicción en segmentos b a interpredicción unidireccional
ES2744235T3 (es) Actualizaciones de conjuntos de parámetros en la codificación de vídeo
ES2810253T3 (es) Reposicionamiento de bloques residuales de predicción en codificación de vídeo
ES2728091T3 (es) Aparato de decodificación por entropía de segmentos de corte
ES2715314T3 (es) Acceso aleatorio completo desde imágenes de acceso aleatorio limpio en codificación de vídeo
EP3531698A1 (en) Deblocking filter method and terminal
ES2656470T3 (es) Mejora de los diseños de formato de la carga útil de RTP
ES2905124T3 (es) Dispositivo y método para procesar datos de video
US11172239B2 (en) Media information processing method and apparatus
US10798417B2 (en) Deblock filtering for 360-degree video coding
BR112020026686A2 (pt) Sistema e método para codificação de vídeo
WO2018030292A1 (ja) 符号化装置、復号装置、符号化方法及び復号方法
BR112021004822A2 (pt) codificador, decodificador, método de codificação e método de decodificação
WO2018030293A1 (ja) 符号化装置、復号装置、符号化方法及び復号方法
US20190253703A1 (en) Motion compensation for cubemap packed frames
BR112020000876A2 (pt) dispositivo codificador, dispositivo decodificador, método de codificação, e método de decodificação
WO2018030294A1 (ja) 符号化装置、復号装置、符号化方法及び復号方法
BR112021014711A2 (pt) Codificador, decodificador, método de codificação e método de decodificação
BR112020000219A2 (pt) codificação, método de codificação, decodificador e método de decodificação
BR112020021718A2 (pt) codificador, decodificador, método de codificação e método de decodificação
WO2018030291A1 (ja) 符号化装置、復号装置、符号化方法及び復号方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180920

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180920

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190927

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191015

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200115

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200608

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200615

R150 Certificate of patent or registration of utility model

Ref document number: 6718976

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250