TWI581635B - 用於處理多視圖視訊編碼操作點的方法、裝置及電腦可讀儲存媒體 - Google Patents

用於處理多視圖視訊編碼操作點的方法、裝置及電腦可讀儲存媒體 Download PDF

Info

Publication number
TWI581635B
TWI581635B TW099126516A TW99126516A TWI581635B TW I581635 B TWI581635 B TW I581635B TW 099126516 A TW099126516 A TW 099126516A TW 99126516 A TW99126516 A TW 99126516A TW I581635 B TWI581635 B TW I581635B
Authority
TW
Taiwan
Prior art keywords
mvc
operating point
view
views
value
Prior art date
Application number
TW099126516A
Other languages
English (en)
Other versions
TW201112769A (en
Inventor
陳盈
陳培松
馬塔 卡茲維克茲
Original Assignee
高通公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 高通公司 filed Critical 高通公司
Publication of TW201112769A publication Critical patent/TW201112769A/zh
Application granted granted Critical
Publication of TWI581635B publication Critical patent/TWI581635B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234327Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by decomposing into layers, e.g. base layer and one or more enhancement layers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/633Control signals issued by server directed to the network components or client
    • H04N21/6332Control signals issued by server directed to the network components or client directed to client
    • H04N21/6336Control signals issued by server directed to the network components or client directed to client directed to decoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8451Structuring of content, e.g. decomposing content into time segments using Advanced Video Coding [AVC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2362Generation or processing of Service Information [SI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2365Multiplexing of several video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4347Demultiplexing of several video streams

Description

用於處理多視圖視訊編碼操作點的方法、裝置及電腦可讀儲存媒體
本發明係關於經編碼之視訊資料之傳送。
本申請案主張2009年8月7日申請之美國臨時申請案第61/232,272號、2009年10月5日申請之美國臨時申請案第61/248,738號及2009年12月4日申請之美國臨時申請案第61/266,861號之權利,該等申請案中之每一者之各別全部內容在此以引用的方式併入。
數位視訊能力可併入至廣泛範圍之器件中,該等器件包括數位電視、數位直播系統、無線廣播系統、個人數位助理(PDA)、膝上型或桌上型電腦、數位相機、數位記錄器件、數位媒體播放器、視訊遊戲器件、視訊遊戲控制台、蜂巢式或衛星無線電電話、視訊電話會議器件及其類似者。數位視訊器件實施諸如以下各者之視訊壓縮技術以較有效率地傳輸及接收數位視訊資訊:描述於由MPEG-2、MPEG-4、ITU-T H.263或ITU-T H.264/MPEG-4第10部分(進階視訊編碼(AVC))定義之標準及此等標準之延伸中的視訊壓縮技術。
視訊壓縮技術執行空間預測及/或時間預測以減少或移除視訊序列中所固有之冗餘。對於基於區塊之視訊編碼而言,可將視訊圖框或切片分割成巨集區塊。可進一步分割每一巨集區塊。使用關於相鄰巨集區塊之空間預測來編碼圖框內編碼(I)圖框或切片中之巨集區塊。圖框間編碼(P或B)圖框或切片中之巨集區塊可使用關於同一圖框或切片中的相鄰巨集區塊之空間預測或關於其他參考圖框之時間預測。
在已編碼視訊資料之後,可藉由多工器將該視訊資料封包化以供傳輸或儲存。MPEG-2包括定義許多視訊編碼標準之傳送層級之「系統」章節。MPEG-2傳送層級系統可由MPEG-2視訊編碼器使用,或由符合不同視訊編碼標準的其他視訊編碼器使用。舉例而言,MPEG-4規定與MPEG-2之編碼及解碼方法不同的編碼及解碼方法,但實施MPEG-4標準之技術的視訊編碼器仍可利用MPEG-2傳送層級方法。
大體而言,在本發明中,對「MPEG-2系統」之參考涉及由MPEG-2規定之視訊資料的傳送層級。在本發明中,由MPEG-2規定之傳送層級亦被稱作「MPEG-2傳送串流」或簡稱作「傳送串流」。同樣地,MPEG-2系統之傳送層級亦包括節目串流。傳送串流及節目串流大體上包括用於遞送類似資料之不同格式,其中傳送串流包含一或多個「節目」,該一或多個「節目」包括音訊及視訊資料兩者,而節目串流包括一個節目,該節目包括音訊資料與視訊資料兩者。
已努力基於H.264/AVC開發新的視訊編碼標準。一個此標準為可按比例調整之視訊編碼(SVC)標準,其為H.264/AVC之可按比例調整之延伸。另一標準為多視圖視訊編碼(MVC),其成為H.264/AVC之多視圖延伸標準。MPEG-2系統規範描述如何可將壓縮多媒體(視訊及音訊)資料串流與其他資料一起多工以形成適於數位傳輸或儲存的單一資料串流。在2006年5月「Information Technology-Generic Coding of Moving Pictures and Associated Audio: Systems,Recommendation H.222.0;International Organisation for Standardisation,ISO/IEC JTC1/SC29/WG11;Coding of Moving Pictures and Associated Audio」中指定MPEG-2系統之最新規範。MPEG近來設計了在MPEG-2系統上之MVC之傳送標準,且此規範之最新版本為「Study of ISO/IEC 13818-1:2007/FPDAM4 Transport of MVC」,MPEG doc. N10572,MPEG of ISO/IEC JTC1/SC29/WG11,Maui,Hawaii,USA,2009年4月。
大體而言,本發明描述用於改良MPEG-2(動畫專家群組)系統中之多視圖視訊編碼之技術。詳言之,本發明之技術係針對用於MPEG-2系統位元串流之操作點之資料結構,其中該資料結構用信號發送接收器件之呈現能力、接收器件之解碼能力及(在一些實例中)操作點之位元速率。該資料結構可對應於包括於該MPEG-2系統位元串流中之操作點描述符。
為了適當解碼並顯示操作點之視訊資料,接收器件應滿足由在資料結構中用信號發送之呈現能力及解碼能力所描述之性質。MPEG-2系統位元串流可包括對應於節目之各個視圖之複數個操作點。使用節目之不同操作點允許各種用戶端器件執行調適。亦即,具有不同呈現及解碼能力之用戶端器件可自同一節目提取視圖以顯示二維或三維視訊資料。用戶端器件亦可與伺服器器件協商以擷取具有變化之位元速率之資料,以適合於具有各種頻寬能力之傳送媒體。
在一實例中,一種方法包括:藉由一源器件建構對應於一MPEG-2系統標準位元串流之一多視圖視訊編碼(MVC)操作點的一資料結構,其中該資料結構用信號發送描述一接收器件使用該MVC操作點待滿足的一呈現能力之一呈現能力值、描述該接收器件使用該MVC操作點待滿足的一解碼能力之一解碼能力值及描述該MVC操作點之一位元速率之一位元速率值,且其中該資料結構經包括作為該位元串流之部分;及輸出包含該資料結構之該位元串流。
在另一實例中,一種裝置包括:一多工器,其建構對應於一MPEG-2系統標準位元串流之一MVC操作點的一資料結構,其中該資料結構用信號發送描述一接收器件使用該MVC操作點待滿足的一呈現能力之一呈現能力值、描述該接收器件使用該MVC操作點待滿足的一解碼能力之一解碼能力值及描述該MVC操作點之一位元速率之一位元速率值,且將該資料結構包括作為該位元串流之部分;及一輸出介面,其輸出包含該資料結構之該位元串流。
在另一實例中,一種裝置包括:用於建構對應於一MPEG-2系統標準位元串流之一MVC操作點的一資料結構之構件,其中該資料結構用信號發送描述一接收器件使用該MVC操作點待滿足的一呈現能力之一呈現能力值、描述該接收器件使用該MVC操作點待滿足的一解碼能力之一解碼能力值及描述該MVC操作點之一位元速率之一位元速率值,且其中該資料結構經包括作為該位元串流之部分;及用於輸出包含該資料結構之該位元串流之構件。
在另一實例中,一種電腦可讀儲存媒體包含指令,該等指令使一源器件之一處理器建構對應於一MPEG-2系統標準位元串流之一MVC操作點的一資料結構,其中該資料結構用信號發送描述一接收器件使用該MVC操作點待滿足的一呈現能力之一呈現能力值、描述該接收器件使用該MVC操作點待滿足的一解碼能力之一解碼能力值及描述該MVC操作點之一位元速率之一位元速率值,且其中該資料結構經包括作為該位元串流之部分;且使一輸出介面輸出包含該資料結構之該位元串流。
在另一實例中,一種方法包括:藉由一目的地器件接收對應於一MPEG-2(動畫專家群組)系統標準位元串流之一MVC操作點的一資料結構,其中該資料結構用信號發送描述一接收器件使用該MVC操作點待滿足的一呈現能力之一呈現能力值、描述該接收器件使用該MVC操作點待滿足的一解碼能力之一解碼能力值及描述該MVC操作點之一位元速率之一位元速率值;判定該目的地器件之一視訊解碼器是否能夠基於藉由該資料結構用信號發送之該解碼能力而解碼對應於該MVC操作點之視圖;判定該目的地器件是否能夠基於藉由該資料結構用信號發送之該呈現能力而呈現對應於該MVC操作點之該等視圖;及在該目的地器件之該視訊解碼器經判定成能夠解碼並呈現對應於該MVC操作點之該等視圖時,將對應於該MVC操作點之該等視圖發送至該目的地器件之該視訊解碼器。
在另一實例中,一種裝置包括:一輸入介面,其經組態以接收對應於一MPEG-2系統標準位元串流之一MVC操作點的一資料結構,其中該資料結構用信號發送描述一接收器件使用該MVC操作點待滿足的一呈現能力之一呈現能力值、描述該接收器件使用該MVC操作點待滿足的一解碼能力之一解碼能力值及描述該MVC操作點之一位元速率之一位元速率值;一視訊解碼器,其經組態以解碼視訊資料;及一解多工器,其經組態以判定該視訊解碼器是否能夠基於藉由該資料結構用信號發送之該解碼能力而解碼對應於該MVC操作點之視圖,判定該裝置是否能夠基於藉由該資料結構用信號發送之該呈現能力而呈現對應於該MVC操作點之該等視圖,且在該視訊解碼器經判定成能夠解碼並呈現對應於該MVC操作點之該等視圖時,將對應於該MVC操作點之該等視圖發送至該視訊解碼器。
在另一實例中,一種裝置包括:用於接收對應於一MPEG-2系統標準位元串流之一MVC操作點的一資料結構之構件,其中該資料結構用信號發送描述一接收器件使用該MVC操作點待滿足的一呈現能力之一呈現能力值、描述該接收器件使用該MVC操作點待滿足的一解碼能力之一解碼能力值及描述該MVC操作點之一位元速率之一位元速率值;用於判定該裝置之一視訊解碼器是否能夠基於藉由該資料結構用信號發送之該解碼能力而解碼對應於該MVC操作點之視圖之構件;用於判定該裝置是否能夠基於藉由該資料結構用信號發送之該呈現能力而呈現對應於該MVC操作點之該等視圖之構件;及用於在該裝置之該視訊解碼器經判定成能夠解碼並呈現對應於該MVC操作點之該等視圖時、將對應於該MVC操作點之該等視圖發送至該裝置之該視訊解碼器之構件。
在另一實例中,一種電腦可讀儲存媒體包含指令,該等指令使一目的地器件之一處理器進行以下操作:接收對應於一MPEG-2系統標準位元串流之一MVC操作點的一資料結構,其中該資料結構用信號發送描述一接收器件使用該MVC操作點待滿足的一呈現能力之一呈現能力值、描述該接收器件使用該MVC操作點待滿足的一解碼能力之一解碼能力值及描述該MVC操作點之一位元速率之一位元速率值;判定該目的地器件之一視訊解碼器是否能夠基於藉由該資料結構用信號發送之該解碼能力而解碼對應於該MVC操作點之視圖;判定該目的地器件是否能夠基於藉由該資料結構用信號發送之該呈現能力而呈現對應於該MVC操作點之該等視圖;及在該目的地器件之該視訊解碼器經判定成能夠解碼並呈現對應於該MVC操作點之該等視圖時,將對應於該MVC操作點之該等視圖發送至該目的地器件之該視訊解碼器。
在隨附圖式及下文之描述中闡述一或多個實例之細節。其他特徵、目標及優點將自描述及圖式以及自申請專利範圍顯而易見。
本發明之技術大體而言係針對增強MPEG-2(動畫專家群組)系統(亦即,關於傳送層級細節符合MPEG-2之系統)中之多視圖視訊編碼(MVC)。舉例而言,MPEG-4提供視訊編碼之標準,但大體上假定符合MPEG-4標準的視訊編碼器將利用MPEG-2傳送層級系統。因此,本發明之技術適用於符合MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4或利用MPEG-2傳送串流及/或節目(program)串流(亦表示為「節目(programme)串流」)之任何其他視訊編碼標準的視訊編碼器。
詳言之,本發明之技術可修改用於MPEG-2傳送串流及節目串流之在傳送層級處之語法元素。舉例而言,本發明之技術包括一描述符,其在傳送串流中傳輸以描述操作點之特徵。舉例而言,伺服器器件可在MPEG-2傳送層位元串流中提供各種操作點,其中之每一者對應於多視圖視訊編碼視訊資料之特定視圖的各別子集。亦即,操作點大體上對應於位元串流之視圖的一子集。在一些實例中,操作點之每一視圖包括在相同圖框速率下之視訊資料。
目的地器件可使用包括於位元串流中之操作點描述符以選擇待解碼之操作點中之一者並最終向使用者呈現(例如,顯示)。目的地器件可僅將選定操作點之視圖發送至視訊解碼器,而非在接收後將關於所有視圖之資料傳遞至視訊解碼器。以此方式,目的地器件可丟棄將不被解碼之視圖之資料。目的地器件可基於位元串流之操作點中具有所支援之最高品質的一者來選擇操作點。
伺服器器件可在單一傳送串流或節目串流中發送複數個子位元串流(其中之每一者可對應於一操作點)。雖然在各個章節中,本發明可個別地涉及「傳送串流」或「節目串流」,但應理解,本發明之技術大體上適用於MPEG-2傳送串流及節目串流中之一者或兩者。大體而言,本發明描述對用於執行本發明之技術之作為實例資料結構的描述符之使用。描述符係用以延伸串流之功能性。本發明之描述符可由傳送串流及節目串流兩者使用以實施本發明之技術。雖然本發明主要聚焦於可用以用信號發送操作點之呈現能力值、操作點之解碼能力值及操作點之位元速率值之作為實例資料結構之描述符,但應理解,亦可使用其他資料結構來執行此等技術。
根據本發明之技術,源器件20可建構描述操作點之特性之操作點描述符。該等特性可包括(例如)哪些視圖包括於操作點中及該操作點之該等視圖的圖框速率。操作點描述符可指定應由視訊解碼器支援以便接收並解碼操作點之呈現能力、應由視訊解碼器支援以便接收並解碼操作點之解碼能力,及操作點之位元速率。
本發明之技術可大體上將每一操作點表示成好像該操作點為藉由傳送串流中之節目映射表或節目串流中之節目串流映射來用信號發送的其自己的節目。或者,當節目含有多個操作點時,本發明之技術提供關於該等操作點應如何在操作點描述符中經重新組譯之資訊。操作點描述符可進一步用信號發送操作點之相依性,此可節省位元。
圖1為說明音訊/視訊(A/V)源器件20將音訊及視訊資料傳送至A/V目的地器件40之實例系統10的方塊圖。圖1之系統10可對應於視訊電話會議系統、伺服器/用戶端系統、廣播器/接收器系統,或視訊資料自源器件(諸如,A/V源器件20)發送至目的地器件(諸如,A/V目的地器件40)之任何其他系統。在一些實例中,A/V源器件20及A/V目的地器件40可執行雙向資訊交換。亦即,A/V源器件20及A/V目的地器件40可能夠對音訊及視訊資料進行編碼及解碼(及傳輸及接收)兩者。在一些實例中,音訊編碼器26可包含一語音編碼器,其亦被稱作聲碼器。
在圖1之實例中,A/V源器件20包含音訊源22及視訊源24。音訊源22可包含(例如)麥克風,其產生代表待由音訊編碼器26編碼的所俘獲音訊資料之電信號。或者,音訊源22可包含儲存先前記錄之音訊資料之儲存媒體、諸如電腦化合成器之音訊資料產生器,或任何其他音訊資料源。視訊源24可包含產生待由視訊編碼器28編碼的視訊資料之視訊相機,編碼有先前記錄之視訊資料之儲存媒體、視訊資料產生單元,或任何其他視訊資料源。
原始音訊及視訊資料可包含類比或數位資料。類比資料可在由音訊編碼器26及/或視訊編碼器28編碼之前經數位化。在說話之參與者正說話時,音訊源22可自該說話之參與者獲得音訊資料,且視訊源24可同時獲得該說話之參與者的視訊資料。在其他實例中,音訊源22可包含一包含所儲存之音訊資料的電腦可讀儲存媒體,且視訊源24可包含一包含所儲存之視訊資料的電腦可讀儲存媒體。以此方式,本發明中所描述之技術可應用於實況、串流、即時音訊及視訊資料或應用於被封存、預先記錄之音訊及視訊資料。
對應於視訊圖框之音訊圖框大體上為含有音訊資料之音訊圖框,該音訊資料由音訊源22俘獲,同時,視訊圖框內所含有之視訊資料由視訊源24俘獲。舉例而言,在說話之參與者大體上由於說話產生音訊資料時,音訊源22俘獲該音訊資料,且同時(亦即,在音訊源22正俘獲音訊資料時)視訊源24俘獲該說話之參與者之視訊資料。因此,音訊圖框可在時間上對應於一或多個特定視訊圖框。因此,音訊圖框對應於視訊圖框大體上對應於如下情形:音訊資料及視訊資料同時被俘獲且音訊圖框及視訊圖框分別包含同時俘獲之音訊資料及視訊資料。
在一些實例中,音訊編碼器26可在每一經編碼之音訊圖框中編碼表示經編碼之音訊圖框之音訊資料被記錄之時間的時戳,且類似地,視訊編碼器28可在每一經編碼之視訊圖框中編碼表示經編碼之視訊圖框之視訊資料被記錄之時間的時戳。在此等實例中,音訊圖框對應於視訊圖框可包含一音訊圖框包含時戳及一視訊圖框包含相同時戳。A/V源器件20可包括內部時脈,音訊編碼器26及/或視訊編碼器28可自其產生時戳,或音訊源22及視訊源24可用其分別使音訊與視訊資料與時戳相關聯。
在一些實例中,音訊源22可將對應於音訊資料被記錄之時間的資料發送至音訊編碼器26,且視訊源24可將對應於視訊資料被記錄之時間的資料發送至視訊編碼器28。在一些實例中,音訊編碼器26可在經編碼之音訊資料中編碼序列識別符以指示經編碼之音訊資料之相對時間排序,但未必指示音訊資料被記錄之絕對時間,且類似地,視訊編碼器28亦可使用序列識別符以指示經編碼之視訊資料之相對時間排序。類似地,在一些實例中,序列識別符可與時戳進行映射或以其他方式與時戳相關。
本發明之技術大體而言係針對經編碼之多媒體(例如,音訊及視訊)資料之傳送,及經傳送之多媒體資料的接收以及後續解譯及解碼。本發明之技術特定而言適用於多視圖視訊編碼(MVC)資料(亦即,包含複數個視圖之視訊資料)之傳送。如圖1之實例中所示,視訊源24可將場景之複數個視圖提供給視訊編碼器28。MVC可有用於產生待由三維顯示器(諸如,立體或自動立體三維顯示器)使用的三維視訊資料。
A/V源器件20可將「服務」提供給A/V目的地器件40。服務大體上對應於MVC資料之可用視圖之子集。舉例而言,MVC資料可用於八個視圖,其以零至七排序。一服務可對應於具有兩個視圖之立體視訊,而另一服務可對應於四個視圖,且又一服務可對應於所有八個視圖。大體而言,服務對應於可用視圖之任何組合(亦即,任何子集)。服務亦可對應於可用視圖以及音訊資料之組合。操作點可對應於服務,以使得A/V源器件20可向由A/V源器件20所提供之每一服務進一步提供一操作點描述符。
根據本發明之技術,A/V源器件20能夠提供對應於視圖之子集之服務。大體而言,視圖係由視圖識別符(亦稱作「view_id」)表示。視圖識別符大體上包含可用以識別視圖之語法元素。在編碼一視圖時,MVC編碼器提供該視圖之view_id。view_id可由M VC解碼器用於視圖間預測或由其他單元用於其他目的(例如,用於呈現)。
視圖間預測為用於參考處於共同時間位置之一或多個圖框而將一圖框之MVC視訊資料編碼為不同視圖之經編碼之圖框的技術。下文更詳細論述之圖7提供用於視圖間預測之一實例編碼方案。大體而言,可在空間上、時間上及/或參考處於共同時間位置之其他視圖之圖框來預測性編碼MVC視訊資料之經編碼之圖框。因此,參考視圖(自其預測其他視圖)大體上在諸視圖(參考視圖充當其參考)之前被解碼,以使得在解碼參考視圖時此等經解碼之視圖可用於參考。解碼次序未必對應於view_id之次序。因此,使用視圖次序索引來描述視圖之解碼次序。視圖次序索引為指示存取單元中之對應視圖分量之解碼次序的索引。
資料之每一個別串流(無論音訊或是視訊)被稱作基本串流。基本串流為節目之單一經數位編碼(可能經壓縮)之分量。舉例而言,節目之經編碼之視訊或音訊部分可為基本串流。在將基本串流多工成節目串流或傳送串流之前,可將其轉換成封包化之基本串流(PES)。在同一節目內,串流ID用以區別屬於一基本串流之PES封包與其他PES封包。基本串流之資料之基本單位為封包化之基本串流(PES)封包。因此,MVC視訊資料之每一視圖對應於各別基本串流。類似地,音訊資料對應於一或多個各別基本串流。
可將MVC經編碼之視訊序列分離成若干子位元串流,其中之每一者為一基本串流。可使用MVC view_id子集來識別每一子位元串流。基於每一MVC view_id子集之概念,定義MVC視訊子位元串流。MVC視訊子位元串流含有在MVC view_id子集中所列出之視圖之網路抽象層(NAL)單元。節目串流大體上僅含有來自彼等基本串流之NAL單元。其亦經設計使得任何兩個基本串流不能含有一相同視圖。
在圖1之實例中,多工器30自視訊編碼器28接收包含視訊資料之基本串流且自音訊編碼器26接收包含音訊資料之基本串流。在一些實例中,視訊編碼器28及音訊編碼器26可各自包括用於自經編碼之資料形成PES封包之封包化器。在其他實例中,視訊編碼器28及音訊編碼器26可各自與用於自經編碼之資料形成PES封包之封包化器介接。在又其他實例中,多工器30可包括用於自經編碼之音訊及視訊資料形成PES封包之封包化器。
如本發明中所使用之「節目」可包含音訊資料與視訊資料之組合,例如,音訊基本串流及由A/V源器件20之服務遞送之可用視圖之子集。每一PES封包包括識別該PES封包所屬之基本串流之stream_id。多工器30負責將基本串流組譯成構成節目串流或傳送串流。節目串流及傳送串流為以不同應用為目標的兩個替代多工產物。
大體而言,節目串流包括關於一個節目之資料,而傳送串流可包括關於一或多個節目之資料。多工器30可基於所提供之服務、媒體(串流將被傳遞至其中)、待發送之節目之數目或其他考慮因素而編碼節目串流或傳送串流中之一者或兩者。舉例而言,當視訊資料待編碼於儲存媒體中時,多工器30可較可能形成節目串流,而當視訊資料待經由網路而串流傳輸、作為視訊電話之部分而廣播或發送時,多工器30可較可能使用傳送串流。
多工器30可能偏向於將節目串流用於儲存單一節目及自數位儲存服務顯示單一節目。節目串流意欲用於無錯誤環境或較不易遭遇錯誤之環境中,因為節目串流相當易受錯誤影響。節目串流僅包含屬於其之基本串流且通常含有具有可變長度之封包。在節目串流中,自起作用之基本串流導出之PES封包組織成「封裝」。封裝包含按照任何次序之封裝標頭、選用之系統標頭及自起作用之基本串流中之任意者獲得之任何數目個PES封包。系統標頭含有節目串流之特性(諸如,其最大資料速率、起作用之視訊及音訊基本串流之數目、另外時序資訊或其他資訊)之概述。解碼器可使用系統標頭中所含有之資訊以判定該解碼器是否能夠解碼節目串流。
多工器30可將傳送串流用於經由可能之易於出錯之頻道同時遞送複數個節目。傳送串流為經設計以用於諸如廣播之多節目應用以使得單一傳送串流可容納許多獨立節目之多工產物。傳送串流可包含一連串傳送封包,傳送封包中之每一者長188位元組。使用較短固定長度之封包使得與節目串流相比,傳送串流較不易受錯誤影響。另外,可藉由經由標準錯誤防護程序(諸如,李德-所羅門(Reed-Solomon)編碼)處理每一188位元組長之傳送封包而給予該封包額外錯誤防護。舉例而言,傳送串流之改良之錯誤回復意謂其具有倖免於在廣播環境中發現之易於出錯之頻道的較佳機會。
可看出,與節目串流相比,傳送串流歸因於其增加之錯誤回復及載運許多同時節目之能力而為較佳的。然而,傳送串流為比節目串流複雜之多工產物,且因此與節目串流相比,較難以建立且較複雜解多工。傳送封包之第一位元組可為具有值0x47(十六進制47,二進位「01000111」,十進制71)的同步位元組。單一傳送串流可載運許多不同節目,每一節目包含許多封包化之基本串流。多工器30可使用十三位元之封包識別符(PID)欄位以區別含有一個基本串流之資料的傳送封包與載運其他基本串流之資料的彼等傳送封包。確保向每一基本串流給予唯一PID值為多工器之責任。傳送封包之最後位元組可為連續性計數欄位。多工器30在屬於同一基本串流的連續傳送封包之間使連續性計數欄位之值遞增。此使目的地器件(諸如,A/V目的地器件40)之解碼器或其他單元能夠偵測傳送封包之損失或增益,且有希望隱藏可能另外因此種事件所致之錯誤。
多工器30自音訊編碼器26及視訊編碼器28接收節目之基本串流之PES封包,且自該等PES封包形成對應網路抽象層(NAL)單元。在H.264/AVC(進階視訊編碼)之實例中,經編碼之視訊片段組織成NAL單元,其提供解決諸如視訊電話、儲存、廣播或串流之應用的「網路易用(network-friendly)」視訊表示。可將NAL單元分類成視訊編碼層(VCL)NAL單元及非VCL NAL單元。VCL單元含有核心壓縮引擎且可包含區塊、巨集區塊及/或切片層級。其他NAL單元為非VCL NAL單元。
多工器30可形成NAL單元,其包含一識別NAL所屬之節目之標頭,以及一有效負載(例如,音訊資料、視訊資料或描述NAL單元所對應的傳送或節目串流之資料)。舉例而言,在H.264/AVC中,NAL單元包括一1位元組標頭及一具有變化大小之有效負載。在一實例中,NAL單元標頭包含priority_id元素、temporal_id元素、anchor_pic_flag元素、view_id元素、non_idr_flag元素及inter_view_flag元素。在習知MVC中,留存由H.264定義之NAL單元,除了首碼NAL單元及MVC編碼切片NAL單元(其包括4位元組MVC NAL單元標頭及NAL單元有效負載)之外。
NAL標頭之priority_id元素可用於簡單之單路徑位元串流調適程序。temporal_id元素可用於指定對應NAL單元之時間層級,其中不同時間層級對應於不同圖框速率。
anchor_pic_flag元素可指示圖像是錨定圖像或是非錨定圖像。可正確地解碼錨定圖像及在輸出次序(亦即,顯示次序)上在其之後的所有圖像,而不解碼在解碼次序(亦即,位元串流次序)上之先前圖像,且因此錨定圖像及在輸出次序(亦即,顯示次序)上在其之後的所有圖像可用作隨機存取點。錨定圖像及非錨定圖像可具有不同相依性,其兩者皆在序列參數集合中用信號發送。將論述其他旗標且在此章之以下章節中使用其他旗標。此種錨定圖像亦可被稱作開放GOP(圖像群組)存取點,而在non_idr_flag元素等於零時,封閉GOP存取點亦得以支援。non_idr_flag元素指示圖像為瞬時解碼器再新(IDR)或是視圖IDR(V-IDR)圖像。大體而言,可正確地解碼IDR圖像及在輸出次序或位元串流次序上在其之後的所有圖像,而不解碼在解碼次序或顯示次序上之先前圖像。
view_id元素可包含可用以識別視圖之語法資訊,其可用於MVC解碼器內部之資料互動以(例如)用於視圖間預測及解碼器外部之資料互動以(例如)用於呈現。inter_view_flag元素可指定對應NAL單元是否由其他視圖用於視圖間預測。為了傳達基礎視圖之4位元組NAL單元標頭資訊(其可符合AVC),在MVC中定義首碼NAL單元。在MVC之情形下,基礎視圖存取單元包括視圖之當前時間瞬時之VCL NAL單元以及其首碼NAL單元,該首碼NAL單元僅含有NAL單元標頭。H.264/AVC解碼器可忽視首碼NAL單元。
在有效負載中包括視訊資料的NAL單元可包含各種細微度等級之視訊資料。舉例而言,NAL單元可包含視訊資料之區塊、巨集區塊、複數個巨集區塊、視訊資料之切片,或視訊資料之整個圖框。多工器30可自視訊編碼器28接收呈基本串流之PES封包之形式的經編碼之視訊資料。多工器30可藉由將stream_id映射至(例如,資料庫或其他資料結構中的)對應節目(諸如,節目映射表(PMT)或節目串流映射(PSM))而使每一基本串流與對應節目相關聯。
多工器30亦可自複數個NAL單元組譯存取單元。大體而言,存取單元可包含用於表示視訊資料之圖框以及對應於該圖框之音訊資料(在此音訊資料可用時)之一或多個NAL單元。存取單元大體上包括一輸出時間瞬時之所有NAL單元,例如,一時間瞬時之所有音訊及視訊資料。舉例而言,若每一視圖具有20個圖框/秒(fps)之圖框速率,則每一時間瞬時可對應於0.05秒之時間間隔。在此時間間隔期間,可同時呈現同一存取單元(同一時間瞬時)之所有視圖的特定圖框。在對應於H.264/AVC之實例中,存取單元可包含一時間瞬時中之經編碼之圖像,其可呈現為主要經編碼之圖像。因此,存取單元可包含共同時間瞬時之所有音訊及視訊圖框,例如,對應於時間X之所有視圖。本發明亦將特定視圖之經編碼之圖像稱作「視圖分量」。亦即,視圖分量可包含在特定時間之特定視圖的經編碼之圖像(或圖框)。因此,可將存取單元定義為包含共同時間瞬時之所有視圖分量。存取單元之解碼次序未必需要與輸出次序或顯示次序相同。
多工器30亦可將關於節目之資料嵌入於NAL單元中。舉例而言,多工器30可建立包含節目映射表(PMT)或節目串流映射(PSM)之NAL單元。大體而言,PMT用以描述傳送串流,而PSM用以描述節目串流。如下文關於圖2之實例更詳細描述,多工器30可包含資料儲存單元或與資料儲存單元互動,該資料儲存單元使自音訊編碼器26及視訊編碼器28接收之基本串流與節目相關聯,且相應地與各別傳送串流及/或節目串流相關聯。
與大多數視訊編碼標準一樣,H.264/AVC定義無錯誤位元串流之語法、語義及解碼程序,其中之每一者符合特定設定檔或層級。H.264/AVC不指定編碼器,但編碼器之任務為保證對於解碼器而言所產生之位元串流為符合標準的。在視訊編碼標準之情形下,「設定檔」對應於演算法、特徵或工具及施加至演算法、特徵或工具之約束之子集。舉例而言,如由H.264標準所定義,「設定檔」為由H.264標準指定之整個位元串流語法之子集。「層級」對應於解碼器資源消耗之限制,諸如,與圖像之解析度、位元速率及巨集區塊(MB)處理速率有關之解碼器記憶體及計算。
舉例而言,H.264標準認識到,在由給定設定檔之語法強加之界限內,視由位元串流中之語法元素所採用之值(諸如,經解碼之圖像之指定大小),仍有可能需要編碼器及解碼器之效能的大變化。H.264標準進一步認識到,在許多應用中,實施能夠處理特定設定檔內之語法之所有假定用途之解碼器既不實用亦不經濟。因此,H.264標準將「層級」定義為對位元串流中之語法元素之值所強加的約束之指定集合。此等約束可為對諸值之簡單限制。或者,此等約束可採用對諸值之算術組合(例如,圖像寬度乘以圖像高度乘以每秒所解碼之圖像之數目)之約束之形式。H.264標準進一步提供,個別實施可支援每一所支援之設定檔之不同層級。
符合設定檔之解碼器通常支援該設定檔中所定義之所有特徵。舉例而言,作為編碼特徵,B圖像編碼在H.264/AVC之基線設定檔中未被支援,但在H.264/AVC之其他設定檔中得以支援。符合層級之解碼器應能夠解碼不需要超出該層級中所定義之限制的資源之任何位元串流。設定檔及層級之定義可幫助實現可解譯性。舉例而言,在視訊傳輸期間,針對整個傳輸作業階段之一對設定檔及層級定義可經協商並達成一致。更具體言之,在H.264/AVC中,層級可定義(例如)對以下各項之限制:需要經處理之巨集區塊之數目、經解碼之圖像緩衝器(DPB)大小、經編碼之圖像緩衝器(CPB)大小、垂直運動向量範圍、每兩個連續MB之運動向量之最大數目,及B區塊是否可具有小於8×8像素之子巨集區塊分割區。以此方式,解碼器可判定該解碼器是否能夠適當解碼位元串流。
參數集合大體上含有序列參數集合(SPS)中之序列層標頭資訊及圖像參數集合(PPS)中之偶爾改變之圖像層標頭資訊。就參數集合而言,每一序列或圖像之此偶爾改變之資訊無需重複;因此,編碼效率可改良。此外,參數集合之使用可致使能夠頻帶外傳輸標頭資訊,從而避免為達成錯誤回復之冗餘傳輸之需要。在頻帶外傳輸中,將參數集合NAL單元在與其他NAL單元不同的頻道上傳輸。
MPEG-2系統標準藉由「描述符」允許系統之延伸。PMT與PSM兩者皆包括描述符迴圈,一或多個描述符可插入於描述符迴圈中。大體而言,描述符可包含可用以延伸節目及/或節目元素之定義的資料結構。本發明描述用於執行本發明之技術之操作點。大體而言,本發明之操作點描述符藉由描述操作點之呈現能力、解碼能力及位元速率而增強習知MVC延伸描述符。目的地器件(諸如,A/V目的地器件40)可使用每一操作點之操作點描述符以選擇待解碼之位元串流之操作點中之一者。
每一PMT或PSM可包括描述操作點之特性之操作點描述符。舉例而言,源器件20可提供操作點描述符以提供描述用戶端器件40之呈現能力之呈現能力值。為了使用戶端器件40適當呈現(例如,顯示)操作點之視訊資料,用戶端器件40應滿足藉由呈現能力值來用信號發送之呈現能力。呈現能力值可描述(例如)待顯示之視圖之數目(例如,以呈現為目標之視圖之數目)及/或視圖之視訊資料之圖框速率。因此,用戶端器件40可判定,當用戶端器件40之視訊輸出44能夠在由操作點描述符指定之圖框速率下顯示操作點之視圖的數目時,呈現能力得以滿足。
在源器件20使用多播或廣播協定傳輸MVC位元串流之實例中,源器件20可將整個MVC位元串流封包化成傳送串流,其可由具有各種呈現能力之用戶端器件接收。舉例而言,一些三維節目可具有不同數目個視圖(例如,兩個視圖、四個視圖、六個視圖或八個視圖),且各種器件可能夠使用一對視圖與四對視圖之間的任何地方。因此,每一用戶端器件可基於可由用戶端器件顯示的視圖之所支援數目而判定將使用哪一操作點。舉例而言,用戶端器件40可藉由判定可由視訊輸出44顯示之視圖之數目及視訊輸出44能夠顯示視訊資料之圖框速率及判定基於視訊輸出44之呈現能力應使用諸操作點中之哪一者來判定將使用諸操作點中之哪一者。
在源器件使用單播協定傳輸MVC位元串流之實例中,用戶端器件40可藉由檢查在對應操作點描述符中所指定之呈現能力而建立對應於具有可接受數目個視圖之節目之作業階段。類似地,在MVC位元串流經編碼於電腦可讀儲存媒體中以供本地播放之實例中,用戶端器件40可藉由檢查PMT或PSM之操作點描述符中所指定之呈現能力而選擇合適節目。
源器件20亦可在操作點描述符中提供解碼能力值。待解碼之視圖之數目可能未必與待顯示之視圖之數目相同。因此,操作點描述符可分別用信號發送操作點之待顯示之視圖之數目及操作點之待解碼之視圖之數目。此外,操作點描述符可特定識別對應於操作點之視圖。特定用戶端器件可(例如)基於檢視圖度而(針對各種目的)偏好於特定視圖。因此,用戶端器件40可經組態以基於哪些視圖可用於操作點中而選擇操作點。
在一些實例中,在操作點中用信號發送之解碼能力可另外或替代地指定該操作點所對應之設定檔及層級。在源器件20使用多播或廣播協定傳輸位元串流之實例中,具有不同解碼能力之各種用戶端器件可接收該位元串流。舉例而言,一些解碼器可能僅能夠在30 fps下解碼兩個視圖,而一些解碼器可能夠在60 fps下解碼四個視圖。在源器件20使用單播協定傳輸位元串流之實例中,用戶端器件40可在檢查PMT中之描述符中所指定的解碼能力之後建立合適作業階段(針對特定三維節目)。類似地,針對本地播放,用戶端器件40可藉由檢查PMT或PSM之操作點描述符中所指定之解碼能力而選擇合適節目。
源器件20可另外在操作點描述符中用信號發送位元速率資訊。位元速率資訊可描述操作點之平均位元速率及/或最大位元速率中之一者或兩者。舉例而言,當源器件20使用單播協定傳輸位元串流時,可在頻寬方面限制用以傳輸該位元串流之頻道。因此,用戶端器件40可選擇具有通信頻道之可容許最大或平均位元速率之操作點。
在一些實例中,源器件20可進一步在操作點描述符中指定操作點之圖框速率。操作點之特定視圖可具有與操作點之圖框速率不匹配之圖框速率。因此,用戶端器件40可判定操作點之圖框速率及此視圖之圖框速率以簡化為達成顯示視訊資料之目的而重新組譯經解碼之視訊資料之程序。在各種實例中,當兩個操作點之圖框速率不匹配時,用戶端器件40可丟棄來自具有較高圖框速率之操作點之視圖的圖框或內插來自具有較低圖框速率之操作點之視圖的圖框。
通常,基本串流包括旗標「no_sei_nal_unit_present」及「no_prefix_nal_unit_present」,其分別描述該基本串流是否包括SEI訊息及首碼NAL單元。本發明提議用戶端器件(諸如,用戶端器件40)推斷SEI訊息及/或首碼NAL單元是否存在於操作點內,而非明確地用信號發送操作點之此等值。為了判定SEI訊息是否存在於操作點中,用戶端器件40可判定該操作點之基本串流之no_sei_nal_unit_present值的最大值是否等於一。類似地,為了判定首碼NAL單元是否存在於操作點中,用戶端器件40可判定該操作點之基本串流之no_prefix_nal_unit_present值的最大值是否等於上文所論述之實例已聚焦於關於MVC位元串流之每一操作點所包括之操作點描述符。作為一替代,源器件20可提供用信號發送類似資料之MVC延伸描述符。舉例而言,源器件20可使一個以上MVC延伸描述符與對應於基本串流之MVC視訊子位元串流相關聯。源器件20可在子位元串流之MVC延伸描述符中指定待顯示之視圖之圖框速率、view_id子集及待解碼之視圖之數目。源器件20可進一步用信號發送MVC延伸描述符與對應操作點之間的映射。
諸如ITU-T H.261、H.262、H.263、MPEG-1、MPEG-2及H.264/MPEG-4第10部分之視訊壓縮標準利用運動補償時間預測以減少時間冗餘。編碼器使用來自一些先前編碼之圖像(在本文中亦被稱作圖框)之運動補償預測以根據運動向量預測當前經編碼之圖像。在典型視訊編碼中存在三種主要圖像類型。其為經圖框內編碼之圖像(「I圖像」或「I圖框」)、經預測之圖像(「P圖像」或「P圖框」)及經雙向預測之圖像(「B圖像」或「B圖框」)。P圖像僅使用在時間次序上在當前圖像之前的參考圖像。在B圖像中,可自一或兩個參考圖像預測B圖像之每一區塊。此等參考圖像可在時間次序上位於當前圖像之前或之後。
根據H.264編碼標準,作為一實例,B圖像使用先前經編碼之參考圖像之兩個清單,清單0及清單1。此兩個清單可各自含有在時間次序上之過去及/或未來經編碼之圖像。可按以下若干方式中之一者預測B圖像中之區塊:來自清單0參考圖像之運動補償預測、來自清單1參考圖像之運動補償預測,或來自清單0參考圖像與清單1參考圖像兩者之組合之運動補償預測。為了得到清單0參考圖像與清單1參考圖像兩者之組合,分別自清單0參考圖像與清單1參考圖像獲得兩個運動補償參考區域。其組合將用以預測當前區塊。
ITU-T H.264標準支援:以各種區塊大小進行之圖框內預測,諸如,針對亮度分量之16乘16、8乘8或4乘4以及針對色度分量之8×8;以及以各種區塊大小進行之圖框間預測,諸如,針對亮度分量之16×16、16×8、8×16、8×8、8×4、4×8及4×4以及針對色度分量之對應按比例調整之大小。在本發明中,「×」與「乘」可互換地使用以指代在垂直尺寸與水平尺寸方面的區塊之像素尺寸,例如,16×16像素或16乘16像素。大體而言,16×16區塊將具有垂直方向上之16個像素(y=16)及水平方向上之16個像素(x=16)。同樣地,N×N區塊大體上具有垂直方向上之N個像素及水平方向上之N個像素,其中N表示非負整數值。可以列及行配置區塊中之像素。
小於16乘16之區塊大小可被稱作16乘16巨集區塊之分割區。視訊區塊可包含像素域中之像素資料之區塊,或(例如)在將諸如離散餘弦變換(DCT)、整數變換、小波變換或概念上類似之變換的變換應用於殘餘視訊區塊資料之後的變換域中之變換係數的區塊,該殘餘視訊區塊資料表示經編碼之視訊區塊與預測性視訊區塊之間的像素差。在一些狀況下,視訊區塊可包含變換域中之經量化之變換係數的區塊。
較小視訊區塊可提供較佳解析度,且可用於定位包括高層級細節之視訊圖框。大體而言,巨集區塊及各種分割區(有時被稱作子區塊)可被視為視訊區塊。另外,切片可被視為複數個視訊區塊,諸如,巨集區塊及/或子區塊。每一切片可為視訊圖框之可獨立解碼之單元。或者,圖框自身可為可解碼單元,或圖框之其他部分可被定義為可解碼單元。術語「經編碼之單元」或「編碼單元」可指代視訊圖框之任何可獨立解碼的單元,諸如,整個圖框、圖框之切片、圖像群組(GOP)(亦被稱作序列),或根據適用編碼技術所定義之另一可獨立解碼的單元。
術語巨集區塊指代用於根據包含16×16像素之二維像素陣列編碼圖像及/或視訊資料的資料結構。每一像素包含一色度分量及一亮度分量。因此,巨集區塊可定義:四個亮度區塊,其各自包含8×8像素之二維陣列;兩個色度區塊,其各自包含16×16像素之二維陣列;及一標頭,其包含語法資訊,諸如,編碼區塊型樣(CBP)、編碼模式(例如,圖框內(I)或圖框間(P或B)編碼模式)、圖框內編碼之區塊之分割區的分割大小(例如,16×16、16×8、8×16、8×8、8×4、4×8或4×4),或圖框間編碼之巨集區塊的一或多個運動向量。
視訊編碼器28、視訊解碼器48、音訊編碼器26、音訊解碼器46、多工器30及解多工器38各自可在適用時實施為多種合適編碼器或解碼器電路中之任意者,諸如,一或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯電路、軟體、硬體、韌體或其任何組合。視訊編碼器28及視訊解碼器48中之每一者可包括於一或多個編碼器或解碼器中,其中任意者可整合為組合之視訊編碼器/解碼器(編解碼器)的部分。同樣地,音訊編碼器26及音訊解碼器46中之每一者可包括於一或多個編碼器或解碼器中,其中任意者可整合為組合之編解碼器的部分。包括視訊編碼器28、視訊解碼器48、音訊編碼器26、音訊解碼器46、多工器30及/或解多工器38的裝置可包含積體電路、微處理器及/或諸如蜂巢式電話之無線通信器件。
與關於MVC子位元串流之習知技術(其不提供操作點之發信號特性)相比,本發明之技術可提供特定優點。每一子位元串流可包括對應位元串流之一或多個視圖。在一些狀況下,操作點可對應於不同位元串流之視圖。本發明之技術提供識別對應操作點之視圖之操作點描述符。
在多工器30已自所接收之資料組譯NAL單元及/或存取單元之後,多工器30將該單元傳遞至輸出介面32以供輸出。輸出介面32可包含(例如)傳輸器、收發器、用於將資料寫入至電腦可讀媒體(諸如,光碟機、磁性媒體磁碟機(例如,軟性磁碟))之器件、通用串列匯流排(USB)埠、網路介面或其他輸出介面。輸出介面32將NAL單元或存取單元輸出至電腦可讀媒體34,諸如,傳輸信號、磁性媒體、光學媒體、記憶體、隨身碟或其他電腦可讀媒體。
最後,輸入介面36自電腦可讀媒體34擷取資料。輸入介面36可包含(例如)光碟機、磁性媒體磁碟機、USB埠、接收器、收發器或其他電腦可讀媒體介面。輸入介面36可將NAL單元或存取單元提供至解多工器38。解多工器38可將傳送串流或節目串流解多工成構成PES串流,對該等PES串流解封包化以擷取經編碼之資料,且視該經編碼之資料為音訊串流或是視訊串流的部分(例如,如由串流之PES封包標頭所指示)而將該經編碼之資料發送至音訊解碼器46或視訊解碼器48。音訊解碼器46解碼經編碼之音訊資料且將該經解碼之音訊資料發送至音訊輸出42,而視訊解碼器48解碼經編碼之視訊資料且將該經解碼之視訊資料(其可包括串流之複數個視圖)發送至視訊輸出44。視訊輸出44可包含使用場景之複數個視圖之顯示器,例如,同時呈現場景之每一視圖之立體或自動立體顯示器。
詳言之,解多工器38可選擇所接收之位元串流之操作點。舉例而言,解多工器38可比較該位元串流之操作點之特性以選擇待由A/V目的地器件40使用之適當操作點。大體而言,解多工器38可試圖選擇該等操作點中之將向使用者提供最高品質檢視體驗的可由視訊解碼器48解碼之一操作點。舉例而言,解多工器38可將視訊解碼器48之呈現能力及解碼能力與藉由位元串流之操作點描述符用信號發送之所建議之呈現能力及解碼能力比較。關於解多工器38判定可由視訊解碼器48適當解碼之操作點,解多工器38可選擇將提供最高品質視訊資料(例如,最高圖框速率及/或位元速率)之操作點。在其他實例中,解多工器38可基於其他考慮(諸如,電力消耗)來選擇所支援之操作點中之一操作點。
圖2為說明多工器30(圖1)之組件之實例配置的方塊圖。在圖2之實例中,多工器30包括串流管理單元60、視訊輸入介面80、音訊輸入介面82、經多工串流輸出介面84,及節目特定資訊表88。串流管理單元60包括NAL單元建構器62、PMT建構器64、串流識別符(串流ID)查詢單元66,及節目識別符(PID)指派單元68。
在圖2之實例中,視訊輸入介面80及音訊輸入介面82包括用於自經編碼之視訊資料及經編碼之音訊資料形成PES單元的各別封包化器。在其他實例中,視訊及/或音訊封包化器可包括於在多工器30外部的單元或模組中。關於圖2之實例,視訊輸入介面80可自接收自視訊編碼器28的經編碼之視訊資料形成PES封包,且音訊輸入介面82可自接收自音訊編碼器26的經編碼之音訊資料形成PES封包。
串流管理單元60自視訊輸入介面80及音訊輸入介面82接收PES封包。每一PES封包包括識別該PES封包所屬之基本串流之串流ID。串流ID查詢單元66可藉由查詢節目特定資訊表88而判定PES封包所對應的節目。亦即,串流ID查詢單元66可判定所接收之PES封包對應於哪一節目。每一節目可包含複數個基本串流,而大體而言,一個基本串流對應於僅一個節目。然而,在一些實例中,基本串流可包括於複數個節目中。因為各種服務可各自包括可用音訊及視訊串流之各種子集,所以每一PES封包可包括於自多工器30輸出之複數個串流中。因此,串流ID查詢單元66可判定PES封包是否應包括於一或多個輸出串流(例如,一或多個傳送或節目串流)中,且特定言之判定在該等輸出串流中之哪一者中包括該PES封包。
在一實例中,每一基本串流對應於一節目。多工器30可負責確保每一基本串流與特定節目相關聯,且相應地與節目ID(PID)相關聯。當接收包括未由多工器30辨識之串流ID(例如,未儲存於節目特定資訊表88中之串流ID)的PES封包時,PID指派單元68在節目特定資訊表88中建立一或多個新項目以使新串流ID與未使用的PID相關聯。
在判定PES封包所對應的節目之後,NAL單元建構器62(例如)藉由將該PES封包與NAL單元標頭(其包括該PES封包之串流ID所對應的節目之PID)囊封在一起而形成包含該PES封包的NAL單元。在一些實例中,NAL單元建構器62或串流管理單元60之另一子單元可形成包含複數個NAL單元的存取單元。
PMT建構器64使用來自節目特定資訊表88之資訊建立多工器30之對應輸出串流之節目映射表(PMT)。在另一實例中,串流管理單元60可包含用於建立由多工器30輸出之節目串流之節目串流映射的PSM建構器。在一些實例中,多工器30可包含PMT建構器64及PSM建構器兩者且輸出傳送串流及節目串流中之一者或兩者。在圖2之實例中,PMT建構器64可建構一PMT,該PMT包括由本發明描述之新描述符(例如,操作點描述符以及任何其他必要描述符)及其PMT資料。PMT建構器64可週期性地(例如,在特定時間週期之後或在已傳輸特定量之資料之後)發送傳送串流之後續PMT。PMT建構器64可(例如)將所建立之PMT傳遞至NAL單元建構器62,以用於藉由將PMT與對應NAL單元標頭(其包括對應PID)囊封在一起而形成包含PMT的NAL單元。
PMT建構器64可建立節目之每一操作點之資料結構(諸如,操作點描述符)。由PMT建構器64建立之資料結構可用信號發送以下各者:描述接收器件使用該操作點待滿足的呈現能力之呈現能力值、描述接收器件使用該操作點待滿足的解碼能力之解碼能力值,及描述該操作點之位元速率之位元速率值。
舉例而言,PMT建構器64可基於由節目特定資訊表88儲存之資訊或經由視訊輸入介面80自視訊編碼器28接收之資訊來判定操作點之待顯示之視圖的數目及操作點之視圖之圖框速率。PMT建構器64可使用資料結構之呈現能力值用信號發送操作點之視圖之數目及操作點之視圖之圖框速率中的一者或兩者。
PMT建構器64亦可判定操作點之待解碼之視圖的數目及操作點之視圖所對應之設定檔的層級值。舉例而言,PMT建構器64可判定需要經處理之巨集區塊之數目、經解碼之圖像緩衝器大小、經編碼之圖像緩衝器大小、垂直運動向量範圍、每兩個連續巨集區塊之運動向量之最大數目,及/或B區塊是否可具有小於8×8像素之子巨集區塊分割區,且使用此等判定以判定操作點之層級。PMT建構器64可經由視訊輸入介面80自視訊編碼器28接收此資訊。PMT建構器64可接著使用操作點之解碼能力值表示待解碼之視圖之數目及/或設定檔之層級值。
PMT建構器64可進一步判定操作點之位元速率值且將該位元速率值編碼於資料結構中。位元速率值可對應於操作點之平均位元速率或最大位元速率。PMT建構器64可計算操作點之位元速率或自視訊編碼器28接收位元速率之指示。
經多工串流輸出介面84可自串流管理單元60接收一或多個NAL單元及/或存取單元,例如,包含PES封包(例如,音訊或視訊資料)之NAL單元及/或包含PMT之NAL單元。在一些實例中,在自串流管理單元60接收對應於共同時間位置的一或多個NAL單元之後,經多工串流輸出介面84可自該等NAL單元形成存取單元。經多工串流輸出介面84將該等NAL單元或存取單元作為輸出而在對應傳送串流或節目串流中傳輸。經多工串流輸出介面84亦可自PMT建構器64接收資料結構且包括該資料結構作為位元串流之部分。
圖3為說明節目特定資訊表88之實例集合的方塊圖。可基於傳送封包之PID值判定該傳送封包所屬的基本串流。為了使解碼器適當解碼所接收之資料,該解碼器需要能夠判定屬於每一節目之基本串流。如包括於節目特定資訊表88中的節目特定資訊可明確指定節目與分量基本串流之間的關係。在圖3之實例中,節目特定資訊表88包括網路資訊表100、條件存取表102、節目關聯表104,及節目映射表106。對於圖3之實例而言,假定輸出串流包含MPEG-2傳送串流。在一替代實例中,輸出串流可包含節目串流,在此狀況下,可用節目串流映射替換節目映射表106。
MPEG-2系統規範指定載運於傳送串流中之每一節目具有一與其相關聯之節目映射表(諸如,節目映射表106)。節目映射表106可包括關於節目及該節目包括之基本串流之細節。作為一實例,被識別為節目號3之節目可含有具有PID 33之視訊基本串流、具有PID 57之英文音訊串流,及具有PID 60之中文音訊串流。准許PMT包括一個以上節目。
由MPEG-2系統規範指定的基礎節目映射表可附有在該MPEG-2系統規範內指定的許多描述符中之一些(例如,描述符108)。描述符108可包括MPEG-2系統規範之指定描述符中的任意者或全部。大體而言,描述符(諸如,描述符108)傳達關於節目或節目之分量基本串流或子位元串流之其他資訊。該等描述符可包括視訊編碼參數、音訊編碼參數、語言識別、搖攝及掃描資訊、條件存取細節、版權資訊,或其他此種資訊。廣播公司或其他使用者可定義額外私用描述符。
本發明提供一種用以描述符合MPEG-2系統之位元串流中之操作點之特性的操作點描述符。描述符108可包括對應位元串流之每一操作點之操作點描述符。如圖3中所展示,描述符108包括MVC延伸描述符110、階層描述符112及操作點描述符114。操作點描述符114中之每一者可對應於位元串流之特定操作點,且用信號發送關於該操作點之以下各者:描述接收器件使用該操作點待滿足的呈現能力之呈現能力值、描述接收器件使用該操作點待滿足的解碼能力之解碼能力值,及描述操作點之位元速率之位元速率值。在視訊相關之分量基本串流中,亦存在階層描述符,其提供資訊以識別含有經階層式編碼的視訊、音訊及私用串流之分量之節目元素。
下文表1提供包括於MVC延伸描述符110中之資料的一實例。表1中所展示之各種欄位及該等欄位之位元深度僅為一實例。在一實例中,每一MVC視訊子位元串流係與MVC延伸描述符110中之一對應者相關聯,該相應MVC延伸描述符指定對應MVC視訊子位元串流之特性。MVC視訊子位元串流可需要組譯其他MVC視訊子位元串流。亦即,為了解碼並呈現特定子位元串流,用戶端器件可需要自包括兩個子位元串流之常見位元串流之其他子位元串流提取並解碼視訊資料。
在表1之實例中,描述符標籤欄位可對應於包括於每一描述符中以特定識別該描述符之八位元描述符標籤欄位,如由MPEG-2系統標準所闡述。MPEG-2系統標準定義特定描述符標籤且將其他描述符標籤值(例如,值36至63)標記為「保留」。然而,MPEG-2系統標準之修正案4提議將MVC延伸描述符設定成「49」,其對應於如MPEG-2系統規範中所指定的保留描述符標籤中之一者。因此,本發明提議將MVC延伸描述符110之descriptor_tag之值設定成值「49」。
此外,描述符長度欄位可對應於亦包括於每一描述符中之八位元描述符長度欄位,如由MPEG-2系統標準所闡述。多工器30可將描述符長度欄位之值設定成等於MVC延伸描述符110中之緊接描述符長度欄位之後的一對應者之位元組之數目。因為MVC延伸描述符之長度不改變,所以多工器30可將MVC延伸描述符110中之每一者之描述符長度欄位之值設定成值8,以表示在描述符長度欄位之後存在資訊之八個位元組。
平均位元速率欄位可包含指示經重新組譯之AVC視訊串流之平均位元速率(以每秒千位元計)之十六位元欄位。亦即,平均位元速率欄位描述當自MVC延伸描述符110中之一者所對應的傳送串流或節目串流之構成部分組譯一視訊串流時該視訊串流之平均位元速率。在一些實例中,多工器30可將平均位元速率欄位之值設定成零以指示平均位元速率未由MVC延伸描述符110中之一者指示。
最大位元速率欄位可包含指示經重新組譯之AVC視訊串流之最大位元速率(以每秒千位元計)之十六位元欄位。亦即,最大位元速率欄位描述當自MVC延伸描述符110中之一者所對應的傳送串流或節目串流之構成部分組譯一視訊串流時該視訊串流之最大位元速率。在一些實例中,多工器30可將最大位元速率欄位之值設定成零以指示最大位元速率未由MVC延伸描述符110中之一者指示。
視圖次序索引最小值欄位可包含指示相關聯之MVC視訊子位元串流中所含有的所有NAL單元之視圖次序索引之最小值的十位元欄位。類似地,視圖次序索引最大值欄位為指示相關聯之MVC視訊子位元串流中所含有的所有NAL單元之視圖次序索引之最大值的十位元欄位。
時間ID起始欄位可包含指示相關聯之MVC視訊子位元串流中所含有的所有NAL單元之NAL單元標頭語法元素的temporal_id之最小值之三位元欄位。亦即,時間ID值包括於每一NAL單元之標頭中。大體而言,時間ID值對應於特定圖框速率,其中相對較大時間ID值對應於較高圖框速率。舉例而言,時間ID之值「0」可對應於15個圖框/秒(fps)之圖框速率,時間ID之值「1」可對應於30 fps之圖框速率。以此方式,在此實例中,將具有0之時間ID之所有圖像聚集至一集合中可用以形成具有15 fps之圖框速率之視訊片段,而將具有0之時間ID之所有圖像及具有1之時間ID之所有圖像聚集至一不同集合中可用以形成具有30 fps之圖框速率之一不同視訊片段。多工器30判定MVC視訊子位元串流之所有NAL單元之最小時間ID,且將時間ID起始欄位之值設定成等於此經判定之最小時間ID值。
時間ID結束欄位可包含指示相關聯之MVC視訊子位元串流中所含有的所有NAL單元之NAL單元標頭語法元素的時間ID之最大值之三位元欄位。因此,多工器30判定MVC視訊子位元串流之所有NAL單元之最大時間ID,且將時間ID結束欄位之值設定成等於此經判定之最大時間ID值。
無SEI NAL單元存在欄位可包含在設定成「1」時指示無補充增強資訊NAL單元存在於相關聯之MVC視訊子位元串流中的一位元旗標。多工器30可判定一或多個補充增強資訊NAL單元是否已置放於位元串流中,且在位元串流中不存在SEI NAL單元時將無SEI NAL單元存在欄位之值設定成值「1」,而在至少一個SEI NAL單元存在於位元串流中時可將無SEI NAL單元存在欄位之值設定成值「0」。
下文表2提供包括於階層描述符112中之資料的一實例。在MPEG-2系統中,可針對含有嵌入式視訊節目串流之視訊之節目串流定義階層描述符。將表2中所展示之各種欄位及該等欄位之位元深度提供為一實例。hierarchy_layer_index值識別當前節目串流之層索引,且hierarchy_embedded_layer_index值識別相依層。在MVC設計中,一節目串流可視使用階層描述符之另一節目串流而定。亦即,可基於包括於階層描述符中之資料來判定節目串流之間的相依性。
如上文所註,MPEG-2系統規範指定每一描述符包括一描述符標籤欄位及一描述符長度欄位。因此,階層描述符112包括一描述符標籤欄位及一描述符長度欄位。根據MPEG-2系統規範,多工器30可將描述符標籤欄位之值設定成用於階層描述符112之值「4」。
可先驗判定階層描述符112之長度,因為階層描述符112之每一例項應包括相同量之資料。在一實例中,多工器30可將描述符長度欄位之值設定成值4,其指示階層描述符112之例項中在描述符長度欄位之結尾之後的四個位元組。
階層類型欄位描述相關聯之階層式層(hierarchy layer)與其階層式嵌入層之間的階層關係。在一實例中,多工器30基於階層關係設定階層類型欄位之值,例如,如由下文之表3所描述。作為一實例,當可按比例調整性在一個以上維度上適用時,多工器30可將階層類型欄位設定成值「8」(如表3中所展示之「組合之可按比例調整性」),且多工器30根據自各別串流之PES封包及PES封包標頭擷取之資料來設定時間可按比例調整性旗標欄位、空間可按比例調整性旗標欄位及品質可按比例調整性旗標欄位之值。大體而言,多工器30可判定對應於各種視圖及/或音訊資料串流之不同串流之間的相依性。多工器30亦可判定包含一增強層之相依串流為空間層、信號對雜訊比(SNR)增強層、品質增強層或是另一類型之增強層。
作為另一實例,對於MVC視訊子位元串流而言,多工器30可將階層類型欄位設定成值「9」(如表3中所示之「MVC」),且可將時間可按比例調整性旗標欄位、空間可按比例調整性旗標欄位及品質可按比例調整性旗標欄位中之每一者之值設定成「1」。作為又一實例,對於MVC基礎視訊子位元串流而言,多工器30可將階層類型欄位之值設定成值「15」,且可將時間可按比例調整性旗標欄位、空間可按比例調整性旗標欄位及品質可按比例調整性旗標欄位之值設定成「1」。作為再一實例,對於首碼MVC子位元串流而言,多工器30可將階層類型欄位設定成值「14」,且可將時間可按比例調整性旗標欄位、空間可按比例調整性旗標欄位及品質可按比例調整性旗標欄位設定成「1」。
階層式層索引欄位可包含定義編碼層階層之表中的相關聯之節目元素的唯一索引之六位元欄位。索引在單一節目定義內可為唯一的。對於符合ITU-T Rec. H.264|ISO/IEC 14496-10之附件G中所定義的一或多個設定檔之AVC視訊串流之視訊子位元串流而言,此為以如下方式來指派的節目元素索引:在以hierarchy_layer_index之漸增次序重新組譯同一存取單元之視訊子位元串流的相關聯之SVC相依性表示的情況下,位元串流次序將正確。對於符合ITU-TRec. H.264|ISO/IEC 14496-10之附件H中所定義的一或多個設定檔之AVC視訊串流之MVC視訊子位元串流而言,此為以如下方式來指派的節目元素索引:此等值中之任一些大於在首碼MVC子位元串流之階層描述符中指定的hierarchy_layer_index值。
階層式嵌入層索引欄位可包含定義節目元素之階層表索引之六位元欄位,該節目元素需要在解碼與階層描述符112之對應例項相關聯的基本串流之前加以存取。針對階層類型欄位具有值15(亦即,對應於基礎層之值)的情形,本發明保持階層式嵌入層索引欄位之值未經定義。
階層頻道欄位可包含指示傳輸頻道之有序集合中的相關聯之節目元素之預期頻道數目之六位元欄位。關於整個傳輸階層定義,最強健傳輸頻道係由階層頻道欄位之最低值定義。注意,給定階層頻道可同時指派給若干節目元素。
保留表1及表2之保留欄位以供未來由未來標準開發使用。本發明之技術此時不提議將語義意義指派給保留欄位之值。
下文表3說明上文所描述之階層類型欄位之可能值:
在一些實例中,階層描述符112可用以用信號發送藉由遞增式子位元串流及嵌入式子位元串流來用信號發送之MVC子位元串流。嵌入式子位元串流包括對應於hierarchy_embedded_layer_index之直接相依子位元串流及此直接相依子位元串流之所有嵌入式子位元串流。在本發明中,明確含有之視圖被稱為增強視圖,而嵌入之視圖被稱為相依視圖。
在多工器30之輸出包含節目串流的一實例中,節目特定資訊表88可包括節目串流映射(PSM)。PSM可提供對應節目串流中之基本串流之描述及該等基本串流彼此的關係。在一些實例中,節目串流映射亦可對應於傳送串流。當載運於對應傳送串流中時,PSM結構不應加以修改。多工器30可藉由將PES封包之stream_id值設定成0xBC(亦即,十六進制值BC,其對應於二進位值10111100或十進制值188)而指示PSM存在於該PES封包中。
多工器30將可用於傳送串流中的所有節目之完整清單維持於節目關聯表104中。多工器30亦可將節目關聯表嵌入於NAL單元中。多工器30可藉由向NAL單元指派PID值0而指示該NAL單元包括一節目關聯表。多工器30可在節目關聯表104中列出每一節目連同含有對應節目映射表之傳送封包之PID值。使用上文所提及之相同實例,指定節目號3之基本串流的實例節目映射表具有為1001之PID且另一PMT具有為1002之另一PID。此資訊集合或類似資訊集合可包括於節目關聯表104中。
節目特定資訊表88亦包括網路資訊表(NIT)100及條件存取表(CAT)102。如PAT中所指定之節目號零具有特殊意義。詳言之,節目號零可用以指明至網路資訊表100之路線。該表為選用的且當存在時,該表可提供關於載運傳送串流之實體網路之資訊,諸如,頻道頻率、衛星轉頻器細節、調變特性、服務發源站、服務名稱及可用替代網路之細節。
若傳送串流內之任何基本串流被擾亂,則條件存取表102必須存在。條件存取表102提供使用中的擾亂系統之細節,且提供含有條件存取管理及權利資訊之傳送封包之PID值。未在MPEG-2系統標準內指定此資訊之格式。
圖4為說明可包括於操作點描述符114(圖3)中之一者中的資料之實例集合的方塊圖。在圖4之實例中,操作點描述符118包括描述符標籤欄位120、描述符長度欄位122、圖框速率欄位124、顯示視圖之數目欄位126、解碼視圖之數目欄位128、視圖識別符欄位130、平均位元速率欄位132、最大位元速率欄位134、時間識別符欄位136,及保留尾隨位元欄位138。
在圖4之實例中,圖框速率欄位124及顯示視圖之數目欄位126對應於實例呈現能力值、解碼視圖之數目欄位128對應於實例解碼能力值,且平均位元速率欄位132及最大位元速率欄位134對應於實例位元速率值。操作點描述符118僅為可用以用信號發送操作點之特性(諸如,呈現能力、解碼能力及位元速率)之資料結構的一實例。下文之圖5及圖6提供用信號發送此等特性之操作點描述符的替代實例。
如上文所描述,MPEG-2系統規範指定每一描述符具有一描述符標籤欄位及一描述符長度欄位,其各自為8位元。因此,多工器30(圖1)可將一值指派給指示MVC操作點描述符之描述符標籤欄位120。多工器30亦可判定操作點之視圖之數目及操作點描述符之保留位元之數目,且接著計算(以位元組計)在描述符長度欄位122之後的操作點描述符118之長度。多工器30可在將操作點描述符118實體化時將此所計算之長度值指派給描述符長度欄位122。
圖框速率欄位124可包含指示經重新組譯之AVC視訊串流之最大圖框速率(以每256秒之圖框計)之16位元欄位。亦即,多工器30可計算256秒時間週期之最大圖框速率以設定圖框速率欄位124之值。在一些實例中,除以256可導致浮點值轉換至整數值。在其他實例中,可使用除了256秒之外的時間週期。關於圖框速率欄位124所描述之256秒時間週期僅為可用於計算操作點之最大圖框速率之一個可能實例。
顯示視圖之數目欄位126可包含指示經重新組譯之AVC視訊串流之視圖(以輸出為目標)之數目的值之十位元欄位。大體而言,顯示視圖之數目欄位126表示對應操作點之待顯示之視圖的數目。因為不同顯示器可能夠顯示不同數目個視圖,所以用戶端器件可使用顯示視圖之數目欄位126之值以選擇具有與用戶端器件之顯示器上的視圖儘可能一樣多的待顯示之視圖之操作點。舉例而言,若用戶端器件能夠顯示四個視圖,則該用戶端器件可選擇顯示視圖之數目欄位具有指示對應操作點之四個視圖將顯示之值的操作點。因此,顯示視圖之數目欄位126可經包括作為呈現能力值之部分。同樣地,多工器30可根據針對操作點之待顯示之視圖的數目而設定顯示視圖之數目欄位126之值。
解碼視圖之數目欄位128可包含指示解碼經重新組譯之AVC視訊串流所需的視圖之數目的值之十位元欄位。此值可能不同於由顯示視圖之數目欄位126所指示的待顯示之視圖之數目。此可能係因歸因於視圖相依性而使解碼需要特定視圖,但該等視圖實際上未顯示所致。
簡要參看圖7,作為一實例,視圖S0及S1可為針對操作點之待顯示之視圖。可在不解碼任何其他視圖的情況下直接解碼視圖S0。然而,為了解碼視圖S1,亦必須解碼視圖S2,因為視圖S1包括涉及視圖S2之預測資料。因此,在此實例中,顯示視圖之數目欄位126將具有值2,但解碼視圖之數目欄位128將具有值3。在一些實例中,待顯示之視圖可自一或多個其他視圖內插,以使得待顯示之視圖之數目可大於待解碼之視圖之數目。亦即,使用基礎視圖及深度資訊,視訊解碼器48(圖1)可內插第二視圖。視訊解碼器48可使用兩個或兩個以上視圖以計算深度資訊從而內插新視圖,或視訊解碼器48可自源器件20接收視圖之深度資訊。
解碼視圖之數目欄位128可對應於解碼能力值,因為用戶端器件之解碼器(諸如,目的地器件40之視訊解碼器48)應能夠解碼等於解碼視圖之數目欄位128之值的視圖之數目。因此,用戶端器件可選擇具有代表用戶端器件之視訊解碼器能夠解碼之視圖之數目的解碼視圖之數目欄位之操作點。
圖4之操作點描述符118亦包括視圖識別符欄位130。視圖識別符欄位130中之每一者可包含指示經重新組譯之AVC視訊位元串流中所含有的NAL單元之view_id之值的十位元欄位。因此,使用視圖識別符欄位130來用信號發送操作點之每一顯示之視圖的視圖識別符。亦即,視圖識別符欄位130之視圖識別符對應於所顯示之視圖。因此,在圖4之實例中,並未藉由視圖識別符欄位130來用信號發送經解碼但未顯示之視圖。
平均位元速率欄位132可包含指示經重新組譯之AVC視訊串流之平均位元速率(以每秒千位元計)的十六位元欄位。當其經設定成0時,不指示平均位元速率。亦即,平均位元速率欄位132之值0暗示平均位元速率欄位132不應用於判定經重新組譯之AVC視訊串流之平均位元速率。
最大位元速率欄位134可包含指示經重新組譯之AVC視訊串流之最大位元速率(以每秒千位元計)的十六位元欄位。當其經設定成0時,不指示最大位元速率。亦即,當最大位元速率欄位134之值設定成0時,最大位元速率欄位134不應用於判定經重新組譯之AVC視訊串流之最大位元速率。
時間識別符欄位136可包含指示對應於經重新組譯之AVC視訊串流之圖框速率的temporal_id之值的三位元欄位。亦即,temporal_id可用以判定經重新組譯之AVC視訊串流之圖框速率,如上文所論述。
實例操作點描述符118亦包括保留尾隨位元欄位138。在一實例中,(例如)如下文表4中所展示,保留尾隨位元之數目可用於額外發信號及填補操作點描述符118兩者,以使得操作點描述符118在位元組邊界上結束。舉例而言,如上文所論述,操作點描述符118可使用十個位元以表示每一所顯示之視圖之視圖識別符。在此實例中,除了用於視圖識別符之位元及保留尾隨位元之外的位元之靜態數目為87。因此,為了確保操作點描述符118在位元組邊界上結束(亦即,具有平均可被8除盡之位元之數目),多工器30可根據以下公式添加尾隨位元之數目:尾隨位元=(1+6*num_display_views) % 8其中「%」表示數學模運算子。亦即,A%B產生A除以B之餘數,以使得該餘數在0與B-1之間的整數範圍中。
表4概述可包括於圖4之操作點描述符118之實例中的資料之一實例集合。
圖5為說明可包括於操作點描述符114(圖3)中之一者中的資料之一替代實例集合的方塊圖。大體而言,操作點描述符114中之每一者應具有共同格式,以使得用戶端器件可經組態以接收具有單一格式之操作點描述符。因此,操作點描述符114中之每一者可具有與圖4、圖5或圖6之操作點描述符類似之格式,或包括類似發信號資料之另一共同格式。
在圖5之實例中,操作點描述符140包括描述符標籤欄位142、描述符長度欄位144、profile_IDC欄位146、level_IDC欄位148、圖框速率欄位149、顯示視圖之數目欄位150、解碼視圖之數目欄位152、平均位元速率欄位154、最大位元速率欄位156、時間識別符欄位158、保留位元欄位160、視圖次序索引欄位162、視圖識別符欄位164,及保留尾隨位元欄位166。IDC代表「識別符」。如下文所解釋,操作點描述符140之實例明確地用信號發送操作點之profile_idc值及level_idc值,以及關於如何組譯操作點之資訊。
顯示視圖之數目欄位150及圖框速率欄位149對應於藉由操作點描述符140來用信號發送之呈現能力值。在圖5之實例中,profile_IDC欄位146、level_IDC欄位148及解碼視圖之數目欄位152表示可對應於藉由操作點描述符140來用信號發送之解碼能力值之資料之實例。平均位元速率欄位154及最大位元速率欄位156對應於藉由操作點描述符140來用信號發送之位元速率值。
如上文所描述,MPEG-2系統規範指定每一描述符具有一描述符標籤欄位及一描述符長度欄位,其中之每一者之長度可為8位元。因此,多工器30(圖1)可將一值指派給指示MVC操作點描述符之描述符標籤欄位142。多工器30亦可判定操作點之視圖之數目及操作點描述符之保留位元之數目,且接著計算(以位元組計)在描述符長度欄位144之後的操作點描述符140之長度。多工器30可在將操作點描述符140實體化時將此所計算之長度值指派給描述符長度欄位144。
Profile_IDC欄位146可包含指示藉由在操作點描述符140中給予的資訊重新組譯之操作點之profile_idc的八位元欄位。Level_IDC欄位148可包含指示藉由在操作點描述符140中給予的資訊重新組譯之操作點之level_idc之八位元欄位。
圖框速率欄位149可包含指示經重新組譯之AVC視訊串流之最大圖框速率(以每256秒之圖框計)之16位元欄位。亦即,多工器30可計算256秒時間週期之最大圖框速率以設定圖框速率欄位149之值。與圖框速率欄位124一樣,在圖框速率欄位149之其他實例中,可使用除了256秒之外的其他時間週期。
顯示視圖之數目欄位150可包含指示經重新組譯之AVC視訊串流之視圖(以輸出為目標)之數目的值之十位元欄位。大體而言,顯示視圖之數目欄位150表示針對對應操作點之待顯示之視圖的數目。解碼視圖之數目欄位152可包含指示解碼經重新組譯之AVC視訊串流所需的視圖之數目的值之十位元欄位。此值可能不同於由顯示視圖之數目欄位150所指示的待顯示之視圖之數目。此可能係因歸因於視圖相依性而使解碼需要特定視圖,但該等視圖實際上未顯示所致,例如,如上文關於解碼視圖之數目欄位128所描述。
平均位元速率欄位154可包含指示經重新組譯之AVC視訊串流之平均位元速率(以每秒千位元計)的十六位元欄位。當其經設定成0時,不指示平均位元速率。亦即,平均位元速率欄位154之值0暗示平均位元速率欄位154不應用於判定經重新組譯之AVC視訊串流之平均位元速率。最大位元速率欄位156可包含指示經重新組譯之AVC視訊串流之最大位元速率(以每秒千位元計)的十六位元欄位。當其經設定成0時,不指示最大位元速率。亦即,當最大位元速率欄位156之值設定成0時,最大位元速率欄位156不應用於判定經重新組譯之AVC視訊串流之最大位元速率。
時間識別符欄位158可包含指示對應於經重新組譯之AVC視訊串流之圖框速率的temporal_id之值的三位元欄位。亦即,temporal_id可用以判定經重新組譯之AVC視訊串流之圖框速率,如上文所論述。
操作點描述符140亦包括視圖次序索引欄位162及視圖識別符欄位164。視圖次序索引欄位162中之每一者可包含指示操作點中所含有的NAL單元之視圖次序索引之值的十位元欄位。用戶端器件可重新組譯對應於所有用信號發送之view_order_index值之NAL單元,該等所有用信號發送之view_order_index值藉由視圖次序索引欄位162來在操作點描述符140中用信號發送。視圖次序索引欄位162包括待解碼之視圖中之每一者的視圖次序索引欄位。在給予view_order_index值的情況下,用戶端器件可自基本串流提取對應NAL單元,此係因為MVC延伸描述符告知彼基本串流中之視圖次序索引值之範圍且該範圍涵蓋在操作點描述符中用信號發送之view_order_index值。
視圖識別符欄位164中之每一者可包含指示經重新組譯之AVC視訊位元串流中所含有的NAL單元之view_id之值之十位元欄位。因此,使用視圖識別符欄位164來用信號發送操作點之每一所顯示之視圖之視圖識別符。亦即,視圖識別符欄位164之視圖識別符對應於所顯示之視圖。因此,在圖5之實例中,並未藉由視圖識別符欄位164來用信號發送經解碼但未顯示之視圖。
操作點描述符140亦包括保留尾隨位元欄位166。操作點描述符140可包括作為填補之尾隨位元,以使得操作點描述符140中之位元之數目平均可被8除盡。因為視圖次序索引欄位及視圖識別符欄位之數目可變化,所以多工器30在操作點描述符140中所包括的尾隨位元之數目可相應地變化。舉例而言,可根據以下公式判定尾隨位元之數目尾隨位元=(6*(num_display_views+num_decode_views))%8其中「%」表示模運算子。
表5概述可包括於圖5之實例操作點描述符140中的資料之一實例集合。
圖6為說明可包括於操作點描述符114(圖3)中之一者中的資料之另一替代實例集合的方塊圖。在圖6之實例中,操作點描述符170包括描述符標籤欄位172、描述符長度欄位174、profile_IDC欄位176、level_IDC欄位178、圖框速率欄位180、顯示視圖之數目欄位182、解碼視圖之數目欄位184、平均位元速率欄位186、最大位元速率欄位188、時間識別符欄位190、保留位元欄位192、操作點識別符欄位194、操作點相依旗標欄位196、選用之相依操作點識別符欄位198、視圖次序索引欄位200、視圖識別符欄位202,及保留尾隨位元欄位204。如下文所描述,操作點描述符170提供視另一操作點而定且用信號發送解碼所需之額外視圖的一操作點之實例操作點描述符。
顯示視圖之數目欄位182及圖框速率欄位180對應於藉由操作點描述符140來用信號發送之呈現能力值。在圖6之實例中,profile_IDC欄位176、level_IDC欄位178及解碼視圖之數目欄位184表示可對應於藉由操作點描述符140來用信號發送之解碼能力值的資料之實例。平均位元速率欄位154及最大位元速率欄位156對應於藉由操作點描述符140來用信號發送之位元速率值。
如上文所描述,MPEG-2系統規範指定每一描述符具有一描述符標籤欄位及一描述符長度欄位,其各自為8位元。因此,多工器30(圖1)可將一值指派給指示MVC操作點描述符之描述符標籤欄位172。多工器30亦可判定操作點之視圖之數目及操作點描述符之保留位元之數目,且接著計算(以位元組計)在描述符長度欄位174之後的操作點描述符170之長度。多工器30在將操作點描述符140實體化時將此所計算之長度值指派給描述符長度欄位174。
Profile_IDC欄位176可包含指示藉由在操作點描述符170中給予的資訊重新組譯之操作點之profile_idc的八位元欄位。Level_IDC欄位178可包含指示藉由在操作點描述符170中給予的資訊重新組譯之操作點之level_idc的八位元欄位。
圖框速率欄位180可包含指示經重新組譯之AVC視訊串流之最大圖框速率(以每256秒之圖框計)之16位元欄位。亦即,多工器30可計算256秒時間週期之最大圖框速率以設定圖框速率欄位149之值。與圖框速率欄位124一樣,在圖框速率欄位180之其他實例中,可使用除了256秒之外的其他時間週期。
顯示視圖之數目欄位182可包含指示經重新組譯之AVC視訊串流之視圖(以輸出為目標)之數目的值之十位元欄位。大體而言,顯示視圖之數目欄位182表示針對對應操作點之待顯示之視圖的數目。解碼視圖之數目欄位184可包含指示解碼經重新組譯之AVC視訊串流所需的視圖之數目的值之十位元欄位。此值可能不同於由顯示視圖之數目欄位182所指示的待顯示之視圖之數目。此可能係因歸因於視圖相依性而使解碼需要特定視圖,但該等視圖實際上未顯示所致,例如,如上文關於解碼視圖之數目欄位128所描述。
平均位元速率欄位186可包含指示經重新組譯之AVC視訊串流之平均位元速率(以每秒千位元計)的十六位元欄位。當其經設定成0時,不指示平均位元速率。亦即,平均位元速率欄位186之值0暗示平均位元速率欄位186不應用於判定經重新組譯之AVC視訊串流之平均位元速率。最大位元速率欄位188可包含指示經重新組譯之AVC視訊串流之最大位元速率(以每秒千位元計)的十六位元欄位。當其經設定成0時,不指示最大位元速率。詳言之,當最大位元速率欄位188之值設定成0時,最大位元速率欄位188不應用於判定經重新組譯之AVC視訊串流之最大位元速率。
時間識別符欄位190可包含指示對應於經重新組譯之AVC視訊串流之圖框速率的temporal_id之值的三位元欄位。亦即,temporal_id可用以判定經重新組譯之AVC視訊串流之圖框速率,如上文所論述。保留位元欄位192對應於經保留以供未來使用之單一位元。
操作點描述符170亦包括操作點識別符欄位194及操作點相依旗標欄位196。操作點識別符欄位194可包含指示由操作點描述符170所描述之操作點之識別符的十位元欄位。操作點相依旗標欄位196為指示是否用信號發送當前操作點關於另一操作點之相依性之單位元旗標。若操作點相依旗標196具有值1(或真),則用信號發送相依性;若操作點相依旗標196之值為0(或假),則未用信號發送相依性。
當操作點相依旗標196之值為真或1時,操作點描述符170另外包括相依操作點識別符欄位198。當操作點識別符欄位198存在時,操作點識別符欄位198可包含指示當前描述符所取決於的操作點之識別符之十位元欄位。亦即,當多工器30判定操作點描述符170對應於一視另一操作點而定之操作點時,多工器30將操作點相依旗標之值設定成真或1,且接著用信號發送對應於操作點識別符170之操作點所取決於的操作點之識別符。
操作點描述符170亦包括視圖次序索引欄位200及視圖識別符欄位202。視圖次序索引欄位202中之每一者可包含一十位元欄位,其指示含有於識別符為operation_point_id之當前操作點中但未含有於識別符為dependent_operation_point_id之操作點中的NAL單元之視圖次序索引之值。用戶端器件可重新組譯對應於所有用信號發送之view_order_index值之NAL單元,該等所有用信號發送之view_order_index值藉由視圖次序索引欄位200在操作點描述符170中用信號發送。視圖次序索引欄位200包括待解碼之視圖中之每一者的視圖次序索引欄位。在給予view_order_index值的情況下,用戶端器件可自基本串流提取對應NAL單元,因為MVC延伸描述符告知彼基本串流中之視圖次序索引值之範圍且該範圍涵蓋在操作點描述符中用信號發送之view_order_index值。藉由對應於視圖次序索引欄位200之所有用信號發送之view_order_index值的NAL單元及由識別符為dependent_operation_point_id之操作點所含有的NAL單元重新組譯在操作點描述符170中用信號發送之操作點。
視圖識別符欄位202中之每一者可包含指示經重新組譯之AVC視訊位元串流中所含有的NAL單元之view_id之值的十位元欄位。因此,使用視圖識別符欄位202來用信號發送操作點之每一所顯示之視圖的視圖識別符。亦即,視圖識別符欄位164之視圖識別符對應於所顯示之視圖。因此,在圖5之實例中,並未藉由視圖識別符欄位202來用信號發送經解碼但未顯示之視圖。
操作點描述符170亦包括保留尾隨位元欄位204。操作點描述符170可包括作為填補之尾隨位元,以使得操作點描述符170中之位元之數目平均可被8除盡。因為視圖次序索引欄位及視圖識別符欄位之數目可變化,所以多工器30在操作點描述符170中所包括的尾隨位元之數目可相應地變化。舉例而言,可根據以下公式判定尾隨位元之數目尾隨位元=(6*(num_display_views+num_decode_views))% 8其中「%」表示模運算子。
以下表6概述可包括於圖6之實例操作點描述符170中的資料之一實例集合。
作為又一替代,源器件20(圖1)使用除了操作點描述符之外的資料結構來用信號發送操作點之特性。舉例而言,源器件20可使用修改之MVC延伸描述符來用信號發送描述接收器件使用MVC操作點待滿足的呈現能力之呈現能力值、描述接收器件使用MVC操作點待滿足的解碼能力之解碼能力值,及描述MVC操作點之位元速率之位元速率值。
多工器30(圖2)可根據由表7所定義之語法建構MVC延伸描述符110。大體而言,表7之語法元素之語義與關於上文之表1所描述的通常命名之元素相同。與表1之彼等元素相比,表7之實例包括額外元素,即,圖框速率欄位、顯示視圖之數目欄位、解碼視圖之數目欄位及MVC延伸描述符所對應之操作點之每一視圖的視圖識別符欄位。
圖框速率欄位可包含指示經重新組譯之AVC視訊串流之最大圖框速率(以每256秒之圖框計)的十六位元欄位。顯示視圖之數目欄位「num_display_views」可包含指示經重新組譯之AVC視訊串流之視圖(以輸出為目標)之數目的值之十位元欄位。解碼視圖之數目欄位「num_decode_views」可包含指示解碼經重新組譯之AVC視訊串流所需之視圖之數目的值之十位元欄位。視圖識別符欄位「view_id」中之每一者可包含指示經重新組譯之AVC視訊位元串流中所含有的對應視圖之NAL單元之view_id之值的十位元欄位。
在一些實例中,一或多個操作點描述符可包括指示位元串流之所有MVC操作點之最大時間識別符值及最大圖框速率值之值。在一些實例中,可在MVC操作點描述符中用信號發送位元串流之所有MVC操作點之最大時間識別符值及最大圖框速率值。
圖7為說明實例MVC預測型樣的概念圖。在圖7之實例中,說明八個視圖(具有視圖ID「S0」至「S7」),且針對每一視圖說明十二個時間位置(「T0」至「T11」)。亦即,圖7中之每一列對應於一視圖,而每一行指示一時間位置。
雖然MVC具有可由H.264/AVC解碼器解碼之所謂的基礎視圖且立體視圖對亦可由MVC支援,但MVC之優點為其可支援將兩個以上視圖用作3D視訊輸入且解碼由多個視圖表示的此3D視訊之實例。具有MVC解碼器之用戶端之呈現器可預期具有多個視圖之3D視訊內容。
使用包括字母之著色區塊在圖7中之每一列及每一行之指示處指示圖7中之圖框,該字母指定對應圖框是經圖框內編碼(亦即,I圖框)或是在一個方向上經圖框間編碼(亦即,作為P圖框)或在多個方向上經圖框間編碼(亦即,作為B圖框)。大體而言,用箭頭指示預測,其中所指向至(pointed-to)之圖框將所指向(point-from)之物件用於預測參考。舉例而言,自視圖S0之處於時間位置T0之I圖框來預測視圖S2之處於時間位置T0之P圖框。
與單視圖視訊編碼一樣,可關於處於不同時間位置之圖框預測性地編碼多視圖視訊編碼視訊序列之圖框。舉例而言,視圖S0之處於時間位置T1之b圖框具有自視圖S0之處於時間位置T0之I圖框指向至其之箭頭,從而指示自I圖框預測該b圖框。然而,另外,在多視圖視訊編碼之情形下,可以視圖間之方式預測圖框。亦即,視圖分量可將其他視圖中之視圖分量用於參考。舉例而言,在MVC中,視圖間預測好像另一視圖中之視圖分量為圖框間預測參考一樣得以實現。在序列參數集合(SPS)MVC延伸中用信號發送可能之視圖間參考,且可藉由參考圖像清單建構程序來修改可能之視圖間參考,此舉實現圖框間預測或視圖間預測參考之靈活排序。下文表8提供MVC延伸序列參數集合之實例定義。
圖7提供視圖間預測之各種實例。在圖7之實例中,將視圖S1之圖框說明為自視圖S1之處於不同時間位置之圖框加以預測,以及自視圖S0與S2之處於相同時間位置之圖框加以視圖間預測。舉例而言,自視圖S1之處於時間位置T0與T2的B圖框中之每一者以及視圖S0與S2之處於時間位置T1之b圖框預測視圖S1之處於時間位置T1之b圖框。
在圖7之實例中,大寫字母「B」及小寫字母「b」意欲指示圖框之間的不同階層關係而非不同編碼方法。大體而言,與小寫字母「b」圖框相比,大寫字母「B」圖框在預測階層中相對較高。圖7亦使用不同程度之著色來說明預測階層之變化,其中與具有較少著色(亦即,相對較淺)之彼等圖框相比,較大量之著色(亦即,相對較深)圖框在預測階層中較高。舉例而言,以完全著色來說明圖7中之所有I圖框,而P圖框具有稍微較淺之著色,且B圖框(及小寫字母b圖框)具有相對於彼此之各種程度之著色,但始終淺於P圖框及I圖框之著色。
大體而言,預測階層與視圖次序索引有關,因為應在解碼在預測階層中相對較低之圖框之前解碼在該階層中相對較高之圖框,以使得在該階層中相對較高之彼等圖框可在解碼在該階層中相對較低之圖框期間用作參考圖框。視圖次序索引為指示存取單元中之視圖分量之解碼次序的索引。在如H.264/AVC之附件H(MVC修正案)中所指定的SPS MVC延伸中暗示視圖次序索引。在SPS中,針對每一索引i,用信號發送對應view_id。視圖分量之解碼應遵循視圖次序索引之遞升次序。若呈現所有視圖,則視圖次序索引呈自0至num_views_minus_1之連續次序。
以此方式,用作參考圖框之圖框可在解碼參考該等參考圖框來編碼的圖框之前加以解碼。視圖次序索引為指示存取單元中之視圖分量之解碼次序的索引。針對每一視圖次序索引i,用信號發送對應view_id。視圖分量之解碼遵循視圖次序索引之遞升次序。若呈現所有視圖,則視圖次序索引之集合可包含自0至比視圖之全部數目小一的經連續排序之集合。
對於處於該階層之相等層級之特定圖框而言,解碼次序可能相對於彼此無關緊要。舉例而言,視圖S0之處於時間位置T0之I圖框用作視圖S2之處於時間位置T0之P圖框的參考圖框,視圖S2之處於時間位置T0之P圖框又用作視圖S4之處於時間位置T0之P圖框的參考圖框。因此,視圖S0之處於時間位置T0之I圖框應在視圖S2之處於時間位置T0之P圖框之前加以解碼,視圖S2之處於時間位置T0之P圖框應在視圖S4之處於時間位置T0之P圖框之前加以解碼。然而,在視圖S1與S3之間,解碼次序無關緊要,因為視圖S1與S3並不依賴於彼此以用於預測,而是僅自在預測階層中較高之視圖預測。此外,可在視圖S4之前解碼視圖S1,只要視圖S1係在視圖S0與S2之後解碼即可。
以此方式,階層排序可用以描述視圖S0至S7。令記法SA>SB意謂應在視圖SB之前解碼視圖SA。在圖7之實例中使用此記法S0>S2>S4>S6>S7。又,關於圖7之實例,S0>S1、S2>S1、S2>S3、S4>S3、S4>S5且S6>S5。不違背此等要求的視圖之任何解碼次序係可能的。因此,在僅具有特定限制的情況下,許多不同的解碼次序係可能的。下文呈現兩個實例解碼次序,但應理解,許多其他解碼次序係可能的。在下文表9中所說明的一實例中,儘可能快地解碼視圖。
表9之實例認識到,可緊接在已解碼視圖S0與S2之後解碼視圖S1,可緊接在已解碼視圖S2與S4之後解碼視圖S3,且可緊接在已解碼視圖S4與S6之後解碼視圖S5。
下文表10提供另一實例解碼次序,其中解碼次序使得用作另一視圖之參考的任何視圖係在未用作任何其他視圖之參考的視圖之前加以解碼。
表10之實例認識到,視圖S1、S3、S5及S7之圖框並不充當任何其他視圖之圖框的參考圖框,且因此,視圖S1、S3、S5及S7可在用作參考圖框的彼等視圖(亦即,在圖7之實例中,視圖S0、S2、S4及S6)之圖框之後加以解碼。視圖S1、S3、S5及S7相對於彼此可以任何次序加以解碼。因此,在表10之實例中,在視圖S1、S3及S5中之每一者之前解碼視圖S7。
為清楚起見,在每一視圖之圖框以及每一視圖之圖框之時間位置之間存在階層關係。關於圖7之實例,處於時間位置T0之圖框自其他視圖之處於時間位置T0之圖框加以圖框內預測或視圖間預測。類似地,處於時間位置T8之圖框自其他視圖之處於時間位置T8之圖框加以圖框內預測或視圖間預測。因此,關於時間階層,時間位置T0及T8處於該時間階層之頂部。
在圖7之實例中,與時間位置T0與T8之圖框相比,處於時間位置T4之圖框在時間階層中較低,因為時間位置T4之圖框係參考時間位置T0與T8之圖框而經B編碼。與處於時間位置T4之圖框相比,處於時間位置T2與T6之圖框在時間階層中較低。最後,與時間位置T2與T6之圖框相比,處於時間位置T1、T3、T5及T7處之圖框在時間階層中較低。
在MVC中,可提取整個位元串流之子集以形成仍符合MVC之子位元串流。存在特定應用可基於(例如)由伺服器提供之服務、一或多個用戶端之解碼器之容量、支援及能力及/或一或多個用戶端之偏好而需要的許多可能的子位元串流。舉例而言,用戶端可能僅需要三個視圖,且可能存在兩種情況。在一實例中,一個用戶端可需要平滑檢視體驗且可能偏好於具有view_id值S0、S1及S2的視圖,而另一其他用戶端可需要視圖可按比例調整性且偏好於具有view_id值S0、S2及S4的視圖。若最初關於表9之實例對view_id排序,則在此等兩個實例中,視圖次序索引值分別為{0,1,2}及{0,1,4}。注意,可將此等兩個子位元串流解碼為獨立MVC位元串流,且可同時支援此等兩個子位元串流。
可存在可由MVC解碼器解碼的許多MVC子位元串流。理論上,滿足以下兩個性質之視圖之任何組合可由符合特定設定檔或層級之MVC解碼器解碼:(1)每一存取單元中之視圖分量以視圖次序索引之漸增次序排序;及(2)對於組合中之每一視圖而言,其相依視圖亦包括於組合中。
圖8為說明用於使用用信號發送操作點之特性之資料結構的實例方法之流程圖。亦即,圖8之方法包括使用源器件(例如,源器件20(圖1))建構MPEG-2系統位元串流之每一操作點之資料結構。圖8之方法亦包括使用所接收之資料結構以選擇操作點,自該操作點擷取多媒體資料以由目的地器件(諸如,目的地器件40(圖1))解碼並顯示。
最初,在圖8之實例中,源器件20判定節目之操作點(210)。舉例而言,源器件20可選擇節目之視圖之各種子集以建立表示具有各種能力(例如,呈現及解碼能力)之用戶端器件之各種操作點。管理員可與源器件20互動(例如)以選擇視圖且建立表示具有變化之呈現及解碼能力之用戶端器件之操作點或可由源器件20自動建立之不同操作點。
在判定節目之操作點之後,(例如)在位元串流將作為MPEG-2系統傳送串流被廣播時,源器件20可在節目映射表中產生操作點中之每一者之資料結構(212)。或者,在位元串流將作為MPEG-2系統節目串流被廣播時,源器件20可在節目串流映射中產生資料結構。在任何狀況下,源器件20可針對每一操作點產生表示對應操作點之特性之資料結構。舉例而言,該資料結構可包含對應於圖4至圖6之實例中的一者之操作點描述符。以此方式,資料結構可用信號發送對應操作點之呈現特性、解碼特性及位元速率。
源器件20可接著將(例如)圖8之實例中的PMT內之資料結構輸出(214)至用戶端器件(例如,目的地器件40(圖1))。以此方式,源器件20可輸出該等資料結構作為位元串流之部分。源器件20可以廣播、單播、多播、任意傳播(anycast)或經由網路(例如,經由無線或有線網路)之其他通信協定或(例如)根據符合美國高級電視制式委員會(ATSC)標準或美國國家電視制式委員會(NTSC)標準之信號經由電視頻率之廣播的形式來輸出位元串流。或者,源器件20可將位元串流編碼至諸如DVD-ROM、藍光光碟、隨身碟、磁性磁碟或其他儲存媒體之電腦可讀儲存媒體中,在此狀況下,源器件20可形成包括操作點之資料結構之PSM且將該PSM編碼至該電腦可讀儲存媒體中。
目的地器件40可最終自源器件20接收PMT(或PSM)(216)。目的地器件40可接著基於藉由包括於PMT或PSM中之資料結構來用信號發送之操作點之特性而選擇操作點中之一者(218)。大體而言,目的地器件40可選擇目的地器件40滿足藉由對應資料結構來用信號發送之呈現及解碼能力之操作點。舉例而言,目的地器件40可判定視訊輸出44是否能夠在符合藉由操作點之資料結構來用信號發送之呈現能力值之圖框速率下將由資料結構指示之視圖之數目呈現為待顯示之視圖之數目。同樣地,目的地器件40可判定視訊解碼器48是否能夠解碼如藉由操作點之解碼能力值資料結構來用信號發送的操作點之待解碼之視圖的數目。此外,在一些實例中,目的地器件40可使用在資料結構中用信號發送之位元速率以(例如)基於傳送媒體(目的地器件40自其接收位元串流)之頻寬限制而選擇適於該傳送媒體之操作點。
當目的地器件40判定目的地器件40能夠呈現並解碼一個以上操作點時,目的地器件40可選擇用於解碼及呈現之最高品質操作點。舉例而言,目的地器件40可選擇具有最高數目個視圖、最高位元速率、最高圖框速率或操作點之其他品質指示的操作點來判定要選擇哪一操作點。
在選擇操作點之後,目的地器件40可自位元串流擷取該操作點之資料(220)。亦即,目的地器件40可自包括於位元串流中之節目提取對應於操作點之視圖中之每一者的資料。在一些實例中,目的地器件40自位元串流中之一或多個子位元串流選擇資料以提取關於操作點之資料。在提取資料之後,目的地器件可解碼並顯示選定操作點之資料(222)。視訊解碼器48可解碼操作點之待解碼之視圖中的每一者,而視訊輸出44可顯示操作點之待顯示之視圖中的每一者。所顯示之視圖可能未必為經解碼之視圖,如上文所描述。
在一或多個實例中,可以硬體、軟體、韌體或其任何組合來實施所描述之功能。若以軟體實施,則功能可作為一或多個指令或程式碼儲存於電腦可讀媒體上或經由電腦可讀媒體而傳輸。電腦可讀媒體可包括電腦可讀儲存媒體(諸如,資料儲存媒體)或通信媒體,通信媒體包括促進將電腦程式自一處傳送至另一處之任何媒體。資料儲存媒體可為可由一或多個電腦或一或多個處理器存取以擷取指令、程式碼及/或資料結構以用於實施本發明中所描述之技術的任何可用媒體。舉例而言且非限制,該等電腦可讀儲存媒體可包含RAM、ROM、EEPROM、CD-ROM或其他光碟儲存器、磁碟儲存器或其他磁性儲存器件、快閃記憶體,或可用以儲存呈指令或資料結構之形式的所要程式碼且可由電腦存取之任何其他媒體。又,任何連接被適當地稱為電腦可讀媒體。舉例而言,若使用同軸電纜、光纖纜線、雙絞線、數位用戶線(DSL)或諸如紅外線、無線電及微波之無線技術而自網站、伺服器或其他遠端源傳輸指令,則同軸電纜、光纖纜線、雙絞線、DSL或諸如紅外線、無線電及微波之無線技術包括於媒體之定義中。然而,應理解,電腦可讀儲存媒體及資料儲存媒體不包括連接、載波、信號或其他暫時性媒體。如本文中所使用,磁碟及光碟包括緊密光碟(CD)、雷射光碟、光學光碟、數位影音光碟(DVD)、軟性磁碟及藍光光碟,其中磁碟通常以磁性方式再生資料,而光碟藉由雷射以光學方式再生資料。上述各者之組合亦應包括於電腦可讀媒體之範疇內。
指令可由諸如以下各者之一或多個處理器執行:一或多個數位信號處理器(DSP)、通用微處理器、特殊應用積體電路(ASIC)、場可程式化邏輯陣列(FPGA)或其他等效積體或離散邏輯電路。因此,如本文中所使用之術語「處理器」可指代前述結構或適於實施本文中所描述之技術的任何其他結構中之任意者。另外,在一些態樣中,可將本文所描述之功能性提供於經組態以用於編碼及解碼的專用硬體及/或軟體模組內,或併入於組合之編碼解碼器中。又,該等技術可充分實施於一或多個電路或邏輯元件中。
可在包括無線手機、積體電路(IC)或一組IC(例如,晶片組)之廣泛多種器件或裝置中實施本發明之技術。各種組件、模組或單元描述於本發明中以強調經組態以執行所揭示之技術之器件的功能態樣,但未必需要藉由不同硬體單元實現。實情為,如上文所描述,各種單元可組合於編碼解碼器硬體單元中或由交互操作之硬體單元的集合(包括如上文所描述之一或多個處理器)結合合適的軟體及/或韌體來提供。
已描述各種實例。此等及其他實例處於以下申請專利範圍之範疇內。
10...系統
20...音訊/視訊(A/V)源器件
22...音訊源
24...視訊源
26...音訊編碼器
28...視訊編碼器
30...多工器
32...輸出介面
34...電腦可讀媒體
36...輸入介面
38...解多工器
40...音訊/視訊目的地器件
42...音訊輸出
44...視訊輸出
46...音訊解碼器
48...視訊解碼器
60...串流管理單元
62...網路抽象層(NAL)單元建構器
64...節目映射表建構器
66...串流識別符(串流ID)查詢單元
68...節目識別符(PID)指派單元
80...視訊輸入介面
82...音訊輸入介面
84...經多工串流輸出介面
88...節目特定資訊表
100...網路資訊表(NIT)
102...條件存取表(CAT)
104...節目關聯表
106...節目映射表
108...描述符
110...多視圖視訊編碼延伸描述符
112...階層描述符
114...操作點描述符
118...操作點描述符
120...描述符標籤欄位
122...描述符長度欄位
124...圖框速率欄位
126...顯示視圖之數目欄位
128...解碼視圖之數目欄位
130...視圖識別符欄位
132...平均位元速率欄位
134...最大位元速率欄位
136...時間識別符欄位
138...保留尾隨位元欄位
140...操作點描述符
142...描述符標籤欄位
144...描述符長度欄位
146...profile_IDC欄位
148...level_IDC欄位
149...圖框速率欄位
150...顯示視圖之數目欄位
152...解碼視圖之數目欄位
154...平均位元速率欄位
156...最大位元速率欄位
158...時間識別符欄位
160...保留位元欄位
162...視圖次序索引欄位
164...視圖識別符欄位
166...保留尾隨位元欄位
170...操作點描述符
172...描述符標籤欄位
174...描述符長度欄位
176...profile_IDC欄位
178...level_IDC欄位
180...圖框速率欄位
182...顯示視圖之數目欄位
184...解碼視圖之數目欄位
186...平均位元速率欄位
188...最大位元速率欄位
190...時間識別符欄位
192...保留位元欄位
194...操作點識別符欄位
196...操作點相依旗標欄位
198...選用之相依操作點識別符欄位
200...視圖次序索引欄位
202...視圖識別符欄位
204...保留尾隨位元欄位
圖1為說明音訊/視訊(A/V)源器件將音訊及視訊資料傳送至A/V目的地器件之實例系統的方塊圖。
圖2為說明與本發明一致之多工器之組件之實例配置的方塊圖。
圖3為說明與本發明一致之節目特定資訊表之實例集合的方塊圖。
圖4至圖6為說明可包括於操作點描述符中的資料之集合之各種實例的概念圖。
圖7為說明實例MVC預測型樣的概念圖。
圖8為說明用於使用用信號發送操作點之特性之一資料結構之實例方法的流程圖。
10...系統
20...音訊/視訊(A/V)源器件
22...音訊源
24...視訊源
26...音訊編碼器
28...視訊編碼器
30...多工器
32...輸出介面
34...電腦可讀媒體
36...輸入介面
38...解多工器
40...音訊/視訊目的地器件
42...音訊輸出
44...視訊輸出
46...音訊解碼器
48...視訊解碼器

Claims (48)

  1. 一種用於傳送經編碼之視訊資料的方法,其包含:藉由一源器件建構複數個多視圖視訊編碼(MVC)描述符,該複數個MVC描述符之每一者對應於一MPEG-2(動畫專家群組)系統標準位元串流之各自MVC操作點,其中每一MVC描述符用信號發送描述一接收器件使用該MVC操作點待滿足的一呈現能力之一呈現能力值,及描述該接收器件使用該MVC操作點待滿足的一解碼能力之一解碼能力值,且其中每一MVC描述符經包括作為該位元串流之部分;及輸出包含對應於該等各自MVC操作點之該複數個MVC描述符之該位元串流。
  2. 如請求項1之方法,其中建構該複數個MVC描述符包含建構每一MVC描述符以使得一或多個二維顯示器件及三維顯示器件使該位元串流適合於該一或多個二維顯示器件及三維顯示器件且使各種頻寬之傳送媒體適應該一或多個二維顯示器件及三維顯示器件。
  3. 如請求項1之方法,其中該呈現能力值描述該對應MVC操作點之以呈現為目標的視圖之至少一數目、該對應MVC操作點之視訊資料之一圖框速率及該對應MVC操作點之一時間識別符值。
  4. 如請求項1之方法,其中該解碼能力值描述該對應MVC操作點之待解碼之視圖之至少一數目、對應於該MVC操作點之一層級值及對應於該MVC操作點之一設定檔值。
  5. 如請求項1之方法,其中建構該複數個MVC描述符包含建構該複數個MVC描述符以用信號發送一位元速率值,其描述該對應MVC操作點之一位元速率,且其中該位元速率值描述該對應MVC操作點之一平均位元速率及該對應MVC操作點之最大位元速率中之一者。
  6. 如請求項1之方法,其中建構該複數個MVC描述符包含建構一節目映射表資料結構中之一操作點描述符,且其中該位元串流包含一MPEG-2傳送串流。
  7. 如請求項1之方法,其中建構該複數個MVC描述符包含建構一節目串流映射資料結構中之一操作點描述符,且其中該位元串流包含一MPEG-2節目串流。
  8. 如請求項1之方法,其中每一MVC描述符包含一操作點描述符,且其中建構該複數個MVC描述符包含:將一圖框速率值包括於該操作點描述符中,該圖框速率值描述包括於該MVC操作點之視圖中的視訊資料之一最大圖框速率;將該MVC操作點之以呈現為目標的視圖之視圖識別符值包括於該操作點描述符中,其中該等視圖識別符值中之每一者對應於以呈現為目標之該等視圖中之一者;將該MVC操作點之待解碼之視圖的視圖識別符值包括於該操作點描述符中,其中該等視圖識別符值中之每一者對應於待解碼之該等視圖中之一者;及將一時間識別符值包括於該操作點描述符中,該時間識別符值對應於自該MVC操作點之該等視圖之該視訊資 料組譯的一視訊串流之一圖框速率。
  9. 一種用於傳送經編碼之視訊資料的裝置,其包含:一多工器,其建構複數個多視圖視訊編碼(MVC)描述符,該複數個MVC描述符之每一者對應於一MPEG-2(動畫專家群組)系統標準位元串流之各自MVC操作點,其中每一MVC描述符用信號發送描述一接收器件使用該MVC操作點待滿足的一呈現能力之一呈現能力值,及描述該接收器件使用該MVC操作點待滿足的一解碼能力之一解碼能力值,且其中每一MVC描述符經包括作為該位元串流之部分;及一輸出介面,其輸出包含對應於該等各自MVC操作點之該複數個MVC描述符之該位元串流。
  10. 如請求項9之裝置,其中該呈現能力值描述該對應MVC操作點之以呈現為目標的視圖之至少一數目、該對應MVC操作點之視訊資料之一圖框速率及該對應MVC操作點之一時間識別符值。
  11. 如請求項9之裝置,其中該解碼能力值描述該對應MVC操作點之待解碼之視圖之至少一數目、對應於該MVC操作點之一層級值及對應於該MVC操作點之一設定檔值。
  12. 如請求項9之裝置,其中該位元速率值描述該對應MVC操作點之一平均位元速率及該對應MVC操作點之最大位元速率中之一者。
  13. 如請求項9之裝置,其中該多工器將每一MVC描述符建構為一節目映射表資料結構中之一操作點描述符,且其 中該位元串流包含一MPEG-2傳送串流。
  14. 如請求項9之裝置,其中該多工器將每一MVC描述符建構為一節目串流映射資料結構中之一操作點描述符,且其中該位元串流包含一MPEG-2節目串流。
  15. 如請求項9之裝置,其中該多工器將每一MVC描述符建構為一操作點描述符,其中該MVC操作點對應於該位元串流之視圖之一子集,且其中為了建構每一MVC描述符,該多工器進行以下操作:將一圖框速率值包括於該操作點描述符中,該圖框速率值描述包括於該MVC操作點之該等視圖中的視訊資料之一最大圖框速率;將該MVC操作點之以呈現為目標的視圖之視圖識別符值包括於該操作點描述符中,其中該等視圖識別符值中之每一者對應於以呈現為目標之該等視圖中之一者;將該MVC操作點之待解碼之視圖的視圖識別符值包括於該操作點描述符中,其中該等視圖識別符值中之每一者對應於待解碼之該等視圖中之一者;及將一時間識別符值包括於該操作點描述符中,該時間識別符值對應於自該MVC操作點之該等視圖之該視訊資料組譯的一視訊串流之一圖框速率。
  16. 如請求項9之裝置,其中該裝置包含以下各項中之至少一者:一積體電路;一微處理器,及包括該多工器之一無線通信器件。
  17. 一種用於傳送經編碼之視訊資料的裝置,其包含:用於建構複數個多視圖視訊編碼(MVC)描述符之構件,該複數個MVC描述符之每一者對應於一MPEG-2(動畫專家群組)系統標準位元串流之各自MVC操作點,其中每一MVC描述符用信號發送描述一接收器件使用該MVC操作點待滿足的一呈現能力之一呈現能力值,及描述該接收器件使用該MVC操作點待滿足的一解碼能力之一解碼能力值,且其中每一MVC描述符經包括作為該位元串流之部分;及用於輸出包含對應於該等各自MVC操作點之該複數個MVC描述符之該位元串流之構件。
  18. 如請求項17之裝置,其中該呈現能力值描述該對應MVC操作點之以呈現為目標的視圖之至少一數目、該對應MVC操作點之視訊資料之一圖框速率及該對應MVC操作點之一時間識別符值。
  19. 如請求項17之裝置,其中該解碼能力值描述該對應MVC操作點之待解碼之視圖之至少一數目、對應於該MVC操作點之一層級值及對應於該MVC操作點之一設定檔值。
  20. 如請求項17之裝置,其中該位元速率值描述該對應MVC操作點之一平均位元速率及該對應MVC操作點之最大位元速率中之一者。
  21. 如請求項17之裝置,其中每一MVC描述符包含一操作點描述符,且其中該用於建構每一MVC描述符之構件包含: 用於將一圖框速率值包括於該操作點描述符中之構件,該圖框速率值描述包括於該MVC操作點之視圖中的視訊資料之一最大圖框速率;用於將該MVC操作點之以呈現為目標的視圖之視圖識別符值包括於該操作點描述符中之構件,其中該等視圖識別符值中之每一者對應於以呈現為目標之該等視圖中之一者;用於將該MVC操作點之待解碼之視圖的視圖識別符值包括於該操作點描述符中之構件,其中該等視圖識別符值中之每一者對應於待解碼之該等視圖中之一者;及用於將一時間識別符值包括於該操作點描述符中之構件,該時間識別符值對應於自該MVC操作點之該等視圖之該視訊資料組譯的一視訊串流之一圖框速率。
  22. 一種具有指令儲存於其上之非過渡電腦可讀儲存媒體,當該等指令在執行時使一源器件之一處理器進行以下操作:建構複數個多視圖視訊編碼(MVC)描述符,該複數個MVC描述符之每一者對應於一MPEG-2(動畫專家群組)系統標準位元串流之各自MVC操作點,其中每一MVC描述符用信號發送描述一接收器件使用該MVC操作點待滿足的一呈現能力之一呈現能力值,及描述該接收器件使用該MVC操作點待滿足的一解碼能力之一解碼能力值,且其中每一MVC描述符經包括作為該位元串流之部分;及使一輸出介面輸出包含對應於該等各自MVC操作點之 該複數個MVC描述符之該位元串流。
  23. 如請求項22之具有指令儲存於其上之非過渡電腦可讀儲存媒體,其中該呈現能力值描述該對應MVC操作點之以呈現為目標的視圖之至少一數目、該對應MVC操作點之視訊資料之一圖框速率及該對應MVC操作點之一時間識別符值。
  24. 如請求項22之具有指令儲存於其上之非過渡電腦可讀儲存媒體,其中該解碼能力值描述該對應MVC操作點之待解碼之視圖之至少一數目、對應於該MVC操作點之一層級值及對應於該MVC操作點之一設定檔值。
  25. 如請求項22之具有指令儲存於其上之非過渡電腦可讀儲存媒體,其中該位元速率值描述該對應MVC操作點之一平均位元速率及該對應MVC操作點之最大位元速率中之一者。
  26. 如請求項22之具有指令儲存於其上之非過渡電腦可讀儲存媒體,其中每一MVC描述符包含一操作點描述符,且其中使該處理器建構每一MVC描述符之該等指令包含使該處理器進行以下操作之指令:將一圖框速率值包括於該操作點描述符中,該圖框速率值描述包括於該MVC操作點之視圖中的視訊資料之一最大圖框速率;將該MVC操作點之以呈現為目標的視圖之視圖識別符值包括於該操作點描述符中,其中該等視圖識別符值中之每一者對應於以呈現為目標之該等視圖中之一者; 將該MVC操作點之待解碼之視圖的視圖識別符值包括於該操作點描述符中,其中該等視圖識別符值中之每一者對應於待解碼之該等視圖中之一者;及將一時間識別符值包括於該操作點描述符中,該時間識別符值對應於自該MVC操作點之該等視圖之該視訊資料組譯的一視訊串流之一圖框速率。
  27. 一種用於傳送經編碼之視訊資料的方法,其包含:藉由一目的地器件接收複數個多視圖視訊編碼(MVC)描述符,該複數個MVC描述符對應於一MPEG-2(動畫專家群組)系統標準位元串流之各自MVC操作點,其中該等MVC描述符之每一者用信號發送描述一接收器件使用該MVC操作點待滿足的一呈現能力之一呈現能力值,及描述該接收器件使用該MVC操作點待滿足的一解碼能力之一解碼能力值;針對對應於該等各自MVC操作點之該等MVC描述符之每一者判定該目的地器件之一視訊解碼器是否能夠基於藉由該MVC描述符用信號發送之該解碼能力而解碼對應於該MVC操作點之視圖之一數目;針對對應於該等各自MVC操作點之該等MVC描述符之每一者判定該目的地器件是否能夠基於藉由該MVC描述符用信號發送之該呈現能力而呈現對應於該MVC操作點之該等視圖;基於該對應MVC描述符選擇該等操作點之一者,其中選擇包括判定該視訊解碼器能夠解碼及呈現對應於該經 選擇的操作點之視圖;及將對應於該經選擇的MVC操作點之該等視圖發送至該目的地器件之該視訊解碼器。
  28. 如請求項27之方法,其中該等MVC描述符之每一者包含一操作點描述符,且其中該操作點描述符包含:一圖框速率值,該圖框速率值描述包括於該MVC操作點之該等視圖中的視訊資料之一最大圖框速率;該MVC操作點之以呈現為目標的視圖之視圖識別符值,其中該等視圖識別符值中之每一者對應於以呈現為目標的該等視圖中之一者;該MVC操作點之待解碼之視圖的視圖識別符值,其中該等視圖識別符值中之每一者對應於待解碼之該等視圖中之一者;及一時間識別符值,該時間識別符值對應於自該MVC操作點之該等視圖之該視訊資料組譯的一視訊串流之一圖框速率。
  29. 如請求項28之方法,其中判定該視訊解碼器是否能夠解碼該等視圖包含判定該視訊解碼器是否能夠在由該圖框速率值所指示之該圖框速率下解碼等效於視圖之解碼數目值的視圖之一數目。
  30. 如請求項27之方法,其中該目的地器件係藉由描述可由該目的地器件呈現的視圖之一最大數目之一最大視圖呈現器值及描述可由該目的地器件顯示的視訊資料之一最大圖框速率之一最大圖框速率值來組態,其中判定該目的地器件是否能夠呈現對應於該MVC操作點之該等視圖包含: 比較對應於該MVC操作點之視圖之一數目與該最大視圖呈現器值;及比較對應於該MVC操作點之該等視圖之一圖框速率與該最大圖框速率值,其中將對應於該MVC操作點之該等視圖發送至該視訊解碼器包含:在對應於該MVC操作點之視圖之該數目小於或等於該最大視圖呈現器值時且在對應於該MVC操作點之該等視圖之該圖框速率小於或等於該最大圖框速率值時,將對應於該MVC操作點之該等視圖發送至該視訊解碼器。
  31. 如請求項30之方法,其中該最大視圖呈現器值與該最大圖框速率值成反比。
  32. 一種用於傳送經編碼之視訊資料的裝置,其包含:一輸入介面,其經組態以接收複數個多視圖視訊編碼(MVC)描述符,該複數個MVC描述符對應於一MPEG-2(動畫專家群組)系統標準位元串流之各自MVC操作點,其中該等MVC描述符之每一者用信號發送描述一接收器件使用該MVC操作點待滿足的一呈現能力之一呈現能力值,及描述該接收器件使用該MVC操作點待滿足的一解碼能力之一解碼能力值;一視訊解碼器,其經組態以解碼視訊資料;及一解多工器,其經組態以針對對應於該等各自MVC操作點之該等MVC描述符之每一者判定該視訊解碼器是否能夠基於藉由該MVC描述符用信號發送之該解碼能力而 解碼對應於該MVC操作點之視圖之一數目;針對對應於該等各自MVC操作點之該等MVC描述符之每一者判定該裝置是否能夠基於藉由該MVC描述符用信號發送之該呈現能力而呈現對應於該MVC操作點之該等視圖;基於該對應MVC描述符選擇該等操作點之一者,其中選擇包括判定該視訊解碼器能夠解碼及呈現對應於該經選擇的操作點之視圖;及將對應於該經選擇的MVC操作點之該等視圖發送至該視訊解碼器。
  33. 如請求項32之裝置,其中每一MVC描述符包含一操作點描述符,且其中該操作點描述符包含:一圖框速率值,該圖框速率值描述包括於該MVC操作點之該等視圖中的視訊資料之一最大圖框速率;該MVC操作點之以呈現為目標的視圖之視圖識別符值,其中該等視圖識別符值中之每一者對應於以呈現為目標的該等視圖中之一者;該MVC操作點之待解碼之視圖的視圖識別符值,其中該等視圖識別符值中之每一者對應於待解碼之該等視圖中之一者;及一時間識別符值,該時間識別符值對應於自該MVC操作點之該等視圖之該視訊資料組譯的一視訊串流之一圖框速率。
  34. 如請求項33之裝置,其中為了判定該視訊解碼器是否能夠解碼該等視圖,該解多工器經組態以判定該視訊解碼器是否能夠在由該圖框速率值所指示之該圖框速率下解碼等效於視圖之解碼數目值的視圖之一數目。
  35. 如請求項33之裝置,其中該解多工器經組態以接收包括 於該位元串流中之每一操作點之操作點描述符;基於該對應操作點描述符選擇一操作點,其中為了選擇該MVC操作點,該解多工器經組態以判定該視訊解碼器能夠解碼並呈現對應於該選定操作點之視圖;且將對應於該選定操作點之該等視圖發送至該視訊解碼器。
  36. 如請求項32之裝置,其進一步包含一電腦可讀儲存媒體,該電腦可讀儲存媒體經組態以儲存描述可由目的地器件呈現的視圖之一最大數目之一最大視圖呈現器值及描述可由該目的地器件顯示的視訊資料之一最大圖框速率之一最大圖框速率值,其中為了判定該裝置是否能夠呈現對應於該MVC操作點之該等視圖,該解多工器經組態以比較對應於該MVC操作點之視圖之一數目與該最大視圖呈現器值,且比較對應於該MVC操作點之該等視圖之一圖框速率與該最大圖框速率值,且其中該解多工器經組態以在對應於該MVC操作點之視圖之該數目小於或等於該最大視圖呈現器值時且在對應於該MVC操作點之該等視圖之該圖框速率小於或等於該最大圖框速率值時,將對應於該MVC操作點之該等視圖發送至該視訊解碼器。
  37. 如請求項36之裝置,其中該最大視圖呈現器值與該最大圖框速率值成反比。
  38. 如請求項32之裝置,其中該裝置包含以下各項中之至少一者: 一積體電路;一微處理器,及包括該解多工器之一無線通信器件。
  39. 一種用於傳送經編碼之視訊資料的裝置,其包含:用於接收複數個多視圖視訊編碼(MVC)描述符之構件,該複數個MVC描述符對應於一MPEG-2(動畫專家群組)系統標準位元串流之各自MVC操作點,其中該等MVC描述符之每一者用信號發送描述一接收器件使用該MVC操作點待滿足的一呈現能力之一呈現能力值,及描述該接收器件使用該MVC操作點待滿足的一解碼能力之一解碼能力值;用於針對對應於該等各自MVC操作點之該等MVC描述符之每一者判定該裝置之一視訊解碼器是否能夠基於藉由該MVC描述符用信號發送之該解碼能力而解碼對應於該MVC操作點之視圖之構件;用於針對對應於該等各自MVC操作點之該等MVC描述符之每一者判定該裝置是否能夠基於藉由該MVC描述符用信號發送之該呈現能力而呈現對應於該MVC操作點之該等視圖之構件;用於基於該對應MVC描述符選擇該等操作點之一者之構件,其中選擇包括判定該視訊解碼器能夠解碼及呈現對應於該經選擇的操作點之視圖;及用於將對應於該經選擇的MVC操作點之該等視圖發送至該裝置之該視訊解碼器之構件。
  40. 如請求項39之裝置,其中每一MVC描述符包含一操作點描述符,且其中該操作點描述符包含:一圖框速率值,該圖框速率值描述包括於該MVC操作點之該等視圖中的視訊資料之一最大圖框速率;該MVC操作點之以呈現為目標的視圖之視圖識別符值,其中該等視圖識別符值中之每一者對應於以呈現為目標的該等視圖中之一者;該MVC操作點之待解碼之視圖的視圖識別符值,其中該等視圖識別符值中之每一者對應於待解碼之該等視圖中之一者;及一時間識別符值,該時間識別符值對應於自該MVC操作點之該等視圖之該視訊資料組譯的一視訊串流之一圖框速率。
  41. 如請求項40之裝置,其中該用於判定該視訊解碼器是否能夠解碼該等視圖之構件包含用於判定該視訊解碼器是否能夠在由該圖框速率值所指示之該圖框速率下解碼等效於視圖之解碼數目值的視圖之一數目之構件。
  42. 如請求項40之裝置,其進一步包含:用於接收包括於該位元串流中之每一操作點之操作點描述符之構件;用於基於該對應操作點描述符選擇一操作點之構件,其中作出選擇包含判定該視訊解碼器能夠解碼並呈現對應於該選定操作點之視圖;及用於將對應於該選定操作點之該等視圖發送至該視訊解碼器之構件。
  43. 如請求項39之裝置,其進一步包含用於儲存描述可由目 的地器件呈現的視圖之一最大數目之一最大視圖呈現器值及描述可由該目的地器件顯示的視訊資料之一最大圖框速率之一最大圖框速率值之構件,其中該用於判定該目的地器件是否能夠呈現對應於該MVC操作點之該等視圖之構件包含:用於比較對應於該MVC操作點之視圖之一數目與該最大視圖呈現器值之構件;及用於比較對應於該MVC操作點之該等視圖之一圖框速率與該最大圖框速率值之構件,其中該用於將對應於該MVC操作點之該等視圖發送至該視訊解碼器之構件包含:用於在對應於該MVC操作點之視圖之該數目小於或等於該最大視圖呈現器值時且在對應於該MVC操作點之該等視圖之該圖框速率小於或等於該最大圖框速率值時、將對應於該MVC操作點之該等視圖發送至該視訊解碼器之構件。
  44. 一種具有指令儲存於其上之非過渡電腦可讀儲存媒體,當該等指令在執行時使一目的地器件之一處理器進行以下操作:接收複數個多視圖視訊編碼(MVC)描述符,該複數個MVC描述符對應於一MPEG-2(動畫專家群組)系統標準位元串流之各自MVC操作點,其中該等MVC描述符之每一者用信號發送描述一接收器件使用該MVC操作點待滿足的一呈現能力之一呈現能力值,及描述該接收器件使用該MVC操作點待滿足的一解碼能力之一解碼能力值; 針對對應於該等各自MVC操作點之該等MVC描述符之每一者判定該目的地器件之一視訊解碼器是否能夠基於藉由該MVC描述符用信號發送之該解碼能力而解碼對應於該MVC操作點之視圖之一數目;針對對應於該等各自MVC操作點之該等MVC描述符之每一者判定該目的地器件是否能夠基於藉由該MVC描述符用信號發送之該呈現能力而呈現對應於該MVC操作點之該等視圖;基於該對應MVC描述符選擇該等操作點之一者,其中選擇包括判定該視訊解碼器能夠解碼及呈現對應於該經選擇的操作點之視圖;及將對應於該經選擇的MVC操作點之該等視圖發送至該目的地器件之該視訊解碼器。
  45. 如請求項44之具有指令儲存於其上之非過渡電腦可讀儲存媒體,其中每一MVC描述符包含一操作點描述符,且其中該操作點描述符包含:一圖框速率值,該圖框速率值描述包括於該MVC操作點之該等視圖中的視訊資料之一最大圖框速率;該MVC操作點之以呈現為目標的視圖之視圖識別符值,其中該等視圖識別符值中之每一者對應於以呈現為目標的該等視圖中之一者;該MVC操作點之待解碼之視圖的視圖識別符值,其中該等視圖識別符值中之每一者對應於待解碼之該等視圖中之一者;及一時間識別符值,該時間識別符值對應於自該MVC操作點之該等視圖之該視訊資料組譯的一視訊串流之一圖框速 率。
  46. 如請求項45之具有指令儲存於其上之非過渡電腦可讀儲存媒體,其中使該處理器判定該視訊解碼器是否能夠解碼該等視圖之該等指令包含使該處理器判定該視訊解碼器是否能夠在由該圖框速率值所指示之該圖框速率下解碼等效於視圖之解碼數目值的視圖之一數目之指令。
  47. 如請求項45之具有指令儲存於其上之非過渡電腦可讀儲存媒體,其進一步包含使該處理器進行以下操作之指令:接收包括於該位元串流中之每一操作點之操作點描述符;基於該對應操作點描述符選擇一操作點,其中作出選擇包含判定該視訊解碼器能夠解碼並呈現對應於該選定操作點之視圖;及將對應於該選定操作點之該等視圖發送至該視訊解碼器。
  48. 如請求項44之具有指令儲存於其上之非過渡電腦可讀儲存媒體,其中該目的地器件係藉由描述可由該目的地器件呈現的視圖之一最大數目之一最大視圖呈現器值及描述可由該目的地器件顯示的視訊資料之一最大圖框速率之一最大圖框速率值來組態,其中使該處理器判定該目的地器件是否能夠呈現對應於該MVC操作點之該等視圖之該等指令包含使該處理器進行以下操作之指令:比較對應於該MVC操作點之視圖之一數目與該最大視 圖呈現器值;及比較對應於該MVC操作點之該等視圖之一圖框速率與該最大圖框速率值,其中使該處理器將對應於該MVC操作點之該等視圖發送至該視訊解碼器之該等指令包含:使該處理器在對應於該MVC操作點之視圖之該數目小於或等於該最大視圖呈現器值時且在對應於該MVC操作點之該等視圖之該圖框速率小於或等於該最大圖框速率值時,將對應於該MVC操作點之該等視圖發送至該視訊解碼器之指令。
TW099126516A 2009-08-07 2010-08-09 用於處理多視圖視訊編碼操作點的方法、裝置及電腦可讀儲存媒體 TWI581635B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US23227209P 2009-08-07 2009-08-07
US24873809P 2009-10-05 2009-10-05
US26686109P 2009-12-04 2009-12-04
US12/757,231 US8948241B2 (en) 2009-08-07 2010-04-09 Signaling characteristics of an MVC operation point

Publications (2)

Publication Number Publication Date
TW201112769A TW201112769A (en) 2011-04-01
TWI581635B true TWI581635B (zh) 2017-05-01

Family

ID=43534831

Family Applications (1)

Application Number Title Priority Date Filing Date
TW099126516A TWI581635B (zh) 2009-08-07 2010-08-09 用於處理多視圖視訊編碼操作點的方法、裝置及電腦可讀儲存媒體

Country Status (18)

Country Link
US (1) US8948241B2 (zh)
EP (1) EP2462742B1 (zh)
JP (1) JP5602854B2 (zh)
KR (1) KR101293425B1 (zh)
CN (1) CN102474655B (zh)
AU (1) AU2010279256B2 (zh)
BR (1) BR112012002259B1 (zh)
CA (1) CA2768618C (zh)
ES (1) ES2650220T3 (zh)
HK (1) HK1169247A1 (zh)
HU (1) HUE037168T2 (zh)
IL (1) IL217436A (zh)
MY (1) MY180768A (zh)
RU (1) RU2530740C2 (zh)
SG (1) SG177621A1 (zh)
TW (1) TWI581635B (zh)
WO (1) WO2011017661A1 (zh)
ZA (1) ZA201201474B (zh)

Families Citing this family (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL2526674T3 (pl) 2010-01-18 2017-09-29 Telefonaktiebolaget Lm Ericsson (Publ) Sposób i urządzenie dla wsparcia odtwarzania treści
US8724710B2 (en) * 2010-02-24 2014-05-13 Thomson Licensing Method and apparatus for video encoding with hypothetical reference decoder compliant bit allocation
US8374113B2 (en) * 2010-06-03 2013-02-12 Cisco Technology, Inc. Distributed gateway for reliable multicast wireless video
US9191284B2 (en) * 2010-10-28 2015-11-17 Avvasi Inc. Methods and apparatus for providing a media stream quality signal
CN102186038A (zh) * 2011-05-17 2011-09-14 浪潮(山东)电子信息有限公司 一种在数字电视屏幕上同步播放多视角画面的方法
CN105554510B (zh) 2011-06-28 2019-06-28 三星电子株式会社 对视频进行解码的方法和设备
US9237356B2 (en) 2011-09-23 2016-01-12 Qualcomm Incorporated Reference picture list construction for video coding
US9264717B2 (en) 2011-10-31 2016-02-16 Qualcomm Incorporated Random access with advanced decoded picture buffer (DPB) management in video coding
US20130113882A1 (en) * 2011-11-08 2013-05-09 Sony Corporation Video coding system and method of operation thereof
EP2781103A1 (en) * 2011-11-14 2014-09-24 Motorola Mobility LLC Association of mvc stereoscopic views to left or right eye display for 3dtv
US9473752B2 (en) 2011-11-30 2016-10-18 Qualcomm Incorporated Activation of parameter sets for multiview video coding (MVC) compatible three-dimensional video coding (3DVC)
CA2856909C (en) 2011-12-04 2016-12-06 Lg Electronics Inc. Digital broadcasting reception method and apparatus capable of displaying stereoscopic images
CA2859673A1 (en) * 2011-12-27 2013-07-04 Lg Electronics Inc. Digital broadcast receiving method for displaying three-dimensional image, and receiving device thereof
US20130258052A1 (en) * 2012-03-28 2013-10-03 Qualcomm Incorporated Inter-view residual prediction in 3d video coding
EP2835971A4 (en) * 2012-04-03 2015-04-08 Panasonic Ip Corp America IMAGE ENCODING METHOD, IMAGE DECODING METHOD, IMAGE ENCODING DEVICE, AND IMAGE DECODING DEVICE
PL2842313T3 (pl) 2012-04-13 2017-06-30 Ge Video Compression, Llc Skalowalny strumień danych i obiekt sieciowy
JP5949204B2 (ja) * 2012-06-21 2016-07-06 ソニー株式会社 電子機器、電子機器におけるストリーム送受信方法、プログラム、ホストデバイスおよびホストデバイスにおけるストリーム送受信方法
CN115442623A (zh) 2012-06-29 2022-12-06 Ge视频压缩有限责任公司 视频数据流、编码器、编码视频内容的方法以及解码器
US9912941B2 (en) * 2012-07-02 2018-03-06 Sony Corporation Video coding system with temporal layers and method of operation thereof
US9479774B2 (en) * 2012-09-24 2016-10-25 Qualcomm Incorporated Buffering period and recovery point supplemental enhancement information messages
US9161039B2 (en) * 2012-09-24 2015-10-13 Qualcomm Incorporated Bitstream properties in video coding
US9351005B2 (en) 2012-09-24 2016-05-24 Qualcomm Incorporated Bitstream conformance test in video coding
US9432664B2 (en) * 2012-09-28 2016-08-30 Qualcomm Incorporated Signaling layer identifiers for operation points in video coding
US9479779B2 (en) * 2012-10-01 2016-10-25 Qualcomm Incorporated Sub-bitstream extraction for multiview, three-dimensional (3D) and scalable media bitstreams
US9781413B2 (en) * 2012-10-02 2017-10-03 Qualcomm Incorporated Signaling of layer identifiers for operation points
CN104704836B (zh) * 2012-10-03 2018-04-17 寰发股份有限公司 三维视频、多视图视频及可缩放视频的编码方法及装置
US20140098851A1 (en) * 2012-10-04 2014-04-10 Qualcomm Incorporated Indication of video properties
US9154785B2 (en) 2012-10-08 2015-10-06 Qualcomm Incorporated Sub-bitstream applicability to nested SEI messages in video coding
US9936196B2 (en) * 2012-10-30 2018-04-03 Qualcomm Incorporated Target output layers in video coding
US9257092B2 (en) 2013-02-12 2016-02-09 Vmware, Inc. Method and system for enhancing user experience for remoting technologies
CN103118285A (zh) * 2013-02-22 2013-05-22 浪潮齐鲁软件产业有限公司 一种多场景电视兼容普通电视的方法
US10063868B2 (en) 2013-04-08 2018-08-28 Arris Enterprises Llc Signaling for addition or removal of layers in video coding
US10075690B2 (en) * 2013-10-17 2018-09-11 Mediatek Inc. Method of motion information prediction and inheritance in multi-view and three-dimensional video coding
US10205954B2 (en) * 2013-10-23 2019-02-12 Qualcomm Incorporated Carriage of video coding standard extension bitstream data using MPEG-2 systems
US10291922B2 (en) * 2013-10-28 2019-05-14 Arris Enterprises Llc Method and apparatus for decoding an enhanced video stream
JP5886341B2 (ja) * 2014-03-07 2016-03-16 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
JP5836424B2 (ja) * 2014-04-14 2015-12-24 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
MX2018013877A (es) * 2014-05-21 2022-06-15 Arris Int Ip Ltd Gestion individual de memorias intermedias en transporte de video escalable.
EP3146724A1 (en) * 2014-05-21 2017-03-29 ARRIS Enterprises LLC Signaling and selection for the enhancement of layers in scalable video
US10250884B2 (en) * 2014-06-20 2019-04-02 Qualcomm Incorporated Systems and methods for signaling information for layer sets in a parameter set
EP3038358A1 (en) * 2014-12-22 2016-06-29 Thomson Licensing A method for adapting a number of views delivered by an auto-stereoscopic display device, and corresponding computer program product and electronic device
US9930378B2 (en) * 2015-02-11 2018-03-27 Qualcomm Incorporated Signaling of operation points for carriage of HEVC extensions
CN106303673B (zh) * 2015-06-04 2021-01-22 中兴通讯股份有限公司 码流对齐、同步处理方法及发送、接收终端和通信系统
GB2539462B (en) * 2015-06-16 2019-04-03 Canon Kk Obtaining media data and metadata from encapsulated bit-streams wherein operating point descriptors can be dynamically set
CN106331704B (zh) * 2015-07-07 2019-10-22 杭州海康威视数字技术股份有限公司 一种视频码率控制方法及视频编码装置
EP3226561A1 (en) 2016-03-31 2017-10-04 Thomson Licensing Method and apparatus for coding a video into a bitstream carrying region-based post processing parameters into an sei nesting message
KR102397673B1 (ko) 2016-05-13 2022-05-16 소니그룹주식회사 화상 처리 장치 및 방법
CN110476207B (zh) 2017-01-10 2023-09-01 弗劳恩霍夫应用研究促进协会 音频解码器、音频编码器、提供解码的音频信号的方法、提供编码的音频信号的方法、音频流提供器和计算机介质
US11755272B2 (en) 2021-12-10 2023-09-12 Vmware, Inc. Method and system for using enhancement techniques to improve remote display while reducing hardware consumption at a remote desktop

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090147860A1 (en) * 2006-07-20 2009-06-11 Purvin Bibhas Pandit Method and apparatus for signaling view scalability in multi-view video coding

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US266861A (en) 1882-10-31 William e
US232272A (en) 1880-09-14 Bran-cleaner and middlings-separator
US248738A (en) 1881-10-25 Refrigerati no-chamber
US4829299A (en) 1987-09-25 1989-05-09 Dolby Laboratories Licensing Corporation Adaptive-filter single-bit digital encoder and decoder and adaptation control circuit responsive to bit-stream loading
DE69232729T2 (de) 1991-05-29 2003-04-24 Pacific Microsonics Inc Verbesserungen in Systemen zum Erreichen von grösserer Frequenz-Auflösung
US6748020B1 (en) * 2000-10-25 2004-06-08 General Instrument Corporation Transcoder-multiplexer (transmux) software architecture
KR100475060B1 (ko) * 2002-08-07 2005-03-10 한국전자통신연구원 다시점 3차원 동영상에 대한 사용자 요구가 반영된 다중화장치 및 방법
TWI260591B (en) 2002-10-14 2006-08-21 Samsung Electronics Co Ltd Information storage medium with structure for multi-angle data, and recording and reproducing apparatus therefor
US20040260827A1 (en) 2003-06-19 2004-12-23 Nokia Corporation Stream switching based on gradual decoder refresh
US7324594B2 (en) * 2003-11-26 2008-01-29 Mitsubishi Electric Research Laboratories, Inc. Method for encoding and decoding free viewpoint videos
US20050254575A1 (en) 2004-05-12 2005-11-17 Nokia Corporation Multiple interoperability points for scalable media coding and transmission
US7054536B2 (en) * 2004-05-12 2006-05-30 Molex Incorporated Breakout assembly for flexible circuitry
KR100779875B1 (ko) * 2005-01-14 2007-11-27 주식회사 휴맥스 다-시점 코딩을 위한 참조 프레임 순서 설정 방법 및 그방법을 기록한 기록매체
KR100943912B1 (ko) 2006-01-12 2010-03-03 엘지전자 주식회사 다시점 비디오의 처리 방법 및 장치
AU2007243935A1 (en) 2006-03-29 2007-11-08 Thomson Licensing Multi view video coding method and device
JP4793366B2 (ja) * 2006-10-13 2011-10-12 日本ビクター株式会社 多視点画像符号化装置、多視点画像符号化方法、多視点画像符号化プログラム、多視点画像復号装置、多視点画像復号方法、及び多視点画像復号プログラム
AU2007311476C1 (en) * 2006-10-16 2013-01-17 Nokia Technologies Oy System and method for implementing efficient decoded buffer management in multi-view video coding
CN101558652B (zh) * 2006-10-20 2011-08-17 诺基亚公司 用于实现低复杂度多视点视频编码的系统和方法
EP2116063B1 (en) 2007-01-04 2017-03-08 Thomson Licensing Methods and apparatus for multi-view information conveyed in high level syntax
MX2009007240A (es) * 2007-01-08 2009-08-07 Nokia Corp Sistema y procedimiento para proporcionar y usar señalizacion predeterminada de puntos de interoperabilidad para flujos de medios transcodificados.
KR20080066522A (ko) * 2007-01-11 2008-07-16 삼성전자주식회사 다시점 영상의 부호화, 복호화 방법 및 장치
KR101741050B1 (ko) 2007-04-17 2017-05-29 톰슨 라이센싱 멀티뷰 비디오 코딩을 위한 가설의 참조 디코더
WO2009048502A2 (en) 2007-10-05 2009-04-16 Thomson Licensing Methods and apparatus for incorporating video usability information (vui) within a multi-view video (mvc) coding system

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090147860A1 (en) * 2006-07-20 2009-06-11 Purvin Bibhas Pandit Method and apparatus for signaling view scalability in multi-view video coding

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Chen et al.,The Emerging MVC Standard for 3D Video Service,EURASIP Joernal of Advanced Signal Processing Vol.2009(Published:25 March 2008) *
Vetro et al.,Joint Draft 8.0 on Multiview Video Coding,Joint Video Team (JVT) of ISO/IEC MPEG & ITU-T VCEG(ISO/IEC JTC1/SC29/WG11 and ITU-T SG16 Q.6) 28th Meeting:Hannover,DE,20-25 July, 2008 *

Also Published As

Publication number Publication date
CA2768618C (en) 2015-12-08
KR101293425B1 (ko) 2013-08-05
EP2462742B1 (en) 2017-09-20
WO2011017661A1 (en) 2011-02-10
AU2010279256A1 (en) 2012-03-01
CN102474655B (zh) 2016-06-29
CA2768618A1 (en) 2011-02-10
CN102474655A (zh) 2012-05-23
MY180768A (en) 2020-12-08
ES2650220T3 (es) 2018-01-17
RU2012108618A (ru) 2013-11-20
IL217436A (en) 2015-09-24
AU2010279256B2 (en) 2013-11-28
IL217436A0 (en) 2012-02-29
TW201112769A (en) 2011-04-01
US8948241B2 (en) 2015-02-03
HK1169247A1 (zh) 2013-01-18
BR112012002259A2 (pt) 2016-06-14
JP5602854B2 (ja) 2014-10-08
KR20120054052A (ko) 2012-05-29
HUE037168T2 (hu) 2018-08-28
SG177621A1 (en) 2012-03-29
US20110032999A1 (en) 2011-02-10
RU2530740C2 (ru) 2014-10-10
ZA201201474B (en) 2013-08-28
EP2462742A1 (en) 2012-06-13
JP2013502097A (ja) 2013-01-17
BR112012002259B1 (pt) 2021-05-25

Similar Documents

Publication Publication Date Title
TWI581635B (zh) 用於處理多視圖視訊編碼操作點的方法、裝置及電腦可讀儲存媒體
TWI437887B (zh) Mpeg-2系統上多視角視訊編碼
US8780999B2 (en) Assembling multiview video coding sub-BITSTREAMS in MPEG-2 systems
KR101645780B1 (ko) 네트워크-스트리밍된 비디오 데이터에 대한 속성들의 시그널링