TW201304551A - 用於視訊編碼及解碼之方法及裝置 - Google Patents

用於視訊編碼及解碼之方法及裝置 Download PDF

Info

Publication number
TW201304551A
TW201304551A TW101124233A TW101124233A TW201304551A TW 201304551 A TW201304551 A TW 201304551A TW 101124233 A TW101124233 A TW 101124233A TW 101124233 A TW101124233 A TW 101124233A TW 201304551 A TW201304551 A TW 201304551A
Authority
TW
Taiwan
Prior art keywords
access unit
sequence
decoding
time
image
Prior art date
Application number
TW101124233A
Other languages
English (en)
Inventor
Miska Hannuksela
Original Assignee
Nokia Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Corp filed Critical Nokia Corp
Publication of TW201304551A publication Critical patent/TW201304551A/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/188Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/156Availability of hardware or computational resources, e.g. encoding based on power-saving criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/23424Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving splicing one content stream with another content stream, e.g. for inserting or substituting an advertisement
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/44016Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving splicing one content stream with another content stream, e.g. for substituting a video clip

Abstract

一種方法包含接收一第一序列之存取單位及一第二序列之存取單位;解碼該第一序列之存取單位中之至少一個存取單位;解碼該第二序列之存取單位中之一第一可解碼存取單位;決定在該第二序列之存取單位中之一下一個可解碼存取單位之一輸出時間之前,該第二序列之存取單位中之一下一個可解碼存取單位是否可被解碼;及基於決定在該下一個可解碼存取單位之該解碼時間與該輸出時間中之至少一者之前該下一個可解碼存取單位無法被解碼,跳掉下一個可解碼存取單位的解碼。

Description

用於視訊編碼及解碼之方法及裝置 發明領域
本發明大致上係有關於視訊編碼欄位,及更明確言之,係有關於編碼資料之編碼及/或解碼中的有效串流切換。
發明背景
本章節係意圖對申請專利範圍中引述的發明提供背景或脈絡。此處之描述可包括可尋求的構思,但非必要為已經構思或已經尋求者。因此,除非於此處另行指示,否則本章節描述者並非本案之詳細說明部分及申請專利範圍的先前技術,且非藉含括於本章節而承認為先前技術。
為了協助透過一或多個網路之視訊內容的通訊,已經發展出數種編碼標準。視訊編碼標準包括ITU-T H.261、ISO/IEC MPEG-1視訊、ITU-T H.262或ISO/IEC MPEG-2視訊、ITU-T H.263、ISO/IEC MPEG-4視覺、ITU-T H.264(也稱ISO/IEC MPEG-4 AVC)、H.264/AVC之可擴充視訊編碼(SVC)擴延、及H.264/AVC之多視視訊編碼(MVC)擴延。此外,目前正在致力於發展新的視訊編碼標準。一個此種正在發展中的標準為高效視訊編碼(HEVC)標準。
進階視訊編碼(H.264/AVC)標準係稱作為ITU-T推薦H.264及ISO/IEC國際標準14496-10,也稱作MPEG-4部分10進階視訊編碼(AVC)。H.264/AVC標準已有數個版本,各自 整合新特徵至其規格。版本8係指包括可擴充視訊編碼(SVC)修訂的標準。版本10包括多視視訊編碼(MVC)修訂。
建議使用藉H.264/AVC、SVC、MVC、及HEVC而變成可行的多層級時間上可擴充性階層關係,原因在於其壓縮效率顯著改良故。但當出現位元串流間的切換時,多層級階層也可能引發問題。不同位元率之編碼串流間的切換乃一種用在例如針對網際網路之單播串流化來匹配傳輸位元率至預期的網路輸出資料量且避免網路壅塞的方法。為了作動串流間的切換,該等串流共享一個共用時間表。舉例言之,3GPP及MPEG DASH載明全部表示型態共享同一個時間表。暗示於一般情況下,於該處全部串流共享相同圖框率,然後於一個串流中的第n個圖框具有與任何其它串流的第n個圖框相同的表示內容時間戳記且表示相同的原始圖像。
發明概要
於本發明之一個面向中,一種方法包含接收一第一序列之存取單位及一第二序列之存取單位;解碼該第一序列之存取單位中之至少一個存取單位;解碼該第二序列之存取單位中之一第一可解碼存取單位;決定在該第二序列之存取單位中之一下一個可解碼存取單位的一解碼時間及該第二序列之存取單位中之該下一個可解碼存取單位的一輸出時間中之至少一者之前,該第二序列之存取單位中之該下一個可解碼存取單位是否可被解碼;及基於決定在該下 一個可解碼存取單位的該解碼時間及該輸出時間中之至少一者之前該下一個可解碼存取單位無法被解碼,跳掉下一個可解碼存取單位的解碼。
於一個實施例中,該方法係進一步包含跳掉取決於該下一個可解碼存取單位的任何此等存取單位的解碼。於一個實施例中,該方法係進一步包含基於決定在該下一個可解碼存取單位的該解碼時間及該輸出時間中之至少一者之前該下一個可解碼存取單位可被解碼而解碼該下一個可解碼存取單位。重複該決定及或為跳掉解碼或為解碼該下一個可解碼存取單位直到不再有任何存取單位為止。於一個實施例中,第一可解碼存取單位的解碼可包括在相對於前一個解碼位置為非連續位置而開始解碼。於一個實施例中,各個存取單位可為含有一錨定圖像之一IDR存取單位、一SVC存取單位或一MVC存取單位中之一者。
於本發明之另一面向中,一種方法包含從一接收器接收一要求從一第一序列之存取單位切換至一第二序列之存取單位;封裝該第一序列之存取單位之至少一個可解碼存取單位以供傳輸;封裝該第二序列之存取單位之一第一可解碼存取單位以供傳輸;決定在該第二序列之存取單位中之一下一個可解碼存取單位的一解碼時間及該第二序列之存取單位中之該下一個可解碼存取單位的一傳輸時間中之至少一者之前,該第二序列之存取單位中之該下一個可解碼存取單位是否可被封裝;及基於決定在該下一個可解碼存取單位的該解碼時間及該傳輸時間中之至少一者之前該 下一個可解碼存取單位無法被封裝,跳掉下一個可解碼存取單位的封裝;及傳輸該經封裝的可解碼存取單位給該接收器。
於本發明之另一面向中,一種方法包含產生用以解碼一第一序列之存取單位及一第二序列之存取單位的指令,該等指令係包含:解碼該第一序列之存取單位中之至少一個存取單位;解碼該第二序列之存取單位中之一第一可解碼存取單位;決定在該第二序列之存取單位中之一下一個可解碼存取單位的一解碼時間及該第二序列之存取單位中之該下一個可解碼存取單位的一輸出時間中之至少一者之前,該第二序列之存取單位中之該下一個可解碼存取單位是否可被解碼;及基於決定在該下一個可解碼存取單位的該解碼時間及該輸出時間中之至少一者之前該下一個可解碼存取單位無法被解碼,跳掉下一個可解碼存取單位的解碼。
於本發明之另一面向中,一種方法包含產生用以封裝一第一序列之存取單位及一第二序列之存取單位的指令,該等指令係包含:封裝該第一序列之存取單位中之至少一個存取單位用以傳輸;封裝該第二序列之存取單位中之一第一可解碼存取單位用以傳輸;決定在該第二序列之存取單位中之一下一個可解碼存取單位的一解碼時間及該第二序列之存取單位中之該下一個可解碼存取單位的一傳輸時間中之至少一者之前,該第二序列之存取單位中之該下一個可解碼存取單位是否可被封裝;及基於決定在該下一個 可解碼存取單位的該解碼時間及該傳輸時間中之至少一者之前該下一個可解碼存取單位無法被封裝,跳掉下一個可解碼存取單位的封裝。
於本發明之另一面向中,一種裝置包含一解碼器係經組配來解碼該第一序列之存取單位中之至少一個存取單位;解碼該第二序列之存取單位中之一第一可解碼存取單位;決定在該第二序列之存取單位中之一下一個可解碼存取單位的一解碼時間及該第二序列之存取單位中之該下一個可解碼存取單位的一輸出時間中之至少一者之前,該第二序列之存取單位中之該下一個可解碼存取單位是否可被解碼;及基於決定在該下一個可解碼存取單位的該解碼時間及該輸出時間中之至少一者之前該下一個可解碼存取單位無法被解碼,跳掉下一個可解碼存取單位的解碼。
於本發明之另一面向中,一種裝置包含一編碼器係經組配來封裝該第一序列之存取單位中之至少一個存取單位用以傳輸;封裝該第二序列之存取單位中之一第一可解碼存取單位用以傳輸;決定在該第二序列之存取單位中之一下一個可解碼存取單位的一解碼時間及該第二序列之存取單位中之該下一個可解碼存取單位的一傳輸時間中之至少一者之前,該第二序列之存取單位中之該下一個可解碼存取單位是否可被封裝;及基於決定在該下一個可解碼存取單位的該解碼時間及該傳輸時間中之至少一者之前該下一個可解碼存取單位無法被封裝,跳掉下一個可解碼存取單位的封裝。
於本發明之另一面向中,一種裝置包含一檔案產生器係經組配來產生指令而:解碼該第一序列之存取單位中之至少一個存取單位;解碼該第二序列之存取單位中之一第一可解碼存取單位;決定在該第二序列之存取單位中之一下一個可解碼存取單位的一解碼時間及該第二序列之存取單位中之該下一個可解碼存取單位的一輸出時間中之至少一者之前,該第二序列之存取單位中之該下一個可解碼存取單位是否可被解碼;及基於決定在該下一個可解碼存取單位的該解碼時間及該輸出時間中之至少一者之前該下一個可解碼存取單位無法被解碼,跳掉下一個可解碼存取單位的解碼。
於本發明之另一面向中,一種裝置包含一檔案產生器係經組配來產生指令而:封裝該第一序列之存取單位中之至少一個存取單位用以傳輸;封裝該第二序列之存取單位中之一第一可解碼存取單位用以傳輸;決定在該第二序列之存取單位中之一下一個可解碼存取單位的一解碼時間及該第二序列之存取單位中之該下一個可解碼存取單位的一傳輸時間中之至少一者之前,該第二序列之存取單位中之該下一個可解碼存取單位是否可被封裝;及基於決定在該下一個可解碼存取單位的該解碼時間及該傳輸時間中之至少一者之前該下一個可解碼存取單位無法被封裝,跳掉下一個可解碼存取單位的封裝。
於本發明之另一面向中,一種裝置包含至少一個處理器及至少一個記憶體。該記憶體單元包括電腦程式代碼。 該至少一個記憶體及該電腦程式代碼與該至少一個處理器係經組配來使得該裝置至少解碼該第一序列之存取單位中之至少一個存取單位;解碼該第二序列之存取單位中之一第一可解碼存取單位;決定在該第二序列之存取單位中之一下一個可解碼存取單位的一解碼時間及該第二序列之存取單位中之該下一個可解碼存取單位的一輸出時間中之至少一者之前,該第二序列之存取單位中之該下一個可解碼存取單位是否可被解碼;及基於決定在該下一個可解碼存取單位的該解碼時間及該輸出時間中之至少一者之前該下一個可解碼存取單位無法被解碼,跳掉下一個可解碼存取單位的解碼。
於本發明之另一面向中,一種裝置包含至少一個處理器及至少一個記憶體。該記憶體單元包括電腦程式代碼。該至少一個記憶體及該電腦程式代碼與該至少一個處理器係經組配來使得該裝置至少封裝該第一序列之存取單位中之至少一個存取單位用以傳輸;封裝該第二序列之存取單位中之一第一可解碼存取單位用以傳輸;決定在該第二序列之存取單位中之一下一個可解碼存取單位的一解碼時間及該第二序列之存取單位中之該下一個可解碼存取單位的一傳輸時間中之至少一者之前,該第二序列之存取單位中之該下一個可解碼存取單位是否可被封裝;及基於決定在該下一個可解碼存取單位的該解碼時間及該傳輸時間中之至少一者之前該下一個可解碼存取單位無法被封裝,跳掉下一個可解碼存取單位的封裝。
於本發明之另一面向中,一種電腦程式產品係在一電腦可讀取媒體上具體實例且係包含解碼該第一序列之存取單位中之至少一個存取單位用之電腦代碼;解碼該第二序列之存取單位中之一第一可解碼存取單位用之電腦代碼;決定在該第二序列之存取單位中之一下一個可解碼存取單位的一解碼時間及該第二序列之存取單位中之該下一個可解碼存取單位的一輸出時間中之至少一者之前,該第二序列之存取單位中之該下一個可解碼存取單位是否可被解碼用之電腦代碼;及基於決定在該下一個可解碼存取單位的該解碼時間及該輸出時間中之至少一者之前該下一個可解碼存取單位無法被解碼,跳掉下一個可解碼存取單位的解碼用之電腦代碼。
於本發明之另一面向中,一種電腦程式產品係在一電腦可讀取媒體上具體實例且係包含封裝該第一序列之存取單位中之至少一個存取單位用以傳輸用之電腦代碼;封裝該第二序列之存取單位中之一第一可解碼存取單位用以傳輸用之電腦代碼;決定在該第二序列之存取單位中之一下一個可解碼存取單位的一解碼時間及該第二序列之存取單位中之該下一個可解碼存取單位的一傳輸時間中之至少一者之前,該第二序列之存取單位中之該下一個可解碼存取單位是否可被封裝用之電腦代碼;及基於決定在該下一個可解碼存取單位的該解碼時間及該傳輸時間中之至少一者之前該下一個可解碼存取單位無法被封裝,跳掉下一個可解碼存取單位的封裝用之電腦代碼。
本發明之此等及其它多個實施例的優點及特徵連同其組織及操作方式從後文詳細說明部分結合附圖將更為彰顯。
圖式簡單說明
藉參考附圖敘述本發明之實施例,附圖中:第1圖例示說明具有時間可擴充性的階層編碼結構之實例;第2a圖例示說明依據ISO基本媒體檔案格式的一框實例;第2b圖顯示依據ISO基本媒體檔案格式的一簡化檔案結構之實例;第3圖為例示說明樣本分組之一框實例;第4圖例示說明含有包括一SampletoToGroup框之一電影片段的一框實例;第5圖闡釋AVC樣本結構之一實例;第6圖闡釋一媒體表示內容描述XML基模之一實例;第7a-7c圖例示說明有五個時間層級之階層式可擴充位元串流實例;第8圖為流程圖例示說明依據本發明之實施例之一體現實例;第9a-9c圖例示說明於拍攝順序、解碼順序、及輸出順序中之序列實例;第10a-10b圖分別地例示說明依據本發明之實施例,第9a圖於解碼順序及輸出順序中之序列實例,連結從第9a圖 之一個串流切換至另一串流;第10c-10d圖分別地例示說明第9a圖於解碼順序及輸出順序中之序列實例,連結使用延遲切換而從第9a圖之一個串流切換至另一串流;第11a-11b圖例示說明始於對第7a圖之該序列體現的一切換點之一交替序列實例;第11c-11d圖例示說明始於對第7a圖之該序列體現的一切換點之一交替序列的另一實例;第12圖為其中可體現本發明之多個實施例之一系統的綜覽圖;第13圖例示說明依據本發明之多個實施例可利用之一電子裝置實例之透視圖;第14圖為可含括於第13圖之電子裝置內之該電路之示意代表圖;及第15圖為其中可體現多個實施例之一通用多媒體通訊系統之圖解代表圖;第16圖闡釋含括於HTTP串流系統中若干功能區塊、格式、及介面之例示說明實例;第17圖闡釋針對伺服器檔案格式之一檔案結構實例,於該處一個檔案含有組成一表示內容之整個持續時間之母資料片段;第18圖例示說明操作為HTTP串流伺服器之一常規網路伺服器之實例;及第19圖例示說明連結一動態串流伺服器之一常規網路 伺服器之實例。
較佳實施例之詳細說明
為了解說而非限制性目的,後文詳細說明部分中陳述細節及說明以供徹底瞭解本發明。但熟諳技藝人士顯然易知本發明可於背離此等細節及說明的其它實施例中實施。
如前記,進階視訊編碼(H.264/AVC)標準係稱作為ITU-T推薦H.264及ISO/IEC國際標準14496-10,又稱MPEG-4部分10進階視訊編碼(AVC)。已有數個H.264/AVC標準版本,各自將新特徵整合入規格中。第8版係指含括可擴充視訊編碼(SVC)修正的標準。第10版包括多視視訊編碼(MVC)修正。
類似早先視訊編碼標準,位元串流語法及語意以及無誤位元串流之解碼處理係載明於H.264/AVC。編碼程序係未經載明。位元串流及解碼器的相符程度可以假設性參考解碼器(HRD)證實,HRD係載明於H.264/AVC附錄C。該標準含有編碼工具,協助因應傳輸錯誤及損失,但該等工具用於編碼為選擇性,未曾載明針對錯誤位元串流的解碼處理。
H.264/AVC編碼器之輸入及H.264/AVC解碼器之輸出的基本單位為圖像。圖像可為一圖框或一欄位。一圖框包含亮度樣本及相對應的彩度樣本之一矩陣。一欄位為一圖框的交替樣本列之一集合,且當來源信號為交錯時,該欄位可用作為編碼器輸入。巨集區塊為亮度樣本之一16x16區塊及彩度樣本的相對應區塊。一圖像被分割成一或多個截 割片群組,一截割片群組含有一或多個截割片。一截割片包括在一特定截割片群組內部在光柵掃描中連續排序的整數個巨集區塊。
H.264/AVC編碼器之輸入及H.264/AVC解碼器之輸出的基本單位為網路摘要層(NAL)單位。部分或訛誤NAL單位的解碼典型地顯示困難。寫了透過封包導向網路傳送或儲存入結構化檔案,NAL單位典型地封裝成封包或相似的結構。針對不提供圖框化結構的傳輸或儲存環境,於H.264/AVC已經載明位元組串流格式。藉由在各個NAL單位前方附接一起始代碼,位元組串流格式將NAL單位彼此分開。為了避免NAL單位邊界的錯誤檢測,編碼器跑防止位元組導向起始代碼仿真演算法,否則若已經出現起始代碼,則增加一防止仿真位元組至該NAL單位酬載。為了作動封包-與串流-導向系統間的直捷閘道器操作,經常性地執行防止起始代碼仿真,而與是否使用位元組串流格式無關。
H.264/AVC之位元串流語法指示特定圖像是否為任何其它圖像的交互預測之參考圖像。結果,可安全地設置非用於預測的圖像亦即非參考圖像。於H.264/AVC中,任何編碼型別(I、P、B)的圖像可為參考圖像或非參考圖像。NAL單位標頭指示NAL單位之型別,及含在NAL單位中的編碼截割片是否為參考圖像或非參考圖像的一部分。
H.264/AVC已解碼為參考圖像標記程序來控制於解碼器中的記憶體耗用。用於交互預測的為參考圖像之最大數目標示為M係在序列參數集合中決定。當一參考圖像被解 碼時,標記為「用於參考」。若造成多於M個圖像的參考圖像之解碼被標記為「用於參考」時,至少一個圖像係被標記為「非用於參考」。針對解碼參考圖像標記,有兩個型別操作:適應性記憶體控制及截割窗。解碼參考圖像標記的操作模式係基於圖像作選擇。適應性記憶體控制作動明確傳訊哪些個圖像係被標記為「非用於參考」,且也可分派長期指數給短期參考圖像。適應性記憶體控制要求在位元串流中存在有記憶體管理控制操作(MMCO)。若使用截割窗操作模式且有M個圖像係被標記為「用於參考」,則在係被標記為「用於參考」的該等短期參考圖像中的第一解碼圖像之該短期參考圖像係被標記為「非用於參考」。換言之,截割窗操作模式導致短期參考圖像間的先進先出緩衝操作。
於H.264/AVC中的記憶體管理控制操作中之一者造成目前圖像以外的全部參考圖像皆係被標記為「非用於參考」。即時解碼再新(IDR)圖像只含有內部編碼截割片,且造成類似的參考圖像之「復置」。
用於交互預測的參考圖像係以一指數指示至一參考圖像列表。該指數係以可變長度編碼而編碼,亦即指數愈小,則相對應的語法元素變更短。針對H.264/AVC的各個雙預測截割片產生兩個參考圖像列表,及針對H.264/AVC的各個交互編碼截割片形成一個參考圖像列表。參考圖像列表係以二步驟建構:第一,產生初始參考圖像列表,及然後,該初始參考圖像列表可藉含在截割片標頭的參考圖像列表重新排序(RPLR)指令而重新排序。RPLR指令指示圖像被排 序至個別參考圖像列表的起點。
frame_num語法元素係用於與多參考圖像相關的各個解碼程序。於H.264/AVC中,IDR圖像的frame_num值為0。非IDR圖像的frame_num值係等於在解碼順序中,前一個參考圖像的frame_num遞增1(於模組算術中,亦即在frame_num的最大值之後frame_num之值捲繞過0)。
針對各個圖像推衍出圖像順序計數(POC)之一值,且相對於前一個IDR圖像,或含有一記憶體管理控制操作標記全部圖像為「非用於參考」的一圖像,隨著輸出順序中的圖像位置遞增不會減少。也係用在解碼程序用於雙預測截割片的時間直接模式中運動向量的暗示定標,用在加權預測的暗示導算權值,及用在B截割片的參考圖像列表初始化。此外,POC用於輸出順序相符性的驗證。
H.264/AVC附錄C中規定的假設性參考解碼器(HRD)係用來查驗位元串流與解碼器相符性。HRD含有一編碼圖像緩衝器(CPB)、一即時解碼程序、一解碼圖像緩衝器(DPB)、及一輸出圖像收穫區塊。CPB及即時解碼程序係類似地載明至任何其它視訊編碼標準,及輸出圖像收穫區塊只從在傳訊的輸出圖像程度外側的該解碼圖像收穫該等樣本。
於HRD中編碼圖像緩衝操作可簡化如下。假設位元係以常數到達位元率而到達CPB。如此,編碼圖像或存取單位係與初始到達時間相聯結,該初始到達時間指示何時編碼圖像或存取單位的第一位元進入CPB。此外,當該編碼圖像或存取單位的最末位元係插入CPB內,個別解碼圖像 係插入DPB時,編碼圖像或存取單位係被假設為即時去除,如此模擬即時解碼。此一時間稱作為編碼圖像或存取單位的去除時間。編碼視訊序列之第一編碼圖像的去除時間典型地係經控制,例如藉緩衝週期補充加強資訊(SEI)訊息控制。此種所謂的初始編碼圖像去除延遲,確保就用來填補CPB的常數位元率而言,編碼位元率的任何變化不會造成CPB的匱乏或溢位。須瞭解HRD之操作係比此處描述者更為複雜,具有例如低延遲操作模式及能力來於多個不同常數位元率操作。
DPB係用來控制相符的位元串流解碼所要求的記憶體資源。緩衝解碼圖像有兩個理由,用於交互預測之參考,及用於將解碼圖像重新排序為輸出順序。因H.264/AVC針對參考圖像標記及輸出重新排序二者提供相當大的彈性,故用於參考圖像緩衝及輸出圖像緩衝的分開緩衝器浪費記憶體資源。因此,DPB包括用於參考圖像及輸出重新排序的統一解碼圖像緩衝程序。當不再用作為參考且需要輸出時,解碼圖像係從DPB去除。位元串流許可使用的DPB之最大大小係載明於H.264/AVC的層定義(附錄A)。
解碼器有兩型相符性:輸出時間相符及輸出順序相符。針對輸出時間相符,比較HRD,解碼器係於相同時間輸出圖像。針對輸出順序相符,只考慮輸出圖像的正確順序。輸出順序DPB係假設含有最大容許數目的圖框緩衝器。當一圖框不再用作為參考而需輸出時,該圖框係從DPB移除。當解碼圖像緩衝器(DPB)變滿位時,在輸出順序的最 早圖框係輸出直到至少一個圖框緩衝器變成不被占用為止。
HRD之圖像時間及操作可藉兩個補充加強資訊(SEI)訊息控制:緩衝週期及圖像時間SEI訊息。緩衝週期SEI訊息載明初始CPB移除延遲。圖像時間SEI訊息載明與HRD之操作以及解碼圖像之輸出時間有關的其它延遲(cpb_removal_delay及dpb_removal_delay)。緩衝週期及圖像時間SEI訊息之資訊也可經由其它裝置傳遞,且無需含括入H.264/AVC位元串流。
NAL單位可歸類為視訊編碼層(VCL)NAL單位及非VCL NAL單位。VCL NAL單位係為編碼截割片NAL單位、編碼截割片資料劃分NAL單位、或VCL前綴NAL單位。編碼截割片NAL單位含有表示一或多個編碼巨集區塊之語法元素,其各自係相對應於未經壓縮圖像的一樣本區塊。編碼截割片NAL單位有四個型別:於即時解碼再新(IDR)圖像中的編碼截割片、於非IDR圖像中的編碼截割片、輔助編碼圖像(諸如α平面)的編碼截割片、及編碼截割片擴延(針對於可擴充或多視擴延的編碼截割片)。三個編碼截割片資料劃分NAL單位之集合含有與編碼截割片相同的語法元素。編碼截割片資料劃分A包含一截割片之巨集區塊標頭及運動向量,而編碼截割片資料劃分B及C分別地包括針對巨集區塊內部及巨集區塊間的編碼殘差資料。VCL前綴NAL單位在SVC位元串流基礎層的編碼截割片之前,且含有相聯結的編碼截割片之擴充性階層關係之指示。
非VCL NAL單位可以屬下列型別中之一者:一序列參數集合、一圖像參數集合、一補充加強資訊(SEI)NAL單位一存取單位定界符、序列NAL單位之一端、串列NAL單位之一端、或一填充元資料NAL單位。參數集合為解碼圖像之重建所必需,而其它非VCL NAL單位並非解碼樣本值之重建所必需且係用於其它目的。
為了穩健地傳輸不常改變的編碼參數,參數集合機制係調整適用於H.264/AVC。經由編碼視訊順序維持不變的參數係含括於一序列參數集合。除了解碼處理所必需的參數外,序列參數集合選擇性地可含有視訊可用性資訊(VUI),VUI含有針對緩衝、圖像輸出時間、渲染、及資源保留為重要的參數。圖像參數集合含有在數個編碼圖像中可能為不變的此等參數。沒有任何圖像標頭係存在於H.264/AVC位元串流,但頻仍地改變中的圖像層面資料係在各個截割片標頭重複,圖像參數集合載有其餘圖像層面參數。H.264/AVC語法許可序列及圖像參數集合的多個情況,各個情況係以一個獨特識別符標示。各個截割片標頭包括針對含有該截割片的圖像解碼為作用態之圖像參數集合的識別符,及各個圖像參數集合含有作用態序列參數集合之識別符。結果,圖像參數集合及序列參數集合的傳輸無需與截割片的傳輸準確地同步化。取而代之,作用態序列參數集合及圖像參數集合係在被述及前的任何瞬間被接收即足,如此允許比較用於截割片資料的協定,使用更為可靠的傳輸機構傳輸參數集合。舉例言之,參數集合可含括作為H.264/AVC RTP階段性作業的階段性作業描述中之參數。於應用中每當可能時,推薦使用頻帶外可靠傳輸機制。若參數集合係在頻帶內傳輸,則可重複來改良錯誤穩健度。
SEI NAL單位含有一或多個SEI訊息,此點並非輸出圖像之解碼所需,反而協助相關處理程序,諸如圖像輸出時間、渲染、錯誤檢測、錯誤隱慝、及資源保留。若干SEI訊息已載明於H.264/AVC,用戶資料SEI訊息使得機構及公司可載明供其本身使用的SEI訊息。H.264/AVC含有所載明的SEI訊息之語法及語意,但未定義在接收者端處置訊息之處理程序。結果,當編碼器產生SEI訊息時係遵循H.264/AVC標準,而遵照H.264/AVC標準的解碼器並非處理輸出順序相符性的SEI訊息所需。在H.264/AVC中含有SEI訊息之語法及語意的理由中之一者係許可不同的系統規格以相同方式解譯補充資訊,因而可交互操作。意圖系統規格可要求在編碼端及解碼端二者使用特定SEI訊息,及額外地可載明在接收者端處置SEI訊息之處理程序。
編碼圖像包括該圖像解碼所要求的VCL NAL單位。編碼圖像可為一次編碼圖像或為冗餘編碼圖像。一次編碼圖像係用於有效位元串流的解碼處理,而冗餘編碼圖像為當一次編碼圖像無法成功地被解碼時才被解碼的冗餘表示型態。
一個存取單位包括一個一次編碼圖像及與其相聯結的該等NAL單位。NAL單位在一存取單位內部的出現順序限於如下。NAL單位的選擇性存取單位定界符可指示一存取 單位的起點。接著為零個或更多個SEI NAL單位。其次出現一次編碼圖像的編碼截割片或截割片資料劃分,接著為針對零個或更多個冗餘編碼圖像的編碼截割片。
編碼視訊序列係定義為以解碼順序從IDR存取單位(含),至下個IDR存取單位(除外),或至位元串流的終點(視何者先出現而定)的一序列連續存取單位。
H.264/AVC許可階層式時間擴充性。其擴延SVC及MVC提供若干額外指示,特別為於NAL單位標頭中的temporal_id語法元素,使得時間擴充性的使用更為直捷。時間擴充性藉給於調整圖框率的彈性而提供於時域中的視訊品質精製。由SVC提供不同型別擴充性之綜論係提供於隨後各段,時間擴充性之更加細節綜論係進一步提供如下。
於可擴充視訊編碼中,視訊信號可編碼入基底層及建構一或多個加強層。加強層加強時間解析度(亦即圖框率)、空間解析度、或單純由另一層或其部分表示的視訊內容的品質。各層連同其全部依賴層係視訊信號在某個空間解析度、時間解析度、及品質層面的一個表示型態。於本文件中,將可擴充層連同其全部依賴層稱作為「可擴充層表示型態」。相對應於可擴充層表示型態的可擴充位元串流部分可經提取與解碼來以某個保真度產生原先信號之一表示型態。
於某些情況下,於加強層的資料在某個位置之後或甚至在任意位置可經截頭,於該處各個截頭位置可包括表示視覺品質遞增加強的額外資料。此種 可擴充性係稱作為細粒(粒度)可擴充性(FGS)。值得一提者FGS之支援並不含括於SVC標準,反而支援可得自早期SVC草稿,例如於JVT-U201,「SVC修訂之聯合草稿8」,第21屆JVT會議,中國杭州2006年10月,得自http//ftp3.itu.ch/av-arch/jvt-site/2006_10_Hangzhou/JVT-U201.zip。與FGS相反地,由無法被截頭的該等加強層所提供的可擴充性係稱作為粗粒(粒度)可擴充性(CGS)。其集合地包括傳統品質(SNR)可擴充性及空間可擴充性。SVC草稿標準也支援所謂的中粒可擴充性(MGS),於該處品質加強圖像係類似於SNR可擴充層圖像編碼,但由類似FGS層圖像的高位準語法元素指示,由具有quality_id語法元素大於0指示。
SVC使用層間預測機制,其中某個資訊可從目前重建層或下一個較低層以外的各層預測。可被層間預測的資訊包括排列結構、運動及殘差內部資料。層間運動預測包括區塊編碼模式、標頭資訊等的預測,其中來自較低層的運動可用以預測較高層。於內部編碼之情況下,來自較低層的周圍巨集區塊或來自共同定位巨集區塊的預測為可能。此等預測技術並不採用來自早期編碼存取單位的資訊,因而稱作為內部預測技術。又復,來自較低層的殘差資料也可採用於目前層的預測。
於SVC草稿中的可擴充性結構係以如下三個語法元素決定特徵:「temporal_id」、「dependency_id」、及「quality_id」。語法元素「temporal_id」係用來指示時間可 擴充性階層,或間接地指示圖框率。包含具有較小的最大「temporal_id」值之圖像的可擴充層表示型態係具有比包含具有較大的最大「temporal_id」值之圖像的可擴充層表示型態更小的圖框率。給定的時間層典型地係取決於較低時間層(亦即具有較小「temporal_id」值之時間層),但不依賴任何較高時間層。語法元素「dependency_id」係用來指示CGS層間編碼依賴性階層(如前述,包括SNR及空間可擴充性二者)。在任一個時間層級位置,較小的「dependency_id」值之圖像可用於具有較大「dependency_id」值的圖像編碼之層間預測。語法元素「quality_id」係用來指示FGS或MGS層之品質位準階層。在任一個時間位置,且具有相同「quality_id」值,具有「quality_id」等於QL的圖像使用具有「quality_id」等於QL-1的圖像用於層間預測。具有「quality_id」大於0之編碼截割片可編碼為可截頭FGS截割片或非可截頭MGS截割片。
為求簡明,在一個存取單位中具有相同值「quality_id」的全部資料單位(例如於SVC脈絡中的網路摘要層(NAL)單位或NAL單位)係稱作為依賴性單位或依賴性表示型態。於一個依賴性單位內部,具有相同值「quality_id」的全部資料單位係稱作為品質單位或層表示型態。
基本表示型態又稱解碼基本圖像或參考基本圖像,係從解碼具有「quality_id」等於0的依賴性單位之視訊編碼層(VCL)NAL單位所得的解碼圖像,「store_ref_base_pic_flag」 係設定為等於1。加強表示型態又稱解碼圖像,係得自規則解碼處理程序,其中對最高依賴性表示型態存在的全部層表示型態皆係經解碼。
各個H.264/AVC VCL NAL單位(NAL單位型別係在1至5的範圍)前方接有SVC位元串流中的一前綴NAL單位。相符H.264/AVC解碼器體現忽視前綴NAL單位。前綴NAL單位包括「temporal_id」值,因此解碼基本層的SVC解碼器可從前綴NAL單位得知時間可擴充性階層。此外,前綴NAL單位包括基本表示型態之參考圖像標記指令。
SVC使用與H.264/AVC的相同機制來提供時間可擴充性。時間可擴充性藉給定調整圖框率的彈性而提供時域中的視訊品質的精製。隨後段落提供時間可擴充性之綜述。
最早導入視訊編碼標準的可擴充性為在MPEG-1視覺中具有B圖像的時間可擴充性。於此種B圖像構思中,B圖像係從兩個圖像雙預測,一個圖像係在B圖像之前,而另一個在B圖像之後,皆為顯示順序。於雙預測中,來自兩個參考圖像的兩個預測區塊係逐一樣本求平均來獲得終預測區塊。習知地,B圖像為非參考圖像(亦即非用於由其它圖像的圖像間預測參考)。結果,B圖像可被拋棄來達成具有較低圖框率的時間可擴充性點。相同機制保留在MPEG-2視訊、H.263及MPEG-4視覺。
於H.264/AVC中,B圖像或B截割片構思已經改變。B截割片之定義如下:使用在同一個截割片內部來自解碼樣本的內部預測或來自先前解碼參考圖像的交互預測可解碼 的截割片,使用至多兩個運動向量及參考指數來預測各個區塊的樣本值。習知B圖像的雙向預測性質及非參考圖像性質二者不再有效。於B截割片的一個區塊可以顯示順序從在相同方向的兩個參考圖像預測,及含括B截割片的圖像可由其它圖像參照用於圖像間預測。
於H.264/AVC、SVC、及MVC中,時間可擴充性可藉使用非參考圖像及/或階層圖像間預測結構達成。只使用非參考圖像可達成於MPEG-1/2/4中藉拋棄非參考圖像,使用習知B圖像所能達成的相似的時間可擴充性。階層編碼結構可達成更具彈性的時間可擴充性。
典型地於隨機存取點可切換成另一個編碼串流。但在切換點,切換-至串流的初始緩衝要求可能比切換-自串流的緩衝延遲更長,因而回放時可能有干擾。視訊回放無法無縫地連續,反而切換-自串流的最末圖像被顯示比規則圖像間隔更長的時間週期。雖然可能難以知覺視訊圖框率的小量變化,可維持音訊串流的對嘴型同步化,因而音訊回放時可能有小中斷或干擾。此種音訊中斷容易觀察得且惱人。另一項可能係使得音訊及視訊非同步化,但此種非同步性也可察覺且發現為惱人。
在切換點,切換-至串流的初始緩衝要求可能比切換-自串流的緩衝延遲更長係因至少兩個理由:
第一,當切換-自串流及切換-至串流的輸出時間表為相同時,切換-至串流的解碼程序可能要求比切換-自串流的解碼程序結束時間更早開始。換言之,切換-自串流的最末編 碼圖像解碼之結束時間可比切換-至串流的第一編碼圖像之開始時間更晚。就H.264/AVC之假設性參考解碼器(HRD)言之,在切換-自串流中之最末存取單位的移除時間可比切換-至串流的第一存取單位的初始到達時間更遲。陳述此項挑戰的又另一方式為在解碼時間表上,切換-自串流之最末圖像的解碼時間可能重疊切換-至串流的第一樣本的解碼時間。
第二,串流的時間預測/可擴充性階層可能相異,因此於切換-自串流及切換-至串流中初始解碼圖像緩衝延遲可能相異。
現在參考第1圖,以四個層級的時間可擴充性來例示說明之階層編碼結構實例。顯示順序係以標示為圖像順序計數值(POC)210之值指示。於時間層級(TL)0的I或P圖像諸如I/P圖像212,又稱關鍵圖像,係以解碼順序編碼為一組圖像(GOP)214中的第一圖像。當關鍵圖像(例如關鍵圖像216、218)係交互編碼時,先前關鍵圖像212、216係用作為圖像間預測的參考。此等圖像係相對應於時間可擴充性結構中的最低時間層級220(圖中標示為TL),且係與最低圖框率相聯結。較高時間層級的圖像可只使用相同的或更低的時間層級之圖像用於圖像間預測。採用此種階層編碼結構,藉拋棄某個時間層級值及超過該值的圖像,可達成相對應於不同圖框率的不同時間可擴充性。於第1圖中,圖像0、8、及16係屬最低時間層級,而圖像1、3、5、7、9、11、13及15係屬最高時間層級。其它圖像係被分派以其它時間層級 階層。此等具有不同時間層級的圖像組成具有不同圖框率的位元串流。當解碼全部時間層級時,獲得30赫茲圖框率(假設原先編碼序列具有30赫茲圖框率)。藉拋棄若干時間層級的圖像,可獲得其它圖框率。具有最低時間層級的圖像係與3.75赫茲相聯結。具有較低時間層級或較低圖框率的時間可擴充性層也稱作較低時間層。
前述階層B圖像編碼結構為用於時間可擴充性的最典型編碼結構。但須注意遠更具有彈性的編碼結構亦屬可能。舉例言之,GOP大小隨時間之經過可能非為常數。於另一個實例中,時間加強層圖像無需編碼為B截割片;也可編碼為P截割片。
於H.264/AVC中,時間層級可藉在次-序列資訊補充加強資訊(SEI)訊息中的次-序列層號碼傳訊。於SVC及MVC中,時間層級可藉語法元素「temporal_id」於網路摘要層(NAL)單位標頭中傳訊。各個時間層級的位元率及圖框率資訊可於可擴充性資訊SEI訊息中傳訊。
隨機存取係指解碼器在串流起點以外的一點開始解碼一串流,且復原該解碼圖像的確切或約略表示型態的能力。隨機存取點及復原點決定隨機存取操作之特徵。隨機存取點為可開始解碼的任何編碼圖像。以輸出順序在復原點或接續其後的全部解碼圖像,其內容為正確或近似正確。若隨機存取點與復原點相同,則隨機存取操作為瞬時,否則為漸進。
隨機存取點許可儲存在本地的視訊串流之搜尋、快速 前轉、及快速倒轉操作。於視訊應需串流化中,伺服器可回應於搜尋要求,傳輸資料始於最靠近所要求的搜尋操作之目的地的該隨機存取點。在不同位元率的編碼串流間切換乃一種方法,該方法常用在單播串流化中,將所傳輸的位元率匹配期望的網路資料通過速率,且避免網路的壅塞。在一隨機存取點切換至另一個串流為可能。又復,隨機存取點許可調整為廣播或多播。此外,隨機存取點可編碼為來源序列中的場景切割的回應,或編碼為圖像內部更新要求的回應。
習知地,各個內圖像在編碼序列中具有一隨機存取點。導入多個參考圖像用於圖像間預測,造成內圖像不足以用於隨機存取。舉例言之,以解碼順序在內圖像之前的一解碼圖像可用作為以解碼順序在內圖像之後的圖像間預測的一參考圖像。因此,必須使用H.264/AVC標準中載明的IDR圖像或具有IDR圖像之類似性質的內圖像作為隨機存取點。封閉式圖像群組(GOP)乃其中全部圖像係正確解碼的一組圖像。於H.264/AVC中,封閉式GOP可始於IDR存取點(或始於內部編碼圖像,具有記憶體管理控制操作標記出全部未使用的先前參考圖像)。
開放式圖像群組(GOP)為下述圖像群組,其中於輸出順序在初始內圖像之前的圖像無法正確地解碼,但在初始內圖像之後的圖像可被正確地解碼。H.264/AVC解碼器可辨識一內圖像,係從在H.264/AVC位元串流中的復原點SEI訊息開始開放式GOP。在開始開放式GOP的初始內圖像前方的 圖像係稱作為先導圖像。有兩型先導圖像:可解碼及非可解碼。可解碼先導圖像為當解碼係始於開始開放式GOP的初始內圖像時,該圖像可被正確解碼。換言之,可解碼先導圖像只使用解碼順序中的初始內圖像或隨後圖像作為圖像間預測的參考。非可解碼先導圖像為當解碼係始於開始開放式GOP的初始內圖像時,該圖像無法被正確解碼。換言之,非可解碼先導圖像只使用解碼順序中在開始開放式GOP的初始內圖像之前的圖像作為圖像間預測的參考。ISO基本媒體檔案格式(第3版)修訂1包括支援用以透過樣本依賴性型別框中的先導語法元素及可用在追蹤片段之樣本旗標中的先導語法元素而指示可解碼及非可解碼先導圖像。
注意於隨機存取脈絡中GOP一詞的用法與SVC脈絡中的用法不同。於SVC中,GOP係指從具有temporal_id等於0(含)的圖像至具有temporal_id等於0(除外)的下一個圖像該圖像群組,如第1圖例示說明。於隨機存取脈絡中,GOP為可解碼的一組圖像,而與解碼順序中任何較早的圖像是否已經被解碼無關。
漸進解碼再新(GDR)係指在非IDR圖像開始解碼,且在解碼某個量的圖像後復原內容為正確的解碼圖像。換言之,GDR可用來從非內圖像達成隨機存取。用於圖像間預測的某些參考圖像在隨機存取點與復原點間可能不可得,因此,於漸進解碼再新週期中的某些解碼圖像部分無法被正確地重建。但此等部分並非用在復原點或復原點之後預測之用,結果導致始於復原點的無誤解碼圖像。
顯然比較即時解碼再新,漸進解碼再新對編碼器及解碼器二者皆更為煩瑣。但因兩項事實,漸進解碼再新於容易出錯環境下合乎所需:第一,內編碼圖像通常係顯著大於非內編碼圖像。如此使得內圖像比非內圖像更容易出錯,錯誤可能及時傳播直到訛誤的巨集區塊位置被內編碼為止。第二,內編碼巨集區塊係用在容易出錯環境下停止錯誤傳播。如此,如此組合內編碼巨集區塊用於隨機存取且用於防止錯誤傳播變成合理,例如在容易出錯的傳輸通道上操作的視訊會議用途及廣播視訊用途。此項結論係用在漸進解碼再新。
漸進解碼再新可以隔離區域編碼法實現。一圖像中的隔離區域可含有任何巨集區塊位置,一圖像可含有零或更多個不重疊的隔離區域。剩餘區域為不被圖像的任何隔離區域覆蓋的圖像區域。當編碼隔離區域時,橫過其邊界圖像內預測被解除作動。剩餘區域可從同一個圖像的隔離區域預測。
編碼隔離區域可經解碼而無同一個編碼圖像的任何其它隔離區域或剩餘區域的存在。在剩餘區域之先,可能需要解碼一圖像的全部隔離區域。一隔離區域或一剩餘區域含有至少一個截割片。
其隔離區域係從彼此可預測的圖像係集結成為隔離區域圖像群組。隔離區域可從同一個隔離區域圖像群組內部其它圖像的相對應隔離區域作間-預測,而不許可從其它隔離區域或隔離區域圖像群組外部的間-預測。剩餘區域可從 任何隔離區域間-預測。耦合的隔離區域之形狀、位置、及大小可在隔離區域圖像群組中從圖像至圖像演進。
演進的隔離區域可用來提供漸進解碼再新。新演進的隔離區域係建立在圖像的隨機存取點,及隔離區域中的巨集區塊係內-編碼。隔離區域之形狀、位置、及大小係從圖像至圖像演進。隔離區域可從漸進解碼再新週期中的較早圖像的相對應隔離區域間-預測。當隔離區域覆蓋整個圖像區,始於隨機存取點解碼時,獲得內容完全正確的圖像。此一方法也可普及化成含括多於一個演進的隔離區域,其最終涵蓋整個圖像區。
可有訂製的頻帶內傳訊,諸如復原點SEI訊息來指示解碼器的漸進隨機存取點及復原點。此外,復原點SEI訊息含括一指示,演進的隔離區域是否用在隨機存取點與復原點間來提供漸進解碼再新。
雖然本發明之多個實施例係參考H.264/AVC、SVC、及/或MVC描述,但須瞭解實施例中之多者可應用至其它視訊編碼體系,諸如HEVC及MPEG-2視覺,以及傳承相似緩衝至編碼圖像緩衝及/或非編碼圖像緩衝的編碼體系。
RTP係用在傳輸連續媒體資料,諸如於基於網際網路協定(IP)網路中的編碼音訊及視訊串流。即時傳送控制協定(RTCP)為RTP的伙伴,亦即當網路及應用程式基礎架構允許其使用時,RTCP須用來補償RTP。RTP及RTCP通常係透過用戶資料訊息協定(UDP)傳遞,而其又轉而透過網際網路協定(IP)傳遞。RTCP係用來監視由網路所提供的服務品 質,及傳遞有關正在進行中的對話參與者的資訊。RTP及RTCP係設計來用於從一對一通訊至數千個端點的大型多播群的對話。為了於多方對話中控制由RTCP封包所造成的總位元率,由單一端點傳輸的RTCP封包的傳輸間隔係與對話中的參與者數目成正比。各個媒體編碼格式具有特定RTP酬載格式,規定在RTP封包之酬載中的媒體資料如何結構化。
可用的媒體檔案格式標準包括ISO基本媒體檔案格式(ISO/IEC 14496-12)、MPEG-4檔案格式(ISO/IEC 14496-14,又稱MP4格式)、AVC檔案格式(ISO/IEC 14496-15)、3GPP檔案格式(3GPP TS 26.244,又稱3GP格式),及DVB檔案格式。SVC及MVC檔案格式係載明為AVC檔案格式的修訂。ISO檔案格式係用來推衍全部前述檔案格式(ISO檔案格式本身除外)的基礎。此等檔案格式(含ISO檔案格式本身)係稱作ISO檔案格式家族。
第2a圖顯示依據ISO基本媒體檔案格式之一簡化檔案結構230。ISO基本媒體檔案格式中之基本積木單位稱作一框。各個框有一標頭及一酬載。框標頭以位元組為單位,指示框型別及框大小。一框可含有其它框,ISO檔案格式載明哪些類型框被許可存在某一型框內部。此外,有些框係被強制存在於各個檔案內,而其它框則為選擇性。又復,針對某些框型別,一個檔案內許可有多於一個框存在。歸結為ISO基本媒體檔案格式載明階層式框結構。
依據ISO檔案格式家族,檔案包括媒體資料及母資料, 分別地包含在分開框內亦即媒體資料(mdat)框及電影(moov)框。為了讓檔案可操作,可存在此等框中之二者,除非媒體資料係位在一或多個外部檔案內,且述及使用資料參考框,容後詳述。電影框可含有一或多個軌跡,各個軌跡係駐在一個軌跡框內。軌跡可屬下列型別中之一者:媒體、暗示、定時母資料。媒體軌跡係指依據壓縮格式(及其封裝成ISO基本媒體檔案格式)格式化的樣本。暗示軌跡係指暗示樣本,含有用以組成封包供透過指示的通訊協定傳輸之食譜指令。食譜指令可含有封包標頭組成之指南,且包括封包酬載組成。於封包酬載組成中,可參考駐在其它軌跡或項目的資料,亦即藉參考而指示於封包組成過程中,在特定軌跡或項目中的哪一段資料係被指示拷貝入一封包。定時母資料軌跡係指描述所指稱媒體的樣本及/或暗示樣本。為了呈現一個媒體型別,典型地選擇一個媒體軌跡。
一軌跡中的樣本係暗示地與樣本號碼相聯結,於指示的樣本解碼順序中,樣本號碼係遞增1。一軌跡中的第一樣本係與樣本號碼1相聯結。注意此一假設影響如下部分式,且熟諳技藝人士顯然易知針對樣本號碼之其它起始偏移值(諸如0)修正該式。
第2b圖顯示依據ISO基本媒體檔案格式之一簡化檔案結構實例。
雖然未例示說明於第2b圖,但依據ISO基本媒體檔案格式而格式化的許多檔案始於一檔案型別框,又稱ftyp框。 ftyp框含有標示檔案的品牌資訊。ftyp框包括一個主品牌指示及一可相容性品牌列表。主品牌識別最適合用以剖析該檔案的檔案格式規格。可相容性品牌指示該檔案係遵照哪個檔案格式規格及/或相符性點。一個檔案可能符合多個規格。須列表指示與此等規格具可相容性的全部品牌,使得讀者只瞭解可相容性品牌之一子集可獲得檔案可經剖析的指示。可相容性品牌也許可一特定檔案格式規格的檔案剖析器處理於該ftyp框中含有該特定檔案格式品牌的一檔案。
須注意ISO基本媒體檔案格式並不限制一表示型態含在一個檔案,反而可含於數個檔案。一個檔案含有整個表示型態之母資料。此一檔案也可含有全部媒體資料,而此時表示型態為自容式。其它檔案若使用時並不要求格式化為ISO基本媒體檔案格式,其它檔案係用來含有媒體資料,也可含有未使用的媒體資料或其它資訊。ISO基本媒體檔案格式係只有關於該表示型態檔案之結構。唯有在媒體檔案中的媒體資料係如ISO基本媒體檔案格式或其推衍格式所規定而格式化時,媒體資料檔案之格式係限於ISO基本媒體檔案格式或其推衍格式。
參考外部檔案的能力係經由資料參考實現如下。於各個軌跡所含的樣本描述框包括一樣本分錄列表,各個分錄提供有關所使用的編碼型別之細節資訊,及該編碼需要的任何初始化資訊。一組塊(chunk)之全部樣本及一軌跡片段之全部樣本使用相同樣本分錄。一個組塊為一個軌跡之連續樣本集合。資料參考框也含括於各個軌跡,該框含有 URL、URN、及自我參考含有母資料之該檔案的一索引列表。一個樣本分錄指向該資料參考框的一個索引,因而指示含有個別組塊或軌跡片段之樣本的該檔案。
當記錄內容至ISO檔案時可使用電影片段,以免當記錄應用程式故障、碟片耗盡、或發生若干其它意外時遺失資料。若無電影片段,可能發生資料遺失,原因在於檔案格式堅持全部母資料(電影框)被寫在檔案的一個連續區。又復,當記錄一檔案時,可能沒有足量隨機存取記憶體(RAM)或其它讀寫記憶體來針對可用儲存裝置大小而緩衝一電影框,及當電影的閉合太慢時重新計算電影框的內容。此外,電影片段可允許使用規則ISO檔案剖析器來同時記錄與回放一檔案。最後,當使用電影片段,且初電影框係比具有相同媒體內容但不使用電影片段結構化的一檔案更小時,要求更小的初始緩衝時間用以漸進下載,亦即同時接收與回放一檔案。
電影片段特徵許可將習知係駐在moov框的母資料分裂成多塊,各自係相對應於一軌跡的某個時間週期。換言之,該電影片段特徵許可交插檔案母資料及媒體資料。結果可限制moov框大小,實現前述用途實例。
電影片段之媒體樣本若係在moov框的相同檔案,則照例係駐在mdat框。但針對電影片段之母資料提供moof框。包含先前在moov框的某個回放時間期間之資訊。moov框本身仍表示有效影片,但此外包含一mvex框,指示同一個檔案將接著電影片段。電影片段擴延時間上與moov框相聯結 的該表示型態。
在電影片段內部有個軌跡片段集合,每個軌跡有零或更多個軌跡片段。該等軌跡片段又轉而含有零或更多個軌跡回合,軌跡回合各自記錄該軌跡之一連續樣本回合。在此等結構內部,許多欄位為選擇性且可為內設。
可含括於moof框的母資料係限於可含括於moov框之該母資料之一子集,但於某些情況下係以不同方式編碼。可含括於moof框的該等框細節可見於ISO基本媒體檔案格式規格。
現在參考第3及4圖,例示說明於框中樣本分組的使用。於ISO基本媒體檔案格式及其推衍格式,諸如AVC檔案格式及SVC檔案格式中樣本分組為基於分組標準,將一軌跡中的各個樣本分派給一樣本群組的一個成員。於樣本分組中的一樣本群組並不限於連續樣本,可含有非相鄰樣本。由於針對一軌跡中的該等樣本可有多於一種樣本分組,故各個樣本分組具有一型別欄位來指示分組的型別。樣本分組係藉兩個鏈接的資料結構表示:(1)SampleToGroup框(sbgp框)表示樣本分派給樣本群組;及(2)SampleGroupDescription框(sgpd框)針對描述該群組性質的各個樣本群組含有一個樣本群組分錄。基於不同分組標準,可有多個SampleToGroup框及SampleGroupDescription框情況。此等係藉型別欄位區別來指示分組的型別。
第3圖提供簡化框階層結構,指示樣本群組框的巢套結構。樣本群組框(SampleGroupDescription框及 SampleToGroup框)係駐在樣本表(stbl)框內部,該框係包圍在電影(moov)框內部的媒體資訊(minf)、媒體(mdia)、及軌跡(trak)框(以所述順序)內。
SampleToGroup框係被許可駐在一電影片段內。因此,可逐一片段完成樣本分組。第4圖例示說明含有包括一SampleToGroup框的一電影片段之一檔案實例。於ISO基本媒體檔案格式草稿修訂3(版本3)中,除了樣本表框之外,係許可含括SampleGroupDescription框來駐在電影片段。
由於顯著壓縮效率改良故,提示使用藉H.264/AVC、SVC、及MVC而可作動的多層級時間擴延性階層。但多層級階層關係也造成解碼起始與渲染起始間的顯著延遲。延遲係因下述事實所起,已解碼圖像必須從其解碼順序重新排序成輸出/顯示順序。結果,當從一隨機位置存取一串流時,比較非階層式時間擴延性的延遲,起始延遲增加,及同樣地,多播或廣播的調整延遲增加。
第7a-7c圖例示說明有五個時間層級(亦即GOP大小16)的可階層式擴延位元串流之一實例。在時間層級0的圖像係從在時間層級0的先前圖像預測。在時間層級N(N>0)的圖像係從以輸出順序在時間層級<N的先前及接續其後圖像預測。於本實例假設一個圖像的解碼係持續一個圖像間隔。即便此乃無知的假設,但可用於例示說明問題之目的而又不喪失普及性。
第7a圖顯示於輸出順序之序列實例。框內數值指示該圖像的frame_num值。斜體字數值指示非參考圖像,而其它 圖像為參考圖像。
第7b圖顯示於解碼順序之序列實例。第7c圖顯示當假設輸出時間表係重合解碼時間表時,於輸出順序之序列實例。從第7a圖可知,具有圖框號碼5的圖像須在該序列可被正確地解碼與輸出前解碼。因此,於第7c圖中該序列的輸出係延遲五個圖框間隔,使得該序列其餘部分的輸出將不會在解碼器輸出造成任何間隙。換言之,於第7c圖中,一圖像的最早輸出時間係在圖像解碼後的下一個圖像間隔。可知串流回放的開始比串流解碼的開始更遲五個圖框間隔。若圖像係以25赫茲取樣,則圖像間隔為40毫秒,及回放延遲0.2秒。
AVC檔案格式(ISO/IEC 14496-15)係基於ISO基本媒體檔案格式。描述如何將H.264/AVC串流儲存在基於ISO基本媒體檔案格式的任何檔案格式。
AVC串流為一序列存取單位,各自劃分為多個網路摘要層(NAL)單位。於一AVC檔案中,一個存取單位的全部NAL單位形成一個檔案格式樣本;及於該檔案中,各個NAL單位前方緊接其大小,以位元組表示。
AVC樣本之結構之實例係闡釋於第5圖。
AVC存取單位係由一個NAL單位集合組成。各個NAL單位係以長度欄位(長度)及酬載(NAL單位)表示。長度指示接著的NAL單位之長度,以位元組表示。長度欄位可組配成1、2、或4位元組。NAL單位含有如ISO/IEC 14496-10載明的NAL單位資料。
SVC及MVC檔案格式為AVC檔案格式的進一步規格且與其可相容。類似AVC檔案格式,定義SVC及MVC串流如何可儲存在基於ISO基本媒體檔案格式的任何檔案格式。
因SVC及MVC編解碼器可以與AVC可相容之方式操作,故SVC及MVC檔案格式也可以AVC可相容方式使用。但有若干SVC-及MVC-特定結構來許可擴充性操作及多視操作。
於遵守ISO基本媒體檔案格式的檔案中之一樣本,諸如視訊軌跡之一圖像,典型地係與一解碼時間及一組成時間相聯結,該解碼時間指示何時開始樣本的處理或解碼,及該組成時間指示何時樣本被渲染或輸出。組成時間為其軌跡所特有,例如出現在該軌跡的媒體時間表上。組成時間係透過解碼時間與個別組成時間間之偏移值指示。針對描述於樣本表框的樣本,組成偏移值係含括於至取樣的組成時間框;針對描述於軌跡片段框的樣本,組成偏移值係含括於電影片段結構,諸如軌跡回合框。自從ISO基本媒體檔案格式修訂1(版本3)以來,已經許可組成偏移值帶有符號;而在檔案格式規格的更早期版本,要求組成偏移值為非負。軌跡相對於彼此的同步化可經由編輯框指示,其各自含有含該編輯框之該軌跡的媒體時間表對電影時間表之一對映關係。編輯框包括一編輯列表框,其含有一序列操作或指令,各自對映該媒體時間表之一章節至該電影時間表。稱作為空白編輯之一指令可用來移位該媒體時間表的起始時間,使得始於該電影時間表的非零位置。
組成至解碼框可定義如下:框型別:「cslg」容器:樣本表框(「stbl」)或軌跡擴延性質框(「trep」)強制:無數量:零或一
當使用有符號的組成偏移值時,此框可用來關聯組成時間表與解碼時間表,且因應由有符號的組成偏移值所導入的若干模稜兩可。
全部此等欄位皆可應用至整個媒體(非僅任何編輯所選用的媒體)。推薦任何編輯明確地或暗示地不選擇不對映至一樣本的組成時間表的任何部分。舉例言之,若最小組成時間為1000,則從0至該媒體持續時間的內設編輯留下與無媒體樣本相聯結的的0至1000之週期。於此種情況下,播放器表現及此一時間間隔組成者係未經界定。推薦最小計算組成時間戳記(CTS)為零,或匹配第一編輯的起點。
當組成至解碼框係含括於樣本表框時,記錄於電影框中樣本的組成與解碼時間關係。當組成至解碼框係含括於軌跡擴延性質框時,記錄在該電影框之後的全部電影片段中樣本的組成與解碼時間關係。
一軌跡中最末樣本的組成持續時間可能模稜兩可或不明;組成結束時間之欄位可用來澄清此項模稜兩可,及與組成開始時間建立該軌跡的清晰組成持續時間。但因當該框記錄電影片段時組成結束時間可能為未知,故組成結束時間是否存在為選擇性。
組成至解碼框之語法可定義如下:
若該值compositionToDTSShift係加至組成時間(如藉與解碼時間戳記(DTS)的CTS偏移值計算),則針對全部樣本,其CTS係保證大於或等於其DTS,且將授與由指示的輪廓/層級暗示的緩衝模型;若leastDecodeToDisplayDelta為正或為零,則此欄位可為0。否則此欄位至少為(-leastDecodeToDisplayDelta)。
leastDecodeToDisplayDelta:於本軌跡中於CompositionTimeToSample框中的最小組成偏移值greatDecodeToDisplayDelta:於本軌跡中於CompositionTimeToSample框中的最大組成偏移值compositionStartTime:針對本軌跡之媒體中的任何樣本之最小計算組成時間(CTS)compositionEndTime:具有本軌跡之媒體中之最大計算組成時間(CTS)的樣本之組成時間加組成持續時間
軌跡擴延性質框可定義如下:框型別:「trep」容器:電影擴延框(「mvex」) 強制:無數量:零或以上(每一軌跡為零或為一)
此一框可用來記錄或摘述在隨後電影片段中的軌跡特性。可含有任何數目的子框。
軌跡擴延性質框之語法可定義如下:
track_id指示軌跡擴延性質提供於此框的軌跡。另一個起始序列含有在始於sync樣本的某個週期內部之一軌跡之樣本子集。藉解碼此一樣本子集,樣本的渲染可比全部樣本皆經解碼的情況更早開始。
「alst」樣本群組描述分錄指示於個別交替起始序列中之任一者的樣本數目,隨後全部樣本皆應經處理。
樣本至群組框的版本0或版本0可用於交替起始序列樣本分組。若使用樣本至群組框的版本1,則grouping_type_parameter不具有經定義的語意,但推衍交替起始序列的相同演算法可與grouping_type_parameter的一個特定值一致地使用。
利用交替起始序列的播放器可操作如下。首先,藉使用同步樣本框而識別由其開始解碼的同步樣本。然後,若該同步樣本係與型別「alst」的一樣本群組描述分錄相聯結,於該處roll_count係大於0,則播放器可起用該交替起始序列。然後播放器只解碼對映至該交替起始序列的該等樣 本,直到已經解碼的樣本數目係等於roll_count為止。隨後,全部樣本可經解碼。
交替起始序列之語法可為如下:
roll_count指示於交替起始序列中的樣本數目。若roll_count等於0,則相聯結的樣本不屬任何roll_count,及first_output_sample的語意係未經載明。每一個交替起始序列對映至此一樣本群組的樣本數目係等於roll_count。
first_output_sample指示在交替起始序列的樣本中意圖用於輸出的第一樣本的指數。開始交替起始序列的同步樣本的指數為1,以解碼順序,於交替起始序列中每個樣本的指數遞增1。
sample_offset[i]指示相對於推衍自解碼時間至樣本框或軌跡片段標頭框的該樣本之常規解碼時間,交替起始序列中的第i個樣本的解碼時間△。開始交替起始序列的同步樣本為其第一個樣本。
num_output_samples[j]及num_total_samples[j]指示於交替起始序列內部的樣本輸出率。交替起始序列係劃分為k個連續塊,於該處各塊具有常數樣本輸出率,係不等於相鄰塊的樣本輸出率。第一塊係始於藉first_output_sample指示的該樣本。num_output_samples[j]指示交替起始序列的第j塊輸出樣本號碼。num_total_samples[j]指示得自第j塊中的第一樣本的樣本總數,包括不在交替起始序列中者,該第j塊中的第一樣本係輸出給結束交替起始序列之樣本與恰在該第(j+1)塊中的第一輸出樣本前方的樣本中之較先者(就組成順序而言)。
同步樣本之另外或除外,載明於ISO基本媒體檔案格式草稿修訂3(版本3)標記以「rap」樣本分組的樣本可使用如上。
階層式時間可擴充性(例如於AVC及SVC)可改進壓縮效率,但可能增加解碼延遲,原因在於解碼圖像之從(解)碼順序至輸出順序的重新排序。若干研究中已經驗證就壓縮效率而言,深度時間階層關係為有用。當時間階層為深度且解碼器之操作速度受限(限於不比實時處理更快)時,則從解碼起點至渲染起點的初始延遲可能相當大,而可能對終端用戶的使用經驗造成負面影響。
交替起始序列性質框可定義如下:框型別:「assp」容器:軌跡擴延性質框(「trep」)強制:無 數量:零或一
本框指示於含有軌跡擴延性質框中指示的該軌跡的隨後軌跡片段中之交替起始序列樣本群組的性質。
若樣本至群組框版本0係用於交替起始序列樣本分組,則可使用交替起始序列性質框版本0。若樣本至群組框版本1係用於交替起始序列樣本分組,則可使用交替起始序列性質框版本1。
交替起始序列性質框之語法可定義如下:
min_initial_alt_startup_offset:交替起始序列樣本分組的參考樣本群組描述分錄之sample_offset[1]並無任何值係小於min_initial_alt_startup_offset。於此框的版本0中,係參考使用樣本至群組框版本0的交替起始序列樣本分組。於此框的版本1中,係參考使用樣本至群組框版本1的交替起始序列樣本分組,更進一步受grouping_type_parameter所限。
num_entries指示本框中記載的交替起始序列樣本分組號碼。
grouping_type_parameter指示適用此一回路分錄的交替樣本分組中之哪一者。
於第16圖中顯示含括於超文字傳輸協定(HTTP)串流化系統中的若干功能區塊、格式、及介面之具體實施例。檔案封裝器100取媒體表示內容之媒體位元串流作為輸入。該等位元串流已經封裝於一或多個容器檔案102。位元串流當藉一或多個媒體編碼器形成時可由檔案封裝器100接收。檔案封裝器將媒體位元串流轉成一或多個檔案104,該等檔案可藉串流化伺服器110諸如HTTP串流化伺服器處理。檔案封裝器之輸出106係依據伺服器檔案格式而予格式化。HTTP串流化伺服器110可接收來自串流化客戶機120諸如HTTP串流化客戶機的要求。該等要求可含括於依據超文字傳輸協定的訊息內,諸如GET要求訊息。該項要求可包括指示所要求的媒體串流之一位址。該位址可以是所謂的統一資源定位符(URL)。HTTP串流化伺服器110可藉傳輸所要求的媒體檔案及其它資訊,諸如母資料檔案給HTTP串流化客戶機120而回應於該項要求。然後HTTP串流化客戶機120將該(等)媒體檔案轉換成適合藉HTTP串流化客戶機及/或藉媒體播放器130回放的檔案格式。轉換的媒體資料檔案也可儲存於記憶體140及/或另一種儲存媒體內。HTTP串流化客戶機及/或媒體播放器可含括或工作式連結至一或多個媒體解碼器,可將含在HTTP回應的位元串流解碼成可被渲染的格式。
伺服器檔案格式
伺服器檔案格式係用於HTTP串流化伺服器110管理且使用來產生對HTTP之回應的檔案。例如可有以下三種辦法來將媒體資料儲存入檔案。
於第一辦法中,針對全部版本產生單一母資料檔案。內容(媒體資料)的全部版本(例如針對不同位元率)的母資料係駐在同一個檔案。媒體資料可分割成多個片段,涵蓋表示型態的某些回放範圍。媒體資料可駐在同一個檔案,或可位在由該母資料所指稱的一或多個外部檔案。
於第二辦法中,針對各個版本產生一個母資料檔案。單一內容版本的母資料係駐在相同檔案。媒體資料可分割成多個片段,涵蓋表示型態的某些回放範圍。媒體資料可駐在同一個檔案,或可位在由該母資料所指稱的一或多個外部檔案。
於第三辦法中,針對各個片段產生一個檔案。各片段的母資料及個別媒體資料涵蓋一表示型態的某個回放範圍,及內容的各個版本係駐在其本身的檔案內。此種內容的厚積化(chunking)成小型檔案的一個大集合,可用於靜態HTTP串流化的可能實現。舉例言之,將持續時間20分鐘且具有10個可能表示型態(5不同視訊位元率及2不同音訊語言)的一內容檔案厚積化成1秒的小型內容塊,將獲得12000個小檔案。須處理如此大量的小型檔案,造成網路伺服器的負擔。
第一及第二辦法亦即針對全部版本的單一母資料檔案及針對各個版本的一個母資料檔案係使用ISO基本媒體檔 案格式結構例示說明於第17圖。於第17圖之實例中,母資料係與媒體資料分開儲存,媒體資料係儲存在外部檔案。母資料係被劃分成片段707a、714a;707b、714b涵蓋某個回放期間。若檔案含有彼此交錯的軌跡707a、707b,諸如以不同位元率編碼的相同內容,第17圖例示說明針對全部版本的單一母資料情況;否則例示說明針對各個版本的一個母資料。
HTTP串流化伺服器
HTTP串流化伺服器110取一媒體表示內容的一或多個檔案作為輸入。輸入檔案係依據伺服器檔案格式而格式化。HTTP串流化伺服器110藉封裝媒體於HTTP回應而回應114於來自HTTP串流化客戶機120的HTTP要求112。HTTP串流化伺服器輸出且傳輸依據傳送檔案格式而格式化的且封裝於HTTP回應的媒體表示內容之一個檔案或許多檔案。
於若干實施例中,HTTP串流化伺服器110可粗略地歸成三個類別。第一類為於「靜態」模式的網路伺服器,又稱HTTP伺服器。於此模式中,HTTP串流化客戶機120可要求媒體表示內容的一或多個檔案全部地或部分地傳輸,該等檔案可依據伺服器檔案格式而格式化。不要求伺服器藉任何手段準備該內容。取而代之,內容表示型態係事前,可能離線,藉一個分開實體完成。
第18圖例示說明網路伺服器作為HTTP串流化伺服器的實例。內容提供者300可提供內容準備310的內容及內容的公告給服務/內容公告服務320。用戶裝置330可含有HTTP 串流化客戶機120,可從服務/內容公告服務320接收有關公告的資訊,其中用戶裝置330的用戶可選擇一內容來接收。服務/內容公告服務320可提供網路介面,結果,用戶裝置330可透過用戶裝置330中的網路瀏覽器而選擇一內容來接收。另外或此外,服務/內容公告服務320可使用其它裝置及協定,諸如服務廣播協定(SAP)、真正簡單整合(RSS)協定、或廣播電視系統的電子服務指南(ESG)機制。用戶裝置330可含有服務/內容探索元件332來接收有關服務/內容之資訊,且例如提供資訊給用戶裝置的顯示器。然後,串流化客戶機120與網路伺服器340通訊來通知網路伺服器340用戶已經選擇供下載的內容。然後網路伺服器340從內容準備服務310提取該內容,且提供該內容給HTTP串流化客戶機120。
第二類別為工作式連結動態串流化伺服器的(常規)網路伺服器,如第19圖之例示說明。動態串流化伺服器410基於來自客戶機420的要求,動態地裁剪給客戶機420的串流化內容。HTTP串流化伺服器430解譯來自客戶機420的HTTP GET要求,及識別得自一給定內容的所要求的媒體樣本。然後HTTP串流化伺服器430定位所要求的媒體樣本於內容檔案或來自直播串流。然後擷取且封裝所要求的媒體樣本於容器440。隨後,剛形成的有媒體樣本之容易傳遞給在HTTP GET回應體的客戶機。
第18及19圖的第一介面「1」係基於HTTP協定,且定義HTTP串流化要求與回應的語法及語意。HTTP串流化要 求/回應可基於HTTP GET要求/回應。
第19圖的第二介面「2」允許存取內容傳遞描述。內容傳遞描述又稱媒體表示內容描述,可由內容提供者450或服務提供者提供。給予有關存取相關內容的手段。更明確言之,描述內容是否透過HTTP串流化存取以及如何執行存取。內容傳遞描述通常係透過HTTP GET要求/回應取回,但也可藉其它手段傳遞,諸如藉由使用SAP、RSS、或ESG。
第19圖中第三介面「3」表示共用閘道器介面(CGI),此乃在網路伺服器與動態內容產生伺服器間標準化的且廣泛部署的介面。其它介面諸如代表狀態轉移(REST)介面係為可能,且將組成更加快取友善的資源定位器。
共用閘道器介面(CGI)定義網路伺服器軟體如何可將網頁的生成委派給控制台應用程式。此種應用程式稱作為CGI腳本;可以任一種程式語言寫成,但常見使用腳本語言。網路伺服器的一項工作係回應於由客戶機,通常為網路瀏覽器所簽發的對網頁的要求,該回應方式係藉分析要求的內容,決定回應於此欲發送的適當文件,及提供該文件給客戶機。若該要求識別碟片上之一檔案,則伺服器可回送該檔案內容。另外,文件內容可於行進間組構而成。達成此項目的一個方式係讓控制台應用程式計算該文件的內容,且通知網路伺服器使用該控制台應用程式。CGI載明在網路伺服器與此種控制台應用程式將通訊哪個資訊,及如何通訊。
代表狀態轉移乃一型用於分散式超媒體系統的軟體架 構,諸如全球資訊網(WWW)。REST型架構係由客戶機及伺服器組成。客戶機引發對伺服器的要求;伺服器處理要求且回送適當回應。要求及回應係環繞「資源」的「表示型態」的轉移建立。資源大致上可為任何可定址的任何同調且有意義的構思。資源之表示型態可為捕集資源的目前狀態或意圖狀態的文件。於任何特定時間,客戶機可在應用態或休眠態間變遷。於休眠態的客戶機可與其使用者互動,但不會產生任何負荷,且在伺服器組上或網路上不會消耗任何客戶機的容量。當客戶機準備過渡為新狀態時,客戶機開始發送要求。當一或多個要求為未完成時,客戶機被視為過渡態。各個應用程式狀態之表示型態含有鏈結,下次當客戶機選擇初始化新的狀態過渡時可使用該鏈結。
依據本歸類實例的HTTP串流化伺服器的第三類別為動態HTTP串流化伺服器。其它方面皆類似第二類別,但HTTP伺服器及動態串流化伺服器形成單一組件。此外,動態HTTP串流化伺服器可為狀態保持性。
伺服器終端解碼圖像可以兩個操作模式實現HTTP串流化:靜態HTTP串流化及動態HTTP串流化。於靜態HTTP串流化情況下,內容係事先準備或與伺服器獨立無關。媒體資料的結構不經伺服器修正來適合客戶機的需求。於「靜態」模式的常規網路伺服器只可在靜態HTTP串流化模式操作。於動態HTTP串流之情況下,當接收到非快取要求時,內容準備係在伺服器動態進行。常規網路伺服器係連結動 態串流化伺服器操作,及動態HTTP串流化伺服器可於動態HTTP串流化模式操作。
傳送檔案格式也可稱作傳遞格式、傳遞檔案格式、或節段格式。
於一具體實施例中,傳送檔案格式可粗分為兩類。於第一類中,傳輸檔案係遵照可用於檔案回放的既有檔案格式。舉例言之,傳輸檔案係遵照ISO基本媒體檔案格式或3GPP檔案格式之漸進下載輪廓。
於第二類中,傳輸檔案係類似係遵照可用於檔案回放的既有檔案格式而格式化的檔案。舉例言之,傳輸檔案可為伺服器檔案片段,可能非自容式用於個別地回放。於另一辦法中,欲傳輸的檔案係遵照可用於檔案回放的既有檔案格式,但檔案只部分傳輸,因而此等檔案的回放要求知曉部分檔案及管理部分檔案的能力。
傳輸的檔案通常係轉換成遵照用於檔案回放的既有檔案格式。
HTTP快取記憶體
HTTP快取記憶體150(第16圖)可為常規網路快取記憶體,其儲存HTTP要求,且回應該等要求來減少帶寬的使用、伺服器的負荷、及知覺的延遲。若HTTP快取記憶體含有一特定HTTP要求及其回應,則可服務要求方,而非HTTP串流化伺服器。
HTTP串流化客戶機
HTTP串流化客戶機120接收媒體表示內容之檔案。 HTTP串流化客戶機120可含有或可操作式連結至一媒體播放器130,媒體播放器130剖析檔案,解碼所含括的媒體串流,及渲染已解碼的媒體串流。媒體播放器130也可儲存所接收的檔案供未來使用。互換檔案格式可用於儲存。
於若干具體實施例中,HTTP串流化客戶機可粗略歸類為至少下述兩類。於第一類中,習知漸進下載客戶機針對正在接收的數位媒體檔案猜測或歸結適當緩衝時間,且在此緩衝時間之後開始媒體渲染。習知漸進下載客戶機不會產生媒體表示內容之位元率調整上相關的要求。
於第二類中,作用態的HTTP串流化客戶機監視於該HTTP串流化客戶機中的表示型態之緩衝狀態,且可產生與位元率調整有關的要求,來保證該表示型態的渲染而無中斷。
HTTP串流化客戶機120可將依據傳送檔案格式而格式化的接收HTTP回應酬載轉換成依據互換檔案格式而格式化的一或多個檔案。轉換可出現在接收HTTP回應時,亦即一旦已經接收,則HTTP回應係寫至媒體檔案。另外,當針對一串流化階段性作業的多個HTTP回應直至全部HTTP回應皆已經接收時出現轉換。
互換檔案格式
於若干具體實施例中,互換檔案格式可粗分為以下兩類。於第一類中,所接收的檔案係依據傳送檔案格式就此儲存。
於第二類中,所接收的檔案係依據用於檔案回放的既 有檔案格式儲存。
媒體檔案播放器
媒體檔案播放器130可剖析、解碼、及渲染儲存的檔案。媒體檔案播放器130可剖析、解碼、及渲染互換檔案中之一類或兩類。若媒體檔案播放器130可剖析與播放依據既有檔案格式儲存的檔案,但不能播放依據傳送檔案格式儲存的檔案,則稱作為舊式播放器。若媒體檔案播放器130可剖析與播放依據傳送檔案格式儲存的檔案,則稱作HTTP串流化知曉播放器。
於若干體現中,HTTP串流化客戶機只接收與儲存一或多個檔案但不播放之。相反地,當接收與儲存檔案時,媒體檔案播放器剖析、解碼、及渲染此等檔案。
於若干體現中,HTTP串流化客戶機120及媒體檔案播放器130係為或駐在不同裝置。於若干體現中,HTTP串流化客戶機120透過網路連結,諸如無線區域網路(WLAN)連結傳輸依據互換檔案格式而格式化的一媒體檔案給媒體檔案播放器130,媒體檔案播放器130播放該媒體檔案。媒體檔案可在將所接收的HTTP回應轉換成媒體檔案過程中產生時傳輸。另外,媒體檔案可在所接收的HTTP回應已經完成轉換成媒體檔案過程後傳輸。媒體檔案播放器130可在接收檔案時解碼且播放媒體檔案。舉例言之,媒體檔案播放器130可使用HTTP GET要求而從HTTP串流化客戶機漸進地下載檔案格式。另外,媒體檔案播放器130可在完成接收後解碼且播放媒體檔案。
HTTP管線化乃一項技術,其中多個HTTP要求係寫出至單一插槽而不等待相對應的回應。由於可將數個HTTP要求嵌入同一個傳輸封包內,諸如傳輸控制協定(TCP)封包,故HTTP管線化許可透過網路發送較少的傳輸封包,而可減輕網路負荷。
連結可藉伺服器IP位址、伺服器埠號碼、客戶機IP位址、及客戶機埠號碼等四重元組識別。從相同客戶機至相同伺服器的多重同時TCP連結為可能,原因在於各個客戶機處理被分派一個不同的埠號碼。如此,即便全部TCP連結存取相同伺服器處理(諸如於埠80的網路伺服器處理係專用於HTTP),但全部TCP連結皆具有不同客戶機插槽且表示獨特的連結。此乃使得從同一電腦可對相同網址做若干同時要求。
若干第三代及未來世代的無線技術係建立在演進GSM(全球行動通訊系統)核心網路上且支援無線存取技術。
動態適應性HTTP串流化標準(DASH)所界定的若干元件及構思描述如下。
一媒體表示內容為單一媒體內容例如影片或節目的編碼資料之結構化集合。資料係可存取至HTTP串流化客戶機來提供串流化服務給用戶。媒體表示內容係由一或多個接續非重疊週期之一序列組成;各個週期含有來自相同媒體內容的一或多個表示型態;各個表示型態係由一或多個節段組成;及節段含有媒體資料及/或母資料來解碼與表示所 含括的媒體內容。
週期邊界允許改變一媒體表示內容內部的顯著量之資訊,諸如伺服器位置、編碼參數、或可用內容變化。週期構思係介紹來剪接新內容,諸如廣告及邏輯內容分節。相對於媒體表示內容的起點,各個週期被分派一個起始時間。
各個週期本身可含有一或多個表示型態。一個表示型態為媒體內容其子集的替代選項中之一者,例如由編碼選擇,其差異在於例如位元率、解析度、語言、編解碼器等。
各個表示型態包括一或多個媒體成分,於該處各個媒體成分為一個個別媒體型別的編碼版本,諸如音訊、視訊、或定時文字(timed text)。各個表示型態係分派給一個適應性集合。於相同適應性集合中的表示型態彼此為替代之道,例如一客戶機可在同一個適應性集合內的多個表示型態間切換,例如基於表示型態之位元率、估計可用通過資料量、及客戶機的緩衝器占用情況而切換。
一個表示型態可含有一個初始化節段及一或多個媒體節段。橫過一個表示型態內部的接續媒體節段邊界,媒體成分為時間連續。節段表示可由http-URL所獨特地參照的一個單位(可能受位元組範圍所限)。藉此,初始化節段含有存取該表示型態之資訊,但無媒體資料。媒體節段含有媒體資料,且可符合進一步要求,可含有下列實例中之一或多者:-各個媒體節段在媒體表示內容中被分派一個起始時間,來使得於規則播出模式或於搜尋後下載適當節段。此 一時間通常不是準確的媒體回放時間,反而只是約略時間,讓客戶機可做適當決定何時下載該節段,來使得該節段可即時取得用於播出。
-媒體節段可提供隨機存取資訊,亦即隨機存取點的存在、所在、及時間性。
-一媒體節段當結合媒體表示內容描述(MPD)之資訊及結構考慮時,含有足夠資訊來時間上準確地呈示於該表示型態中的各個所含媒體成分,若該媒體節段含有一隨機存取點(RAP)時無需存取此一表示型態中的任何先前媒體節段。時間準確度允許無縫地切換表示型態,及聯合地呈示多個表示型態。
-媒體節段也可含有藉使用部分HTTP GET要求用以隨機存取該節段子集的資訊。
媒體表示內容係描述於媒體表示內容描述(MPD),在一媒體表示內容的有效期間,可更新該媒體表示內容描述。更明確言之,媒體表示內容描述說明可存取節段及其時間性。媒體表示內容描述可為明確格式化的可擴延標記語言(XML)文件。一媒體表示內容描述的XML基模及語意之不同版本已經載明於3GPP版本9適應性HTTP串流化規格(3GPP技術規格26.234版本9,條款12)、3GPP版本10及其後版本、透過HTTP之動態適應性串流化(DASH)規格(3GPP技術規格26.247)、及MPEG DASH規格。媒體表示內容描述可以特定方式更新,使得更新係符合任何過去媒體之媒體表示內容描述(MPD)的先前例。XML基模之圖形表示內容之 實例係提供於第6圖。資料模型至XML基模的對映係經強調。個別屬性及元件之細節於各個實施例中各異。
適應性HTTP串流化支援直播串流化服務。於此種情況下,節段的產生可在行進間發生。因此理由故,客戶機可只存取節段之一子集,亦即針對此瞬時即時,目前媒體表示內容描述說明可存取節段之一時間窗。藉由提供媒體表示內容描述的更新,伺服器可描述新節段及/或新週期,使得更新後的媒體表示內容描述係與先前媒體表示內容描述為可相容。
因此,用於直播串流化服務,媒體表示內容可藉初媒體表示內容描述說明,且全部媒體表示內容描述皆更新。為了確保客戶機與伺服器間的同步,媒體表示內容描述以協調世界通用時間(UTC時間)提供存取資訊。只要伺服器與客戶機係同步化至UTC時間,藉於媒體表示內容描述情況下使用UTC時間,讓伺服器與客戶機間的同步化變可能。
當長時間在網路上可存取媒體節段時,支援時間偏移觀看及網路個人視訊記錄(PVR)功能。
在一節段起頭可得的節段索引框可輔助切換操作。節段索引框載明如下。
框型別:「sidx」容器:檔案強制:無數量:零或一
節段索引框(「sidx」)提供於一節段中電影片段及其它 節段索引框之一精簡索引。各個節段索引框記錄一子節段,係定義為一或多個接續電影片段,結束於容納節段之終點,或結束於另一個節段索引框記錄之一子節段的起點。
索引可直接檢索至電影片段,或指稱節段索引,該等索引直接地或間接地檢索至電影片段;藉將針對其它節段索引框的時間及位元組偏移值記錄在同一個節段或子節段內部,可以「階層」或「菊花鏈」或其它形式載明節段索引。
於節段索引框中有兩個回路結構。第一回路記錄子節段的第一樣本,亦即第二回路所述第一電影片段中的樣本。第二回路提供該子節段的索引。
於不含電影框(「moov」)但含有電影片段框(「moof」)的媒體節段中,若供給任何節段索引框,時一節段索引框須置於任何電影片段(「moof」)框之前,且藉該第一節段索引框記錄的子節段為整個節段。
一個軌跡選用作為一參考軌跡,該軌跡通常為其中並非每個樣本為一隨機存取點的軌跡,諸如視訊。供給在至少該參考軌跡之該子節段中的第一樣本之解碼時間。也供給在其它軌跡之第一樣本在該子節段中的解碼時間。
參考型別定義該參考為電影片段(「moof」)框或節段索引(「sidx」)框。偏移值以位元組表示,給定從包圍節段索引框之後的第一位元組,至參考框的第一位元組之距離,例如若參考框緊接在「sidx」之後,則此位元組偏移值為0。
針對該參考軌跡,於第二回路中第一參考框的解碼時間為於第一回路給定的decoding_time。於第二回路中隨後各分錄的解碼時間係藉將先前分錄的持續時間加至此decoding_time求出。軌跡片段之持續時間為其樣本之解碼持續時間之和(一樣本之解碼持續時間係明確地定義,藉軌跡回合(「trun」)框的sample_duration欄位繼承而定義);一子節段之持續時間係為該等軌跡片段之持續時間之和;一節段索引之持續時間為於其第二回路中之持續時間之和。因此於一節段中的第一節段索引框之持續時間為整個節段之持續時間。
若在其第二回路中之任何分錄含有一隨機存取點(RAP),則一節段索引框含有一隨機存取點。
在一電影框「moov」之後,藉第一節段索引框針對全部軌跡記錄的解碼時間須為0。
「sidx」框的容器為檔案或直接為節段。後文中,「sidx」框的容器實例係使用假代碼例示說明:
後文中,將簡短說明假代碼中使用的術語。
reference_track_ID提供參考軌跡的track_ID。
track_count:下一個回路中索引檢索的軌跡號碼;track_count係為1或以上;reference_count:藉第二回路中索引檢索的軌跡號碼;reference_count係為1或以上;track_ID:一軌跡的ID,針對該ID一個軌跡片段係含括於藉此索引識別的該第一電影片段內;於本回路中恰有一個track_ID係等於reference_track_ID;decoding_time:於該軌跡中由藉該的二回路中第一項所參照的該電影片段中之track_ID所識別的第一樣本之解碼時間,係以該軌跡的時間刻度表示(如記錄在該軌跡的媒體標頭框之時間刻度欄位中);reference_type:設定為0時指示該參考為電影片段 (「moof」)框;設定為1時指示該參考為節段索引(「sidx」)框;reference_offset:從該容納節段索引框的第一位元組至該參考框的第一位元組之距離,以位元組表示;subsegment_duration:當該參考為節段索引框時,此一欄位載有於該框的第二回路中之subsegment_duration之和;當該參考為電影片段時,此一欄位載有於參考軌跡中,於指示的電影片段及隨後各電影片段中,直到由該回路中的下個分錄所記錄的第一電影片段或該子節段之終點為止(視何者較早出現而定)中之樣本的樣本持續時間之和;該持續時間係以該軌跡的時間刻度表示,如記錄在該軌跡的媒體標頭框之時間刻度欄位中;contains_RAP:當係參考電影片段時,若在具有track_ID等於reference_track_ID的該軌跡的電影片段內部之軌跡片段含有至少一個隨機存取點,則此一位元可為1,否則此一位元係設定為0;當係參考節段索引時,則唯有在該節段索引中的任一個參考具有此一位元設定為1時,此一位元才設定為1,否則係設定為0;RAP_delta_time:若contains_RAP為1,則提供一隨機存取點(RAP)的呈示(組成)時間;若contains_RAP為0,則保留值0。於track_ID係等於reference_track_ID的該軌跡中,時間係表示為藉此分錄記錄的子節段之第一樣本的解碼時間與該隨機存取點的呈示(組成)時間間之差。
串流存取點(SAP)為在一表示型態中的位置,該位置係 經識別為只使用含在表示型態資料的資訊而開始媒體串流之回放之一位置,從該位置繼續前進,前方先行以在初始化節段(若有)的資料初始化。
各個SAP具有定義如下之六個性質亦即ISAP、TSAP、ISAPAU、TDEC、TEPT、及TPTF:
1. TSAP為媒體串流的任何存取點的最早表示內容時間,使得使用始於ISAP且無任何資料在ISAP前方之表示型態中的資料,具有表示內容時間大於或等於TSAP的媒體串流之全部存取時間可被正確地解碼。
2. ISAP為該表示型態中的最大位置,使得使用始於ISAP且無任何資料在ISAP前方之表示型態資料,具有表示內容時間大於或等於TSAP的媒體串流之全部存取時間可被正確地解碼。
3. ISAPAU為以解碼順序表示,在媒體串流的表示型態中,最後存取單位的起始位置,使得使用該最後存取單位及在解碼順序中隨後的存取單位且在解碼順序中並無較早的存取單位,具有表示內容時間大於或等於TSAP的媒體串流之全部存取時間可被正確地解碼。
4. TDEC為使用始於ISAPAU之存取單位及在解碼順序中隨後的存取單位且在解碼順序中並無較早的存取單位,可被正確地解碼之該媒體串流的任何存取單位之最早表示內容時間。
5. TEPT為在表示型態中始於ISAPAU之該媒體串流的任何存取單位之最早表示內容時間。
6. TPTF為在始於ISAPAU之該表示型態中,以解碼順序該媒體串流的第一存取單位之表示內容時間。
定義SAP之下列型別:˙型別1:TEPT=TDEC=TSAP=TPTF˙型別2:TEPT=TDEC=TSAP<TPTF˙型別3:TEPT<TDEC=TSAPTPTF˙型別4:TEPT<TDEC=TSAP及TPTF<TSAP˙型別5:TEPT=TDEC<TSAP˙型別6:TEPT<TDEC<TSAP
型別1係相對應於若干編碼方案中稱作為「封閉式GOP隨機存取點」(其中以解碼順序,始於ISAPAU的全部存取單位可被正確地解碼,結果導致沒有間隙的經正確解碼之存取單位之一連續時間序列),此外,於解碼順序中的存取單位也是呈示順序中的第一存取單位。
型別2係相對應於若干編碼方案中稱作為「封閉式GOP隨機存取點」,以解碼順序,於媒體串流中始於ISAPAU的第一存取單位並非呈示順序中的第一存取單位。
型別3係相對應於若干編碼方案中稱作為「開放式GOP隨機存取點」,其中以解碼順序,在ISAPAU之後的某些存取單位無法被正確地解碼,且具有小於TSAP的表示內容時間。
型別4係相對應於若干編碼方案中稱作為「漸進解碼再新(GDR)隨機存取點」,其中以解碼順序,在ISAPAU之後的某些存取單位無法被正確地解碼,且具有小於TSAP的表示 內容時間。
於動態適應性HTTP串流化中,於一小節段內部的第一SAP可以節段索引框指示。
於DASH對話中具有不同解碼圖像緩衝要求的表示型態間之串流切換已經討論於MPEG文件M20400。DASH規格假設該等表示型態共享一共用時間表。但若相同適應性集合的表示型態具有不同的解碼圖像緩衝要求,則源自於相同未經壓縮圖像的個別圖像之組成時間在各個表示型態間相異。三個可能的解碼圖像係摘述於MPEG文件M20400來針對全部表示型態指示一共用時間表。第一,全部表示型態可以相同第一圖框組成偏移值或組成時間封裝。但編碼/封裝工具通常並非如此,反而係最小化第一圖框組成偏移值。如此也暗示全部表示型態的第一圖框組成偏移值係受具有最大圖框重新排序的表示型態所左右。第二,可能使用有符號的組成偏移值,故針對全部表示型態的第一圖框組成偏移值為零。就解碼時間與組成時間間之差實際上係受具有最大圖框重新排序的表示型態所左右而言,如此大致上與第一選項相同。但今日存在有且使用許多裝置及工具,其並不支援有符號的組成偏移值。第三,可能使用具有空白編輯的編輯列表,使得第一圖框具有與其它表示型態校準的表示內容時間。就解碼起點與回放起點間之延遲係受具有最大圖框重新排序的表示型態所左右而言,此一選項係類似先前選項。
後文中,將以進一步細節描述從一個串流切換至另一 串流的額外實例。於接收器驅動串流切換或位元率調整中,其係例如用於適應性HTTP串流化,諸如DASH,例如基於下述基礎,客戶機可決定從具有某個特性之一個串流切換至具有至少部分不同特性的另一串流之需要。
客戶機例如可藉監視要求的節段被接收時之位元率而估計通道或網路連結的通過資料量。客戶機也可使用其它手段用於通過資料量的估計。舉例言之,客戶機可具有該無線電存取鏈路之盛行的平均位元率及最大位元率之資訊,如由無線電存取連結之服務參數的品質決定。客戶機可基於含括於媒體表示內容描述(MPD)的表示型態之估計通過資料量及位元率資訊而決定欲接收的表示型態。當決定欲接收的適當表示型態時,該客戶機也可使用表示型態的其它MPD屬性。舉例言之,指示保留用於該表示型態之解碼的計算資源及記憶體資源應是客戶機可處置的資源。此種計算資源及記憶體資源可藉一位準指示,該位準為由該標準(例如H.264/AVC標準之附錄A)的語法元素及變因所取數值之經界定的限制集合。
此外或另外,例如就回放持續時間而言,客戶機可決定目標緩衝器占用程度。該目標緩衝器占用程度例如可基於預期小區式無線網路移交最大持續時間而設定。該客戶機可比較目前緩衝器占用程度與目標程度,且若目前緩衝器占用程度顯著偏離目標程度,則決定表示型態切換的需要。若該緩衝器占用程度係低於目標緩衝器占用程度減某個臨界值,則客戶機可決定切換成較低位元率表示型態。 若該緩衝器占用程度係超過目標緩衝器占用程度加另一個臨界值,則客戶機可決定切換成較高位元率表示型態。
於伺服器驅動串流切換或位元率調整中,基於與前文解說的客戶機驅動串流切換之相同基準,伺服器可決定從具有某些特性的一個串流切換至具有至少部分不同特性的另一串流的需要。為了輔助伺服器,客戶機可例如基於所接收的位元率或封包率,或基於客戶機的緩衝器占用狀態而提供指示給伺服器。RTCP可用於此種回授或指示。舉例言之,具有接收器緩衝器狀態指示的RTCP擴延報告,又稱具有客戶機緩衝器回授的RTCP APP封包(NADU APP封包)已經載明於3GPP封包切換串流化服務中。
切換自串流及切換至串流可為相同視訊內容例如相同節目的不同表示型態,或可屬於不同視訊內容。切換自串流及切換至串流具有不同的串流傳輸性質,諸如位元率、初始緩衝要求、解碼率等。
依據本發明之實施例,當開始從一個串流切換至另一串流時,可刪除所擇定的子序列之解碼或傳輸。結果,針對切換至串流的不中斷解碼與回放所要求的初始緩衝,可經修改來適合切換自串流的緩衝狀態,因而不會出現由於切換所造成的暫停回放。
本發明之實施例可應用於播放器,於該處存取至切換至串流起點係比位元串流的導致以正常速率回放的自然解碼速率更快速。此種播放器之實例為來自適應性HTTP串流化之大容量記憶體及客戶機的串流回放。播放器選擇該位 元串流的哪些子序列係不被解碼。
本發明之實施例也可藉用於單播傳輸的伺服器或發送器施用。當伺服器已經決定或接收器已經要求從一個串流切換至另一個串流時,發送器選擇該位元串流的哪些子序列被傳輸至接收器。
本發明之實施例也可藉產生指令用以從一個串流切換至另一個串流的檔案產生器施用。當於適應性HTTP串流化切換表示型態時,或當封裝位元串流用於單播輸送時,該等指令可於本地回放施用。
現在參考第8圖,例示說明本發明之實施例的具體體現。第8圖例示說明之方法800例如可於內容提供者(第19圖之方塊300),於動態串流化伺服器(第19圖之方塊410),於檔案產生器,或於編碼器(第15圖之方塊510)執行。第8圖例示說明之方法可能導致在一或多個容器檔案內部的各項指示,諸如交替起始序列樣本群組(包括針對交替起始序列樣本群組的樣本群組描述框及樣本至群組框二者)。
於第8圖之方塊810,在處理單元必須存取的該等存取單位中,識別第一可解碼存取單位。可解碼存取單位例如可以下列方式中之一或多者定義:-IDR存取單位;-具有IDR依賴性表示型態之SVC存取單位,該dependency_id係小於該存取單位的最大dependency_id;-含有錨定圖像的MVC存取單位;-含括一復原點SEI訊息的存取單位,亦即始於開放式 GOP(當recovery_frame_cnt係等於0時)或漸進解碼再新週期(當recovery_frame_cnt係大於0時)之一存取單位;-含有冗餘IDR圖像的存取單位;-含有與復原點SEI訊息相聯結的冗餘編碼圖像的存取單位。
就最廣義言之,可解碼存取單位可為任一種存取單位。然後於解碼過程中遺失的預測參考係被忽略或例如藉內設值置換。
該第一可解碼存取單位經識別的存取單位係取決於體現本發明之功能方塊。若本發明係施用至從一大容量記憶體存取一位元串流的播放器、用於適應性HTTP串流化的客戶機、或發送器,則該第一可解碼存取單位可為始於期望的切換位置之任何存取單位,或可為在期望的切換位置前方或在該位置的該第一可解碼存取單位。
第一可解碼存取單位可藉多個手段識別,該等手段包括下列:
-視訊位元串流中指示,諸如nal_unit_type等於5,idr_flag等於1,或復原點SEI訊息存在於該位元串流。
-藉傳送協定指示,諸如SVC RTP酬載格式之PACSI NAL單位之A位元。A位元指示是否可進行在非IDR層表示型態(具有nal_unit_type不等於5及idr_flag不等於1的一層表示型態)的CGS或空間層切換。具有若干圖像編碼結構,非IDR層內表示型態可用於隨機存取。比較只使用IDR層表示型態,可達成更高編碼效率。H.264/AVC或SVC解決方案指 示非IDR層內表示型態的隨機存取性係使用一復原點SEI訊息。A位元提供對此資訊的直接存取,而無需剖析復原點SEI訊息,該訊息可深埋在SEI NAL單位。又復,SEI訊息可不存在於該位元串流。
-於容器檔案指示。舉例言之,同步樣本框、陰影同步樣本框、隨機存取復原點樣本群組、軌跡片段隨機存取框可用在與ISO基本媒體檔案格式可相容的檔案或節段。
-用在適應性HTTP串流化及可能其它傳輸機制的針對媒體節段之節段索引框。
-於封包化元素串流中指示。
再度參考第8圖,於方塊820,處理該切換至串流的該第一可解碼存取單位。處理方法取決於體現第8圖之方法實例的功能方塊。若該方法係在播放器體現,則處理可包含解碼。若該方法係在發送器體現,則處理可包含封裝該存取單位成為一或多個傳送封包,及傳輸該存取單位,以及(可能係假設)接收及解碼用於該存取單位之傳送封包。若該方法係在檔案產生器體現,則處理可包含寫(例如寫成檔案)指令,其子序列須於加速切換程序中解碼或傳輸。
於若干實施例中,方塊820之執行時間係取決於切換自串流的處理。舉例言之,當切換自串流的全部存取單位已經解碼時,直至切換至串流始於第一可解碼存取單位的最早表示內容時間,可執行方塊820。
於方塊830,初始化且開始輸出時鐘。於若干實施例 中,方塊830的執行時間係取決於切換自串流的處理。舉例言之,當切換自串流的全部存取單位已經呈示時,直至切換至串流始於第一可解碼存取單位的最早表示內容時間,可初始化輸出時鐘。於若干實施例中,切換自串流及切換至串流共享相同輸出或表示內容時間表。如此,切換至串流的輸出時鐘係經初始化至切換自串流的輸出時鐘的呈示值。
與輸出時鐘起始同時的額外操作可取決於體現處理的功能方塊。若處理係在播放器內體現,則從第一可解碼存取單位解碼所得的解碼圖像可與輸出時鐘起始同時顯示。若處理係在發送器內體現,則由第一可解碼存取單位第一可解碼存取單位解碼所得(假設)解碼圖像可與輸出時鐘起始同時(假設)顯示。若處理係在檔案產生器內體現,則輸出時鐘可能不會實時呈現掛壁時鐘的滴嗒,反而可與存取單位的解碼時間或組成時間同步化。
於多個實施例中,方塊820及830的操作順序可以顛倒。
於方塊840,作決定決定於解碼順序中的下個存取單位是否可在輸出時鐘到達下個存取單位的輸出時間之前處理。於若干實施例中,於方塊840交替起始序列或其它指示用於該項決定。舉例言之,接受處理的存取單位之交替起始序列之決定,可基於緩衝器占用、解碼起始時間、及輸出時鐘而針對切換至序列中的第一可解碼存取單位決定。
於方塊840處理方法係取決於體現處理的功能方塊。若處理係在播放器中體現,則處理可包含解碼。若處理係在 發送器中體現,則處理可包含將該存取單位封裝入一或多個傳送封包,且傳輸該存取單位,以及(可能假設地)接收及解碼針對該存取單位的傳送封包。若處理係在檔案產生器中體現,則取決於是否針對播放器或發送器分別地產生指令,處理可如上對播放器或發送器定義。
注意若處理係在發送器或在產生位元串流傳輸之指令的檔案產生器內體現,則解碼順序可由傳輸順序置換,傳輸順序無需與解碼順序相同。
於另一個實施例中,當處理係在發送器或在產生位元傳輸之指令的檔案產生器內體現,則輸出時鐘及處理可差異地解譯。於此一實施例中,輸出時鐘係視為傳輸時鐘。於方塊840,決定存取單位的排程解碼時間是否出現在存取單位的輸出時間(亦即傳輸時間)之前。潛在原理為存取單位可在其解碼時間之前傳輸或指示欲傳輸(例如在一檔案內)。項目處理包含將該存取單位封裝為一或多個傳送封包,及傳輸該存取單位,於檔案產生器之情況下,傳輸該存取單位為當遵照檔案中給定的指令時發送器將進行的假說操作。
若於方塊840決定於解碼順序中下個存取單位係在輸出時鐘到達與下個存取單位相聯結的的轉出時間之前處理時,則處理前進至方塊850。於方塊850,下個存取單位係經處理。處理係以方塊820之相同方式定義。於方塊850處理後,指向於解碼順序中下個存取單位的指標器遞增一個存取單位,及處理程序返回方塊840。
另一方面,若於方塊840做出決定於解碼順序中的下個存取單位無法在輸出時鐘到達與下個存取單位相聯結的輸出時間之前處理,則處理前進至方塊860。於方塊860,刪除於解碼順序中的下個存取單位之處理。此外,刪除取決於解碼中下個存取單位的該等存取單位的處理。換言之,其根係在解碼順序中的下個存取單位之該子序列係未經處理。然後,於解碼順序中的下個存取單位之指標器係遞增一個存取單位(假定被刪除的存取單位已經不再存在於解碼順序中),及程序返回方塊840。
若位元串流中已經不再有存取單位,則於方塊840停止處理程序。
於另一體現中,在輸出時鐘開始前處理多於一個圖框。輸出時鐘可不始於第一可解碼存取單位的輸出時間,反而可選擇較後方的存取單位。相對應地,當該輸出時鐘開始時同時傳輸或播放所選較後方圖框。
於一個實施例中,即便在輸出時間之前一個存取單位可經處理,但該存取單位可不被選用於處理。當在同一個時間層級的多個接續子序列之解碼被刪除時特別屬於此種情況。
第8圖例示說明之方法可用來產生各個指示,諸如在一或多個容器檔案內部的交替起始序列樣本群組(包括針對該等交替起始序列樣本群組之樣本群組描述框及樣本至群組框二者)。此種指示可藉選擇方塊820的執行時間(亦即初始編碼圖像緩衝延遲)或針對於方塊830何時開始輸出時鐘 的某個時間而產生。舉例言之,若已知第一串流要求M個圖像間隔的初始解碼緩衝延遲,且已知第二串流要求N個圖像間隔的初始解碼緩衝延遲,於該處M<N,則第8圖之處理可針對第二串流之隨機存取點進行,使得輸出時鐘係始於第一可解碼存取單位解碼後的M個圖像間隔。藉此方式產生的交替起始序列獎許可從第一串流切換至第二串流,使得該等串流要求等量初始解碼圖像緩衝,因而不會出現因切換造成的回放中斷。
指示可用以輔助第8圖例示說明之處理。該等指示可含括於位元串流例如作為SEI訊息,含括於封包酬載結構,含括於封包化元素串流結構,及含括於檔案格式,或藉其它手段指示。本章節討論的指示例如可藉編碼器、藉位元串流分析單元、或藉檔案產生器而產生。
為了輔助解碼器、接收器或播放器選擇哪些子序列係從解碼中刪除,可提供該位元串流之時間擴充性結構的指示。一個實例為一旗標,指示是否使用如第2a圖例示說明的常規「分叉」巢套結構,及存在有多少個時間層級(或何者為GOP大小)。指示之另一個實例為temporal_id值之一序列,各自指示於解碼順序中存取單位的temporal_id。任何圖像的temporal_id可藉重複temporal_id值的指示序列亦即,指示temporal_id值的重複表現的temporal_id值序列歸結。依據本發明之解碼器、接收器、或播放器基於該項指示而擇定所刪除的及解碼的子序列。
可指示用以輸出的預期第一解碼圖像。此項指示輔助 解碼器、接收器、或播放器如發送器或檔案產生器所預期者般執行。舉例言之,可指示具有frame_num等於2的解碼圖像為於第11c-11d圖之實例中意圖用於輸出的第一者。否則解碼器、接收器、或播放器可首先輸出具有frame_num等於0的解碼圖像,輸出程序不如發送器或檔案產生器所預期者,起始延遲的節省並非最佳。
可指示用以開始從相聯結的第一可解碼存取單位(而非更早的,例如從該位元串流的起點)解碼的HRD參數。此等HRD參數指示當解碼始於相聯結的第一可解碼存取單位時可施用的初始CPB及DPB延遲。
若干本發明之實施例係藉由檢測針對切換至串流的初始緩衝要求係比在切換點的切換自串流之緩衝延遲更長而可增強於適應性串流化的串流切換,依據交替起始序列的處理/解碼切換至串流,其刪除一或多個圖像的解碼,且可減少切換至串流要求的初始緩衝需求。
因此,可達成無縫串流切換,在音訊回放中無干擾或中斷,而在視訊回放中幾乎無可察覺的抖動,此點係與針對全部串流有顯著音訊中斷/干擾或起始延遲增加的辦法相反。
客戶機操作中可有變化。客戶機例如可為DASH客戶機。DASH客戶機可如下操作。最初,可從一適應性集合的各個表示型態i的初始化節段提取-空白編輯之持續時間,ai,-軌跡(於第一電影片段中)之第一媒體樣本的組成 StartTime,bi,-組成ToDTSShift,ci,及-min_initial_alt_startup_offset之最大值,di
於始於解碼時間0的解碼時間及組成時間之一共用時間表上,DASH客戶機可針對各個表示型態i推衍出一標準化組成起始時間ei及替代組成起始時間fi,如下述:ei=bi+ci及fi=bi+ci-di。替代組成起始時間表示當組成時間偏移值為非負時,於輸出順序中該軌跡之第一樣本的最小組成時間。設e為ei的最大值。於適應性集合中各個表示型態i的空白編輯之持續時間ai通常係等於e-ei。設f為fi的最大值。於適應性集合中各個表示型態i的另一種空白編輯之持續時間gi通常係等於f-fi
在串流化對話的起點,DASH客戶機可選擇來從適應性集合的表示型態j要求節段。典型地進行選擇使得表示型態之平均位元率或頻寬係符合且不超過儘可能接近頻道的預期通過資料量。若gj係小於aj,則額外層可選擇來當有需要時施加另一個起始序列,因此客戶機偏移軌跡之組成時間達gj而非aj,起始進階時間變數h被初始化至aj-gj。否則,客戶機如由軌跡的編輯列表框控管,且偏移軌跡的組成時間達aj,及h被初始化至0。
於串流化對話期間,若DASH客戶機選擇從切換自表示型態j切換表示型態成為切換至表示型態k,且起始進階時間變數h係大於0,則客戶機可操作如下。客戶機可從針對其sample_offset[1]係大於或等於h的表示型態k選擇另一個 起始序列,及然後解碼與渲染另一個起始序列。起始進階時間變數h係藉從其中扣除所選另一個起始序列的sample_offset[1]而更新之。
於串流化對話期間,若DASH客戶機選擇從切換自表示型態j切換表示型態成為切換至表示型態k,且起始進階時間變數h係等於(或小於)0,則客戶機如以習知方式解碼且渲染切換至表示型態,亦即如藉用於存取表示型態k的SAP之型別所控管而解碼且渲染樣本。
DASH客戶機之潛在操作實例係以第9及10圖提供。於所呈示的實例中,兩個表示型態係以H.264/AVC編碼:表示型態1使用所謂的IBBP間預測階層,而表示型態2使用巢套式階層時間性可擴充性三個時間層級的階層關係。兩個表示型態中介於兩個接續IDR圖像間有10個非IDR圖像。第9a圖例示說明於拍攝順序中該等表示型態之編碼圖樣。
第9圖使用之註釋解說如下。含括在框內的值指示該圖像之frame_num值。斜體字數值指示非參考圖像,而其它圖像為參考圖像。下方畫線之數值指示IDR圖像,而其它圖像為非IDR圖像。為了保持第9圖的簡明,並無任何箭頭指示含括間預測。於時間層級1及以上的圖像係從在更低時間層級的先行圖像及從在更低時間層級的隨後圖像(若該圖像為非IDR圖像)雙預測。
表示型態中的編碼圖像之解碼順序係例示說明於第9b圖。第9c圖顯示當假設輸出時間表重合解碼時間表,且一個圖像之解碼持續一個圖像間隔時,於輸出順序中的表示 型態之圖像序列。由於不同的間預測階層關係,可知表示型態的初始解碼圖像緩衝延遲係比表示型態1更長一個圖像間隔。若空白編輯係用來對準表示型態的第一圖框之呈示起始時間,則具有一個圖像間隔的持續時間之空白編輯係插入表示型態1。
於第9及10圖給定之實例中-以圖像間隔為單位,空白時間a1及a2分別為1及0,-以圖像間隔為單位,軌跡之第一媒體樣本(於該第一電影片段中)的compositionStartTime,b1及b2分別為1及2,-compositionToDTSShift,c1=c2=0,及-以圖像間隔為單位,min_initial_alt_startup_offset,d1及d2分別為0及1。(針對表示型態1未提供交替起始序列,而針對表示型態2,對各個SAP提供一個交替起始序列,以圖像間隔表示,獲得min_initial_alt_startup_offset,d2等於1,如第10b圖例示說明及解說如下)。
結果,針對第9及10圖給定之實例,
-標準化組成起始時間e1=1
-標準化組成起始時間e2=2
-替代組成起始時間f1=1
-替代組成起始時間f2=1
-最大標準化組成起始時間e=2
-最大替代組成起始時間f=1
-空白編輯之持續時間a1=1
-空白編輯之持續時間a2=0
-替代空白編輯之持續時間g1=0
-替代空白編輯之持續時間g2=0
於該處全部數值皆係以圖像間隔表示。
於第9及10圖之實例中,DASH客戶機選擇從表示型態1開始串流化。因g1<a1,故客戶機可選擇是否以習知方式操作,且偏移表示內容時間表上的組成時間達a1(藉延遲解碼序列的輸出),或當有需要時是否施加交替起始序列,且偏移表示內容時間表上的組成時間達g1=0。於第10a及10b圖之實例中,客戶機決定使用交替起始序列,因此如從第10a及10b圖觀察,第一IDR圖像係恰在其解碼後顯示。起始進階時間變數h係經初始化為a1-g1=1。
參考第9及10圖之實例中,當DASH客戶機決定在第二IDR圖像從表示型態1切換至表示型態2時,發現起始進階時間變數h係大於0,因此,使用交替起始序列用以解碼與渲染表示型態2。於此一特定交替起始序列中,第一非參考圖像係未經解碼或渲染(第一圖像具有斜體字frame_num 3)。結果,從第10b圖可觀察得表示型態2的第一解碼IDR圖像係在兩個圖像間隔渲染。常見回放速率係在具有frame_num等於2的圖像達成(參考第10b圖)。
後文中,作為實例,第8圖之方法係例示說明為應用至第9圖之序列。於第9圖中,以拍攝順序說明切換自串流Rep.1之實例及切換至串流Rep.2實例。第9b圖以解碼順序例示說明第9a圖之實例序列,及第9c圖以輸出順序例示說明第9a圖之實例序列。第10a-10b圖依據本發明之實施例關聯第 9a圖從串流Rep.1切換至串流Rep.2,分別地以解碼順序及以輸出順序例示說明第9a圖之實例序列。第10c-10d圖為當顯示切換係關聯第9a圖從串流Rep.1切換至串流Rep.2使用時,以解碼順序及以輸出順序例示說明第9a圖之實例序列。
為了只用於例示說明之目的,假設切換係發生在第9b圖的切換自串流Rep.1之位置910。第9a圖及第9b圖係水平地對齊使得在第9b圖中可出現在解碼器輸出的一解碼圖像的最早時槽為相對於第9a圖中個別存取單位的處理時槽之下個時槽。Rep.1圖框係經處理(解碼)直到切換點。第8圖之方塊圖表示切換至串流Rep.2之處理如下。
於第8圖之方塊810,切換至串流Rep.2之具有frame_num等於0的存取單位係識別為第一可解碼存取單位。
於第8圖之方塊820,具有frame_num等於0的存取單位係經處理。
於第8圖之方塊830,輸出時鐘係經起始,具有frame_num等於0的存取單位(假說)解碼所得的解碼圖像係(假說地)經輸出。
第8圖之方塊840及850係針對具有frame_num等於1及2的存取單位經迭代重複,原因在於該等存取單位可在輸出時鐘到達其輸出時間前經處理。
當具有frame_num等於3的存取單位乃解碼順序中的下一者時,其輸出時間已經超過。如此,跳掉在Rep.2的第一處理GOP中具有frame_num等於3的第一存取單位(第8圖之 方塊860)。
第8圖之方塊840及850然後係針對以解碼順序的全部隨後存取單位迭代重複,原因在於該等存取單位可在輸出時鐘到達其輸出時間前經處理。
於本實例中,比較先前描述的習知辦法,當施加第8圖之程序時,圖像的渲染係更早一個圖像間隔開始。當圖像率為25赫茲時,起始延遲的節省為40毫秒。
如前述,第7a-7c圖例示說明具有五個時間層級的可階層式擴充位元串流之實例。由於時間性階層關係,在該序列的起點可能只解碼一圖像子集。結果,渲染可更快開始,但開始時的顯示圖像率可較低。換言之,播放器可在初起始延遲之持續時間與初顯示圖像率間做出折衷。第11a-11b圖及第11c-11d圖顯示交替起始序列的兩個實例,於該處第7a圖之該位元串流之一子集係經解碼。第11a-11b圖及第11c-11d圖只闡釋切換至序列。
針對解碼及解碼器輸出選定的樣本係分別呈示於第11a圖及第11b圖。具有frame_num等於4之參考圖像及取決於具有frame_num等於4的圖像的具有frame_num等於5的非參考圖像係未經解碼。於本實例中,圖像的渲染比第7c圖更早四個圖像間隔。當圖像率為25赫茲時,起始延遲的節省為160毫秒。起始延遲的節省伴有缺點為於該位元串流起點的顯示圖像率為較低。
第11c-11d圖例示說明依據本發明之實施例另一個實例序列。於本實例中,取決於具有frame_num等於3之圖像的 該等圖像之解碼被刪除,於第一圖像群組第二半部內部的非參考圖像之解碼也被刪除。從具有frame_num等於2之存取單位所得的解碼圖像乃被輸出/傳輸之第一者。含有取決於具有frame_num等於3之存取單位的子序列之解碼係被刪除,於第一群組圖像第二半部內部的非參考圖像之解碼也被刪除。結果,第一GOP的輸出圖像率為正常圖像率之半,但顯示程序比前述習知解決方案更早開始兩個圖框間隔(於25赫茲圖像率為80毫秒)。
當位元串流之處理係始於開始開放式GOP的內-圖像時,非可解碼先行圖像的處理係經刪除。此外,若該等可解碼圖像係不用作為於輸出順序中在內-圖像之後的圖像之間-預測參考,則非可解碼先行圖像的處理也可經刪除。此外,於輸出順序中出現在開始開放式GOP的內-圖像之後的一或多個子序列係經刪除。
若在輸出順序中的最早解碼圖像係不輸出(例如由於類似第11c-11d圖例示說明的處理結果),取決於體現本發明之實施例的功能方塊,必須執行額外操作。
-若本發明之實施例係在播放器中體現,該播放器實時(亦即平均不比解碼率或回放率更快)接收一視訊位元串流及與該視訊位元串流同步的一或多個位元串流,其它位元串流之若干第一存取單位的處理可能必須刪除,來有全部串流的同步播出,串流的回放率須經調整(減慢)。可使用任何適應性媒體播出演算法。
-若本發明之實施例係在發送器或檔案產生器其寫入 傳輸串流的指令中體現,則來自與視訊位元串流同步化的該等位元串流之第一存取單位係經選擇而輸出時間儘可能地匹配第一解碼圖像。
若本發明之實施例係施加至一切換至串流,於該處該第一可解碼存取單位含有一漸進解碼再新週期的第一圖像,則只解碼具有temporal_id等於0的存取單位。此外,在漸進解碼再新週期內部可只解碼可靠的分離區域。
若存取單位係以數量、空間、或其它可擴充手段編碼,則只有特選的依賴性表示型態及層級表示型態可被解碼來加速解碼程序,且進一步減少起始延遲。
於一個實施例中,只有適應性集合中的一個表示型態子集係被考慮用於如上數值a至g的計算,許可在該子集內部之表示型態切換。相同適應性集合的表示型態之其它子集也可被推衍且由DASH客戶機使用。如此,若表示型態間的緩衝要求有重大變異度,則比較當從適應性集合的全部表示型態推衍其它空白編輯持續時間時,此等子集可許可較小的其它空白編輯持續時間值。
於一個實施例中,當串流化對話開始時,客戶機可選擇使用零或任何正的常數(與表示型態之性質無關)來將組成時間偏移至表示內容時間表。然後,客戶機可使用交替起始序列,即便當未進行切換時亦復如此,來增加緩衝器占用率至等於其它空白編輯持續時間,或增加至含括於編輯列表框中的空白編輯持續時間。
於一個實施例中,解碼速率可各異且與位元串流中假 設的及/或藉編碼器假設的解碼速率不同。交替起始序列可用以控制(CPB或DPB或二者)的緩衝器占用程度,使得占用程度充分地超過一臨界值。串流切換及交替起始序列也可聯合用來控制緩衝器占用程度。
於不同實施例中,初始緩衝要求包括解碼圖像緩衝要求或編碼圖像緩衝要求或二者。緩衝要求典型地係表示為初始緩衝的延遲或時間及/或初始緩衝結束時的緩衝器占用度,於該處占用度可以位元組表示(特別於編碼圖像緩衝之情況),及/或以圖像或圖框表示(特別於解碼圖像緩衝之情況)。於若干實施例中,足夠檢測二串流的初始緩衝要求是否相異,而於其它實施例中,可研究目前緩衝狀態,諸如占用程度,且比較切換至串流的初始緩衝要求作比較。
於本發明之一個實施例中,有一檔案封裝器(參考第16圖)或檔案產生器,產生交替起始序列且指示於檔案。此外,檔案封裝器或檔案產生器可將交替起始序列的性質摘要至檔案中的特定位置,諸如交替起始序列性質框或交替起始序列樣本分組的樣本描述分錄表。檔案封裝器或檔案產生器例如可包括min_initial_alt_startup_offset語法元素或如上變數a至g中之任一者於性質的摘要。為了若干性質,檔案封裝器或檔案產生器可研究多個軌跡,該個軌跡意圖彼此為替代品,諸如在DASH對話中在單一適應性集合內部的不同表示型態。舉例言之,針對其它空白編輯持續時間gi,檔案封裝器或檔案產生器研究全部替代軌跡。
於本發明之一個實施例中,MPD產生器係經組配來操 作如下。MPD產生器可含括於檔案封裝器或檔案產生器,或可為分開功能區塊,可存取節段或伺服器檔案。MPD產生器針對同一個適應性集合的二或多個表示型態產生有效MPD。MPD產生器可額外地產生表示該表示型態的交替起始序列性質之元件及/或屬性。語意加至MPEG DASH之MPD的實例提供如下。屬性@minAltStartupOffset可出現在共通組群、表示型態及子表示型態屬性間,或例如可出現在表示型態元素。
@minAltStartupOffset載明最初可進階的表示型態的表示內容時間,同時許可切換至在型1至3的SAP於相同適應性集合中的任何其它表示型態,因而藉潛在施加與SAP相聯結的交替起始序列,可維持連續回放。針對ISOBMFF,若該初始化節段的交替起始序列性質框存在,則@minAltStartupOffset值係等於在該框中的min_initial_alt_startup_offset值中之一者。
MPD產生器可類似檔案封裝器或檔案產生器操作,來將交替起始序列之性質摘要成MPD,於該處該等性質可為例如如前述@minAltStartupOffset或為於性質摘要中前述變數a至g中之任一者。
類似含括於表示型態之初始化節段中的相似資訊,DASH客戶機可使用含括於MPD中的交替起始序列資訊。使用於MPD中之資訊的效果可為客戶機無需提取全部表示型態之初始化節段,因而提取較少資料,減少在串流化對話起點因初緩衝所造成的延遲量。
於一個實施例中,替代客戶機諸如DASH客戶機,作用態串流化伺服器決定在串流切換中使用交替起始序列。伺服器選擇被傳輸的編碼圖像。
於一個實施例中,針對作用態串流化伺服器之一伺服器檔案含括特定暗示軌跡或暗示軌跡章節,描述當從一個串流切換至另一串流時的封包化指令。封包化指令指示交替起始序列之使用,因而某些編碼圖像不傳輸在交替起始序列內部的圖像之解碼時間及/或輸出時間可經修正。於一個實施例中,有個檔案產生器產生暗示軌跡或暗示軌跡章節,描述使用交替起始序列,當從一個串流切換至另一串流時的封包化指令。
於一個實施例中,串流或表示型態係經多工化,亦即含有多於一個媒體串流。舉例言之,串流可為MPEG-2傳送串流。針對多工化串流的交替起始序列可載明所容納串流諸如視訊串流中之只有一者。結果,有關針對交替起始序列之緩衝要求的指示及變數也可針對所容納串流中之一者載明。
第12圖顯示一種系統10,其中可利用本發明之各個實施例,包含透過一或多個網路可通訊的多個通訊裝置。系統10可包含有線或無線網路之任一項組合,包括但非限於行動電話網路、無線區域網路(LAN)、藍牙個人區域網路、乙太LAN、信號環流LAN、廣域網路、網際網路等。系統10可包括有線及無線通訊裝置二者。
舉例言之,第12圖所示系統10包括包括一無線電路網 路11及網際網路28。與網際網路28之連結可包括但非限於長距離無線連結、短距離無線連結、及各種有線連結包括但非限於電話線、纜線、電力線等。
系統10之通訊裝置之實例可包括但非限於呈行動電話形式之電子裝置12、個人數位助理器(PDA)與行動電話之組合14、PDA 16、整合型傳訊裝置(IMD)18、桌上型電腦20、筆記型電腦22等。通訊裝置可為固定式,或當由移動中的個人攜帶時為行動式。通訊裝置也可以運輸模式定位,包括但非限於汽車、卡車、計程車、巴士、船、飛機、腳踏車、摩托車等。部分或全部通訊裝置可發送與接收呼叫及訊息,與服務提供者透過與站台24的無線連結25而通訊。站台24可連結至網路伺服器26,該網路伺服器26許可無線電路網路11與網際網路28間之通訊。系統10可包括額外通訊裝置及不同型別的通訊裝置。
通訊裝置可使用各種傳輸技術通訊,包括但非限於劃碼多向接取(CDMA)、全球行動通訊系統(GSM)、通用行動電信系統(UMTS)、分時多向接取(TDMA)、分頻多向接取(FDMA)、傳輸控制協定/網際網路協定(TCP/IP)、簡訊服務(SMS)、多媒體傳訊服務(MMS)、電子郵件、即時傳訊服務(IMS)、藍牙、IEEE 802.11等。涉及體現本發明之多個實施例的通訊裝置可使用多種媒體通訊,包括但非限於紅外線、雷射、纜線連結等。
第13及14圖顯示依據本發明之多個實施例可用作為網路節點的一個代表性電子裝置12。但須瞭解本發明之範圍 不欲受一個特定裝置型別所限。第13及14圖之電子裝置12包括一殼體30、呈液晶顯示器形式之一顯示器32、一數字小鍵盤34、一麥克風36、一耳機38、一電池40、一紅外線埠42、一天線44、依據一個實施例呈UICC形式之一晶片卡46、一卡片讀取器48、無線電介面電路52、編碼譯碼器電路54、一控制器56及一記憶體58。依據本發明之多個實施例,前述組件使得電子裝置12可發送/接收各項訊息至/自可駐在網路上的其它裝置。個別電路及元件全部皆為技藝界已知之型別,例如於諾基亞(Nokia)之行動電話之範圍。
第15圖為其中可體現多個實施例之通俗多媒體通訊系統之代表圖。如第15圖所示,資料來源500提供呈類比、未經壓縮之數位、或經壓縮之數位格式、或此等格式之任一項組合的來源信號。編碼器510將來源信號編碼成編碼媒體位元串流。須注意欲解碼的位元串流可直接地或間接地接收自位在虛擬任一型網路內部的一遠端裝置。此外,位元串流可接收自本地硬體或軟體。編碼器510可編碼多於一個媒體型別,諸如音訊及視訊,或多於一個編碼器510可被要求編碼不同媒體型別的來源信號。編碼器510也可獲得合成產生的輸入,諸如圖形及文字,或也可產生合成媒體之編碼位元串流。後文中,只考慮一個媒體型別的編碼媒體位元串流之處理來簡化描述。但須注意典型地即時廣播服務包含數個串流(典型地至少一個音訊、視訊、及文字小標題串流)。也須注意系統可包括多個編碼器,但於第15圖中只表示一個編碼器510來簡化描述而不缺一般性。更進一步須 瞭解雖然此處所含文字及實例可特別地描述一種編碼方法,但熟諳技藝人士將瞭解相同構思及原理也適用於相對應的解碼方法,及反之亦然。
已編碼媒體位元串流係傳送至一儲存裝置520。儲存裝置520可包含任一型大容量記憶體來儲存已編碼媒體位元串流。儲存裝置520中的已編碼媒體位元串流之格式可為元素自容式位元串流格式,或一或多個已編碼媒體位元串流可以封裝成容器檔案。有些系統係「直播」操作,亦即刪除儲存且從編碼器510直接傳送已編碼媒體位元串流至發送器530。基於需求然後已編碼媒體位元串流傳送至發送器530,又稱伺服器。傳輸中使用的格式可為元素自容式位元串流格式、封包串流格式,或一或多個已編碼媒體位元串流可封裝入一容器檔案內。編碼器510、儲存裝置520、及發送器530可駐在相同物理裝置,或可含括於分開裝置。編碼器510及發送器530可以直播即時內容操作,於該種情況下,已編碼媒體位元串流典型地並不持久地儲存,反而係在內容編碼器510內及/或在發送器530內緩衝短時間週期,來平順化處理延遲、傳送延遲、及編碼媒體位元率的變化。
發送器530使用通訊協定堆疊發送已編碼媒體位元串流。該堆疊可包括但非限於即時傳輸協定(RTP)、用戶資料訊息協定(UDP)、及網際網路協定(IP)。當該通訊協定堆疊為封包導向時,發送器530將該已編碼媒體位元串流封裝成封包。舉例言之,當使用RTP時,發送器530依據RTP酬載 格式將該已編碼媒體位元串流封裝成封包。典型地,各個媒體型別具有一專用的RTP酬載格式。再度須注意系統可含有多於一個發送器530,但為求簡明,後文描述只考慮一個發送器530。
若媒體內容係封裝成針對儲存裝置520之一容器檔案或用來將資料輸入發送器530,發送器530可包含或工作式附接至「發送檔案剖析器」(圖中未顯示)。更明確言之,若該容器檔案並非就此傳輸,反而所含已編碼媒體位元串流中之至少一者係透過通訊協定傳輸,一發送檔案剖析器定位欲透過通訊協定傳輸的已編碼媒體位元串流之適當部分。該發送檔案剖析器也協助產生用於該通訊協定的正確格式,諸如封包標頭及酬載。多媒體容器檔案可含有封裝指令,諸如於ISO基本媒體檔案格式中的暗示軌跡用以封裝通訊協定上所含媒體位元串流中之至少一者。
發送器530可以或可不經由一通訊網路而連結至一閘道器540。閘道器540可發揮不同功能,諸如將依據一個通訊協定堆疊的一封包串流轉譯成依據另一個通訊協定堆疊,資料串流之合併及分叉,及依據下行鏈路及/或接收器能力而操縱資料串流,諸如依據普遍下行鏈路網路狀況控制正向串流的位元率。閘道器540之實例包括MCU、電路切換視訊電話與封包切換視訊電路間之閘道器、透過小區推送談話(PoC)伺服器、於數位視訊廣播手持式(DVB-H)系統中之IP封裝器、或機上盒其前傳本地廣播傳輸至家用無線網路。當使用RTP時,閘道器540係稱作RTP混合器或RTP 轉譯器,且典型地係用作為RTP連結之端點。
系統包括一或多個接收器550,典型地可接收、解調、及解除封裝所傳輸的信號成為已編碼媒體位元串流。該已編碼媒體位元串流係傳送給一記錄儲存裝置555。記錄儲存裝置555可包含任一型大容量記憶體來儲存已編碼媒體位元串流。另外或此外,記錄儲存裝置555可包含計算記憶體,諸如隨機存取記憶體。於記錄儲存裝置555中之已編碼媒體位元串流的格式可為元素自容式位元串流格式,或一或多個已編碼媒體位元串流可封裝成一容器檔案。若有多個彼此相聯結的已編碼媒體位元串流,諸如音訊串流及視訊串流,則典型地使用容器檔案,接收器550包含或係附接至一容器檔案產生器而從輸入串流產生一容器檔案。有些系統係「直播」操作,亦即刪除記錄儲存裝置555且將已編碼媒體位元串流從接收器550直接傳送至解碼器560。於若干系統中,只有所記錄串流的最晚近部分,例如所記錄串流的最晚近10分鐘節錄,係維持於記錄儲存裝置555,同時任何稍早記錄的資料係從記錄儲存裝置555拋棄。
已編碼媒體位元串流係從記錄儲存裝置555轉移至解碼器560。若有許多彼此相聯結的且封裝成一容器檔案的已編碼媒體位元串流,諸如音訊串流及視訊串流,則使用一檔案剖析器(圖中未顯示)來從該容器檔案解除各個已編碼媒體位元串流的封裝。記錄儲存裝置555或解碼器560可包含檔案剖析器,或檔案剖析器係附接至記錄儲存裝置555或解碼器560。
已編碼媒體位元串流典型地係進一步藉解碼器560處理,其輸出為一或多個未經壓縮的媒體串流。最後,渲染器(renderer)570例如可以揚聲器或顯示器再現該等未經壓縮的媒體串流。接收器550、記錄儲存裝置555、解碼器560、及第一處理器570可駐在相同實體裝置或可含括於分開裝置。
此處所述多個實施例係以方法步驟或製程的通用脈絡描述,於一個實施例中可藉一電腦程式產品體現,可於電腦可讀取媒體中具體實施,可含括電腦可執行指令,諸如程式代碼,可藉電腦於網路環境中執行。電腦可讀取媒體可包括活動式及非活動式儲存裝置,包括但非限於唯讀記憶體(ROM)、隨機存取記憶體(RAM)、光碟(CD)、數位影音碟(DVD)等。一般而言,程式模組可包括執行特定工作或體現特定摘要資料型別的常式、程式、物品、組件、資料結構等。電腦可執行指令、相聯結的資料結構、及程式模組表示用以執行此處揭示之方法步驟之程式代碼之實例。此等可執行指令或相聯結的資料結構之特定序列表示體現於此等步驟或方法中描述的功能之相對應動作的實例。
本發明之實施例可於軟體、硬體、應用邏輯或軟體、硬體與應用邏輯之組合中體現。舉例言之,若干面向可於硬體體現,而其它面向可於可藉控制器、微處理器或其它計算裝置處理的韌體或軟體體現,但本發明之範圍並非受如此所限。軟體、應用邏輯及/或硬體例如可駐在一晶片組 一行動裝置、一桌上型電腦、一膝上型電腦、或一伺服器上。多個實施例之軟體及網路體現可以標準程式規劃技術完成,以基於法則的邏輯或其它邏輯來完成各個資料庫搜尋步驟或方法、相互關聯的步驟或方法、比較步驟或方法、及決定步驟或方法完成。各個實施例也可在網路元件或模組內部完全或部分地體現。須注意如此處使用及如下申請專利範圍使用的「組件」及「模組」等詞意圖涵蓋使用軟體代碼、及/或硬體體現、及/或接收手動輸入之設備中之一線或多線而體現。
軟體可儲存在此等實體媒體上,諸如記憶體晶片、或在處理器內部體現的記憶體區塊、磁性媒體諸如硬碟或軟碟、及光學媒體諸如DVD及其資料變異體CD。
記憶體可為適合本地技術環境的任一型,且可使用任何適當資料儲存技術體現,諸如基於半導體之記憶體裝置、磁性記憶體裝置及系統、光學記憶體裝置及系統、固定式記憶體及活動式記憶體。資料處理器可屬適合本地技術環境的任何型別,且可包括通用電腦、特用電腦、微處理器、數位信號處理器(DSP)、及處理器中之一或多者作為非限制性實例。
已經呈示本發明之實施例之前文描述用於例示說明及描述目的。並非意圖為排它性或限制本發明於所揭示的精確形式,鑑於前文教示,修正及變化係屬可能或可從本發明之實施獲得。實施例係經選擇及描述來解說本發明之原理及其實際應用,來使得熟諳技藝人士利用本發明於多個 實施例,且涵蓋適用於特定用途的多項修改。
後文中將提出若干實例。
一種方法包含:接收一第一序列之存取單位及一第二序列之存取單位;解碼該第一序列之存取單位中之至少一個存取單位;解碼該第二序列之存取單位中之一第一可解碼存取單位;決定在該第二序列之存取單位中之一下一個可解碼存取單位的一解碼時間及該第二序列之存取單位中之該下一個可解碼存取單位的一輸出時間中之至少一者之前,該第二序列之存取單位中之該下一個可解碼存取單位是否可被解碼;及基於決定在該下一個可解碼存取單位的該解碼時間及該輸出時間中之至少一者之前該下一個可解碼存取單位無法被解碼,跳掉下一個可解碼存取單位的解碼。
於若干實例中,該方法係進一步包含:跳掉在該第二序列之存取單位中取決於該下一個可解碼存取單位的任何此等存取單位的解碼。
於若干實例中,該方法係進一步包含:基於決定在該下一個可解碼存取單位的該解碼時間及該輸出時間中之至少一者之前該下一個可解碼存取單位可被解碼而解碼該下一個可解碼存取單位。
於若干實例中,該方法係進一步包含: 重複該決定及或為跳掉解碼或為解碼該下一個可解碼存取單位直到不再有任何存取單位為止。
於若干實例中,該方法係進一步包含:接收針對該第二序列之存取單位的一交替起始序列之指令;於該決定中使用該交替起始序列。
於若干實例中,該方法係進一步包含:該第一序列之存取單位係為一第一表示型態之一子集,及該第二序列之存取單位係為一第二表示型態之一子集,該第一表示型態及該第二表示型態主要係源自於該相同媒體內容,及該第一序列之存取單位的輸出時間係具有與該第二序列之存取單位的輸出時間至少部分相異之範圍;該方法係進一步包含:要求在接收該第一序列之存取單位之前傳輸該第一序列之存取單位,決定要求傳輸該第二序列之存取單位而非該第一表示型態之隨後的存取單位,及要求在接收該第二序列之存取單位之前傳輸該第二序列之存取單位。
一種方法之另一個實例係包含:從一接收器接收一要求從一第一序列之存取單位切換至一第二序列之存取單位; 封裝該第一序列之存取單位之至少一個可解碼存取單位以供傳輸;封裝該第二序列之存取單位之一第一可解碼存取單位以供傳輸;決定在該第二序列之存取單位中之一下一個可解碼存取單位的一解碼時間及該第二序列之存取單位中之該下一個可解碼存取單位的一傳輸時間中之至少一者之前,該第二序列之存取單位中之該下一個可解碼存取單位是否可被封裝;及基於決定在該下一個可解碼存取單位的該解碼時間及該傳輸時間中之至少一者之前該下一個可解碼存取單位無法被封裝,跳掉下一個可解碼存取單位的封裝;及傳輸該經封裝的可解碼存取單位給該接收器。
於若干實例中,該方法係進一步包含:跳掉在該第二序列之存取單位中取決於該下一個可解碼存取單位的任何此等存取單位的封裝。
於若干實例中,該方法係進一步包含:基於決定在該下一個可解碼存取單位的該解碼時間及該傳輸時間中之至少一者之前該下一個可解碼存取單位可被封裝而封裝該下一個可解碼存取單位。
於若干實例中,該方法係進一步包含:重複該決定及或為跳掉封裝或為封裝該下一個可解碼存取單位直到不再有任何存取單位為止。
該方法之於若干實例中,該封裝係包含將該等可解碼 存取單位封裝成一位元串流。
該方法之於若干實例中,該等存取單位為至少一個已編碼視訊序列之存取單位。
一種方法之另一個實例係包含:產生用以解碼一第一序列之存取單位及一第二序列之存取單位的指令,該等指令係包含:解碼該第一序列之存取單位中之至少一個存取單位;解碼該第二序列之存取單位中之一第一可解碼存取單位;決定在該第二序列之存取單位中之一下一個可解碼存取單位的一解碼時間及該第二序列之存取單位中之該下一個可解碼存取單位的一輸出時間中之至少一者之前,該第二序列之存取單位中之該下一個可解碼存取單位是否可被解碼;及基於決定在該下一個可解碼存取單位的該解碼時間及該輸出時間中之至少一者之前該下一個可解碼存取單位無法被解碼,產生一指令來跳掉下一個可解碼存取單位的解碼。
一種方法之另一個實例係包含:產生用以封裝一第一序列之存取單位及一第二序列之存取單位的指令,該等指令係包含:封裝該第一序列之存取單位中之至少一個存取單位用以傳輸; 封裝該第二序列之存取單位中之一第一可解碼存取單位用以傳輸;決定在該第二序列之存取單位中之一下一個可解碼存取單位的一解碼時間及該第二序列之存取單位中之該下一個可解碼存取單位的一傳輸時間中之至少一者之前,該第二序列之存取單位中之該下一個可解碼存取單位是否可被封裝;及基於決定在該下一個可解碼存取單位的該解碼時間及該傳輸時間中之至少一者之前該下一個可解碼存取單位無法被封裝,產生一指令來跳掉下一個可解碼存取單位的封裝。
依據一實例,一種裝置係包含:一解碼器係經組配來:解碼一第一序列之存取單位中之至少一個存取單位;解碼一第二序列之存取單位中之一第一可解碼存取單位;決定在該第二序列之存取單位中之一下一個可解碼存取單位的一解碼時間及該第二序列之存取單位中之該下一個可解碼存取單位的一輸出時間中之至少一者之前,該第二序列之存取單位中之該下一個可解碼存取單位是否可被解碼;及基於決定在該下一個可解碼存取單位的該解碼時間及該輸出時間中之至少一者之前該下一個可解碼存取單 位無法被解碼,跳掉下一個可解碼存取單位的解碼。
依據另一實例,一種裝置係包含:一編碼器係經組配來:封裝一第一序列之存取單位的至少一個可解碼存取單位用以傳輸;封裝一第二序列之存取單位的一第一可解碼存取單位用以傳輸;決定在該第二序列之存取單位中之一下一個可解碼存取單位的一解碼時間及該下一個可解碼存取單位的一傳輸時間中之至少一者之前,該第二序列之存取單位中之該下一個可解碼存取單位是否可被封裝;及基於決定在該下一個可解碼存取單位的該解碼時間及該傳輸時間中之至少一者之前該下一個可解碼存取單位無法被封裝,跳掉下一個可解碼存取單位的封裝。
依據另一實例,一種裝置係包含:一檔案產生器係經組配來產生指令而:解碼一第一序列之存取單位中之至少一個存取單位;解碼一第二序列之存取單位中之一第一可解碼存取單位;決定在該第二序列之存取單位中之一下一個可解碼存取單位的一解碼時間及該第二序列之存取單位中之該下一個可解碼存取單位的一輸出時間中之至少一者之前,該第二序列之存取單位中之該下一個可解碼存取單位是否 可被解碼;及基於決定在該下一個可解碼存取單位的該解碼時間及該輸出時間中之至少一者之前該下一個可解碼存取單位無法被解碼,跳掉下一個可解碼存取單位的解碼。
依據另一實例,一種裝置係包含:一檔案產生器係經組配來產生指令而:封裝一第一序列之存取單位的至少一個可解碼存取單位用以傳輸;封裝一第二序列之存取單位的一第一可解碼存取單位用以傳輸;決定在該第二序列之存取單位中之一下一個可解碼存取單位的一解碼時間及該下一個可解碼存取單位的一傳輸時間中之至少一者之前,該第二序列之存取單位中之該下一個可解碼存取單位是否可被封裝;及基於決定在該下一個可解碼存取單位的該解碼時間及該傳輸時間中之至少一者之前該下一個可解碼存取單位無法被封裝,跳掉下一個可解碼存取單位的封裝。
依據另一實例,一種裝置係包含:至少一個處理器;及含括電腦程式代碼之至少一個記憶體,該至少一個記憶體及該電腦程式代碼與該至少一個處理器係經組配來使得該裝置至少:解碼一第一序列之存取單位中之至少一個存取單位; 解碼一第二序列之存取單位中之一第一可解碼存取單位;決定在該第二序列之存取單位中之一下一個可解碼存取單位的一解碼時間及該第二序列之存取單位中之該下一個可解碼存取單位的一輸出時間中之至少一者之前,該第二序列之存取單位中之該下一個可解碼存取單位是否可被解碼;及基於決定在該下一個可解碼存取單位的該解碼時間及該輸出時間中之至少一者之前該下一個可解碼存取單位無法被解碼,跳掉下一個可解碼存取單位的解碼。
於該裝置之若干實例中,該記憶體係進一步包含電腦程式代碼,該至少一個記憶體及該電腦程式代碼與該至少一個處理器係經組配來使得該裝置至少:跳掉在該第二序列之存取單位中取決於該下一個可解碼存取單位的任何此等存取單位的解碼。
於該裝置之若干實例中,該記憶體係進一步包含電腦程式代碼,該至少一個記憶體及該電腦程式代碼與該至少一個處理器係經組配來使得該裝置至少:基於決定在該下一個可解碼存取單位的該解碼時間及該輸出時間中之至少一者之前該下一個可解碼存取單位可被解碼而解碼該下一個可解碼存取單位。
於該裝置之若干實例中,該記憶體係進一步包含電腦程式代碼,該至少一個記憶體及該電腦程式代碼與該至少一個處理器係經組配來使得該裝置至少: 重複該決定及或為跳掉解碼或為解碼該下一個可解碼存取單位直到不再有任何存取單位為止。
於該裝置之若干實例中,該記憶體係進一步包含電腦程式代碼,該至少一個記憶體及該電腦程式代碼與該至少一個處理器係經組配來使得該裝置至少:接收針對該第二序列之存取單位的一交替起始序列之指令;於該決定中使用該交替起始序列。
於若干實例中,該第一序列之存取單位為一第一表示型態之一子集,及該第二序列之存取單位為一第二表示型態之一子集;該第一表示型態與該第二表示型態係源自於大致上相同的媒體內容,及該第一序列之存取單位的輸出時間有至少部分範圍係與該第二序列之存取單位的輸出時間相異;其中該記憶體係進一步包含電腦程式代碼,該至少一個記憶體及該電腦程式代碼與該至少一個處理器係經組配來使得該裝置至少:要求在接收該第一序列之存取單位之前傳輸該第一序列之存取單位,決定要求傳輸該第二序列之存取單位而非該第一表示型態之隨後存取單位,及要求在接收該第二序列之存取單位之前傳輸該第二序列之存取單位。
依據另一實例,一種裝置係包含: 至少一個處理器;及含括電腦程式代碼之至少一個記憶體,該至少一個記憶體及該電腦程式代碼與該至少一個處理器係經組配來使得該裝置至少:封裝一第一序列之存取單位的至少一個可解碼存取單位用以傳輸;封裝一第二序列之存取單位的一第一可解碼存取單位用以傳輸;決定在該第二序列之存取單位中之一下一個可解碼存取單位的一解碼時間及該下一個可解碼存取單位的一傳輸時間中之至少一者之前,該第二序列之存取單位中之該下一個可解碼存取單位是否可被封裝;及基於決定在該下一個可解碼存取單位的該解碼時間及該傳輸時間中之至少一者之前該下一個可解碼存取單位無法被封裝,跳掉下一個可解碼存取單位的封裝。
於該裝置之若干實例中,該記憶體係進一步包含電腦程式代碼,該至少一個記憶體及該電腦程式代碼與該至少一個處理器係經組配來使得該裝置至少:跳掉在該第二序列之存取單位中取決於該下一個可解碼存取單位的任何此等存取單位的封裝。
於該裝置之若干實例中,該記憶體係進一步包含電腦程式代碼,該至少一個記憶體及該電腦程式代碼與該至少一個處理器係經組配來使得該裝置至少:基於決定在該下一個可解碼存取單位的該解碼時間及 該傳輸時間中之至少一者之前該下一個可解碼存取單位可被封裝而封裝該下一個可解碼存取單位。
於該裝置之若干實例中,該記憶體係進一步包含電腦程式代碼,該至少一個記憶體及該電腦程式代碼與該至少一個處理器係經組配來使得該裝置至少:重複該決定及或為跳掉封裝或為封裝該下一個可解碼存取單位直到不再有任何存取單位為止。
於該裝置之若干實例中,該記憶體係進一步包含電腦程式代碼,該至少一個記憶體及該電腦程式代碼與該至少一個處理器係經組配來使得該裝置至少將該可解碼存取單位封裝成一位元串流。
於該裝置之若干實例中,該記憶體係進一步包含電腦程式代碼,該至少一個記憶體及該電腦程式代碼與該至少一個處理器係經組配來使得該裝置至少使用至少一個已編碼視訊序列之存取單位作為該等存取單位。
於一電腦可讀取媒體上具體實施之一電腦程式產品之一實例包含:解碼該第一序列之存取單位中之至少一個存取單位用之電腦代碼;解碼該第二序列之存取單位中之一第一可解碼存取單位用之電腦代碼;決定在該第二序列之存取單位中之一下一個可解碼存取單位的一解碼時間及該第二序列之存取單位中之該下一個可解碼存取單位的一輸出時間中之至少一者之前,該第 二序列之存取單位中之該下一個可解碼存取單位是否可被解碼用之電腦代碼;及基於決定在該下一個可解碼存取單位的該解碼時間及該輸出時間中之至少一者之前該下一個可解碼存取單位無法被解碼,跳掉下一個可解碼存取單位的解碼用之電腦代碼。
於一電腦可讀取媒體上具體實施之一電腦程式產品之一實例包含:封裝該第一序列之存取單位中之至少一個存取單位用以傳輸用之電腦代碼;封裝該第二序列之存取單位中之一第一可解碼存取單位用以傳輸用之電腦代碼;決定在該第二序列之存取單位中之一下一個可解碼存取單位的一解碼時間及該第二序列之存取單位中之該下一個可解碼存取單位的一傳輸時間中之至少一者之前,該第二序列之存取單位中之該下一個可解碼存取單位是否可被封裝用之電腦代碼;及基於決定在該下一個可解碼存取單位的該解碼時間及該傳輸時間中之至少一者之前該下一個可解碼存取單位無法被封裝,跳掉下一個可解碼存取單位的封裝用之電腦代碼。
1-16‧‧‧圖像
10‧‧‧系統
11‧‧‧無線電路網路
12‧‧‧電子裝置
14‧‧‧個人數位助理器(PDA)與行動電話之組合
16‧‧‧PDA
18‧‧‧整合型傳訊裝置(IMD)
20‧‧‧桌上型電腦
22‧‧‧筆記型電腦
24‧‧‧站台
25‧‧‧無線連結
26‧‧‧網路伺服器
28‧‧‧網際網路
30‧‧‧殼體
32‧‧‧顯示器
34‧‧‧數字小鍵盤
36‧‧‧麥克風
38‧‧‧耳機
40‧‧‧電池
42‧‧‧紅外線埠
44‧‧‧天線
46‧‧‧晶片卡
48‧‧‧卡片讀取器
52‧‧‧無線電介面電路
54‧‧‧編碼譯碼器電路
56‧‧‧控制器
58‧‧‧記憶體
100‧‧‧檔案封裝器
102‧‧‧容器檔案
104‧‧‧檔案
106‧‧‧輸出
110、430‧‧‧HTTP串流化伺服器
112‧‧‧HTTP要求
114‧‧‧回應
120‧‧‧HTTP串流化客戶機
130‧‧‧媒體播放器
140‧‧‧記憶體
150‧‧‧HTTP快取記憶體
210‧‧‧圖像順序計數值(POC)
212‧‧‧I/P圖像
214‧‧‧圖像群組(GOP)
216、218‧‧‧關鍵圖像
220‧‧‧最低時間層級(TL)
230‧‧‧簡化檔案結構
300、450‧‧‧內容提供者
310‧‧‧內容準備服務
320‧‧‧服務/內容公告服務
330‧‧‧用戶裝置
332‧‧‧服務/內容探索元件
340‧‧‧網路伺服器
410‧‧‧動態串流化伺服器
420‧‧‧客戶機
440‧‧‧容器、儲存裝置
500‧‧‧資料來源
510‧‧‧編碼器
530‧‧‧發送器
540‧‧‧閘道器
550‧‧‧接收器
555‧‧‧記錄儲存裝置
560‧‧‧解碼器
570‧‧‧渲染器
707a-b、714a-b‧‧‧片段、軌跡
800-860‧‧‧方塊
910‧‧‧位置
B‧‧‧B截割片
I、P‧‧‧圖像
POC‧‧‧圖像順序計數值
TL‧‧‧時間層級
第1圖例示說明具有時間可擴充性的階層編碼結構之實例; 第2a圖例示說明依據ISO基本媒體檔案格式的一框實例;第2b圖顯示依據ISO基本媒體檔案格式的一簡化檔案結構之實例;第3圖為例示說明樣本分組之一框實例;第4圖例示說明含有包括一SampletoToGroup框之一電影片段的一框實例;第5圖闡釋AVC樣本結構之一實例;第6圖闡釋一媒體表示內容描述XML基模之一實例;第7a-7c圖例示說明有五個時間層級之階層式可擴充位元串流實例;第8圖為流程圖例示說明依據本發明之實施例之一體現實例;第9a-9c圖例示說明於拍攝順序、解碼順序、及輸出順序中之序列實例;第10a-10b圖分別地例示說明依據本發明之實施例,第9a圖於解碼順序及輸出順序中之序列實例,連結從第9a圖之一個串流切換至另一串流;第10c-10d圖分別地例示說明第9a圖於解碼順序及輸出順序中之序列實例,連結使用延遲切換而從第9a圖之一個串流切換至另一串流;第11a-11b圖例示說明始於對第7a圖之該序列體現的一切換點之一交替序列實例;第11c-11d圖例示說明始於對第7a圖之該序列體現的一 切換點之一交替序列的另一實例;第12圖為其中可體現本發明之多個實施例之一系統的綜覽圖;第13圖例示說明依據本發明之多個實施例可利用之一電子裝置實例之透視圖;第14圖為可含括於第13圖之電子裝置內之該電路之示意代表圖;及第15圖為其中可體現多個實施例之一通用多媒體通訊系統之圖解代表圖;第16圖闡釋含括於HTTP串流系統中若干功能區塊、格式、及介面之例示說明實例;第17圖闡釋針對伺服器檔案格式之一檔案結構實例,於該處一個檔案含有組成一表示內容之整個持續時間之母資料片段;第18圖例示說明操作為HTTP串流伺服器之一常規網路伺服器之實例;及第19圖例示說明連結一動態串流伺服器之一常規網路伺服器之實例。
800-860‧‧‧方塊

Claims (10)

  1. 一種方法,其係包含:接收一第一序列之存取單位及一第二序列之存取單位;解碼該第一序列之存取單位中之至少一個存取單位;解碼該第二序列之存取單位中之一第一可解碼存取單位;決定在該第二序列之存取單位中之一下一個可解碼存取單位的一解碼時間及該第二序列之存取單位中之該下一個可解碼存取單位的一輸出時間中之至少一者之前,該第二序列之存取單位中之該下一個可解碼存取單位是否可被解碼;及基於決定在該下一個可解碼存取單位的該解碼時間及該輸出時間中之至少一者之前該下一個可解碼存取單位無法被解碼,跳掉下一個可解碼存取單位的解碼。
  2. 如申請專利範圍第1項之方法,其係進一步包含:跳掉在該第二序列之存取單位中取決於該下一個可解碼存取單位的任何此等存取單位的解碼。
  3. 如申請專利範圍第1項之方法,其係進一步包含:基於決定在該下一個可解碼存取單位的該解碼時間及該輸出時間中之至少一者之前該下一個可解碼存取單位可被解碼而解碼該下一個可解碼存取單位。
  4. 如申請專利範圍第1項之方法,其係進一步包含:接收針對該第二序列之存取單位的一交替起始序列之指令;於該決定中使用該交替起始序列。
  5. 如申請專利範圍第1項之方法,其中該第一序列之存取單位係為一第一表示型態之一子集,及該第二序列之存取單位係為一第二表示型態之一子集,該第一表示型態及該第二表示型態主要係源自於該相同媒體內容,及該第一序列之存取單位的輸出時間係具有與該第二序列之存取單位的輸出時間至少部分相異之範圍;該方法係進一步包含:要求在接收該第一序列之存取單位之前傳輸該第一序列之存取單位,決定要求傳輸該第二序列之存取單位而非該第一表示型態之隨後的存取單位,及要求在接收該第二序列之存取單位之前傳輸該第二序列之存取單位。
  6. 一種包含至少一個處理器及含括電腦程式代碼之至少一個記憶體的裝置,該至少一個記憶體及該電腦程式代碼係經組配來連同該至少一個處理器使得該裝置係:解碼一第一序列之存取單位中之至少一個存取單位; 解碼一第二序列之存取單位中之一第一可解碼存取單位;決定在該第二序列之存取單位中之一下一個可解碼存取單位的一解碼時間及該第二序列之存取單位中之該下一個可解碼存取單位的一輸出時間中之至少一者之前,該第二序列之存取單位中之該下一個可解碼存取單位是否可被解碼;及基於決定在該下一個可解碼存取單位的該解碼時間及該輸出時間中之至少一者之前該下一個可解碼存取單位無法被解碼,跳掉下一個可解碼存取單位的解碼。
  7. 如申請專利範圍第6項之裝置,其中該儲存有代碼於其上的至少一個記憶體當藉該至少一個處理器執行時,進一步包含使得該裝置係:跳掉在該第二序列之存取單位中取決於該下一個可解碼存取單位的任何此等存取單位的解碼。
  8. 如申請專利範圍第6項之裝置,其中該儲存有代碼於其上的至少一個記憶體當藉該至少一個處理器執行時,進一步包含使得該裝置係:基於決定在該下一個可解碼存取單位的該解碼時間及該輸出時間中之至少一者之前該下一個可解碼存取單位可被解碼而解碼該下一個可解碼存取單位。
  9. 如申請專利範圍第6項之裝置,其中該儲存有代碼於其上的至少一個記憶體當藉該至少一個處理器執行時,進 一步包含使得該裝置係:接收針對該第二序列之存取單位的一交替起始序列之指令;於該決定中使用該交替起始序列。
  10. 一種包含至少一個處理器及含括電腦程式代碼之至少一個記憶體的裝置,該至少一個記憶體及該電腦程式代碼係經組配來連同該至少一個處理器使得該裝置係:封裝一第一序列之存取單位的至少一個可解碼存取單位用以傳輸;封裝一第二序列之存取單位的一第一可解碼存取單位用以傳輸;決定在該第二序列之存取單位中之一下一個可解碼存取單位的一解碼時間及該下一個可解碼存取單位的一傳輸時間中之至少一者之前,該第二序列之存取單位中之該下一個可解碼存取單位是否可被封裝;及基於決定在該下一個可解碼存取單位的該解碼時間及該傳輸時間中之至少一者之前該下一個可解碼存取單位無法被封裝,跳掉下一個可解碼存取單位的封裝。
TW101124233A 2011-07-05 2012-07-05 用於視訊編碼及解碼之方法及裝置 TW201304551A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US201161504382P 2011-07-05 2011-07-05

Publications (1)

Publication Number Publication Date
TW201304551A true TW201304551A (zh) 2013-01-16

Family

ID=47436580

Family Applications (1)

Application Number Title Priority Date Filing Date
TW101124233A TW201304551A (zh) 2011-07-05 2012-07-05 用於視訊編碼及解碼之方法及裝置

Country Status (5)

Country Link
US (1) US20130170561A1 (zh)
EP (1) EP2730087A4 (zh)
CN (1) CN103782601A (zh)
TW (1) TW201304551A (zh)
WO (1) WO2013004911A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105612753A (zh) * 2013-10-08 2016-05-25 高通股份有限公司 媒体流传输期间在适配集合间的切换
TWI610560B (zh) * 2016-05-06 2018-01-01 晨星半導體股份有限公司 控制位元流解碼的方法及相關之位元流解碼電路

Families Citing this family (79)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7515710B2 (en) 2006-03-14 2009-04-07 Divx, Inc. Federated digital rights management scheme including trusted systems
CN105072454B (zh) 2009-01-07 2019-04-19 索尼克Ip股份有限公司 针对在线内容的媒体指南的特定化、集中式、自动化创建
EP2507995A4 (en) 2009-12-04 2014-07-09 Sonic Ip Inc SYSTEMS AND METHODS FOR TRANSPORTING ELEMENTARY BIT TRAIN CRYPTOGRAPHIC MATERIAL
US9247312B2 (en) 2011-01-05 2016-01-26 Sonic Ip, Inc. Systems and methods for encoding source media in matroska container files for adaptive bitrate streaming using hypertext transfer protocol
US9590814B2 (en) * 2011-08-01 2017-03-07 Qualcomm Incorporated Method and apparatus for transport of dynamic adaptive streaming over HTTP (DASH) initialization segment description fragments as user service description fragments
US9467708B2 (en) 2011-08-30 2016-10-11 Sonic Ip, Inc. Selection of resolutions for seamless resolution switching of multimedia content
US8909922B2 (en) 2011-09-01 2014-12-09 Sonic Ip, Inc. Systems and methods for playing back alternative streams of protected content protected using common cryptographic information
US8964977B2 (en) 2011-09-01 2015-02-24 Sonic Ip, Inc. Systems and methods for saving encoded media streamed using adaptive bitrate streaming
US9264717B2 (en) * 2011-10-31 2016-02-16 Qualcomm Incorporated Random access with advanced decoded picture buffer (DPB) management in video coding
US20150003536A1 (en) * 2012-02-08 2015-01-01 Thomson Licensing Method and apparatus for using an ultra-low delay mode of a hypothetical reference decoder
WO2013146571A1 (ja) 2012-03-28 2013-10-03 日本放送協会 符号化装置、復号装置及びこれらのプログラム
US9276989B2 (en) * 2012-03-30 2016-03-01 Adobe Systems Incorporated Buffering in HTTP streaming client
EP3611923B1 (en) 2012-04-16 2021-06-02 Telefonaktiebolaget LM Ericsson (publ) Method for processing video with temporal layers
US8788512B2 (en) * 2012-05-23 2014-07-22 International Business Machines Corporation Generating data feed specific parser circuits
US9571827B2 (en) 2012-06-08 2017-02-14 Apple Inc. Techniques for adaptive video streaming
HRP20230430T1 (hr) * 2012-06-25 2023-07-07 Huawei Technologies Co., Ltd. Postupni pristup vremenskom sloju slika u videokompresiji
US20140002598A1 (en) * 2012-06-29 2014-01-02 Electronics And Telecommunications Research Institute Transport system and client system for hybrid 3d content service
US20140003520A1 (en) * 2012-07-02 2014-01-02 Cisco Technology, Inc. Differentiating Decodable and Non-Decodable Pictures After RAP Pictures
CN108235034B (zh) * 2012-07-03 2020-10-16 三星电子株式会社 视频编码方法和设备以及视频解码方法和设备
JP5885604B2 (ja) * 2012-07-06 2016-03-15 株式会社Nttドコモ 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法及び動画像予測復号プログラム
US11284133B2 (en) * 2012-07-10 2022-03-22 Avago Technologies International Sales Pte. Limited Real-time video coding system of multiple temporally scaled video and of multiple profile and standards based on shared video coding information
US9804668B2 (en) * 2012-07-18 2017-10-31 Verimatrix, Inc. Systems and methods for rapid content switching to provide a linear TV experience using streaming content distribution
WO2014015110A1 (en) 2012-07-18 2014-01-23 Verimatrix, Inc. Systems and methods for rapid content switching to provide a linear tv experience using streaming content distribution
US9654802B2 (en) 2012-09-24 2017-05-16 Qualcomm Incorporated Sequence level flag for sub-picture level coded picture buffer parameters
US10021394B2 (en) 2012-09-24 2018-07-10 Qualcomm Incorporated Hypothetical reference decoder parameters in video coding
JP6094126B2 (ja) 2012-10-01 2017-03-15 富士通株式会社 動画像復号装置
US20140098868A1 (en) 2012-10-04 2014-04-10 Qualcomm Incorporated File format for video data
US9843845B2 (en) 2012-11-28 2017-12-12 Sinclair Broadcast Group, Inc. Terrestrial broadcast market exchange network platform and broadcast augmentation channels for hybrid broadcasting in the internet age
CN107770545B (zh) * 2012-12-10 2020-04-24 Lg 电子株式会社 解码图像的方法和使用其的装置
US9374585B2 (en) * 2012-12-19 2016-06-21 Qualcomm Incorporated Low-delay buffering model in video coding
US9191457B2 (en) 2012-12-31 2015-11-17 Sonic Ip, Inc. Systems, methods, and media for controlling delivery of content
US9313510B2 (en) 2012-12-31 2016-04-12 Sonic Ip, Inc. Use of objective quality measures of streamed content to reduce streaming bandwidth
US9647818B2 (en) 2013-01-03 2017-05-09 Intel IP Corporation Apparatus and method for single-tone device discovery in wireless communication networks
US9402076B2 (en) 2013-01-07 2016-07-26 Qualcomm Incorporated Video buffering operations for random access in video coding
US9571847B2 (en) 2013-01-07 2017-02-14 Qualcomm Incorporated Gradual decoding refresh with temporal scalability support in video coding
CN105075273B (zh) 2013-02-27 2019-03-26 苹果公司 自适应流式传输技术
US9906785B2 (en) 2013-03-15 2018-02-27 Sonic Ip, Inc. Systems, methods, and media for transcoding video data according to encoding parameters indicated by received metadata
WO2014158264A1 (en) * 2013-03-29 2014-10-02 Intel IP Corporation Quality-aware rate adaptation techniques for dash streaming
US9602822B2 (en) * 2013-04-17 2017-03-21 Qualcomm Incorporated Indication of cross-layer picture type alignment in multi-layer video coding
US9509758B2 (en) * 2013-05-17 2016-11-29 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Relevant commentary for media content
US9094737B2 (en) 2013-05-30 2015-07-28 Sonic Ip, Inc. Network video streaming with trick play based on separate trick play files
WO2014196198A1 (ja) * 2013-06-05 2014-12-11 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 画像符号化方法、画像復号方法、画像符号化装置及び画像復号装置
CN105340281B (zh) 2013-07-05 2019-06-28 索尼公司 发送装置、发送方法、接收装置和接收方法
WO2015009693A1 (en) 2013-07-15 2015-01-22 Sony Corporation Layer based hrd buffer management for scalable hevc
JP5947269B2 (ja) * 2013-09-24 2016-07-06 ソニー株式会社 符号化装置、符号化方法、送信装置および受信装置
WO2015053157A1 (ja) * 2013-10-11 2015-04-16 ソニー株式会社 送信装置、送信方法および受信装置
EP3989585A1 (en) * 2013-10-11 2022-04-27 VID SCALE, Inc. High level syntax for hevc extensions
KR102064792B1 (ko) * 2013-12-17 2020-01-10 한국전자통신연구원 Http 기반의 멀티미디어 스트리밍 서비스를 위한 네트워크 대역폭 적응적 콘텐츠 생성 방법 및 시스템
CN106105241B (zh) * 2014-03-18 2019-06-14 Lg 电子株式会社 发送和接收用于提供hevc流特技播放服务的广播信号的方法和设备
US9866878B2 (en) * 2014-04-05 2018-01-09 Sonic Ip, Inc. Systems and methods for encoding and playing back video at different frame rates using enhancement layers
JP6483028B2 (ja) * 2014-05-23 2019-03-13 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 画像符号化方法及び画像符号化装置
US10063867B2 (en) * 2014-06-18 2018-08-28 Qualcomm Incorporated Signaling HRD parameters for bitstream partitions
GB2527786B (en) * 2014-07-01 2016-10-26 Canon Kk Method, device, and computer program for encapsulating HEVC layered media data
US9787751B2 (en) 2014-08-06 2017-10-10 At&T Intellectual Property I, L.P. Method and apparatus for delivering media content utilizing segment and packaging information
BR112017005325A2 (pt) * 2014-09-26 2017-12-12 Sony Corp dispositivo e método para processamento de informação.
US10893266B2 (en) * 2014-10-07 2021-01-12 Disney Enterprises, Inc. Method and system for optimizing bitrate selection
JP6776229B2 (ja) * 2014-10-16 2020-10-28 サムスン エレクトロニクス カンパニー リミテッド ビデオデータ処理方法及び装置並びにビデオデータ生成方法及び装置
EP4020983A1 (en) * 2014-12-31 2022-06-29 Nokia Technologies Oy An apparatus, a method and a computer program for video coding and decoding
CN104581229B (zh) * 2015-01-16 2018-08-03 京东方科技集团股份有限公司 一种流媒体数据传输装置、方法和系统
US10270823B2 (en) * 2015-02-10 2019-04-23 Qualcomm Incorporated Low latency video streaming
US9928297B2 (en) * 2015-02-11 2018-03-27 Qualcomm Incorporated Sample grouping signaling in file formats
GB2538997A (en) * 2015-06-03 2016-12-07 Nokia Technologies Oy A method, an apparatus, a computer program for video coding
WO2017177010A1 (en) 2016-04-07 2017-10-12 ONE Media, LLC Next generation terrestrial broadcasting platform aligned internet and towards emerging 5g network architectures
CN109076256A (zh) * 2016-04-12 2018-12-21 索尼公司 发送设备、发送方法、接收设备和接收方法
US10568009B2 (en) * 2016-07-14 2020-02-18 Viasat, Inc. Variable playback rate of streaming content for uninterrupted handover in a communication system
CN107634930B (zh) * 2016-07-18 2020-04-03 华为技术有限公司 一种媒体数据的获取方法和装置
US10484701B1 (en) * 2016-11-08 2019-11-19 Amazon Technologies, Inc. Rendition switch indicator
US10412441B2 (en) * 2016-12-06 2019-09-10 Rgb Spectrum Systems, methods, and devices for high-bandwidth digital content synchronization
GB2560921B (en) 2017-03-27 2020-04-08 Canon Kk Method and apparatus for encoding media data comprising generated content
CN107483949A (zh) * 2017-07-26 2017-12-15 千目聚云数码科技(上海)有限公司 增加svac svc实用性的方法及系统
US11183220B2 (en) 2018-10-03 2021-11-23 Mediatek Singapore Pte. Ltd. Methods and apparatus for temporal track derivations
CN111131874B (zh) * 2018-11-01 2021-03-16 珠海格力电器股份有限公司 一种解决h.265码流随机接入点播放卡顿的方法、设备及计算机存储介质
US11205456B2 (en) * 2019-01-09 2021-12-21 Mediatek Singapore Pte. Ltd. Methods and apparatus for using edit operations to perform temporal track derivations
US11561997B2 (en) * 2019-03-13 2023-01-24 Oracle International Corporation Methods, systems, and computer readable media for data translation using a representational state transfer (REST) application programming interface (API)
KR102165837B1 (ko) * 2019-04-03 2020-10-14 네이버웹툰컴퍼니 주식회사 효과적인 적응형 비트레이트 스트리밍을 위한 방법 및 시스템
CN113796085A (zh) * 2019-05-06 2021-12-14 华为技术有限公司 用于逐步解码刷新的假想参考解码器
CA3152345A1 (en) * 2019-09-24 2021-04-01 Ye-Kui Wang Scalable nesting sei message management
CN114846805A (zh) * 2019-12-26 2022-08-02 字节跳动有限公司 视频编解码中的信令通知编解码图片缓冲区级别
KR20230015373A (ko) * 2020-05-22 2023-01-31 바이트댄스 아이엔씨 비디오 비트스트림들에서 코딩된 픽처 버퍼 정보의 시그널링

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5559999A (en) * 1994-09-09 1996-09-24 Lsi Logic Corporation MPEG decoding system including tag list for associating presentation time stamps with encoded data units
US5905768A (en) * 1994-12-13 1999-05-18 Lsi Logic Corporation MPEG audio synchronization system using subframe skip and repeat
KR100301826B1 (ko) * 1997-12-29 2001-10-27 구자홍 비디오디코더
FR2782437B1 (fr) * 1998-08-14 2000-10-13 Thomson Multimedia Sa Procede de commutation de flux mpeg
US6629318B1 (en) * 1998-11-18 2003-09-30 Koninklijke Philips Electronics N.V. Decoder buffer for streaming video receiver and method of operation
US6678332B1 (en) * 2000-01-04 2004-01-13 Emc Corporation Seamless splicing of encoded MPEG video and audio
US20060251167A1 (en) * 2002-12-20 2006-11-09 Koninkijkle Phillips Electronics N.V. Multi-track hinting for receiver-driven streaming system
US8582659B2 (en) * 2003-09-07 2013-11-12 Microsoft Corporation Determining a decoding time stamp from buffer fullness
JP4950206B2 (ja) * 2005-10-11 2012-06-13 ノキア コーポレイション 効率的なスケーラブルストリーム適応のためのシステム及び方法
US8170116B2 (en) * 2006-03-27 2012-05-01 Nokia Corporation Reference picture marking in scalable video encoding and decoding
US8699583B2 (en) * 2006-07-11 2014-04-15 Nokia Corporation Scalable video coding and decoding
KR100787314B1 (ko) * 2007-02-22 2007-12-21 광주과학기술원 미디어내 동기화를 위한 적응형 미디어 재생 방법 및 장치
EP2392138A4 (en) * 2009-01-28 2012-08-29 Nokia Corp METHOD AND APPARATUS FOR VIDEO ENCODING AND DECODING

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105612753A (zh) * 2013-10-08 2016-05-25 高通股份有限公司 媒体流传输期间在适配集合间的切换
TWI610560B (zh) * 2016-05-06 2018-01-01 晨星半導體股份有限公司 控制位元流解碼的方法及相關之位元流解碼電路

Also Published As

Publication number Publication date
EP2730087A1 (en) 2014-05-14
US20130170561A1 (en) 2013-07-04
CN103782601A (zh) 2014-05-07
EP2730087A4 (en) 2015-03-25
WO2013004911A1 (en) 2013-01-10

Similar Documents

Publication Publication Date Title
TW201304551A (zh) 用於視訊編碼及解碼之方法及裝置
US9992555B2 (en) Signaling random access points for streaming video data
JP5770345B2 (ja) ビデオデータをストリーミングするためのビデオ切替え
US9185439B2 (en) Signaling data for multiplexing video components
US9769230B2 (en) Media streaming apparatus
CN108141455B (zh) 用于媒体数据的流式发射的期限信令
TWI473016B (zh) 用以處理多視圖視訊位元串流之方法與裝置及電腦可讀媒體
KR101421390B1 (ko) 트릭 모드 비디오 표현물에 대한 비디오 샘플의 시그널링
WO2013036450A1 (en) Network streaming of coded video data
CN115943631A (zh) 流式传输包括具有切换集的可寻址资源索引轨道的媒体数据
TW201743614A (zh) 樣本條目及隨機存取
KR20130053444A (ko) 비디오 구성요소들을 멀티플렉싱하기 위한 데이터의 시그널링