TW201711471A - 至高動態範圍及/或廣色域視訊資料之固定轉移功能之內容自適應應用 - Google Patents
至高動態範圍及/或廣色域視訊資料之固定轉移功能之內容自適應應用 Download PDFInfo
- Publication number
- TW201711471A TW201711471A TW105118290A TW105118290A TW201711471A TW 201711471 A TW201711471 A TW 201711471A TW 105118290 A TW105118290 A TW 105118290A TW 105118290 A TW105118290 A TW 105118290A TW 201711471 A TW201711471 A TW 201711471A
- Authority
- TW
- Taiwan
- Prior art keywords
- codewords
- video
- post
- color values
- processing
- Prior art date
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/1887—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a variable length codeword
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/117—Filters, e.g. for pre-processing or post-processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
- H04N19/615—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding using motion compensated temporal filtering [MCTF]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/98—Adaptive-dynamic-range coding [ADRC]
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Processing Of Color Television Signals (AREA)
- Image Processing (AREA)
Abstract
本發明係關於處理視訊資料,包括處理視訊資料以符合一高動態範圍(HDR)/寬色域(WCG)色彩容器。該等技術在一編碼側在應用一靜態轉移函數之前對應用對色彩值之預處理及/或對來自該靜態轉移函數之該應用的該輸出應用後處理。藉由應用預處理,該等實例可產生色彩值,當藉由應用該靜態轉移函數將該等色彩值壓緊至一不同的動態範圍中時該等色彩值線性化輸出碼字。藉由應用後處理,該等實例可提高信號對量化雜訊比。該等實例可在解碼側上應用編碼側上的該等操作的反向操作以重新建構該等色彩值。
Description
本申請案主張2015年6月8日申請的美國臨時申請案第62/172,713號以及2015年6月24日申請的美國臨時申請案第62/184,216號之權益,每一美國臨時申請案之全部內容以引用之方式併入本文中。
本發明係關於視訊寫碼。
數位視訊能力可併入至廣泛範圍之裝置中,包括數位電視、數位直播系統、無線廣播系統、個人數位助理(PDA)、膝上型或桌上型電腦、平板電腦、電子書閱讀器、數位攝影機、數位記錄裝置、數位媒體播放器、視訊遊戲裝置、視訊遊戲控制台、蜂巢式或衛星無線電電話、所謂的「智慧型電話」、視訊電話會議裝置、視訊串流裝置及其類似者。數位視訊裝置實施視訊寫碼技術,諸如由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第10部分進階視訊寫碼(AVC)、ITU-T H.265、高效率視訊寫碼(HEVC)所界定的標準及此等標準之擴展中所描述的彼等技術。視訊裝置可藉由實施此類視訊寫碼技術來更高效地發射、接收、編碼、解碼及/或儲存數位視訊資訊。
視訊寫碼技術包括空間(圖像內)預測及/或時間(圖像間)預測以減少或移除視訊序列中固有之冗餘。對於基於區塊之視訊寫碼,可將視訊圖塊(例如,視訊圖框或視訊圖框之一部分)分割成視訊區塊(其亦可被稱作樹型區塊)、寫碼單元(CU)及/或寫碼節點。圖像之經框內寫碼(I)之圖塊中的視訊區塊係使用關於同一圖像中之鄰近區塊中之參考樣本的空間預測來編碼。圖像之框間寫碼(P或B)圖塊中之視訊區塊可使用關於同一圖像中之鄰近區塊中的參考樣本的空間預測或關於其他參考圖像中之參考樣本的時間預測。圖像可被稱作圖框,且參考圖像可被稱作參考圖框。
空間或時間預測產生待寫碼之區塊之預測性區塊。殘餘資料表示待寫碼之原始區塊與預測性區塊之間的像素差。根據指向形成預測性區塊之參考樣本之區塊的運動向量及指示經寫碼區塊與預測性區塊之間的差異之殘餘資料來編碼經框間寫碼區塊。經框內寫碼區塊係根據框內寫碼模式與殘餘資料來編碼。為了進行進一步壓縮,可將殘餘資料自像素域變換至變換域,從而導致殘餘變換係數,可接著量化該等殘餘變換係數。可掃描最初配置成二維陣列之經量化變換係數,以便產生變換係數之一維向量,且可應用熵寫碼以達成甚至較多壓縮。
本發明係關於處理視訊資料,包括處理視訊資料以符合高動態範圍(HDR)/寬色域(WCG)色彩容器。如在下文中將更詳細地解釋,本發明之技術在編碼側上在應用靜態轉移函數之前應用對色彩值之預處理及/或對來自靜態轉移函數之應用的輸出應用後處理。藉由應用預處理,該等實例可產生色彩值,當藉由應用該靜態轉移函數將該等色彩值壓緊至一不同的動態範圍中時該等色彩值線性化輸出碼字。藉由應用後處理,該等實例可在解碼側上應用編碼側上的該等操作的反向操作以重新建構該等色彩值。
在一個實例中,本發明描述視訊處理之方法,該方法包含:接收表示視訊資料之經壓緊之色彩值的第一複數個碼字,經壓緊之色彩值表示第一動態範圍內之色彩;使用對視訊資料非自適應之反向靜態轉移函數基於第一複數個碼字解壓(uncompact)第二複數個碼字以產生解壓之色彩值,解壓之色彩值表示第二、不同動態範圍內之色彩,其中第二複數個碼字為來自經反向後處理之第一複數個碼字或第一複數個碼字的碼字中之一者;反向後處理第一複數個碼字以產生第二複數個碼字或反向預處理解壓之色彩值中之至少一者;以及輸出解壓之色彩值或經反向預處理的解壓之色彩值。
在一個實例中,本發明描述視訊處理之方法,該方法包含:接收表示第一動態範圍內之色彩的視訊資料之複數個色彩值;使用對經壓緊之視訊資料非自適應的靜態轉移函數壓緊色彩值以產生表示經壓緊之色彩值之複數個碼字,經壓緊之色彩值表示第二、不同動態範圍內之色彩;在壓緊之前預處理色彩值以產生被壓緊之色彩值或後處理由壓緊色彩值產生之碼字中之至少一者;以及基於經壓緊之色彩值或經後處理的經壓緊之色彩值中之一者來輸出色彩值。
在一個實例中,本發明描述用於視訊處理之裝置,該裝置包含經組態以儲存視訊資料之視訊資料記憶體以及包含固定功能或可程式化電路中之至少一者的視訊後處理器。視訊後處理器經組態以:自視訊資料記憶體接收表示視訊資料之經壓緊之色彩值的第一複數個碼字,經壓緊之色彩值表示第一動態範圍內之色彩;使用對視訊資料非自適應之反向靜態轉移函數基於第一複數個碼字解壓第二複數個碼字以產生解壓之色彩值,解壓之色彩值表示第二、不同動態範圍內之色彩,其中第二複數個碼字為來自經反向後處理之第一複數個碼字或第一複數個碼字的碼字中之一者;反向後處理第一複數個碼字以產生第二複數個碼字或反向預處理解壓之色彩值中之至少一者;以及輸出解
壓之色彩值或經反向預處理的解壓之色彩值。
在一個實例中,本發明描述用於視訊處理之裝置,該裝置包含經組態以儲存視訊資料之視訊資料記憶體以及包含固定功能或可程式化電路中之至少一者的視訊預處理器。該視訊預處理器經組態以:自視訊資料記憶體接收表示第一動態範圍內之色彩的視訊資料之複數個色彩值;使用對經壓緊之視訊資料非自適應的靜態轉移函數壓緊色彩值以產生表示經壓緊之色彩值的複數個碼字,經壓緊之色彩值表示第二、不同動態範圍內之色彩;在壓緊之前預處理色彩值以產生被壓緊之色彩值或後處理由壓緊色彩值產生之碼字中之至少一者;以及基於經壓緊之色彩值或經後處理之經壓緊之色彩值中之一者來輸出色彩值。
在一個實例中,本發明描述儲存指令之電腦可讀儲存媒體,當執行該等指令時使得用於視訊處理之裝置之一或多個處理器:接收表示視訊資料之經壓緊之色彩值的第一複數個碼字,經壓緊之色彩值表示第一動態範圍內之色彩;使用對視訊資料非自適應的反向靜態轉移函數基於第一複數個碼字解壓第二複數個碼字以產生解壓之色彩值,解壓之色彩值表示第二、不同動態範圍內之色彩,其中第二複數個碼字為來自經反向後處理之第一複數個碼字或第一複數個碼字的碼字中之一者;反向後處理第一複數個碼字以產生第二複數個碼字或反向預處理解壓之色彩值中之至少一者;以及輸出解壓之色彩值或經反向預處理的解壓之色彩值。
在一個實例中,本發明描述用於視訊處理之裝置,該裝置包含:用於接收表示視訊資料之經壓緊之色彩值的第一複數個碼字之構件,經壓緊之色彩值表示第一動態範圍內之色彩;用於使用對視訊資料非自適應的反向靜態轉移函數基於第一複數個碼字解壓第二複數個碼字以產生解壓之色彩值之構件,解壓之色彩值表示第二、不同動態
範圍內之色彩,其中第二複數個碼字為來自經反向後處理之第一複數個碼字或第一複數個碼字的碼字中之一者;用於反向後處理第一複數個碼字以產生第二複數個碼字之構件或用於反向預處理解壓之色彩值之構件中之至少一者;以及用於輸出解壓之色彩值或經反向預處理的解壓之色彩值之構件。
在附圖及以下描述中闡述一或多個實例之細節。其他特徵、目標及優點根據描述、圖式及申請專利範圍將係顯而易見的。
10‧‧‧視訊編碼及解碼系統/系統
12‧‧‧源裝置/裝置
14‧‧‧目的地裝置/裝置
16‧‧‧電腦可讀媒體
18‧‧‧視訊源
19‧‧‧視訊預處理器
20‧‧‧視訊編碼器
21‧‧‧視訊編碼單元
22‧‧‧輸出介面
28‧‧‧輸入介面
29‧‧‧視訊解碼單元
30‧‧‧視訊解碼器
31‧‧‧視訊後處理器
32‧‧‧顯示裝置
110‧‧‧線性RGB資料
112‧‧‧TF單元
112'‧‧‧自適應形狀TF單元/自適應TF單元
114‧‧‧色彩轉換單元
116‧‧‧量化單元
118‧‧‧HDR資料
120‧‧‧HDR資料
122‧‧‧反量化單元
124‧‧‧反向色彩轉換單元
126‧‧‧反向非線性轉移函數單元/反向TF單元
128‧‧‧線性RGB資料
132‧‧‧視訊資料記憶體
134‧‧‧預處理單元
138‧‧‧後處理單元
140‧‧‧視訊資料記憶體
142‧‧‧反向預處理單元
144‧‧‧反向後處理單元
150‧‧‧後處理單元
152‧‧‧反向後處理單元
200~208‧‧‧區塊
300~308‧‧‧區塊
s‧‧‧色彩值
s'‧‧‧色彩值/信號值
s1‧‧‧輸出信號/色彩值/信號值
s1'‧‧‧輸出/線性色彩值
S1‧‧‧輸出碼字/碼字
S1'‧‧‧碼字
S2‧‧‧輸出值/碼字
S2'‧‧‧碼字
圖1為說明經組態以實施本發明之技術的實例視訊編碼及解碼系統的方塊圖。
圖2為說明高動態範圍(HDR)資料之概念的圖式。
圖3為比較高清晰度電視(HDTV)(BT.709)與超高清晰度電視(UHDTV)(BT.2020)之視訊信號之色域的概念圖。
圖4為展示HDR/WCG表示轉換之概念圖。
圖5為展示HDR/WCG反向轉換之概念圖。
圖6為展示實例轉移函數之概念圖。
圖7為展示PQ TF(ST2084 EOTF)的輸出對比輸入之可視化的概念圖。
圖8為展示具備自適應形狀轉移函數(TF)之內容自適應HDR處理管線(編碼器側)的概念圖。
圖9為展示具備固定TF之內容自適應HDR處理管線(編碼器側)之概念圖。
圖10為展示具備固定TF之內容自適應HDR處理管線(解碼器側)之概念圖。
圖11為展示具備靜態TF之內容自適應HDR管線(編碼器側)之概念圖。
圖12為展示具備靜態TF之內容自適應HDR管線(解碼器側)之概念圖。
圖13A展示出於可視化目的的與PQ TF(ST 2084)重疊之HDR信號之線性光信號(紅色分量)之直方圖之實例。
圖13B展示由將PQ TF(ST 2084)應用於線性光信號(紅色分量)產生之非線性信號之直方圖之實例。
圖14為由PQ TF以及根據本發明中所描述之技術的處理所產生之非線性信號之直方圖輸出。
圖15A為說明在預處理之後PQ TF對信號統計資料之影響的圖。
圖15B為說明由PQTF產生之輸出非線性信號之直方圖的圖。
圖16A為說明標準化非線性信號S之直方圖的圖。
圖16B為說明在後處理之後的標準化非線性信號S2之直方圖的圖。
圖17A為說明出於如ST2084中所界定之HDR之目的的非線性PQ TF的圖。
圖17B為說明在Scale2=1以及Offset2=0之情況下經模型化之藉由本發明中所描述之技術的線性轉移函數y=x的圖。
圖17C為說明在Scalse2=1.5以及Offset=-0.25之情況下經模型化之藉由本發明中所描述之技術的線性轉移函數的圖。
圖18為說明在應用轉移函數之後且在本發明中所描述之後處理技術之前執行色彩轉換的實例的概念圖。
圖19為說明在本發明中所描述之反向後處理技術之後且在應用反向轉移函數之前執行反向色彩轉換的實例的概念圖。
圖20A為說明將S2之直方圖截割至某一範圍的後處理的圖。
圖20B為說明將S2之直方圖截割至某一範圍的後處理的另一圖。
圖20C為說明將S2之直方圖截割至某一範圍的後處理的另一圖。
圖21A以及圖21B為說明在具有尾部處置的本發明中所描述之後處理技術之後的碼字之直方圖的圖。
圖22為說明具備靜態TF之內容自適應HDR管線(編碼器側)之另一實例的概念圖。
圖23為說明具備靜態TF之內容自適應HDR管線(解碼器側)之另一實例的概念圖。
圖24為說明具有兩個經保留的經寫碼處置色彩值的直方圖的圖。
圖25A以及圖25B為說明由本發明中所描述之技術實施之參數自適應函數的圖。
圖26A、圖26B以及圖26C為說明在用本發明中所描述之技術實施之逐段線性轉移函數應用至輸入信號之情況下的後處理以及此後處理對輸出信號之直方圖之影響的圖。
圖27說明作為實例的混合對數伽瑪轉移函數以及潛在目標範圍。
圖28說明環繞拐點的拋物線之斜率為可調整的轉移函數。
圖29為說明在內容自適應高動態範圍(HDR)系統中之視訊處理之實例方法的流程圖。
圖30為說明在內容自適應高動態範圍(HDR)系統中之視訊處理之另一實例方法的流程圖。
本發明係關於寫碼具有高動態範圍(HDR)及寬色域(WCG)表示之視訊信號之領域。更特定而言,本發明之技術包括應用於某些色彩空間中之視訊資料以實現HDR及WCG視訊資料之更高效壓縮的傳訊及操作。所提出之技術可改良用於寫碼HDR及WCG視訊資料之混合式視訊寫碼系統(例如,基於HEVC之視訊寫碼器)的壓縮效率。
包括混合式視訊寫碼標準的視訊寫碼標準包括ITU-T H.261、ISO/IEC MPEG-1 Visual、ITU-T H.262或ISO/IEC MPEG-2 Visual、ITU-T H.263、ISO/IEC MPEG-4 Visual及ITU-T H.264(亦被稱作ISO/IEC MPEG-4 AVC),包括其可調式視訊寫碼(SVC)及多視圖視訊寫碼(MVC)擴展。新視訊寫碼標準之設計(即,HEVC)已由ITU-T視訊寫碼專家組(VCEG)及ISO/IEC動畫專家組(MPEG)的關於視訊寫碼之聯合合作小組(JCT-VC)定案。Bross等人的被稱作HEVC工作草案10(WD10)之HEVC草案規範「High efficiency video coding(HEVC)text specification draft 10(for FDIS & Last Call)」(ITU-T SG16 WP3與ISO/IEC JTC1/SC29/WG11的關於視訊寫碼之聯合合作小組(JCT-VC),第12次會議:瑞士日內瓦,2013年1月14日至23日,JCTVC-L1003v34)可自http://phenix.int-evry.fr/jct/doc_end_user/documents/12_Geneva/wg11/JCTVC-L1003-v34.zip獲得。定案之HEVC標準被稱作HEVC版本1。
Wang等人之缺陷報告「High efficiency video coding(HEVC)Defect Report」(ITU-T SG16 WP3與ISO/IEC JTC1/SC29/WG11的關於視訊寫碼之聯合合作小組(JCT-VC),第14次會議:奧地利維也納,2013年7月25日至8月2日,JCTVC-N1003v1)可自http://phenix.int-evry.fr/jct/doc_end_user/documents/14_Vienna/wg11/JCTVC-N1003-v1.zip獲得。經定案之HEVC標準文獻在2013年4月經公佈為ITU-T H.265,系列H:視聽及多媒體系統,視聽服務基礎架構-移動視訊之寫碼,高效視訊寫碼(國際電信聯盟(ITU)之電信標準化部門),且在2014年10月公佈另一版本。
圖1為說明可利用本發明之技術之實例視訊編碼及解碼系統10的方塊圖。如圖1中所展示,系統10包括提供稍後將由目的地裝置14解碼之經編碼視訊資料的源裝置12。詳言之,源裝置12經由電腦可讀媒體16將視訊資料提供至目的地裝置14。源裝置12及目的地裝置14可包
含廣泛範圍之裝置中之任一者,包括桌上型電腦、筆記型(亦即,膝上型)電腦、平板電腦、機上盒、電話手持機(諸如,所謂的「智慧型」電話)、所謂的「智慧型」平板電腦、電視機、攝影機、顯示裝置、數位媒體播放器、視訊遊戲控制台、視訊串流裝置或其類似者。在一些狀況下,源裝置12及目的地裝置14可能經裝備以用於無線通信。
目的地裝置14可經由電腦可讀媒體16接收待解碼之經編碼視訊資料。電腦可讀媒體16可包含能夠將經編碼視訊資料自源裝置12移動至目的地裝置14的任一類型之媒體或裝置。在一個實例中,電腦可讀媒體16可包含通信媒體以使源裝置12能夠即時地將經編碼視訊資料直接傳輸至目的地裝置14。可根據通信標準(諸如,無線通信協定)調變經編碼視訊資料,且將其傳輸至目的地裝置14。通信媒體可包含任何無線或有線通信媒體,諸如,射頻(RF)頻譜或一或多個實體傳輸線。通信媒體可形成基於封包之網路(諸如區域網路、廣域網路或全球網路,諸如網際網路)的一部分。通信媒體可包括路由器、交換器、基地台或任何其他可適用於促進自源裝置12至目的地裝置14的通信之設備。
在一些實例中,經編碼資料可自輸出介面22輸出至儲存裝置。類似地,可藉由輸入介面自儲存裝置存取經編碼資料。儲存裝置可包括各種分散式或本端存取之資料儲存媒體中之任一者,諸如,硬碟機、藍光(Blu-ray)光碟、DVD、CD-ROM、快閃記憶體、揮發性或非揮發性記憶體或用於儲存經編碼視訊資料之任何其他合適數位儲存媒體。在另一實例中,儲存裝置可對應於檔案伺服器或可儲存由源裝置12產生之經編碼視訊的另一中間儲存裝置。目的地裝置14可經由串流或下載自儲存裝置存取經儲存之視訊資料。檔案伺服器可為能夠儲存經編碼視訊資料且將彼經編碼視訊資料傳輸至目的地裝置14的任何類
型之伺服器。實例檔案伺服器包括網頁伺服器(例如,用於網站)、FTP伺服器、網路附接儲存(NAS)裝置或本端磁碟機。目的地裝置14可經由任何標準資料連接(包括網際網路連接)而存取經編碼之視訊資料。此資料連接可包括無線頻道(例如,Wi-Fi連接)、有線連接(例如,DSL、電纜數據機等)或兩者之適合於存取儲存於檔案伺服器上之經編碼視訊資料的組合。自儲存裝置的經編碼視訊資料之傳輸可為串流傳輸、下載傳輸或其組合。
本發明之技術不必限於無線應用或設定。該等技術可適用於支援各種多媒體應用中之任一者的視訊寫碼,該等應用諸如,空中電視廣播、有線電視傳輸、衛星電視傳輸、網際網路串流視訊傳輸(諸如,經由HTTP之動態自適應串流(DASH))、經編碼至資料儲存媒體上之數位視訊、儲存在資料儲存媒體上的數位視訊之解碼或其他應用。在一些實例中,系統10可經組態以支援單向或雙向視訊傳輸以支援應用(諸如,視訊串流、視訊播放、視訊廣播及/或視訊電話)。
在圖1之實例中,源裝置12包括視訊源18、視訊編碼單元21(其包括視訊預處理器19及視頻編碼器20)以及輸出介面22。目的地裝置14包括輸入介面28、視訊解碼單元29(其包括視訊解碼器30及視訊後處理器31)以及顯示裝置32。根據本發明,視訊預處理器19及視訊後處理器31可經組態以應用本發明中所描述之實例技術。舉例而言,視訊預處理器19及視訊後處理器31可包括經組態以應用靜態轉移函數之靜態轉移函數單元,亦具有可調適信號特性之預處理及後處理單元。
在其他實例中,源裝置及目的地裝置可包括其他組件或配置。舉例而言,源裝置12可自外部視訊源18(諸如外部攝影機)接收視訊資料。同樣地,目的地裝置14可與外部顯示裝置介接,而非包括整合式顯示裝置。
圖1中所說明之系統10僅為一個實例。用於處理視訊資料之技術
可藉由任何數位視訊編碼及/或解碼裝置來執行。儘管本發明之技術一般由視訊編碼裝置執行,但該等技術亦可由視訊編碼器/解碼器(通常被稱作「CODEC」)執行。為了易於描述,參照在源裝置12及目的地裝置14中之各別一者中預形成本發明中所描述之實例技術的視訊預處理器19及視訊後處理器31來描述本發明。源裝置12及目的地裝置14僅為此類寫碼裝置的實例,其中源裝置12產生經寫碼視訊資料以供傳輸至目的地裝置14。在一些實例中,裝置12、14可以實質上對稱的方式操作,使得裝置12、14中之每一者包括視訊編碼及解碼組件。因此,系統10可支援視訊裝置12、14之間的單向或雙向視訊傳播,以用於(例如)視訊串流、視訊播放、視訊廣播或視訊電話。
源裝置12之視訊源18可包括視訊俘獲裝置,諸如視訊攝影機、含有先前俘獲之視訊的視訊存檔及/或用以自視訊內容提供者接收視訊的視訊饋送介面。作為另一替代,視訊源18可將基於電腦圖形之資料產生為源視訊、或產生實況視訊、存檔視訊及電腦產生之視訊的組合。在一些狀況下,若視訊源18為視訊攝影機,則源裝置12及目的地裝置14可形成所謂的攝影機電話或視訊電話。然而,如上文所提及,本發明所描述之技術一般可適用於視訊寫碼,且可適用於無線及/或有線應用。在每一狀況下,經俘獲、經預俘獲或電腦產生的視訊可由視訊編碼單元21編碼。經編碼視訊資訊可接著由輸出介面22輸出至電腦可讀媒體16上。
電腦可讀媒體16可包括瞬間媒體,諸如,無線廣播或有線網路傳輸,或儲存媒體(亦即,非暫時性儲存媒體),諸如,硬碟、隨身碟、緊密光碟、數位視訊光碟、藍光光碟或其他電腦可讀媒體。在一些實例中,網路伺服器(未展示)可自源裝置12接收經編碼視訊資料,且(例如)經由網路傳輸將經編碼視訊資料提供至目的地裝置14。類似地,媒體產生設施(諸如光碟衝壓設施)之計算裝置可自源裝置12接收
經編碼視訊資料且產生含有經編碼視訊資料之光碟。因此,在各種實例中,可理解電腦可讀媒體16包括各種形式之一或多個電腦可讀媒體。
目的地裝置14之輸入介面28自電腦可讀媒體16接收資訊。電腦可讀媒體16之資訊可包括由視訊編碼單元21之視頻編碼器20界定之語法資訊(其亦由視訊解碼單元29之視訊解碼器30所使用),包括描述區塊及其他經寫碼單元(例如,圖像群組(GOP))之特性及/或處理的語法元素。顯示裝置32將經解碼視訊資料顯示給使用者,且可包含各種顯示裝置中之任一者,諸如,陰極射線管(CRT)、液晶顯示器(LCD)、電漿顯示器、有機發光二極體(OLED)顯示器或另一類型之顯示裝置。
如所說明,視訊預處理器19自視訊源18接收視訊資料。視訊預處理器19可經組態以處理視訊資料以將其轉換成適用於藉由視頻編碼器20編碼的形式。舉例而言,視訊預處理器19可執行動態範圍壓緊(例如,使用非線性轉移函數)、至較緊密或穩固的色彩空間之色彩轉換及/或浮點至整數表示的轉換。視頻編碼器20可對由視訊預處理器19輸出之視訊資料執行視訊編碼。視訊解碼器30可執行視頻編碼器20之反向操作以解碼視訊資料,且視訊後處理器31可執行視訊預處理器19之反向操作以將視訊資料轉換成適用於顯示器的形式。舉例而言,視訊後處理器31可執行整數至浮點轉換、自緊密或穩固色彩空間之色彩轉換及/或動態範圍壓緊之反向操作以產生適用於顯示器的視訊資料。
視訊編碼單元21及視訊解碼單元29各可實施為各種固定功能及可程式化電路中之任一者,諸如一或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯、軟體、硬體、韌體或其任何組合。當該等技術部分以軟體實施
時,裝置可將用於軟體之指令儲存於合適之非暫時性電腦可讀媒體中,且在硬體中使用一或多個處理器執行指令以執行本發明之技術。視訊編碼單元21及視訊解碼單元29中之每一者可包括於一或多個編碼器或解碼器中,編碼器或解碼器中之任一者可整合為各別裝置中的組合式編碼器/解碼器(CODEC)之部分。
儘管視訊預處理器19及視頻編碼器20經說明為視訊編碼單元21內之獨立單元,且視訊後處理器31及視訊解碼器30經說明為視訊解碼單元29內之獨立單元,但本發明中所描述之技術並不限於此。視訊預處理器19及視頻編碼器20可形成為共同裝置(例如,同一積體電路或容納在同一晶片或晶片封裝內)。類似地,視訊後處理器31及視訊解碼器30可形成為共同裝置(例如,同一積體電路或容納在同一晶片或晶片封裝內)。
在一些實例中,視訊編碼器20及視訊解碼器30根據諸如以下各者之視訊壓縮標準操作:ISO/IEC MPEG-4 Visual及ITU-T H.264(亦被稱為ISO/IEC MPEG-4 AVC),包括其可調式視訊寫碼(SVC)擴展、多視圖視訊寫碼(MVC)擴展及基於MVC之三維視訊(3DV)擴展。在一些情況下,遵守基於MVC之3DV的任何位元串流始終含有與MVC設定檔(例如,立體高設定檔)一致之子位元串流。此外,存在持續努力以產生H.264/AVC之3DV寫碼擴展,即基於AVC之3DV。視訊寫碼標準之其他實例包括ITU-T H.261、ISO/IEC MPEG-1 Visual、ITU-T H.262或ISO/IEC MPEG-2 Visual、ITU-T H.263、ISO/IEC MPEG-4 Visual及ITU-T H.264、ISO/IEC Visual。在其他實例中,視訊編碼器20及視訊解碼器30可經組態以根據ITU-T H.265,HEVC標準操作。
在HEVC及其他視訊寫碼標準中,視訊序列通常包括一系列圖像。圖像亦可被稱作「圖框」。圖像可包括表示為SL,SCb及SCr的三個樣本陣列。SL為明度樣本之二維陣列(亦即,區塊)。SCb係Cb色度樣
本之二維陣列。SCr係Cr色度樣本之二維陣列。色度樣本亦可在本文中被稱作「色度」樣本。在其他情況下,圖像可為單色的,且可僅包括明度樣本陣列。
視訊編碼器20可產生一組寫碼樹狀結構單元(CTU)。CTU中之每一者可包含明度樣本之寫碼樹型區塊、色度樣本之兩個對應寫碼樹型區塊及用以寫碼寫碼樹型區塊之樣本的語法結構。在單色圖像或具有三個單獨彩色平面之圖像中,CTU可包含單一寫碼樹型區塊及用於寫碼該寫碼樹型區塊之樣本的語法結構。寫碼樹型區塊可為樣本之N×N區塊。CTU亦可被稱作「樹型區塊」或「最大寫碼單元」(LCU)。HEVC之CTU可廣泛地類似於諸如H.264/AVC之其他視訊寫碼標準的巨集區塊。然而,CTU未必限於特定大小,且可包括一或多個寫碼單元(CU)。圖塊可包括在光柵掃描中連續排序之整數數目個CTU。
本發明可使用術語「視訊單元」或「視訊區塊」以指樣本之一或多個區塊,及用於寫碼樣本之一或多個區塊之樣本的語法結構。視訊單元之實例類型可包括HEVC中之CTU、CU、PU、變換單元(TU),或其他視訊寫碼標準中之巨集區塊、巨集區塊分割區等等。
視訊編碼器20可將CU之寫碼區塊分割為一或多個預測區塊。預測區塊可為應用相同預測之樣本的矩形(亦即,正方形或非正方形)區塊。CU之預測單元(PU)可包含圖像之明度樣本的預測區塊,圖像之色度樣本的兩個對應預測區塊,及用於對預測區塊樣本進行預測的語法結構。在單色圖像或具有三個單獨彩色平面之圖像中,PU可包含單一預測區塊,及用以對預測區塊樣本進行預測之語法結構。視訊編碼器20可針對CU之每一PU的明度、Cb及Cr預測區塊產生預測性明度、Cb及Cr區塊。
視訊編碼器20可使用框內預測或框間預測來產生PU之預測性區
塊。若視訊編碼器20使用框內預測產生PU之預測性區塊,則視訊編碼器20可基於與PU相關聯之圖像之經解碼樣本產生PU之預測性區塊。
在視訊編碼器20產生CU之一或多個PU的預測性明度區塊、預測性Cb區塊及預測性Cr區塊之後,視訊編碼器20可產生CU之明度殘餘區塊。CU之明度殘餘區塊中的每一樣本指示CU之預測性明度區塊中之一者中的明度樣本與CU之原始明度寫碼區塊中的對應樣本之間的差異。另外,視訊編碼器20可產生CU之Cb殘餘區塊。CU之Cb殘餘區塊中的每一樣本可指示CU之預測性Cb區塊中之一者中的Cb樣本與CU之原始Cb寫碼區塊中之對應樣本之間的差異。視訊編碼器20亦可產生CU之Cr殘餘區塊。CU之Cr殘餘區塊中之每一樣本可指示CU之預測性Cr區塊之一者中的Cr樣本與CU之原始Cr寫碼區塊中之對應樣本之間的差異。
此外,視訊編碼器20可使用四分樹分割以將CU之明度、Cb及Cr殘餘區塊分解成一或多個明度、Cb及Cr變換區塊。變換區塊可為應用相同變換的樣本之矩形區塊。CU之變換單元(TU)可包含明度樣本之變換區塊、色度樣本之兩個對應變換區塊及用於對變換區塊樣本進行變換之語法結構。在單色圖像或具有三個單獨彩色平面之圖像中,TU可包含單一變換區塊,及用以對變換區塊樣本進行變換之語法結構。因此,CU之每一TU可與明度變換區塊、Cb變換區塊及Cr變換區塊相關聯。與TU相關聯之明度變換區塊可為CU之明度殘餘區塊之子區塊。Cb變換區塊可為CU之Cb殘餘區塊的子區塊。Cr變換區塊可為CU之Cr殘餘區塊的子區塊。
視訊編碼器20可將一或多個變換應用於TU之明度變換區塊,以產生TU之明度係數區塊。係數區塊可為變換係數之二維陣列。變換係數可為純量。視訊編碼器20可將一或多個變換應用於TU之Cb變換
區塊,以產生TU之Cb係數區塊。視訊編碼器20可將一或多個變換應用於TU之Cr變換區塊以產生TU之Cr係數區塊。
在產生係數區塊(例如,明度係數區塊、Cb係數區塊或Cr係數區塊)之後,視訊編碼器20可量化係數區塊。量化大體上指變換係數經量化以可能減少用以表示變換係數的資料之量從而提供進一步壓縮之過程。此外,視訊編碼器20可反量化變換係數,並將反向變換應用至變換係數,以便重新建構圖像之CU的TU之變換區塊。視訊編碼器20可使用CU之TU的經重新建構之變換區塊及CU之PU的預測性區塊來重新建構CU之寫碼區塊。藉由重新建構圖像之每一CU的寫碼區塊,視訊編碼器20可重新建構圖像。視訊編碼器20可將經重新建構的圖像儲存於經解碼圖像緩衝器(DPB)中。視訊編碼器20可將DPB中之經重新建構圖像用於框間預測及框內預測。
在視訊編碼器20量化係數區塊之後,視訊編碼器20可熵編碼指示經量化變換係數之語法元素。舉例而言,視訊編碼器20可對指示經量化變換係數之語法元素執行上下文自適應二進位算術寫碼(CABAC)。視訊編碼器20可在位元串流中輸出經熵編碼之語法元素。
視訊編碼器20可輸出包括形成經寫碼圖像及相關聯資料之表示的位元序列之位元串流。位元串流可包含網路抽象層(NAL)單元的序列。該等NAL單元中之每一者包括NAL單元標頭且囊封原始位元組序列酬載(RBSP)。NAL單元標頭可包括指示NAL單元類型碼之語法元素。藉由NAL單元之NAL單元標頭所指定的NAL單元類型碼指示NAL單元之類型。RBSP可為囊封於NAL單元內之含有整數數目個位元組的語法結構。在一些情況下,RBSP包括零個位元。
不同類型之NAL單元可囊封不同類型之RBSP。舉例而言,第一類型之NAL單元可囊封圖像參數集(PPS)之RBSP,第二類型之NAL單元可囊封經寫碼圖塊之RBSP,第三類型之NAL單元可囊封補充增強
資訊(SEI)之RBSP等等。PPS為可含有適用於零個或更多個完整經寫碼圖像之語法元素的語法結構。囊封用於視訊寫碼資料之RBSP(相反於用於參數集及SEI訊息之RBSP)的NAL單元可被稱作視訊寫碼層(VCL)NAL單元。囊封經寫碼圖塊之NAL單元在本文中可被稱作經寫碼圖塊NAL單元。用於經寫碼圖塊之RBSP可包括圖塊標頭及圖塊資料。
視訊解碼器30可接收位元串流。另外,視訊解碼器30可剖析位元串流以自位元串流解碼語法元素。視訊解碼器30可至少部分基於自位元串流解碼之語法元素而重新建構視訊資料之圖像。重新建構視訊資料之過程可與由視訊編碼器20執行之過程大體互逆。舉例而言,視訊解碼器30可使用PU之運動向量判定當前CU之PU的預測性區塊。視訊解碼器30可使用PU之一或多個運動向量產生PU之預測性區塊。
另外,視訊解碼器30可反量化與當前CU之TU相關聯的係數區塊。視訊解碼器30可對係數區塊執行反向變換以重新建構與當前CU之TU相關聯的變換區塊。藉由將當前CU之PU的預測性樣本區塊之樣本添加至當前CU之TU的變換區塊之對應樣本,視訊解碼器30可重新建構當前CU之寫碼區塊。藉由重新建構圖像之每一CU的寫碼區塊,視訊解碼器30可重新建構圖像。視訊解碼器30可將經解碼圖像儲存於經解碼圖像緩衝器中,以用於輸出及/或用於解碼其他圖像。
預料下一代視訊應用對以HDR(高動態範圍)及WCG(寬色域)表示經俘獲之場景的視訊資料操作。所利用之動態範圍及色域之參數為視訊內容之兩個獨立屬性,且其出於數位電視及多媒體服務之目的的規範由若干國際標準界定。舉例而言,ITU-R Rec.709界定HDTV(高清晰度電視)之參數,諸如標準動態範圍(SDR)及標準色域,且ITU-R Rec.2020指定諸如HDR及WCG之UHDTV(超高清晰度電視)參數。亦存在其他標準開發組織(SDO)文獻,其指定其他系統中之動態範圍及
色域屬性,例如P3色域界定於SMPTE-231-2(運動圖像及電視工程師協會)中,且HDR之一些參數界定於STMPTE-2084中。在下文中提供視訊資料之動態範圍及色域的簡要描述。
動態範圍通常經界定為視訊信號之最小與最大亮度之間的比率。亦可依據『f光闌』量測動態範圍,其中一個f光闌對應於信號動態範圍之加倍。在MPEG之定義中,HDR內容為以大於16個f光闌的亮度變化為特徵的此類內容。在一些條件下,10個f光闌與16個f光闌之間的位準被視為中間動態範圍,但在其他定義中可被視為HDR。在一些實例中,HDR視訊內容可為相較於傳統使用之具備標準動態範圍之視訊內容(例如,如由ITU-R Rec.BT.709指定之視訊內容)具有較高動態範圍的任何視訊內容。同時,人類視覺系統(HVS)能夠感知大得多的動態範圍。然而,HVS包括用以窄化所謂同時範圍之自適應機制。對由HDTV之SDR、UHDTV之經預期HDR提供之動態範圍及HVS動態範圍之可視化展示於圖2中。
當前視訊應用及服務由Rec.709管控且提供SDR,通常支援每m2大約0.1至100燭光(candela,cd)(常常被稱作「尼特(nit)」)的亮度(或明度)範圍,從而導致小於10個f光闌。下一代視訊服務經預期以提供高達16個f光闌之動態範圍。儘管詳細規範當前在開發中,但在SMPTE-2084及Rec.2020中已經指定一些初始參數。
除HDR以外更真實的視訊體驗之另一態樣為色彩維度,其習知地由色域界定。圖3為展示SDR色域(基於BT.709紅色、綠色及藍色原色之三角形)以及UHDTV之較寬色域(基於BT.2020紅色、綠色及藍色原色之三角形)的概念圖。圖3亦描繪所謂的頻譜軌跡(藉由舌片形狀之區定界),其表示天然色彩之界限。如藉由圖3所說明,自BT.709原色至BT.2020原色的移動旨在為UHDTV服務提供多約70%的色彩。D65指定給定規範(例如,BT.709及/或BT.2020規範)之白色。
色域規範之幾個實例展示於表1中。
如表1中可以看出,色域可由白點之X及Y值且由原色(例如,紅色(R)、綠色(G)以及藍色(B))之X及Y值界定。X及Y值表示色彩之色度(X)及亮度(Y),如由CIE 1931色彩空間界定。CIE 1931色彩空間界定純色(例如,就波長而言)之間的聯繫及人眼如何感知此類色彩。
通常在每分量極高精度下(甚至浮點)以4:4:4色度格式及極寬色彩空間(例如,CIE 1931 XYZ色彩空間)獲取及儲存HDR/WCG。此表示以高精度為目標且在數學上(幾乎)無損。然而,此格式特徵可包括許多冗餘且對於壓縮目的而言並非最佳的。具備基於HVS之假定的較低精確度格式通常用於目前先進技術的視訊應用。
出於壓縮之目的,典型的視訊資料格式轉換由三個主要過程構成,如圖4中所展示。可藉由視訊預處理器19執行圖4之技術。線性RGB資料110可為HDR/WCG視訊資料且可以浮點表示儲存。可使用用於動態範圍壓緊之非線性轉移函數(TF)來壓緊線性RGB資料110。舉例而言,視訊預處理器19可包括經組態以使用用於動態範圍壓緊之非線性轉移函數的轉移函數(TF)單元112。
TF單元112之輸出可為一組碼字,其中每一碼字表示色彩值(例如,照明位準)之範圍。動態範圍壓緊意謂線性RGB資料110之動態範圍可為第一動態範圍(例如,如在圖2中所說明之人類視覺範圍)。所得碼字之動態範圍可為第二動態範圍(例如,如在圖2中所說明之HDR顯示範圍)。因此,碼字相較於線性RGB資料110俘獲較小動態範圍,
且因此,TF單元112執行動態範圍壓緊。
TF單元112執行非線性函數,其意義在於碼字與輸入色彩值之間的映射並非相等地間隔開(例如,碼字為非線性碼字)。非線性碼字意謂輸入色彩值的改變並不顯現為輸出碼字之線性比例改變,而是顯現為碼字之非線性改變。舉例而言,若色彩值表示低照明,則輸入色彩值之小改變將導致由TF單元112輸出之碼字的小改變。然而,若色彩值表示高照明,則對於碼字之小改變將需要輸入色彩值之相對較大的改變。由每一碼字表示之照明範圍並非恆定的(例如,第一碼字對於第一照明範圍為相同的且第二碼字對於第二照明範圍為相同的,且第一與第二範圍不同)。下文所描述之圖7說明由TF單元112所應用之轉移函數之特性。
如更詳細地描述,技術可縮放及偏移TF單元112接收的線性RGB資料110,且/或縮放及偏移TF單元112輸出之碼字以較好地利用碼字空間。TF單元112可使用任何數目之非線性轉移函數(例如,如SMPTE-2084中所界定之PQ(感知量化器)TF)來壓緊線性RGB資料110(或經縮放及偏移之RGB資料)。
在一些實例中,色彩轉換單元114將經壓緊之資料轉換成較適用於藉由視頻編碼器20壓縮的較緊密或穩固之色彩空間(例如,經由色彩轉換單元轉換成YUV或YCrCb色彩空間)。如更詳細地描述,在一些實例中,在色彩轉換單元114執行色彩轉換之前,該等技術可縮放及偏移由TF單元112應用TF所輸出之碼字。色彩轉換單元114可接收此等經縮放及偏移之碼字。在一些實例中,一些經縮放及偏移之碼字可大於或小於各別臨限值;對於此等碼字,該等技術可指派各別經設定碼字。
接著使用浮點至整數表示轉換(例如,經由量化單元116)來量化此資料以產生傳輸至視頻編碼器20以被編碼之視訊資料(例如,HDR
資料118)。在此實例中,HDR資料118呈整數表示。HDR資料118現可呈較適用於由視頻編碼器20壓縮的格式。應理解,圖4中所描繪的程序之次序被給定作為實例,且在其他應用中可改變。舉例而言,色彩轉換可先於TF處理。另外,視訊預處理器19可將較多處理(例如,空間次取樣)應用於色彩分量。
因此,在圖4中,藉由由TF單元112所利用之非線性轉移函數(例如,如SMPTE-2084中所界定之PQ TF)來壓緊呈線性及浮點表示之輸入RGB資料110之高動態範圍,之後將其轉換成較適用於壓縮的目標色彩空間(例如,藉由色彩轉換單元114)(例如,YCbCr),且接著經量化(例如,量化單元116)以達成整數表示。此等元件之次序經給定作為實例,且在真實世界應用中可改變,例如色彩轉換可先於TF模組(例如,TF單元112)。如此類空間次取樣之額外處理可在TF單元112應用轉移函數之前應用至色彩分量。
在解碼器側處之反向轉換描繪於圖5中。可藉由視訊後處理器31執行圖5之技術。舉例而言,視訊後處理器31自視訊解碼器30接收視訊資料(例如,HDR資料120)且反量化單元122可反量化資料;反向色彩轉換單元124執行反向色彩轉換;且反向非線性轉移函數單元126執行反向非線性轉移以產生線性RGB資料128。
反向色彩轉換單元124執行之反向色彩轉換程序可為色彩轉換單元114執行之色彩轉換程序之反向過程。舉例而言,反向色彩轉換單元124可將HDR資料自YCrCb格式轉換回至RGB格式。反向轉移函數單元126可將反向轉移函數應用於資料以添加回由TF單元112壓緊之動態範圍,從而重建線性RGB資料128。
在本發明中所描述之實例技術中,在反向轉移函數單元126執行反向轉移函數之前,視訊後處理器31可應用反向後處理;且在反向轉移函數單元126執行反向轉移函數之後,視訊後處理器31可應用反向
預處理。舉例而言,如上文所描述,在一些實例中,視訊預處理器19可在TF單元112之前應用預處理(例如,縮放及偏移)且可在TF單元112之後應用後處理(例如,縮放及偏移)。為了補償預處理及後處理,視訊後處理器31可在反向TF單元126執行反向轉移函數之前應用反向後處理且在反向TF單元126執行反向轉移函數之後應用反向預處理。應用預處理及後處理兩者以及反向後處理及反向預處理兩者為可選的。在一些實例中,視訊預處理器19可應用預處理及後處理中之一者,但不可應用兩者,且對於此類實例,視訊後處理器31可應用由視訊預處理器19所應用之處理的反向處理。
進一步詳細地描述圖4中所說明的實例視訊預處理器19,其中理解圖5中所說明的實例視訊後處理器31大體上執行互逆操作。將轉移函數應用於資料(例如,HDR/WCG RGB視訊資料)以壓緊其動態範圍且使得有可能藉由有限數目之位元表示資料。表示資料的此等有限數目之位元被稱為碼字。此函數通常為一維(1D)非線性函數,其反映如Rec.709中針對SDR所指定的終端使用者顯示器之電光轉移函數(EOTF)之逆函數,或近似在SMPTE-2084中針對HDR所指定的PQ TF的對亮度改變之HVS感知。OETF之反向處理(例如,如藉由視訊後處理器31執行)為EOTF(電光轉移函數),其將碼位準映射回至明度。圖6展示非線性TF之若干實例。此等轉移函數亦可分開地應用於每一R、G及B分量。
在本發明之上下文中,術語「信號值」或「色彩值」可用於描述對應於影像元素的特定色彩分量(諸如,R、G、B或Y)之值的明度位準。信號值通常表示線性光位準(明度值)。術語「碼位準」、「數位碼值」或「碼字」可指影像信號值之數位表示。通常,此數位表示表示非線性信號值。EOTF表示提供至顯示裝置(例如,顯示裝置32)之非線性信號值與由顯示裝置產生之線性色彩值之間的關係。
ST2084之規範界定EOTF應用如下。將TF應用於標準化線性R、G、B值,此導致R'G'B'之非線性表示。ST2084按NORM=10000界定標準化,NORM=10000與10000尼特(燭光/平方米)之峰值亮度相關聯。
○R'=PQ_TF(max(0,min(R/NORM,1))) (1) ○G'=PQ_TF(max(0,min(G/NORM,1))) (1) ○B'=PQ_TF(max(0,min(B/NORM,1)))
其中
藉由x軸上之經標準化至範圍0…1的輸入值(線性色彩值)及y軸上之標準化輸出值(非線性色彩值),在圖7中將PQ EOTF可視化。如根據圖7中之曲線可以看出,將輸入信號之動態範圍之百分之1(低照明)轉換成輸出信號之動態範圍之50%。
存在可用以表示輸入線性色彩值之有限數目個碼字。圖7說明對於PQ EOTF,大致50%的可用碼字被專用於低照明輸入信號,使得較少可用碼字用於較高照明輸入信號。因此,相對高照明輸入信號之輕微改變可能未經俘獲,此係因為表示此等輕微改變之碼字不足。然而,可存在用於低照明輸入信號的不必要的較大數目之可用碼字,意謂甚至相對低照明輸入信號之極輕微的改變亦可由不同碼字表示。因此,可存在用於低照明輸入信號之可用碼字的較大分佈及用於高照明輸入信號之可用碼字的相對低分佈。
通常,EOTF經界定為具備浮點準確度之函數。因此,若應用反
向TF(亦即,所謂的OETF),則無誤差引入至具備此非線性之信號。ST2084中所指定之反向TF(OETF)經界定為inversePQ函數:○R=10000*inversePQ_TF(R')○G=10000*inversePQ_TF(G')○B=10000*inversePQ_TF(B') (2)
其中
藉由浮點準確度,依序應用EOTF及OETF提供不具有誤差之完美的重新建構。然而,對於串流或廣播服務,此表示並非最佳的。在下文中描述非線性R'G'B'資料之具備固定位元準確度的較緊密表示。應注意,EOTF及OETF為當前非常活躍的研究之主題,且一些HDR視訊寫碼系統中所利用之TF可不同於ST2084。
對於HDR,其他轉移函數亦在考慮中。實例包括菲利普(Philips)TF或BBC混合式「對數伽瑪」TF。BBC混合式「對數伽瑪」TF係基於Rec 709 TF,以用於SDR回溯相容性。為了延伸動態範圍,BBC混合式將第三部分添加至較高輸入明度下的Rec 709曲線。曲線之新部分為對數函數。
Rec 709中所界定之OETF為:
其中L為影像之明度,0L1;且V為對應的電信號。在Rec 2020
中,同一方程式經指定為:
其中E為藉由參考白位準標準化且與將由參考攝影機色彩通道R、G、B偵測到之隱式光強度成比例的電壓。E'為所得非線性信號。
對於10位元的系統,α=1.099且β=0.018
對於12位元的系統,α=1.0993且β=0.0181
儘管未經明確地陳述,但α及β為以下聯立方程式之解:4.5β=αβ 0.45-(α-1)
4.5=0.45αβ -0.55
第一方程式為在E=β時線性函數及伽瑪函數之值之平均化,且第二方程式為亦在E=β時兩個函數之梯度。
在下文中展示混合式「對數伽瑪」中之額外部分且圖27說明OETF。舉例而言,圖27展示作為實例的混合式對數伽瑪轉移函數及潛在目標範圍。
在圖27中,藉由A、B、C、D以及E標記各別曲線以與曲線圖之右下方方框中之各別圖例匹配。詳言之,A對應於10位元的PQ-EOTF,B對應於8位元的BT.709 EOTF,C對應於10位元的BT.709 EOTF,D對應於10位元的BBC混合式對數伽瑪EOTF以及E對應於12位元的PQ-EOTF。
圖28說明環繞拐點的拋物線之斜率為可調整的轉移函數。圖28僅作為具備斜率調整實例5000[燭光/平方米]的一個實例而經說明。然而,具備可調整斜率的轉移函數之其他實例為可能的。
RGB資料通常用作輸入,此係因為其由影像俘獲感測器產生。然
而,此色彩空間在其分量當中具有高冗餘且對於緊密表示而言並非最佳的。為了達成較緊密且較穩固的表示,通常將RGB分量轉換成較適用於壓縮的較不相關的色彩空間(例如YCbCr)(亦即,執行色彩變換)。此色彩空間將呈明度形式之亮度及呈不同的不相關分量之色彩資訊分隔開。
對於現代視訊寫碼系統,通常使用之色彩空間為YCbCr,如ITU-R BT.709或ITU-R BT.709中所指定。BT.709標準中之YCbCr色彩空間指定自R'G'B'至Y'CbCr(非恆定明度表示)之以下轉換程序:○Y'=0.2126 * R'+0.7152 * G'+0.0722 * B' (3)
以上過程亦可使用避免Cb及Cr分量的除法的以下近似轉換來實施:○Y'=0.212600 * R'+0.715200 * G'+0.072200 * B'○Cb=-0.114572 * R'-0.385428 * G'+0.500000 * B'○Cr=0.500000 * R'-0.454153 * G'-0.045847 * B' (4)
ITU-R BT.2020標準指定自R'G'B'至Y'CbCr(非恆定明度表示)之以下轉換程序:
以上過程亦可使用避免Cb及Cr分量的除法的以下近似轉換來實施:○Y'=0.262700 * R'+0.678000 * G'+0.059300 * B'○Cb=-0.139630 * R'-0.360370 * G'+0.500000 * B'○Cr=0.500000 * R'-0.459786 * G'-0.040214 * B' (6)
應注意,兩個色彩空間均保持標準化。因此,對於在0…1範圍內經標準化之輸入值,所得值將映射至範圍0…1。一般而言,藉由浮點準確度所實施之色彩轉換提供完美的重新建構,因此此過程無損。
對於量化及/或固定點轉換,上文所描述之處理階段通常以浮點準確度表示實施,因此該等處理階段可被視為無損的。然而,對於大多數消費型電子裝置應用,此類型之準確度可被視為冗餘且昂貴的。對於此類服務,將目標色彩空間中之輸入資料轉換成目標位元深度固定點準確度。某些研究展示與PQ TF組合的10到12位元的準確度足以為具有16個f光闌之HDR資料提供小於恰可辨差異(Just-Noticeable Difference)之失真。可藉由大多數目前先進技術的視訊寫碼解決方案來進一步寫碼藉由10位元準確度表示之資料。此轉換程序包括信號量化且為有損寫碼元件,且為經引入至經轉換資料的不準確度源。
應用至目標色彩空間(在此實例中,YCbCr)中之碼字的此類量化之實例展示在下文中。將以浮點準確度表示之輸入值YCbCr轉換成具有Y值之固定位元深度BitDepthY及色度值(Cb、Cr)之BitDepthC之信號。
○DY' =Clip1Y(Round((1≪(BitDepthY-8))*(219 * Y'+16)))○DCb=Clip1C(Round((1≪(BitDepthC-8))*(224 * Cb+128)))○DCr=Clip1C(Round((1≪(BitDepthC-8))*(224 * Cr+128))) (7)
其中Round(x)=Sign(x)* Floor(Abs(x)+0.5)
若x<0,則Sign(x)=-1;若x=0,則Sign(x)=0;若x>0,則Sign(x)=1
Floor(x)小於或等於x之最大整數
若x>=0,則Abs(x)=x;若x<0,則Abs(x)=-x
Clip1Y(x)=Clip3(0,(1<<BitDepthY)-1,x)
Clip1C(x)=Clip3(0,(1<<BitDepthC)-1,x)
若z<x,則Clip3(x,y,z)=x;若z>y,則Clip3(x,y,z)=y;否則Clip3(x,y,z)=z
一些技術可能不十分適合於HDR及WCG視訊資料。大多數當前可公開獲得之用於HDR視訊系統之用途的EOTF(諸如,PH、菲利浦以及BBC)為獨立地應用於R、G及B分量且並不考慮HDR視訊時空統計資料或區域亮度位準之靜態的、與內容無關的1D轉移函數。就HDR視訊寫碼系統中之此類EOTF利用而言,此方法將導致對於HDR視訊內容之所提供視覺品質而言的非最佳位元分配。
當前所利用之HDR處理管線之第二問題為目標色彩空間中之非線性碼字自浮點準確度表示至表示之靜態轉換。通常,碼字空間為固定的且在時間及空間上變化的HDR內容將無法得到最佳表示。以下提供關於此等兩個問題的更多細節。
關於靜態1D EOTF的非最佳性,ST2084中所界定之EOTF指定表示為PQ TF之靜態的、與內容無關的1D轉移函數,其假定地基於在亮度之特定位準(幾燭光/平方米)下人類視覺系統(HVS)之感知敏感度。儘管大多數研究界定對以燭光/平方米為單位之亮度的HVS感知敏感度,但PQ TF被獨立地應用於色彩值R、G及B中之每一者,如在方程式1中(例如,以判定R'、G'以及B');且並不利用此RGB像素之亮度強度。此導致PQ TF在近似對所得R'G'B'之非線性之HVS敏感度時之可能的不準確度,例如R'G'B'色彩值之組合可導致不同位準之亮度,該亮度本應與相較於獨立地應用於R、G、B分量中之每一者的PQ TF值的另一PQ TF值相關聯。
此外,歸因於此設計意向,PQ TF組合了兩個模式(所謂的夜間亮光視覺及微光(所謂的夜間)視覺)下之HVS敏感度。當場景之亮度在
0.03cd/m2以下時後一視覺開始起作用,且以以降低色彩感知為代價的高得多的敏感度為特徵。為了實現高敏感度,所利用之PQ TF將較大量之碼字提供至低明度值,如圖7中所反映。若圖像之亮度為低HVS,則此類碼字分佈可為最佳的且將在夜間視覺模式下操作。舉例而言,若碼字對亮度的較小改變敏感,則此類碼字分佈可為最佳的。然而,典型的HDR圖像可以明亮的場景及暗的有雜訊的片段為特徵,歸因於自最接近的明亮樣本的遮蔽,暗的有雜訊的片段將不影響視覺品質但將大大影響使用當前靜態TF之位元速率。
關於對碼字空間之低效利用,量化以浮點準確度所表示之非線性碼字(Y'、Cb、Cr)及其如方程式(7)中所展示之具有固定數目之位元的表示(DY'、DCb、DCr)為HDR管線之主要壓縮工具。通常,在量化之前輸入信號之動態範圍小於1.0,且對於Y分量屬於在0…1內的範圍,以及對於Cb及Cr分量屬於範圍-0.5…0.5。
然而,HDR信號之實際分佈逐圖框地變化,因此,如方程式(7)中所展示之量化將不提供最小量化誤差,且可藉由調整HDR信號之動態範圍以與等於1.0之預料範圍匹配來改良。
為了解決上文所描述之問題,可考慮以下解決方案。EOTF可經界定為具有依據內容性質(例如,在圖框層級)改變之形狀的動態的、內容自適應轉移函數,如圖8中所說明。圖8說明具有自適應形狀TF單元112'之內容自適應HDR處理管線(編碼器側)。舉例而言,圖8說明視訊預處理器19之另一實例,其包括由TF單元所利用之自適應形狀TF函數。
圖8之組件大體上符合圖4之組件。在圖8之實例中,與圖4中之實例之彼等組件具有相同參考標號的組件相同。然而,在圖8中,自適應TF單元112'應用自適應TF,而非TF單元112應用靜態TF,如圖4中所說明。在此實例中,自適應TF單元112'執行資料壓緊的方式為自
適應的且可基於視訊內容而改變。儘管對應的視訊後處理器31未經說明,但此實例視訊後處理器31將執行自適應反向轉移函數而非圖5之反向轉移函數單元126之靜態反向轉移函數。視訊預處理器19將輸出指示TF單元112'用以調適TF之參數的資訊。視訊後處理器31將相應地接收指示TF單元112'用以調適自適應反向轉移函數之參數的此類資訊。
然而,此技術可需要轉移函數適應之參數之廣泛傳訊以及支援此適應性之實施,例如儲存多個查找表或實施分支。此外,PQ EOTF之非最佳性之某些態樣可經由3D轉移函數解決。對於某些實施及傳訊成本,此類方法可能太昂貴。
在本發明中,傳訊指輸出用於解碼或以其他方式重新建構視訊資料之語法元素或其他視訊資料。經傳訊之參數可經儲存以供目的地裝置14稍後擷取或可直接傳輸至目的地裝置14。
本發明描述使用靜態固定轉移函數(TF)之內容自適應HDR視訊系統。本發明描述將靜態TF保持在管線中,但使信號特性適應固定處理流程。此可藉由自適應處理待由TF處理之信號或由應用TF所產生之信號而達成。某些技術可對此等適應機制兩者進行組合。在解碼器(例如,視訊後處理器31)處,將應用自適應處理(其與在編碼器側(例如,視訊預處理器19)處所應用之處理反向)。
圖9為展示具備固定TF之內容自適應HDR處理管線(編碼器側)之概念圖。如所說明,視訊預處理器19包括預處理單元134(亦被稱作動態範圍調整(DRA1)、TF單元112、後處理單元138(亦被稱作DRA2)、色彩轉換單元114以及量化單元116。
在所說明的實例中,視訊預處理器19可經組態為固定功能及可程式化電路。舉例而言,視訊預處理器19可包括共同或分開地形成預處理單元134、TF單元112、後處理單元138、色彩轉換單元114以及量
化單元116的電晶體、電容器、電感器、被動及主動組件、算術邏輯單元(ALU)、初等函數單元(EFU)及其類似者。在一些實例中,視訊預處理器19包括可程式化核心,其執行使得預處理單元134、TF單元112、後處理單元138、色彩轉換單元114以及量化單元116執行其各別功能之指令。在此等實例中,視訊資料記憶體132或某一其他記憶體可儲存由視訊預處理器19執行之指令。
在圖9中,為了易於理解,亦說明視訊資料記憶體132。舉例而言,視訊資料記憶體132可在視訊預處理器19接收視訊資料之前暫時儲存視訊資料。作為另一實例,視訊預處理器19輸出之任何視訊資料可暫時儲存在視訊資料記憶體132中(例如,在輸出至視頻編碼器20之前儲存在視訊資料記憶體中)。視訊資料記憶體132可為視訊預處理器19之一部分或可在視訊預處理器19外部。
可(例如)自視訊源18獲得儲存於視訊資料記憶體132中之視訊資料。視訊資料記憶體132可由諸如動態隨機存取記憶體(DRAM)之各種記憶體裝置中之任一者形成,包括同步DRAM(SDRAM)、磁阻式RAM(MRAM)、電阻式RAM(RRAM)或其他類型之記憶體裝置。在各種實例中,視訊資料記憶體132可與視訊預處理器19之其他組件一起在晶片上,或相對於彼等組件在晶片外。
如下文更詳細地描述,預處理單元134(例如,DRA1)在靜態轉移函數單元112應用靜態轉移函數之前預處理線性RBG資料110。預處理之一部分包括縮放及偏移(例如,將輸入值與因數相乘以縮放,且添加值以偏移)。在一些實例中,預處理單元134基於視訊內容預處理視訊資料(例如,縮放因數及偏移因數係基於視訊內容)。TF單元112接著將轉移函數應用於經縮放及偏移之輸入值以產生複數個碼字。在此實例中,TF單元112應用壓緊輸入值之動態範圍的靜態轉移函數以使得所產生的複數個碼字表示相較於輸入色彩值(例如,線性RGB資料
110)較小的動態範圍內之色彩。
後處理單元136(例如,DRA2)對藉由TF單元112所產生的碼字執行後處理功能。舉例而言,TF單元112之輸出可為表示色彩值之非線性碼字。後處理單元136亦可縮放及偏移由TF單元112輸出之碼字。色彩轉換單元114對後處理單元138之輸出執行色彩轉換(例如,自RGB轉換至YCrCb),且量化單元116對色彩轉換單元114之輸出執行量化。
藉由預處理線性RGB資料110,預處理單元134可經組態以縮放及偏移線性RGB資料110,使得儘管TF單元112應用靜態轉移函數,但至TF單元112之輸入經調整使得TF單元112之輸出碼字更為線性。另外,藉由預處理線性RGB資料110,預處理單元134可使用視訊內容以選擇考慮到時空統計資料或區域亮度位準之縮放及偏移參數。
可存在預處理單元134可判定縮放及偏移參數之各種方式。作為一個實例,預處理單元134可判定圖像中色彩中之每一者之直方圖(例如,判定紅色之直方圖、綠色之直方圖以及藍色之直方圖)。直方圖指示有多少特定色彩之像素具有特定照明位準。可藉由TF單元112將應用之轉移函數之數學表示來預程式化預處理單元134,以使得預處理單元134可縮放及偏移色彩值以提高TF單元112輸出之碼字之線性。
預處理單元134可在輸入信號之允許的碼字空間之完整動態範圍[0…1]內的有限跨距[hist_min…hist_max]內使輸入信號之直方圖標準化。預處理單元134可藉由水平地拉伸色彩值中之每一者之直方圖且基於經拉伸之直方圖判定偏移及縮放而判定待應用於輸入信號之縮放及偏移參數。舉例而言,用於判定偏移及縮放之方程式可為:Offset1=-hist_min
Scale1=1/(hist_max-hist_min)
預處理單元134可使用Offset1及Scale1之方程式判定色彩中之每
一者的偏移及縮放參數,且應用如更詳細地描述之offset1及scale1參數以縮放及偏移色彩值。可存在預處理單元134判定用於預處理之偏移及縮放參數的各種其他方式,且以上方程式被提供作為一個實例。
後處理單元138可以類似方式判定偏移及縮放參數,但是後處理單元138對色彩碼字應用判定偏移及縮放參數。舉例而言,後處理單元138可判定TF單元112輸出之碼字中之每一者之直方圖。後處理單元138可在經允許之碼字空間之完整動態範圍[0…1]內的有限跨距[hist_min…hist_max]內將碼字之直方圖標準化。後處理單元138可藉由拉伸針對色彩值中之每一者的碼字中之每一者之直方圖且基於經拉伸之直方圖判定偏移及縮放而判定待應用於碼字之縮放及偏移參數。舉例而言,用於判定偏移及縮放之方程式可為:Offset1=-hist_min
Scale1=1/(hist_max-hist_min)
後處理單元138可使用Offset2及Scale2之方程式判定色彩中之每一者的偏移及縮放參數,且應用如更詳細地描述之offset2及scale2參數以縮放及偏移碼字。可存在預處理單元138判定用於後處理之偏移及縮放參數的各種其他方式,且以上方程式被提供作為一個實例。
儘管色彩轉換單元114經說明為在後處理單元138之後,但在一些實例中,色彩轉換單元114可首先將色彩自RGB轉換至YCrCb。後處理單元138可對YCrCb碼字執行操作。對於明度(Y)分量,後處理單元138可使用類似於上文所描述之彼等技術的技術來判定縮放及偏移值。下文描述用於判定色度分量之縮放及偏移的技術。
後處理單元138可根據輸入視訊信號之比色及輸出視訊信號之目標比色來判定Cb及Cr色彩分量之縮放及偏移參數。舉例而言,考慮由原色座標(xXt,yXt)所指定之目標(T)色彩容器,其中X指R、G、B色彩分量:
及由原色座標(xXn,yXn)所指定之原生(N)色域,其中X指R、G、B色彩分量:
兩個色域之白點座標等於whiteP=(xW,yW)。DRA參數估計單元(例如,後處理單元138)可導出隨原色座標與白點之間的距離而變的Cb及Cr色彩分量之scale Cb及scale Cr。此估計之一個實例給定如下:rdT=sqrt((primeT(1,1)-whiteP(1,1))^2+(primeN(1,2)-whiteP(1,2))^2)
gdT=sqrt((primeT(2,1)-whiteP(1,1))^2+(primeN(2,2)-whiteP(1,2))^2)
bdT=sqrt((primeT(3,1)-whiteP(1,1))^2+(primeN(3,2)-whiteP(1,2))^2)
rdN=sqrt((primeN(1,1)-whiteP(1,1))^2+(primeN(1,2)-whiteP(1,2))^2)
gdN=sqrt((primeN(2,1)-whiteP(1,1))^2+(primeN(2,2)-whiteP(1,2))^2)
bdN=sqrt((primeN(3,1)-whiteP(1,1))^2+(primeN(3,2)-whiteP(1,2))^2)
scale Cb=bdT/bdN
scale Cr=sqrt((rdT/rdN)^2+(gdT/gdN)^2)
可將此類實施例之Cb及Cr偏移參數設定為等於0:offset Cb=offset Cr=0
在一些實例中,色彩轉換單元114可在預處理單元134應用預處理之前將RGB轉換至YCrCb。對於此類實例,預處理單元134可對於YCrCb值執行與上文針對後處理單元138所描述之彼等操作類似的操作,不過是在TF單元112應用轉移函數之前對輸入色彩值執行。
預處理單元134可基於直方圖來判定縮放及偏移因數以判定當被應用於輸入色彩值時產生使得當TF單元112應用轉移函數時TF單元112之輸出為線性碼字(例如,由碼字表示之色彩值範圍跨越色彩及碼
字空間相對相同)的輸出之縮放及偏移因數。在一些實例中,後處理單元138可將縮放及偏移應用至TF單元112輸出之碼字。後處理單元138可修改碼字以更好地使用可用碼字範圍。舉例而言,TF單元112之輸出可為並不利用整個碼字空間之碼字。藉由跨越碼字空間散佈碼字,可改良量化單元116之信號對量化雜訊比。
信號對量化雜訊比通常反映最大標稱信號強度與量化誤差(亦被稱作量化雜訊)之間的關係:SNR=E(x^2)/E(n^2),其中E(x^2)為信號之功率,E(n^2)為量化雜訊之功率;其中^表示指數操作,E為能量且n為雜訊。
將信號x與>1.0之縮放參數相乘將導致信號功率之提高,且因此將導致改良之信號對量化雜訊比:SNR2=E((scale *x)^2)/E(n^2)>SNR。
視頻編碼器20接收視訊預處理器19之輸出,對視訊預處理器19輸出之視訊資料進行編碼,且輸出經編碼視訊資料以供稍後由視訊解碼器30解碼且由視訊後處理器31處理。在一些實例中,視頻編碼器20可對指示預處理單元134及後處理單元138中之一者或兩者的縮放及偏移因數的資訊進行編碼及傳訊。在一些實例中,視訊預處理器19可輸出諸如直方圖之資訊,視訊後處理器31根據該資訊判定縮放及偏移因數;而非編碼及傳訊指示縮放及偏移因數之資訊。視訊預處理器19輸出之指示視訊資料由預處理單元134預處理或由後處理單元138後處理之方式的資訊可被稱為自適應轉移函數(ATF)參數。
應理解,在各種實例中,由TF單元112所應用之轉移函數為靜態的(例如,非內容自適應的)。然而,輸出至TF單元112之資料可經調適(例如,藉由預處理單元134)及/或TF單元112輸出之資料可經調適(例如,藉由後處理單元138)。以此方式,視訊預處理器19輸出表示經減小之動態範圍(相較於線性RGB資料110之動態範圍)內之色彩的
碼字,其中輸出碼字係基於視訊內容。因此,藉由調適至TF單元112之輸入及TF單元112之輸出,預處理單元134、TF單元112以及後處理單元138之組合起應用自適應轉移函數的作用。
圖10為展示具備固定TF之內容自適應HDR處理管線(解碼器側)之概念圖。如所說明,視訊後處理器31包括反量化單元122、反向色彩轉換單元124、反向後處理單元144、反向TF單元126以及反向預處理單元142。
在所說明的實例中,視訊後處理器31可經組態為固定功能及可程式化電路。舉例而言,視訊後處理器31可包括共同或分開地形成反量化單元122、反向色彩轉換單元124、反向後處理單元144、反向TF單元126以及反向預處理單元142的電晶體、電容器、電感器、被動及主動組件、算術邏輯單元(ALU)、初等函數單元(EFU)及其類似者。在一些實例中,視訊後處理器31包括可程式化核心,其執行使得反量化單元122、反向色彩轉換單元124、反向後處理單元144、反向TF單元126以及反向預處理單元142執行其各別功能之指令。在此等實例中,視訊資料記憶體140或某一其他記憶體可儲存由視訊後處理器31執行之指令。
在圖10中,為了易於理解,亦說明視訊資料記憶體140。舉例而言,視訊資料記憶體140可暫時儲存由視訊後處理器31輸出之視訊資料。作為另一實例,視訊解碼器30輸出至視訊後處理器31之任何視訊資料可暫時儲存在視訊資料記憶體140中(例如,在由視訊後處理器31接收之前儲存在視訊資料記憶體中)。視訊資料記憶體140可為視訊後處理器31之一部分或可在視訊後處理器31外部。
舉例而言,儲存在視訊資料記憶體140中之視訊資料可輸出至顯示裝置32。視訊資料記憶體140可由諸如動態隨機存取記憶體(DRAM)之各種記憶體裝置中之任一者形成,包括同步DRAM(SDRAM)、磁阻
式RAM(MRAM)、電阻式RAM(RRAM)或其他類型之記憶體裝置。在各種實例中,視訊資料記憶體140可與視訊後處理器31之其他組件一起在晶片上,或相對於彼等組件在晶片外。
視訊後處理器31可經組態以執行視訊預處理器19之反向處理。舉例而言,視訊解碼器30將經解碼視訊資料輸出至視訊後處理器31,經解碼視訊資料實質上可類似於視訊預處理器19輸出至視頻編碼器20之視訊資料。另外,視訊解碼器30可將自適應轉移函數(ATF)參數輸出至視訊後處理器31以執行由視訊預處理器19執行之預處理及後處理之反向處理。
反量化單元122自視訊解碼器30接收視訊資料且執行量化單元116之反向操作。反量化單元122之輸出為未經量化之視訊資料。反向色彩轉換單元執行與色彩轉換單元114執行之操作反向的操作。舉例而言,若色彩轉換單元114將RGB色彩轉換至YCrCb色彩,則反向色彩轉換單元124將YCrCb色彩轉化成RGB色彩。
反向後處理單元144可執行後處理單元138之反向操作。反向後處理單元144接收表示第一動態範圍內之色彩的碼字,該第一動態範圍在此狀況下為與後處理單元138之輸出相同的動態範圍。
並非與後處理單元138一樣乘以縮放因數,反向後處理單元144可除以與後處理單元138乘以的縮放因數實質上類似的縮放因數。若後處理單元138自經縮放碼字減去偏移量,則反向後處理單元144可將偏移量添加至經反向縮放之碼字。反向後處理單元144之輸出可為並不跨越整個碼字空間散佈的碼字。在一些實例中,反向後處理單元144可自視訊預處理器19接收縮放及偏移參數(例如,縮放及偏移因數)。在一些實例中,反向後處理單元144可接收資訊,根據該資訊反向後處理單元144判定縮放及偏移因數。
反向TF單元126執行TF單元112之反向操作。舉例而言,TF單元
112將色彩值壓緊於表示相較於色彩值之動態範圍的較小動態範圍之碼字中。反向TF單元126將色彩值自較小動態範圍擴展回至較大動態範圍中。反向TF單元126之輸出可為線性RGB資料;然而,可需要移除某種預處理以產生原始RGB資料。
反向預處理單元142接收反向TF單元126之輸出且執行由預處理單元134所應用之預處理之反向處理。反向後處理單元144接收表示第二動態範圍內之色彩的色彩值,該第二動態範圍在此狀況下為與預處理單元134之輸出相同的動態範圍。
並非與處理預處理單元134一樣乘以縮放因數,反向預處理單元142可除以與預處理單元134乘以之縮放因數實質上類似的縮放因數。若預處理單元134自經縮放色彩值減去偏移量,則反向預處理單元142可將偏移量添加至經反向縮放之色彩值。在一些實例中,反向預處理單元142可自視訊預處理器19接收縮放及偏移參數(例如,縮放及偏移因數)。在一些實例中,反向預處理單元142可接收資訊(例如,直方圖資訊),根據該資訊反向預處理單元142判定縮放及偏移因數。
反向預處理單元142之輸出可為線性RGB資料128。線性RGB資料128及線性RGB資料110應實質上類似。顯示裝置32可顯示線性RGB資料128。
類似於TF單元112,反向TF單元126應用之反向轉移函數為靜態反向轉移函數(例如,不對視訊內容自適應)。然而,輸出至反向TF單元126之資料可經調適(例如,藉由反向後處理單元144)及/或反向TF單元126輸出之資料可經調適(例如,藉由反向預處理單元142)。以此方式,視訊後處理器31輸出表示並不處於減小之動態範圍(相較於後處理單元138之輸出之減小之動態範圍)內之色彩的色彩值。因此,藉由調適至反向TF單元126之輸入及反向TF單元126之輸出,反向後處理單元144、反向TF單元126以及反向預處理單元142之組合起應用自
適應反向轉移函數的作用。
儘管圖9中說明預處理單元134及後處理單元138兩者,但本發明中所描述之實例技術並不限於此。在一些實例中,視訊預處理器19可包括預處理單元134,但可不包括後處理單元138。在一些實例中,視訊預處理器19可包括後處理單元138,但可不包括預處理單元134。
因此,圖9說明用於內容自適應HDR系統中之視訊處理之裝置(例如,源裝置12)的實例,其中裝置包括視訊資料記憶體132及視訊預處理器19。視訊預處理器19包含固定功能或可程式化電路中之至少一者或兩者的組合,且經組態以接收表示第一動態範圍內之色彩的視訊資料(例如,線性RGB資料110)之複數個色彩值。視訊預處理器19包括TF單元112,其經組態以使用對經壓緊之視訊資料非自適應的靜態轉移函數來壓緊色彩值以產生表示第二動態範圍內的經壓緊之色彩值的複數個碼字。第二動態範圍相較於第一動態範圍較緊密。
視訊預處理器19可包括預處理單元134或後處理單元138中之至少一者。預處理單元134經組態以在壓緊之前預處理色彩值以產生被壓緊之色彩值。後處理單元138經組態以後處理由壓緊色彩值所產生之碼字。視訊預處理器19可經組態以基於經壓緊之色彩值(例如,在不存在後處理單元138之實例中)或經後處理之經壓緊之色彩值(例如,在後處理單元138為視訊預處理器19之一部分的實例中)中之一者而輸出色彩值(例如,量化單元116之輸出)。
此外,儘管圖10中說明反向後處理單元144及反向預處理單元142兩者,但本發明中所描述之實例技術並不限於此。在一些實例中,視訊後處理器31可包括反向後處理單元144,但可不包括反向預處理單元142(例如,在視訊預處理器19並不包括預處理單元134之實例中,但技術並不限於此)。在一些實例中,視訊後處理器31可包括反向預處理單元142,但可不包括反向後處理單元144(例如,在視訊
預處理器19並不包括後處理單元138之實例中,但技術並不限於此)。
因此,圖10說明用於內容自適應HDR系統中之視訊處理之裝置(例如,目的地裝置14)的實例,其中裝置包括視訊資料記憶體140及視訊後處理器31。視訊後處理器31包含固定功能或可程式化電路中之至少一者或兩者的組合,且經組態以接收表示視訊資料之經壓緊之色彩值的第一複數個碼字。經壓緊之色彩值表示第一動態範圍(例如,與視訊預處理器19輸出之碼字之經壓緊之動態範圍實質上類似的動態範圍)內之色彩。視訊後處理器31包括反向TF單元126,其經組態以使用對視訊資料非自適應之反向靜態轉移函數基於該第一複數個碼字解壓第二複數個碼字以產生解壓之色彩值。解壓之色彩值表示第二動態範圍(例如,與線性RGB資料110實質上類似的動態範圍)內之色彩。該第二複數個碼字為來自經反向後處理之第一複數個碼字(例如,在包括反向後處理單元144之實例中)或第一複數個碼字(例如,在不包括反向後處理單元144之實例中)的碼字中之一者。
視訊後處理器31可包括反向後處理單元144或反向預處理單元142中之至少一者。反向後處理單元144經組態以反向後處理第一複數個碼字以產生解壓之第二複數個碼字。反向預處理單元142經組態以反向預處理由解壓第二複數個碼字所產生之解壓之色彩值。視訊預處理器19可經組態以輸出解壓之色彩值(例如,在並不包括反向預處理單元142之實例中反向TF單元126之輸出)或經反向預處理的解壓之色彩值(例如,反向預處理單元142之輸出)以供顯示。
圖9及圖10說明用於減少由固定(例如,靜態)轉移函數產生之偽訊之內容自適應動態範圍調整(DRA)的實例技術。然而,藉由預處理及/或後處理TF單元112接收或輸出之資料,且藉由反向後處理及/或反向預處理反向TF單元126接收或輸出之資料,實例技術仍可使用靜態轉移函數,但仍達成內容自適應DRA。
本發明描述使用靜態固定轉移函數(TF)之內容自適應HDR視訊系統。下文描述可一起使用或可保持分開之一些實例。為了方便起見,在理解各種排列及組合均有可能之情況下,分開描述該等實例。
如上文所描述,本發明中所描述之技術在管線中利用靜態TF(例如,用於產生經編碼之視訊內容),但使信號特性適應於固定處理流程。此可藉由自適應處理待由TF單元112處理之信號(例如,藉由預處理單元134)或自適應處理由TF單元112應用TF所產生之信號(例如,藉由後處理單元138)而達成。
在一個實例中,預處理單元134可藉由在TF單元112應用轉移函數之前線性(縮放及偏移)預處理輸入線性色彩值而實現自適應性。除預處理單元134之外或替代預處理單元134,後處理單元138可藉由線性(縮放及偏移)後處理由TF單元112將TF應用於線性色彩值所產生之非線性碼字而實現自適應性。反向後處理單元144、反向TF單元126以及反向預處理單元142可分別應用後處理單元138、TF單元112以及預處理單元134的反向操作。
預處理單元134可藉由應用偏移Offset1及縮放Scale1而將線性預處理應用至輸入信號s(例如,線性RGB 110)以達成TF輸出之較佳碼字分佈(例如,使得每一碼字表示輸入色彩值(諸如,明度)之大致相等範圍)。後處理單元138可將線性後處理應用至TF單元112之輸出。線性後處理由參數Scale 2及Offset 2界定,且允許實現在TF單元112應用轉移函數之後對可用碼字空間(動態範圍)之高效利用。
在上文所描述之實例中,預處理單元134對線性RGB資料110應用預處理。然而,本發明中所描述之技術不受如此限制。RGB為HDR之一個色彩空間,預處理單元134可對該色彩空間執行預處理。一般而言,預處理單元134可實施在TF單元112應用轉移函數之前的HDR處理流程之任何色彩空間(例如,在所說明的實例中之輸入線性RGB
中,但其他色彩空間亦為可能的,諸如YCbCr色彩空間)中的預處理。
反向預處理單元142亦可經組態以在任何色彩空間中執行反向預處理。在此等實例中,反向預處理單元142可自反向TF單元126接收非線性色彩值(例如,非線性RGB資料,但包括YCbCr之其他色彩空間為可能的)。
以上實例描述後處理單元138在RGB色彩空間(例如,非線性RGB,歸因於由TF單元112所應用之轉移函數)中執行後處理。然而,本發明中所描述之技術不受如此限制。RGB為HDR之一個色彩空間,後處理單元138可對該色彩空間執行後處理。一般而言,後處理單元138可實施在TF單元112應用轉移函數之後的HDR處理流程之任何色彩空間(例如,在所說明的實例中之非線性RGB中,但其他色彩空間亦為可能的,諸如YCbCr色彩空間)中的後處理。
反向後處理單元144亦可經組態以在任何色彩空間中執行反向後處理。在此等實例中,反向後處理單元144可有可能在反量化之後自視訊解碼器30接收色彩值(例如,非線性經壓緊之RGB資料,但包括YCbCr之其他色彩空間為可能的)。
如上文所描述,在編碼器側之預處理單元134可根據輸入或目標色彩空間(例如,線性RGB資料110或YCrCb,若色彩轉換單元114接收線性RGB資料110且將色彩轉換成YCrCb值)或用以產生較好參數導出的補充色彩空間中的HDR信號性質(諸如直方圖分佈)導出且應用諸如Scale1及Offset1因數之參數。後處理單元138亦可根據TF單元112之輸出導出及應用參數,諸如Scale2及Offset2因數。
預處理單元134及/或後處理單元138可輸出反向預處理單元142及反向後處理單元144分別利用以執行預處理單元134及後處理單元138之反向操作的Scale1及Offset1因數及/或Scale2及Offset2因數。在一些
實例中,預處理單元134及後處理單元138可輸出用於判定Scale1、Offset1、Scale2及/或Offset2的資訊而非輸出Scale1、Offset1、Scale2及/或Offset2因數,以使得反向預處理單元142及反向後處理單元144可使用相同程序判定用於反向處理的Scale1、Offset1、Scale2及/或Offset2。在一些狀況下,預處理單元134及後處理單元138可輸出一或多個Scale1、Offset1、Scale2及/或Offset2且輸出可用以導出其他各者之資訊。
在一些實例中,視訊預處理器19(例如,經由控制器電路)可選擇性地啟用對預處理單元134及/或後處理單元138之使用。因此,視訊預處理器19可輸出指示是否啟用預處理單元134及/或後處理單元138之資訊。作為回應,視訊後處理器31(例如,經由控制器電路)可選擇性地啟用對反向後處理單元144及/或反向預處理單元142之使用。
可存在視頻編碼器20可對各種參數進行編碼且輸出各種參數之各種方式。舉例而言,視頻編碼器20可傳訊參數且視訊解碼器30可接收藉助於SEI(補充增強資訊)/VUI(視訊可用性資訊)經由位元串流、或作為旁側資訊提供至解碼器側(例如,視訊後處理器31)或根據其他標識(諸如,輸入及輸出色彩空間、所利用之轉移函數等等)由解碼器側(例如,藉由視訊後處理器31)導出的參數。
下文描述可根據本發明中所描述之實例技術應用之實例技術。可分開或以任何組合形式應用此等技術中之每一者。此外,在下文中進一步更詳細地描述此等技術中之每一者。
在上述實例中,視訊預處理器19可以各種方式傳訊參數資訊。僅作為一個實例,視頻編碼器20包括編碼單元(例如,熵編碼單元),且熵編碼單元可對經傳訊之參數資訊進行編碼。類似地,視訊解碼器30包括解碼單元(例如,熵解碼單元),且熵解碼單元可解碼經傳訊之參數資訊且視訊後處理器31可自視訊解碼器30接收參數資訊。可存在
可傳訊及接收參數資訊之各種方式,且本發明中所描述之技術並不限於任何特定技術。此外,如上文所示,在所有狀況下,視訊預處理器19可不需要傳訊參數資訊。在一些實例中,視訊後處理器31可導出參數資訊而不必自視訊預處理器19接收參數資訊。
下文為僅出於說明的目的所使用之實例實施且不應將其視為限制。舉例而言,本發明描述藉由在應用TF(例如,靜態、非內容自適應的)之前線性(縮放及偏移)預處理輸入線性色彩值及/或藉由線性(縮放及偏移)後處理由應用於線性色彩值之TF所產生之非線性碼字而實現自適應性。以下為技術之實施之若干非限制性實例。
圖11中展示所提出之正向ATF處理流程。在此實例中,輸入色彩空間(例如,RGB)中之線性信號分量s正由預處理單元134預處理以產生輸出信號s1。TF單元112將轉移函數應用於s1之值,產生輸出碼字S1。在下一步驟中,藉由後處理單元138後處理S1之碼字以產生輸出值S2。
圖12為圖11中所說明的ATF處理流程之反向處理流程。舉例而言,反向後處理單元144對碼字S2'執行反向後處理。碼字S2'實質上可類似於碼字S2。藉由反向後處理單元144的反向後處理之輸出為碼字S1'。碼字S1'可類似於碼字S1。反向TF單元126接收碼字S1',且反向TF單元126之輸出為s1',其表示色彩值且類似於色彩值s1。反向預處理單元142將s1'接收作為輸入且輸出色彩值s'。色彩值s'實質上類似於色彩值s。
為了易於說明,圖11及圖12中未說明各種程序。舉例而言,圖11及圖12中未說明色彩轉換及量化以及其各別反向程序。
下文描述預處理單元134及反向預處理單元142可執行之實例操作及演算法。預處理單元134由參數Scale 1及Offset 1界定。預處理單元134以將輸入信號特性調整為由TF單元112所應用之轉移函數之某些
性質為目標。圖13A及圖13B中說明此類處理之實例。圖13A展示與PQT轉移函數重疊之HDR信號之紅色分量之直方圖;應注意,出於可視化目的,以不同比例展示信號。圖13B中展示由PQTF產生之非線性信號之直方圖(例如,若TF單元112應用PQTF而不使用預處理單元134)。
如所說明,藉由PQTF之曲線(其與圖7相同),PQTF將更多碼字提供至低亮度樣本,例如允許藉由輸出動態範圍之50%表示輸入動態範圍之0…1%。對於某些類別之信號及/或應用,此類分佈可能並非最佳的。
對於線性預處理,預處理單元134可將線性預處理應用至輸入信號s,從而藉由應用偏移Offset1及縮放Scale1達成自TF單元112輸出之TF之較佳碼字分佈。
s1=Scale1 *(s-Offset1) (8)
由方程式8產生之信號值s1被利用於方程式1中,且應用方程式(3至7)中所指定之HDR處理管線(例如,藉由色彩轉換單元114及量化單元116)。
在解碼器側(例如,視訊後處理器31)處,反向預處理單元142將與預處理反向之操作應用如下:
其中術語s1'表示由如方程式2中所指定之反向TF產生之線性色彩值。換言之,s1'為由反向TF單元126應用之反向轉移函數之輸出。
圖14中展示具有參數(Scale1=0.1且Offset1=0.0001)的此類預處理的效果。圖14由與圖13A所說明之輸入相同的輸入產生。可以看出,S1信號之碼字相較於圖13B中所說明的實例更高效地佔據可用動態範圍,且高亮度值之表示較準確,此係因為該等碼字佔據大得多的動態範圍(參見圖14中之直方圖S1之經拉伸之峰值,相較於圖13B中之直方
圖峰值)。
在一些實例中,至TF單元112之輸入可為雙極信號。雙極信號意欲指示預處理單元138輸出之一些值為負值且其他值為正值。為了使得能夠由TF單元112將靜態TF甚至應用於(且由反向TF單元126應用反向靜態TF)雙極信號,TF單元112可調整預處理單元134之輸出及/或在應用轉移函數之後調整輸出。舉例而言,若預處理單元134之輸出為負值,則TF單元126可將轉移函數應用於預處理單元134之輸出之絕對值,且將結果乘以sign(s)函數之輸出,其中s為預處理單元134之輸出,且對於s<0,sign(s)=-1;對於s=0,sign(s)=0;以及對於s>0,sign(s)=1。因此,為了使得能夠應用靜態TF,TF單元112可利用經正值界定之函數,對於雙極信號,該函數暗示對雙極信號之正負號之某種特殊處理。
下文描述具備雙極信號處置之轉移函數。在一些實例中,技術可修改方程式(1)以能夠處置雙極輸入信號。
此技術可允許圖9之TF單元112在動態範圍之所需區域處分配所要陡度之TF,例如若需要對中等亮度位準之信號的較準確表示。圖15A及圖15B中展示參數scale=0.1且offset=0.1的此概念之可視化。
因此,用於雙極信號之反向TF將經界定為經修改之方程式2:
舉例而言,對於輸入碼字為正之狀況,圖10之反向TF單元126可應用反向轉移函數。對於為負之輸入碼字,反向TF單元126可判定輸入碼字之絕對值且將反向轉移函數應用於輸入碼字之絕對值。TF單元126可將結果乘以sign()函數之輸出,其中至sign()函數之輸入為反
向TF單元126所接收的碼字。
下文描述後處理單元138及反向後處理單元144可執行之實例操作及演算法。後處理單元138由參數Scale 2及Offset 2界定,且允許實現在藉由TF單元112應用TF之後對可用碼字空間(動態範圍)之高效利用。在下文中描述此類處理之實例。
以下為在藉由TF單元112應用TF之後的HDR信號之實例。圖16A展示在藉由TF單元112應用TF之後HDR信號之紅色分量之直方圖。如所說明,在此實例中,信號之直方圖並不佔據完整碼字空間,而是實際上僅利用碼字之60%。在信號以浮點準確度表示之前,此類表示均並非問題。然而,可較高效地利用未使用的碼字預算以減小由方程式7引入之量化誤差。
後處理單元138可將偏移及縮放之線性操作應用至在藉由TF單元112應用TF之後所產生之碼字S:S2=scale2 *(S-offset2) (12)
在某些構架中,後處理單元138(圖9)可如下將所得S值截割至所指定之動態範圍:S2=min(maxValue,max(S2,minValue)) (13)
在此後處理之後,在方程式(3)中利用信號值S2,且後接方程式(3至7)中所指定之HDR處理流程。
在解碼器側(例如,視訊後處理器31)處,如下實施可應用與後處理反向之操作的反向後處理單元144:
在某些構架中,反向後處理單元144可如下將所得S值截割至所指定之動態範圍:S'=min(maxValue,max(S',minValue)) (15)
其中術語S2'表示經解碼的非線性色彩值。
圖16B中展示藉由參數(scale=0.8且offset=0)的此類後處理之效果。可以看出,S2信號之碼字較高效地佔據可用碼字空間(動態範圍),且高亮度值之表示較準確,此係因為該等碼字佔據大得多的動態範圍(參見圖16B中之直方圖S2之經拉伸之峰值,相較於圖16A中之直方圖峰值)。
在上述實例中,並非應用方程式(12)之操作,後處理單元138可被視為應用第二轉移函數(其為線性轉移函數)而非TF單元112應用之非線性轉移函數。應用此第二轉移函數可等效於使輸入碼字與Scale2相乘且加上Offset2,且反向後處理單元144應用此程序的反向操作。因此,在一些實例中,可經由額外線性轉移函數TF2部署後處理單元138及反向後處理單元144(圖10)之技術。可經由Scale 2及Offset 2指定此額外線性轉移函數TF2之參數,例如如圖17A至圖17C中所展示。
舉例而言,圖17A說明與圖7(例如,TF單元112應用之靜態轉移函數)相同的轉移函數行為。圖17B說明在Scale2=1且Offset2=0之情況下後處理單元138應用於TF單元112之輸出的轉移函數。圖17C說明在Scale2=1.5且Offset2=-0.25之情況下後處理單元138應用於TF單元112之輸出的轉移函數。
以上實例描述存在預處理單元134(DRA1)及/或後處理單元138(DRA2)以及對應反向預處理單元142及反向後處理單元144的狀況。在一些實例中,可在色彩轉換(例如,在目標色彩空間中)之後而非在色彩轉換之前執行後處理。舉例而言,如圖18中所說明,TF單元112輸出至色彩轉換單元114,且後處理單元150在色彩轉換之後應用後處理。類似地,如圖19中所說明,反向後處理單元152對反量化單元122之輸出且在反向色彩轉換單元124應用色彩轉換之前應用反向後處理。在圖18及圖19中,為了方便起見,預處理單元134及反向預處理單元142未經說明,且可包括於其他實例中。
後處理單元150及反向後處理單元152可以類似於後處理單元138及反向後處理單元144之方式但在不同色彩空間(例如,YCbCr色彩空間而非RGB色彩空間)中作用。舉例而言,後處理單元150及反向後處理單元152可利用Scale2及Offset2參數以供縮放及偏移。下文描述在目標色彩空間處之後處理。
對於利用某些目標色彩空間(例如,BT709或BT2020之YCbCr)之一些HDR系統,且藉由對於R、G及B之3個分量利用相同參數之後處理,可在輸出色彩空間中應用後處理而非在輸入RGB色彩空間中應用後處理。
舉例而言,對於YCbCr色彩變換,如方程式3及5中所界定:○Y'=a * R'+b * G'+c * B' (16)
其中變數a、b、c、d1及d2為色彩空間之參數,且R'、G'、B'為在應用EOTF之後輸入色彩空間中之非線性色彩值。
界定於方程式12及13中之後處理被應用於輸入色彩空間處,即應用於R'、G'、B',從而產生輸出值R2'、G2'、B2':R2'=scale2 *(R'-offset2)G2'=scale2 *(G'-offset2)B2'=scale2 *(B'-offset2) (17)
在方程式17中,假定R、G及B域中後處理之參數相同。
然而,歸因於界定於方程式16及17中之程序之線性,後處理可實施於目標色彩空間中:Y2'=scaleY * Y'-offsetY Cb2=scaleB * Cb-offsetBCr2=scaleR * Cr-offsetR (18)
其中後處理單元150計算後處理之參數如下:
在解碼器側(例如,視訊後處理器31)處,藉由反向後處理單元152的後處理之反向操作可實施如下:
其中變數Y2'、Cb及Cr為經解碼且經解量化之分量,且如方程式19中所展示計算反向後處理之參數。
對於界定於BT2020中之YCbCr色彩變換,自輸入色彩空間中之後處理之參數及色彩變換之參數導出實施於目標色彩空間中之後處理之參數如下:
在一些實例中,具有自輸入色彩空間中的後處理之參數導出的參數的實施於目標色彩空間中之方程式20可實施為以下方程式20A:
在一些實例中,可經由乘法而非除法來實施上述方程式20A。
對於非線性處理,除上文所描述之預處理及後處理技術之外,後處理單元138或150及反向後處理單元144或152亦可利用某些非線性技術以進一步改良碼字利用。作為直方圖尾部處置之一個實例,後處理單元138或150及反向後處理單元144或152可藉由應用於處於指定範圍外之樣本的參數性逐段指定之轉移函數來補充上文所界定之線性碼字後處理。
上文所指定之HDR信號之處理流程通常在預定義之範圍內操作。
Range={minValue,MaxValue}
在標準化信號及上述方程式之狀況下,值為:Range={0.0..1.0}minValue=0.0 maxValue=1.0 (22)
經由將Offset2及Scale2應用於碼字S1,方程式12中所提出之後處理(例如,如藉由後處理單元138執行)可導致所得S2值溢出所指定之範圍邊界的情形。為了確保資料保持處於指定範圍內,可將截割操作應用至方程式13中之範圍{minValue…maxValue},例如如圖20A至圖20C中所展示。
圖20A為說明將截割應用至S2之直方圖之範圍的後處理的圖。圖20B為說明在方程式10中之後處理之後將截割應用至S2之直方圖之範圍的後處理的另一圖。圖20C為說明在方程式11中之截割之後將截割應用至S2之直方圖之範圍的後處理的另一圖。
如圖20C中所說明,在後處理之後應用截割將導致指定範圍外之資訊的不可恢復的損失。為了藉由應用Scale2/Offset2高效地表示有限碼字空間中之HDR信號且保存對HVS感知之TF假定,後處理單元138或150可藉由對產生指定範圍外之碼字的色彩樣本之特殊處置來補充上文所界定之碼字後處理,從而允許內容自適應直方圖尾部處置。
對於處於範圍外之由方程式12產生之所有S2,後處理單元138或150可應用參數性逐段指定之轉移函數。視頻編碼器20將彼等樣本的表示之參數與屬於指定範圍之S2碼字分開地編碼及傳訊。
作為說明,可提供操作以將由方程式12產生之碼字S2根據其與如方程式22中所指定的所支援之資料範圍的關係歸類。
其中S2 in 樣本屬於Range=[minValue…maxValue],S2 low 為範圍外之樣本集,且其小於或等於minValue;以及S2 high 為範圍外之樣本且其大於或等於maxValue。
該等技術可藉由個別地指定/判定/傳訊處於範圍外之S2 low 及S2 high 中之每一者的碼字值或指定/判定/傳訊最佳地表示範圍外之資訊的碼字群組來替換針對S2 low 及S2 high 之色彩值的方程式13中之截割操作。
下文為可替換對樣本S2 low 及S2 high 之截割的實例判定程序之非限制性實例:
a. 判定S2 low 及S2 low 中之每一者的平均值:Smin=mean(S2 low )Smax=mean(S2 high ) (26)
b. 判定S2 low 及S2 high 中之每一者的中位值:Smin=median(S2 low )
Smax=median(S2 high ) (27)
c. 判定依據某些準則(例如,最小絕對差總和(SAD)、均方誤差(MSE)或速率失真最佳化(RDO)成本)最佳地表示彼等樣本集合中之每一者的S2 low 及S2 high 中之每一者之值。
Smin=fun(S2 low )Smax=fun(S2 high ) (28)
在此等實例中,每一樣本值S2 low 或S2 high 將不用如方程式(13)中所展示之經截割之值替換,而是分別用方程式(26、27)中導出之Smin及Smax值替換。
所提出之非線性處理之參數為表示S2 low 及S2 high 中之每一者的碼字。將此等碼字傳訊至解碼器側(例如,視訊後處理器31)且由反向後處理單元144或152在重新建構之程序中利用:
舉例而言,在參數性逐段處理之以上實例中,後處理單元138或150可縮放及偏移(例如,將Scale2及Offset2應用於)由TF單元112壓緊色彩值(例如,由應用轉移函數產生之動態範圍壓緊)所產生之碼字。後處理單元138或150可判定一組經縮放及偏移之碼字具有小於最小臨限值或大於最大臨限值的值。後處理單元138或150可將第一碼字(例如,Smin)指派至具有小於最小臨限值之值的該組經縮放及偏移之碼字,且將第二碼字(例如,Smax)指派至具有大於最小臨限值之值的該組經縮放及偏移之碼字。對於在最小值與最大值之間的經縮放及偏移之碼字,後處理單元138或150可如以上實例中所描述地應用縮放及偏移。
反向後處理單元144或152(圖10或圖19)可執行參數性逐段處理之反向處理。舉例而言,反向後處理單元144或152可判定來自自視訊解碼器30所接收到的複數個碼字的第一組碼字表示具有小於最小臨限值或大於最大臨限值之值的經壓緊之色彩值(例如,其中由藉由TF單元112應用轉移函數而壓緊動態範圍)。反向後處理單元144或152可判定來自該複數個碼字之第二組碼字表示具有大於或等於最小臨限值且小於或等於最大臨限值之值的經壓緊之色彩值。對於此類實例,反向後處理單元144或152可將第一碼字(例如,Smin)指派至第一組碼字中的小於最小臨限值之碼字且將第二碼字(例如,Smax)指派至第一組碼字中的大於最大臨限值之碼字。可經由視頻編碼器20自視訊預處理器19傳訊Smin及Smax之值。反向後處理單元144或152可使用與上文所描述之彼等技術相同的實例技術反向縮放及偏移第二組碼字(例如,大於最小值且小於最大值之彼等碼字)。
在以上實例中,描述逐段應用縮放及偏移參數。在一些實例中,可對於預處理單元134及後處理單元138或152兩者以及反向後處理單元144或152及反向預處理單元142兩者延伸縮放及偏移參數之此類逐段應用。
舉例而言,反向後處理單元144或152接收之碼字可包括第一組碼字及第二組碼字。第一組碼字表示具有屬於動態範圍之第一分割區之值的經壓緊之色彩值,且第二組碼字表示具有屬於動態範圍之第二分割區之值的經壓緊之色彩值。在此等實例中,反向後處理單元144或152可藉由第一組縮放及偏移參數(例如,第一Scale2及第一Offset2)來縮放及偏移第一組碼字。反向後處理單元144或152可藉由第二組縮放及偏移參數(例如,第二Scale2及第二Offset2)來縮放及偏移第二組碼字。
作為另一實例,反向預處理單元142接收之色彩值可包括第一組
解壓之色彩值及第二組解壓之色彩值。第一組解壓之色彩值表示具有屬於動態範圍之第一分割區之值的解壓之色彩值,且第二組解壓之色彩值表示具有屬於動態範圍之第二分割區之值的解壓之色彩值。在此等實例中,反向預處理單元142可藉由第一組縮放及偏移參數(例如,第一Scale1及第一Offset1)來縮放及偏移第一組色彩值。反向預處理單元142可藉由第二組縮放及偏移參數(例如,第二Scale1及第二Offset1)來縮放及偏移第二組色彩值。
類似地,預處理單元134可判定第一組色彩值具有屬於動態範圍之第一分割區之值,且判定第二組色彩值具有屬於動態範圍之第二分割區之值。預處理單元134可藉由第一組縮放及偏移參數(例如,第一Scale1及第一Offset1)來縮放及偏移第一組色彩值。預處理單元134可藉由第二組縮放及偏移參數(例如,第二Scale1及第二Offset1)來縮放及偏移第二組色彩值。
後處理單元138或152可判定來自複數個碼字之第一組碼字具有屬於動態範圍之第一分割區的值,且判定來自複數個碼字之第二組碼字具有屬於動態範圍之第二分割區的值。後處理單元138或152可藉由第一組縮放及偏移參數(例如,第一Scale2及第一Offset2)來縮放及偏移第一組碼字且可藉由第二組縮放及偏移參數(例如,第二Scale2及第二Offset2)來縮放及偏移第二組碼字。
圖21A及圖21B為說明在具有尾部處置之後處理之後的碼字之直方圖的圖。圖22為說明具備靜態TF之內容自適應HDR管線(編碼器側)之另一實例的概念圖。圖23為說明具備靜態TF之內容自適應HDR管線(解碼器側)之另一實例的概念圖。圖22及圖23幾乎與圖11及圖12相同,但圖22及圖23說明在一些實例中,若經縮放及偏移之值在範圍外,則輸出Smin及Smax碼字;且說明在一些實例中,若該等值在範圍外,則Smin'及Smax'(兩者類似於Smin及Smax)為所接收到的碼字。
在上述實例中,對於小於最小值之碼字,使單個碼字反轉;且對於大於最大值之碼字,使單個碼字反轉。在一些實例中,屬於指定範圍外之直方圖尾部之碼字可藉由多於單個經保留碼字的碼字表示。
後處理單元138可判定且傳訊碼字S之動態範圍之指定區域的多個經保留之碼字。在解碼器側(例如,視訊後處理器31)處,反向後處理單元144可判定指定區域的經保留之碼字。該技術可在解碼器處判定、傳訊且應用與經保留碼字中之每一者相關聯的信號值S'。
圖24為說明具備兩個經保留之碼字處置色彩值之直方圖的圖。舉例而言,在圖24中展示此實例之可視化,在S2low中有2個經保留之碼字處置色彩值。在此實例中,將S2 low 碼字分離在兩個子範圍中,其中分別藉由碼字Smin1及Smin2來寫碼每一子範圍。在類似於方程式26至28之程序中,在編碼器側處(例如,藉由視訊預處理器19)判定與此等碼字中之每一者相關聯的值;將該值傳訊至解碼器30且在解碼器側處(例如,藉由視訊後處理器31)經由方程式29應用。
在一些實例中,該等技術可以轉移函數之形式實施。轉移函數之非線性部分(即,給定實例中之直方圖尾部處置)可藉由自適應轉移函數模型化,其中兩個經保留之碼字與在解碼器側處經判定(例如,在解碼器側處經傳訊及應用)之值相關聯。
圖25A及圖25B為說明參數自適應函數之圖。圖25A說明在Scale2=1.5且Offset=-0.25之情況下經模型化之線性轉移函數(TF2),且圖25B說明在Scale2=1.5且Offset=-0.25之情況下經模型化之線性轉移函數(TF2)及參數化的非線性區段。非線性區段係藉由與2個經判定且經傳訊至解碼器的色彩值Smin1及Smin2相關聯的2個碼字而參數化,以及將S2 high 之碼字截割至範圍之maxValue。
下文描述藉由逐段線性轉移函數之後處理(例如,藉由後處理單元138或150)。後處理單元138或150可將S之碼字空間分成有限數目個
區段r,使得:範圍={r i },其中i=0..N (30)
對於此等區段ri中之每一者,後處理單元138或150判定獨立後處理參數Scale2i及Offset2i,且傳訊及在編碼器側及解碼器側處將Scale2i及Offset2i參數應用於碼字S以產生輸出S2。
Scales={Scale2i};Offsets={Offset2i};i=0..N
就轉移函數而言,實例演算法可經模型化如下。圖26A至圖26C為說明具有逐段線性轉移函數之後處理的圖。圖26A說明由PQTF產生之S信號之直方圖,圖26B說明後處理之參數性逐段線性TF,且圖26C說明由後處理之TF產生之S2信號之直方圖。
在圖26A中之S信號之直方圖中,藉由垂直柵格展示動態範圍之引入區段。可以看出,信號佔據約80%之可用碼字,且可利用20%之可用碼字以減小量化誤差,如方程式12及13中所提出。同時,直方圖展示相當大部分之碼字位於自碼字範圍之0.6伸至0.8的第4區段中。可利用可用碼字預算以改良此特定第4區段的量化誤差,使得不會改變其他區段之表示之準確度。
此等r區段(N=5)之後處理參數可撰寫如下:Scales2={1,1,1,2,1};Offsets2={-0.1,-0.1,-0.1,-0.1,0.1}
此將導致圖26B中所展示之逐段線性轉移函數。由應用此TF產生之S2信號之直方圖展示於圖26C中。如所見,直方圖移位至左側以佔據更多碼字且位於第4區段中之峰值伸至較大動態範圍,因此提供表示之較高準確度且減小量化誤差。
一般而言,此方案之參數可包括:
a. 動態範圍之分割區數
b. 區段中之每一者之範圍
c. 此等區段中之每一者的Scale及Offset
應用:
a. 在一些實例中,技術可包括預處理、後處理以及非線性處理技術。在一些實例中,該等技術可藉由應用於在指定範圍內之樣本的參數性逐段指定之轉移函數補充如上文所界定之線性碼字後處理。在一個實例中,該等技術可保留指定範圍內之有限數目個碼字以識別調用此參數性轉移函數之樣本。
b. 在一些實例中,預處理及後處理技術經界定為縮放及偏移,即應用至輸入信號之Scale 1及Offset 1及/或Scale2及Offset2。在一些實例中,以轉移函數之形式實施技術。
c. 在一些實例中,非線性處理可包括用於界定屬於指定範圍外之色彩值的單個參數,一個參數用於小於minValue之樣本且另一個參數用於大於maxValue之樣本。在一些實例中,可應用經分開界定之轉移函數。
d. 在一些實例中,獨立地針對每一色彩分量(獨立參數集)(例如,獨立地針對R、G、B或Y)進行動態範圍調整(DRA)。在一些實例中,將單個跨分量參數集應用於所有色彩分量。
e. 在一些實例中,可判定整個視訊序列之參數。在一些實例中,該等參數可在時間上經調適或為時空自適應的。
f. 在一些實例中,可在具備SDR相容性之HDR系統中利用所提出之處理。在此類系統中,藉由使用中之某一轉移函數,將所提出之技術應用至表示HDR信號(例如,大於100尼特及/或小於0.01尼特)之碼字,使得其餘碼字未經處理,因此提供SDR相容性。
參數導出:
a. 在一些實例中,獨立地導出預處理及後處理之參數。在一些實例中,聯合地導出預處理及後處理之參數。
b. 在一些實例中,自使量化誤差最小化之程序導出或藉由使成
本函數最小化導出參數,該成本函數係由由轉換及寫碼產生之位元速率之加權總和及由此等兩個有損程序引入之失真形成。
c. 在一些實例中,對於每一分量,可使用關於彼分量之資訊分開判定參數及/或可藉由使用跨分量資訊導出該等參數。
d. 在一些實例中,可根據轉移函數TF之類型及性質判定參數(諸如,應用範圍),例如處理可僅應用至表示HDR信號(例如,大於100尼特)之碼字且表示<=100之SDR信號的碼字保持不變。
e. 在一些實例中,可將範圍參數作為旁側資訊提供至解碼器且隨在處理時所利用之TF而變地應用該等參數。
f. 在一些實例中,可根據轉移函數TF之類型及性質判定參數(諸如,應用範圍),例如對於以轉變為特徵之TF,可利用轉變(拐點)位置以判定應用處理之動態範圍。
g. 參數可包括對多個經保留碼字及其實際值之識別
h. 參數可包括對與經保留碼字相關聯之程序之識別
i. 參數可包括用於應用所判定之處理的碼字空間內之子範圍的數目
j. 參數可包括供應用所判定之處理的碼字值子範圍識別
參數傳訊:
a. 在一些實例中,在編碼器側(例如,視訊預處理器19)處估計參數且將其經由位元串流(後設資料、SEI訊息、VUI等)傳訊至解碼器(例如,視訊後處理器31)。解碼器自位元串流接收參數。
b. 在一些實例中,經由指定程序自輸入信號或自與輸入信號及處理流程相關聯之其他可用參數在編碼器及解碼器側處導出參數。
c. 在一些實例中,顯式地傳訊參數且該等參數足以用於在解碼器側處執行DRA。在一些實例中,自其他輸入信號參數(例如,輸入色域及目標色彩容器(原色)之參數)導出參數。
d. 在一些實例中,所提出之系統之參數可經傳訊為系統中所利用之轉移函數(TF)之參數,或作為旁側資訊提供至解碼器以用於特定轉移函數。
e. 所提出之方案之參數可藉助於SEI/VUI經由位元串流傳訊或作為旁側資訊提供至解碼器,或由解碼器自其他識別(諸如,輸入及輸出色彩空間、所利用之轉移函數等等)導出該等參數。
圖29為說明在內容自適應高動態範圍(HDR)系統中之視訊處理之實例方法的流程圖。關於視訊後處理器31描述圖29之實例以將所接收到的視訊資料轉換成供顯示之視訊資料。在一些實例中,視訊後處理器31可針對每一色彩執行實例技術(一次針對紅色分量,一次針對綠色分量,且一次針對藍色分量)以使得該處理為獨立的。
視訊後處理器31接收表示視訊資料之經壓緊之色彩值的第一複數個碼字,其中經壓緊之色彩值表示第一動態範圍內之色彩(200)。舉例而言,為了降低位元速率,視訊預處理器19可已壓緊色彩值之動態範圍。壓緊之結果為第一複數個碼字。視訊後處理器31可直接自視訊解碼器30或經由視訊資料記憶體140接收第一複數個碼字。經壓緊之色彩值可處於特定色彩空間(諸如,RGB或YCrCb)中。可藉由反量化單元122反量化經壓緊之色彩值。
反向後處理單元144或152可應用反向後處理功能,其減小碼字之範圍以產生第二複數個碼字(202)。在一些實例中,反向後處理單元144可對經色彩轉換之碼字(例如,經由反向色彩轉換單元124轉換之色彩)應用反向後處理操作。在一些實例中,反向後處理單元152可在色彩轉換之前應用反向後處理,且反向色彩轉換單元124可轉換反向後處理單元152之輸出。
反向後處理單元144或152可對第一複數個碼字執行反向縮放及偏移。反向後處理單元144或152可接收縮放及偏移參數(例如,Scale2
及Offset2)。在一些實例中,反向後處理單元144或152可接收資訊,根據資訊,反向後處理單元144或152判定縮放及偏移參數。一般而言,反向後處理單元144或152可自所接收到的位元串流或經分開傳訊之旁側資訊導出縮放及偏移參數以用於對碼字之反向縮放及偏移。當接收位元串流中之縮放及偏移參數時,反向後處理單元144或152接收縮放及偏移參數以及待處理之圖像資料。當將縮放及偏移參數作為經分開傳訊之旁側資訊接收時,反向後處理單元144或152接收縮放及偏移參數,而不具有待處理之任何圖像資料(例如,在任何圖像資料之前接收縮放及偏移參數)。
在一些實例中,並非對於碼字之所有值將縮放及偏移應用至第一複數個碼字,反向後處理單元144或152可應用逐段縮放及偏移。舉例而言,反向後處理單元144或152可判定來自第一複數個碼字之第一組碼字表示具有小於最小臨限值或大於最大臨限值之值的經壓緊之色彩值且來自第一複數個碼字之第二組碼字表示具有小於最大臨限值且大於最小臨限值之值的經壓緊之色彩值。
反向後處理單元144或152可將第一碼字(例如,Smin')指派至第一組碼字中的小於最小臨限值之碼字,且將第二碼字(例如,Smax')指派至第一組碼字中的大於最大臨限值之碼字。反向後處理單元144或152可反向縮放及偏移(例如,基於Scale2及Offset2)第二組碼字。儘管描述一個最小臨限值及一個最大臨限值,但在一些實例中,可存在複數個此類臨限值以及針對該等臨限值中之每一者的經保留之碼字。反向後處理單元144或152可接收Smin'、Smax'或經保留之碼字;接收關於如何判定此等碼字之資訊,或此等碼字可預儲存在視訊資料記憶體140中。
在使用反向後處理單元152之實例中,反向TF單元126自反向後處理單元144或自反向色彩轉換單元124接收輸出。然而,在一些實例
中,反向後處理單元144或152可能未經啟用或可能不可用。在此等實例中,反向TF單元126接收第一複數個碼字。
反向TF單元126可使用對視訊資料非自適應之反向靜態轉移函數基於第一複數個碼字解壓第二複數個碼字以產生解壓之色彩值(204)。解壓之色彩值表示第二動態範圍內之色彩。第二複數個碼字為來自經反向後處理之第一複數個碼字(例如,在反向色彩轉換之後來自反向後處理單元144或來自反向後處理單元152之輸出)或第一複數個碼字(例如,其中反向後處理單元144或152經停用或不可用)的碼中之一者。
在一些實例中,反向TF單元126可輸出解壓之色彩值以供輸出用於顯示或進一步處理(208)。然而,在一些實例(諸如,其中視訊預處理器19在壓緊之前應用預處理)中,反向TF單元126可將解壓之色彩值輸出至反向預處理單元142。在此狀況下,反向預處理單元142可輸出經反向預處理的解壓之色彩值以供顯示或進一步處理,如在下文中參看視情況選用之操作206所論述。解壓之色彩值之動態範圍可大於反向TF單元126接收之碼字之動態範圍。換言之,反向TF單元126增大碼字之動態範圍以產生具有較高動態範圍之解壓之色彩值。
在一些實例中,反向預處理單元142可對解壓之色彩值應用反向預處理(206)。反向預處理單元142可接收縮放及偏移參數(例如,Scale1及Offset1)。在一些實例中,反向預處理單元142可接收資訊,根據資訊,反向預處理單元142判定縮放及偏移參數(例如,圖像中之色彩之直方圖)。反向預處理單元142輸出所得經反向預處理的解壓之色彩值以供顯示或進一步處理(208)。
一般而言,反向預處理單元142可自所接收到的位元串流或經分開傳訊之旁側資訊導出縮放及偏移參數以用於對碼字之反向縮放及偏移。當接收位元串流中之縮放及偏移參數時,反向預處理單元142接
收縮放及偏移參數以及待處理之圖像資料。當接收經分開傳訊之旁側資訊中的縮放及偏移參數時,反向預處理單元142接收縮放及偏移參數,而不具有待處理之任何圖像資料(例如,在任何圖像資料之前接收縮放及偏移參數)。
如上文所描述,視訊後處理器31可執行反向後處理第一複數個碼字以產生第二複數個碼字或對解壓之色彩值執行反向預處理中之至少一者。然而,在一些實例中,視訊後處理器31可執行反向後處理第一複數個碼字以產生第二複數個碼字(例如,經由反向後處理單元144或152)及反向預處理解壓之色彩值(例如,經由反向預處理單元142)以產生經反向預處理的解壓之色彩值兩者。
圖30為說明在內容自適應高動態範圍(HDR)系統中之視訊處理之另一實例方法的流程圖。關於視訊預處理器19描述圖30之實例以將所接收到的視訊資料轉換成供傳輸之視訊資料。在一些實例中,視訊預處理器19可針對每一色彩執行實例技術(一次針對紅色分量,一次針對綠色分量,且一次針對藍色分量)以使得該處理為獨立的。
視訊預處理器19接收表示第一動態範圍內之色彩的視訊資料之複數個色彩值(300)。舉例而言,視訊預處理器19可接收儲存在視訊資料記憶體132中之視訊資料,其中此類資料係自視訊源18接收到的。色彩值可處於RGB色彩空間中,但色彩轉換單元114有可能在處理之前將色彩轉換至YCrCb色彩空間。
預處理單元134可對色彩值執行預處理,使得當藉由TF單元112處理預處理色彩值時,所得碼字各自大致表示色彩值之範圍,或至少並不受到很大加權使得低照明色彩由大得多的範圍之碼字表示且高照明色彩由相對較小範圍之碼字表示(302)。舉例而言,預處理單元134可縮放及偏移(例如,經由Scale1及Offset1)。預處理單元134可基於圖像中的色彩值之直方圖判定縮放及偏移參數(例如,基於輸入線性色
彩值自適應地判定縮放因數及偏移因數)。預處理單元134可輸出Scale1及Offset1之值或可輸出可用以判定Scale1及Offset1之值的資訊。舉例而言,視訊預處理器19可使得視頻編碼器20在位元串流中或作為旁側資訊傳訊縮放及偏移參數以用於縮放及偏移輸入線性色彩值。
TF單元112可接收預處理單元134之輸出以用於壓緊色彩值。然而,如所說明,在一些實例中,預處理單元134可能未經啟用或不可用。在此等實例中,TF單元112可接收複數個色彩值而不會預處理該等色彩值。
TF單元112可使用對經壓緊之視訊資料非自適應之靜態轉移函數壓緊色彩值以產生表示經壓緊之色彩值的複數個碼字,其中經壓緊之色彩值表示第二動態範圍內之色彩(304)。TF單元112可減小色彩值之動態範圍,從而促進此類色彩值之傳輸。
在一些實例中,TF單元112可基於由碼字表示之經壓緊之色彩值輸出色彩值(308)。然而,在一些實例中,後處理單元138或150可後處理由壓緊色彩值產生之碼字以產生更好地使用碼字空間之碼字(例如,提高對可用碼字空間之使用)(306)。後處理單元150可接收色彩轉換單元114之輸出以供後處理,且色彩轉換單元114接收TF單元112之輸出。後處理單元138或150可藉由Scale2縮放且藉由Offset2偏移。舉例而言,視訊預處理器19可使得視頻編碼器20在位元串流中或作為旁側資訊傳訊縮放及偏移參數以用於對碼字之縮放及偏移。
在一些實例中,並非對於碼字之所有值將縮放及偏移應用至TF單元112輸出之複數個碼字,後處理單元138或150可應用逐段縮放及偏移。舉例而言,後處理單元138或150可判定一組經縮放及偏移之碼字具有小於最小臨限值或大於最大臨限值的值。後處理單元138或150可將第一碼字(Smin)指派至具有小於最小臨限值之值的該組經縮放及
偏移之碼字,且將第二碼字(Smax)指派至具有大於最大臨限值之值的該組經縮放及偏移之碼字。對於其他碼字,後處理單元138或150可縮放及偏移其他碼字(例如,基於Scale2及Offset2)。儘管描述一個最小臨限值及一個最大臨限值,但在一些實例中,可存在複數個此類臨限值以及針對該等臨限值中之每一者的經保留之碼字。後處理單元138或150可輸出Smin、Smax或經保留之碼字的資訊,或輸出關於如何判定此等碼字之資訊。
視訊預處理器19可基於經壓緊之色彩值或經後處理的經壓緊之色彩值中之一者而輸出色彩值(308)。舉例而言,若啟用後處理單元138或150,則視訊預處理器19可基於經後處理的經壓緊之色彩值而輸出色彩值。若後處理單元138或150未經啟用或不可用,則視訊預處理器19可基於如由TF單元112壓緊且無後處理的經壓緊之色彩值而輸出色彩值。然而,色彩轉換單元114及量化單元116可在輸出之前執行各別處理。
應認識到,取決於實例,本文中所描述之技術中之任一者的某些動作或事件可以不同序列執行,可添加、合併或完全省略該等動作或事件(例如,並非所有所描述動作或事件對於該等技術之實踐皆係必要的)。此外,在某些實例中,可例如經由多線緒處理、中斷處理或多個處理器同時而非順序執行動作或事件。
在一或多個實例中,所描述功能可以硬體、軟體、韌體或其任何組合來實施。若以軟體實施,則該等功能可作為一或多個指令或程式碼而儲存於電腦可讀媒體上或經由電腦可讀媒體進行傳輸,且藉由基於硬體之處理單元執行。電腦可讀媒體可包括電腦可讀儲存媒體(其對應於諸如資料儲存媒體之有形媒體)或通信媒體(其包括促進(例如)根據通信協定將電腦程式自一處轉移至另一處的任何媒體)。以此方式,電腦可讀媒體大體上可對應於(1)非暫時性的有形電腦可讀儲
存媒體,或(2)諸如信號或載波之通信媒體。資料儲存媒體可為可由一或多個電腦或一或多個處理器存取以擷取用於實施本發明中所描述之技術的指令、程式碼及/或資料結構的任何可用媒體。電腦程式產品可包括電腦可讀媒體。
藉由實例而非限制,此等電腦可讀儲存媒體可包含RAM、ROM、EEPROM、CD-ROM或其他光碟儲存器、磁碟儲存器或其他磁性儲存裝置、快閃記憶體或可用於儲存呈指令或資料結構形式之所要程式碼且可由電腦存取的任何其他媒體。另外,任何連接被恰當地稱為電腦可讀媒體。舉例而言,若使用同軸電纜、光纜、雙絞線、數位用戶線(DSL)或無線技術(諸如,紅外線、無線電及微波)自網站、伺服器或其他遠端源傳輸指令,則同軸電纜、光纜、雙絞線、DSL或無線技術(諸如,紅外線、無線電及微波)包括於媒體之定義中。然而,應理解,電腦可讀儲存媒體及資料儲存媒體不包括連接、載波、信號或其他暫時性媒體,而是針對非暫時性有形儲存媒體。如本文中所使用,磁碟及光碟包括緊密光碟(CD)、雷射光碟、光學光碟、數位影音光碟(DVD)、軟性磁碟及藍光光碟,其中磁碟通常以磁性方式再生資料,而光碟使用雷射以光學方式再生資料。以上之組合亦應包括於電腦可讀媒體之範疇內。
可由諸如一或多個數位信號處理器(DSP)、通用微處理器、特殊應用積體電路(ASIC)、場可程式化邏輯陣列(FPGA)或其他等效整合式或離散邏輯電路之一或多個處理器來執行指令。因此,如本文中所使用之術語「處理器」可指上述結構或適合於實施本文中所描述之技術的任何其他結構中之任一者。另外,在一些態樣中,本文中所描述之功能性可提供於經組態用於編碼及解碼之專用硬體及/或軟體模組內,或併入組合式編碼解碼器中。此外,該等技術可完全實施於一或多個電路或邏輯元件中。
本發明之技術可在廣泛多種裝置或設備中實施,該等裝置或設備包括無線手機、積體電路(IC)或IC集合(例如,晶片組)。本發明中描述各種組件、模組或單元以強調經組態以執行所揭示技術之裝置的功能態樣,但未必要求由不同硬體單元來實現。確切而言,如上文所描述,可將各種單元組合於編碼解碼器硬體單元中,或藉由互操作性硬體單元(包括如上文所描述之一或多個處理器)之集合結合合適之軟體及/或韌體來提供該等單元。
已描述各種實例。此等及其他實例係在以下申請專利範圍之範疇內。
10‧‧‧視訊編碼及解碼系統/系統
12‧‧‧源裝置/裝置
14‧‧‧目的地裝置/裝置
16‧‧‧電腦可讀媒體
18‧‧‧視訊源
19‧‧‧視訊預處理器
20‧‧‧視訊編碼器
21‧‧‧視訊編碼單元
22‧‧‧輸出介面
28‧‧‧輸入介面
29‧‧‧視訊解碼單元
30‧‧‧視訊解碼器
31‧‧‧視訊後處理器
32‧‧‧顯示裝置
Claims (38)
- 一種視訊處理之方法,該方法包含:接收表示視訊資料之經壓緊之色彩值的第一複數個碼字,該等經壓緊之色彩值表示一第一動態範圍內之色彩;使用對該視訊資料非自適應之一反向靜態轉移函數基於該第一複數個碼字解壓第二複數個碼字以產生解壓之色彩值,該等解壓之色彩值表示一第二、不同動態範圍內之色彩,其中該第二複數個碼字為來自經反向後處理之該第一複數個碼字或該第一複數個碼字的碼字中之一者;反向後處理該第一複數個碼字以產生該第二複數個碼字或反向預處理該等解壓之色彩值中之至少一者;以及輸出該等解壓之色彩值或該等經反向預處理的解壓之色彩值。
- 如請求項1之方法,其中反向後處理該第一複數個碼字以產生該第二複數個碼字或反向預處理該等解壓之色彩值中之至少一者包含:反向後處理該第一複數個碼字以產生該第二複數個碼字;以及反向預處理該等解壓之色彩值以產生該等經反向預處理的解壓之色彩值。
- 如請求項1之方法,其中該反向後處理包含反向縮放以及偏移該第一複數個碼字,且其中該反向預處理包含反向縮放以及偏移由該解壓產生之該解壓之第二複數個碼字。
- 如請求項3之方法,其進一步包含:對於該反向縮放及偏移該第一複數個碼字以及該反向縮放及 偏移由該解壓產生之該解壓的第二複數個碼字中之一者或兩者,自一所接收到的位元串流或經分開傳訊之旁側資訊導出縮放及偏移參數。
- 如請求項1之方法,其進一步包含:判定來自該第一複數個碼字的第一組碼字表示具有小於一最小臨限值或大於一最大臨限值之值的經壓緊之色彩值;以及判定來自該第一複數個碼字的第二組碼字表示具有大於或等於該最小臨限值且小於或等於該最大臨限值的值的經壓緊之色彩值,其中反向後處理該第一複數個碼字包含:將一第一碼字指派至該第一組碼字中之小於該最小臨限值的碼字,將一第二碼字指派至該第一組碼字中之大於該最大臨限值的碼字,以及反向縮放及偏移該第二組碼字。
- 如請求項5之方法,其進一步包含:基於自一位元串流或自經分開傳訊之旁側資訊所接收到的指示該第一碼字、該第二碼字、該最大臨限值或該最小臨限值之資訊判定該第一碼字、該第二碼字、該最大臨限值以及該最小臨限值中之一或多者;或應用處理以判定該第一碼字、該第二碼字、該最大臨限值或該最小臨限值。
- 如請求項1之方法,其進一步包含:判定來自該第一複數個碼字之第一組碼字表示具有屬於該第一動態範圍之一第一分割區的值的經壓緊之色彩值;以及判定來自該第一複數個碼字之第二組碼字表示具有屬於該第一動態範圍之一第二分割區的值的經壓緊之色彩值, 其中反向後處理該第一複數個碼字包含:藉由第一組縮放及偏移參數來縮放及偏移該第一組碼字,以及藉由第二組縮放及偏移參數來縮放及偏移該第二組碼字。
- 如請求項1之方法,其進一步包含:判定第一組該等解壓之色彩值表示具有屬於該第二動態範圍之一第一分割區之值的解壓之色彩值;以及判定第二組該等解壓之色彩值表示具有屬於該第二動態範圍之一第二分割區之值的解壓之色彩值,其中反向預處理該等解壓之色彩值包含:藉由第一組縮放及偏移參數來縮放及偏移該第一組該等解壓之色彩值,以及藉由第二組縮放及偏移參數來縮放及偏移該第二組該等解壓之色彩值。
- 一種視訊處理之方法,該方法包含:接收表示一第一動態範圍內之色彩的視訊資料之複數個色彩值;使用對經壓緊之該視訊資料非自適應的一靜態轉移函數壓緊該等色彩值以產生表示經壓緊之色彩值之複數個碼字,該等經壓緊之色彩值表示一第二、不同動態範圍內之色彩;在壓緊之前預處理該等色彩值以產生被壓緊之該等色彩值或後處理由該壓緊該等色彩值所產生之碼字中之至少一者;以及基於該等經壓緊之色彩值或該等經後處理之經壓緊之色彩值中之一者來輸出色彩值。
- 如請求項9之方法,其中在壓緊之前預處理該等色彩值以產生被壓緊之該等色彩值或後處理由該壓緊該等色彩值所產生之碼字 中之至少一者包含:在壓緊之前預處理該等色彩值以產生被壓緊之該等色彩值;以及後處理由該壓緊該等色彩值所產生之碼字。
- 如請求項9之方法,其中該預處理包含縮放及偏移輸入線性色彩值,且其中該後處理包含縮放及偏移由該壓緊產生之該等碼字。
- 如請求項11之方法,其進一步包含:對於該縮放及偏移輸入線性色彩值以及縮放及偏移由該壓緊產生之該等碼字中之一者或兩者,將縮放及偏移參數在一位元串流中或作為旁側資訊傳訊。
- 如請求項11之方法,其中縮放及偏移輸入線性色彩值包含基於該等輸入線性色彩值自適應地判定一縮放因數及一偏移因數,且其中縮放及偏移該等碼字包含基於該等碼字自適應地判定一縮放因數及一偏移因數以提高對可用碼字空間之使用。
- 如請求項9之方法,其中後處理該等碼字包含:縮放及偏移由該壓緊該等色彩值所產生之該等碼字;判定一組該等經縮放且偏移之碼字具有小於一最小臨限值或大於一最大臨限值之值;將一第一碼字指派至具有小於該最小臨限值之值的該組經縮放且偏移之碼字;以及將一第二碼字指派至具有大於該最大臨限值之值的該組經縮放且偏移之碼字。
- 如請求項14之方法,其進一步包含:將指示該第一碼字、該第二碼字、該最大臨限值或該最小臨限值中之一或多者的資訊在一位元串流中或作為旁側資訊傳 訊。
- 如請求項9之方法,其進一步包含:判定第一組該等色彩值具有屬於該第一動態範圍之一第一分割區之值;以及判定第二組該等色彩值具有屬於該第一動態範圍之一第二分割區之值,其中預處理該等色彩值包含:藉由第一組縮放及偏移參數來縮放及偏移該第一組該等色彩值,以及藉由第二組縮放及偏移參數來縮放及偏移該第二組該等色彩值。
- 如請求項9之方法,其進一步包含:判定來自該複數個碼字之第一組碼字具有屬於該第二動態範圍之一第一分割區之值;以及判定來自該複數個碼字之第二組碼字具有屬於該第二動態範圍之一第二分割區之值,其中後處理該複數個碼字包含:藉由第一組縮放及偏移參數來縮放及偏移該第一組碼字,以及藉由第二組縮放及偏移參數來縮放及偏移該第二組碼字。
- 一種用於視訊處理之裝置,該裝置包含:一視訊資料記憶體,其經組態以儲存視訊資料;以及一視訊後處理器,其包含固定功能或可程式化電路中之至少一者,該視訊後處理器經組態以:自該視訊資料記憶體接收表示視訊資料之經壓緊的色彩值的第一複數個碼字,該等經壓緊之色彩值表示一第一動態範 圍內之色彩;使用對該視訊資料非自適應之一反向靜態轉移函數基於該第一複數個碼字解壓第二複數個碼字以產生解壓之色彩值,該等解壓之色彩值表示一第二、不同動態範圍內之色彩,其中該第二複數個碼字為來自經反向後處理之該第一複數個碼字或該第一複數個碼字的碼字中之一者;反向後處理該第一複數個碼字以產生該第二複數個碼字或反向預處理該等解壓之色彩值中之至少一者;以及輸出該等解壓之色彩值或該等經反向預處理的解壓之色彩值。
- 如請求項18之裝置,其中該視訊後處理器經組態以:反向後處理該第一複數個碼字以產生該第二複數個碼字;以及反向預處理該等解壓之色彩值以產生該等經反向預處理的解壓之色彩值。
- 如請求項18之裝置,其中為了反向後處理,該視訊後處理器經組態以反向縮放及偏移該第一複數個碼字,且其中為了反向預處理,該視訊後處理器經組態以反向縮放及偏移由該解壓產生之該解壓之第二複數個碼字。
- 如請求項20之裝置,其中該視訊後處理器經組態以:對於該反向縮放及偏移該第一複數個碼字以及該反向縮放及偏移由該解壓產生之該解壓的第二複數個碼字中之一者或兩者,自一所接收到的位元串流或經分開傳訊之旁側資訊導出縮放及偏移參數。
- 如請求項18之裝置,其中該視訊後處理器經組態以:判定來自該第一複數個碼字之第一組碼字表示具有小於一最 小臨限值或大於一最大臨限值之值的經壓緊之色彩值;以及判定來自該第一複數個碼字之第二組碼字表示具有大於或等於該最小臨限值且小於或等於該最大臨限值之值的經壓緊之色彩值,其中為了反向後處理該第一複數個碼字,該視訊後處理器經組態以:將一第一碼字指派至該第一組碼字中之小於該最小臨限值的碼字,將一第二碼字指派至該第一組碼字中之大於該最大臨限值的碼字,以及反向縮放及偏移該第二組碼字。
- 如請求項22之裝置,其中該視訊後處理器經組態以:基於自一位元串流或自經分開傳訊之旁側資訊所接收到的指示該第一碼字、該第二碼字、該最大臨限值或該最小臨限值的資訊來判定該第一碼字、該第二碼字、該最大臨限值以及該最小臨限值中之一或多者;或應用處理以判定該第一碼字、該第二碼字、該最大臨限值或該最小臨限值。
- 如請求項18之裝置,其中該視訊後處理器經組態以:判定來自該第一複數個碼字之第一組碼字表示具有屬於該第一動態範圍之一第一分割區之值的經壓緊之色彩值;以及判定來自該第一複數個碼字之第二組碼字表示具有屬於該第一動態範圍之一第二分割區之值的經壓緊之色彩值,其中為了反向後處理該第一複數個碼字,該視訊後處理器經組態以:藉由第一組縮放及偏移參數來縮放及偏移該第一組碼字,以及 藉由第二組縮放及偏移參數來縮放及偏移該第二組碼字。
- 如請求項18之裝置,其中該視訊後處理器經組態以:判定第一組該等解壓之色彩值表示具有屬於該第二動態範圍之一第一分割區之值的解壓之色彩值;以及判定第二組該等解壓之色彩值表示具有屬於該第二動態範圍之一第二分割區之值的解壓之色彩值,其中為了反向預處理該等解壓之色彩值,該視訊後處理器經組態以:藉由第一組縮放及偏移參數來縮放及偏移該第一組該等解壓之色彩值,以及藉由第二組縮放及偏移參數來縮放及偏移該第二組該等解壓之色彩值。
- 一種用於視訊處理之裝置,該裝置包含:一視訊資料記憶體,其經組態以儲存視訊資料;以及一視訊預處理器,其包含固定功能或可程式化電路中之至少一者,該視訊預處理器經組態以:自該視訊資料記憶體接收表示一第一動態範圍內之色彩的視訊資料之複數個色彩值;使用對經壓緊之該視訊資料非自適應的一靜態轉移函數壓緊該等色彩值以產生表示經壓緊之色彩值之複數個碼字,該等經壓緊之色彩值表示一第二、不同動態範圍內之色彩;在壓緊之前預處理該等色彩值以產生被壓緊之該等色彩值或後處理由該壓緊該等色彩值所產生之碼字中之至少一者;以及基於該等經壓緊之色彩值或該等經後處理之經壓緊色彩值中之一者來輸出色彩值。
- 如請求項26之裝置,其中該視訊預處理器經組態以:在壓緊之前預處理該等色彩值以產生被壓緊之該等色彩值;以及後處理由該壓緊該等色彩值所產生之碼字。
- 如請求項26之裝置,其中為了預處理,該視訊預處理器經組態以縮放及偏移輸入線性色彩值,且其中為了後處理,該視訊預處理器經組態以縮放及偏移由該壓緊產生之該等碼字。
- 如請求項28之裝置,其進一步包含一視訊編碼器,其中該視訊預處理器經組態以使得該視訊編碼器:對於該縮放及偏移輸入線性色彩值以及縮放及偏移由該壓緊產生之該等碼字中之一者或兩者,將縮放及偏移參數在一位元串流中或作為旁側資訊傳訊。
- 如請求項28之裝置,其中為了縮放及偏移輸入線性色彩值,該視訊預處理器經組態以基於該等輸入線性色彩值自適應地判定一縮放因數及一偏移因數,且其中為了縮放及偏移該等碼字,該視訊預處理器經組態以基於該等碼字自適應地判定一縮放因數及一偏移因數以提高對可用碼字空間之使用。
- 如請求項26之裝置,其中為了後處理該等碼字,該視訊預處理器經組態以:縮放及偏移由該壓緊該等色彩值所產生之該等碼字;判定一組該等經縮放且偏移之碼字具有小於一最小臨限值或大於一最大臨限值之值;將一第一碼字指派至具有小於該最小臨限值之值的該組經縮放且偏移之碼字;以及將一第二碼字指派至具有大於該最大臨限值之值的該組經縮放且偏移之碼字。
- 如請求項31之裝置,其進一步包含一視訊編碼器,其中該視訊預處理器經組態以使得該視訊編碼器將指示該第一碼字、該第二碼字、該最大臨限值或該最小臨限值中之一或多者的資訊在一位元串流中或作為旁側資訊傳訊。
- 如請求項26之裝置,其中該視訊預處理器經組態以:判定第一組該等色彩值具有屬於該第一動態範圍之一第一分割區之值;以及判定第二組該等色彩值具有屬於該第一動態範圍之一第二分割區之值,其中為了預處理該等色彩值,該視訊預處理器經組態以:藉由第一組縮放及偏移參數來縮放及偏移該第一組該等色彩值,以及藉由第二組縮放及偏移參數來縮放及偏移該第二組該等色彩值。
- 如請求項26之裝置,其中該視訊預處理器經組態以:判定來自該複數個碼字之第一組碼字具有屬於該第二動態範圍之一第一分割區之值;以及判定來自該複數個碼字之第二組碼字具有屬於該第二動態範圍之一第二分割區之值,其中為了後處理該複數個碼字,該視訊預處理器經組態以:藉由第一組縮放及偏移參數來縮放及偏移該第一組碼字,以及藉由第二組縮放及偏移參數來縮放及偏移該第二組碼字。
- 一種儲存指令之電腦可讀儲存媒體,當執行該等指令時使得用於視訊處理之一裝置之一或多個處理器:接收表示視訊資料之經壓緊之色彩值的第一複數個碼字,該 等經壓緊之色彩值表示一第一動態範圍內之色彩;使用對該視訊資料非自適應之一反向靜態轉移函數基於該第一複數個碼字解壓第二複數個碼字以產生解壓之色彩值,該等解壓之色彩值表示一第二、不同動態範圍內之色彩,其中該第二複數個碼字為來自經反向後處理之該第一複數個碼字或該第一複數個碼字的碼字中之一者;反向後處理該第一複數個碼字以產生該第二複數個碼字或反向預處理該等解壓之色彩值中之至少一者;以及輸出該等解壓之色彩值或該等經反向預處理的解壓之色彩值。
- 如請求項35之電腦可讀儲存媒體,其中使得該一或多個處理器反向後處理該第一複數個碼字以產生該第二複數個碼字或反向預處理該等解壓之色彩值中之至少一者的該等指令包含使得該一或多個處理器執行以下操作的指令:反向後處理該第一複數個碼字以產生該第二複數個碼字;以及反向預處理該等解壓之色彩值以產生該等經反向預處理的解壓之色彩值。
- 一種用於視訊處理之裝置,該裝置包含:用於接收表示視訊資料之經壓緊之色彩值的第一複數個碼字之構件,該等經壓緊之色彩值表示一第一動態範圍內之色彩;用於使用對該視訊資料非自適應之一反向靜態轉移函數基於該第一複數個碼字解壓第二複數個碼字以產生解壓之色彩值之構件,該等解壓之色彩值表示一第二、不同動態範圍內之色彩,其中該第二複數個碼字為來自經反向後處理之該第一複數個碼字或該第一複數個碼字的碼字中之一者; 用於反向後處理該第一複數個碼字以產生該第二複數個碼字之構件或用於反向預處理該等解壓之色彩值之構件中之至少一者;以及用於輸出該等解壓之色彩值或該等經反向預處理的解壓之色彩值之構件。
- 如請求項37之裝置,其進一步包含:用於反向後處理該第一複數個碼字以產生該第二複數個碼字之該構件;以及用於反向預處理該等解壓之色彩值以產生該等經反向預處理的解壓之色彩值之該構件。
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562172713P | 2015-06-08 | 2015-06-08 | |
US62/172,713 | 2015-06-08 | ||
US201562184216P | 2015-06-24 | 2015-06-24 | |
US62/184,216 | 2015-06-24 | ||
US15/176,034 | 2016-06-07 | ||
US15/176,034 US10244245B2 (en) | 2015-06-08 | 2016-06-07 | Content-adaptive application of fixed transfer function to high dynamic range (HDR) and/or wide color gamut (WCG) video data |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201711471A true TW201711471A (zh) | 2017-03-16 |
TWI670969B TWI670969B (zh) | 2019-09-01 |
Family
ID=57452653
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW105118290A TWI670969B (zh) | 2015-06-08 | 2016-06-08 | 至高動態範圍及/或廣色域視訊資料之固定轉移功能之內容自適應應用 |
Country Status (14)
Country | Link |
---|---|
US (1) | US10244245B2 (zh) |
EP (2) | EP4090017A1 (zh) |
JP (1) | JP6882198B2 (zh) |
KR (1) | KR102031477B1 (zh) |
CN (1) | CN107736024B (zh) |
AU (1) | AU2016274617B2 (zh) |
DK (1) | DK3304900T3 (zh) |
ES (1) | ES2916575T3 (zh) |
HU (1) | HUE058692T2 (zh) |
PL (1) | PL3304900T3 (zh) |
PT (1) | PT3304900T (zh) |
SI (1) | SI3304900T1 (zh) |
TW (1) | TWI670969B (zh) |
WO (1) | WO2016200969A1 (zh) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10116938B2 (en) * | 2015-07-22 | 2018-10-30 | Arris Enterprises Llc | System for coding high dynamic range and wide color gamut sequences |
CN107852502B (zh) * | 2015-07-28 | 2021-07-20 | 杜比实验室特许公司 | 用于增强视频信号的位深的方法、编码器、解码器和系统 |
US10244249B2 (en) | 2015-09-21 | 2019-03-26 | Qualcomm Incorporated | Fixed point implementation of range adjustment of components in video coding |
US10129558B2 (en) * | 2015-09-21 | 2018-11-13 | Qualcomm Incorporated | Supplement enhancement information (SEI) messages for high dynamic range and wide color gamut video coding |
EP3338243B1 (en) * | 2015-09-23 | 2022-04-20 | ARRIS Enterprises LLC | High dynamic range adaptation operations at a video decoder |
US10742986B2 (en) | 2015-11-09 | 2020-08-11 | Netflix, Inc. | High dynamic range color conversion correction |
US10715772B2 (en) | 2015-11-09 | 2020-07-14 | Netflix, Inc. | High dynamic range color conversion correction |
US10080005B2 (en) * | 2015-11-09 | 2018-09-18 | Netflix, Inc. | High dynamic range color conversion correction |
JP6470474B2 (ja) | 2015-12-09 | 2019-02-13 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 補間誤差を抑えた低演算量ルックアップテーブル構築 |
JP6876931B2 (ja) * | 2016-09-06 | 2021-05-26 | ソニーグループ株式会社 | 画像処理装置、および画像処理方法、並びにプログラム |
JP6822122B2 (ja) * | 2016-12-19 | 2021-01-27 | ソニー株式会社 | 画像処理装置、画像処理方法及びプログラム |
JP6822121B2 (ja) * | 2016-12-19 | 2021-01-27 | ソニー株式会社 | 画像処理装置、画像処理方法及びプログラム |
JP6822123B2 (ja) * | 2016-12-19 | 2021-01-27 | ソニー株式会社 | 画像処理装置、画像処理方法及びプログラム |
US10778979B2 (en) * | 2018-01-11 | 2020-09-15 | Qualcomm Incorporated | Signaling mechanisms for equal ranges and other DRA parameters for video coding |
WO2019192484A1 (en) * | 2018-04-02 | 2019-10-10 | Huawei Technologies Co., Ltd. | Video coding with successive codecs |
CN108882028B (zh) * | 2018-07-05 | 2019-06-14 | 华为技术有限公司 | 视频信号的处理方法及装置 |
CN109146822A (zh) * | 2018-09-05 | 2019-01-04 | 成都索贝数码科技股份有限公司 | 一种利用sdr显示设备模拟hdr监视器的方法 |
BR112020017270A2 (pt) | 2018-12-27 | 2020-12-22 | Dolby Laboratories Licensing Corporation | Imagens bidimensionais (2d) com renderização de ampla gama de cores em telas com capacidade tridimensional (3d) |
US11076152B2 (en) * | 2019-03-18 | 2021-07-27 | Sony Group Corporation | Quantization step parameter for point cloud compression |
US12067749B2 (en) | 2021-12-27 | 2024-08-20 | Advanced Micro Devices, Inc. | Color channel correlation detection |
CN115293994B (zh) * | 2022-09-30 | 2022-12-16 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、计算机设备和存储介质 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5258928A (en) * | 1990-05-03 | 1993-11-02 | Rca Thomson Licensing Corporation | Parts efficient memory based functional circuit having selectable transfer characteristics |
US6118820A (en) * | 1998-01-16 | 2000-09-12 | Sarnoff Corporation | Region-based information compaction as for digital images |
US7483486B2 (en) * | 2004-07-02 | 2009-01-27 | Max-Planck-Gesellschaft Zur Forderung Der Wissenschaften E.V. | Method and apparatus for encoding high dynamic range video |
US7885469B2 (en) * | 2006-05-22 | 2011-02-08 | Microsoft Corporation | Encoded high dynamic range textures |
EP2406959B1 (en) | 2009-03-13 | 2015-01-14 | Dolby Laboratories Licensing Corporation | Layered compression of high dynamic range, visual dynamic range, and wide color gamut video |
CN103237884B (zh) | 2010-06-14 | 2015-08-19 | 株式会社爱茉莉太平洋 | 新的土壤微生物、从所述土壤微生物分离的新氧化还原酶、编码所述氧化还原酶的基因和使用所述微生物、氧化还原酶和基因产生糖苷配基的方法 |
TWI575933B (zh) * | 2011-11-04 | 2017-03-21 | 杜比實驗室特許公司 | 階層式視覺動態範圍編碼中之層分解技術 |
KR20130141920A (ko) | 2012-06-18 | 2013-12-27 | 삼성디스플레이 주식회사 | 색역 변환 시스템 및 방법 |
CN104429075B (zh) | 2012-07-09 | 2017-10-31 | 太阳专利托管公司 | 图像编码方法、图像解码方法、图像编码装置及图像解码装置 |
WO2015007505A1 (en) * | 2013-07-18 | 2015-01-22 | Koninklijke Philips N.V. | Methods and apparatuses for creating code mapping functions for encoding an hdr image, and methods and apparatuses for use of such encoded images |
US9948916B2 (en) | 2013-10-14 | 2018-04-17 | Qualcomm Incorporated | Three-dimensional lookup table based color gamut scalability in multi-layer video coding |
ES2744795T3 (es) * | 2014-05-28 | 2020-02-26 | Koninklijke Philips Nv | Métodos y aparatos para codificar unas imágenes HDR, y métodos y aparatos para usar tales imágenes codificadas |
US10735755B2 (en) * | 2015-04-21 | 2020-08-04 | Arris Enterprises Llc | Adaptive perceptual mapping and signaling for video coding |
US10397585B2 (en) * | 2015-06-08 | 2019-08-27 | Qualcomm Incorporated | Processing high dynamic range and wide color gamut video data for video coding |
EP3338243B1 (en) * | 2015-09-23 | 2022-04-20 | ARRIS Enterprises LLC | High dynamic range adaptation operations at a video decoder |
-
2016
- 2016-06-07 US US15/176,034 patent/US10244245B2/en active Active
- 2016-06-08 DK DK16730659.6T patent/DK3304900T3/da active
- 2016-06-08 ES ES16730659T patent/ES2916575T3/es active Active
- 2016-06-08 PT PT167306596T patent/PT3304900T/pt unknown
- 2016-06-08 SI SI201631527T patent/SI3304900T1/sl unknown
- 2016-06-08 KR KR1020177035102A patent/KR102031477B1/ko active IP Right Grant
- 2016-06-08 PL PL16730659T patent/PL3304900T3/pl unknown
- 2016-06-08 EP EP22164055.0A patent/EP4090017A1/en active Pending
- 2016-06-08 AU AU2016274617A patent/AU2016274617B2/en active Active
- 2016-06-08 EP EP16730659.6A patent/EP3304900B1/en active Active
- 2016-06-08 WO PCT/US2016/036480 patent/WO2016200969A1/en active Application Filing
- 2016-06-08 TW TW105118290A patent/TWI670969B/zh active
- 2016-06-08 JP JP2017563203A patent/JP6882198B2/ja active Active
- 2016-06-08 CN CN201680032461.4A patent/CN107736024B/zh active Active
- 2016-06-08 HU HUE16730659A patent/HUE058692T2/hu unknown
Also Published As
Publication number | Publication date |
---|---|
AU2016274617A1 (en) | 2017-11-30 |
WO2016200969A1 (en) | 2016-12-15 |
US10244245B2 (en) | 2019-03-26 |
EP3304900B1 (en) | 2022-04-27 |
KR102031477B1 (ko) | 2019-10-11 |
ES2916575T3 (es) | 2022-07-01 |
KR20180016383A (ko) | 2018-02-14 |
EP3304900A1 (en) | 2018-04-11 |
EP4090017A1 (en) | 2022-11-16 |
CN107736024B (zh) | 2020-10-30 |
SI3304900T1 (sl) | 2022-06-30 |
CN107736024A (zh) | 2018-02-23 |
PL3304900T3 (pl) | 2022-06-20 |
JP6882198B2 (ja) | 2021-06-02 |
PT3304900T (pt) | 2022-05-27 |
JP2018524870A (ja) | 2018-08-30 |
US20160360215A1 (en) | 2016-12-08 |
TWI670969B (zh) | 2019-09-01 |
HUE058692T2 (hu) | 2022-09-28 |
AU2016274617B2 (en) | 2019-10-03 |
DK3304900T3 (da) | 2022-05-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI670969B (zh) | 至高動態範圍及/或廣色域視訊資料之固定轉移功能之內容自適應應用 | |
KR102612652B1 (ko) | 비디오 코딩에서 크로스-성분 동적 범위 조정 (cc-dra) 의 시스템 및 방법 | |
US10200701B2 (en) | HDR and WCG coding architecture with SDR backwards compatibility in a single bitstream for video coding | |
CN109155848B (zh) | 用于高动态范围及宽色域视频译码的环路内样本处理 | |
TWI801432B (zh) | 利用內容適應性空間變化量化之視訊寫碼 | |
CN107950028B (zh) | 用于处理视频数据的方法和设备 | |
EP3504701A1 (en) | Color gamut adaptation with feedback channel | |
TW201711473A (zh) | 針對視訊寫碼處理高動態範圍及廣色域視訊資料 | |
TW201931853A (zh) | 具有聯合像素/變換為基礎之量化之視頻寫碼之量化參數控制 | |
TWI765903B (zh) | 用於循環樣本處理之視訊寫碼工具 | |
TWI713354B (zh) | 用於顯示器調適之色彩重映射資訊sei信息發信號 | |
EP3476127A1 (en) | Signaling target display parameters of color remapping information in supplemental enhancement information messages |