RU2575398C2

RU2575398C2 - Reduction of number of contexts for context adaptive binary arithmetic coding

Info

Publication number: RU2575398C2
Application number: RU2014123366/08A
Authority: RU
Inventors: Вэй-Цзюн ЧИЭНЬ; РОХАЛЬС Хоэль СОЛЕ; Марта КАРЧЕВИЧ
Original assignee: Квэлкомм Инкорпорейтед
Priority date: 2011-11-08
Filing date: 2012-10-05
Publication date: 2016-02-20

Abstract

FIELD: information technology.

SUBSTANCE: method of encoding video data comprises determining a partition type for a prediction mode for a block of video data; encoding a partition type structural element of a prediction type syntax element for the block of video data using context adaptive binary arithmetic coding (CABAC) with a single context, wherein the single context is the same for any partition type; and encoding a partition size structural element of the prediction type syntax element for the block of video data using CABAC in bypass mode.

EFFECT: reducing the number of CABAC contexts used for one or more syntax elements without significant impact on coding efficiency.

32 cl, 10 dwg, 22 tbl

Description

[0001] Настоящая заявка испрашивает приоритет предварительной заявки США 61/557, 325, поданной 8 ноября 2011 года, и предварительной заявки США 61/561, 911, поданной 20 ноября 2011 года, обе из которых включены в настоящий документ в качестве ссылки во всей их полноте.[0001] This application claims the priority of provisional application US 61/557, 325, filed November 8, 2011, and provisional application US 61/561, 911, filed November 20, 2011, both of which are incorporated herein by reference throughout their fullness.

ОБЛАСТЬ ТЕХНИКИFIELD OF TECHNOLOGY

[0002] Настоящее изобретение относится к кодированию видео и, в частности, контекстно-адаптивному бинарному арифметическому кодированию (САВАС), используемому в кодировании видео.[0002] The present invention relates to video coding, and in particular, context adaptive binary arithmetic coding (CABAC) used in video coding.

ПРЕДШЕСТВУЮЩИЙ УРОВЕНЬ ТЕХНИКИBACKGROUND OF THE INVENTION

[0003] Возможности цифрового видео могут быть включены в широкий диапазон устройств, включая цифровые телевизоры, системы цифрового прямого вещания, беспроводные системы вещания, персональные цифровые помощники (PDA), портативные или настольные компьютеры, планшетные компьютеры, электронные книги, цифровые камеры, цифровые записывающие устройства, цифровые медиаплееры, игровые видеоустройства, игровые приставки, сотовые или спутниковые радиотелефоны, так называемые «смартфоны», устройства видео-телеконференций, устройства потокового видео и тому подобное. Цифровые видео устройства реализуют технологии сжатия видео, такие как те, что описаны в стандартах, определенных MPEG-2, MPEG-4, ITU-T Η.263, ITU-T Η.264/MPEG-4, часть 10, Расширенное кодирование видео (AVC), стандарт Высокоэффективного кодирования видео (HEVC), находящийся в настоящее время в стадии разработки, и расширения таких стандартов. Видео устройства могут передавать, принимать, кодировать, декодировать и/или хранить цифровую видео информацию более эффективно путем реализации таких методов сжатия видео.[0003] Digital video capabilities can be incorporated into a wide range of devices, including digital TVs, digital direct broadcast systems, wireless broadcast systems, personal digital assistants (PDAs), laptop or desktop computers, tablet computers, e-books, digital cameras, digital recordings devices, digital media players, game video devices, game consoles, cellular or satellite radiotelephones, so-called “smartphones”, video teleconferencing devices, streaming video devices EO and the like. Digital video devices implement video compression technologies, such as those described in the standards defined by MPEG-2, MPEG-4, ITU-T Η.263, ITU-T Η.264 / MPEG-4, part 10, Advanced video encoding (AVC), the High Performance Video Coding (HEVC) standard currently under development, and an extension to such standards. Video devices can transmit, receive, encode, decode and / or store digital video information more efficiently by implementing such video compression methods.

[0004] Методы сжатия видео выполняют пространственное (внутри изображения, интра-) предсказание и/или временное (между изображениями, интер-) предсказание для сокращения или устранения избыточности, присущей видеопоследовательностям. Для блочного кодирования, видео слайс (то есть видеоизображение или часть видеоизображения) может быть разделен на блоки видео, которые также могут упоминаться как блоки дерева, единицы кодирования (CU) и/или узлы кодирования. Блоки видео в интра-кодированном (I) слайсе (сегменте) изображения кодируются с использованием пространственного предсказания относительно опорных выборок в соседних блоках в том же изображении. Блоки видео в интер-кодированном (Р или В) сегменте изображения могут использовать пространственное предсказание относительно опорных выборок в соседних блоках в том же изображении или временное предсказание относительно опорных выборок в других опорных изображениях. Изображения могут упоминаться как кадры, и опорные изображения могут упоминаться как опорные кадры.[0004] Video compression techniques perform spatial (intra image, intra) prediction and / or temporal (between image, inter) prediction to reduce or eliminate redundancy inherent in video sequences. For block coding, a video slice (i.e., a video image or part of a video image) can be divided into video blocks, which can also be referred to as tree blocks, coding units (CUs) and / or coding nodes. Video blocks in an intra-coded (I) image slice (segment) are encoded using spatial prediction with respect to reference samples in neighboring blocks in the same image. Video blocks in an inter-coded (P or B) image segment may use spatial prediction for reference samples in neighboring blocks in the same image or temporal prediction for reference samples in other reference images. Images may be referred to as frames, and reference images may be referred to as reference frames.

[0005] Пространственное или временное предсказание приводит в результате к блоку предсказания для блока, подлежащего кодированию. Остаточные данные представляет пиксельные разницы между исходным блоком, подлежащим кодированию, и блоком предсказания. Интер-кодируемый блок кодируется в соответствии с вектором движения, который указывает на блок опорных выборок, образующих блок предсказания, и остаточными данными, указывающими разницу между кодированным блоком и блоком предсказания. Интра-кодируемый блок кодируется в соответствии с режимом интра-кодирования и остаточными данными. Для дальнейшего сжатия, остаточные данные могут быть преобразованы из пиксельной области в область преобразования, приводя в результате к остаточным коэффициентам преобразования, которые затем могут быть квантованы. Квантованные коэффициенты преобразования, первоначально упорядоченные в двумерный массив, могут сканироваться, чтобы сформировать одномерный вектор коэффициентов преобразования, и энтропийное кодирование может быть применено для достижения еще большего сжатия.[0005] Spatial or temporal prediction results in a prediction block for the block to be encoded. The residual data represents the pixel differences between the source block to be encoded and the prediction block. The inter-coded block is encoded in accordance with a motion vector that points to a block of reference samples forming a prediction block and residual data indicating the difference between the coded block and the prediction block. The intra-encoded block is encoded in accordance with the intra-encoding mode and the residual data. For further compression, the residual data can be converted from the pixel region to the transformation region, resulting in residual transform coefficients, which can then be quantized. The quantized transform coefficients originally ordered in a two-dimensional array can be scanned to form a one-dimensional vector of transform coefficients, and entropy coding can be applied to achieve even greater compression.

СУЩНОСТЬ ИЗОБРЕТЕНИЯSUMMARY OF THE INVENTION

[0006] В общем, это раскрытие описывает методы для контекстно-адаптивного бинарного арифметического кодирования (САВАС) в процессе видео кодирования. В частности, это раскрытие предлагает сокращение числа контекстов САВАС, используемых для одного или нескольких синтаксических элементов, неограничительные примеры которых включают pred_typ, merge_idx, inert_pred_flag, ref_idx__lx, cbf_cb, cbf_cr, coeff abs_level_greaterl_flag и coeff_abs_level_greater2_flag. Модификации могут сократить до 56 контекстов с пренебрежимо малыми изменениями эффективности кодирования. Предлагаемые сокращения контекста для синтаксических элементов могут быть использованы отдельно или в любой комбинации.[0006] In general, this disclosure describes methods for context adaptive binary arithmetic coding (SAVAS) in a video coding process. In particular, this disclosure offers a reduction in the number of SAVAC contexts used for one or more syntax elements, non-limiting examples of which include pred_typ, merge_idx, inert_pred_flag, ref_idx__lx, cbf_cb, cbf_cr, coeff abs_level_greaterl_flag and coeff_abs_level_reg_reg_reg_reg_reg_reg_reg_reg_reg_reg_reg_reg_reg_reg_reg_reg_reg_reg_reg_reg_reg_reg_reg_reg_grel_greater. Modifications can reduce to 56 contexts with negligible changes in coding efficiency. The proposed contextual abbreviations for syntax elements can be used individually or in any combination.

[0007] В одном примере осуществления раскрытия, способ кодирования видео может включать в себя определение первого типа предсказания для блока видеоданных в Ρ слайсе (сегменте), представление первого типа предсказания как синтаксический элемент типа предсказания Ρ сегмента, определение второго типа предсказания для блока видеоданных в В сегменте, представление второго типа предсказания как синтаксический элемент типа предсказания В сегмента, определение бинаризации Ρ сегмента для синтаксического элемента типа предсказания Ρ сегмента, определение бинаризации В сегмента для синтаксического элемента типа предсказания В сегмента, при этом синтаксический элемент типа предсказания Ρ сегмента и синтаксический элемент типа предсказания В сегмента определяются с использованием той же самой логики бинаризации, и кодирование видеоданных на основе бинаризации синтаксического элемента типа предсказания Ρ сегмента и синтаксического элемента типа предсказания В сегмента.[0007] In one embodiment, the video encoding method may include determining a first prediction type for a block of video data in a slice (segment), representing the first type of prediction as a syntax element of a prediction type Ρ segment, determining a second prediction type for a block of video data in In a segment, representing the second type of prediction as a syntax element of a type of prediction In a segment, the definition of binarization Ρ segment for a syntax element of a type of prediction Ρ segment, segmentation of B binarization for a syntax element of prediction type B segment, wherein the syntax element of prediction type Ρ segment and the syntax element of prediction type B are determined using the same binarization logic, and video encoding based on the binarization of the syntax element of prediction type Ρ segment and syntax prediction type element in the segment.

[0008] В другом примере настоящего раскрытия способ декодирования видео может включать в себя отображение бинаризованного синтаксического элемента типа предсказания Ρ сегмента на тип предсказания, используя отображение бинаризации для блока видеоданных в Ρ сегменте, отображение бинаризованного синтаксического элемента типа предсказания В сегмента на тип предсказания, используя отображение бинаризации для блока видеоданных в В сегменте, и декодирование видеоданных, основываясь на отображенных типах предсказания.[0008] In another example of the present disclosure, a video decoding method may include mapping a binarized syntax element of a prediction type Ρ segment to a prediction type using a binarization map for a block of video data in a Ρ segment, mapping a binarized syntax element of a prediction type B segment to a prediction type using mapping binarization for a block of video data in the In segment, and decoding video data based on the displayed prediction types.

[0009] В другом примере настоящего раскрытия, способ кодирования видеоданных включает в себя определение типа разделения для режима предсказания для блока видеоданных, кодирование структурного элемента типа разделения синтаксического элемента типа предсказания для блока видеоданных с использованием САВАС с одним контекстом, причем этот один контекст является тем же самым для любого типа разделения, и кодирование структурного элемента размера разделения синтаксического элемента типа предсказания для блока видеоданных с использованием САВАС в режиме обхода.[0009] In another example of the present disclosure, a video encoding method includes determining a split type for a prediction mode for a video block, encoding a structural element of a split type syntax for a prediction type block for a video block using CABAC with one context, this single context being that the same for any type of separation, and encoding a structural element of a separation size of a prediction type syntax element for a video block using CABAC bypass mode.

[0010] В другом примере настоящего раскрытия, способ декодирования видеоданных содержит прием синтаксического элемента типа предсказания для блока видеоданных, которые были кодированы с использованием САВАС, причем синтаксический элемент типа предсказания включает в себя структурный элемент типа разделения, представляющий тип разделения, и структурный элемент размера разделения, представляющий размер разделения, декодирование структурного элемента типа разделения синтаксического элемента типа предсказания с использованием контекстно-адаптивного бинарного арифметического кодирования с одним контекстом, причем этот один контекст является тем же самым для любого типа разделения, и декодирование структурного элемента типа разделения синтаксического элемента типа предсказания с использованием САВАС в режиме обхода.[0010] In another example of the present disclosure, a method for decoding video data comprises receiving a prediction type syntax element for a block of video data that has been encoded using SAVAS, the prediction type syntax element including a separation type structural element representing a separation type and a size structural element. separation representing the size of the separation, decoding the structural element of the type of separation of the syntax element of the prediction type using context but-adaptive binary arithmetic coding with one context, and one context this is the same for any type of separation and decoding of the structural element separation type syntax prediction type element using CABAC in bypass mode.

[0011] В другом примере настоящего раскрытия, способ кодирования видеоданных включает в себя кодирование флага кодированного блока цветности Сb для блока видеоданных с использованием САВАС, причем кодирование флага кодированного блока цветности Сb включает в себя использование набора контекстов, включающего в себя один или более контекстов как часть САВАС, и кодирование флага кодированного блока цветности Cr с использование САВАС, причем кодирование флага кодированного блока цветности Cr содержит использованием того же самого набора контекстов, что и для флага кодированного блока цветности Cb, как часть САВАС.[0011] In another example of the present disclosure, a video encoding method includes encoding a flag of a coded chroma block Cb for a video block using CABAC, wherein encoding a flag of a coded chroma block Cb includes using a set of contexts including one or more contexts as part of SAVAS, and encoding the flag of the encoded chroma block Cr using SAVAS, wherein encoding the flag of the encoded chroma block Cr contains using the same set of cont Kstovo as for the coded block flag chrominance Cb, as part of CABAC.

[0012] Настоящее раскрытие также описывает вышеуказанные способы в терминах устройств, сконфигурированных для выполнения этих способов, а также в терминах считываемого компьютером носителя для хранения инструкций, которые, при их выполнении, побуждают один или более процессоров выполнять эти способы.[0012] The present disclosure also describes the above methods in terms of devices configured to execute these methods, as well as in terms of computer-readable media for storing instructions that, when executed, cause one or more processors to execute these methods.

[0013] Детали одного или нескольких примеров приведены на прилагаемых чертежах и описании ниже. Другие признаки, цели и преимущества будут очевидны из описания и чертежей и из формулы изобретения.[0013] Details of one or more examples are provided in the accompanying drawings and description below. Other features, objects, and advantages will be apparent from the description and drawings, and from the claims.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙBRIEF DESCRIPTION OF THE DRAWINGS

[0014] На фиг. 1 представлена блок-схема, иллюстрирующая примерную систему кодирования и декодирования видео, которая может использовать методы, описанные в настоящем раскрытии.[0014] FIG. 1 is a block diagram illustrating an example video encoding and decoding system that may use the techniques described in the present disclosure.

[0015] На фиг. 2 представлена блок-схема, иллюстрирующая примерный видеокодер, который может реализовать способы, описанные в настоящем раскрытии.[0015] FIG. 2 is a flowchart illustrating an example video encoder that can implement the methods described in the present disclosure.

[0016] На фиг. 3 представлена блок-схема, иллюстрирующая примерный видеодекодер, который может реализовать способы, описанные в настоящем раскрытии.[0016] FIG. 3 is a flowchart illustrating an example video decoder that can implement the methods described in the present disclosure.

[0017] На фиг. 4 показан концептуальный чертеж, демонстрирующий как квадратные, так и неквадратные типы разделения.[0017] FIG. 4 is a conceptual drawing showing both square and non-square types of separation.

[0018] На фиг. 5 показан концептуальный чертеж, демонстрирующий асимметричные типы разделения.[0018] FIG. 5 is a conceptual drawing showing asymmetric separation types.

[0019] На фиг. 6 представлена блок-схема последовательности операций, иллюстрирующая пример способа кодирования видео согласно настоящему раскрытию.[0019] FIG. 6 is a flowchart illustrating an example of a video encoding method according to the present disclosure.

[0020] На фиг. 7 представлена блок-схема последовательности операций, иллюстрирующая пример способа декодирования видео согласно настоящему раскрытию.[0020] FIG. 7 is a flowchart illustrating an example of a video decoding method according to the present disclosure.

[0021] На фиг. 8 представлена блок-схема последовательности операций, иллюстрирующая пример способа кодирования видео согласно настоящему раскрытию.[0021] FIG. 8 is a flowchart illustrating an example of a video encoding method according to the present disclosure.

[0022] На фиг. 9 представлена блок-схема последовательности операций, иллюстрирующая пример способа декодирования видео согласно настоящему раскрытию.[0022] FIG. 9 is a flowchart illustrating an example of a video decoding method according to the present disclosure.

[0023] На фиг. 10 представлена блок-схема последовательности операций, иллюстрирующая пример способа кодирования видео согласно настоящему раскрытию.[0023] FIG. 10 is a flowchart illustrating an example of a video encoding method according to the present disclosure.

ПОДРОБНОЕ ОПИСАНИЕDETAILED DESCRIPTION

[0024] Настоящее раскрытие описывает способы кодирования данных, таких как видеоданные. В частности, в настоящем раскрытии описываются способы, которые могут способствовать эффективному кодированию видеоданных с использованием процессов контекстно-адаптивного энтропийного кодирования. В частности, в настоящем раскрытии предлагается сокращение количества контекстов САВАС, используемых для кодирования синтаксических элементов, таких как pred_typ, merge_idx, inert_pred_flag, ref_idx_1x, cbf_cb, cbf_cr, coeff_abs_level_greaterl_flag и coeff_abs_level_greater2_flag. Модификации сокращают до 56 контекстов с пренебрежимо малыми изменениями эффективности кодирования. Настоящее раскрытие описывает кодирование видео для целей иллюстрации. Однако способы, описанные в данном описании, также могут быть применимы к кодированию других типов данных.[0024] The present disclosure describes methods for encoding data, such as video data. In particular, the present disclosure describes methods that can facilitate efficient coding of video data using context adaptive entropy coding processes. In particular, this disclosure proposes a reduction in the number of SAVAS contexts used to encode syntax elements such as pred_typ, merge_idx, inert_pred_flag, ref_idx_1x, cbf_cb, cbf_cr, coeff_abs_level_greaterl_flag and coeff_abs_level_greater. Modifications are reduced to 56 contexts with negligible changes in coding efficiency. The present disclosure describes video encoding for illustration purposes. However, the methods described herein may also be applicable to encoding other types of data.

[0025] На фиг. 1 представлена блок-схема, иллюстрирующая пример системы 10 кодирования и декодирования видео, которая может быть сконфигурирована, чтобы использовать методы контекстно-адаптивного бинарного арифметического кодирования (САВАС) в соответствии с примерами настоящего раскрытия. Как показано на фиг. 1, система 10 включает в себя устройство-источник 12, которое передает кодированное видео к устройству-получателю 14 через канал 16 связи. Кодированные видеоданные могут также храниться на носителе 34 хранения данных или файловом сервере 36, и устройство-получатель 14 может обращаться к ним по желанию. При хранении на носителе хранения данных или файловом сервере, видеокодер 20 может предоставить кодированные видеоданные другому устройству, такому как сетевой интерфейс, компакт-диск (CD), программатор или устройство оборудования штамповки Blu-Ray или цифрового видеодиска (DVD) или другие устройства, для хранения кодированных видеоданных на носителе хранения данных. Кроме того, устройство, отдельное от видеодекодера 30, такое как сетевой интерфейс, CD или DVD считыватель или тому подобное, может извлекать кодированные видеоданные с носителя хранения данных и предоставлять извлеченные данные на видеодекодер 30.[0025] FIG. 1 is a block diagram illustrating an example of a video encoding and decoding system 10 that can be configured to use context adaptive binary arithmetic coding (SAVAS) methods in accordance with examples of the present disclosure. As shown in FIG. 1, system 10 includes a source device 12 that transmits encoded video to a destination device 14 via a communication channel 16. The encoded video data may also be stored on the storage medium 34 or the file server 36, and the recipient device 14 may access it as desired. When stored on a storage medium or file server, video encoder 20 may provide encoded video data to another device, such as a network interface, compact disc (CD), programmer or Blu-ray punching equipment or DVD, or other devices, for storing encoded video data on a storage medium. In addition, a device separate from the video decoder 30, such as a network interface, a CD or DVD reader, or the like, can extract encoded video data from the storage medium and provide the extracted data to the video decoder 30.

[0026] Устройство-источник 12 и устройство-получатель 14 могут включать в себя любое из широкого спектра устройств, включая настольные компьютеры, ноутбуки (т.е. портативные компьютеры), планшетные компьютеры, телевизионные приставки, телефонные аппараты, такие как так называемые смартфоны, телевизоры, камеры, устройства отображения, цифровые медиаплееры, игровые консоли или тому подобное. Во многих случаях такие устройства могут быть оснащены для беспроводной связи. Таким образом, канал 16 связи может содержать беспроводной канал, проводной канал или комбинацию проводных и беспроводных каналов, пригодных для передачи кодированных видеоданных. Аналогично, файловый сервер 36 может быть доступен для устройства-получателя 14 через любое стандартное соединение передачи данных, в том числе Интернет-соединение. Это может включать в себя беспроводной канал (например, соединение Wi-Fi), проводное соединение (например, DSL, кабельный модем и т.д.), или сочетание того и другого, которое подходит для доступа к кодированным видеоданным, хранящимся на файловом сервере.[0026] The source device 12 and the recipient device 14 may include any of a wide variety of devices, including desktop computers, laptops (ie laptop computers), tablet computers, set-top boxes, telephones, such as so-called smartphones , televisions, cameras, display devices, digital media players, game consoles, or the like. In many cases, such devices may be equipped for wireless communication. Thus, the communication channel 16 may comprise a wireless channel, a wired channel, or a combination of wired and wireless channels suitable for transmitting encoded video data. Similarly, file server 36 can be accessed by destination device 14 via any standard data connection, including an Internet connection. This may include a wireless channel (for example, a Wi-Fi connection), a wired connection (for example, DSL, cable modem, etc.), or a combination of the two that is suitable for accessing encoded video data stored on a file server .

[0027] Методы САВАС, в соответствии с примерами настоящего раскрытия, могут быть применены к кодированию видео для поддержки любого из множества мультимедийных приложений, таких как эфирное телевизионное вещание, передачи кабельного телевидения, передачи спутникового телевидения, передачи потокового видео, например, через Интернет, кодирование цифрового видео для хранения на носителе данных, декодирование цифрового видео, сохраненного на носителе данных, или других приложений. В некоторых примерах, система 10 может быть сконфигурирована для поддержки односторонних или двусторонних передач видео для поддержки таких приложений, как потоковое видео, воспроизведение видео, видео вещание и/или видеотелефония.[0027] The SAVAS methods, in accordance with examples of the present disclosure, can be applied to video encoding to support any of a variety of multimedia applications, such as terrestrial television broadcasting, cable television broadcasts, satellite television broadcasts, streaming video streams, for example, over the Internet, encoding digital video for storage on a storage medium; decoding a digital video stored on a storage medium or other applications. In some examples, system 10 may be configured to support one-way or two-way video transmissions to support applications such as video streaming, video playback, video broadcasting and / or video telephony.

[0028] В примере по фиг. 1, устройство-источник 12 включает в себя источник 18 видео, видеокодер 20, модулятор/демодулятор 22 и передатчик 24. В устройстве-источнике 12, источник 18 видео может включать в себя источник, такой как устройство захвата видео, например, видеокамеру, видеоархив, содержащий ранее захваченное видео, интерфейс видеоканала для приема видео от поставщика видеоконтента и/или систему компьютерной графики для генерации данных компьютерной графики в качестве исходного видео или комбинацию таких источников. В качестве одного примера, если источник 18 видео представляет собой видеокамеру, устройство-источник 12 и устройство-получатель 14 могут образовывать так называемые камеры-телефоны или видеотелефоны. Однако способы, описанные в настоящем раскрытии, могут применяться к кодированию видео в общем и могут быть применены к беспроводным и/или проводным приложениям или приложению, в котором кодированные видеоданные сохранены на локальном диске.[0028] In the example of FIG. 1, the source device 12 includes a video source 18, a video encoder 20, a modulator / demodulator 22, and a transmitter 24. In the source device 12, the video source 18 may include a source, such as a video capture device, for example, a video camera, video archive containing previously captured video, a video channel interface for receiving video from a video content provider and / or a computer graphics system for generating computer graphics data as source video, or a combination of such sources. As one example, if the video source 18 is a video camera, the source device 12 and the receiving device 14 may form so-called camera telephones or video telephones. However, the methods described in the present disclosure can be applied to video encoding in general and can be applied to wireless and / or wired applications or an application in which encoded video data is stored on a local disk.

[0029] Захваченное, предварительно захваченное или генерируемое компьютером видео может кодироваться с помощью видеокодера 20. Кодированная информация видео может модулироваться с помощью модема 22 в соответствии со стандартом связи, например, протоколом беспроводной связи, и передаваться к устройству-получателю 14 посредством передатчика 24. Модем 22 может включать в себя различные смесители, фильтры, усилители и другие компоненты, предназначенные для модуляции сигнала. Передатчик 24 может включать в себя схемы, предназначенные для передачи данных, в том числе усилители, фильтры и одну или более антенн.[0029] Captured, pre-captured or computer-generated video can be encoded using video encoder 20. The encoded video information can be modulated using a modem 22 in accordance with a communication standard, for example, a wireless communication protocol, and transmitted to a destination device 14 via a transmitter 24. The modem 22 may include various mixers, filters, amplifiers and other components designed to modulate the signal. The transmitter 24 may include circuits for transmitting data, including amplifiers, filters, and one or more antennas.

[0030] Захваченное, предварительно захваченное или генерируемое компьютером видео, которое кодируется с помощью видеокодера 20, также может храниться на носителе 34 хранения данных или файловом сервере 36 для последующего потребления. Носитель 34 хранения данных может включать Blu-Ray диски, DVD-диски, CD-ROM, флэш-память или любой другой подходящий цифровой носитель хранения данных для хранения кодированного видео. Кодированное видео, сохраненное на носителе 34 хранения данных, может затем быть доступным для устройства-получателя 14 для декодирования и воспроизведения. Хотя это не показано на фиг. 1, в некоторых примерах носитель 34 хранения данных и/или файловый сервер 36 может хранить выходной сигнал передатчика 24.[0030] Captured, pre-captured or computer generated video encoded by video encoder 20 may also be stored on the storage medium 34 or the file server 36 for subsequent consumption. The storage medium 34 may include Blu-ray discs, DVDs, CD-ROMs, flash memory, or any other suitable digital storage medium for storing encoded video. The encoded video stored on the storage medium 34 may then be available to the recipient device 14 for decoding and playback. Although not shown in FIG. 1, in some examples, the storage medium 34 and / or the file server 36 may store the output of the transmitter 24.

[0031] Файловый сервер 36 может быть любым типом сервера, способным хранить кодированное видео и передавать это кодированное видео к устройству-получателю 14. Примерные файловые серверы включают в себя веб-сервер (например, для вебсайта), FTP-сервер, устройства хранения, связанные с сетью (NAS), локальный диск или любой другой тип устройства, способного хранить кодированные видеоданные и передавать его к устройству-получателю. Передача кодированных видеоданных с файлового сервера 36 может быть потоковой передачей, передачей загрузки или сочетанием того и другого. Файловый сервер 36 может быть доступным для устройства-получателя 14 через любое стандартное соединение передачи данных, в том числе Интернет соединение. Это может включать в себя беспроводной канал (например, соединение Wi-Fi), проводное соединение (например, DSL, кабельный модем, Ethernet, USB и т.д.), или сочетание того и другого, которое подходит для доступа к кодированным видеоданным, хранящимся на файловом сервере.[0031] File server 36 may be any type of server capable of storing encoded video and transmitting this encoded video to a recipient device 14. Exemplary file servers include a web server (eg, for a website), an FTP server, storage devices, connected to a network (NAS), local disk, or any other type of device capable of storing encoded video data and transmitting it to a recipient device. The transmission of the encoded video data from the file server 36 may be streaming, downloading, or a combination of the two. File server 36 can be accessed by destination device 14 via any standard data connection, including an Internet connection. This may include a wireless channel (for example, a Wi-Fi connection), a wired connection (for example, DSL, cable modem, Ethernet, USB, etc.), or a combination of both that is suitable for access to encoded video data, stored on a file server.

[0032] Устройство-получатель 14, в примере по фиг. 1, включает в себя приемник 26, модем 28, видеодекодер 30 и устройство 32 отображения. Приемник 26 устройства-получателя 14 принимает информацию по каналу 16, и модем 28 демодулирует информацию для получения демодулированного потока битов для видеодекодера 30. Информация, передаваемая через канал 16, может включать в себя различную синтаксическую информацию, генерируемую видеокодером 20, для использования видеодекодером 30 при декодировании видеоданных. Такой синтаксис также может быть включен в кодированные видеоданные, сохраненные на носителе 34 хранения данных или файловом сервере 36. Каждый из видеокодера 20 и видеодекодера 30 может являться частью соответствующего кодера-декодера (кодека), который способен кодировать или декодировать видеоданные.[0032] The recipient device 14, in the example of FIG. 1 includes a receiver 26, a modem 28, a video decoder 30, and a display device 32. The receiver 26 of the recipient device 14 receives information on channel 16, and the modem 28 demodulates information to obtain a demodulated bit stream for video decoder 30. The information transmitted through channel 16 may include various syntactic information generated by video encoder 20 for use by video decoder 30 when video decoding. Such syntax may also be included in encoded video data stored on the storage medium 34 or file server 36. Each of the video encoder 20 and video decoder 30 may be part of a corresponding encoder-decoder (codec) that is capable of encoding or decoding video data.

[0033] Устройство 32 отображения может быть встроенным или внешним по отношению к устройству-получателю 14. В некоторых примерах устройство-получатель 14 может включать в себя встроенное устройство отображения, а также может быть сконфигурировано для взаимодействия с внешним устройством отображения. В других примерах устройство-получатель 14 может быть устройством отображения. В общем, устройство 32 отображения отображает декодированные видеоданные пользователю и может содержать любое из множества устройств отображения, таких как жидкокристаллический дисплей (LCD), плазменный дисплей, дисплей на органических светоизлучающих диодах (OLED) или другой тип устройства отображения.[0033] The display device 32 may be internal or external to the recipient device 14. In some examples, the recipient device 14 may include an integrated display device, and may also be configured to interact with an external display device. In other examples, the recipient device 14 may be a display device. In general, the display device 32 displays decoded video data to a user and may comprise any of a variety of display devices, such as a liquid crystal display (LCD), a plasma display, an organic light emitting diode (OLED) display, or another type of display device.

[0034] В примере на фиг. 1, канал 16 связи может содержать любую проводную или беспроводную среду связи, например, радиочастотный (РЧ) спектр или одну или нескольких физических линий передачи, или любую комбинацию беспроводных и проводных сред передачи. Канал 16 связи может являться частью пакетной сети, например, локальной сети, сети широкого охвата или глобальной сети, такой как Интернет. Канал 16 связи обычно представляет собой любую подходящую среду связи или набор различных сред связи для передачи видеоданных от устройства-источника 12 к устройству-получателю 14, включая любую подходящую комбинацию проводных или беспроводных сред передачи. Канал 16 связи может включать в себя маршрутизаторы, коммутаторы, базовые станции или любое другое оборудование, которое может быть полезным для обеспечения связи от устройства-источника 12 к устройству-получателю 14.[0034] In the example of FIG. 1, communication channel 16 may comprise any wired or wireless communication medium, for example, a radio frequency (RF) spectrum or one or more physical transmission lines, or any combination of wireless and wired transmission media. Communication channel 16 may be part of a packet network, such as a local area network, a wide area network, or a wide area network such as the Internet. Communication channel 16 is typically any suitable communication medium or a set of different communication media for transmitting video data from source device 12 to destination device 14, including any suitable combination of wired or wireless transmission media. Communication channel 16 may include routers, switches, base stations, or any other equipment that may be useful for providing communication from source device 12 to destination device 14.

[0035] Видеокодер 20 и видеодекодер 30 могут работать в соответствии со стандартом сжатия видео, таким как стандарт Высокоэффективного кодирования видео (HEVC), находящийся в настоящее время на стадии разработки Объединенной совместной группы по кодированию видео (JCT-VC) ITU-T Группы экспертов по кодированию видео (VCEG) и ISO/IEC Группы экспертов по движущемуся изображению (MPEG). Недавний проект стандарта HEVC, называемый "HEVC рабочий проект 6" или "WD6", описывается в документе JCTVC-H1003, Bross et al., "High efficiency video coding (HEVC) text specification draft 6", Объединенной совместной группы по кодированию видео (JCT-VC) ITU-T SGI 6 WP3 и ISO/IEC JTC1/SC29/WG11, 8-е заседание: Сан-Хосе, Калифорния, США, февраль 2012, который, по состоянию на 1 июня 2012 года можно скачать с http://phenix.int-evry.fr/jct/doc_end_user/documents/8_San%20Jose/wg11/JCTVC-1003-v22.zip.[0035] Video encoder 20 and video decoder 30 may operate in accordance with a video compression standard, such as the High Efficiency Video Encoding (HEVC) standard, currently under development by the ITU-T Joint Video Encoding Team (JCT-VC) Expert Group Video Encoding (VCEG) and ISO / IEC Moving Picture Experts Group (MPEG). A recent draft of the HEVC standard, called "HEVC Work Draft 6" or "WD6", is described in JCTVC-H1003, Bross et al., "High efficiency video coding (HEVC) text specification draft 6," of the Joint Video Encoding Team ( JCT-VC) ITU-T SGI 6 WP3 and ISO / IEC JTC1 / SC29 / WG11, 8th meeting: San Jose, California, USA, February 2012, which as of June 1, 2012 can be downloaded from http: //phenix.int-evry.fr/jct/doc_end_user/documents/8_San%20Jose/wg11/JCTVC-1003-v22.zip.

[0036] Кроме того, видеокодер 20 и видеодекодер 30 могут действовать в соответствии с другими проприетарными или промышленными стандартами, такими как стандарт ITU-T Η.2 64, альтернативно называемый MPEG-4, часть 10, Расширенное кодирование видео (AVC), или расширения таких стандартов. Методы настоящего раскрытия, однако, не ограничивается каким-либо конкретным стандартом кодирования. Другие примеры включают MPEG-2 и ITU-T Η.263.[0036] In addition, video encoder 20 and video decoder 30 may operate in accordance with other proprietary or industry standards, such as ITU-T No. 2 64, alternatively referred to as MPEG-4, part 10, Advanced video encoding (AVC), or expanding such standards. The methods of the present disclosure, however, are not limited to any particular coding standard. Other examples include MPEG-2 and ITU-T No. 263.

[0037] Хотя это не показано на фиг. 1, в некоторых аспектах видеокодер 20 и видеодекодер 30 могут, каждый, быть интегрирован с аудиокодером и декодером и могут включать в себя соответствующие блоки MUX-DEMUX или другие аппаратные средства и программное обеспечение для обработки кодирования аудио и видео в общем потоке данных или отдельных потоках данных. Если применимо, в некоторых примерах, блоки MUX-DEMUX могут соответствовать протоколу мультиплексора ITU Н.223 или другим протоколам, таким как протокол пользовательских дейтаграмм (UDP).[0037] Although not shown in FIG. 1, in some aspects, video encoder 20 and video decoder 30 may each be integrated with an audio encoder and decoder and may include respective MUX-DEMUX units or other hardware and software for processing audio and video encoding in a common data stream or separate streams data. If applicable, in some examples, the MUX-DEMUX units may conform to the ITU H.223 multiplexer protocol or other protocols, such as the user datagram protocol (UDP).

[0038] Видеокодер 20 и видеодекодер 30, каждый, может быть реализован как любой из множества подходящих схем кодера, таких как один или более микропроцессоров, цифровые сигнальные процессоры (DSP), специализированные интегральные схемы (ASIC), программируемые вентильные матрицы (FPGA), дискретная логика, программное обеспечение, аппаратные средства, программно-аппаратные средства или любые их комбинации. Когда технологии реализованы частично в программном обеспечении, устройство может хранить инструкции для программного обеспечения на подходящем постоянном считываемом компьютером носителе и выполнять инструкции в аппаратных средствах с использованием одного или более процессоров для выполнения методов настоящего раскрытия. Каждый из видеокодера 20 и видеодекодера 30 может быть включен в один или более кодеров или декодеров, каждый из которых может быть интегрирован как часть комбинированного кодера/декодера (кодека) в соответствующем устройстве.[0038] Video encoder 20 and video decoder 30, each, can be implemented as any of a variety of suitable encoder circuits, such as one or more microprocessors, digital signal processors (DSP), specialized integrated circuits (ASIC), programmable gate arrays (FPGA), discrete logic, software, hardware, firmware, or any combination thereof. When the technologies are partially implemented in software, the device may store instructions for the software on a suitable, permanent computer-readable medium and execute instructions in hardware using one or more processors to perform the methods of the present disclosure. Each of video encoder 20 and video decoder 30 may be included in one or more encoders or decoders, each of which may be integrated as part of a combined encoder / decoder (codec) in a corresponding device.

[0039] Видеокодер 20 может реализовывать любой или все методы настоящего раскрытия для САВАС в процессе кодирования видео. Кроме того, видеодекодер 30 может осуществлять некоторые или все из этих методов для САВАС в процессе кодирования видео. Устройство кодирования видео, как описано в данном раскрытии, может относиться к видеокодеру или видеодекодеру. Аналогичным образом, блок кодирования видео может относиться к видеокодеру или видеодекодеру. Кроме того, кодирование видео может относиться к кодированию видео или декодированию видео.[0039] Video encoder 20 may implement any or all of the methods of the present disclosure for SAVAS in a video encoding process. In addition, video decoder 30 may implement some or all of these methods for SAVAS in the video encoding process. A video encoding device, as described in this disclosure, may refer to a video encoder or video decoder. Similarly, a video encoding unit may refer to a video encoder or video decoder. In addition, video encoding may relate to video encoding or video decoding.

[0040] В одном примере настоящего раскрытия, видеокодер 20 может быть сконфигурирован, чтобы определять первый тип предсказания для блока видеоданных в Ρ сегменте, представлять первый тип предсказания как синтаксический элемент типа предсказания Ρ сегмента, определять второй тип предсказания для блока видеоданных в В сегменте, представлять второй тип предсказания как синтаксический элемент типа предсказания В сегмента, определять бинаризацию Ρ сегмента для синтаксического элемента типа предсказания Ρ сегмента, определять бинаризацию В сегмента для синтаксического элемента типа предсказания В сегмента, при этом синтаксический элемент типа предсказания Ρ сегмента и синтаксический элемент типа предсказания В сегмента определяются с использованием той же самой логики бинаризации, и кодировать видеоданные на основе бинаризации синтаксического элемента типа предсказания Ρ сегмента и синтаксического элемента типа предсказания В сегмента.[0040] In one example of the present disclosure, video encoder 20 may be configured to determine a first prediction type for a block of video data in a Ρ segment, represent the first type of prediction as a syntax element of a prediction type Ρ segment, define a second type of prediction for a block of video data in a менте segment, represent the second type of prediction as a syntactic element of the prediction type of the B segment, determine the binarization of the для segment for the syntax element of the prediction type of the Ρ segment, determine the binarization of B The segment for the prediction type syntax element is B segment, and the prediction type syntax element Ρ segment and the prediction type syntax element B segment are determined using the same binarization logic, and encode video data based on the binarization of the Ρ segment prediction type syntax element and the prediction type syntax element In a segment.

[0041] В другом примере настоящего раскрытия видеодекодер 30 может быть сконфигурирован, чтобы отображать бинаризованный синтаксический элемент типа предсказания Ρ сегмента на тип предсказания, используя отображение бинаризации для блока видеоданных в Ρ сегменте, отображать бинаризованный синтаксический элемент типа предсказания В сегмента на тип предсказания, используя то же самое отображение бинаризации для блока видеоданных в В сегменте, и декодировать видеоданные, основываясь на отображенных типах предсказания.[0041] In another example of the present disclosure, video decoder 30 may be configured to map a binarized prediction type syntax element of a Ρ segment to a prediction type using a binarization map for a video data block in a Ρ segment, to map a binarized prediction type syntax element of a сегмента segment to a prediction type using the same binarization mapping for the video block in the In segment, and decode the video data based on the displayed prediction types.

[0042] В другом примере настоящего раскрытия, видеокодер 20 может быть сконфигурирован, чтобы определять тип разделения для режима предсказания для блока видеоданных, кодировать структурный элемент типа разделения синтаксического элемента типа предсказания для блока видеоданных с использованием САВАС с одним контекстом, причем этот один контекст является тем же самым для любого типа разделения, и кодировать структурный элемент размера разделения синтаксического элемента типа предсказания для блока видеоданных с использованием САВАС в режиме обхода.[0042] In another example of the present disclosure, video encoder 20 may be configured to determine a partition type for a prediction mode for a video block, encode a structural element of a partition type of a prediction type syntax element for a video block using CABAC with one context, this one context is the same for any type of separation, and encode the structural element of the separation size of the prediction type syntax element for the video block using SAVAS in Bypass Mode.

[0043] В другом примере настоящего раскрытия, видеодекодер 30 может быть сконфигурирован, чтобы принимать синтаксический элемент типа предсказания для блока видеоданных, которые были кодированы с использованием САВАС, причем синтаксический элемент типа предсказания включает в себя структурный элемент типа разделения, представляющий тип разделения, и структурный элемент размера разделения, представляющий размер разделения, декодировать структурный элемент типа разделения синтаксического элемента типа предсказания с использованием САВАС с одним контекстом, причем этот один контекст является тем же самым для любого типа разделения, и декодировать структурный элемент размера разделения синтаксического элемента типа предсказания с использованием САВАС в режиме обхода.[0043] In another example of the present disclosure, video decoder 30 may be configured to receive a prediction type syntax element for a block of video data that has been encoded using SAVAS, the prediction type syntax element including a division type structure element representing a division type, and a partition size structure element representing a partition size, decode a prediction type syntax element partition type structure element using CAB AS with one context, and this one context is the same for any type of separation, and decode the structural element of the size of the separation of the syntax element of the prediction type using SAVAS in bypass mode.

[0044] В другом примере настоящего раскрытия, как видеокодер 20, так и видеодекодер 30 могут быть сконфигурированы, чтобы кодировать флаг кодированного блока цветности Cb для блока видеоданных с использованием САВАС, причем кодирование флага кодированного блока цветности Cb включает в себя использование набора контекстов, включающего в себя один или более контекстов как часть САВАС, и кодировать флаг кодированного блока цветности Cr с использованием САВАС, причем кодирование флага кодированного блока цветности Cr содержит использование того же самого набора контекстов, что и для флага кодированного блока цветности Сb, как часть САВАС.[0044] In another example of the present disclosure, both video encoder 20 and video decoder 30 may be configured to encode a flag of a coded chroma block Cb for a video block using CABAC, wherein encoding a flag of a coded chroma block Cb includes using a set of contexts including one or more contexts as part of SAVAS, and encode the flag of the encoded chroma block Cr using SAVAS, wherein the encoding of the flag of the encoded chroma chromium block contains the same set itself contexts as for the chrominance Cb coded block flag as part of CABAC.

[0045] JCT-VC работает над развитием стандарта HEVC. Усилия HEVC стандартизации базируются на развивающейся модели устройства кодирования видео, называемой тестовой моделью HEVC (НМ). НМ предполагает несколько дополнительных возможностей устройств кодирования видео относительно существующих устройств в соответствии, например, с ITU-T H.264/AVC. Например, в то время как Н.264 обеспечивает девять режимов кодирования с интра-предсказанием, НМ может обеспечить тридцать три режима кодирования с интра-предсказанием. В следующем разделе будут более подробно описаны некоторые аспекты НМ.[0045] JCT-VC is working on the development of the HEVC standard. HEVC standardization efforts are based on an evolving model of a video encoding device called the HEVC Test Model (NM). NM involves several additional features of video encoding devices relative to existing devices in accordance with, for example, ITU-T H.264 / AVC. For example, while H.264 provides nine intra-prediction coding modes, HM can provide thirty-three intra-prediction coding modes. The next section will describe in more detail some aspects of NM.

[0046] В общем, рабочая модель НМ описывает, что видео кадр или изображение может быть разделено на последовательность блоков дерева или наибольших единиц кодирования (LCU), которые включают в себя выборки как яркости, так и цветности. Блок дерева имеет цель, подобную таковой макроблока стандарта Н.264. Сегмент (слайс) включает в себя ряд последовательных блоков дерева в порядке кодирования. Видеокадр или изображение может быть разделено на один или более сегментов. Каждый блок дерева может быть разделен на единицы кодирования (CU) в соответствии с квадродеревом. Например, блок дерева, в качестве корневого узла квадродерева, может быть разделен на четыре дочерних узла, а каждый дочерний узел, в свою очередь, может быть родительским узлом и может быть разделен на следующие четыре дочерних узлов. Окончательный, неразделимый дочерний узел, как узел листа квадродерева, включает в себя узел кодирования, то есть блок кодированного видео. Данные синтаксиса, связанные с кодированным битовым потоком, могут определять максимальное количество раз разбиения блока дерева, а также могут определять минимальный размер узлов кодирования.[0046] In general, an NM working model describes that a video frame or image can be divided into a sequence of tree blocks or largest coding units (LCUs), which include both brightness and color samples. A tree block has a purpose similar to that of an H.264 macroblock. A segment (slice) includes a series of consecutive blocks of a tree in coding order. A video frame or image may be divided into one or more segments. Each block of the tree can be divided into coding units (CU) in accordance with the quad tree. For example, a tree block, as the root node of a quad tree, can be divided into four child nodes, and each child node, in turn, can be a parent node and can be divided into the following four child nodes. The final, inseparable child node, like the leaf node of a quad tree, includes an encoding node, i.e., a block of encoded video. The syntax data associated with the encoded bitstream can determine the maximum number of times a tree block is split, and can also determine the minimum size of encoding nodes.

[0047] CU включает в себя узел кодирования и единицы предсказания (PU) и единицы преобразования (TU), связанные с узлом кодирования. Размер CU обычно соответствует размеру узла кодирования и обычно должен быть квадратной формы. Размер CU может находиться в диапазоне от 8x8 пикселей до размера блока дерева максимально с 64×64 пикселей или более. Каждая CU может содержать одну или более PU и одну или более TU. Данные синтаксиса, ассоциированные с CU, могут описывать, например, разделение CU на одну или более PU. Режимы разделения могут отличаться в зависимости от того, пропускается ли CU, или кодирована в прямом режиме, кодирована в режиме интра-предсказания или кодирована в режиме интер-предсказания. PU могут быть разделены, чтобы быть в неквадратной форме. Данные синтаксиса, ассоциированные с CU, также могут описывать, например, разделение CU на одну или более TU в соответствии с квадродеревом. TU может быть квадратной или неквадратной формы.[0047] The CU includes a coding unit and prediction units (PUs) and transform units (TUs) associated with the coding unit. The size of the CU usually corresponds to the size of the encoding node and usually should be square. The CU size can range from 8x8 pixels to a tree block size with a maximum of 64 × 64 pixels or more. Each CU may contain one or more PUs and one or more TUs. The syntax data associated with the CU may describe, for example, the division of the CU into one or more PUs. Separation modes may differ depending on whether the CU is skipped, or encoded in direct mode, encoded in intra prediction mode, or encoded in inter prediction mode. PU can be divided to be in non-square form. The syntax data associated with the CUs may also describe, for example, splitting a CU into one or more TUs in accordance with a quad tree. TU can be square or non-square.

[0048] Новый стандарт HEVC допускает преобразования в соответствии с TU, которые могут быть различными для различных CU. TU обычно имеют размер в зависимости от размера PU в пределах данной CU, определенной для разделенной LCU, хотя это может не всегда иметь место. TU, как правило, такого же размера, или меньше, чем PU. В некоторых примерах остаточные выборки, соответствующие CU, могут быть разделены на более мелкие единицы, используя структуру квадродерева, известную как "остаточное квадродерево" (RQT). Листовые узлы RQT могут упоминаться как единицы преобразования (TU). Пиксельные разностные значения, связанные с TU, могут быть преобразованы для получения коэффициентов преобразования, которые могут быть квантованы.[0048] The new HEVC standard allows for TU transformations, which may be different for different CUs. TUs typically have a size depending on the size of the PU within a given CU defined for a split LCU, although this may not always be the case. TUs are usually the same size, or smaller than PUs. In some examples, the residual samples corresponding to the CU can be divided into smaller units using a quad tree structure known as a “residual quad tree” (RQT). RQT leaf nodes may be referred to as transformation units (TUs). The pixel difference values associated with the TU can be converted to obtain transform coefficients that can be quantized.

[0049] В общем, PU относится к данным, относящимся к процессу предсказания. Например, когда PU является кодированной в интра-режиме, PU может включать данные, описывающие режим интра-предсказания для PU. В качестве другого примера, когда PU кодирована в интер-режиме, PU может включать данные, определяющие вектор движения для PU. Данные, определяющие вектор движения для PU, могут описывать, например, горизонтальную составляющую вектора движения, вертикальную составляющую вектора движения, разрешение для вектора движения (например, точность в одну четверть пикселя или точность в одну восьмую пикселя), опорное изображение, на которое указывает вектор движения, и/или список опорных изображений (например, список 0, список 1 или список С) для вектора движения.[0049] In general, a PU refers to data related to a prediction process. For example, when the PU is intra-coded, the PU may include data describing the intra prediction mode for the PU. As another example, when the PU is inter-mode encoded, the PU may include data defining a motion vector for the PU. The motion vector data for the PU can describe, for example, the horizontal component of the motion vector, the vertical component of the motion vector, the resolution for the motion vector (for example, one quarter pixel accuracy or one eighth pixel precision), the reference image pointed to by the vector motion, and / or a list of reference images (for example, list 0, list 1 or list C) for the motion vector.

[0050] В общем, TU используется для процессов преобразования и квантования. Данная CU, имеющая одну или более PU, может также включать в себя одну или более единиц преобразования (TU). После предсказания, видеокодер 20 может вычислить остаточные значения из блока видео, идентифицированного узлом кодирования, в соответствии с PU. Узел кодирования затем обновляется для ссылки на остаточные значения вместо исходного блока видео. Остаточные значения содержат пиксельные разностные значения, которые могут преобразовываться в коэффициенты преобразования, квантоваться и сканироваться с использованием преобразований и другой информации[0050] In general, TU is used for transformation and quantization processes. A given CU having one or more PUs may also include one or more transformation units (TUs). After the prediction, video encoder 20 may calculate the residual values from the video block identified by the encoding node in accordance with the PU. The encoding node is then updated to refer to residual values instead of the original video block. Residual values contain pixel difference values that can be converted to transform coefficients, quantized, and scanned using transforms and other information

преобразования, определенной в TU, чтобы создать преобразованные в последовательную форму коэффициенты преобразования для энтропийного кодирования. Узел кодирования может быть в очередной раз обновлен, чтобы ссылаться на эти преобразованные в последовательную форму коэффициенты преобразования. Настоящее раскрытие обычно использует термин "блок видео", чтобы ссылаться на узел кодирования CU. В некоторых конкретных случаях, настоящее раскрытие может также использовать термин "блок видео", чтобы ссылаться на блок дерева, т.е. LCU или CU, которая включает в себя узел кодирования и PU и TU.transform defined in TU to create serialized transform coefficients for entropy coding. The coding unit may again be updated to refer to these serialized transform coefficients. The present disclosure typically uses the term “video block” to refer to a CU encoding node. In some specific cases, the present disclosure may also use the term “video block” to refer to a tree block, i.e. LCU or CU, which includes an encoding node and PU and TU.

[0051] Видеопоследовательность обычно включает в себя ряд видеокадров или изображений. Группа изображений (GOP) обычно включает в себя последовательность из одного или более видеоизображений. GOP может включать синтаксические данные в заголовке GOP, заголовке одного или более изображений или в другом месте, которое описывает ряд изображений, включенных в GOP. Каждый сегмент изображения может включать синтаксические данные сегмента, которые описывают режим кодирования для соответствующего сегмента. Видеокодер 20 обычно работает на блоках видео в отдельных сегментах видео для кодирования видеоданных. Блок видео может соответствовать узлу кодирования внутри CU. Блоки видео могут иметь фиксированные или переменные размеры и могут отличаться по размеру в соответствии с заданным стандартом кодирования.[0051] A video sequence typically includes a series of video frames or images. A group of images (GOP) typically includes a sequence of one or more video images. A GOP may include syntax data in a GOP header, a header of one or more images, or elsewhere that describes a series of images included in the GOP. Each image segment may include segment syntax data that describes the encoding mode for the corresponding segment. Video encoder 20 typically operates on blocks of video in separate video segments to encode video data. The video block may correspond to an encoding node within the CU. Video blocks may have fixed or variable sizes and may vary in size in accordance with a given coding standard.

[0052] В качестве примера, НМ поддерживает предсказание в различных размерах PU. В предположении, что размер определенной CU равен 2Ν×2Ν, НМ поддерживает интра-предсказание в PU размеров 2Ν×2Ν или Ν×Ν, и интер-предсказание в симметричных PU размеров 2Ν×2Ν, 2Ν×Ν, Ν×2Ν или Ν×Ν. НМ также поддерживает асимметричное разделение для интер-предсказания в PU размеров 2N×nU, 2N×nD, nL×2N и nR×2N. В асимметричном разделении, одно направление CU не разделяется, а другое направление разделяется на 25% и 75%. Часть CU, соответствующая 25% разделению, обозначается посредством "n" с последующим указанием "вверх", "вниз", "влево" или "вправо". Так, например, "2N×nU" относится к 2N×2N CU, которая разделена горизонтально с 2N×0.5N PU сверху и 2N×1.5N PU снизу.[0052] As an example, HM supports prediction in various PU sizes. Assuming that the size of a specific CU is 2Ν × 2Ν, NM supports intra prediction in PUs of 2Ν × 2Ν or Ν × Ν, and inter prediction in symmetric PUs of 2Ν × 2Ν, 2Ν × Ν, Ν × 2Ν or Ν × Ν. NM also supports asymmetric separation for inter prediction in PUs of sizes 2N × nU, 2N × nD, nL × 2N and nR × 2N. In asymmetric separation, one direction of the CU is not divided, and the other direction is divided by 25% and 75%. The portion of the CU corresponding to the 25% separation is indicated by “n” followed by “up”, “down”, “left” or “right”. So, for example, “2N × nU” refers to 2N × 2N CU, which is divided horizontally with 2N × 0.5N PU on top and 2N × 1.5N PU on the bottom.

[0053] На фиг. 4 показана концептуальная диаграмма, демонстрирующая как квадратные, так и неквадратные типы разделения для интра-предсказания и интер-предсказания. Разделение 102 является разделением 2N×2N и может быть использовано как для интра-предсказания, так и для интерпредсказания. Разделение 104 является разделением Ν×Ν и может быть использовано как для интра-предсказания, так для интерпредсказания. Разделение 106 является разделением 2Ν×Ν и в настоящее время используется в HEVC для интер-предсказания. Разделение 108 является разделением Ν×2Ν и в настоящее время используется в HEVC для интер-предсказания.[0053] FIG. 4 is a conceptual diagram illustrating both square and non-square separation types for intra prediction and inter prediction. Division 102 is a 2N × 2N division and can be used for both intra prediction and inter prediction. Division 104 is a Ν × Ν division and can be used for both intra prediction and inter prediction. Division 106 is a 2Ν × Ν division and is currently used in HEVC for inter prediction. Separation 108 is a Ν × 2Ν division and is currently used in HEVC for inter prediction.

[0054] На фиг. 5 представлена концептуальная диаграмма, показывающая асимметричные типы разделения. Разделение 110 является разделением 2N×nU и в настоящее время используется в HEVC для интер-предсказания. Разделение 112 является разделением 2N×nD и в настоящее время используется в HEVC для интерпредсказания. Разделение 114 является разделением nL×2N и в настоящее время используется в HEVC для интер-предсказания. Разделение 116 является разделением nR×2N и в настоящее время используется в HEVC для интер-предсказания.[0054] FIG. 5 is a conceptual diagram showing asymmetric separation types. Split 110 is a 2N × nU split and is currently used in HEVC for inter prediction. Division 112 is a 2N × nD division and is currently used in HEVC for inter prediction. Division 114 is an nL × 2N division and is currently used in HEVC for inter prediction. Division 116 is an nR × 2N division and is currently used in HEVC for inter prediction.

[0055] В этом описании "N×N" и "N на N" могут использоваться взаимозаменяемым образом для обозначения размеров в пикселях блока видео по вертикали и горизонтали, например, 16×16 пикселей или 16 на 16 пикселей. В общем, 16×16 блок будет иметь 16 пикселей в вертикальном направлении (y=16) и 16 пикселей в горизонтальном направлении (х=16). Аналогично, блок N×N, в общем виде, имеет N пикселей в вертикальном направлении и N пикселей в горизонтальном направлении, где N представляет собой неотрицательное целое число. Пиксели в блоке могут быть упорядочены в строки и столбцы. Кроме того, блоки не обязательно должны иметь одинаковое число пикселей в горизонтальном направлении и в вертикальном направлении. Например, блоки могут содержать N×M пикселей, где Μ не обязательно равно N.[0055] In this description, “N × N” and “N by N” can be used interchangeably to indicate the pixel sizes of a video block vertically and horizontally, for example, 16 × 16 pixels or 16 by 16 pixels. In general, a 16 × 16 block will have 16 pixels in the vertical direction (y = 16) and 16 pixels in the horizontal direction (x = 16). Similarly, an N × N block, in general, has N pixels in the vertical direction and N pixels in the horizontal direction, where N is a non-negative integer. Pixels in a block can be arranged in rows and columns. In addition, the blocks do not have to have the same number of pixels in the horizontal direction and in the vertical direction. For example, blocks may contain N × M pixels, where Μ is not necessarily equal to N.

[0056] После кодирования с интра-предсказанием или интерпредсказанием с использованием PU для CU, видеокодер 20 может вычислить остаточные данные, к которым применяются преобразования, указанные посредством TU в PU. Остаточные данные могут соответствовать разнице в пикселях между пикселями некодированного изображения и значениями предсказания, соответствующими CU. Видеокодер 20 может формировать остаточные данные для CU, а затем преобразовывать остаточные данные для получения коэффициентов преобразования.[0056] After intra-prediction or inter-prediction encoding using the PU for the CU, video encoder 20 may calculate the residual data to which the transforms indicated by the TU to the PU are applied. Residual data may correspond to a difference in pixels between the pixels of the unencoded image and the prediction values corresponding to the CU. Video encoder 20 may generate residual data for the CU, and then convert the residual data to obtain transform coefficients.

[0057] После любых преобразований, чтобы сформировать коэффициенты преобразования, видеокодер 20 может выполнять квантование коэффициентов преобразования. Квантование, в общем, относится к процессу, в котором коэффициенты преобразования квантуются, чтобы по возможности уменьшить объем данных, используемых для представления коэффициентов, обеспечивая дальнейшее сжатие. Процесс квантования может уменьшить битовую глубину, ассоциированную с некоторых или всеми коэффициентами. Например, n-битное значение можно округлить вниз до m-битного значения во время квантования, где n больше, чем т.[0057] After any transforms, to generate transform coefficients, video encoder 20 may quantize the transform coefficients. Quantization generally refers to a process in which transform coefficients are quantized to possibly reduce the amount of data used to represent the coefficients, providing further compression. The quantization process can reduce the bit depth associated with some or all of the coefficients. For example, an n-bit value can be rounded down to an m-bit value during quantization, where n is greater than t.

[0058] В некоторых примерах, видеокодер 20 может использовать предопределенный порядок сканирования для сканирования квантованных коэффициентов преобразования для получения преобразованного в последовательную форму вектора, который может энтропийно кодироваться. В других примерах видеокодер 20 может выполнять адаптивное сканирование. После сканирования квантованных коэффициентов преобразования, чтобы сформировать одномерный вектор, видеокодер 20 может энтропийно кодировать одномерный вектор, например, в соответствии с контекстно-адаптивным кодированием переменной длины (CAVLC), контекстно-адаптивным бинарным арифметическим кодированием (САВАС), основанным на синтаксисе контекстно-адаптивным бинарным арифметическим кодированием (SBAC), энтропийным кодированием с разделением интервала вероятности (PIPE) или другим методом энтропийного кодирования. Видеокодер 20 может также энтропийно кодировать синтаксические элементы, ассоциированные с кодированными видеоданными для использования видеодекодером 30 в декодировании видеоданных.[0058] In some examples, video encoder 20 may use a predetermined scan order to scan the quantized transform coefficients to obtain a serialized vector that can be entropy encoded. In other examples, video encoder 20 may perform adaptive scanning. After scanning the quantized transform coefficients to form a one-dimensional vector, video encoder 20 can entropy encode a one-dimensional vector, for example, in accordance with context-adaptive variable-length coding (CAVLC), context-adaptive binary arithmetic coding (CABAC) based on context-adaptive syntax binary arithmetic coding (SBAC), entropy coding with separation of the probability interval (PIPE), or other method of entropy coding. Video encoder 20 may also entropy encode syntax elements associated with encoded video data for use by video decoder 30 in decoding video data.

[0059] Для выполнения САВАС, видеокодер 20 может назначить контекст в контекстной модели для символа, подлежащего передаче. Контекст может относиться, например, к тому, являются ли соседние значения символа ненулевыми, или нет. Для выполнения CAVLC, видеокодер 20 может выбрать код переменной длины для символа, подлежащего передаче. Кодовые слова в VLC могут быть сконструированы так, что относительно более короткие коды соответствуют более вероятным символам, в то время как более длинные коды соответствуют менее вероятным символам. Таким образом, использование VLC может достигать экономии в битах по сравнению, например, с использованием кодовых слов одинаковой длины для каждого символа, подлежащего передаче. Определение вероятности может быть основано на контексте, назначенном символу.[0059] To perform SAVAS, video encoder 20 may assign a context in the context model for the character to be transmitted. The context may relate, for example, to whether neighboring values of the symbol are nonzero or not. To perform CAVLC, video encoder 20 may select a variable-length code for the character to be transmitted. VLC codewords can be designed so that relatively shorter codes correspond to more likely characters, while longer codes correspond to less likely characters. Thus, the use of VLC can achieve savings in bits compared to, for example, using codewords of the same length for each character to be transmitted. The definition of probability may be based on the context assigned to the symbol.

[0060] Настоящее раскрытие относится к способам для энтропийных кодеров контекстно-адаптивного бинарного арифметического кодирования (САВАС) или другим энтропийным кодерам, таким как энтропийное кодирование с разделением интервала вероятности (PIPE) или связанным кодерам. Арифметическое кодирование является формой энтропийного кодирования, используемого во многих алгоритмах сжатия, которые имеют высокую эффективность кодирования, поскольку оно способно отображать символы на кодовые слова нецелочисленной длины. Примером алгоритма арифметического кодирования является основанное на контексте бинарное арифметическое кодирование (САВАС), используемое в H.264/AVC.[0060] The present disclosure relates to methods for entropy encoders of context adaptive binary arithmetic coding (CABAC) or other entropy encoders, such as entropy coding with separation of probability intervals (PIPE) or related encoders. Arithmetic coding is a form of entropy coding used in many compression algorithms that have high coding efficiency because it is able to map characters to non-integer codewords. An example of an arithmetic coding algorithm is the context-based binary arithmetic coding (SAVAS) used in H.264 / AVC.

[0061] В общем, кодирование символов данных с помощью САВАС включает в себя один или более из следующих этапов:[0061] In general, encoding data symbols using SAVAS includes one or more of the following steps:

(1) Бинаризация: Если символ, подлежащий кодированию, не является бинарным значением, он отображается на последовательности так называемых "структурных элементов". Каждый структурный элемент может иметь значение "0" или "1".(1) Binarization: If the character to be encoded is not a binary value, it is displayed on a sequence of so-called "structural elements". Each structural element can have a value of "0" or "1".

(2) Назначение контекста: Каждому структурному элементу (в обычном режиме) назначается контекст. Контекстная модель определяет, как рассчитывается контекст для данного структурного элемента на основе информации, доступной для структурного элемента, такой как значения ранее кодированных символов или число структурных элементов.(2) Context Assignment: Each structural element (in normal mode) is assigned a context. The context model determines how context is calculated for a given structural element based on information available for the structural element, such as the values of previously encoded characters or the number of structural elements.

(3) Кодирование структурных элементов: Структурные элементы кодируются арифметическим кодером. Для кодирования структурного элемента, арифметический кодер требует в качестве входа вероятность значения структурного элемента, то есть вероятность того, что значение структурного элемента равно "0", и вероятность того, что значение структурного элемента равно "1". (Оцененная) вероятность каждого контекста представлена целым числом, называемым "состоянием контекста". Каждый контекст имеет состояние, и, таким образом, состояние (т.е. оцененная вероятность) является тем же самым для структурных элементов, назначенных одному контексту, и отличается между контекстами.(3) Coding of structural elements: Structural elements are encoded by an arithmetic encoder. To encode a structural element, the arithmetic encoder requires as input the probability of the value of the structural element, that is, the probability that the value of the structural element is "0" and the probability that the value of the structural element is "1". The (estimated) probability of each context is represented by an integer called the "context state". Each context has a state, and thus the state (i.e. the estimated probability) is the same for the structural elements assigned to one context, and differs between contexts.

(4) Обновление состояния: Вероятность (состояние) для выбранного контекста обновляется на основе фактического кодированного значения структурного элемента (например, если значение структурного элемента было "1," вероятность "1" увеличивается).(4) Status update: The probability (state) for the selected context is updated based on the actual encoded value of the structural element (for example, if the value of the structural element was "1," probability "1" increases).

[0062] Следует отметить, что энтропийное кодирование с разделением интервала вероятности (PIPE) использует принципы, аналогичные принципам арифметического кодирования, и, таким образом, может также использовать метод настоящего раскрытия.[0062] It should be noted that probability interval separation entropy coding (PIPE) uses principles similar to arithmetic coding principles, and thus may also use the method of the present disclosure.

[0063] САВАС в H.264/AVC и HEVC использует состояния, и каждое состояние неявно связано с вероятностью. Существуют варианты САВАС, в которых вероятность символа ("0" или "1") используется непосредственно, то есть вероятность (или ее целочисленная версия) является состоянием. Например, такие варианты САВАС описаны в "Description of video coding technology proposal by France Telecom, NTT, NTT DOCOMO, Panasonic and Technicolor", JCTVC-A114, 1st JCT-VC Meeting, Dresden, DE, апрель 2010 г., далее упоминается как "JCTVC-A114", и A. Alshin and Ε. Alshina, "Multi-parameter probability update for CABAC", JCTVC-F254, 6th JCT-VC Meeting, Torino, IT, июль 2011, далее упоминается как "JCTVC-F254".[0063] SAVAS in H.264 / AVC and HEVC uses states, and each state is implicitly associated with probability. There are variants of SAVAS in which the probability of a symbol ("0" or "1") is used directly, that is, probability (or its integer version) is a state. For example, such SAVAS options are described in "Description of video coding technology proposal by France Telecom, NTT, NTT DOCOMO, Panasonic and Technicolor", JCTVC-A114, 1st JCT-VC Meeting, Dresden, DE, April 2010, hereinafter referred to as "JCTVC-A114", and A. Alshin and Ε. Alshina, “Multi-parameter probability update for CABAC”, JCTVC-F254, 6th JCT-VC Meeting, Torino, IT, July 2011, hereinafter referred to as “JCTVC-F254”.

[0064] В настоящем раскрытии предложено сокращение количества бинаризаций и/или контекстов, используемых в САВАС. В частности, настоящее раскрытие предлагает методы, которые могут снизить количество контекстов, используемых в САВАС, на величину до 56. С числом на 56 меньше контекстов, экспериментальные результаты показывают, 0,00%, 0,01% и -0,13% изменения частоты искажения битов (BD) в высокоэффективном интра-режиме только, произвольном доступе и тестовых условиях малой задержки, соответственно. Таким образом, сокращение в количестве требуемых контекстов, снижает потребности в хранении как в кодере, так и декодере без существенного влияния на эффективность кодирования.[0064] The present disclosure proposes a reduction in the number of binarizations and / or contexts used in SAVAS. In particular, the present disclosure proposes methods that can reduce the number of contexts used in SAVAS by up to 56. With 56 less contexts, experimental results show 0.00%, 0.01%, and -0.13% change bit distortion frequencies (BD) in high-performance intra-mode only, random access and low latency test conditions, respectively. Thus, a reduction in the number of contexts required reduces storage requirements in both the encoder and the decoder without significantly affecting coding efficiency.

[0065] В настоящем раскрытии предложено сокращение числа контекстов САВАС, используемых для синтаксических элементов pred_typ, merge_idx, inert_pred_flag, ref_idx_1x, cbf_cb, cbf cr, coeff_abs_level_greaterl_flag и coeff_abs_level_greater2_flag. Модификации сокращают до 56 контекстов с пренебрежимо малыми изменениями в эффективности кодирования. Предлагаемые сокращения контекста для синтаксических элементов, приведенных выше, могут быть использованы по отдельности или в любой комбинации.[0065] The present disclosure proposes a reduction in the number of SAVAS contexts used for the syntax elements pred_typ, merge_idx, inert_pred_flag, ref_idx_1x, cbf_cb, cbf cr, coeff_abs_level_greaterl_flag and coeff_abs_level_greater2_flag. Modifications are reduced to 56 contexts with negligible changes in coding efficiency. The proposed contextual abbreviations for the syntax elements above can be used individually or in any combination.

[0066] Синтаксический элемент pred_type включает в себя режим предсказания (pred_mode_flag) и тип разделения (part_mode) для каждой единицы кодирования. Синтаксический элемент pred mode flag, равный 0, определяет, что текущая единица кодирования кодирована в режиме интер-предсказания.[0066] The pred_type syntax element includes a prediction mode (pred_mode_flag) and a partition type (part_mode) for each coding unit. The syntax element pred mode flag, equal to 0, determines that the current coding unit is encoded in inter-prediction mode.

Синтаксический элемент pred_mode_flag, равный 1, указывает, что текущая единица кодирования кодирована в режиме интра-предсказания. Синтаксический элемент part_mode определяет режим разделения текущей единицы кодирования.The pred_mode_flag syntax element of 1 indicates that the current encoding unit is encoded in intra-prediction mode. The syntax element part_mode defines the split mode of the current coding unit.

[0067] Синтаксический элемент merge_jdx[х0][y0] определяет индексы кандидатов слияния списка кандидатов слияния, где х0, y0 определяют местоположение (х0, y0) верхней левой выборки яркости рассматриваемого блока предсказания относительно верхней левой выборки яркости изображения. Когда merge_jdx [х0] [y0] отсутствует, то делается вывод, что он равен 0. Список кандидатов слияния является списком соседних единиц кодирования с текущими единицами, из которых информация о движении может быть скопирована.[0067] The syntax element merge_jdx [x0] [y0] defines the merge candidate indices of the merge candidate list, where x0, y0 determine the location (x0, y0) of the upper left luma sample of the prediction block in relation to the upper left sample luma sample. When merge_jdx [x0] [y0] is absent, it is concluded that it is 0. The list of merge candidates is a list of neighboring coding units with the current units from which motion information can be copied.

[0068] Синтаксический элемент inter_pred_flag[x0] [у0] определяет, используется ли моно-предсказание или би-предсказание для текущей единицы предсказания. Индексы массива х0, y0 определяют местоположение (х0, y0) верхней-левой выборки яркости рассматриваемого блока предсказания относительно верхней-левой выборки яркости изображения.[0068] The syntax element inter_pred_flag [x0] [y0] determines whether mono prediction or bi prediction is used for the current prediction unit. The array indices x0, y0 determine the location (x0, y0) of the upper-left brightness sample of the prediction block in relation to the upper-left image brightness sample.

[0069] Синтаксический элемент ref_idx_1x относится к конкретному опорному изображению внутри списка опорных изображений.[0069] The syntax element ref_idx_1x refers to a particular reference image within the list of reference images.

[0070] Синтаксические элементы cbf_cb, cbf_cr указывают, содержат блоки преобразования цветности (Сb и Cr, соответственно) ненулевые коэффициенты преобразования. Синтаксический элемент cbf_cb[x0][y0][trafoDepth], равный 1, определяет, что блок преобразования Cb содержит один или более уровней коэффициентов преобразования, не равных 0. Индексы массива х0, y0 указывают местоположение (х0, y0) верхней-левой выборки яркости рассматриваемого блока преобразования относительно верхней-левой выборки яркости изображения. Индекс массива trafoDepth указывает текущий уровень подразделения единицы кодирования на блоки с целью кодирования преобразования. Индекс массива trafoDepth равен 0 для блоков, которые соответствуют единицам кодирования. Когда cbf_cb[x0][y0][trafoDepth] не присутствует, и режимом предсказания является не интра-предсказание, значение cbf_cb[x0][y0][trafoDepth] выводится как равное 0.[0070] The syntax elements cbf_cb, cbf_cr indicate contain color conversion blocks (Cb and Cr, respectively) non-zero transform coefficients. The syntax element cbf_cb [x0] [y0] [trafoDepth], equal to 1, determines that the transform block Cb contains one or more levels of transform coefficients other than 0. The array indices x0, y0 indicate the location (x0, y0) of the upper-left sample brightness of the conversion unit under consideration with respect to the upper-left image brightness sample. The trafoDepth array index indicates the current level of division of the coding unit into blocks for the purpose of coding the transform. The index of the trafoDepth array is 0 for blocks that correspond to coding units. When cbf_cb [x0] [y0] [trafoDepth] is not present, and the prediction mode is not intra prediction, the value cbf_cb [x0] [y0] [trafoDepth] is output as 0.

[0071] Синтаксический элемент cbf_cr[x0][y0][trafoDepth], равный 1, указывает, что блок преобразования Cr содержит один или более уровней коэффициентов преобразования, не равных 0. Индексы массива х0, y0 указывают местоположение (х0, y0) верхней-левой выборки яркости рассматриваемого блока преобразования относительно верхней-левой выборки яркости изображения. Индекс массива trafoDepth указывает текущий уровень подразделения единицы кодирования на блоки с целью кодирования преобразования. Индекс массива trafoDepth равен 0 для блоков, которые соответствуют единицам кодирования. Когда cbf_cr[x0][y0][trafoDepth] не присутствует, и режимом предсказания не является интра-предсказание, значение cbf_cr[x0][y0][trafoDepth] выводится равным 0.[0071] The syntax element cbf_cr [x0] [y0] [trafoDepth] equal to 1 indicates that the Cr transform unit contains one or more levels of transform coefficients other than 0. The array indices x0, y0 indicate the location (x0, y0) of the upper - the left luma sample of the conversion unit under consideration with respect to the upper-left luma sample image. The trafoDepth array index indicates the current level of division of the coding unit into blocks for the purpose of coding the transform. The index of the trafoDepth array is 0 for blocks that correspond to coding units. When cbf_cr [x0] [y0] [trafoDepth] is not present, and the prediction mode is not intra-prediction, the value cbf_cr [x0] [y0] [trafoDepth] is output equal to 0.

[0072] Синтаксический элемент coeff_abs_level_greaterl_flag[n] указывает для позиции n сканирования, имеются ли уровни коэффициентов преобразования больше, чем 1. Когда coeff_abs_level_greaterl_flag[n] не присутствует, то делается вывод, что он равен 0.[0072] The syntax element coeff_abs_level_greaterl_flag [n] indicates for scan position n whether there are conversion coefficient levels greater than 1. When coeff_abs_level_greaterl_flag [n] is not present, it is concluded that it is 0.

[0073] Синтаксический элемент coeff_abs_level_greater2_flag[n] указывает для позиции n сканирования, имеются ли уровни коэффициентов преобразования больше, чем 2. Когда coeff_abs_level_greater2_flag[n] не присутствует, делается вывод, что он равен 0.[0073] The syntax element coeff_abs_level_greater2_flag [n] indicates for scan position n whether there are conversion coefficient levels greater than 2. When coeff_abs_level_greater2_flag [n] is not present, it is concluded that it is 0.

[0074] В одном предложении для HEVC, различные бинаризации по синтаксическому элементу pred_type используются в Ρ и В сегментах, как показано в таблице 1. Настоящее раскрытие предлагает использовать те же самые бинаризации для Ρ и В сегментов. Примеры приведены в таблицах 2-4. Таблица 5 показывает влияние эффективности кодирования на Ρ сегмент в стандартных условиях тестирования (см., например, F. Bossen, "Common test conditions and software reference configurations", JCTVC-F900).[0074] In one sentence for HEVC, different binarizations for the pred_type syntax element are used in Ρ and B segments, as shown in Table 1. The present disclosure proposes to use the same binarizations for Ρ and B segments. Examples are given in tables 2-4. Table 5 shows the effect of coding efficiency on the Ρ segment under standard test conditions (see, for example, F. Bossen, "Common test conditions and software reference configurations", JCTVC-F900).

[0075] Как видно из таблицы 1, I сегменты (например, сегменты, которые включают только блоки интра-предсказания), включают в себя два различных типа предсказания (pred_type). Одна строка структурного элемента (бинаризация) используется для блока интра-предсказания с типом разделения 2N×2N, а другая строка структурного элемента используется для блока интра-предсказания с типом разделения N×N. Как показано в таблице 1, строка структурного элемента, используемая для I сегментов, не зависит от размера CU.[0075] As can be seen from table 1, I segments (for example, segments that include only intra-prediction blocks) include two different types of prediction (pred_type). One row of a structural element (binarization) is used for an intra-prediction block with a division type of 2N × 2N, and another row of a structural element is used for an intra-prediction block with a division type of N × N. As shown in table 1, the line of the structural element used for I segments does not depend on the size of the CU.

[0076] Для Ρ и В сегментов, в Таблице 1, различные строки структурного элемента используются для каждого значения pred_type. Вновь, значение pred_type зависит как от режима предсказания (интер-предсказания или интра-предсказания), так и используемого типа разделения. Для Ρ и В сегментов, фактическая используемая строка структурного элемента дополнительно зависит от размера кодируемой CU и от того, поддерживается ли интерпредсказание для размера 4×4 блока.[0076] For the Ρ and B segments, in Table 1, different lines of the structural element are used for each pred_type value. Again, the pred_type value depends on both the prediction mode (inter prediction or intra prediction) and the type of separation used. For Ρ and B segments, the actual line of the structural element used additionally depends on the size of the encoded CU and on whether inter prediction is supported for a 4 × 4 block size.

[0077] Первый столбец под строкой структурного элемента применяется для ситуации, когда логарифмическая функция размера CU кодируемой CU превышает логарифмическую функцию минимально допустимого размера CU. Согласно одному примеру в HEVC, первый столбец строк структурного элемента используется, если cLog2CUSize>Log2MinCUsize. Логарифмическая функция используется для создания меньшего числа, так что может быть использован меньший последовательный индекс.[0077] The first column below the row of the structural element is used for a situation where the logarithmic function of the size of the CU of the encoded CU exceeds the logarithmic function of the minimum allowable size of the CU. According to one example in HEVC, the first row column of a structural element is used if cLog2CUSize> Log2MinCUsize. The logarithmic function is used to create a smaller number, so a smaller sequential index can be used.

[0078] Если логарифмическая функция от размера CU кодируемой CU эквивалентна логарифмической функции минимально допустимого размера CU (т.е. cLog2CUSize==Log2MinCUSize), то один из столбцов 2 и 3 под строкой структурного элемента в таблице 1 используется для выбора бинаризации. Столбец 2 используется, когда логарифмическая функция от размера CU кодируемой CU эквивалентна 3, и интер-предсказание для 4×4 CU не поддерживается (т.е. cLog2CUSize==3 &&! inter_4×4_enabled_flag). Столбец 3 используется, когда логарифмическая функция от размера CU для кодируемой CU больше, чем 3, или когда интер-предсказание для 4×4 CU поддерживается (то есть, cLog2CUSize>3||inter_4×4_enabled_flag).[0078] If the logarithmic function of the size of the CU of the encoded CU is equivalent to the logarithmic function of the minimum allowable size of the CU (ie cLog2CUSize == Log2MinCUSize), then one of the columns 2 and 3 below the row of the structural element in table 1 is used to select the binarization. Column 2 is used when the logarithmic function of the CU size of the encoded CU is equivalent to 3, and inter prediction for 4 × 4 CUs is not supported (i.e. cLog2CUSize == 3 &&! Inter_4 × 4_enabled_flag). Column 3 is used when the logarithmic function of the CU size for the encoded CU is greater than 3, or when inter prediction for the 4 × 4 CU is supported (that is, cLog2CUSize> 3 || inter_4 × 4_enabled_flag).

[0079] В таблице 2 ниже показаны примеры бинаризации, где Ρ и В сегменты используют те же строки структурного элемента, в соответствии с одним или более примерами, описанными в настоящем раскрытии. Как показано в таблице 2, Ρ сегменты используют те же бинаризации, используемые для В сегментов в таблице 1. Таким образом, нет необходимости хранить и использовать отдельный набор контекстов для Ρ и В сегментов. Таким образом, общее количество контекстов, необходимых для кодирования синтаксического элемента pred_type, снижается. Кроме того, только одно отображение (вместо двух) между логикой строки структурного элемента (показано в столбцах (1)-(3)) и фактической строкой структурного элемента должно быть сохранено.[0079] Table 2 below shows examples of binarization, where Ρ and B segments use the same lines of a structural element, in accordance with one or more examples described in the present disclosure. As shown in Table 2, the Ρ segments use the same binarization used for the B segments in table 1. Thus, there is no need to store and use a separate set of contexts for the Ρ and B segments. Thus, the total number of contexts needed to encode the pred_type syntax element is reduced. In addition, only one mapping (instead of two) between the row logic of the structural element (shown in columns (1) - (3)) and the actual row of the structural element must be saved.

[0080] В таблице 3 ниже показан другой пример бинаризации для pred_type. В этом примере В сегменты используют те же бинаризации, что и Ρ сегменты из Таблицы 1. Таблица 4 ниже показывает дополнительный пример, где Ρ сегменты и В сегменты используют те же бинаризации. Таблицы 2-4 предназначены только для того, чтобы показать примеры общих бинаризаций между Ρ и В сегментами. Любые бинаризации или правила бинаризации могут быть использованы так, что синтаксические элементы pred_type для Ρ и В сегментов совместно используют те же бинаризации.[0080] Table 3 below shows another example of binarization for pred_type. In this example, B segments use the same binarization as Ρ segments from Table 1. Table 4 below shows an additional example where, segments and B segments use the same binarizations. Tables 2-4 are intended only to show examples of common binarizations between Ρ and B segments. Any binarization or binarization rules can be used so that the syntax elements pred_type for Ρ and B segments share the same binarization.

[0081] Видеокодер 20 и видеодекодер 30 могут хранить те же правила отображения и таблицы отображения (например, как показано в таблицах 2-4) для использования с Ρ и В сегментами. Кодирование и декодирование САВАС могут быть применены к синтаксическому элементу pred_type с использованием этих отображений.[0081] Video encoder 20 and video decoder 30 may store the same display rules and display tables (for example, as shown in Tables 2-4) for use with Ρ and B segments. CABAC encoding and decoding can be applied to the pred_type syntax element using these mappings.

[0082] Таким образом, видеокодер 20 может быть сконфигурирован, чтобы определять первый тип предсказания для блока видеоданных в Ρ сегменте, представлять первый тип предсказания как синтаксический элемент типа предсказания Ρ сегмента, определять второй тип предсказания для блока видеоданных в В сегменте, представлять второй тип предсказания как синтаксический элемент типа предсказание В сегмента, определять бинаризацию Ρ сегмента для синтаксического элемента типа предсказания Ρ сегмента, определять бинаризацию В сегмента для синтаксического элемента типа предсказания В сегмента, причем синтаксический элемент типа предсказания Ρ сегмента и синтаксический элемент типа предсказания В сегмента определяются с использованием той же логики бинаризации, и кодировать видеоданные на основе бинаризаций синтаксического элемента типа предсказания Ρ сегмента и синтаксического элемента типа предсказания В сегмента.[0082] Thus, video encoder 20 may be configured to determine a first prediction type for a block of video data in a Ρ segment, represent a first type of prediction as a syntax element of a prediction type Ρ segment, define a second type of prediction for a block of video data in a, segment, represent a second type predictions as a syntax element of type prediction In a segment, define binarization Ρ segment for a syntax element of type prediction Ρ segment, define binarization In a segment for syntax of the prediction type element in the segment, the syntax element of the prediction type Ρ segment and the syntax element of the prediction type in the segment are determined using the same binarization logic, and encode video data based on binarizations of the syntax element of the prediction type Ρ segment and the syntax element of the prediction type in the segment.

[0083] Видеокодер 20 может быть дополнительно сконфигурирован для бинаризации синтаксического элемента типа предсказания Ρ сегмента с определенной бинаризацией Ρ сегмента, бинаризации синтаксического элемента типа предсказания В сегмента с определенной бинаризацией В сегмента, применения контекстно-адаптивного бинарного арифметического кодирования (САВАС) к бинаризованному синтаксическому элементу типа прогнозирования Ρ сегмента и применения контекстно-адаптивного бинарного арифметического кодирования (САВАС) к бинаризованному синтаксическому элементу типа прогнозирования В сегмента.[0083] Video encoder 20 may be further configured to binarize a prediction type syntax element Ρ a segment with a specific Ρ segment binarization, binarize a prediction type syntax element on a segment with a certain binarization on a segment, applying context adaptive binary arithmetic coding (SAVAS) to the binarized syntax element type of segment prediction применения and application of context adaptive binary arithmetic coding (SAVAS) to a binarized system taksicheskomu element prediction type B segment.

[0084] Аналогичным образом, видео декодер 30 может быть сконфигурирован для отображения бинаризованного синтаксического элемента типа предсказания Ρ сегмента на тип предсказания с использованием отображения бинаризации для блока видеоданных в Ρ сегменте, отображения бинаризованного синтаксического элемента типа предсказания В сегмента на тип предсказания с использованием того же самого отображения бинаризации для блока видеоданных в В сегменте и декодирования видеоданных на основе отображенных типов предсказания.[0084] Similarly, video decoder 30 may be configured to map the binarized syntax element of the Ρ segment prediction type to the prediction type using a binarization map for the video block in the Ρ segment, display the binarized syntax element of the В segment prediction type to the prediction type using the same the binarization mapping itself for a block of video data in the In segment and decoding video data based on the displayed prediction types.

[0085] Видеодекодер 30 может быть дополнительно сконфигурирован, чтобы принимать подвергнутый контекстно-адаптивному бинарному арифметическому кодированию синтаксический элемент типа предсказания Ρ сегмента, который указывает тип предсказания для блока видеоданных в Ρ сегменте, принимать подвергнутый контекстно-адаптивному бинарному арифметическому кодированию синтаксический элемент типа предсказания В сегмента, который указывает тип предсказания для блока видеоданных в В сегменте, декодировать синтаксический элемент типа предсказания Ρ сегмента, чтобы сформировать бинаризованный синтаксический элемент типа предсказания Ρ сегмента, и декодировать синтаксический элемент типа предсказания В сегмента, чтобы сформировать бинаризованный синтаксический элемент типа предсказания В сегмента.[0085] Video decoder 30 may be further configured to receive a context-adaptive binary arithmetic coding syntax element of a prediction type Ρ segment that indicates a prediction type for a video block in a Ρ segment, to receive a context-adaptive binary arithmetic coding syntax element of a prediction type B a segment that indicates the type of prediction for the video block in the In segment, decode a syntax element of the prediction type anija Ρ segment to form the binarized syntax element Ρ prediction type segment, and decoding the syntax element in a prediction type segment to form a prediction type of the binarized syntax element in the segment.

[0086] Таблица 5 ниже показывает производительность кодирования с использованием общей бинаризации для Ρ и В сегментов, показанных в Таблице 2. Как можно видеть из Таблицы 5, незначительная эффективность кодирования теряется (или не теряется вообще) при использовании общих бинаризаций. НЕ (высокая эффективность) низкой задержки Ρ является общим тестовым условием для бинаризаций однонаправленно предсказанных (Р) сегментов. Классы А-Е представляют различные разрешения кадров. Класс А соответствует разрешению 2k×4k. Класс В соответствует разрешению 1920×1080. Класс С соответствует разрешению WVGA. Класс D соответствует разрешению WQVGA. Класс Ε соответствует разрешению 720Р. Изменение от 0,1 до 0,2 процента при тестовом условии НЕ низкой задержки Р, как правило, считается незначительным.[0086] Table 5 below shows the coding performance using common binarization for the Ρ and B segments shown in Table 2. As can be seen from Table 5, negligible coding efficiency is lost (or not lost at all) when using common binarizations. NOT (high performance) low latency Ρ is a general test condition for binarizations of unidirectionally predicted (P) segments. Classes AE represent different frame resolutions. Class A corresponds to a resolution of 2k × 4k. Class B corresponds to a resolution of 1920 × 1080. Class C corresponds to WVGA resolution. Class D corresponds to WQVGA resolution. Class Ε corresponds to a resolution of 720P. A change from 0.1 to 0.2 percent under the test condition of NOT a low delay P is generally considered insignificant.

[0087] Опционально, те же бинаризации (не ограничиваясь таблицами 2-4) для типа предсказания (включает размер предсказания и/или режим предсказания) могут быть совместно использованы в двух и более различных типах сегментов интерпредсказания. Сегменты интер-предсказания могут включать в себя, без ограничения указанным:[0087] Optionally, the same binarizations (not limited to tables 2-4) for the prediction type (includes prediction size and / or prediction mode) can be shared in two or more different types of inter prediction segments. Inter prediction segments may include, but are not limited to:

a. Ρ сегмент: сегмент поддерживает только однонаправленное предсказание движенияa. Ρ segment: the segment only supports unidirectional motion prediction

b. В сегмент: сегмент поддерживает однонаправленное и двунаправленное предсказание движенияb. Per Segment: The segment supports unidirectional and bidirectional motion prediction

c. В масштабируемом кодировании видео: улучшенный слой может совместно использовать те же самые бинаризации с базовым слоем.c. In scalable video encoding: An enhanced layer can share the same binarizations with the base layer.

d. В многовидовом кодировании: разные виды (представления) могут совместно использовать те же самые бинаризации.d. In multi-view coding: different types (representations) can share the same binarizations.

[0088] Когда поддерживается асимметричное разделение, четыре контекста, поровну разделенные на два набора контекстов, используются для САВАС на последних двух структурных элементах для сигнализации синтаксического элемента pred_type для асимметричных разделений (т.е. PART_2N×nU, PART_2N×nD, РАРТ nL×2N, PART_nR×2N). В зависимости от того, выполнено ли разделение в горизонтальном направлении или вертикальном направлении, применяется один набор контекстов. Предпоследний структурный элемент (т.е. структурный элемент типа разделения; part_mode) определяет, имеет ли текущая CU симметричные разделения или асимметричные разделения. Последний структурный элемент (т.е. структурный элемент размера разделения; part_mode) определяет, является ли размером первого разделения одна четверть или три четверти от размера CU. Таблица 6 показывает пример контекстов предпоследнего (тип разделения) и последнего (размер разделения) для синтаксического элемента pred_type.[0088] When asymmetric separation is supported, four contexts, evenly divided into two sets of contexts, are used for SAVAS on the last two structural elements to signal the pred_type syntax element for asymmetric separations (ie, PART_2N × nU, PART_2N × nD, PART nL × 2N, PART_nR × 2N). Depending on whether the separation is performed in the horizontal direction or the vertical direction, one set of contexts is applied. The penultimate structural element (i.e., a structural element of a split type; part_mode) determines whether the current CU has symmetrical splits or asymmetric splits. The last structural element (i.e., the structural element of the partition size; part_mode) determines whether the size of the first partition is one quarter or three quarters of the size of the CU. Table 6 shows an example of the penultimate (split type) and last (split size) contexts for the pred_type syntax element.

Таблица 6
Контексты для последних двух структурных элементов синтаксического элемента pred_typeTable 6
Contexts for the last two structural elements of the pred_type syntax element Структурный элементStructural element КонтекстContext Тип разделения (симметричный или асимметричный)Separation type (symmetric or asymmetric) Набор 1 контекстов (2 контекста, один для вертикального разделения, 1 для горизонтального разделения)Set of 1 contexts (2 contexts, one for vertical separation, 1 for horizontal separation) Размер разделения (первое разделение равно ¼ CU или ¾ CU)Partition size (first partition is ¼ CU or ¾ CU) Набор 2 контекстов (2 контекста, один для ¼ CU и один для ¾ CU)A set of 2 contexts (2 contexts, one for ¼ CU and one for ¾ CU)

[0089] Настоящее раскрытие предлагает использовать один контекст для предпоследнего структурного элемента (т.е. структурного элемента типа разделения) и использовать режим обхода на последнем структурном элементе (т.е. структурном элементе размера разделения). В результате, число контекстов уменьшается с 4 до 1. Таблица 7 показывает пример контекста, используемого согласно данному примеру настоящего раскрытия. Таблица 8 показывает производительность кодирования, связанную с предлагаемыми изменениями. Высокая эффективность (НЕ) произвольного доступа является тестовым условием с кадрами произвольного доступа. НЕ низкой задержки В является тестовым условием, которое допускает двунаправленное предсказание.[0089] The present disclosure proposes to use one context for the penultimate structural element (ie, a structural element of a split type) and use the crawl mode on the last structural element (ie, a structural element of a split size). As a result, the number of contexts decreases from 4 to 1. Table 7 shows an example of the context used according to this example of the present disclosure. Table 8 shows the coding performance associated with the proposed changes. High performance (NOT) random access is a test condition with random access frames. NOT low latency B is a test condition that allows bi-directional prediction.

Таблица 7
Контексты для последних двух структурных элементов синтаксического элемента pred_type в соответствии с примером
настоящего раскрытия.Table 7
Contexts for the last two structural elements of the pred_type syntax element according to an example
of the present disclosure. Структурный элементStructural element КонтекстContext Тип разделения (симметричный или асимметричный)Separation type (symmetric or asymmetric) Набор 1 контекстов (1 контекст)Set of 1 contexts (1 context) Размер разделения (первое разделение равно ¼ CU или ¾ CU)Partition size (first partition is ¼ CU or ¾ CU) Режим обхода (ни одного контекста)Crawl mode (no context)

[0090] Таким образом, согласно этому примеру, видеокодер 20 может быть сконфигурирован, чтобы определять тип разделения для режима предсказания для блока видеоданных, кодировать структурный элемент типа разделения синтаксического элемента типа предсказания для блока видеоданных с использованием контекстно-адаптивного бинарного арифметического кодирования с одним контекстом, причем один контекст является одинаковым для любого типа разделения, и кодировать структурный элемент размера разделения синтаксиса типа предсказания для блока видеоданных с использованием контекстно-адаптивного бинарного арифметического кодирования в режиме обхода.[0090] Thus, according to this example, video encoder 20 may be configured to determine a split type for a prediction mode for a video block, encode a structural element of a split type of a prediction type syntax element for a video block using one context context adaptive binary arithmetic coding moreover, one context is the same for any type of separation, and encode the structural element of the size division of the syntax of the prediction type for the block deodannyh using context-adaptive binary arithmetic coding in bypass mode.

[0091] Кроме того, согласно этому примеру, видеодекодер 30 может быть сконфигурирован, чтобы принимать синтаксический элемента типа предсказания для блока видеоданных, который был кодирован с использованием контекстно-адаптивного бинарного арифметического кодирования (САВАС), причем синтаксический элемент типа предсказания включает в себя структурный элемент типа разделения, представляющий тип разделения, и структурный элемент размера разделения, представляющий размер разделения, декодировать структурный элемент типа разделения синтаксического элемента типа предсказания с использованием контекстно-адаптивного бинарного арифметического кодирования с одним контекстом, причем один контекст является одинаковым для любого типа разделения, и декодировать структурный элемент размера разделения синтаксиса типа предсказания для блока видеоданных с использованием контекстно-адаптивного бинарного арифметического кодирования в режиме обхода.[0091] Furthermore, according to this example, video decoder 30 may be configured to receive a prediction type syntax element for a video block that has been encoded using context adaptive binary arithmetic coding (SAVAS), wherein the prediction type syntax element includes a structural a separation type element representing a separation type, and a separation size structural element representing a separation size, decode a syntax separation type structural element a x-prediction type element using context adaptive binary arithmetic coding with one context, with one context being the same for any type of separation, and decode a prediction type syntax separation size element for a block of video data using context-adaptive binary arithmetic coding in crawl mode.

[0092] В другом примере, при кодировании прямоугольного типа разделения, режим обхода или один контекст может быть использован для структурного элемента, который указывает, является ли режимом разделения PART_nL×2N или PART_nR×2N, или же режимом является PART_2N×nU, PART_2N×nD. Использование режима обхода или одного контекста применимо, потому что вероятность любого используемого режима разделения близка к 50%. Также опционально режим обхода или один контекст может быть использован для структурного элемента, который указывает, является ли режим симметричным разделением или асимметричным разделением.[0092] In another example, when encoding a rectangular split type, a traversal mode or single context can be used for a structural element that indicates whether the partition mode is PART_nL × 2N or PART_nR × 2N, or whether the mode is PART_2N × nU, PART_2N × nD. Using a crawl mode or a single context is applicable because the probability of any split mode being used is close to 50%. Also optionally, a traversal mode or a single context can be used for a structural element that indicates whether the mode is symmetric separation or asymmetric separation.

[0093] Следующий пример настоящего раскрытия относится к сигнализации в режиме «слияния» интер-предсказания. В режиме слияния, кодер инструктирует декодер, через сигнализацию битового потока синтаксиса предсказания, копировать вектор движения, опорный индекс (идентифицирующий опорное изображение, в данном списке опорных изображений, на которое указывает вектор движения) и направление предсказания движения (которое идентифицирует список опорных изображений (Список 0 или Список 1), т.е. с точки зрения того, предшествует ли во времени опорный кадр или следует за текущим кадром) от выбранного вектора движения-кандидата для текущей части изображения, которое должно кодироваться. Это выполняется посредством сигнализации в битовом потоке индекса в список векторов движения-кандидатов, идентифицирующего выбранный вектор движения-кандидат (то есть конкретный кандидат пространственного предсказателя вектора движения (MVP) или кандидат временного MVP).[0093] The following example of the present disclosure relates to inter-prediction merge signaling. In merge mode, the encoder instructs the decoder, through the signaling of the bitstream of the prediction syntax, to copy the motion vector, the reference index (identifying the reference image, in this list of reference images indicated by the motion vector) and the direction of motion prediction (which identifies the list of reference images (List 0 or List 1), i.e., from the point of view of whether the reference frame precedes or follows the current frame) from the selected candidate motion vector for the current part of the image to be encoded. This is accomplished by signaling the index bitstream to a list of candidate motion vectors identifying the selected candidate motion vector (i.e., a particular candidate spatial motion vector predictor (MVP) or candidate temporary MVP).

[0094] Таким образом, в режиме слияния, синтаксис предсказания может включать в себя флаг, идентифицирующий режим (в данном случае режим слияния) и индекс (merge_idx), идентифицирующий выбранный вектор движения-кандидат. В некоторых случаях, вектор движения-кандидат будет в причинной части по отношению к текущей части. То есть, вектор движения-кандидат будет уже декодирован декодером. Таким образом, декодер уже принял и/или определил вектор движения, опорный индекс и направление движения предсказания для причинной части. Таким образом, декодер может просто извлечь вектор движения, опорный индекс и направление предсказания движения, ассоциированные с причинной частью, из памяти и скопировать эти значения в качестве информации движения для текущей части. Для восстановления блока в режиме слияния, декодер получает блок предсказания, используя полученную информацию движения для текущей части, и добавляет остаточные данные к блоку предсказания для восстановления кодированного блока.[0094] Thus, in the merge mode, the prediction syntax may include a flag identifying the mode (in this case, the merge mode) and an index (merge_idx) identifying the selected candidate motion vector. In some cases, the candidate motion vector will be in the causal part relative to the current part. That is, the candidate motion vector will already be decoded by the decoder. Thus, the decoder has already received and / or determined a motion vector, a reference index, and a direction of motion of the prediction for the causal part. Thus, the decoder can simply extract the motion vector, the reference index, and the motion prediction direction associated with the causal part from the memory and copy these values as motion information for the current part. To restore the block in the merge mode, the decoder receives the prediction block using the obtained motion information for the current part, and adds residual data to the prediction block to restore the encoded block.

[0095] В НМ4.0, один из пяти кандидатов слияния сигнализируется, когда текущая PU находится в режиме слияния. Усеченный унарный код используется для представления синтаксического элемента merge_idx. В одном предложении для HEVC, для САВАС, каждый структурный элемент использует один контекст. Настоящее раскрытие предлагает использовать один контекст повторно во всех четырех структурных элементах, как показано в таблице 9.[0095] In HM4.0, one of the five merge candidates is signaled when the current PU is in merge mode. Truncated unary code is used to represent the syntax element merge_idx. In one sentence for HEVC, for SAVAS, each structural element uses one context. The present disclosure suggests reusing one context in all four structural elements, as shown in table 9.

Таблица 9
Контексты для последних двух структурных элементов синтаксического элемента pred type.Table 9
Contexts for the last two structural elements of the pred type syntax element. Структурный элементStructural element КонтекстContext Структурный элемент 0-3 для merge_idxStructural element 0-3 for merge_idx Набор 1 контекста (тот же контекст для всех структурных элементов)Set 1 context (the same context for all structural elements)

[0096] Таблица 10 показывает производительность кодирования, связанную с этим примером.[0096] Table 10 shows the coding performance associated with this example.

[0097] Опционально, более чем один контекст может быть использован в кодировании индекса слияния, при этом некоторые структурные элементы совместно используют тот же самый контекст, и некоторые структурные элементы используют различные контексты. В качестве одного примера, только последовательные структурные элементы (bin) совместно используют тот же контекст. Например, bin2 и bin3 могут совместно использовать один контекст; bin2 и bin4 не могут совместно использовать один и тот же контекст, если только bin3 также не использует этот контекст.[0097] Optionally, more than one context can be used in coding the merge index, with some structural elements sharing the same context, and some structural elements using different contexts. As one example, only consecutive structural elements (bin) share the same context. For example, bin2 and bin3 can share the same context; bin2 and bin4 cannot share the same context unless bin3 also uses this context.

[0098] В качестве другого примера, предположим, что общее количество структурных элементов индекса слияния равно N (первый структурный элемент есть bin0, последний структурный элемент есть bin N-1). Υ порогов, thres_i, i=1,…, у, используются для определения контекста, совместно использующегося в кодировании индекса слияния. В этом примере, следующие правила указывают, как контексты совместно используются между структурными элементами:[0098] As another example, suppose that the total number of structural elements of the merge index is N (the first structural element is bin0, the last structural element is bin N-1). Υ thresholds, thres _i , i = 1, ..., y, are used to determine the context shared in the coding of the merge index. In this example, the following rules indicate how contexts are shared between structural elements:

1. 0<Y<N (имеется меньше порогов, чем структурных элементов)1. 0 <Y <N (there are fewer thresholds than structural elements)

2. thresi<thres_i+1 2.thresi <thres _{i + 1}

3. 0<thres₁ 3.0 <thres ₁

4. thres_YN4. thres _Y N

5. bin_j будет совместно использовать один контекст, где х={thres_Y, …, thres_i+1 -1}5. bin _j will share one context, where x = {thres _Y , ..., thres _{i + 1} -1}

[0099] На основании этих правил, предыдущий способ, в котором один контекст многократно используется во всех четырех структурных элементах, можно рассматривать как один случай, где N=4, Y=1, thres₁=4. Поэтому структурные элементы от 0 до 3 совместно используют тот же контекст.[0099] Based on these rules, the previous method, in which one context is repeatedly used in all four structural elements, can be considered as one case, where N = 4, Y = 1, thres ₁ = 4. Therefore, structural elements from 0 to 3 share the same context.

[0100] Другой пример включает в себя установку N=4, Y=2, thres₁=2, thres₂=4. В этом примере, bin0 и bin1 совместно используют одни и те же контексты, и bin2 и bin3 совместно используют одни и те же контексты.[0100] Another example includes setting N = 4, Y = 2, thres ₁ = 2, thres ₂ = 4. In this example, bin0 and bin1 share the same contexts, and bin2 and bin3 share the same contexts.

[0101] Флаг интер-предсказания (inter_pred_flag) определяет, используется ли моно-предсказание или би-предсказание для текущей PU. В некоторых примерах индекс контекста для флага интер-предсказания равен текущей глубине CU. Так как имеется четыре возможных глубины CU (0-3), то существует четыре возможных контекста для кодирования inter_pred_flag.[0101] The inter prediction flag (inter_pred_flag) determines whether mono prediction or bi prediction is used for the current PU. In some examples, the context index for the inter prediction flag is equal to the current CU depth. Since there are four possible CU depths (0-3), there are four possible contexts for encoding inter_pred_flag.

[0102] Настоящее раскрытие предполагает, что индекс контекста, используемый для выбора контекста для кодирования inter_pred_flag, равен текущей глубине CU (например, уровень декомпозиции квадродерева для CU), но ограничен выбранным порогом (то есть меньшим из текущей глубины CU или порога). Порог может быть выбран равным 2 в одном примере. Альтернативно, индекс контекста может быть равным максимальной глубине CU минус текущую глубину CU и ограничен сверху выбранным порогом. Альтернативно, предопределенная таблица отображения может быть спроектирована для выбора индекса контекста по заданной глубине CU. Таблица отображения может быть реализована в виде набора логики. В результате три контекста используются для кодирования синтаксического элемента между inter_pred_flag.[0102] The present disclosure assumes that the context index used to select the context for inter_pred_flag encoding is equal to the current CU depth (for example, the quad tree decomposition level for CU), but is limited by the selected threshold (that is, less than the current CU depth or threshold). The threshold can be selected equal to 2 in one example. Alternatively, the context index may be equal to the maximum CU depth minus the current CU depth and bounded from above by a selected threshold. Alternatively, a predetermined mapping table may be designed to select a context index from a predetermined CU depth. The mapping table may be implemented as a set of logic. As a result, three contexts are used to encode the syntax element between inter_pred_flag.

[0103] Таблица 11 показывает производительность кодирования, когда таблица инициализации изменяется, но количество контекстов не изменяется. Таблица 12 показывает производительность кодирования предлагаемого способа, который уменьшает количество контекстов с 4 до 3.[0103] Table 11 shows the coding performance when the initialization table changes, but the number of contexts does not change. Table 12 shows the coding performance of the proposed method, which reduces the number of contexts from 4 to 3.

[0104] Индекс опорного кадра {ref_idx_1x) сигнализируется с помощью усеченного унарного кода по отношению к активному опорному кадру в ассоциированном списке (например, Список 0 или Список 1). Три контекста используются для кодирования индекса опорного кадра. Один контекст - для структурного элемента 0, один контекст - для структурного элемента 1 и один контекст используется для остальной части структурных элементов. Таблица 13 показывает пример назначений контекста для структурных элементов унарного кода для ref_idx_1x.[0104] The reference frame index {ref_idx_1x) is signaled by a truncated unary code with respect to the active reference frame in the associated list (eg, List 0 or List 1). Three contexts are used to encode the reference frame index. One context is for structural element 0, one context is for structural element 1, and one context is used for the rest of the structural elements. Table 13 shows an example of context assignments for structural elements of a unary code for ref_idx_1x.

Таблица 13
Назначение контекста для структурных элементов ref idx lxTable 13
Context assignment for structural elements ref idx lx Структурные элементы унарного кода ref_idx_1xStructural elements of the unary code ref_idx_1x КонтекстContext Структурный элемент 0Structural element 0 Контекст 1Context 1 Структурный элемент 1Structural element 1 Контекст 2Context 2 Структурные элементы 2-N (N - общее число структурных элементов)Structural elements 2-N (N is the total number of structural elements) Контекст 3Context 3

[0105] Настоящее раскрытие предлагает использование двух контекстов для кодирования унарного кода для ref_idx_1x; один контекст для структурного элемента 0 и другой контекст для остальных структурных элементов. Таблица 14 показывает пример назначения контекста для структурных элементов унарного кода для ref_idx_1x согласно этому примеру настоящего раскрытия. Таблица 15 показывает производительность кодирования, ассоциированную с предложенными модификациями.[0105] The present disclosure proposes the use of two contexts for encoding a unary code for ref_idx_1x; one context for structural element 0 and another context for other structural elements. Table 14 shows an example of context assignment for structural elements of a unary code for ref_idx_1x according to this example of the present disclosure. Table 15 shows the coding performance associated with the proposed modifications.

Таблица 14Table 14 Назначение контекста для структурных элементов ref_idx_1хContext assignment for structural elements ref_idx_1x Структурные элементы унарного кода ref_idx_1xStructural elements of the unary code ref_idx_1x КонтекстContext Структурный элемент 0Structural element 0 Контекст 1Context 1 Структурные элементы 1-N (N - общее число структурных элементов)Structural elements 1-N (N is the total number of structural elements) Контекст 2Context 2

[0106] Для синтаксических элементов флага кодированного блока цветности (cbf_cb и cbf_cr), два различных набора контекстов (5 контекстов в каждом наборе контекстов) используются для САВАС. Индекс фактического контекста, используемого в каждом наборе, равен текущей глубине преобразования, ассоциированной с флагом кодированного блока цветности, который кодируется. Таблица 16 показывает наборы контекстов для флагов кодированного блока цветности cbf_cb и cbf_cr.[0106] For the syntax flag elements of the encoded chroma block (cbf_cb and cbf_cr), two different sets of contexts (5 contexts in each set of contexts) are used for SAVAS. The index of the actual context used in each set is equal to the current conversion depth associated with the flag of the encoded chroma block that is being encoded. Table 16 shows the context sets for the flags of the encoded chroma block cbf_cb and cbf_cr.

Таблица 16
Наборы контекстов для cbf_cb и cbf_cr.Table 16
Context sets for cbf_cb and cbf_cr. Флаг кодированного блока цветностиColor Coded Block Flag Набор контекстовSet of contexts cbf_cbcbf_cb Набор контекстов 1 (5 контекстов)Set of contexts 1 (5 contexts) cbf_crcbf_cr Набор контекстов 2 (5 контекстов)Set of contexts 2 (5 contexts)

[0107] Настоящее раскрытие предлагает, что cbf_cb и cbf_cr совместно используют один набор контекстов. Индекс действительного контекста, используемого в каждом наборе, может все еще быть равным текущей глубине преобразования, ассоциированной с флагом кодированного блока цветности, который кодируется. Таблица 17 показывает наборы контекстов для флагов кодированного блока цветности cbf_cb и cbf_cr согласно примерам настоящего раскрытия. Таблица 18 показывает производительность кодирования, ассоциированную с предложенными модификациями.[0107] The present disclosure suggests that cbf_cb and cbf_cr share the same set of contexts. The index of the actual context used in each set may still be equal to the current conversion depth associated with the flag of the encoded chroma block that is being encoded. Table 17 shows the context sets for the flags of the encoded chroma block cbf_cb and cbf_cr according to the examples of the present disclosure. Table 18 shows the coding performance associated with the proposed modifications.

Таблица 17
Наборы контекстов для cbf_cb и cbf_cr согласно примерам настоящего раскрытия.Table 17
Context sets for cbf_cb and cbf_cr according to examples of the present disclosure. Флаг кодированного блока цветностиColor Coded Block Flag Набор контекстовSet of contexts cbf_cbcbf_cb Набор контекстов 1 (5 контекстов)Set of contexts 1 (5 contexts) cbf_crcbf_cr Набор контекстов 1 (5 контекстов)Set of contexts 1 (5 contexts)

[0108] Таким образом, согласно этому примеру, как видеокодер 20, так и видеодекодер 30 могут быть конфигурированы, чтобы кодировать флаг кодированного блока цветности Cb для блока видеоданных с использованием контекстно-адаптивного бинарного арифметического кодирования (САВАС), причем САВАС использует набор контекстов, включающий в себя один или более контекстов, и кодировать флаг кодированного блока цветности Cr с использованием САВАС, причем САВАС использует тот же набор контекстов, как и для флага кодированного блока цветности Cb. Видеокодер 20 и видеодекодер 30 могут быть дополнительно сконфигурированы для выбора контекста из одного или более контекстов на основе глубины преобразования блока преобразования блока, ассоциированного с блоком видеоданных.[0108] Thus, according to this example, both video encoder 20 and video decoder 30 can be configured to encode the flag of the coded color block Cb for the video block using context adaptive binary arithmetic coding (SAVAS), wherein SAVAS uses a set of contexts, including one or more contexts, and encode the flag of the encoded chroma block Cr using CABAC, wherein CABAC uses the same set of contexts as for the flag of the encoded chroma block Cb. Video encoder 20 and video decoder 30 may be further configured to select a context from one or more contexts based on the conversion depth of the block transform block associated with the video data block.

[0109] В одном предложении для HEVC, имеется двенадцать наборов контекстов как для coeff_abs_level_greaterl_flag, так и coeff_abs_level_greater2_flag. coeff_abs_level_greater1_flag указывает, имеет ли коэффициент преобразования абсолютное значение, больше, чем 1. coeff_abs_level_greater2_flag указывает, имеет ли коэффициент преобразования абсолютное значение, больше, чем 2. Наборы контекстов одинаково назначаются для компонента яркости и цветности, т.е. 6 наборов контекстов для яркости и 6 контекстов для цветности. Каждый набор контекстов состоит из 5 контекстов. Индекс набора контекстов, ct×Set, выбран на основе предыдущего уровня coeff_abs_level_greater1_flag. Для coeff_abs_level_greater1_flag индекс контекста в наборе контекстов, greater1Ctx, определяется на основе концевых единиц до максимум 4. Индекс контекста может быть представлен в виде:[0109] In one sentence for HEVC, there are twelve sets of contexts for both coeff_abs_level_greaterl_flag and coeff_abs_level_greater2_flag. coeff_abs_level_greater1_flag indicates whether the conversion coefficient has an absolute value greater than 1. coeff_abs_level_greater2_flag indicates whether the conversion coefficient has an absolute value greater than 2. The sets of contexts are equally assigned to the luminance and color component, i.e. 6 sets of contexts for brightness and 6 contexts for chroma. Each set of contexts consists of 5 contexts. The context set index, ct × Set, is selected based on the previous level coeff_abs_level_greater1_flag. For coeff_abs_level_greater1_flag, the context index in the context set, greater1Ctx, is determined based on end units up to a maximum of 4. The context index can be represented as:

[0110] Для coeff_abs_level_greater2_flag, индекс контекста в наборе контекстов, greater2Ctx, основывается на числе coeff abs level_greater1_flag, составляющем от 1 до максимум 4. Индекс контекста может быть представлен в виде:[0110] For coeff_abs_level_greater2_flag, the context index in the context set, greater2Ctx, is based on the number of coeff abs level_greater1_flag, from 1 to a maximum of 4. The context index can be represented as:

greater1Ctx основан на числе для значимых коэффициентов и числе коэффициентов, которые больше 1. С другой стороны, greater2Ctx основан на числе коэффициентов, которые больше, чем 1.greater1Ctx is based on the number of significant coefficients and the number of coefficients that are greater than 1. On the other hand, greater2Ctx is based on the number of coefficients that are greater than 1.

[0111] В некоторых примерах различное число контекстов может быть использовано в различных наборах контекстов, в том числе, например:[0111] In some examples, a different number of contexts can be used in different sets of contexts, including, for example:

1. Наборы контекстов для уровня большего, чем 1, или уровня большего, чем 2, могут иметь разное число контекстов. Например, наборы контекстов 0 и 3 могут иметь 5 контекстов, а остальные наборы контекстов могли бы иметь 2 контекста.1. Sets of contexts for a level greater than 1, or a level greater than 2, may have a different number of contexts. For example, context sets 0 and 3 may have 5 contexts, and the remaining context sets could have 2 contexts.

2. Наборы контекстов для коэффициента яркости могут иметь разное число контекстов по сравнению с наборами контекстов для компонента цветности. Например, набор контекстов 0 для яркости может иметь 5 контекстов, а набор контекстов 0 для цветности может иметь 4 контекста.2. The context sets for the luminance factor may have a different number of contexts compared to the context sets for the color component. For example, a set of contexts 0 for luminance may have 5 contexts, and a set of contexts 0 for luminance may have 4 contexts.

3. Набор контекстов для уровня большего, чем 1, может иметь отличающееся число контекстов, по сравнению с набором контекстов для уровня большего, чем 2. Например, набор контекстов 0 для уровня большего, чем 1, может иметь 5 контекстов, и набор контекстов 0 для уровня большего, чем 2, мог бы иметь только 3 контекста.3. A set of contexts for a level greater than 1 may have a different number of contexts compared to a set of contexts for a level greater than 2. For example, a set of contexts 0 for a level greater than 1 may have 5 contexts, and a set of contexts 0 for a level greater than 2, could have only 3 contexts.

[0112] В других примерах может быть использовано другое число для наборов контекстов для кодирования больше 1 или больше 2, в том числе, например:[0112] In other examples, a different number may be used for sets of contexts for encoding greater than 1 or greater than 2, including, for example:

1. Наборы контекстов для коэффициента яркости могут иметь отличающееся число наборов контекстов по отношению к наборам контекстов, используемых для компонента цветности. Например, яркость могла бы использовать 6 контекстов, а цветность могла бы использовать 4 контекста.1. Context sets for the luminance factor may have a different number of context sets with respect to the context sets used for the color component. For example, luminance could use 6 contexts, and chroma could use 4 contexts.

2. Наборы контекстов для больше 1 могут иметь другое число контекстов по отношению к используемым наборам контекстов больше 2. Например, в случае больше 1 могло бы использоваться 6 контекстов, а в случае больше 2 могло бы использоваться 4 контекста.2. Context sets for more than 1 may have a different number of contexts with respect to the used context sets of more than 2. For example, in the case of more than 1, 6 contexts could be used, and in the case of more than 2, 4 contexts could be used.

[0113] Опционально, используется метрика для определения того, какой контекст используется в наборе контекстов, и диапазон значения метрики больше, чем число контекстов в наборе контекстов. В одном таком аспекте один контекст мог бы быть ассоциирован с одним или более значений метрики. Совместное использование контекста предпочтительно ограничено непрерывными значениями. Например, пусть значение метрики равно у, у=2 ассоциировано с контекстом 3 и у=1 и у=4 также могут быть ассоциированы с контекстом 3. Однако если у=3 ассоциировано с контекстом 4, у=4 не может быть ассоциировано с контекстом 3.[0113] Optionally, a metric is used to determine which context is used in the context set, and the range of the metric value is greater than the number of contexts in the context set. In one such aspect, one context could be associated with one or more metric values. Context sharing is preferably limited to continuous values. For example, if the metric value is equal to y, y = 2 is associated with context 3 and y = 1 and y = 4 can also be associated with context 3. However, if y = 3 is associated with context 4, y = 4 cannot be associated with context 3.

[0114] Например, для coeff_abs_level_greater1_flag, наборы контекстов 0 и 3 имеют 5 контекстов, а наборы контекстов 1, 2, 4 и 5 имеют 2 контекста. Для coeff_abs_level_greater2_flag, наборы контекстов 0, 1 и 2 имеют 5 контекстов, а наборы контекстов 3, 4 и 5 имеют 2 контекста. Это может быть представлено в виде:[0114] For example, for coeff_abs_level_greater1_flag, context sets 0 and 3 have 5 contexts, and context sets 1, 2, 4, and 5 have 2 contexts. For coeff_abs_level_greater2_flag, context sets 0, 1, and 2 have 5 contexts, and context sets 3, 4, and 5 have 2 contexts. This can be represented as:

если ct×Set=0 или ct×Set=3, Thres_greater1=4;if ct × Set = 0 or ct × Set = 3, Thres_greater1 = 4;

в противном случае, Thres_greater1=1otherwise, Thres_greater1 = 1

если ct×Set<3, Thres_greater2=4;if ct × Set <3, Thres_greater2 = 4;

в противном случае, Thres_greater2=1otherwise, Thres_greater2 = 1

Thres_greater1 и Thres_greater2 можно выбрать различным образом в зависимости от следующих ситуаций:Thres_greater1 and Thres_greater2 can be selected in various ways depending on the following situations:

1. Компонент яркости или цветности1. The component of brightness or color

2. Наборы контекстов2. Sets of contexts

[0115] В качестве другого примера, для[0115] As another example, for

coeff_abs_level_greater1_flag, наборы контекстов 0 и 3 имеют 5 контекстов, и наборы контекстов 1, 2, 4 и 5 имеют 3 контекста. Для coeff_abs_level_greater2_flag, наборы контекстов 0, 1 и 2 имеют 5 контекстов, и наборы контекстов 3, 4 и 5 имеют 2 контекста. Это может быть представлено в виде:coeff_abs_level_greater1_flag, context sets 0 and 3 have 5 contexts, and context sets 1, 2, 4 and 5 have 3 contexts. For coeff_abs_level_greater2_flag, context sets 0, 1, and 2 have 5 contexts, and context sets 3, 4, and 5 have 2 contexts. This can be represented as:

ct×Idx_level_greater1=(ct×Set*5)+greater1Ct×_mapped (3) ct×Id×_level_greater2=(ct×Set*5)+greater2Ct×_mapped (4)ct × Idx_level_greater1 = (ct × Set * 5) + greater1Ct × _mapped (3) ct × Id × _level_greater2 = (ct × Set * 5) + greater2Ct × _mapped (4)

[0116] В таких примерах отображение может быть таким, как показано в Таблицах 19 и 20:[0116] In such examples, the display may be as shown in Tables 19 and 20:

[0117] Таблицы инициализации САВАС для coeff_abs_level_greater1_flag и coeff_abs_level_greater2_flag также модифицированы для наборов контекстов для Thres_greater1 или Thres_greater2, равного 1. Модификации перемещают инициализацию пятого контекста вперед, чтобы стать инициализацией второго контекста. Этот предложенный способ уменьшает количество контекстов от 120 до 78.[0117] The CABAC initialization tables for coeff_abs_level_greater1_flag and coeff_abs_level_greater2_flag are also modified for context sets for Thres_greater1 or Thres_greater2 equal to 1. Modifications move the initialization of the fifth context forward to become the initialization of the second context. This proposed method reduces the number of contexts from 120 to 78.

[0118] Таблица 21 перечисляет число контекстов для всех синтаксических элементов, упомянутых в предыдущих разделах. Общее снижение составляет 56 контекстов.[0118] Table 21 lists the number of contexts for all syntax elements mentioned in the previous sections. The overall decline is 56 contexts.

[01191 На фиг. 2 представлена блок-схема, иллюстрирующая примерный видеокодер 20, который может реализовать способы, описанные в настоящем раскрытии. Видеокодер 2 0 может выполнять интра- и интер-кодирование блоков видео в сегментах видео. Интра-кодирование опирается на пространственное предсказание для уменьшения или устранения пространственной избыточности в видео в течение определенного видеокадра или изображения. Интеркодирование основывается на временном предсказании для уменьшения или устранения временной избыточности в видео в смежных кадрах или изображениях видеопоследовательности. Интра-режим (режим I) может относиться к любому из нескольких режимов пространственного сжатия. Интер-режимы, такие как однонаправленное предсказание (режим Р) или двунаправленное предсказание (режим В), могут относиться к любому из различных режимов временного сжатия.[01191 In FIG. 2 is a flowchart illustrating an example video encoder 20 that can implement the methods described in the present disclosure. Video encoder 2 0 may perform intra- and inter-coding of video blocks in video segments. Intra-coding relies on spatial prediction to reduce or eliminate spatial redundancy in a video over a specific video frame or image. Intercoding is based on temporal prediction to reduce or eliminate temporal redundancy in video in adjacent frames or images of a video sequence. The intra-mode (mode I) may refer to any of several spatial compression modes. Inter-modes, such as unidirectional prediction (mode P) or bidirectional prediction (mode B), may refer to any of various time compression modes.

[0120] В примере на фиг. 2, видеокодер 20 включает в себя модуль 35 разделения, модуль 41 предсказания, память 64 опорных изображений, сумматор 50, модуль 52 преобразования, модуль 54 квантования и модуль 5 6 энтропийного кодирования. Модуль 41 предсказания включает в себя модуль 42 оценки движения, модуль 4 4 компенсации движения и модуль 4 6 интра-предсказания. Для восстановления блоков видео, видеокодер 20 также включает в себя модуль 58 обратного квантования, модуль 60 обратного преобразования и сумматор 62. Фильтр устранения блочности (не показан на фиг. 2) также может быть включен, чтобы фильтровать границы блоков для устранения артефактов блочности из восстановленного видео. При желании, фильтр устранения блочности, как правило, фильтрует выходной сигнал сумматора 62. Дополнительные фильтры контура (в контуре или после контура) также могут быть использованы в дополнение к фильтру устранения блочности.[0120] In the example of FIG. 2, video encoder 20 includes a separation module 35, a prediction module 41, a reference image memory 64, an adder 50, a transform module 52, a quantization module 54, and an entropy encoding module 5 6. The prediction module 41 includes a motion estimation module 42, a motion compensation module 4 4, and an intra prediction module 4 6. To restore video blocks, video encoder 20 also includes an inverse quantization module 58, an inverse transform module 60, and an adder 62. A deblocking filter (not shown in FIG. 2) may also be included to filter block boundaries to eliminate blocking artifacts from the restored video. If desired, the deblocking filter typically filters the output of the adder 62. Additional loop filters (in or after the loop) can also be used in addition to the deblocking filter.

[0121] Как показано на фиг. 2, видеокодер 20 принимает видеоданные, и модуль 35 разделения разделяет данные на блоки видео. Такое разделение может также включать разделение на сегменты (слайсы), мозаичные элементы (плитки) или другие крупные единицы, а также разделение блока видео, например, в соответствии со структурой квадродерева LCU и CU. Видеокодер 20 обычно иллюстрирует компоненты, которые кодируют блоки видео в сегменте видео, подлежащем кодированию. Сегмент может быть разделен на несколько блоков видео (и, возможно, в наборы блоков видео, называемых плитками). Модуль 41 предсказания может выбрать один из множества возможных режимов кодирования, таких как один из множества режимов интра-кодирования или один из множества режимов интер-кодирования для текущего блока видео на основе результатов по ошибкам (например, скорость кодирования и уровень искажений). Модуль 41 предсказания может предоставить в результате интра- или интер-кодированный блок на сумматор 50 для формирования остаточных данных блока и на сумматор 62 для восстановления кодированного блока для использования в качестве опорного изображения.[0121] As shown in FIG. 2, video encoder 20 receives video data, and a dividing unit 35 divides the data into video blocks. Such a division may also include division into segments (slices), mosaic elements (tiles) or other large units, as well as the division of the video block, for example, in accordance with the structure of the quad tree LCU and CU. Video encoder 20 typically illustrates components that encode video blocks in a video segment to be encoded. A segment can be divided into several video blocks (and possibly into sets of video blocks called tiles). Prediction module 41 may select one of a plurality of possible coding modes, such as one of a plurality of intra-coding modes or one of a plurality of inter-coding modes for the current video block based on error results (e.g., coding rate and distortion level). Prediction module 41 may provide an intra- or inter-coded block to an adder 50 to generate residual block data and to an adder 62 to recover an encoded block for use as a reference image.

[0122] Модуль 46 интра-предсказания в модуле 41 предсказания может выполнять кодирование с интра-предсказанием текущего блока видео по отношению к одному или более соседних блоков в том же кадре или сегменте в качестве текущего блока, подлежащего кодированию, чтобы обеспечить пространственное сжатие. Модуль 42 оценки движения и модуль 44 компенсации движения в модуле 41 предсказания выполняют кодирование с интерпредсказанием текущего блока видео по отношению к одному или более блоков предсказания в одном или более опорных изображений, чтобы обеспечить временное сжатие.[0122] The intra prediction unit 46 in the prediction unit 41 may perform intra prediction encoding of the current video block with respect to one or more neighboring blocks in the same frame or segment as the current block to be encoded to provide spatial compression. Motion estimation module 42 and motion compensation module 44 in prediction module 41 perform inter-prediction encoding of the current video block with respect to one or more prediction blocks in one or more reference images to provide temporal compression.

[0123] Модуль 42 оценки движения может быть выполнен с возможностью определения режима интер-предсказания для сегмента видео в соответствии с предопределенным шаблоном для видеопоследовательности. Предопределенный шаблон может обозначить сегменты видео в последовательности как Ρ сегменты, В сегменты или GPB (обобщенные Р/В) сегменты. Модуль 42 оценки движения и модуль 44 компенсации движения могут быть с высокой степенью интеграции, но проиллюстрированы отдельно для концептуальных целей. Оценка движения, осуществляемая модулем 42 оценки движения, является процессом генерации векторов движения, который оценивает движение для блоков видео. Вектор движения, например, может указывать смещение PU блока видео внутри текущего видеокадра или изображения по отношению к блоку прогнозирования в опорном изображении.[0123] The motion estimation module 42 may be configured to determine an inter-prediction mode for a video segment in accordance with a predetermined pattern for a video sequence. A predefined template can designate video segments in a sequence as Ρ segments, B segments, or GPB (generalized P / V) segments. Motion estimation module 42 and motion compensation module 44 may be highly integrated, but are illustrated separately for conceptual purposes. Motion estimation performed by motion estimation module 42 is a motion vector generation process that estimates motion for video blocks. The motion vector, for example, may indicate the offset of the PU block of the video within the current video frame or image relative to the prediction block in the reference image.

[0124] Блок предсказания представляет собой блок, который находится в точном соответствии с PU кодируемого блока видео в смысле пиксельной разности, который может быть определен суммой абсолютных разностей (SAD), суммой квадратичных разностей (SSD) или другими разностными метриками. В некоторых примерах, видеокодер 20 может вычислять значения для суб-целых пиксельных позиций опорных изображений, хранящихся в памяти 64 опорных изображений. Например, видеокодер 20 может интерполировать значения в одну четверть пиксельных позиций, одну восьмую пиксельных позиций или других дробных пиксельных позиций опорного изображения. Таким образом, модуль 42 оценки движения может выполнять поиск движения относительно полных пиксельных позиций и дробных пиксельных позиций и выводить вектор движения с дробной пиксельной точностью.[0124] A prediction block is a block that exactly matches the PU of the video block being encoded in the sense of a pixel difference, which can be determined by the sum of the absolute differences (SAD), the sum of the quadratic differences (SSD), or other difference metrics. In some examples, video encoder 20 may calculate values for sub-integer pixel positions of reference images stored in the reference image memory 64. For example, video encoder 20 may interpolate values into one quarter of pixel positions, one-eighth of pixel positions, or other fractional pixel positions of a reference image. Thus, the motion estimation module 42 can search for motion relative to full pixel positions and fractional pixel positions and output a motion vector with fractional pixel accuracy.

[0125] Модуль 42 оценки движения вычисляет вектор движения для PU блока видео в интер-кодированном сегменте путем сравнения положения PU с положением блока прогнозирования опорного изображения. Опорное изображение может быть выбрано из первого списка опорных изображений (список 0) или второго списка опорных изображений (Список 1), каждый из которых идентифицирует одно или более опорных изображений, сохраненных в памяти 64 опорных изображений. Модуль 42 оценки движения передает вычисленный вектор движения на модуль 56 энтропийного кодирования и модуль 44 компенсации движения.[0125] The motion estimation module 42 calculates a motion vector for the PU of the video block in the inter-coded segment by comparing the position of the PU with the position of the prediction block of the reference image. The reference image may be selected from the first list of reference images (list 0) or the second list of reference images (List 1), each of which identifies one or more reference images stored in the memory 64 of the reference images. Motion estimation module 42 transmits the calculated motion vector to entropy encoding module 56 and motion compensation module 44.

[0126] Компенсация движения, осуществляемая модулем 44 компенсации движения, может включать в себя извлечение или генерацию блока предсказания на основе вектора движения, определяемого оценкой движения, возможно, выполняя интерполяцию с субпиксельной точностью. После приема вектора движения для PU текущего блока видео, модуль 44 компенсации движения может определить положение блока предсказания, на который указывает вектор движения в одном из списков опорных изображений. Видеокодер 20 формирует остаточный блок видео путем вычитания пиксельных значений блока предсказания из пиксельных значений текущего кодируемого блока видео, образуя пиксельные разностные значения. Пиксельные разностные значения образуют остаточные данные для блока и могут включать разностные компоненты как яркости, так и цветности. Сумматор 50 представляет собой компонент или компоненты, которые выполняют эту операцию вычитания. Модуль 44 компенсации движения также может генерировать синтаксические элементы, ассоциированные с блоками видео и сегментами видео, для использования видеодекодером 30 при декодировании блоков видео сегмента видео.[0126] Motion compensation by the motion compensation module 44 may include extracting or generating a prediction block based on the motion vector determined by the motion estimate, possibly performing interpolation with subpixel accuracy. After receiving the motion vector for the PU of the current video block, the motion compensation module 44 may determine the position of the prediction block indicated by the motion vector in one of the reference picture lists. Video encoder 20 generates a residual video block by subtracting the pixel values of the prediction block from the pixel values of the current encoded video block, forming pixel difference values. Pixel difference values form residual data for the block and may include difference components of both luminance and chrominance. The adder 50 is a component or components that perform this subtraction operation. Motion compensation module 44 may also generate syntax elements associated with video blocks and video segments for use by video decoder 30 when decoding video segment video blocks.

[0127] Модуль 46 интра-предсказания может интра-предсказывать текущий блок, в качестве альтернативы интерпредсказанию, выполняемому модулем 42 оценки движения и модулем 44 компенсации движения, как описано выше. В частности, модуль 46 интра-предсказания может определить режим интра-предсказания, используемый для кодирования текущего блока. В некоторых примерах модуль 46 интра-предсказания может кодировать текущий блок, используя различные режимы интра-предсказания, например, во время отдельных проходов кодирования, и модуль 46 интра-предсказания 46 (или модуль 40 выбора режима, в некоторых примерах) может выбрать соответствующий режим интра-предсказания для использования из протестированных режимов. Например, модуль 46 интра-предсказания может вычислять значения соотношения скорость-искажение путем анализа соотношения скорость-искажение для различных протестированных режимов интра-предсказания и выбрать режим интра-предсказания, имеющий лучшие характеристики соотношения скорость-искажение среди протестированных режимов. Анализ скорость-искажение обычно определяет величину искажения (или ошибку) между кодированным блоком и исходным, некодированным блоком, который был закодирован для получения кодированного блока, а также скорость передачи битов (то есть число битов), используемую для генерации кодированного блока. Модуль 46 интра-предсказания может вычислять отношения искажений и скоростей для различных кодированных блоков, чтобы определять, какой режим интра-предсказания демонстрирует лучшее значение соотношения скорости-искажения для блока.[0127] The intra prediction unit 46 may intra-predict the current block, as an alternative to the inter prediction performed by the motion estimation module 42 and the motion compensation module 44, as described above. In particular, intra prediction unit 46 may determine the intra prediction mode used to encode the current block. In some examples, intra prediction module 46 may encode the current block using various intra prediction modes, for example, during separate coding passes, and intra prediction module 46 (or mode selection module 40, in some examples) may select the corresponding mode intra prediction for use from tested modes. For example, the intra prediction unit 46 may calculate the speed-distortion ratio values by analyzing the speed-distortion ratio for the various intra-prediction modes tested and select an intra-prediction mode having the best speed-distortion ratio characteristics among the tested modes. The rate-distortion analysis usually determines the amount of distortion (or error) between the encoded block and the original, non-encoded block that was encoded to obtain the encoded block, as well as the bit rate (i.e. the number of bits) used to generate the encoded block. Intra prediction unit 46 may calculate distortion-velocity ratios for various coded blocks to determine which intra-prediction mode exhibits the best rate-distortion ratio for the block.

[0128] В любом случае, после выбора режима интра-предсказания для блока, модуль 46 интра-предсказания может предоставлять информацию, указывающую на выбранный режим интра-предсказания, на модуль 56 энтропийного кодирования. Модуль 56 энтропийного кодирования может кодировать информацию, указывающую выбранный режим интра-предсказания, в соответствии с методами настоящего изобретения. Видеокодер 20 может включать в передаваемый битовый поток данные конфигурации, которые могут включать в себя множество таблиц индексов режима интра-предсказания и множество таблиц индексов модифицированного режима интра-предсказания (также называемых таблицами отображения кодовых слов), определения контекстов кодирования для различных блоков и указания наиболее вероятного режима интра-предсказания, таблицы индексов режима интра-предсказания и таблицы индексов модифицированного интра-предсказания, чтобы использовать для каждого из контекстов.[0128] In any case, after selecting the intra prediction mode for the block, the intra prediction module 46 may provide information indicative of the selected intra prediction mode to the entropy encoding module 56. Entropy encoding unit 56 may encode information indicating the selected intra prediction mode in accordance with the methods of the present invention. Video encoder 20 may include configuration data in the transmitted bitstream, which may include a plurality of intra prediction mode index tables and a plurality of intra prediction mode index tables (also called codeword mapping tables), determining encoding contexts for the various blocks, and indicating the most probable intra-prediction mode, intra-prediction mode index tables and modified intra-prediction index tables, to use for each of contexts.

[0129] После того как модуль 41 предсказания генерирует блок предсказания для текущего блока видео посредством интер-предсказания или интра-предсказания, видеокодер 20 формирует остаточный блок видео путем вычитания блока предсказания из текущего блока видео. Остаточные видеоданные в остаточном блоке могут включаться в одну или более TU и подаваться на модуль 52 преобразования. Модуль 52 преобразования преобразует остаточные видеоданные в остаточные коэффициенты преобразования, используя преобразование, такое как дискретное косинусное преобразование (DCT) или концептуально подобное преобразование. Модуль 52 преобразования может преобразовывать остаточные видеоданные из пиксельной области в область преобразования, например, частотную область.[0129] After the prediction module 41 generates a prediction block for the current video block by inter prediction or intra prediction, video encoder 20 generates a residual video block by subtracting the prediction block from the current video block. The residual video data in the residual block may be included in one or more TUs and supplied to the conversion unit 52. The transform unit 52 converts the residual video data to the residual transform coefficients using a transform such as a discrete cosine transform (DCT) or a conceptually similar transform. The transform unit 52 may convert the residual video data from the pixel region to the transform region, for example, the frequency domain.

[0130] Модуль 52 преобразования может отправить полученные в результате коэффициенты преобразования на модуль 54 квантования. Модуль 54 квантования квантует коэффициенты преобразования для дальнейшего снижения битовой скорости. Процесс квантования может уменьшить битовую глубину, ассоциированную с некоторыми или всеми коэффициентами. Степень квантования может быть модифицирована путем настройки параметра квантования. В некоторых примерах, модуль 54 квантования может затем выполнять сканирование матрицы, включающей в себя квантованные коэффициенты преобразования. В качестве альтернативы, модуль 56 энтропийного кодирования может выполнять сканирование. В качестве одного примера, методы кодирования, описанные в настоящем раскрытии, могут быть выполнены полностью или частично модулем 56 энтропийного кодирования. Однако аспекты настоящего описания не ограничены этим. Например, методы кодирования, описанные в настоящем раскрытии, могут быть выполнены компонентом видеокодера 20, не показанным на фиг. 2, таким как процессор или любой другой компонент. В некоторых примерах методы кодирования настоящего раскрытия могут быть выполнены одним из других блоков или модулей, показанных на фиг. 2. В некоторых других примерах методы кодирования настоящего раскрытия могут быть выполнены с помощью комбинации блоков и модулей видеокодера 20. Таким образом, видеокодер 20 может быть сконфигурирован для выполнения примерных методов, описанных в настоящем раскрытии.[0130] The transform unit 52 may send the resulting transform coefficients to the quantization unit 54. Quantization module 54 quantizes transform coefficients to further reduce bit rate. The quantization process can reduce the bit depth associated with some or all of the coefficients. The degree of quantization can be modified by adjusting the quantization parameter. In some examples, quantization module 54 may then scan a matrix including quantized transform coefficients. Alternatively, entropy coding unit 56 may perform a scan. As one example, the encoding methods described in the present disclosure may be performed in whole or in part by entropy encoding module 56. However, aspects of the present description are not limited to this. For example, the encoding methods described in the present disclosure may be performed by a component of video encoder 20, not shown in FIG. 2, such as a processor or any other component. In some examples, the encoding methods of the present disclosure may be performed by one of the other blocks or modules shown in FIG. 2. In some other examples, the encoding methods of the present disclosure may be performed using a combination of blocks and modules of the video encoder 20. Thus, the video encoder 20 may be configured to perform the exemplary methods described in the present disclosure.

[0131] После квантования, модуль 56 энтропийного кодирования кодирует квантованные коэффициенты преобразования. Например, модуль 56 энтропийного кодирования может выполнять контекстно-адаптивное кодирование переменной длины (CAVLC), контекстно-адаптивное бинарное арифметическое кодирование (САВАС), основанное на синтаксисе контекстно-адаптивное бинарное арифметическое кодирование (SBAC), энтропийное кодирование с разделением интервала вероятности (PIPE) или другую технологию энтропийного кодирования или метод. После энтропийного кодирования модулем 56 энтропийного кодирования, кодированный битовый поток может передаваться на видеодекодер 30 или архивироваться для последующей передачи или извлечения видеодекодером 30. Блок 56 энтропийного кодирования также может энтропийно кодировать вектора движения и другие синтаксические элементы для текущего кодируемого сегмента видео.[0131] After quantization, entropy encoding unit 56 encodes the quantized transform coefficients. For example, entropy encoding module 56 may perform variable length context adaptive encoding (CAVLC), context adaptive binary arithmetic encoding (SAVAS) based on context adaptive binary arithmetic encoding (SBAC) syntax, probability interval division entropy encoding (PIPE) or other entropy coding technology or method. After entropy encoding by entropy encoding module 56, the encoded bitstream may be transmitted to video decoder 30 or archived for subsequent transmission or retrieval by video decoder 30. Entropy encoding unit 56 may also entropy encode motion vectors and other syntax elements for the current encoded video segment.

[0132] В одном примере настоящего раскрытия, модуль 56 энтропийного кодирования может быть сконфигурирован, чтобы определять первый тип предсказания для блока видеоданных в Ρ сегменте, представлять первый тип предсказания как синтаксический элемент типа предсказания Ρ сегмента, определять второй тип предсказания для блока видеоданных в В сегменте, представлять второй тип предсказания как синтаксический элемент типа предсказания В сегмента, определять бинаризацию Ρ сегмента для синтаксического элемента типа предсказания Ρ сегмента, определять бинаризацию В сегмента для синтаксического элемента типа предсказания В сегмента, причем синтаксический элемент типа предсказания Ρ сегмента и синтаксический элемент типа предсказания В сегмента определяются с использованием той же самой логики бинаризации, и кодировать видеоданные на основе бинаризации синтаксического элемента типа предсказания Ρ сегмента и синтаксического элемента типа предсказания В сегмента.[0132] In one example of the present disclosure, entropy coding unit 56 may be configured to determine a first prediction type for a video block in a Ρ segment, represent the first prediction type as a syntax element of a Ρ segment prediction type, determine a second prediction type for a video block in B segment, represent the second type of prediction as a syntactic element of the type of prediction In the segment, define the binarization of Ρ segment for the syntax element of the type of prediction Ρ segment, define divide the binarization of the B segment for the syntax element of the prediction type B segment, the syntax element of the prediction type Ρ segment and the syntax element of the prediction type B of the segment are determined using the same binarization logic, and encode the video data based on the binarization of the syntax element of the prediction type Ρ segment and the syntax element type prediction in the segment.

[0133] В другом примере настоящего раскрытия, модуль 56 энтропийного кодирования может быть сконфигурирован, чтобы определять тип разделения для режима предсказания для блока видеоданных, кодировать структурный элемент типа разделения синтаксического элемента типа предсказания для блока видеоданных с использованием контекстно-адаптивного бинарного[0133] In another example of the present disclosure, entropy coding unit 56 may be configured to determine a split type for a prediction mode for a video block, encode a structural element of a split type of a prediction type syntax element for a video block using a context adaptive binary

арифметического кодирования с одним контекстом, причем один контекст является одинаковым для любого типа разделения, и кодировать структурный элемент типа разделения синтаксиса типа предсказания для блока видеоданных с использованием контекстно-адаптивного бинарного арифметического кодирования в режиме обхода.arithmetic coding with one context, and one context is the same for any type of separation, and encode a structural element of the type of separation of the syntax of the prediction type for a block of video data using context adaptive binary arithmetic coding in crawl mode.

[0134] В другом примере настоящего раскрытия, модуль 56 энтропийного кодирования может быть сконфигурирован, чтобы кодировать флаг кодированного блока цветности Cb для блока видеоданных с использованием контекстно-адаптивного бинарного арифметического кодирования (САВАС), причем САВАС использует набор контекстов, включающий в себя один или более контекстов, и кодировать флаг кодированного блока цветности Cr с использованием САВАС, причем СААВС использует тот же самый набор контекстов, что и для флага кодированного блока цветности Cb. Видеокодер 20 и видеодекодер 30 могут быть дополнительно сконфигурированы, чтобы выбирать контекст из одного или более контекстов на основе глубины преобразования модуля преобразования, ассоциированного с блоком видеоданных.[0134] In another example of the present disclosure, entropy coding unit 56 may be configured to encode the flag of the coded color block Cb for a video block using context adaptive binary arithmetic coding (CABAC), wherein CABAC uses a set of contexts including one or more contexts, and encode the flag of the encoded chroma block Cr using CABAC, wherein CAABC uses the same set of contexts as for the flag of the encoded chroma block Cb. Video encoder 20 and video decoder 30 may be further configured to select a context from one or more contexts based on the conversion depth of the transform module associated with the video block.

[0135] Модуль 58 обратного квантования и модуль 60 обратного преобразования применяют обратное квантование и обратное преобразование, соответственно, для восстановления остаточного блока в пиксельной области для последующего использования в качестве опорного блока опорного изображения. Модуль 44 компенсации движения может вычислять опорный блок, путем суммирования остаточного блока с блоком предсказания одного из опорных изображений в одном из списков опорных изображений. Модуль 44 компенсации движения может также применять один или более интерполяционных фильтров к восстановленному остаточному блоку для вычисления суб-целых пиксельных значений для использования в оценке движения. Сумматор 62 суммирует восстановленный остаточный блок со скомпенсированным по движению блоком предсказания, сформированным посредством модуля 44 компенсации движения, чтобы получить опорный блок для сохранения в памяти 64 опорных изображений. Опорный блок может быть использован модулем 42 оценки движения и модулем 44 компенсации движения в качестве опорного блока для интер-предсказания блока в последующем видео кадре или изображении.[0135] The inverse quantization unit 58 and the inverse transform unit 60 apply inverse quantization and inverse transform, respectively, to reconstruct the residual block in the pixel region for later use as the reference block of the reference image. Motion compensation module 44 may calculate the reference block by summing the residual block with the prediction block of one of the reference pictures in one of the reference picture lists. Motion compensation module 44 may also apply one or more interpolation filters to the reconstructed residual block to calculate sub-integer pixel values for use in motion estimation. An adder 62 summarizes the reconstructed residual block with a motion-compensated prediction block generated by the motion compensation unit 44 to obtain a reference block for storing 64 reference images in the memory. The reference block may be used by the motion estimation module 42 and the motion compensation module 44 as a reference block for inter prediction of the block in a subsequent video frame or image.

[0136] На фиг. 3 представлена блок-схема, иллюстрирующая примерный видеодекодер 30, который может реализовать способы, описанные в настоящем раскрытии. В примере на фиг. 3, видеодекодер 30 включает в себя модуль 80 энтропийного декодирования, модуль 81 предсказания, модуль 86 обратного квантования, модуль 88 обратного преобразования, сумматор 90 и память 92 опорных изображений. Модуль 81 предсказания включает в себя модуль 82 компенсации движения и модуль 84 интра-предсказания 84. Видеодекодер 30 может в некоторых примерах выполнять проход декодирования, в общем, обратным образом к проходу кодирования, описанному со ссылкой на видеокодер 20 по фиг. 2.[0136] In FIG. 3 is a flowchart illustrating an example video decoder 30 that may implement the methods described in the present disclosure. In the example of FIG. 3, video decoder 30 includes an entropy decoding unit 80, a prediction unit 81, an inverse quantization unit 86, an inverse transform unit 88, an adder 90, and a reference image memory 92. Prediction module 81 includes motion compensation module 82 and intra-prediction module 84. Video decoder 30 may, in some examples, perform a decoding pass, generally the reverse of the coding pass described with reference to video encoder 20 of FIG. 2.

[0137] Во время процесса декодирования, видеодекодер 30 принимает битовый поток кодированного видео, который представляет блоки видео сегмента кодированного видео и ассоциированные синтаксические элементы, из видеокодера 20. Модуль 80 энтропийного декодирования видеодекодера 30 энтропийно декодирует битовый поток для генерации квантованных коэффициентов, векторов движения, а также других синтаксических элементов. Модуль 80 энтропийного декодирования направляет векторы движения и другие синтаксические элементы в модуль 81 предсказания. Видеодекодер 30 может получать синтаксические элементы на уровне сегмента видео и/или на уровне блока видео.[0137] During the decoding process, video decoder 30 receives the encoded video bitstream, which represents the encoded video segment video blocks and associated syntax elements, from video encoder 20. Entropy decoding module 80 of video decoder 30 entropy decodes the bitstream to generate quantized coefficients, motion vectors, as well as other syntax elements. Entropy decoding unit 80 directs motion vectors and other syntax elements to prediction unit 81. Video decoder 30 may receive syntax elements at the video segment level and / or at the video block level.

[0138] В качестве одного примера, методы кодирования, описанные в настоящем раскрытии, могут быть выполнены полностью или частично посредством модуля 80 энтропийного декодирования. Однако аспекты настоящего раскрытия не ограничены этим. Например, методы кодирования, описанные в настоящем раскрытии, могут быть выполнены компонентом видеодекодера 30, не показанным на фиг. 3, таким, как процессор или любой другой компонент. В некоторых примерах методы кодирования настоящего раскрытия могут быть выполнены одним из других блоков или модулей, показанных на фиг. 3. В еще некоторых других примерах методы кодирования настоящего раскрытия могут быть выполнены с помощью комбинации блоков и модулей видеодекодера 30. Таким образом, видеодекодер 30 может быть сконфигурирован для выполнения примерных методов, описанных в настоящем раскрытии.[0138] As one example, the encoding methods described in the present disclosure may be performed in whole or in part by entropy decoding module 80. However, aspects of the present disclosure are not limited to this. For example, the encoding methods described in the present disclosure may be performed by video decoder component 30, not shown in FIG. 3, such as a processor or any other component. In some examples, the encoding methods of the present disclosure may be performed by one of the other blocks or modules shown in FIG. 3. In still some other examples, the encoding methods of the present disclosure may be performed using a combination of blocks and modules of the video decoder 30. Thus, the video decoder 30 may be configured to perform the example methods described in the present disclosure.

[0139] В одном примере настоящего раскрытия модуль 80 энтропийного декодирования может быть сконфигурирован, чтобы отображать бинаризованный синтаксический элемент типа предсказания Ρ сегмента на тип предсказания с использованием отображения бинаризации для блока видеоданных в Ρ сегменте, отображать бинаризованный синтаксический элемент типа предсказания В сегмента на тип предсказания с использованием того же отображения бинаризации для блока видеоданных в В сегменте, и декодировать видеоданные на основе отображенных типов предсказания.[0139] In one example of the present disclosure, entropy decoding module 80 may be configured to map a binarized Ρ segment prediction type syntax element to a prediction type using a binarization map for a video block in a Ρ segment, map a B segmented prediction type syntax element to a prediction type using the same binarization mapping for the video block in the B segment, and decode the video data based on the displayed prediction types Niya.

[0140] В одном примере настоящего раскрытия модуль 80 энтропийного декодирования может быть сконфигурирован, чтобы принимать синтаксический элемент типа предсказания для блока видеоданных, который был закодирован с использованием контекстно-адаптивного бинарного арифметического кодирования (САВАС), причем синтаксический элемент типа предсказания включает в себя структурный элемент типа разделения, представляющий тип разделения, и структурный элемент размера разделения, представляющий размер разделения, декодировать структурный элемент типа разделения синтаксического элемента типа предсказания с использованием контекстно-адаптивного бинарного арифметического кодирования с одним контекстом, причем один контекст является одинаковым для любого типа разделения, и декодировать структурный элемент размера разделения синтаксического элемента типа предсказания для блока видеоданных с использованием контекстно-адаптивного бинарного арифметического кодирования в режиме обхода.[0140] In one example of the present disclosure, entropy decoding module 80 may be configured to receive a prediction type syntax element for a video block that has been encoded using context adaptive binary arithmetic coding (SAVAS), wherein the prediction type syntax element includes a structural a separation type element representing a separation type, and a separation size structural element representing a separation size, decode the structural element nt type of splitting a syntax element of a prediction type using context adaptive binary arithmetic coding with one context, where one context is the same for any type of separation, and decode the structural element of the size of the separation of the syntax element of the prediction type for a video block using context adaptive binary arithmetic coding in bypass mode.

[0141] В другом примере настоящего раскрытия модуль 80 энтропийного декодирования может быть сконфигурирован, чтобы кодировать флаг кодированного блока цветности Cb для блока видеоданных с использованием контекстно-адаптивного бинарного арифметического кодирования (САВАС), причем САВАС использует набор контекстов, включающий в себя один или более контекстов, и кодировать флаг кодированного блока цветности Cr с использованием САВАС, причем САВАС использует тот же самый набор контекстов, что и для флага кодированного блока цветности Cb. Видеокодер 20 и видеодекодер 30 могут быть дополнительно сконфигурированы, чтобы выбирать контекст из одного или более контекстов на основе глубины преобразования модуля преобразования, ассоциированного с блоком видеоданных.[0141] In another example of the present disclosure, entropy decoding module 80 may be configured to encode the flag of the coded color block Cb for a video data block using context adaptive binary arithmetic coding (CABAC), wherein CABAC uses a set of contexts including one or more contexts, and encode the flag of the encoded chroma block Cr using CABAC, wherein CABAC uses the same set of contexts as for the flag of the encoded chroma block Cb. Video encoder 20 and video decoder 30 may be further configured to select a context from one or more contexts based on the conversion depth of the transform module associated with the video block.

[0142] Когда сегмент видео кодирован как интра-кодированный (I) сегмент, модуль 84 интра-предсказания модуля 81 предсказания может генерировать данные предсказания для блока видео текущего сегмента видео на основе сигнализированного режима интра-предсказания и данных из ранее декодированных блоков текущего кадра или изображения. Когда видеокадр кодирован как интер-кодированный (т.е. В, Ρ или GPB) сегмент, модуль 82 компенсации движения модуля 81 предсказания формирует блоки предсказания для блока видео текущего сегмента видео на основе векторов движения и других синтаксических элементов, полученных из модуля 80 энтропийного декодирования. Блоки предсказания могут быть сформированы из одного из опорных изображений в одном из списков опорных изображений. Видео декодер 30 может построить списки опорных кадров, список 0 и список 1, используя методы построения по умолчанию на основе опорных изображений, хранящихся в памяти 92 опорных изображений.[0142] When a video segment is encoded as an intra-coded (I) segment, the intra-prediction unit 84 of the prediction unit 81 may generate prediction data for a video block of the current video segment based on the signalmed intra-prediction mode and data from previously decoded blocks of the current frame or Images. When a video frame is encoded as an inter-coded (i.e., B, Ρ, or GPB) segment, motion compensation module 82 of prediction module 81 generates prediction blocks for a video block of the current video segment based on motion vectors and other syntax elements obtained from entropy module 80 decoding. Prediction blocks can be formed from one of the reference images in one of the lists of reference images. Video decoder 30 may construct reference frame lists, list 0 and list 1 using default construction methods based on reference images stored in the reference image memory 92.

[0143] Модуль 82 компенсации движения определяет информацию предсказания для блока видео текущего сегмента видео путем анализа векторов движения и других синтаксических элементов и использует информацию предсказания для получения блоков предсказания для текущего декодируемого блока видео. Например, модуль 82 компенсации движения использует некоторые из полученных синтаксических элементов для определения режима предсказания (например, интра- или интер- предсказания), используемого для кодирования блоков видео сегмента видео, типа сегмента интер-предсказания (например, В сегмента, Ρ сегмента или GPB сегмента), структурной информации для одного или более списков опорных изображений для сегмента, векторов движения для каждого интер-кодированного блока видео сегмента, состояния интер-предсказания для каждого интер-кодированного блока видео сегмента и другой информации для декодирования блоков видео в текущем сегменте видео.[0143] Motion compensation module 82 determines the prediction information for the video block of the current video segment by analyzing motion vectors and other syntax elements and uses the prediction information to obtain prediction blocks for the current decoded video block. For example, motion compensation module 82 uses some of the syntax elements obtained to determine a prediction mode (eg, intra or inter prediction) used to encode blocks of a video video segment, such as an inter prediction segment (eg, B segment, Ρ segment, or GPB segment), structural information for one or more reference picture lists for a segment, motion vectors for each inter-coded block of a video segment, inter-prediction status for each inter-coded Video block segment, and other information to decode the video blocks in the current video segment.

[0144] Модуль 82 компенсации движения также может выполнять интерполяцию на основе интерполяционных фильтров. Модуль 82 компенсации движения может использовать интерполяционные фильтры, как используется видеокодером 20 во время кодирования блоков видео, для вычисления интерполированных значений для субцелых пикселей опорных блоков. В этом случае модуль 82 компенсации движения может определить интерполяционные фильтры, использованные видеокодером 20, из принятых синтаксических элементов и использовать интерполяционные фильтры для получения блоков предсказания.[0144] Motion compensation module 82 may also perform interpolation based on interpolation filters. Motion compensation module 82 may use interpolation filters, as used by video encoder 20 during encoding video blocks, to calculate interpolated values for sub-integer pixels of reference blocks. In this case, motion compensation module 82 may determine the interpolation filters used by video encoder 20 from the received syntax elements and use interpolation filters to obtain prediction blocks.

[0145] Модуль 86 обратного квантования обратно квантует, то есть де-квантует, квантованные коэффициенты преобразования, предоставленные в потоке битов и декодированные модулем 80 энтропийного декодирования. Процесс обратного квантования может включать использование параметра квантования, вычисленных видеокодером 20 для каждого блока видео в сегменте видео, чтобы определить степень квантования и, аналогично, степень обратного квантования, которые должны применяться. Модуль 88 обратного преобразования применяет обратное преобразование, например, обратное DCT, обратное целочисленное преобразование или концептуально подобный процесс обратного преобразования к коэффициентам преобразования для получения остаточных блоков в пиксельной области.[0145] The inverse quantization unit 86 inversely quantizes, that is, de-quantizes, the quantized transform coefficients provided in the bitstream and decoded by the entropy decoding unit 80. The inverse quantization process may include using the quantization parameter calculated by video encoder 20 for each video block in the video segment to determine the degree of quantization and, likewise, the degree of inverse quantization that should be applied. The inverse transform unit 88 applies an inverse transform, such as an inverse DCT, an inverse integer transform, or a conceptually similar inverse transform process to transform coefficients to obtain residual blocks in the pixel domain.

[0146] После того, как модуль 82 компенсации движения генерирует блок предсказания для текущего блока видео на основе векторов движения и других синтаксических элементов, видеодекодер 30 формирует декодированный блок видео путем суммирования остаточных блоков из модуля 88 обратного преобразования с соответствующими блоками предсказания, сгенерированными модулем 82 компенсации движения. Сумматор 90 представляет собой компонент или компоненты, которые выполняют эту операцию суммирования. При желании фильтр устранения блочности может также применяться для фильтрации декодированных блоков, чтобы удалить артефакты блочности. Другие фильтры контура (в контуре кодирования или после контура кодирования) также могут быть использованы для сглаживания пиксельных переходов или улучшения иным образом качества видео. Декодированные блоки видео в данном кадре или изображении затем сохраняются в памяти 92 опорных изображений, в которой хранятся опорные кадры, используемые для последующей компенсации движения. Память 92 опорных изображений также сохраняет декодированные видео для последующего представления на устройстве отображения, таком как устройство 32 отображения на фиг. 1.[0146] After the motion compensation module 82 generates a prediction block for the current video block based on motion vectors and other syntax elements, the video decoder 30 generates a decoded video block by summing the residual blocks from the inverse transform module 88 with the corresponding prediction blocks generated by the module 82 motion compensation. The adder 90 is a component or components that perform this summation operation. If desired, the deblocking filter can also be used to filter decoded blocks to remove blocking artifacts. Other loop filters (in the coding loop or after the coding loop) can also be used to smooth pixel transitions or otherwise improve the quality of the video. The decoded video blocks in a given frame or image are then stored in a reference image memory 92, in which reference frames are used for subsequent motion compensation. Reference image memory 92 also stores decoded videos for later presentation on a display device, such as display device 32 in FIG. one.

[0147] На фиг. 6 представлена блок-схема, иллюстрирующая пример способа кодирования видео согласно настоящему раскрытию. Способ по фиг. 6 может быть реализован видеокодером 20. Видеокодер 20 может быть сконфигурирован, чтобы определять первый тип предсказания для блока видеоданных в Ρ сегменте (602) и представлять первый тип предсказания как синтаксический элемент типа предсказания Ρ сегмента (604). Видеокодер 20 может быть дополнительно сконфигурирован, чтобы определять второй тип предсказания для блока видеоданных в В сегменте (606) и представлять второй тип предсказания в качестве синтаксического элемента типа предсказания В сегмента (608). Синтаксический элемент типа предсказания Ρ сегмента и синтаксический элемент типа предсказания В сегмента определяют режим предсказания и тип разделения. Режим предсказания может включать в себя одно из интер-предсказания и интра-предсказания. Тип разделения может включать в себя одно из симметричных разделений и асимметричных разделений.[0147] FIG. 6 is a flowchart illustrating an example of a video encoding method according to the present disclosure. The method of FIG. 6 may be implemented by video encoder 20. Video encoder 20 may be configured to determine a first type of prediction for a video block in a Ρ segment (602) and represent the first type of prediction as a syntax element of a типа segment prediction type (604). Video encoder 20 may be further configured to determine a second prediction type for the video block in the B segment (606) and present the second prediction type as a syntax element of the prediction type B segment (608). Prediction type syntax element Ρ of a segment and a prediction type syntax element In a segment, a prediction mode and a division type are determined. The prediction mode may include one of inter prediction and intra prediction. The type of separation may include one of symmetrical divisions and asymmetric divisions.

[0148] Видеокодер 20 может быть дополнительно сконфигурирован, чтобы определять бинаризацию Ρ сегмента для синтаксического элемента типа предсказания Ρ сегмента (610) и определять бинаризацию В сегмента для синтаксического элемента типа предсказания В сегмента, причем синтаксический элемент типа предсказания Ρ сегмента и синтаксический элемент типа предсказания В сегмента определяются с использованием той же самой логики бинаризации (612). Видеокодер 20 может затем кодировать видеоданные на основе бинаризаций синтаксического элемента типа предсказания Ρ сегмента и синтаксического элемента типа предсказания В сегмента (614).[0148] Video encoder 20 may be further configured to determine Ρ segment binarization for a prediction type типа segment syntax element (610) and determine segment B binarization for a prediction type syntax element B segment, wherein the prediction type syntax element Ρ segment and the prediction type syntax element The segments are determined using the same binarization logic (612). Video encoder 20 may then encode video data based on binarizations of a prediction type syntax element Ρ segment and prediction type syntax element B segment (614).

[0149] Кодирование видеоданных может содержать бинаризацию синтаксического элемента типа предсказания Ρ сегмента с определенными бинаризациями Ρ сегмента, бинаризацию синтаксического элемента типа предсказания В сегмента с определенными бинаризациями В сегмента, применение контекстно-адаптивного бинарного арифметического кодирования (САВАС) к бинаризованному синтаксическому элементу типа предсказания Ρ сегмента и применение контекстно-адаптивного бинарного арифметического кодирования (САВАС) к бинаризованному синтаксическому элементу типа предсказания В сегмента.[0149] Video coding may comprise binarization of a prediction type syntax element Ρ a segment with certain binarization Ρ segments, a prediction type syntax element binarization in a segment with certain binarization B segments, applying context adaptive binary arithmetic coding (SAVAS) to the binarized prediction type syntax element Ρ segment and application of context-adaptive binary arithmetic coding (SAVAS) to the binarized syntactic electronic The cop prediction type segment.

[0150] На фиг. 7 представлена блок-схема, иллюстрирующая пример способа декодирования видео согласно настоящему раскрытию. Способ по фиг. 7 может быть реализован с помощью видеодекодера 30. Видеодекодер 30 может быть сконфигурирован для приема подвергнутого контекстно-адаптивному бинарному арифметическому кодированию синтаксического элемента типа предсказания Ρ сегмента, который указывает тип предсказания для блока видеоданных в Ρ сегменте (702), и приема подвергнутого контекстно-адаптивному бинарному арифметическому кодированию синтаксического элемента типа предсказания В сегмента, который указывает тип предсказания для блока видеоданных в В сегменте (704). Синтаксический элемент типа предсказания Ρ сегмента и синтаксический элемент типа предсказания В сегмента определяют режим предсказания и тип разделения. Режим предсказания может включать в себя одно из интер-предсказания и интра-предсказания. Тип разделения может включать в себя одно из симметричных разделений и асимметричных разделений.[0150] FIG. 7 is a flowchart illustrating an example of a video decoding method according to the present disclosure. The method of FIG. 7 may be implemented using video decoder 30. Video decoder 30 may be configured to receive a context-adaptive binary arithmetic-encoded syntax element of a prediction type Ρ segment, which indicates a prediction type for a video block in the менте segment (702), and received subjected to context-adaptive the binary arithmetic coding of the syntax element of the prediction type In segment, which indicates the type of prediction for the video block in the In segment (704). Prediction type syntax element Ρ of a segment and a prediction type syntax element In a segment, a prediction mode and a division type are determined. The prediction mode may include one of inter prediction and intra prediction. The type of separation may include one of symmetrical divisions and asymmetric divisions.

[0151] Видеодекодер 30 может быть дополнительно сконфигурирован, чтобы декодировать синтаксический элемент типа предсказания Ρ сегмента для получения бинаризованного синтаксического элемента типа предсказания Ρ сегмента (706) и декодировать синтаксический элемент типа предсказания В сегмента для получения бинаризованного синтаксического элемента типа предсказания В сегмента (708). Видеодекодер 30 может быть дополнительно сконфигурирован, чтобы отображать бинаризованный синтаксический элемент типа предсказания Ρ сегмента на тип предсказания с использованием отображения бинаризации для блока видеоданных в Ρ сегменте (710), и чтобы отображать бинаризованный синтаксический элемент типа предсказания В сегмента на тип предсказания с использованием того же самого отображения бинаризации для блока видеоданных в В сегменте (712). Видеодекодер 30 может затем декодировать видеоданные на основе отображенных типов предсказания (714).[0151] Video decoder 30 may be further configured to decode a prediction type syntax element Ρ segment to obtain a binarized prediction type syntax element Ρ segment (706) and decode a segment prediction type syntax element to obtain a binarized prediction type syntax element of a segment (708) . Video decoder 30 may be further configured to map the binarized prediction type syntax element of the Ρ segment to the prediction type using a binarization mapping for the video block in the Ρ segment (710), and to map the binarized syntax element of the prediction type B segment to the prediction type using the same the binarization mapping for the video block in the In segment (712). Video decoder 30 may then decode the video data based on the displayed prediction types (714).

[0152] На фиг. 8 представлена блок-схема последовательности операций, иллюстрирующая пример способа кодирования видео согласно настоящему раскрытию. Способ по фиг. 8 может быть реализован видеокодером 20. Видеокодер 20 может быть сконфигурирован, чтобы определять тип разделения для режима предсказания для блока видеоданных (802) и кодировать структурный элемент типа разделения синтаксического элемента типа предсказания для блока видеоданных с использованием контекстно-адаптивного бинарного арифметического кодирования (САВАС) с одним контекстом (804). Один контекст является одинаковым для любого типа разделения. В одном примере, тип разделения является асимметричным разделением, и структурный элемент типа разделения указывает, является ли асимметричное разделение вертикально разделенным или горизонтально разделенным. Например, структурный элемент размера разделения указывает, является ли первое разделение равным одной четверти размера блока видеоданных или первое разделение равно трем четвертям размера блока видеоданных.[0152] In FIG. 8 is a flowchart illustrating an example of a video encoding method according to the present disclosure. The method of FIG. 8 may be implemented by video encoder 20. Video encoder 20 may be configured to determine a split type for a prediction mode for a block of video data (802) and encode a structural element of a split type of a prediction type syntax element for a video block using context adaptive binary arithmetic coding (SAVAC) with one context (804). One context is the same for any type of separation. In one example, the split type is an asymmetric split, and the split type structural element indicates whether the asymmetric split is vertically split or horizontally split. For example, a partition size structural element indicates whether the first partition is equal to one fourth of the video block size or the first division is three quarters of the video block size.

[0153] Видеокодер 20 может быть дополнительно сконфигурирован, чтобы кодировать структурный элемент размера разделения синтаксического элемента типа предсказания для блока видеоданных с использованием САВАС в режиме обхода (806).[0153] Video encoder 20 may be further configured to encode a structural element of a partition size of a prediction type syntax element for a video block using CAVAC in bypass mode (806).

[0154] На фиг. 9 представлена блок-схема последовательности операций, иллюстрирующая пример способа декодирования видео согласно настоящему раскрытию. Способ по фиг. 9 может быть реализован с помощью видеодекодера 30. Видеодекодер 30 может быть сконфигурирован, чтобы принимать синтаксический элемент типа предсказания для блока видеоданных, которые были закодированы с использованием контекстно-адаптивного бинарного арифметического кодирования (САВАС), причем синтаксический элемент типа предсказания включает в себя структурный элемент типа разделения, представляющий тип разделения, и структурный элемент размера разделения, представляющий размер разделения (902). В одном примере, тип разделения является асимметричным разделением, и структурный элемент типа разделения указывает, является ли асимметричное разделение вертикально разделенным или горизонтально разделенным. Например, структурный элемент размера разделения указывает, является ли первое разделение равным одной четверти размера блока видеоданных или первое разделение равно трем четвертям размера блока видеоданных.[0154] FIG. 9 is a flowchart illustrating an example of a video decoding method according to the present disclosure. The method of FIG. 9 may be implemented using video decoder 30. Video decoder 30 may be configured to receive a prediction type syntax element for a block of video data that has been encoded using context adaptive binary arithmetic coding (SAVAS), wherein the prediction type syntax element includes a structural element a split type representing a split type; and a split size structural element representing a split size (902). In one example, the split type is an asymmetric split, and the split type structural element indicates whether the asymmetric split is vertically split or horizontally split. For example, a partition size structural element indicates whether the first partition is equal to one fourth of the video block size or the first division is three quarters of the video block size.

[0155] Видеодекодер 30 может быть дополнительно сконфигурирован, чтобы декодировать структурный элемент типа разделения синтаксического элемента типа предсказания с использованием САВАС с одним контекстом, причем один контекст является тем же самым для любого типа разделения (904), и декодировать структурный элемент размера разделения синтаксического элемента типа предсказания с использованием САВАС в режиме обхода (906).[0155] Video decoder 30 may be further configured to decode a structural element of a split type of a prediction type syntax element using CABAC with one context, wherein one context is the same for any split type (904), and decode the structural element of a split size of a syntax element type prediction using SAVAS in bypass mode (906).

[0156] На фиг. 10 представлена блок-схема последовательности операций, иллюстрирующая пример способа кодирования видео согласно настоящему раскрытию. Способ по фиг. 10 может быть реализован видеокодером 20 или видеодекодером. Для целей фиг. 10, видеокодер 20 и видеодекодер 30 будет упоминаться в совокупности как устройство кодирования видео. В соответствии с методами по фиг. 10, устройство кодирования видео может быть сконфигурировано, чтобы кодировать флаг кодированного блока цветности Cb для блока видеоданных с использованием контекстно-адаптивного бинарного арифметического кодирования (САВАС), причем кодирование флага кодированного блока цветности Cb включает в себя использование набора контекстов, включающего в себя один или более контекстов как часть САВАС (1002), а также кодировать флаг кодированного блока цветности Cr с использованием САВАС, причем кодирование флага кодированного блока цветности Cr включает в себя использование того же набора контекстов, что и для флага кодированного блока цветности Cb, как часть САВАС (1004). В одном примере, набор контекстов включает в себя 5 контекстов.[0156] FIG. 10 is a flowchart illustrating an example of a video encoding method according to the present disclosure. The method of FIG. 10 may be implemented by video encoder 20 or video decoder. For the purposes of FIG. 10, video encoder 20 and video decoder 30 will be collectively referred to as a video encoding device. In accordance with the methods of FIG. 10, a video encoding device may be configured to encode a flag of a coded chroma block Cb for a video block using context adaptive binary arithmetic coding (CABAC), wherein encoding a flag of a coded chroma block Cb includes using a set of contexts including one or more contexts as part of SAVAC (1002), and also encode the flag of the encoded chroma block Cr using SAVAS, moreover, the encoding of the flag of the encoded chroma block Cr includes flushes the use of the same set of contexts, as for the coded block flag chrominance Cb, as part of CABAC (1004). In one example, a set of contexts includes 5 contexts.

[0157] В одном опциональном примере настоящего раскрытия устройство кодирования видео может быть дополнительно сконфигурировано, чтобы выбирать контекст из одного или более контекстов на основе глубины преобразования единицы преобразования, ассоциированной с блоком видеоданных (1006).[0157] In one optional example of the present disclosure, a video encoding device may be further configured to select a context from one or more contexts based on the conversion depth of the transform unit associated with the video block (1006).

[0158] При работе в качестве видеокодера, устройство кодирования видео может быть дополнительно сконфигурировано, чтобы сигнализировать кодированный флаг кодированного блока цветности Cb в кодированном битовом потоке видео и сигнализировать кодированный флаг кодированного блока цветности Cr в кодированном битовом потоке видео. При работе в качестве видеодекодера, устройство кодирования видео может быть дополнительно сконфигурировано, чтобы принимать кодированный флаг кодированного блока цветности Cb в кодированном битовом потоке видео, а также принимать кодированный флаг кодированного блока цветности Cr в кодированном битовом потоке видео.[0158] When operating as a video encoder, the video encoding device may be further configured to signal the encoded flag of the encoded chroma block Cb in the encoded video bitstream and signal the encoded flag of the encoded chroma block Cr in the encoded video bitstream. When operating as a video decoder, the video encoding device may be further configured to receive the encoded flag of the encoded chroma block Cb in the encoded video bitstream, and also to receive the encoded flag of the encoded chroma block Cr in the encoded video bitstream.

[0159] В одном или более примерах описанные функции могут быть реализованы в аппаратных средствах, программном обеспечении, микропрограммном обеспечении или любой их комбинации. При реализации в программном обеспечении, функции могут храниться или передаваться, как одна или более инструкций или код, на считываемом компьютером носителе и выполняться блоком обработки на основе аппаратных средств. Считываемые компьютером носители могут включать в себя считываемые компьютером носители информации, что соответствует материальному носителю, такому как носители хранения данных, или среды связи, включая любую среду, которая способствует передаче компьютерной программы из одного места в другое, например, в соответствии с протоколом связи. Таким образом, считываемые компьютером носители обычно могут соответствовать (1) материальному считываемому компьютером носителю хранения данных, который является не временным (нетранзитивным) или (2) коммуникационной среде, такой как сигнал или несущая волна. Носители хранения данных могут быть любыми доступными носителями, к которым могут получать доступ один или более компьютеров или один или более процессоров для извлечения инструкций, кода и/или структур данных для реализации методов, описанных в настоящем раскрытии. Компьютерный программный продукт может включать в себя считываемый компьютером носитель.[0159] In one or more examples, the described functions may be implemented in hardware, software, firmware, or any combination thereof. When implemented in software, the functions may be stored or transmitted, as one or more instructions or code, on a computer-readable medium and executed by a hardware-based processing unit. Computer-readable media can include computer-readable media that corresponds to a material medium, such as storage media, or communication media, including any medium that facilitates transferring a computer program from one place to another, for example, in accordance with a communication protocol. Thus, computer-readable media can usually correspond to (1) a material computer-readable storage medium that is not a temporary (non-transitive) or (2) communication medium, such as a signal or carrier wave. Storage media may be any available media that can be accessed by one or more computers or one or more processors to retrieve instructions, code, and / or data structures for implementing the methods described in this disclosure. A computer program product may include computer-readable media.

[0160] В качестве примера, а не ограничения, такие считываемые компьютером носители хранения данных могут включать в себя RAM, ROM, EEPROM, CD-ROM или другой оптический диск, накопитель на магнитных дисках или другие магнитные запоминающие устройства, флэш-память или любой другой носитель, который может использоваться для хранения желаемого программного кода в форме инструкций или структур данных и к которому может обращаться компьютер. Кроме того, любое соединение корректно называть считываемым компьютером носителем. Например, если инструкции передаются от веб-сайта, сервера или другого удаленного источника с помощью коаксиального кабеля, волоконно-оптического кабеля, витой пары, цифровой абонентской линии (DSL) или беспроводных технологий, таких как инфракрасная, радио и микроволновая, то коаксиальный кабель, волоконно-оптический кабель, витая пара, DSL или беспроводные технологии, такие как инфракрасная, радиочастотная и микроволновая, включаются в определение носителя. Следует понимать, однако, что считываемые компьютером носители данных и средства хранения данных не включают соединения, несущие волны, сигналы или другие транзитивные среды хранения, а вместо этого направлены на нетранзитивные, материальные носители. Диски (disk и disc), как используется здесь, включают в себя компакт-диск (CD), лазерный диск, оптический диск, цифровой универсальный диск (DVD), гибкий диск и Blu-Ray Disc, где магнитные диски (disk) обычно воспроизводят данные магнитным способом, в то время как оптические диски (disc) воспроизводят данные оптически с помощью лазеров. Комбинации вышеперечисленного также должны быть включены в объем считываемых компьютером носителей.[0160] By way of example, and not limitation, such computer-readable storage media may include RAM, ROM, EEPROM, CD-ROM or other optical disc, magnetic disk drive or other magnetic storage devices, flash memory, or any another medium that can be used to store the desired program code in the form of instructions or data structures that the computer can access. In addition, any connection is correctly called a computer-readable medium. For example, if instructions are transmitted from a website, server, or other remote source using a coaxial cable, fiber optic cable, twisted pair cable, digital subscriber line (DSL), or wireless technologies such as infrared, radio, and microwave, then the coaxial cable fiber optic cable, twisted pair, DSL, or wireless technologies such as infrared, radio frequency, and microwave are included in the media definition. It should be understood, however, that computer-readable storage media and storage media do not include connections, carrier waves, signals, or other transitive storage media, but instead are directed to non-transitive, tangible media. Disks (disk and disc), as used here, include a compact disk (CD), a laser disk, an optical disk, a digital versatile disk (DVD), a floppy disk and Blu-ray Disc, where magnetic disks (disk) usually play data in a magnetic way, while optical discs (disc) reproduce data optically with lasers. Combinations of the above should also be included within the scope of computer readable media.

[0161] Инструкции могут выполняться одним или более процессорами, такими как один или более цифровых сигнальных процессоров (DSP), микропроцессоров общего назначения, специализированными интегральными схемами (ASIC), программируемыми логическими матрицами (FPGA) или другими эквивалентными интегрированными или дискретными логическими схемами. Соответственно, термин "процессор", как он использован здесь, может относиться к любой из указанных выше структур или любой другой структуре, пригодной для реализации описанных здесь методов. Кроме того, в некоторых аспектах, функциональность, описанная здесь, может быть представлена в специализированных аппаратных средствах и/или программных модулях, сконфигурированных для кодирования и декодирования, или включена в комбинированный кодек. Кроме того, эти методы могут быть полностью реализованы в одной или более схем или логических элементов.[0161] Instructions may be executed by one or more processors, such as one or more digital signal processors (DSPs), general purpose microprocessors, specialized integrated circuits (ASICs), programmable logic arrays (FPGAs), or other equivalent integrated or discrete logic circuits. Accordingly, the term “processor,” as used herein, may refer to any of the above structures or any other structure suitable for implementing the methods described herein. In addition, in some aspects, the functionality described herein may be provided in specialized hardware and / or software modules configured for encoding and decoding, or included in a combination codec. In addition, these methods can be fully implemented in one or more circuits or logic elements.

[0162] Методы настоящего раскрытия могут быть реализованы в широком спектре устройств или аппаратов, включая беспроводной телефон, интегральной схемы (IС) или набор микросхем (например, чипсет). Различные компоненты, модули или блоки описаны в настоящем раскрытии, чтобы подчеркнуть функциональные аспекты устройств, сконфигурированных для выполнения раскрытых методов, но не обязательно требует реализации различными модулями аппаратных средств. Скорее, как описано выше, различные модули могут быть объединены в блоке аппаратных средств кодека или обеспечиваются совокупностью взаимодействующих модулей аппаратных средств, в том числе одного или более процессоров, как описано выше, в сочетании с соответствующим программным обеспечением и/или программно-аппаратными средствами.[0162] The methods of the present disclosure may be implemented in a wide range of devices or apparatuses, including a cordless telephone, integrated circuit (IC), or a chipset (eg, a chipset). Various components, modules, or blocks are described in this disclosure to emphasize the functional aspects of devices configured to perform the disclosed methods, but do not necessarily require hardware implementation by various modules. Rather, as described above, the various modules may be combined in a codec hardware unit or provided by a plurality of interacting hardware modules, including one or more processors, as described above, in combination with appropriate software and / or firmware.

[0163] Различные примеры были описаны. Эти и другие примеры входят в объем прилагаемой формулы изобретения.[0163] Various examples have been described. These and other examples are included in the scope of the attached claims.

Claims

1. A method of encoding video data, comprising:
determining a split type for a prediction mode for a block of video data;
encoding a structural element of a division type of a prediction type syntax element for a video block using context adaptive binary arithmetic coding (SAVAS) with one context, wherein one context is the same for any type of separation; and
encoding a structural element of a partition size of a prediction type syntax element for a block of video data using SAVAS in bypass mode.

2. The method of claim 1, wherein the type of separation is asymmetric separation.

3. The method of claim 2, wherein the structural element of the separation type indicates whether the asymmetric separation is vertically divided or horizontally divided.

4. The method of claim 2, wherein the structural element of the split size indicates whether the first split is one quarter of the size of the video block or whether the first split is three quarters of the size of the video block.

5. A method for decoding video data, comprising:
receiving a prediction type syntax element for a block of video data that has been encoded using context adaptive binary arithmetic coding (SAVAS), the prediction type syntax element including a division type structure element representing a division type and a division size structural element representing a division size ;
decoding a structural element of a division type of a prediction type syntax element using SAVAC with one context, wherein one context is the same for any type of separation; and
decoding a structural element of a partition size of a prediction type syntax element using SAVAS in bypass mode.

6. The method of claim 5, wherein the type of separation is asymmetric separation.

7. The method according to claim 6, in which the structural element of the type of separation indicates whether the asymmetric separation is vertically divided or horizontally divided.

8. The method according to claim 6, in which the structural element of the split size indicates whether the first split is one quarter of the size of the video block or whether the first split is three quarters of the size of the video block.

9. A device configured to encode video data, comprising:
A video encoder configured to:
determine the type of separation for the prediction mode for the block of video data;
encode a structural element of a division type of a prediction type syntax element for a block of video data using context adaptive binary arithmetic coding (SAVAS) with one context, wherein one context is the same for any type of separation; and
encode a structural element of a partition size of a prediction type syntax element for a block of video data using SAVAS in bypass mode.

10. The device according to claim 9, in which the type of separation is asymmetric separation.

11. The device according to claim 10, in which the structural element of the type of separation indicates whether the asymmetric separation is vertically divided or horizontally divided.

12. The device according to claim 10, in which the structural element of the size of the separation indicates whether the first division is one quarter of the size of the block of video data or whether the first division is three quarters of the size of the block of video data.

13. A device configured to decode video data, comprising:
A video decoder configured to:
receive a prediction type syntax element for a block of video data that has been encoded using context adaptive binary arithmetic coding (SAVAS), the prediction type syntax element including a separation type structural element representing a separation type and a separation size structural element representing a separation size ;
decode a structural element of a division type of a prediction type syntax element using SAVAC with one context, wherein one context is the same for any type of separation; and
decode a prediction type syntax element partition size structural element using SAVAS in bypass mode.

14. The device according to p. 13, in which the type of separation is asymmetric separation.

15. The device according to claim 14, in which the structural element of the type of separation indicates whether the asymmetric separation is vertically divided or horizontally divided.

16. The apparatus of claim 14, wherein the structural element of the split size indicates whether the first split is one quarter of the size of the video block or whether the first split is three quarters of the size of the video block.

17. A device configured to encode video data, comprising:
means for determining a split type for a prediction mode for a block of video data;
means for encoding a structural element of a division type of a prediction type syntax element for a block of video data using context adaptive binary arithmetic coding (CABAC) with one context, wherein one context is the same for any type of separation; and
means for encoding a structural element of a partition size of a prediction type syntax element for a block of video data using SAVAS in bypass mode.

18. The device according to p. 17, in which the type of separation is asymmetric separation.

19. The device according to claim 18, in which the structural element of the type of separation indicates whether the asymmetric separation is vertically divided or horizontally divided.

20. The device according to claim 18, in which the structural element of the split size indicates whether the first split is one quarter of the size of the video block or whether the first split is three quarters of the size of the video block.

21. A device configured to decode video data, comprising:
means for receiving a prediction type syntax element for a block of video data that has been encoded using context adaptive binary arithmetic coding (SAVAS), the prediction type syntax element including a division type structure element representing a division type and a division size structural element representing split size;
means for decoding a structural element of a division type of a prediction type syntax element using SAVAC with one context, wherein one context is the same for any type of separation; and
means for decoding a structural element of a partition size of a prediction type syntax element using SAVAS in bypass mode.

22. The device according to p. 21, in which the type of separation is asymmetric separation.

23. The device according to p. 22, in which the structural element of the type of separation indicates whether the asymmetric separation is vertically divided or horizontally divided.

24. The device according to p. 22, in which the structural element of the split size indicates whether the first split is one quarter of the size of the block of video data or whether the first split is three quarters of the size of the block of video data.

25. A computer-readable storage medium that stores instructions that, when executed, prompt one or more processors configured to encode video data:
determine the type of separation for the prediction mode for the block of video data;
encode a structural element of a division type of a prediction type syntax element for a block of video data using context adaptive binary arithmetic coding (SAVAS) with one context, wherein one context is the same for any type of separation; and
encode a structural element of a partition size of a prediction type syntax element for a block of video data using SAVAS in bypass mode.

26. A computer-readable storage medium according to claim 25, wherein the type of partition is an asymmetric partition.

27. A computer-readable storage medium according to claim 26, wherein the structural element of the separation type indicates whether the asymmetric separation is vertically divided or horizontally divided.

28. The computer-readable storage medium according to claim 26, wherein the partition size structural element indicates whether the first partition is one quarter of the size of the video data block or whether the first partition is three quarters of the size of the video data block.

29. A computer-readable storage medium that stores instructions that, when executed, prompt one or more processors configured to decode video data:
receive a prediction type syntax element for a block of video data that has been encoded using context adaptive binary arithmetic coding (SAVAS), the prediction type syntax element including a separation type structural element representing a separation type and a separation size structural element representing a separation size ;
decode a structural element of a division type of a prediction type syntax element using SAVAC with one context, wherein one context is the same for any type of separation; and
decode a prediction type syntax element partition size structural element using SAVAS in bypass mode.

30. A computer-readable storage medium according to claim 29, wherein the type of partition is an asymmetric partition.

31. A computer-readable storage medium according to claim 30, wherein the partition type structural element indicates whether the asymmetric partition is vertically divided or horizontally divided.

32. A computer-readable storage medium according to claim 30, wherein the partition size structural element indicates whether the first partition is one quarter of the size of the video data block or whether the first partition is three quarters of the size of the video data block.