RU2805218C2 - Image coding method based on transformation and a device - Google Patents

Image coding method based on transformation and a device Download PDF

Info

Publication number
RU2805218C2
RU2805218C2 RU2022125133A RU2022125133A RU2805218C2 RU 2805218 C2 RU2805218 C2 RU 2805218C2 RU 2022125133 A RU2022125133 A RU 2022125133A RU 2022125133 A RU2022125133 A RU 2022125133A RU 2805218 C2 RU2805218 C2 RU 2805218C2
Authority
RU
Russia
Prior art keywords
block
information
transform
current block
height
Prior art date
Application number
RU2022125133A
Other languages
Russian (ru)
Other versions
RU2022125133A (en
Inventor
Моонмо КОО
Дзаехиун ЛИМ
Дзунгах ЧОИ
Сеунгхван КИМ
Мехди САЛЕХИФАР
Original Assignee
ЭлДжи ЭЛЕКТРОНИКС ИНК.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ЭлДжи ЭЛЕКТРОНИКС ИНК. filed Critical ЭлДжи ЭЛЕКТРОНИКС ИНК.
Publication of RU2022125133A publication Critical patent/RU2022125133A/en
Application granted granted Critical
Publication of RU2805218C2 publication Critical patent/RU2805218C2/en

Links

Abstract

FIELD: image coding.
SUBSTANCE: extracting the residual sample, wherein the step for extracting the residual sample comprises the following steps: extracting a nullable block for the current block; extracting a context model for position information of the last significant coefficient based on the width or height of the current block; extracting the position value of the last significant coefficient based on the context model; and extracting the position of the last significant coefficient based on the value of the position information of the last significant coefficient and the width or height of the nullable block.
EFFECT: increase in efficiency of image encoding.
10 cl, 13 dwg, 15 tbl

Description

Уровень техникиState of the art

Область техники, к которой относится изобретениеField of technology to which the invention relates

[1] Настоящее раскрытие сущности, в общем, относится к технологии кодирования изображений, а более конкретно, к способу кодирования изображений на основе преобразования в системе кодирования изображений и к аппаратуре для этого.[1] The present disclosure generally relates to image encoding technology, and more particularly to a transform-based image encoding method in an image encoding system and apparatus therefor.

Описание предшествующего уровня техникиDescription of the Prior Art

[2] В наше время, спрос на высококачественные изображения/видео высокого разрешения, к примеру, 4K, 8K или изображения/видео еще более сверхвысокой четкости (UHD) растет в различных областях техники. По мере того, как данные изображений/видео приобретают все более высокое разрешение и более высокое качество, передаваемый объем информации или объем в битах увеличивается по сравнению с традиционными данными изображений. Следовательно, когда данные изображений передаются с использованием такой среды, как традиционная проводная/беспроводная широкополосная линия, или данные изображений/видео сохраняются с использованием существующего носителя хранения данных, затраты на передачу и затраты на хранение для них увеличиваются.[2] Nowadays, the demand for high-quality high-definition images/videos, for example, 4K, 8K or even higher ultra-high definition (UHD) images/videos, is growing in various fields of technology. As image/video data becomes increasingly higher resolution and higher quality, the amount of information transmitted, or bit capacity, increases compared to traditional image data. Therefore, when image data is transmitted using a medium such as a traditional wired/wireless broadband line, or image/video data is stored using an existing storage medium, transmission costs and storage costs for them increase.

[3] Дополнительно, в наше время, интерес и спрос на иммерсивное мультимедиа, такое как контент виртуальной реальности (VR), искусственной реальности (AR) или голограмма и т.п., растет, и широковещательная передача для изображений/видео, имеющих признаки изображений, отличающиеся от признаков действительных изображений, таких как игровое изображение, увеличивается.[3] Additionally, nowadays, interest and demand for immersive multimedia such as virtual reality (VR), artificial reality (AR) or hologram content, etc. is growing, and broadcasting for images/videos having features images different from the features of real images, such as a game image, are increased.

[4] Соответственно, имеется потребность в высокоэффективной технологии сжатия изображений/видео для эффективного сжатия и передачи либо сохранения и воспроизведения информации высококачественных изображений/видео высокого разрешения, имеющих различные признаки, как описано выше.[4] Accordingly, there is a need for high-performance image/video compression technology for efficiently compressing and transmitting or storing and reproducing information of high-quality, high-resolution images/videos having various features as described above.

Сущность изобретенияThe essence of the invention

[5] Технический аспект настоящего раскрытия сущности состоит в том, чтобы предоставлять способ и аппаратуру для повышения эффективности кодирования изображений.[5] The technical aspect of the present disclosure is to provide a method and apparatus for improving the efficiency of image encoding.

[6] Другой технический аспект настоящего раскрытия сущности состоит в том, чтобы предоставлять способ и аппаратуру для повышения эффективности при остаточном кодировании.[6] Another technical aspect of the present disclosure is to provide a method and apparatus for improving efficiency in residual coding.

[7] Еще один другой технический аспект настоящего раскрытия сущности состоит в том, чтобы предоставлять способ и аппаратуру для повышения эффективности при кодировании последнего ненулевого коэффициента преобразования.[7] Yet another technical aspect of the present disclosure is to provide a method and apparatus for increasing efficiency in encoding the last non-zero transform coefficient.

[8] Еще один другой технический аспект настоящего раскрытия сущности состоит в том, чтобы предоставлять способ и аппаратуру для кодирования коэффициента преобразования на основе высокочастотного обнуления, чтобы повышать эффективность остаточного кодирования.[8] Yet another technical aspect of the present disclosure is to provide a method and apparatus for transform coefficient encoding based on high frequency nulling to improve the efficiency of residual encoding.

[9] Еще один другой технический аспект настоящего раскрытия сущности состоит в том, чтобы предоставлять способ и аппаратуру для кодирования информации позиции относительно последнего значимого коэффициента в текущем блоке (или текущем блоке преобразования) на основе высокочастотного обнуления.[9] Yet another technical aspect of the present disclosure is to provide a method and apparatus for encoding position information relative to the last significant coefficient in a current block (or current transform block) based on high frequency nulling.

[10] Еще один другой технический аспект настоящего раскрытия сущности состоит в том, чтобы предоставлять способ и аппаратуру для извлечения максимального значения информации суффикса относительно позиции последнего значимого коэффициента преобразования на основе размера области, к которой высокочастотное обнуление не применяется, в текущем блоке при кодировании коэффициентов преобразования для текущего блока (или текущего блока преобразования) на основе высокочастотного обнуления.[10] Yet another technical aspect of the present disclosure is to provide a method and apparatus for extracting the maximum value of suffix information relative to the position of the last significant transform coefficient based on the size of the region to which high-frequency nulling is not applied in a current block when encoding the coefficients conversions for the current block (or current transform block) based on high-frequency nulling.

[11] Еще один другой технический аспект настоящего раскрытия сущности состоит в том, чтобы предоставлять способ и аппаратуру для извлечения контекстной модели для информации позиции последнего значимого коэффициента преобразования на основе размера текущего блока при кодировании коэффициентов преобразования для текущего блока (или текущего блока преобразования) на основе высокочастотного обнуления.[11] Yet another technical aspect of the present disclosure is to provide a method and apparatus for extracting a context model for position information of the last significant transform coefficient based on the size of the current block when encoding transform coefficients for the current block (or current transform block) on based on high frequency zeroing.

[12] Согласно варианту осуществления настоящего раскрытия сущности, предоставляется способ декодирования изображений, осуществляемый посредством аппаратуры декодирования. Способ включает в себя извлечение остаточной выборки, и извлечение остаточной выборки включает в себя: извлечение обнуляемого блока для текущего блока; извлечение контекстной модели для информации позиции последнего значимого коэффициента на основе ширины или высоты текущего блока; извлечение значения информации позиции последнего значимого коэффициента на основе контекстной модели; и извлечение позиции последнего значимого коэффициента на основе значения информации позиции последнего значимого коэффициента и ширины или высоты обнуляемого блока.[12] According to an embodiment of the present disclosure, an image decoding method performed by decoding equipment is provided. The method includes retrieving a residual sample, and retrieving the residual sample includes: retrieving a nullable block for a current block; retrieving a context model for position information of the last significant coefficient based on the width or height of the current block; extracting the position information value of the last significant coefficient based on the context model; and retrieving the position of the last significant coefficient based on the value of the position information of the last significant coefficient and the width or height of the block to be reset.

[13] Ширина обнуляемого блока может быть меньше ширины текущего блока.[13] The width of the block being reset may be smaller than the width of the current block.

[14] Высота обнуляемого блока может быть меньше высоты текущего блока.[14] The height of the block being reset may be less than the height of the current block.

[15] Информация позиции последнего значимого коэффициента может включать в себя информацию префикса последнего значимого коэффициента и информацию суффикса последнего значимого коэффициента, информация префикса последнего значимого коэффициента может включать в себя информацию префикса по оси X и информацию префикса по оси Y, и контекстное приращение для информации префикса по оси X и информации префикса по оси Y может извлекаться на основе ширины или высоты текущего блока.[15] The position information of the last significant coefficient may include prefix information of the last significant coefficient and suffix information of the last significant coefficient, the prefix information of the last significant coefficient may include X-axis prefix information and Y-axis prefix information, and a context increment for the information X-axis prefix and Y-axis prefix information can be retrieved based on the width or height of the current block.

[16] Максимальное значение, разрешенное для информации префикса последнего значимого коэффициента, может извлекаться на основе размера обнуляемого блока.[16] The maximum value allowed for last significant coefficient prefix information may be retrieved based on the size of the nullable block.

[17] Ширина или высота обнуляемого блока может извлекаться на основе ширины или высоты текущего блока.[17] The width or height of a nullable block can be retrieved based on the width or height of the current block.

[18] Когда ширина текущего блока равна 32, и высота текущего блока равна 32 или меньше, ширина обнуляемого блока может задаваться равной 16, и когда ширина текущего блока не равна 32, или высота текущего блока равна 64 или больше, ширина обнуляемого блока может задаваться равной меньшему значению из ширины текущего блока и 32.[18] When the width of the current block is 32, and the height of the current block is 32 or less, the width of the nullable block can be set to 16, and when the width of the current block is not 32, or the height of the current block is 64 or greater, the width of the nullable block can be set equal to the smaller value of the width of the current block and 32.

[19] Когда высота текущего блока может быть равной 32, и ширина текущего блока равна 32 или меньше, высота обнуляемого блока задается равной 16, и когда высота текущего блока не равна 32, или ширина текущего блока равна 64 или больше, высота обнуляемого блока может задаваться равной меньшему значению из высоты текущего блока и 32.[19] When the height of the current block may be 32, and the width of the current block is 32 or less, the height of the nullable block is set to 16, and when the height of the current block is not 32, or the width of the current block is 64 or greater, the height of the nullable block may be be set equal to the smaller value of the height of the current block and 32.

[20] Согласно другому варианту осуществления настоящего раскрытия сущности, предоставляется способ кодирования изображений, осуществляемый посредством аппаратуры кодирования. Способ может включать в себя кодирование остаточной информации, и кодирование включает в себя: извлечение обнуляемого блока для текущего блока; извлечение позиции последнего значимого коэффициента на основе ширины или высоты обнуляемого блока; извлечение контекстной модели для информации позиции последнего значимого коэффициента на основе ширины или высоты текущего блока; и кодирование информации позиции последнего значимого коэффициента на основе контекстной модели.[20] According to another embodiment of the present disclosure, an image encoding method performed by encoding equipment is provided. The method may include encoding the residual information, and the encoding includes: retrieving a nullable block for the current block; retrieving the position of the last significant coefficient based on the width or height of the block being zeroed; retrieving a context model for position information of the last significant coefficient based on the width or height of the current block; and encoding the position information of the last significant coefficient based on the context model.

[21] Согласно еще одному другому варианту осуществления настоящего раскрытия сущности, может предоставляться цифровой носитель хранения данных, который сохраняет данные изображений, включающие в себя кодированную информацию изображений и поток битов, сформированный согласно способу кодирования изображений, осуществляемому посредством аппаратуры кодирования.[21] According to yet another embodiment of the present disclosure, a digital storage medium that stores image data including encoded image information and a bit stream generated according to an image encoding method carried out by encoding equipment may be provided.

[22] Согласно еще одному другому варианту осуществления настоящего раскрытия сущности, может предоставляться цифровой носитель хранения данных, который сохраняет данные изображений, включающие в себя кодированную информацию изображений и поток битов, чтобы инструктировать аппаратуре декодирования осуществлять способ декодирования изображений.[22] According to yet another embodiment of the present disclosure, a digital storage medium that stores image data including encoded image information and a bit stream may be provided to instruct decoding equipment to perform an image decoding method.

[23] Согласно настоящему раскрытию сущности, можно повышать общую эффективность сжатия изображений/видео.[23] According to the present disclosure, it is possible to improve the overall efficiency of image/video compression.

[24] Согласно настоящему раскрытию сущности, можно повышать эффективность при остаточном кодировании.[24] According to the present disclosure, it is possible to improve efficiency in residual coding.

[25] Согласно настоящему раскрытию сущности, можно повышать эффективность при кодировании позиции последнего значимого коэффициента преобразования.[25] According to the present disclosure, it is possible to improve efficiency when encoding the position of the last significant transform coefficient.

[26] Согласно настоящему раскрытию сущности, можно повышать эффективность остаточного кодирования посредством кодирования коэффициента преобразования на основе высокочастотного обнуления.[26] According to the present disclosure, it is possible to improve the efficiency of residual coding by encoding a transform coefficient based on high-frequency nulling.

[27] Согласно настоящему раскрытию сущности, можно повышать эффективность кодирования изображений посредством кодирования информации позиции относительно последнего значимого коэффициента преобразования в текущем блоке (или текущем блоке преобразования) на основе высокочастотного обнуления.[27] According to the present disclosure, it is possible to improve the efficiency of image encoding by encoding position information relative to the last significant transform coefficient in the current block (or current transform block) based on high-frequency nulling.

[28] Согласно настоящему раскрытию сущности, можно повышать эффективность кодирования изображений посредством извлечения контекстной модели для информации позиции последнего значимого коэффициента преобразования на основе предварительно определенного размера блока при кодировании коэффициентов преобразования для текущего блока (или текущего блока преобразования) на основе высокочастотного обнуления.[28] According to the present disclosure, it is possible to improve the efficiency of image encoding by extracting a context model for position information of the last significant transform coefficient based on a predetermined block size when encoding transform coefficients for a current block (or a current transform block) based on high-frequency nulling.

[29] Преимущества, которые могут получаться за счет конкретных примеров настоящего раскрытия сущности, не ограничены упомянутыми выше преимуществами. Например, могут быть предусмотрены различные технические эффекты, которые специалисты в данной области техники могут понимать или извлекать из настоящего раскрытия сущности. Соответственно, конкретные преимущества настоящего раскрытия сущности не ограничены преимуществами, явно описанными в настоящем раскрытии сущности, и могут включать в себя различные преимущества, которые могут пониматься или извлекаться из технических признаков настоящего раскрытия сущности.[29] The benefits that may be obtained by specific examples of the present disclosure are not limited to the benefits mentioned above. For example, there may be various technical effects that those skilled in the art may understand or learn from the present disclosure. Accordingly, the specific advantages of the present disclosure are not limited to those explicitly described in the present disclosure, and may include various advantages that may be understood or derived from the technical features of the present disclosure.

Краткое описание чертежейBrief description of drawings

[30] Фиг. 1 схематично иллюстрирует пример системы кодирования видео/изображений, к которой является применимым настоящее раскрытие сущности.[30] FIG. 1 schematically illustrates an example of a video/image coding system to which the present disclosure is applicable.

[31] Фиг. 2 является схемой, принципиально иллюстрирующей конфигурацию аппаратуры кодирования видео/изображений, к которой является применимым настоящее раскрытие сущности.[31] FIG. 2 is a diagram fundamentally illustrating a configuration of video/image encoding equipment to which the present disclosure is applicable.

[32] Фиг. 3 является схемой, принципиально иллюстрирующей конфигурацию аппаратуры декодирования видео/изображений, к которой является применимым настоящее раскрытие сущности.[32] FIG. 3 is a diagram fundamentally illustrating a configuration of video/image decoding equipment to which the present disclosure is applicable.

[33] Фиг. 4 схематично иллюстрирует технологию множественного преобразования согласно варианту осуществления настоящего раскрытия сущности.[33] FIG. 4 schematically illustrates a multiple conversion technology according to an embodiment of the present disclosure.

[34] Фиг. 5 иллюстрирует 32-точечное обнуление согласно варианту осуществления настоящего раскрытия сущности.[34] FIG. 5 illustrates 32-point nulling according to an embodiment of the present disclosure.

[35] Фиг. 6 иллюстрирует сегмент остаточного блока согласно варианту осуществления настоящего раскрытия сущности.[35] FIG. 6 illustrates a residual block segment according to an embodiment of the present disclosure.

[36] Фиг. 7 является блок-схемой последовательности операций способа, иллюстрирующей работу аппаратуры декодирования видео согласно варианту осуществления настоящего раскрытия сущности.[36] FIG. 7 is a flowchart illustrating the operation of a video decoding apparatus according to an embodiment of the present disclosure.

[37] Фиг. 8 является блок-схемой, иллюстрирующей конфигурацию аппаратуры декодирования согласно варианту осуществления настоящего раскрытия сущности.[37] FIG. 8 is a block diagram illustrating a configuration of decoding equipment according to an embodiment of the present disclosure.

[38] Фиг. 9 является блок-схемой последовательности операций способа, иллюстрирующей процесс извлечения остаточной выборки согласно варианту осуществления настоящего раскрытия сущности.[38] FIG. 9 is a flowchart illustrating a residual sample extraction process according to an embodiment of the present disclosure.

[39] Фиг. 10 является блок-схемой последовательности операций способа, иллюстрирующей работу аппаратуры кодирования видео согласно варианту осуществления настоящего раскрытия сущности.[39] FIG. 10 is a flowchart illustrating the operation of a video encoding apparatus according to an embodiment of the present disclosure.

[40] Фиг. 11 является блок-схемой, иллюстрирующей конфигурацию аппаратуры кодирования согласно варианту осуществления настоящего раскрытия сущности.[40] FIG. 11 is a block diagram illustrating a configuration of encoding equipment according to an embodiment of the present disclosure.

[41] Фиг. 12 является блок-схемой последовательности операций способа, иллюстрирующей процесс кодирования остаточной информации согласно варианту осуществления настоящего раскрытия сущности.[41] FIG. 12 is a flowchart illustrating a process of encoding residual information according to an embodiment of the present disclosure.

[42] Фиг. 13 иллюстрирует структуру системы потоковой передачи контента, к которой применяется настоящее раскрытие сущности.[42] FIG. 13 illustrates the structure of a content streaming system to which the present disclosure applies.

Подробное описание вариантов осуществленияDetailed Description of Embodiments

[43] Хотя настоящее раскрытие сущности может подвергаться различным модификациям и включает в себя различные варианты осуществления, его конкретные варианты осуществления показаны на чертежах в качестве примера и подробно описываются ниже. Тем не менее, это не имеет намерение ограничивать настоящее раскрытие сущности конкретными вариантами осуществления, раскрытыми в данном документе. Термины, используемые в данном документе, служат только для цели описания конкретных вариантов осуществления и не имеют намерение ограничивать техническую идею настоящего раскрытия сущности. Формы единственного числа могут включать в себя формы множественного числа, если контекст явно не указывает иное. Такие термины, как "включать в себя" и "иметь", предназначены для того, чтобы указывать то, что существуют признаки, числа, этапы, операции, элементы, компоненты либо комбинации вышеозначенного, используемые в нижеприведенном описании, и в силу этого не следует понимать, что заранее исключается возможность наличия или добавления одного или более других признаков, чисел, этапов, операций, элементов, компонентов либо комбинаций вышеозначенного.[43] Although the present disclosure is subject to various modifications and includes various embodiments, specific embodiments thereof are shown in the drawings by way of example and are described in detail below. However, it is not intended to limit the present disclosure to the specific embodiments disclosed herein. The terms used herein are for the purpose of describing specific embodiments only and are not intended to limit the technical intent of the present disclosure. Singular forms may include plural forms unless the context clearly indicates otherwise. Terms such as “include” and “have” are intended to indicate that there are features, figures, steps, operations, elements, components, or combinations thereof used in the description below, and as such should not understand that the possibility of the presence or addition of one or more other features, numbers, steps, operations, elements, components or combinations of the above is excluded in advance.

[44] Между тем, каждый компонент на чертежах, описанных в данном документе, проиллюстрирован независимо для удобства описания в отношении характеристических функций, отличающихся друг от друга, и, тем не менее, не подразумевается то, что каждый компонент реализуется посредством отдельных аппаратных средств или программного обеспечения. Например, любые два или более из этих компонентов могут комбинироваться, чтобы формировать один компонент, и любой один компонент может разделяться на несколько компонентов. Варианты осуществления, в которых компоненты комбинируются и/или разделяются, должны принадлежать объему патентного права настоящего раскрытия сущности при условии, что они не отступают от сущности настоящего раскрытия сущности.[44] Meanwhile, each component in the drawings described herein is illustrated independently for convenience of description with respect to characteristic functions different from each other, and however, it is not intended that each component is implemented by separate hardware or software. For example, any two or more of these components may be combined to form one component, and any one component may be divided into multiple components. Embodiments in which components are combined and/or separated are intended to fall within the scope of the patent rights of this disclosure, provided that they do not depart from the spirit of this disclosure.

[45] В дальнейшем в этом документе, подробнее поясняются предпочтительные варианты осуществления настоящего раскрытия сущности со ссылкой на прилагаемые чертежи. Помимо этого, идентичные ссылки с номерами используются для идентичных компонентов на чертежах, и повторные описания для идентичных компонентов опускаются.[45] Hereinafter, preferred embodiments of the present disclosure are explained in more detail with reference to the accompanying drawings. In addition, identical reference numbers are used for identical components in the drawings, and repeated descriptions for identical components are omitted.

[46] Этот документ относится к кодированию видео/изображений. Например, способ/пример, раскрытый в этом документе, может относится к стандарту VVC (универсального кодирования видео) (ITU-T-рекомендация H.266), к стандарту кодирования видео/изображений следующего поколения после VVC либо к другим связанным с кодированием видео стандартам (например, к стандарту HEVC (высокоэффективного кодирования видео) (ITU-T-рекомендация H.265), к стандарту EVC (фундаментального кодирования видео), к AVS2-стандарту и т.д.).[46] This document relates to video/image coding. For example, the method/example disclosed in this document may relate to the VVC (Video Versatile Coding) standard (ITU-T Recommendation H.266), the next generation video/image coding standard after VVC, or other related video coding standards (for example, to the HEVC (High Efficiency Video Coding) standard (ITU-T recommendation H.265), to the EVC (fundamental video coding) standard, to the AVS2 standard, etc.).

[47] В этом документе, могут предоставляться множество вариантов осуществления, связанных с кодированием видео/изображений, и если не указано обратное, варианты осуществления могут комбинироваться между собой и выполняться.[47] Herein, a variety of embodiments related to video/image coding may be provided, and unless otherwise noted, embodiments may be combined and executed.

[48] В этом документе, видео может означать набор последовательности изображений со временем. В общем, кадр означает единицу, представляющую изображение в конкретной временной зоне, и слайс/плитка представляет собой единицу, составляющую часть кадра. Слайс/плитка может включать в себя одну или более единиц дерева кодирования (CTU). Один кадр может состоять из одного или более слайсов/плиток. Один кадр может состоять из одной или более групп плиток. Одна группа плиток может включать в себя одну или более плиток.[48] In this document, video can mean a collection of sequences of images over time. In general, a frame means a unit representing an image in a particular time zone, and a slice/tile is a unit constituting a part of a frame. A slice/tile may include one or more coding tree units (CTUs). One frame can consist of one or more slices/tiles. One frame can consist of one or more groups of tiles. One tile group may include one or more tiles.

[49] Пиксел или пел может означать наименьшую единицу, составляющую один кадр (или изображение). Кроме того, "выборка" может использоваться в качестве термина, соответствующего пикселу. Выборка, в общем, может представлять пиксел или значение пиксела и может представлять только пиксел/пиксельное значение компонента сигнала яркости либо только пиксел/пиксельное значение компонента сигнала цветности. Альтернативно, выборка может означать пиксельное значение в пространственной области, либо когда это пиксельное значение преобразуется в частотную область, она может означать коэффициент преобразования в частотной области.[49] Pixel or pel can mean the smallest unit that makes up one frame (or image). Additionally, "sample" can be used as a term corresponding to a pixel. A sample may generally represent a pixel or a pixel value, and may represent only a pixel/pixel value of a luma component or only a pixel/pixel value of a chroma component. Alternatively, a sample can mean a pixel value in the spatial domain, or when that pixel value is converted into a frequency domain, it can mean a conversion factor in the frequency domain.

[50] Единица может представлять базовую единицу обработки изображений. Единица может включать в себя по меньшей мере одно из конкретной области и информации, связанной с областью. Одна единица может включать в себя один блок сигналов яркости и два блока сигналов цветности (например, Cb, Cr). "Единица" и такой термин, как "блок", "зона" и т.п., могут использоваться вместо друг друга согласно обстоятельствам. В общем случае, блок MxN может включать в себя набор (или массив) выборок (или массивы выборок) или коэффициентов преобразования, состоящий из M столбцов и N строк.[50] The unit may represent a basic image processing unit. The unit may include at least one of a specific area and information associated with the area. One unit may include one block of luma signals and two blocks of chrominance signals (eg, Cb, Cr). "Unit" and a term such as "block", "zone", etc. may be used instead of each other according to circumstances. In general, an MxN block may include a set (or array) of samples (or arrays of samples) or transform coefficients, consisting of M columns and N rows.

[51] В этом документе, термин "/" и "," должен интерпретироваться как указывающий "и/или". Например, выражение "A/B" может означать "A и/или B". Дополнительно, "A, B" может означать "A и/или B". Дополнительно, "A/B/C" может означать "по меньшей мере одно из A, B и/или C". Кроме того, "A/B/C" может означать "по меньшей мере одно из A, B и/или C".[51] In this document, the terms "/" and "," shall be interpreted to indicate "and/or". For example, the expression "A/B" could mean "A and/or B". Additionally, "A, B" may mean "A and/or B". Additionally, "A/B/C" may mean "at least one of A, B and/or C". In addition, "A/B/C" may mean "at least one of A, B and/or C".

[52] Дополнительно, в документе, термин "или" должен интерпретироваться как указывающий "и/или". Например, выражение "A или B" может включать в себя 1) только A, 2) только B и/или 3) как A, так и B. Другими словами, термин "или" в этом документе должен интерпретироваться как указывающий "дополнительно или альтернативно".[52] Additionally, as used herein, the term “or” should be interpreted to indicate “and/or.” For example, the expression "A or B" may include 1) A only, 2) B only, and/or 3) both A and B. In other words, the term "or" in this document should be interpreted to indicate "in addition or alternatively."

[53] В настоящем раскрытии сущности, "по меньшей мере одно из A и B" может означать "только A", "только B" или "как A, так и B". Помимо этого, в раскрытии сущности, выражение "по меньшей мере одно из A или B" или "по меньшей мере одно из A и/или B" может интерпретироваться как "по меньшей мере одно из A и B".[53] In the present disclosure, “at least one of A and B” may mean “A only,” “B only,” or “both A and B.” In addition, in the disclosure, the expression “at least one of A or B” or “at least one of A and/or B” can be interpreted as “at least one of A and B”.

[54] Помимо этого, в настоящем раскрытии сущности, "по меньшей мере одно из A, B и C" может означать "только A", "только B", "только C" либо "любая комбинация A, B и C". Помимо этого, "по меньшей мере одно из A, B или C" или "по меньшей мере одно из A, B и/или C" может означать "по меньшей мере одно из A, B и C".[54] In addition, in the present disclosure, “at least one of A, B, and C” may mean “A only,” “B only,” “C only,” or “any combination of A, B, and C.” In addition, "at least one of A, B or C" or "at least one of A, B and/or C" may mean "at least one of A, B and C".

[55] Помимо этого, круглая скобка, используемая в настоящем раскрытии сущности, может означать "например". В частности, при указании "прогнозирование (внутреннее прогнозирование)" это может означать то, что "внутреннее прогнозирование" (intra prediction) предлагается в качестве примера "прогнозирования". Таким образом, "прогнозирование" в настоящем раскрытии сущности не ограничено "внутренним прогнозированием", и "внутреннее прогнозирование" может предлагаться в качестве примера "прогнозирования". Помимо этого, при указании "прогнозирование (т.е. внутреннее прогнозирование)", это также может означать то, что "внутреннее прогнозирование" предлагается в качестве примера "прогнозирования".[55] In addition, a parenthesis used in this disclosure may mean "for example." In particular, when specifying "forecasting (intra prediction)" this may mean that "intra prediction" is offered as an example of "forecasting". Thus, “prediction” in the present disclosure is not limited to “internal forecasting,” and “internal forecasting” may be offered as an example of “prediction.” In addition, when indicating "forecasting (ie, internal forecasting)", it may also mean that "internal forecasting" is proposed as an example of "forecasting".

[56] Технические признаки, отдельно описанные на одном чертеже в настоящем раскрытии сущности, могут реализовываться отдельно либо могут реализовываться одновременно.[56] Technical features separately described in a single drawing in this disclosure may be implemented separately or may be implemented simultaneously.

[57] Фиг. 1 схематично иллюстрирует пример системы кодирования видео/изображений, к которой является применимым настоящее раскрытие сущности.[57] FIG. 1 schematically illustrates an example of a video/image coding system to which the present disclosure is applicable.

[58] Ссылаясь на фиг. 1, система кодирования видео/изображений может включать в себя первое устройство (исходное устройство) и второе устройство (приемное устройство). Исходное устройство может доставлять кодированную информацию или данные видео/изображений в форме файла или потоковой передачи в приемное устройство через цифровой носитель хранения данных или сеть.[58] Referring to FIG. 1, the video/image encoding system may include a first device (source device) and a second device (receiver device). A source device may deliver encoded information or video/image data in file or streaming form to a receiving device via a digital storage medium or network.

[59] Исходное устройство может включать в себя видеоисточник, аппаратуру кодирования и передатчик. Приемное устройство может включать в себя приемник, аппаратуру декодирования и модуль рендеринга. Аппаратура кодирования может называться "аппаратурой кодирования видео/изображений", и аппаратура декодирования может называться "аппаратурой декодирования видео/изображений". Передатчик может включаться в аппаратуру кодирования. Приемник может включаться в аппаратуру декодирования. Модуль рендеринга может включать в себя дисплей, и дисплей может быть сконфигурирован как отдельное устройство или внешний компонент.[59] The source device may include a video source, encoding equipment, and a transmitter. The receiving device may include a receiver, decoding hardware, and a rendering module. The encoding apparatus may be referred to as "video/image encoding apparatus" and the decoding apparatus may be referred to as "video/image decoding apparatus." The transmitter can be included in encoding equipment. The receiver can be included in the decoding equipment. The rendering module may include a display, and the display may be configured as a separate device or an external component.

[60] Видеоисточник может получать видео/изображение посредством процесса захвата, синтезирования или формирования видео/изображения. Видеоисточник может включать в себя устройство захвата видео/изображений и/или устройство формирования видео/изображений. Устройство захвата видео/изображений может включать в себя, например, одну или более камер, архивы видео/изображений, включающие в себя ранее захваченные видео/изображения, и т.п. Устройство формирования видео/изображений может включать в себя, например, компьютер, планшетный компьютер и смартфон и может (электронно) формировать видео/изображение. Например, виртуальное видео/изображение может формироваться через компьютер и т.п. В этом случае, процесс захвата видео/изображений может заменяться посредством процесса формирования связанных данных.[60] A video source may obtain video/image through a video/image capture, synthesis, or shaping process. The video source may include a video/image capture device and/or a video/image generation device. The video/image capturing device may include, for example, one or more cameras, video/image archives including previously captured video/images, and the like. The video/image generating apparatus may include, for example, a computer, a tablet computer, and a smartphone, and may (electronically) generate the video/image. For example, a virtual video/image may be generated via a computer or the like. In this case, the video/image capturing process can be replaced by the associated data generation process.

[61] Аппаратура кодирования может кодировать входное видео/изображение. Аппаратура кодирования может выполнять последовательность процедур, таких как прогнозирование, преобразование и квантование, для эффективности сжатия и кодирования. Кодированные данные (кодированная информация видео/изображений) могут выводиться в форме потока битов.[61] The encoding apparatus may encode the input video/image. The encoding hardware may perform a sequence of procedures, such as prediction, transform, and quantization, for efficient compression and encoding. Encoded data (encoded video/image information) may be output in the form of a bit stream.

[62] Передатчик может передавать информацию или данные кодированного видео/изображений, выводимую в форме потока битов, в приемник приемного устройства через цифровой носитель хранения данных или сеть в форме файла или потоковой передачи. Цифровой носитель хранения данных может включать в себя различные носители хранения данных, такие как USB, SD, CD, DVD, Blu-Ray, HDD, SSD и т.п. Передатчик может включать в себя элемент для формирования мультимедийного файла через предварительно определенный формат файлов и может включать в себя элемент для передачи через широковещательную передачу/сеть связи. Приемник может принимать/извлекать поток битов и передавать принимаемый/извлеченный поток битов в аппаратуру декодирования.[62] A transmitter may transmit information or encoded video/image data output in the form of a bitstream to a receiver of a receiving device via a digital storage medium or network in the form of a file or streaming. The digital storage medium may include various storage media such as USB, SD, CD, DVD, Blu-Ray, HDD, SSD, and the like. The transmitter may include an element for generating a multimedia file through a predefined file format and may include an element for transmission through a broadcast/communication network. The receiver may receive/extract the bit stream and transmit the received/extracted bit stream to decoding equipment.

[63] Аппаратура декодирования может декодировать видео/изображение посредством выполнения последовательности процедур, таких как деквантование, обратное преобразование, прогнозирование и т.п., соответствующих работе аппаратуры кодирования.[63] The decoding apparatus may decode the video/image by performing a series of procedures such as dequantization, deconversion, prediction, and the like, corresponding to the operation of the encoding apparatus.

[64] Модуль рендеринга может осуществлять рендеринг декодированного видео/изображения. Подготовленное посредством рендеринга видео/изображение может отображаться через дисплей.[64] The rendering module can render the decoded video/image. The video/image prepared by rendering can be displayed through the display.

[65] Фиг. 2 является схемой, принципиально иллюстрирующей конфигурацию аппаратуры кодирования видео/изображений, к которому является применимым настоящее раскрытие сущности. В дальнейшем в этом документе, то, что называется "аппаратурой кодирования видео", может включать в себя аппаратуру кодирования изображений.[65] FIG. 2 is a diagram fundamentally illustrating the configuration of a video/image encoding apparatus to which the present disclosure is applicable. Hereinafter in this document, what is referred to as “video encoding apparatus” may include image encoding apparatus.

[66] Ссылаясь на фиг. 2, аппаратура 200 кодирования может включать в себя модуль 210 сегментации изображений, модуль 220 прогнозирования, остаточный процессор 230, энтропийный кодер 240, сумматор 250, фильтр 260 и запоминающее устройство 270. Модуль 220 прогнозирования может включать в себя модуль 221 взаимного прогнозирования и модуль 222 внутреннего прогнозирования. Остаточный процессор 230 может включать в себя преобразователь 232, квантователь 233, деквантователь 234, обратный преобразователь 235. Остаточный процессор 230 дополнительно может включать в себя вычитатель 231. Сумматор 250 может называться "модулем восстановления" или "формирователем восстановленных блоков". Модуль 210 сегментации изображений, модуль 220 прогнозирования, остаточный процессор 230, энтропийный кодер 240, сумматор 250 и фильтр 260, которые описываются выше, может состоять из одного или более аппаратных компонентов (например, наборов микросхем или процессоров кодера) согласно варианту осуществления. Дополнительно, запоминающее устройство 270 может включать в себя буфер декодированных кадров (DPB) и может быть сконфигурировано посредством цифрового носителя хранения данных. Аппаратный компонент дополнительно может включать в себя запоминающее устройство 270 в качестве внутреннего/внешнего компонента.[66] Referring to FIG. 2, encoding apparatus 200 may include an image segmentation module 210, a prediction module 220, a residual processor 230, an entropy encoder 240, an adder 250, a filter 260, and a memory 270. The prediction module 220 may include an inter-prediction module 221 and a cross-prediction module 222. internal forecasting. Residual processor 230 may include a transformer 232, a quantizer 233, a dequantizer 234, an inverse transformer 235. The residual processor 230 may further include a subtractor 231. The adder 250 may be referred to as a “recovery module” or a “recovery block generator.” The image segmentation module 210, prediction module 220, residual processor 230, entropy encoder 240, adder 250, and filter 260, which are described above, may be composed of one or more hardware components (eg, encoder chipsets or processors) according to an embodiment. Additionally, storage device 270 may include a decoded frame buffer (DPB) and may be configured with a digital storage medium. The hardware component may further include a storage device 270 as an internal/external component.

[67] Модуль 210 сегментации изображений может сегментировать входное изображение (либо кадр или видеокадр), вводимое в аппаратуру 200 кодирования, на одну или более единиц обработки. В качестве одного примера, единица обработки может называться "единицей кодирования (CU)". В этом случае, начиная с единицы дерева кодирования (CTU) или наибольшей единицы кодирования (LCU), единица кодирования может рекурсивно сегментироваться согласно структуре в виде дерева квадрантов, двоичного дерева и троичного дерева (QTBTTT). Например, одна единица кодирования может разделяться на множество единиц кодирования большей глубины на основе структуры в виде дерева квадрантов, структуры в виде двоичного дерева и/или троичной структуры. В этом случае, например, сначала может применяться структура в виде дерева квадрантов, и впоследствии может применяться структура в виде двоичного дерева и/или троичная структура. Альтернативно, сначала может применяться структура в виде двоичного дерева. Процедура кодирования согласно настоящему раскрытию сущности может выполняться на основе конечной единицы кодирования, которая далее не сегментируется. В этом случае, максимальная единица кодирования может использоваться непосредственно в качестве конечной единицы кодирования на основе эффективности кодирования согласно характеристике изображения. Альтернативно, единица кодирования может рекурсивно сегментироваться на единицы кодирования дополнительной большей глубины по мере необходимости, так что единица кодирования оптимального размера может использоваться в качестве конечной единицы кодирования. Здесь, процедура кодирования может включать в себя такие процедуры, как прогнозирование, преобразование и восстановление, которые описываются ниже. В качестве другого примера, единица обработки дополнительно может включать в себя единицу прогнозирования (PU) или единицу преобразования (TU). В этом случае, единица прогнозирования и единица преобразования могут разбиваться или сегментироваться из вышеописанной конечной единицы кодирования. Единица прогнозирования может представлять собой единицу выборочного прогнозирования, и единица преобразования может представлять собой единицу для извлечения коэффициента преобразования и/или единицу для извлечения остаточного сигнала из коэффициента преобразования.[67] The image segmentation module 210 may segment an input image (either a frame or a video frame) input to the encoding apparatus 200 into one or more processing units. As one example, the processing unit may be referred to as a "coding unit (CU)". In this case, starting from a coding tree unit (CTU) or largest coding unit (LCU), the coding unit can be recursively segmented according to a quadtree, binary tree, and ternary tree (QTBTTT) structure. For example, one coding unit may be divided into multiple coding units of greater depth based on a quadtree structure, a binary tree structure, and/or a ternary structure. In this case, for example, a quadtree structure may be applied first, and a binary tree structure and/or a ternary structure may be subsequently applied. Alternatively, a binary tree structure may be used first. The encoding procedure according to the present disclosure may be performed based on the final encoding unit, which is not further segmented. In this case, the maximum encoding unit can be used directly as the final encoding unit based on the encoding efficiency according to the characteristic of the image. Alternatively, the coding unit can be recursively segmented into coding units of additional greater depth as needed, so that the optimally sized coding unit can be used as the final coding unit. Here, the encoding procedure may include procedures such as prediction, transformation and reconstruction, which are described below. As another example, the processing unit may further include a prediction unit (PU) or a transformation unit (TU). In this case, the prediction unit and the transformation unit may be split or segmented from the above-described final encoding unit. The prediction unit may be a sample prediction unit, and the transformation unit may be a unit for extracting a transformation coefficient and/or a unit for extracting a residual signal from the transformation coefficient.

[68] "Единица" и такой термин, как "блок", "зона" и т.п., могут использоваться вместо друг друга согласно обстоятельствам. В общем случае, блок MxN может представлять набор выборок или коэффициентов преобразования, состоящий из M столбцов и N строк. Выборка, в общем, может представлять пиксел или значение пиксела и может представлять только пиксел/пиксельное значение компонента сигнала яркости либо только пиксел/пиксельное значение компонента сигнала цветности. Выборка может использоваться в качестве термина, соответствующего пикселу или пелу одного кадра (или изображения).[68] "Unit" and a term such as "block", "zone", etc. may be used instead of each other according to circumstances. In general, an MxN block can represent a set of samples or transform coefficients consisting of M columns and N rows. A sample may generally represent a pixel or a pixel value, and may represent only a pixel/pixel value of a luma component or only a pixel/pixel value of a chrominance signal component. Sampling can be used as a term corresponding to a pixel or pel of a single frame (or image).

[69] Вычитатель 223 вычитает прогнозный сигнал (прогнозированный блок, массив прогнозных выборок), выводимый из модуля 221 взаимного прогнозирования или модуля 222 внутреннего прогнозирования, из сигнала входного изображения (исходного блока, массива исходных выборок), чтобы формировать остаточный сигнал (остаточный блок, массив остаточных выборок), и сформированный остаточный сигнал передается в преобразователь 232. В этом случае, как показано, модуль, который вычитает прогнозный сигнал (прогнозированный блок, массив прогнозных выборок) из сигнала входного изображения (исходного блока, массива исходных выборок) в кодере 200, может называться "вычитателем 231". Модуль прогнозирования может выполнять прогнозирование для целевого блока обработки (в дальнейшем в этом документе, называемого "текущим блоком") и может формировать прогнозированный блок, включающий в себя прогнозные выборки для текущего блока. Модуль прогнозирования может определять то, применяется внутреннее прогнозирование или взаимное прогнозирование, на основе текущего блока или CU. Как пояснено ниже в описании каждого режима прогнозирования, модуль прогнозирования может формировать различную информацию, связанную с прогнозированием, к примеру, информацию режима прогнозирования, и передавать сформированную информацию в энтропийный кодер 240. Информация относительно прогнозирования может кодироваться в энтропийном кодере 240 и выводиться в форме потока битов.[69] The subtractor 223 subtracts the prediction signal (predicted block, prediction sample array) output from the inter-prediction module 221 or the intra-prediction module 222 from the input image signal (source block, source sample array) to generate a residual signal (residual block, residual sample array), and the generated residual signal is transmitted to converter 232. In this case, as shown, a module that subtracts the prediction signal (predicted block, prediction sample array) from the input image signal (source block, source sample array) at encoder 200 , may be called "subtractor 231". The prediction module may perform prediction for a target processing block (hereinafter referred to as a "current block") and may generate a prediction block including prediction samples for the current block. The prediction module may determine whether intra prediction or inter prediction is applied based on the current block or CU. As explained below in the description of each prediction mode, the prediction module may generate various prediction-related information, such as prediction mode information, and transmit the generated information to the entropy encoder 240. Information regarding the prediction may be encoded in the entropy encoder 240 and output in the form of a stream bits

[70] Модуль 222 внутреннего прогнозирования может прогнозировать текущий блок посредством ссылки на выборки в текущем кадре. Выборки для ссылки могут быть расположены в соседнем узле или с разнесением от текущего блока согласно режиму прогнозирования. При внутреннем прогнозировании, режимы прогнозирования могут включать в себя множество ненаправленных режимов и множество направленных режимов. Ненаправленные режимы могут включать в себя, например, DC-режим и планарный режим. Направленный режим может включать в себя, например, 33 режима направленного прогнозирования или 65 режимов направленного прогнозирования согласно степени детальности направления прогнозирования. Тем не менее, это представляет собой просто пример, и большее или меньшее число режимов направленного прогнозирования может использоваться в зависимости от настройки. Модуль 222 внутреннего прогнозирования может определять режим прогнозирования, применяемый к текущему блоку, посредством использования режима прогнозирования, применяемого к соседнему блоку.[70] The intra prediction module 222 may predict the current block by reference to the samples in the current frame. Samples for the link can be located in an adjacent node or spaced from the current block according to the prediction mode. In intraprediction, prediction modes may include a plurality of non-directional modes and a plurality of directed modes. Omnidirectional modes may include, for example, DC mode and planar mode. The directional mode may include, for example, 33 directional prediction modes or 65 directional prediction modes according to the granularity of the prediction direction. However, this is merely an example, and more or less directional prediction modes may be used depending on the setting. The intra prediction module 222 may determine the prediction mode applied to the current block by using the prediction mode applied to the adjacent block.

[71] Модуль 221 взаимного прогнозирования может извлекать прогнозированный блок для текущего блока на основе опорного блока (массива опорных выборок), указываемого посредством вектора движения для опорного кадра. В это время, чтобы уменьшать объем информации движения, передаваемой в режиме взаимного прогнозирования, информация движения может прогнозироваться на основе блоков, субблоков или выборок на основе корреляции информации движения между соседним блоком и текущим блоком. Информация движения может включать в себя вектор движения и индекс опорного кадра. Информация движения дополнительно может включать в себя информацию направления взаимного прогнозирования (L0-прогнозирование, L1-прогнозирование, бипрогнозирование и т.д.). В случае взаимного прогнозирования, соседний блок может включать в себя пространственный соседний блок, существующий в текущем кадре, и временной соседний блок, существующий в опорном кадре. Опорный кадр, включающий в себя опорный блок, и опорный кадр, включающий в себя временной соседний блок, могут быть идентичными друг другу или отличающимися друг от друга. Временной соседний блок может называться "совместно размещенным опорным блоком", "совместно размещенной CU (colCU)" и т.п., и опорный кадр, включающий в себя временной соседний блок, может называться "совместно размещенным кадром (colPic)". Например, модуль 221 взаимного прогнозирования может конфигурировать список возможных вариантов информации движения на основе соседних блоков и формировать информацию, указывающую то, какой возможный вариант используется для того, чтобы извлекать вектор движения и/или индекс опорного кадра текущего блока. Взаимное прогнозирование может выполняться на основе различных режимов прогнозирования. Например, в случае режима пропуска и режима объединения, модуль 221 взаимного прогнозирования может использовать информацию движения соседнего блока в качестве информации движения текущего блока. В режиме пропуска, в отличие от режима объединения, остаточный сигнал может не передаваться. В случае режима прогнозирования информации движения (прогнозирования векторов движения, MVP), вектор движения соседнего блока может использоваться в качестве предиктора вектора движения, и вектор движения текущего блока может указываться посредством передачи в служебных сигналах разности векторов движения.[71] The inter-prediction unit 221 can extract a predicted block for the current block based on a reference block (an array of reference samples) indicated by a motion vector for the reference frame. At this time, in order to reduce the amount of motion information transmitted in the inter-prediction mode, motion information may be predicted on a block, sub-block, or sample basis based on the correlation of motion information between a neighboring block and the current block. The motion information may include a motion vector and a reference frame index. The motion information may further include inter-prediction direction information (L0-prediction, L1-prediction, bi-prediction, etc.). In the case of inter-prediction, the neighbor block may include a spatial neighbor block existing in the current frame and a temporal neighbor block existing in the reference frame. The reference frame including the reference block and the reference frame including the temporary adjacent block may be identical to each other or different from each other. A temporary neighbor block may be called a “co-located reference block”, a “col-located CU (colCU)”, etc., and a reference frame including a temporary neighboring block may be called a “col-located frame (colPic)”. For example, the inter-prediction module 221 may configure a list of motion information candidates based on neighboring blocks and generate information indicating which candidate is used to retrieve the motion vector and/or reference frame index of the current block. Mutual prediction can be performed based on different prediction modes. For example, in the case of the skip mode and the merge mode, the inter-prediction unit 221 may use the motion information of the adjacent block as the motion information of the current block. In the skip mode, unlike the combine mode, the residual signal may not be transmitted. In the case of a motion information prediction mode (motion vector prediction, MVP), the motion vector of an adjacent block may be used as a motion vector predictor, and the motion vector of the current block may be indicated by signaling a motion vector difference.

[72] Модуль 220 прогнозирования может формировать прогнозный сигнал на основе различных способов прогнозирования. Например, модуль прогнозирования может применять внутреннее прогнозирование или взаимное прогнозирование для прогнозирования относительно одного блока и, также, может применять внутреннее прогнозирование и взаимное прогнозирование одновременно. Это может называться "комбинированным взаимным и внутренним прогнозированием (CIIP)". Дополнительно, модуль прогнозирования может быть основан на режиме прогнозирования на основе внутриблочного копирования (IBC) либо на палитровом режиме, чтобы выполнять прогнозирование относительно блока. Режим IBC-прогнозирования или палитровый режим может использоваться для кодирования изображений/видео контента игры и т.п., к примеру, для кодирования экранного контента (SCC). Хотя IBC по существу выполняет прогнозирование в текущем блоке, оно может выполняться аналогично взаимному прогнозированию в том, что оно извлекает опорный блок в текущем блоке. Таким образом, IBC может использовать, по меньшей мере, одну из технологий взаимного прогнозирования, описанных в настоящем раскрытии сущности.[72] The prediction module 220 may generate a prediction signal based on various prediction methods. For example, the prediction module may apply intra-prediction or inter-prediction to make predictions regarding one block, and may also apply intra-prediction and inter-prediction simultaneously. This may be referred to as "combined inter-intraprediction (CIIP)". Additionally, the prediction module may be based on an intra-block copy (IBC) prediction mode or a palette mode to perform prediction relative to a block. The IBC prediction mode or palette mode can be used for encoding image/video content of a game and the like, for example, screen content encoding (SCC). Although IBC essentially performs prediction in the current block, it can perform similar to inter prediction in that it retrieves the reference block in the current block. Thus, the IBC may use at least one of the inter-prediction technologies described in the present disclosure.

[73] Прогнозный сигнал, сформированный через модуль 221 взаимного прогнозирования и/или модуль 222 внутреннего прогнозирования, может использоваться для того, чтобы формировать восстановленный сигнал или формировать остаточный сигнал. Преобразователь 232 может формировать коэффициенты преобразования посредством применения технологии преобразования к остаточному сигналу. Например, технология преобразования может включать в себя, по меньшей мере, одно из дискретного косинусного преобразования (DCT), дискретного синусного преобразования (DST), преобразования Карунена-Лоэва (KLT), преобразования на основе графа (GBT) или условно нелинейного преобразования (CNT). Здесь, GBT означает преобразование, полученное из графа, когда информация взаимосвязи между пикселами представляется посредством графа. CNT означает преобразование, полученное на основе прогнозного сигнала, сформированного с использованием всех ранее восстановленных пикселов. Помимо этого, процесс преобразования может применяться к квадратным пиксельным блокам, имеющим идентичный размер, или может применяться к блокам, имеющим переменный размер, а не квадратный.[73] The prediction signal generated through the inter prediction module 221 and/or the intra prediction module 222 can be used to generate a reconstructed signal or generate a residual signal. Converter 232 may generate conversion coefficients by applying conversion technology to the residual signal. For example, the transform technology may include at least one of a discrete cosine transform (DCT), a discrete sine transform (DST), a Karhunen-Loeve transform (KLT), a graph-based transform (GBT), or a conditionally nonlinear transform (CNT). ). Here, GBT means a graph-derived transformation when the relationship information between pixels is represented by the graph. CNT means the transformation obtained from the prediction signal generated using all the previously reconstructed pixels. In addition, the conversion process can be applied to square pixel blocks that are identical in size, or can be applied to blocks that are variable in size rather than square.

[74] Квантователь 233 может квантовать коэффициенты преобразования и передавать их в энтропийный кодер 240, и энтропийный кодер 240 может кодировать квантованный сигнал (информацию относительно квантованных коэффициентов преобразования) и выводить кодированный сигнал в потоке битов. Информация относительно квантованных коэффициентов преобразования может называться "остаточной информацией". Квантователь 233 может перекомпоновывать блочные квантованные коэффициенты преобразования в одномерную векторную форму на основе порядка сканирования коэффициентов и формировать информацию относительно квантованных коэффициентов преобразования на основе квантованных коэффициентов преобразования в одномерной векторной форме. Энтропийный кодер 240 может осуществлять различные способы кодирования, такие как, например, кодирование экспоненциальным кодом Голомба, контекстно-адаптивное кодирование переменной длины (CAVLC), контекстно-адаптивное двоичное арифметическое кодирование (CABAC) и т.п. Энтропийный кодер 240 может кодировать информацию, необходимую для восстановления видео/изображений, отличную от квантованных коэффициентов преобразования (например, значений синтаксических элементов и т.д.), вместе или отдельно. Кодированная информация (например, кодированная информация видео/изображений) может передаваться или сохраняться на основе единиц слоя абстрагирования от сети (NAL) в форме потока битов. Информация видео/изображений дополнительно может включать в себя информацию относительно различных наборов параметров, таких как набор параметров адаптации (APS), набор параметров кадра (PPS), набор параметров последовательности (SPS) или набор параметров видео (VPS) и т.п. Дополнительно, информация видео/изображений дополнительно может включать в себя общую информацию ограничений. В настоящем раскрытии сущности, информация и/или синтаксические элементы, которые передаются/сигнализируются в служебных сигналах в аппаратуру декодирования из аппаратуры кодирования, могут включаться в информацию видео/изображений. Информация видео/изображений может кодироваться через вышеописанную процедуру кодирования и включаться в поток битов. Поток битов может передаваться через сеть или сохраняться на цифровом носителе хранения данных. Здесь, сеть может включать в себя широковещательную сеть, сеть связи и т.п., и цифровой носитель хранения данных может включать в себя различные носители хранения данных, такие как USB, SD, CD, DVD, Blu-Ray, HDD, SSD и т.п. Передатчик (не показан), который передает сигнал, выводимый из энтропийного кодера 240, и/или модуль хранения (не показан), который сохраняет его, могут быть сконфигурированы как внутренний/внешний элемент аппаратуры 200 кодирования, либо передатчик может включаться в энтропийный кодер 240.[74] Quantizer 233 may quantize transform coefficients and transmit them to entropy encoder 240, and entropy encoder 240 may encode the quantized signal (information regarding the quantized transform coefficients) and output the encoded signal in a bit stream. Information regarding the quantized transform coefficients may be referred to as "residual information". Quantizer 233 may re-arrange the block quantized transform coefficients into one-dimensional vector form based on the scanning order of the coefficients, and generate information regarding the quantized transform coefficients based on the quantized transform coefficients in one-dimensional vector form. The entropy encoder 240 may implement various encoding techniques, such as, for example, exponential Golomb coding, context adaptive variable length coding (CAVLC), context adaptive binary arithmetic coding (CABAC), and the like. Entropy encoder 240 may encode information needed to reconstruct video/images other than quantized transform coefficients (eg, syntax element values, etc.), together or separately. Encoded information (eg, encoded video/image information) may be transmitted or stored based on Network Abstraction Layer (NAL) units in the form of a bit stream. The video/image information may further include information regarding various parameter sets, such as an adaptation parameter set (APS), a frame parameter set (PPS), a sequence parameter set (SPS), or a video parameter set (VPS), and the like. Additionally, the video/image information may further include general restriction information. In the present disclosure, information and/or syntax elements that are transmitted/signaled in overhead signals to the decoding equipment from the encoding equipment may be included in the video/image information. The video/image information may be encoded through the encoding procedure described above and included in the bit stream. The bit stream may be transmitted over a network or stored on a digital storage medium. Here, the network may include a broadcast network, a communications network, and the like, and the digital storage medium may include various storage media such as USB, SD, CD, DVD, Blu-Ray, HDD, SSD, and etc. A transmitter (not shown) that transmits the signal output from the entropy encoder 240 and/or a storage module (not shown) that stores it may be configured as an internal/external element of the encoding hardware 200, or the transmitter may be included in the entropy encoder 240 .

[75] Квантованные коэффициенты преобразования, выводимые из квантователя 233, могут использоваться для того, чтобы формировать прогнозный сигнал. Например, посредством применения деквантования и обратного преобразования к квантованным коэффициентам преобразования через деквантователь 234 и обратный преобразователь 235, остаточный сигнал (остаточный блок или остаточные выборки) может восстанавливаться. Сумматор 155 суммирует восстановленный остаточный сигнал с прогнозным сигналом, выводимым из модуля 221 взаимного прогнозирования или модуля 222 внутреннего прогнозирования, так что может формироваться восстановленный сигнал (восстановленный кадр, восстановленный блок, массив восстановленных выборок). Когда отсутствует остаток для целевого блока обработки, как в случае, когда режим пропуска применяется, прогнозированный блок может использоваться в качестве восстановленного блока. Сумматор 250 может называться "модулем восстановления" или "формирователем восстановленных блоков". Сформированный восстановленный сигнал может использоваться для внутреннего прогнозирования следующего целевого блока обработки в текущем блоке и, как описано ниже, может использоваться для взаимного прогнозирования следующего кадра посредством фильтрации.[75] The quantized transform coefficients output from quantizer 233 can be used to generate a predictive signal. For example, by applying dequantization and inverse transform to the quantized transform coefficients through dequantizer 234 and inverter 235, the residual signal (residual block or residual samples) can be recovered. The adder 155 adds the reconstructed residual signal with the prediction signal output from the inter-prediction module 221 or the intra-prediction module 222, so that a reconstructed signal (reconstructed frame, reconstructed block, reconstructed sample array) can be generated. When there is no remainder for the target processing block, as in the case when the skip mode is applied, the predicted block can be used as the reconstructed block. The adder 250 may be referred to as a "recovery module" or a "recovered block generator." The generated reconstructed signal can be used to internally predict the next target processing block in the current block and, as described below, can be used to inter-predict the next frame through filtering.

[76] Между тем, в процессе кодирования и/или восстановления кадров может применяться преобразование сигнала яркости с масштабированием сигнала цветности (LMCS).[76] Meanwhile, in the process of encoding and/or restoring frames, luma conversion with chrominance scaling (LMCS) may be applied.

[77] Фильтр 260 может повышать субъективное/объективное качество видео посредством применения фильтрации к восстановленному сигналу. Например, фильтр 260 может формировать модифицированный восстановленный кадр посредством применения различных способов фильтрации к восстановленному кадру и может сохранять модифицированный восстановленный кадр в запоминающем устройстве 270, в частности, в DPB запоминающего устройства 270. Различные способы фильтрации могут включать в себя, например, фильтрацию для удаления блочности, дискретизированное адаптивное смещение, адаптивный контурный фильтр, билатеральный фильтр и т.п. Как пояснено ниже в описании каждого способа фильтрации, фильтр 260 может формировать различную информацию, связанную с фильтрацией, и передавать сформированную информацию в энтропийный кодер 240. Информация относительно фильтрации может кодироваться в энтропийном кодере 240 и выводиться в форме потока битов.[77] Filter 260 may enhance the subjective/objective quality of the video by applying filtering to the reconstructed signal. For example, filter 260 may generate a modified reconstructed frame by applying various filtering techniques to the reconstructed frame and may store the modified reconstructed frame in storage device 270, particularly in the DPB of storage device 270. Various filtering techniques may include, for example, deletion filtering blocking, sampled adaptive offset, adaptive contour filter, bilateral filter, etc. As explained below in the description of each filtering method, the filter 260 may generate various filtering-related information and transmit the generated information to the entropy encoder 240. The filtering information may be encoded in the entropy encoder 240 and output in the form of a bit stream.

[78] Модифицированный восстановленный кадр, который передан в запоминающее устройство 270, может использоваться в качестве опорного кадра в модуле 221 взаимного прогнозирования. Посредством этого, аппаратура кодирования может не допускать рассогласования прогнозирования в аппаратуре 100 кодирования и аппаратуре декодирования, когда применяется взаимное прогнозирование, и также может повышать эффективность кодирования.[78] The modified reconstructed frame, which is transferred to the storage device 270, can be used as a reference frame in the inter-prediction unit 221. By doing this, the encoding equipment can prevent prediction mismatch in the encoding equipment 100 and the decoding equipment when inter-prediction is applied, and can also improve encoding efficiency.

[79] DPB запоминающего устройства 270 может сохранять модифицированный восстановленный кадр, чтобы использовать его в качестве опорного кадра в модуле 221 взаимного прогнозирования. Запоминающее устройство 270 может сохранять информацию движения блока в текущем кадре, из которой извлекается (или кодируется) информация движения, и/или информацию движения блоков в уже восстановленном кадре. Сохраненная информация движения может передаваться в модуль 221 взаимного прогнозирования для использования в качестве информации движения соседнего блока или информации движения временного соседнего блока. Запоминающее устройство 270 может сохранять восстановленные выборки восстановленных блоков в текущем кадре и передавать их в модуль 222 внутреннего прогнозирования.[79] The DPB of the storage device 270 may store the modified reconstructed frame to use as a reference frame in the inter-prediction module 221. Memory 270 may store block motion information in the current frame from which motion information is extracted (or encoded), and/or block motion information in an already reconstructed frame. The stored motion information may be transmitted to the inter-prediction unit 221 for use as neighboring block motion information or temporary neighbor block motion information. Memory 270 may store reconstructed samples of reconstructed blocks in the current frame and transmit them to intra prediction module 222.

[80] Фиг. 3 является схемой, принципиально иллюстрирующей конфигурацию аппаратуры декодирования видео/изображений, к которому является применимым настоящее раскрытие сущности.[80] FIG. 3 is a diagram fundamentally illustrating the configuration of a video/image decoding apparatus to which the present disclosure is applicable.

[81] Ссылаясь на фиг. 3, аппаратура декодирования видео 300 может включать в себя энтропийный декодер 310, остаточный процессор 320, модуль 330 прогнозирования, сумматор 340, фильтр 350 и запоминающее устройство 360. Модуль 330 прогнозирования может включать в себя модуль 331 взаимного прогнозирования и модуль 332 внутреннего прогнозирования. Остаточный процессор 320 может включать в себя деквантователь 321 и обратный преобразователь 321. Энтропийный декодер 310, остаточный процессор 320, модуль 330 прогнозирования, сумматор 340 и фильтр 350, которые описываются выше, может состоять из одного или более аппаратных компонентов (например, наборов микросхем или процессоров декодера) согласно варианту осуществления. Дополнительно, запоминающее устройство 360 может включать в себя буфер декодированных кадров (DPB) и может быть сконфигурировано посредством цифрового носителя хранения данных. Аппаратный компонент дополнительно может включать в себя запоминающее устройство 360 в качестве внутреннего/внешнего компонента.[81] Referring to FIG. 3, video decoding apparatus 300 may include an entropy decoder 310, a residual processor 320, a prediction module 330, an adder 340, a filter 350, and a memory 360. The prediction module 330 may include an inter-prediction module 331 and an intra-prediction module 332. Residual processor 320 may include a dequantizer 321 and an inverse converter 321. Entropy decoder 310, residual processor 320, prediction module 330, adder 340, and filter 350, which are described above, may be comprised of one or more hardware components (e.g., chipsets or decoder processors) according to an embodiment. Additionally, storage device 360 may include a decoded frame buffer (DPB) and may be configured with a digital storage medium. The hardware component may further include storage device 360 as an internal/external component.

[82] Когда поток битов, включающий в себя информацию видео/изображений, вводится, аппаратура 300 декодирования может восстанавливать изображение, соответствующее процессу, посредством которого информация видео/изображений обработана в аппаратуре кодирования по фиг. 2. Например, аппаратура 300 декодирования может извлекать единицы/блоки на основе информации, связанной с сегментацией на блоки, полученной из потока битов. Аппаратура 300 декодирования может выполнять декодирование посредством использования единицы обработки, применяемой в аппаратуре кодирования. Следовательно, единица обработки декодирования, например, может представлять собой единицу кодирования, которая может сегментироваться вдоль структуры в виде дерева квадрантов, структуры в виде двоичного дерева и/или структуры в виде троичного дерева из единицы дерева кодирования или наибольшей единицы кодирования. Одна или более единиц преобразования могут извлекаться из единицы кодирования. Так же, восстановленный сигнал изображения, декодированный и выводимый через аппаратуру 300 декодирования может воспроизводиться через модуль воспроизведения.[82] When a bitstream including video/image information is input, the decoding apparatus 300 can reconstruct an image corresponding to the process by which the video/image information is processed in the encoding apparatus of FIG. 2. For example, decoding apparatus 300 may extract units/blocks based on block segmentation information obtained from the bit stream. The decoding apparatus 300 can perform decoding by using a processing unit applied in the encoding apparatus. Therefore, a decoding processing unit, for example, may be an encoding unit, which may be segmented along a quadtree structure, a binary tree structure, and/or a ternary tree structure from an encoding tree unit or a largest encoding unit. One or more transformation units may be derived from a coding unit. Also, the reconstructed image signal decoded and output through the decoding apparatus 300 can be reproduced through the playback unit.

[83] Аппаратура 300 декодирования может принимать сигнал, выводимый из аппаратуры кодирования по фиг. 2 в форме потока битов, и принимаемый сигнал может декодироваться через энтропийный декодер 310. Например, энтропийный декодер 310 может синтаксически анализировать поток битов, чтобы извлекать информацию (например, информацию видео/изображений), требуемую для восстановления изображений (или восстановления кадров). Информация видео/изображений дополнительно может включать в себя информацию относительно различных наборов параметров, таких как набор параметров адаптации (APS), набор параметров кадра (PPS), набор параметров последовательности (SPS) или набор параметров видео (VPS) и т.п. Дополнительно, информация видео/изображений дополнительно может включать в себя общую информацию ограничений. Аппаратура декодирования дополнительно может декодировать кадр на основе информации относительно набора параметров и/или общей информации ограничений. В настоящем раскрытии сущности, передаваемая в служебных сигналах/принимаемая информация и/или синтаксические элементы, которые описываются ниже, могут декодироваться посредством процедуры декодирования и получаться из потока битов. Например, энтропийный декодер 310 может декодировать информацию в потоке битов на основе способа кодирования, такого как кодирование экспоненциальным кодом Голомба, CAVLC, CABAC и т.п., и может выводить значение синтаксического элемента, необходимого для восстановления изображений, и квантованные значения коэффициента преобразования относительно остатка. Более конкретно, способ энтропийного CABAC-декодирования может принимать элемент разрешения, соответствующий каждому синтаксическому элементу в потоке битов, определять контекстную модель с использованием декодирования информации целевых синтаксических элементов и декодирования информации соседних и декодируемых целевых блоков либо информации символа/элемента разрешения, декодированного на предыдущем этапе, прогнозировать вероятность формирования элемента разрешения согласно определенной контекстной модели и выполнять арифметическое декодирование элемента разрешения, чтобы формировать символ, соответствующий каждому значению синтаксического элемента. Здесь, способ энтропийного CABAC-декодирования может обновлять контекстную модель с использованием информации символа/элемента разрешения, декодированного для контекстной модели следующего символа/элемента разрешения после определения контекстной модели. Информация относительно прогнозирования из информации, декодированной в энтропийном декодере 310, может предоставляться в модуль прогнозирования (модуль 332 взаимного прогнозирования и модуль 331 внутреннего прогнозирования), и остаточные значения, т.е. квантованные коэффициенты преобразования, для которых энтропийное декодирование выполнено в энтропийном декодере 310, и ассоциированная информация параметров могут вводиться в остаточный процессор 320. Остаточный процессор 320 может извлекать остаточный сигнал (остаточный блок, остаточные выборки, массив остаточных выборок). Дополнительно, информация относительно фильтрации из информации, декодированной в энтропийном декодере 310, может предоставляться в фильтр 350. Между тем, приемник (не показан), который принимает сигнал, выводимый из аппаратуры кодирования, дополнительно может составлять аппаратуру 300 декодирования в качестве внутреннего/внешнего элемента, и приемник может представлять собой компонент энтропийного декодера 310. Между тем, аппаратура декодирования согласно настоящему раскрытию сущности может называться "аппаратурой кодирования видео/изображений/кадров", и аппаратура декодирования может классифицироваться на информационный декодер (декодер информации видео/изображений/кадров) и выборочный декодер (декодер выборок видео/изображений/кадров). Информационный декодер может включать в себя энтропийный декодер 310, и выборочный декодер может включать в себя, по меньшей мере, одно из деквантователя 321, обратного преобразователя 322, сумматора 340, фильтра 350, запоминающего устройства 360, модуля 332 взаимного прогнозирования и модуля 331 внутреннего прогнозирования.[83] The decoding apparatus 300 may receive a signal output from the encoding apparatus of FIG. 2 in the form of a bit stream, and the received signal can be decoded through an entropy decoder 310. For example, an entropy decoder 310 can parse the bit stream to extract information (eg, video/image information) required for image reconstruction (or frame reconstruction). The video/image information may further include information regarding various parameter sets, such as an adaptation parameter set (APS), a frame parameter set (PPS), a sequence parameter set (SPS), or a video parameter set (VPS), and the like. Additionally, the video/image information may further include general restriction information. The decoding apparatus may further decode the frame based on information regarding the parameter set and/or general constraint information. In the present disclosure, the signaling/receiving information and/or syntax elements that are described below can be decoded by a decoding procedure and obtained from the bit stream. For example, entropy decoder 310 may decode information in a bit stream based on an encoding method such as exponential Golomb coding, CAVLC, CABAC, and the like, and may output the value of a syntax element required for image reconstruction and quantized transform coefficient values with respect to remainder. More specifically, the entropy CABAC decoding method may take a resolution element corresponding to each syntax element in the bitstream, determine a context model using decoding the information of target syntax elements and decoding the information of adjacent and decodable target blocks or the symbol/resolution element information decoded in a previous step. , predict the probability of generating a resolution element according to a certain context model, and perform arithmetic decoding of the permission element to generate a symbol corresponding to each value of the syntactic element. Here, the entropy CABAC decoding method can update the context model using the symbol/entry element information decoded for the context model of the next symbol/entry element after determining the context model. Information regarding prediction from the information decoded in the entropy decoder 310 may be provided to the prediction module (inter prediction module 332 and intra prediction module 331), and the residual values, i.e. quantized transform coefficients for which entropy decoding is performed in entropy decoder 310 and associated parameter information may be input to residual processor 320. Residual processor 320 may extract a residual signal (residual block, residual samples, array of residual samples). Additionally, information regarding filtering from information decoded in the entropy decoder 310 may be provided to the filter 350. Meanwhile, a receiver (not shown) that receives a signal output from the encoding equipment may further constitute the decoding equipment 300 as an internal/external element. , and the receiver may be a component of the entropy decoder 310. Meanwhile, the decoding apparatus according to the present disclosure may be called “video/image/frame encoding apparatus,” and the decoding apparatus may be classified into an information decoder (video/image/frame information decoder) and selective decoder (video/image/frame sampling decoder). The information decoder may include an entropy decoder 310, and the sample decoder may include at least one of a dequantizer 321, an inverter 322, an adder 340, a filter 350, a memory 360, an inter-prediction module 332, and an intra-prediction module 331 .

[84] Деквантователь 321 может выводить коэффициенты преобразования посредством деквантования квантованных коэффициентов преобразования. Деквантователь 321 может перекомпоновывать квантованные коэффициенты преобразования в форме двумерного блока. В этом случае, перекомпоновка может выполнять перекомпоновку на основе порядка сканирования коэффициентов, которое выполнено в аппаратуре кодирования. Деквантователь 321 может выполнять деквантование для квантованных коэффициентов преобразования с использованием параметра квантования (например, информации размера шага квантования) и получать коэффициенты преобразования.[84] The dequantizer 321 may output transform coefficients by dequantizing the quantized transform coefficients. The dequantizer 321 may re-arrange the quantized transform coefficients in the form of a two-dimensional block. In this case, the re-arrangement may perform the re-arrangement based on the scanning order of the coefficients, which is performed in the encoding apparatus. The dequantizer 321 may perform dequantization on the quantized transform coefficients using a quantization parameter (eg, quantization step size information) and obtain the transform coefficients.

[85] Деквантователь 322 получает остаточный сигнал (остаточный блок, массив остаточных выборок) посредством обратного преобразования коэффициентов преобразования.[85] The dequantizer 322 obtains the residual signal (residual block, array of residual samples) by inversely transforming the transform coefficients.

[86] Модуль 230 прогнозирования может выполнять прогнозирование для текущего блока и может формировать прогнозированный блок, включающий в себя прогнозные выборки для текущего блока. Модуль прогнозирования может определять то, применяется внутреннее прогнозирование или взаимное прогнозирование к текущему блоку, на основе информации относительно прогнозирования, выводимой из энтропийного декодера 310, и, в частности, может определять режим внутреннего/взаимного прогнозирования.[86] Prediction module 230 may perform prediction for the current block and may generate a predicted block including prediction samples for the current block. The prediction module can determine whether intra prediction or inter prediction is applied to the current block based on the prediction information output from the entropy decoder 310, and in particular can determine the intra/inter prediction mode.

[87] Модуль прогнозирования может формировать прогнозный сигнал на основе различных способов прогнозирования. Например, модуль прогнозирования может применять внутреннее прогнозирование или взаимное прогнозирование для прогнозирования относительно одного блока и, также, может применять внутреннее прогнозирование и взаимное прогнозирование одновременно. Это может называться "комбинированным взаимным и внутренним прогнозированием (CIIP)". Помимо этого, модуль прогнозирования может выполнять внутриблочное копирование (IBC) для прогнозирования для блока. Внутриблочное копирование может использоваться для кодирования изображений/видео контента игры и т.п., к примеру, для кодирования экранного контента (SCC). Хотя IBC по существу выполняет прогнозирование в текущем блоке, оно может выполняться аналогично взаимному прогнозированию в том, что оно извлекает опорный блок в текущем блоке. Таким образом, IBC может использовать, по меньшей мере, одну из технологий взаимного прогнозирования, описанных в настоящем раскрытии сущности.[87] The prediction module can generate a prediction signal based on various prediction methods. For example, the prediction module may apply intra-prediction or inter-prediction to make predictions regarding one block, and may also apply intra-prediction and inter-prediction simultaneously. This may be referred to as "combined inter-intraprediction (CIIP)". In addition, the prediction module can perform intra-block copy (IBC) to predict for a block. In-block copying can be used to encode game image/video content and the like, for example, screen content encoding (SCC). Although IBC essentially performs prediction in the current block, it can perform similar to inter prediction in that it retrieves the reference block in the current block. Thus, the IBC may use at least one of the inter-prediction technologies described in the present disclosure.

[88] Модуль 331 внутреннего прогнозирования может прогнозировать текущий блок посредством ссылки на выборки в текущем кадре. Выборки для ссылки могут быть расположены в соседнем узле или с разнесением от текущего блока согласно режиму прогнозирования. При внутреннем прогнозировании, режимы прогнозирования могут включать в себя множество ненаправленных режимов и множество направленных режимов. Модуль 331 внутреннего прогнозирования может определять режим прогнозирования, применяемый к текущему блоку, посредством использования режима прогнозирования, применяемого к соседнему блоку.[88] The intra prediction module 331 may predict the current block by reference to the samples in the current frame. Samples for the link can be located in an adjacent node or spaced from the current block according to the prediction mode. In intraprediction, prediction modes may include a plurality of non-directional modes and a plurality of directed modes. The intra prediction unit 331 may determine the prediction mode applied to the current block by using the prediction mode applied to the adjacent block.

[89] Модуль 332 взаимного прогнозирования может извлекать прогнозированный блок для текущего блока на основе опорного блока (массива опорных выборок), указываемого посредством вектора движения для опорного кадра. В это время, чтобы уменьшать объем информации движения, передаваемой в режиме взаимного прогнозирования, информация движения может прогнозироваться на основе блоков, субблоков или выборок на основе корреляции информации движения между соседним блоком и текущим блоком. Информация движения может включать в себя вектор движения и индекс опорного кадра. Информация движения дополнительно может включать в себя информацию направления взаимного прогнозирования (L0-прогнозирование, L1-прогнозирование, бипрогнозирование и т.д.). В случае взаимного прогнозирования, соседний блок может включать в себя пространственный соседний блок, существующий в текущем кадре, и временной соседний блок, существующий в опорном кадре. Например, модуль 332 взаимного прогнозирования может конфигурировать список возможных вариантов информации движения на основе соседних блоков и извлекать вектор движения и/или индекс опорного кадра текущего блока на основе принимаемой информации выбора возможных вариантов. Взаимное прогнозирование может выполняться на основе различных режимов прогнозирования, и информация относительно прогнозирования может включать в себя информацию, указывающую режим взаимного прогнозирования для текущего блока.[89] The inter-prediction unit 332 may extract a predicted block for the current block based on a reference block (an array of reference samples) indicated by a motion vector for the reference frame. At this time, in order to reduce the amount of motion information transmitted in the inter-prediction mode, motion information may be predicted on a block, sub-block, or sample basis based on the correlation of motion information between a neighboring block and the current block. The motion information may include a motion vector and a reference frame index. The motion information may further include inter-prediction direction information (L0-prediction, L1-prediction, bi-prediction, etc.). In the case of inter-prediction, the neighbor block may include a spatial neighbor block existing in the current frame and a temporal neighbor block existing in the reference frame. For example, the inter-prediction module 332 may configure a motion information candidate list based on neighboring blocks and extract the motion vector and/or reference frame index of the current block based on the received candidate selection information. The inter-prediction may be performed based on various prediction modes, and the information regarding the prediction may include information indicating the inter-prediction mode for the current block.

[90] Сумматор 340 может формировать восстановленный сигнал (восстановленный кадр, восстановленный блок, массив восстановленных выборок) посредством суммирования полученного остаточного сигнала с прогнозным сигналом (прогнозированным блоком, массивом прогнозных выборок), выводимым из модуля 330 прогнозирования. Когда отсутствует остаток для целевого блока обработки, как в случае, когда режим пропуска применяется, прогнозированный блок может использоваться в качестве восстановленного блока.[90] The adder 340 can generate a reconstructed signal (reconstructed frame, reconstructed block, reconstructed sample array) by adding the resulting residual signal with a predicted signal (predicted block, predicted sample array) output from the prediction unit 330. When there is no remainder for the target processing block, as in the case when the skip mode is applied, the predicted block can be used as the reconstructed block.

[91] Сумматор 340 может называться "модулем восстановления" или "формирователем восстановленных блоков". Сформированный восстановленный сигнал может использоваться для внутреннего прогнозирования следующего целевого блока обработки в текущем блоке и, как описано ниже, может выводиться посредством фильтрации или использоваться для взаимного прогнозирования следующего кадра.[91] The adder 340 may be referred to as a “recovery module” or a “recovered block generator.” The generated reconstructed signal may be used to internally predict the next target processing block in the current block and, as described below, may be output by filtering or used to inter-predict the next frame.

[92] Между тем, в процессе декодирования кадров, может применяться преобразование сигнала яркости с масштабированием сигнала цветности (LMCS).[92] Meanwhile, in the process of decoding frames, luma conversion with chrominance scaling (LMCS) may be applied.

[93] Фильтр 350 может повышать субъективное/объективное качество видео посредством применения фильтрации к восстановленному сигналу. Например, фильтр 350 может формировать модифицированный восстановленный кадр посредством применения различных способов фильтрации к восстановленному кадру и может передавать модифицированный восстановленный кадр в запоминающем устройстве 360, в частности, в DPB запоминающего устройства 360. Различные способы фильтрации могут включать в себя, например, фильтрацию для удаления блочности, дискретизированное адаптивное смещение, адаптивный контурный фильтр, билатеральный фильтр и т.п.[93] Filter 350 may enhance the subjective/objective quality of the video by applying filtering to the reconstructed signal. For example, filter 350 may generate a modified reconstructed frame by applying various filtering techniques to the reconstructed frame and may transfer the modified reconstructed frame to storage device 360, particularly to a DPB of storage device 360. Various filtering techniques may include, for example, deletion filtering blocking, sampled adaptive offset, adaptive contour filter, bilateral filter, etc.

[94] (Модифицированный) восстановленный кадр, который сохранен в DPB запоминающего устройства 360, может использоваться в качестве опорного кадра в модуле 332 взаимного прогнозирования. Запоминающее устройство 360 может сохранять информацию движения блока в текущем кадре, из которой информация движения извлечена (или декодирована), и/или информацию движения блоков в уже восстановленном кадре. Сохраненная информация движения может передаваться в модуль 260 взаимного прогнозирования для использования в качестве информации движения соседнего блока или информации движения временного соседнего блока. Запоминающее устройство 360 может сохранять восстановленные выборки восстановленных блоков в текущем кадре и передавать их в модуль 331 внутреннего прогнозирования.[94] The (modified) reconstructed frame, which is stored in the DPB of the storage device 360, can be used as a reference frame in the inter-prediction unit 332. Storage device 360 may store block motion information in the current frame from which motion information is extracted (or decoded), and/or block motion information in an already reconstructed frame. The stored motion information may be transmitted to the inter-prediction unit 260 for use as neighbor block motion information or temporary neighbor block motion information. Storage device 360 may store reconstructed samples of reconstructed blocks in the current frame and transmit them to intra prediction module 331.

[95] В этом подробном описании, примеры, описанные в модуле 330 прогнозирования, деквантователе 321, обратном преобразователе 322 и фильтре 350 аппаратуры 300 декодирования, могут аналогично или соответственно применяться к модулю 220 прогнозирования, деквантователю 234, обратному преобразователю 235 и фильтру 260 аппаратуры 200 кодирования, соответственно.[95] In this detailed description, the examples described in prediction module 330, dequantizer 321, inverse converter 322, and filter 350 of decoding apparatus 300 may be similarly or correspondingly applied to prediction module 220, dequantizer 234, inverse converter 235, and filter 260 of decoding apparatus 200. coding, respectively.

[96] Как описано выше, прогнозирование выполняется для того, чтобы повышать эффективность сжатия при выполнении кодирования видео. За счет этого, может формироваться прогнозированный блок, включающий в себя прогнозные выборки для текущего блока, который представляет собой целевой блок кодирования. Здесь, прогнозированный блок включает в себя прогнозные выборки в пространственной области (или пиксельной области). Прогнозированный блок может идентично извлекаться в аппаратуре кодирования и аппаратуре декодирования, и аппаратура кодирования может повышать эффективность кодирования изображений посредством передачи в служебных сигналах в аппаратуру декодирования не исходного выборочного значения самого исходного блока, а информации относительно остатка (остаточной информации) между исходным блоком и прогнозированным блоком. Аппаратура декодирования может извлекать остаточный блок, включающий в себя остаточные выборки на основе остаточной информации, формировать восстановленный блок, включающий в себя восстановленные выборки, посредством суммирования остаточного блока с прогнозированным блоком, и формировать восстановленный кадр, включающий в себя восстановленные блоки.[96] As described above, prediction is performed in order to improve compression efficiency when performing video encoding. Due to this, a predicted block can be generated including predictive samples for the current block, which is the target encoding block. Here, the predicted block includes predictive samples in a spatial domain (or pixel domain). The predicted block can be identically retrieved in the encoding equipment and the decoding equipment, and the encoding equipment can improve the efficiency of image encoding by signaling to the decoding equipment not the original sample value of the original block itself, but information regarding the remainder (residual information) between the original block and the predicted block . The decoding apparatus may extract a residual block including residual samples based on the residual information, generate a reconstructed block including the reconstructed samples by adding the residual block with the predicted block, and generate a reconstructed frame including the reconstructed blocks.

[97] Остаточная информация может формироваться через процедуры преобразования и квантования. Например, аппаратура кодирования может извлекать остаточный блок между исходным блоком и прогнозированным блоком, извлекать коэффициенты преобразования посредством выполнения процедуры преобразования для остаточных выборок (массива остаточных выборок), включенных в остаточный блок, и извлекать квантованные коэффициенты преобразования посредством выполнения процедуры квантования для коэффициентов преобразования, так что оно может передавать в служебных сигналах ассоциированную остаточную информацию в аппаратуру декодирования (через поток битов). Здесь, остаточная информация может включать в себя информацию значений, информацию позиции, технологию преобразования, ядро преобразования, параметр квантования и т.п. квантованных коэффициентов преобразования. Аппаратура декодирования может выполнять процедуру квантования/деквантования и извлекать остаточные выборки (или блок остаточных выборок), на основе остаточной информации. Аппаратура декодирования может формировать восстановленный блок на основе прогнозированного блока и остаточного блока. Аппаратура кодирования может извлекать остаточный блок посредством деквантования/обратного преобразования квантованных коэффициентов преобразования для ссылки для взаимного прогнозирования следующего кадра и может формировать восстановленный кадр на его основе.[97] Residual information can be generated through transformation and quantization procedures. For example, the encoding apparatus may extract a residual block between an original block and a predicted block, extract transform coefficients by performing a transform procedure on the residual samples (an array of residual samples) included in the residual block, and extract quantized transform coefficients by performing a quantization procedure on the transform coefficients, such as that it can signal associated residual information to decoding equipment (via a bit stream). Here, the residual information may include value information, position information, conversion technology, conversion kernel, quantization parameter, and the like. quantized conversion coefficients. The decoding apparatus may perform a quantization/dequantization procedure and extract residual samples (or a block of residual samples) based on the residual information. The decoding apparatus may generate a reconstructed block based on the predicted block and the residual block. The encoding apparatus may extract the residual block by dequantizing/de-converting the quantized transform coefficients for the next frame inter-prediction reference, and may generate a reconstructed frame based on it.

[98] Фиг. 4 схематично иллюстрирует технологию множественного преобразования согласно варианту осуществления настоящего раскрытия сущности.[98] FIG. 4 schematically illustrates a multiple conversion technology according to an embodiment of the present disclosure.

[99] Ссылаясь на фиг. 4, преобразователь может соответствовать преобразователю в аппаратуре кодирования вышеприведенного фиг. 2, и обратный преобразователь может соответствовать обратному преобразователю в аппаратуре кодирования вышеприведенного фиг. 2 либо обратному преобразователю в аппаратуре декодирования по фиг. 3.[99] Referring to FIG. 4, the converter may correspond to the converter in the encoding apparatus of FIG. 2, and the inverse converter may correspond to the inverse converter in the encoding apparatus of the above FIG. 2 or the inverse converter in the decoding equipment of FIG. 3.

[100] Преобразователь может извлекать коэффициенты (первичного) преобразования посредством выполнения первичного преобразования на основе остаточных выборок (массива остаточных выборок) в остаточном блоке (S410). Это первичное преобразование может называться "базовым преобразованием". В данном документе, первичное преобразование может быть основано на множественном выборе преобразования (MTS), и когда множественное преобразование применяется в качестве первичного преобразования, оно может называться "многоядерным преобразованием".[100] The converter can extract (primary) transform coefficients by performing a primary transform based on the residual samples (residual sample array) in the residual block (S410). This primary transformation may be called the "base transformation". Herein, the primary transform may be based on multiple transform selection (MTS), and when the multiple transform is applied as the primary transform, it may be referred to as a "multi-core transform".

[101] Многоядерное преобразование может представлять способ преобразования дополнительно с использованием дискретного косинусного преобразования (DCT) тип 2 и дискретного синусного преобразования (DST) тип 7, DCT типа 8 и/или DST типа 1. Таким образом, многоядерное преобразование может представлять способ преобразования для преобразования остаточного сигнала (или остаточного блока) пространственной области в коэффициенты преобразования (или коэффициенты первичного преобразования) частотной области на основе множества ядер преобразования, выбранных из числа DCT типа 2, DST типа 7, DCT типа 8 и DST типа 1. В данном документе, коэффициенты первичного преобразования могут называться "временными коэффициентами преобразования" с точки зрения преобразователя.[101] The multi-core transform may represent a transform method further using discrete cosine transform (DCT) type 2 and discrete sine transform (DST) type 7, DCT type 8 and/or DST type 1. Thus, the multi-core transform may represent a transform method for converting the spatial domain residual signal (or residual block) into frequency domain transform coefficients (or primary transform coefficients) based on a plurality of transform kernels selected from DCT Type 2, DST Type 7, DCT Type 8, and DST Type 1. Herein, the primary conversion coefficients may be called "temporary conversion coefficients" from the point of view of the converter.

[102] Таким образом, когда традиционный способ преобразования применяется, коэффициенты преобразования могут формироваться посредством применения преобразования из пространственной области в частотную область к остаточному сигналу (или остаточному блоку) на основе DCT типа 2. Тем не менее, когда многоядерное преобразование применяется, коэффициенты преобразования (или коэффициенты первичного преобразования) могут формироваться посредством применения преобразования из пространственной области в частотную область к остаточному сигналу (или остаточному блоку) на основе DCT типа 2, DST типа 7, DCT типа 8 и/или DST типа 1. Здесь, DCT тип 2, DST тип 7, DCT тип 8 и DST тип 1 могут называться "типами преобразования", "ядрами преобразования" (transform kernels или transform cores). Эти DCT/DST типы могут задаваться на основе базисных функций.[102] Thus, when the traditional conversion method is applied, transform coefficients can be generated by applying a spatial domain to frequency domain transform to a residual signal (or residual block) based on DCT type 2. However, when multi-core transform is applied, the transform coefficients (or primary transform coefficients) may be generated by applying a spatial domain to frequency domain transform to a residual signal (or residual block) based on DCT type 2, DST type 7, DCT type 8 and/or DST type 1. Here, DCT type 2 , DST type 7, DCT type 8 and DST type 1 may be called "transformation types", "transform kernels" (transform kernels or transform cores). These DCT/DST types can be specified based on basis functions.

[103] Если множественное базовое преобразование выполняется, то ядро вертикального преобразования и ядро горизонтального преобразования для целевого блока могут выбираться из числа ядер преобразования, вертикальное преобразование для целевого блока может выполняться на основе ядра вертикального преобразования, и горизонтальное преобразование для целевого блока может выполняться на основе ядра горизонтального преобразования. Здесь, горизонтальное преобразование может представлять преобразование для горизонтальных компонентов целевого блока, и вертикальное преобразование может представлять преобразование для вертикальных компонентов целевого блока. Ядро вертикального преобразования/ядро горизонтального преобразования может адаптивно определяться на основе режима прогнозирования и/или индекса преобразования целевого блока (CU или субблока), включающего в себя остаточный блок.[103] If a multiple base transform is performed, a vertical transform kernel and a horizontal transform kernel for the target block may be selected from among the transform kernels, a vertical transform for the target block may be performed based on the vertical transform kernel, and a horizontal transform for the target block may be performed based on horizontal transformation kernels. Here, a horizontal transform may represent a transform for the horizontal components of the target block, and a vertical transform may represent a transform for the vertical components of the target block. The vertical transform kernel/horizontal transform kernel may be adaptively determined based on the prediction mode and/or transform index of the target block (CU or subblock) including the residual block.

[104] Дополнительно, согласно примеру, если первичное преобразование выполняется посредством применения MTS, взаимосвязь преобразования для ядер преобразования может задаваться посредством задания конкретных базисных функций равными предварительно определенным значениям и комбинирования базисных функций, которые должны применяться при вертикальном преобразовании или горизонтальном преобразовании. Например, когда ядро горизонтального преобразования выражается как trTypeHor, и ядро преобразования вертикального направления выражается как trTypeVer, значение trTypeHor или trTypeVer в 0 может задаваться для DCT2, значение trTypeHor или trTypeVer в 1 может задаваться для DST7, и значение trTypeHor или trTypeVer в 2 может задаваться для DCT8.[104] Additionally, according to the example, if the primary transformation is performed by applying the MTS, the transformation relationship for the transformation kernels can be specified by setting specific basis functions to predetermined values and combining the basis functions to be applied in the vertical transformation or horizontal transformation. For example, when the horizontal transformation kernel is expressed as trTypeHor and the vertical direction transformation kernel is expressed as trTypeVer, a trTypeHor or trTypeVer value of 0 may be specified for DCT2, a trTypeHor or trTypeVer value of 1 may be specified for DST7, and a trTypeHor or trTypeVer value of 2 may be specified for DCT8.

[105] В этом случае, информация MTS-индекса может кодироваться и передаваться в служебных сигналах в аппаратуру декодирования, чтобы указывать любой из множества наборов ядер преобразования. Например, MTS-индекс в 0 может указывать то, что значения trTypeHor и trTypeVer равны 0, MTS-индекс в 1 может указывать то, что значения trTypeHor и trTypeVer равны 1, MTS-индекс в 2 может указывать то, что значение trTypeHor равно 2, и значение trTypeVer равно 1, MTS-индекс 3 может указывать то, что значение trTypeHor равно 1, и значение trTypeVer равно 2, и MTS-индекс 4 может указывать то, что оба значения trTypeHor и trTypeVer равны 2.[105] In this case, the MTS index information may be encoded and signaled to decoding equipment to indicate any of a plurality of sets of transform cores. For example, an MTS index of 0 may indicate that trTypeHor and trTypeVer are equal to 0, an MTS index of 1 may indicate that trTypeHor and trTypeVer are equal to 1, an MTS index of 2 may indicate that trTypeHor is equal to 2 , and the value of trTypeVer is 1, an MTS index of 3 may indicate that the value of trTypeHor is 1 and the value of trTypeVer is 2, and an MTS index of 4 may indicate that both the values of trTypeHor and trTypeVer are 2.

[106] В одном примере, наборы ядер преобразования согласно информации MTS-индекса проиллюстрированы в следующей таблице.[106] In one example, sets of transformation kernels according to MTS index information are illustrated in the following table.

[107] Табл. 1[107] Tab. 1

[108] В другом примере, trTypeHor и trTypeVer согласно информации MTS-индекса (mts_idx[x][y]) и режиму прогнозирования (CuPredMode[x][y]) для текущего блока (например, текущего блока кодирования) проиллюстрированы следующим образом.[108] In another example, trTypeHor and trTypeVer according to the MTS index information (mts_idx[x][y]) and prediction mode (CuPredMode[x][y]) for the current block (eg, the current encoding block) are illustrated as follows.

[109] Табл. 2[109] Tab. 2

[110] Преобразователь может извлекать модифицированные коэффициенты (вторичного) преобразования посредством выполнения вторичного преобразования на основе коэффициентов (первичного) преобразования (S420). Первичное преобразование представляет собой преобразование из пространственной области в частотную область, и вторичное преобразование означает преобразование в более сжимающее выражение посредством использования корреляции, существующей между коэффициентами (первичного) преобразования. Вторичное преобразование может включать в себя неразделимое преобразование. В этом случае, вторичное преобразование может называться "неразделимым вторичным преобразованием (NSST)" или "зависимым от режима неразделимым вторичным преобразованием (MDNSST)". Неразделимое вторичное преобразование может представлять преобразование, которое формирует модифицированные коэффициенты преобразования (или коэффициенты вторичного преобразования) для остаточного сигнала посредством вторичного преобразования, на основе матрицы неразделимого преобразования, коэффициентов (первичного) преобразования, извлекаемых через первичное преобразование. В это время, вертикальное преобразование и горизонтальное преобразование могут не применяться отдельно (либо горизонтальное и вертикальное преобразования могут не применяться независимо) к коэффициентам (первичного) преобразования, но преобразования могут применяться сразу на основе матрицы неразделимого преобразования. Другими словами, неразделимое вторичное преобразование может представлять способ преобразования, в котором вертикальный и горизонтальный компоненты коэффициентов (первичного) преобразования не разделяются, и, например, двумерные сигналы (коэффициенты преобразования) перекомпонуются в одномерный сигнал через конкретное определенное направление (например, направление сначала по строкам или направление сначала по столбцам), и затем модифицированные коэффициенты преобразования (или коэффициенты вторичного преобразования) формируются на основе матрицы неразделимого преобразования. Например, согласно порядку сначала по строкам, блоки MxN располагаются в линию в порядке "первая строка, вторая строка, ..., и N-ая строка". Согласно порядку сначала по столбцам, блоки MxN располагаются в линию в порядке "первый столбец, второй столбец, ..., и N-ый столбец". Неразделимое вторичное преобразование может применяться к левой верхней области блока, сконфигурированного с коэффициентами (первичного) преобразования (в дальнейшем в этом документе, может называться "блоком коэффициентов преобразования"). Например, если ширина (W) и высота (H) блока коэффициентов преобразования равны или больше 8, неразделимое вторичное преобразование 8×8 может применяться к левой верхней области 8×8 блока коэффициентов преобразования. Дополнительно, если ширина (W) и высота (H) блока коэффициентов преобразования равны или больше 4, и ширина (W) или высота (H) блока коэффициентов преобразования меньше 8, то неразделимое вторичное преобразование 4×4 может применяться к левой верхней области min(8, W) x min(8, H) блока коэффициентов преобразования. Тем не менее, вариант осуществления не ограничен, этим и, например, даже если только такое условие, что ширина (W) или высота (H) блока коэффициентов преобразования равна или выше 4, удовлетворяется, неразделимое вторичное преобразование 4×4 может применяться к левой верхней области min(8, W) x min(8, H) блока коэффициентов преобразования.[110] The converter can extract modified (secondary) conversion coefficients by performing secondary conversion based on the (primary) conversion coefficients (S420). The primary transform is a conversion from the spatial domain to the frequency domain, and the secondary transform is a conversion to a more compressive expression by exploiting the correlation existing between the (primary) transform coefficients. The secondary transformation may include an inseparable transformation. In this case, the secondary transform may be called a "non-separable secondary transform (NSST)" or a "mode-dependent non-separable secondary transform (MDNSST)". The inseparable secondary transform may be a transform that generates modified transform coefficients (or secondary transform coefficients) for the residual signal by a secondary transform, based on the inseparable transform matrix of the (primary) transform coefficients extracted through the primary transform. At this time, the vertical transform and horizontal transform may not be applied separately (or the horizontal and vertical transforms may not be applied independently) to the (primary) transform coefficients, but the transforms may be applied immediately based on the inseparable transform matrix. In other words, an inseparable secondary transform may represent a transform method in which the vertical and horizontal components of the (primary) transform coefficients are not separated, and, for example, the two-dimensional signals (transform coefficients) are recomposed into a one-dimensional signal through a particular defined direction (for example, the row-first direction or column-first direction), and then modified transform coefficients (or secondary transform coefficients) are generated based on the inseparable transform matrix. For example, according to row first order, MxN blocks are arranged in a line in the order "first row, second row, ..., and Nth row". According to column first order, MxN blocks are arranged in a line in the order "first column, second column, ..., and Nth column". An inseparable secondary transform may be applied to the upper left region of a block configured with (primary) transform coefficients (hereinafter in this document, may be referred to as a “transform coefficient block”). For example, if the width (W) and height (H) of the transform coefficient block are equal to or greater than 8, an inseparable secondary 8×8 transform may be applied to the upper left 8×8 region of the transform coefficient block. Additionally, if the width (W) and height (H) of the transform coefficient block are equal to or greater than 4, and the width (W) or height (H) of the transform coefficient block is less than 8, then an inseparable 4x4 secondary transform can be applied to the left upper region min (8, W) x min(8, H) block of transformation coefficients. However, the embodiment is not limited to this and, for example, even if only the condition that the width (W) or height (H) of the transform coefficient block is equal to or greater than 4 is satisfied, the inseparable 4x4 secondary transform can be applied to the left upper area min(8, W) x min(8, H) of the block of transformation coefficients.

[111] Преобразователь может выполнять неразделимое вторичное преобразование на основе выбранных ядер преобразования и может получать модифицированные коэффициенты (вторичного) преобразования. Как описано выше, модифицированные коэффициенты преобразования могут извлекаться в качестве коэффициентов преобразования, квантованных через квантователь, и могут кодироваться и передаваться в служебных сигналах в аппаратуру декодирования и передаваться в деквантователь/обратный преобразователь в аппаратуре кодирования.[111] The converter may perform an inseparable secondary transform based on the selected transform kernels and may obtain modified (secondary) transform coefficients. As described above, the modified transform coefficients may be extracted as transform coefficients quantized through a quantizer, and may be encoded and signaled to the decoding apparatus and transmitted to a dequantizer/inverse converter in the encoding apparatus.

[112] Между тем, как описано выше, если вторичное преобразование опускается, коэффициенты (первичного) преобразования, которые представляют собой вывод первичного (разделимого) преобразования, могут извлекаться в качестве коэффициентов преобразования, квантованных через квантователь, как описано выше, и могут кодироваться и передаваться в служебных сигналах в аппаратуру декодирования и передаваться в деквантователь/обратный преобразователь в аппаратуре кодирования.[112] Meanwhile, as described above, if the secondary transform is omitted, the (primary) transform coefficients that represent the output of the primary (separable) transform can be extracted as transform coefficients quantized through a quantizer as described above, and can be encoded and transmitted in service signals to the decoding equipment and transmitted to the dequantizer/inverse converter in the encoding equipment.

[113] Обратный преобразователь может выполнять последовательность процедур в обратном порядке по отношению к порядку, в котором они выполнены в вышеописанном преобразователе. Обратный преобразователь может принимать (деквантованные) коэффициенты преобразования и извлекать коэффициенты (первичного) преобразования посредством выполнения вторичного (обратного) преобразования (S450) и может получать остаточный блок (остаточные выборки) посредством выполнения первичного (обратного) преобразования для коэффициентов (первичного) преобразования (S460). В этой связи, коэффициенты первичного преобразования могут называться "модифицированными коэффициентами преобразования" с точки зрения обратного преобразователя. Как описано выше, аппаратура кодирования и аппаратура декодирования могут формировать восстановленный блок на основе остаточного блока и прогнозированного блока и могут формировать восстановленное изображение на основе восстановленного блока.[113] The inverse converter may perform a sequence of procedures in the reverse order of the order in which they are performed in the above-described converter. The inverse converter can receive (dequantized) transform coefficients and extract the (primary) transform coefficients by performing a secondary (inverse) transform (S450), and can obtain a residual block (residual samples) by performing a primary (inverse) transform on the (primary) transform coefficients (S460 ). In this regard, the primary conversion coefficients may be referred to as "modified conversion coefficients" from the point of view of the inverse converter. As described above, the encoding equipment and decoding equipment can generate a reconstructed block based on the residual block and the predicted block, and can generate a reconstructed image based on the reconstructed block.

[114] Аппаратура декодирования дополнительно может включать в себя модуль определения применения вторичного обратного преобразования (либо элемент для того, чтобы определять то, следует или нет применять вторичное обратное преобразование) и модуль определения вторичного обратного преобразования (либо элемент для того, чтобы определять вторичное обратное преобразование). Модуль определения применения вторичного обратного преобразования может определять то, следует или нет применять вторичное обратное преобразование. Например, вторичное обратное преобразование может представлять собой NSST или RST, и модуль определения применения вторичного обратного преобразования может определять то, следует или нет применять вторичное обратное преобразование, на основе флага вторичного преобразования, полученного посредством синтаксического анализа потока битов. В другом примере, модуль определения применения вторичного обратного преобразования может определять то, следует или нет применять вторичное обратное преобразование, на основе коэффициента преобразования остаточного блока.[114] The decoding apparatus may further include a secondary inverse transform application determining unit (or an element for determining whether or not a secondary inverse transform should be applied) and a secondary inverse transform determining unit (or an element for determining whether the secondary inverse transform is applied). transformation). The secondary inverse transform application determination module may determine whether or not to apply the secondary inverse transform. For example, the secondary inverse transform may be NSST or RST, and the secondary inverse transform application determination module may determine whether or not to apply the secondary inverse transform based on the secondary transform flag obtained by parsing the bitstream. In another example, the secondary inverse transform application determining unit may determine whether or not to apply the secondary inverse transform based on the transform coefficient of the residual block.

[115] Модуль определения вторичного обратного преобразования может определять вторичное обратное преобразование. В этом случае, модуль определения вторичного обратного преобразования может определять вторичное обратное преобразование, применяемое к текущему блоку, на основе набора для NSST-(или RST-)преобразования, указываемого согласно режиму внутреннего прогнозирования. В варианте осуществления, способ определения вторичного преобразования может определяться в зависимости от способа определения первичного преобразования. Различные комбинации первичных преобразований и вторичных преобразований могут определяться согласно режиму внутреннего прогнозирования. Дополнительно, в примере, модуль определения вторичного обратного преобразования может определять область, к которой применяется вторичное обратное преобразование, на основе размера текущего блока.[115] The secondary inverse transform determination module may determine the secondary inverse transform. In this case, the secondary inverse transform determining unit may determine the secondary inverse transform applied to the current block based on the set for the NSST (or RST) transform specified according to the intra prediction mode. In an embodiment, the method for determining the secondary transformation may be determined depending on the method for determining the primary transformation. Various combinations of primary transformations and secondary transformations may be determined according to the internal prediction mode. Additionally, in the example, the secondary inverse transform determination module may determine the region to which the secondary inverse transform is applied based on the size of the current block.

[116] Между тем, как описано выше, если вторичное (обратное) преобразование опускается, (деквантованные) коэффициенты преобразования могут приниматься, первичное (разделимое) обратное преобразование может выполняться, и остаточный блок (остаточные выборки) может получаться. Как описано выше, аппаратура кодирования и аппаратура декодирования могут формировать восстановленный блок на основе остаточного блока и прогнозированного блока и могут формировать восстановленное изображение на основе восстановленного блока.[116] Meanwhile, as described above, if the secondary (inverse) transform is omitted, the (dequantized) transform coefficients can be received, the primary (separable) inverse transform can be performed, and the residual block (residual samples) can be obtained. As described above, the encoding equipment and decoding equipment can generate a reconstructed block based on the residual block and the predicted block, and can generate a reconstructed image based on the reconstructed block.

[117] Между тем, в настоящем раскрытии сущности, сокращенное вторичное преобразование (RST), в котором размер матрицы (ядра) преобразования уменьшается, может применяться в понятии NSST, чтобы уменьшать объем вычислений и запоминающее устройство, требуемое для неразделимого вторичного преобразования.[117] Meanwhile, in the present disclosure, reduced secondary transform (RST), in which the size of the transformation matrix (kernel) is reduced, can be applied in the concept of NSST to reduce the amount of computation and storage required for the non-separable secondary transform.

[118] Между тем, ядро преобразования, матрица преобразования и коэффициент, составляющий матрицу ядер преобразования, т.е. коэффициент ядра или коэффициент матрицы, описанный в настоящем раскрытии сущности, могут выражаться в 8 битах. Это может представлять собой условие для реализации в аппаратуре декодирования и аппаратуре кодирования и позволяет уменьшать объем запоминающего устройства, требуемый для того, чтобы сохранять ядро преобразования, с ухудшением производительности, которое может приспосабливаться в достаточной степени по сравнению с существующими 9 битами или 10 битами. Помимо этого, выражение матрицы ядер в 8 битах может обеспечивать возможность использования небольшого умножителя и может быть более подходящим для инструкций с одним потоком инструкций и несколькими потоками данных (SIMD), используемых для оптимальной программной реализации.[118] Meanwhile, the transformation kernel, the transformation matrix and the coefficient constituting the transformation kernel matrix, i.e. the kernel coefficient or matrix coefficient described in the present disclosure may be expressed in 8 bits. This may be a condition for implementation in decoding apparatus and encoding apparatus, and allows the storage space required to store the conversion kernel to be reduced, with a performance penalty that can be accommodated sufficiently compared to the existing 9 bits or 10 bits. In addition, expressing the kernel matrix in 8 bits can enable the use of a small multiplier and may be more suitable for single instruction multiple data (SIMD) instructions used for optimal software implementation.

[119] В настоящем описании изобретения, термин "RST" может означать преобразование, которое выполняется для остаточных выборок для целевого блока на основе матрицы преобразования, размер которой сокращается согласно сокращенному коэффициенту. В случае выполнения сокращенного преобразования, объем вычислений, требуемый для преобразования, может уменьшаться вследствие уменьшения размера матрицы преобразования. Таким образом, RST может использоваться для того, чтобы разрешать проблему вычислительной сложности, возникающую при неразделимом преобразовании или преобразовании блока большого размера.[119] As used herein, the term "RST" may mean a transformation that is performed on the residual samples for a target block based on a transformation matrix whose size is reduced according to a reduction factor. When performing a reduced transformation, the amount of computation required for the transformation may be reduced due to the reduction in the size of the transformation matrix. Thus, RST can be used to solve the problem of computational complexity encountered in non-separable transformation or large block size transformation.

[120] RST может называться с помощью различных терминов, таких как "сокращенное преобразование", "сокращенное вторичное преобразование", "преобразование с сокращением", "упрощенное преобразование", "простое преобразование" и т.п., и название, с помощью которого может называться RST, не ограничено перечисленными примерами. Альтернативно, поскольку RST главным образом выполняется в низкочастотной области, включающей в себя ненулевой коэффициент в блоке преобразования, оно может называться "низкочастотным неразделимым преобразованием (LFNST)".[120] RST may be referred to by various terms such as "reduced transform", "reduced secondary transform", "reduced transform", "simplified transform", "simple transform", etc., and named by which may be called RST, is not limited to the examples listed. Alternatively, since RST is primarily performed in the low frequency region including a non-zero coefficient in the transform block, it may be referred to as "low frequency non-separable transform (LFNST)".

[121] Между тем, когда вторичное обратное преобразование выполняется на основе RST, обратный преобразователь 235 аппаратуры 200 кодирования и обратный преобразователь 322 аппаратуры 300 декодирования могут включать в себя обратный сокращенный вторичный преобразователь, который извлекает модифицированные коэффициенты преобразования на основе обратного RST коэффициентов преобразования, и обратный первичный преобразователь, который извлекает остаточные выборки для целевого блока на основе обратного первичного преобразования модифицированных коэффициентов преобразования. Обратное первичное преобразование означает обратное преобразование первичного преобразования, применяемого к остатку. В настоящем раскрытии сущности, извлечение коэффициента преобразования на основе преобразования может означать извлечение коэффициента преобразования посредством применения преобразования.[121] Meanwhile, when the secondary inverse transform is performed based on the RST, the inverse transformer 235 of the encoding apparatus 200 and the inverse transformer 322 of the decoding apparatus 300 may include an inverse shortened secondary transformer that extracts modified transform coefficients based on the inverse RST transform coefficients, and an inverse primary transformer that extracts residual samples for the target block based on the inverse primary transform of the modified transform coefficients. Reverse the primary transformation means the inverse transformation of the primary transformation applied to the remainder. In the present disclosure, extracting a transform coefficient based on a transform may mean extracting a transform coefficient by applying a transform.

[122] В дальнейшем в этом документе, описывается множественный выбор (или набор) для сокращенного адаптивного (или явного) преобразования (RMTS).[122] Later in this document, multiple selection (or set) for reduced adaptive (or explicit) transform (RMTS) is described.

[123] Как описано выше, когда комбинации множества преобразований (DCT2, DST7, DCT8, DST1, DCT5 и т.п.) во множественном наборе для преобразования (явное множественное преобразование или адаптивное множественное преобразование) избирательно используются для первичного преобразования, преобразование может применяться только к предварительно заданной области, чтобы уменьшать сложность, вместо выполнения преобразования во всех случаях, за счет этого значительно уменьшая сложность в худшем случае.[123] As described above, when combinations of multiple transforms (DCT2, DST7, DCT8, DST1, DCT5, etc.) in a multiple transform set (explicit multiple transform or adaptive multiple transform) are selectively used for the primary transform, the transform can be applied only to a predefined region to reduce complexity, rather than performing the transformation in all cases, thereby significantly reducing worst-case complexity.

[124] Например, когда первичное преобразование применяется к пиксельному блоку MxM на основе вышеприведенного способа сокращенного преобразования (RT), только вычисление для блока преобразования RxR (М>=R) может выполняться вместо получения блока преобразования MxM. Как результат, значимые коэффициенты (ненулевые коэффициенты) существуют только в области RxR, и коэффициенты, существующие в другой области, могут рассматриваться как нули без вычисления. Следующая таблица иллюстрирует три примера сокращенного адаптивного множественного преобразования (RAMT) с использованием коэффициента (R) сокращенного преобразования, предварительно заданного согласно размеру блока, к которому применяется первичное преобразование.[124] For example, when the primary transform is applied to an MxM pixel block based on the above reduced transform (RT) method, only the calculation for the RxR (M>=R) transform block may be performed instead of obtaining the MxM transform block. As a result, significant coefficients (non-zero coefficients) exist only in the RxR region, and coefficients existing in another region can be treated as zeros without calculation. The following table illustrates three examples of reduced adaptive multiple transform (RAMT) using the reduced transform coefficient (R) preset according to the block size to which the primary transform is applied.

[125] Табл. 3[125] Tab. 3

Размер преобразованияConversion size Сокращенное преобразование 1Short conversion 1 Сокращенное преобразование 2Shortcut conversion 2 Сокращенное преобразование 3Shortcut Conversion 3 8×88x8 4×44x4 6×66x6 6×66x6 16×1616×16 8×88x8 12×1212x12 8×88x8 32×3232×32 16×1616×16 16×1616×16 16×1616×16 64×6464x64 32×3232×32 16×1616×16 16×1616×16 128×128128x128 32×3232×32 16×1616×16 16×1616×16

[126] Согласно примеру, при применении сокращенных множественных преобразований, проиллюстрированных выше, коэффициент сокращенного преобразования может определяться на основе первичного преобразования. Например, когда первичное преобразование представляет собой DCT2, вычисление является простым по сравнению с другими первичными преобразованиями, и в силу этого сокращенное преобразование может не использоваться для небольшого блока, или относительно большое R-значение может использоваться для небольшого блока, за счет этого минимизируя снижение производительности кодирования. Например, различные коэффициенты сокращенного преобразования могут использоваться для DCT2 и других преобразований следующим образом.[126] According to an example, when applying the shortened multiple transforms illustrated above, the shortened transform coefficient can be determined based on the primary transform. For example, when the primary transform is DCT2, the calculation is simple compared to other primary transforms, and therefore the reduced transform may not be used for a small block, or a relatively large R-value may be used for a small block, thereby minimizing the performance penalty coding. For example, different shortened transform coefficients can be used for DCT2 and other transforms as follows.

[127] Табл. 4[127] Tab. 4

Размер преобразованияConversion size Сокращенное преобразование для DCT2Short conversion for DCT2 Сокращенное преобразование, отличное от DCT2Reduced conversion other than DCT2 8×88x8 8×88x8 4×44x4 16×1616×16 16×1616×16 8×88x8 32×3232×32 32×3232×32 16×1616×16 64×6464x64 32×3232×32 32×3232×32 128×128128x128 32×3232×32 32×3232×32

[128] Как показано в таблице 4, когда первичное преобразование представляет собой DCT2, размер преобразования не изменяется, когда размер блока, который должен преобразовываться, составляет 8×8 или 16×16, и уменьшенный размер преобразования ограничен 32×32, когда размер блока составляет 32×32 или больше.[128] As shown in Table 4, when the primary transform is DCT2, the transform size is not changed when the block size to be converted is 8×8 or 16×16, and the reduced transform size is limited to 32×32 when the block size is 32x32 or larger.

[129] Альтернативно, согласно примеру, когда значение флага, указывающее то, применяется или нет MTS, равно 0 (т.е. когда DCT2 применяется для горизонтального и вертикального направлений), только 32 коэффициента слева или сверху могут оставляться, и высокочастотные компоненты могут обнуляться, т.е. задаваться равными нулям для (горизонтального и вертикального) направлений (вариант 1 осуществления на основе обнуления).[129] Alternatively, according to the example, when the value of the flag indicating whether or not MTS is applied is 0 (ie, when DCT2 is applied to the horizontal and vertical directions), only the 32 coefficients on the left or top can be left, and the high frequency components can reset to zero, i.e. set to zero for the (horizontal and vertical) directions (zero-based embodiment 1).

[130] Например, в единице преобразования (TU) 64×64, коэффициенты преобразования оставляются только в левой верхней области 32×32, в TU 64×16, коэффициенты преобразования оставляются только в левой верхней области 32×16, и в TU 8×64, коэффициенты преобразования оставляются только в левой верхней области 8×32. Таким образом, коэффициенты преобразования существуют согласно только вплоть до максимальной длины в 32 по ширине и по высоте.[130] For example, in a transformation unit (TU) of 64×64, the transformation coefficients are left only in the upper left region of 32×32, in a TU of 64×16, the transformation coefficients are left only in the upper left region of 32×16, and in a TU of 8× 64, the transform coefficients are left only in the upper left 8x32 region. Thus, the conversion factors exist according to only up to a maximum length of 32 in width and height.

[131] Этот способ обнуления может применяться только к остаточному сигналу, к которому применяется внутреннее прогнозирование, либо может применяться только к остаточному сигналу, к которому применяется взаимное прогнозирование. Альтернативно, способ обнуления может применяться как к остаточному сигналу, к которому применяется внутреннее прогнозирование, так и к остаточному сигналу, к которому применяется взаимное прогнозирование.[131] This nulling method may be applied only to a residual signal to which intra prediction is applied, or may be applied only to a residual signal to which inter prediction is applied. Alternatively, the nulling method may be applied to both the residual signal to which the intra prediction is applied and the residual signal to which the inter prediction is applied.

[132] Изменение размера блока преобразования, который может выражаться как вышеприведенное обнуление или высокочастотное обнуление, означает процесс обнуления (определения в качестве нулей) коэффициентов преобразования, связанных с высокой частотой определенного значения или более в блоке (преобразования), имеющем первую ширину (или длину) в W1 и первую высоту (или длину) в H1. Когда высокочастотное обнуление применяется, значения коэффициентов преобразования для всех коэффициентов преобразования за пределами области низкочастотных коэффициентов преобразования, сконфигурированной на основе второй ширины в W2 и второй высоты в H2 из числа коэффициентов преобразования в блоке (преобразования), могут определяться (задаваться) в качестве нулей. Наружная часть по отношению к области низкочастотных коэффициентов преобразования может называться "областью высокочастотных коэффициентов преобразования". В примере, область низкочастотных коэффициентов преобразования может представлять собой прямоугольную область, позиционированную с левого верхнего конца блока (преобразования).[132] Changing the size of a transform block, which may be expressed as the above nulling or high-frequency nulling, means the process of nulling (defining as zeros) transform coefficients associated with a high frequency of a certain value or more in a (transform) block having a first width (or length ) in W1 and the first height (or length) in H1. When high-frequency nulling is applied, transform coefficient values for all transform coefficients outside the low-frequency transform coefficient region configured based on the second width in W2 and the second height in H2 from among the transform coefficients in the (transform) block may be determined (set) as zeros. The portion external to the low-frequency conversion coefficient region may be referred to as the “high-frequency transformation coefficient region.” In an example, the low frequency transform coefficient region may be a rectangular region positioned at the upper left end of the (transform) block.

[133] Таким образом, высокочастотное обнуление может задаваться как задание всех коэффициентов преобразования в позиции, заданной посредством координаты X в N или более и координаты Y в M или более, равным нулям, при этом горизонтальное значение координаты X левой верхней позиции текущего блока преобразования (TB) задается равным 0, и вертикальное значение координаты Y этого задается равным 0 (и при этом координаты X увеличиваются слева направо, и координаты Y увеличиваются вниз).[133] Thus, high-frequency zeroing can be specified as setting all transform coefficients at the position specified by an X coordinate of N or more and a Y coordinate of M or more to zero, with the horizontal value of the X coordinate of the upper left position of the current transform block ( TB) is set to 0, and the vertical Y coordinate value of it is set to 0 (with the X coordinates increasing from left to right and the Y coordinates increasing down).

[134] При использовании в данном документе, конкретный термин или выражение используются для того, чтобы задавать конкретную информацию или понятие. Например, как описано выше, в настоящем раскрытии сущности, процесс обнуления коэффициентов преобразования, связанных с высокой частотой определенного значения или более в блоке (преобразования), имеющем первую ширину (или длину) в W1 и первую высоту (или длину) в H1, задается как "высокочастотное обнуление", область, в которой обнуление выполняется через высокочастотное обнуление, задается как "область высокочастотных коэффициентов преобразования" и область, в которой обнуление не выполняется, задается как "область низкочастотных коэффициентов преобразования". Вторая ширина (или длина) в W2 и вторая высота (длина) в H2 используются для того, чтобы выражать размер области низкочастотных коэффициентов преобразования.[134] When used herein, a specific term or expression is used to specify specific information or concept. For example, as described above, in the present disclosure, a process of zeroing transform coefficients associated with a high frequency of a certain value or more in a (transform) block having a first width (or length) in W1 and a first height (or length) in H1 is specified as "high-frequency nulling", a region in which nulling is performed through high-frequency nulling is specified as a "high-frequency conversion coefficient region" and a region in which nulling is not performed is specified as a "low-frequency transformation coefficient region". The second width (or length) in W2 and the second height (length) in H2 are used to express the size of the low frequency transform coefficient region.

[135] Тем не менее, "высокочастотное обнуление" может заменяться посредством различных терминов, таких как высокочастотное обнуление (high frequency zeroing, high frequency zeroing-out, high-frequency zeroing-out, high-frequency zero-out) и обнуление, и "область высокочастотных коэффициентов преобразования" может заменяться посредством различных терминов, таких как область применения высокочастотного обнуления, область высокочастотного обнуления, высокочастотная область, область высокочастотных коэффициентов, область высокочастотного обнуления и область обнуления, и "область низкочастотных коэффициентов преобразования" может заменяться посредством различных терминов, таких как область без применения высокочастотного обнуления, низкочастотная область, область низкочастотных коэффициентов и ограниченная область. Таким образом, конкретный термин или выражение, используемое в данном документе для того, чтобы задавать конкретную информацию или понятие, должно интерпретироваться во всем подробном описании с учетом различных операций, функций и преимуществ согласно содержанию, указываемому посредством термина, без ограничения обозначением.[135] However, "high-frequency zeroing" can be replaced by various terms such as high-frequency zeroing (high-frequency zeroing-out, high-frequency zeroing-out, high-frequency zero-out) and zeroing, and "high-frequency conversion coefficient region" may be replaced by various terms such as high-frequency nulling application area, high-frequency nulling region, high-frequency region, high-frequency coefficient region, high-frequency nulling region and nulling region, and "low-frequency conversion coefficient region" may be replaced by various terms, such as the area without high-frequency nulling, the low-frequency area, the low-frequency coefficient area, and the restricted area. Thus, a particular term or expression used herein to specify a particular information or concept is to be interpreted throughout the detailed description in light of the various operations, functions and benefits of the content indicated by the term, without limitation by designation.

[136] Альтернативно, согласно примеру, область низкочастотных коэффициентов преобразования означает оставшуюся область после того, как высокочастотное обнуление выполняется, или область, в которой значимый коэффициент преобразования остается, и может называться "областью обнуления" или "обнуляемым блоком".[136] Alternatively, according to the example, the low-frequency transform coefficient region means the remaining region after high-frequency nulling is performed, or the region in which a significant transform coefficient remains, and may be called a “nulling region” or a “nulling block.”

[137] Согласно примеру, когда значение флага, указывающее то, применяется или нет MTS, равно 1, т.е. когда другое преобразование (DST7 или DCT8), отличное от DCT2, является применимым для горизонтального направления и вертикального направления, коэффициенты преобразования могут оставляться только в левой верхней области, и оставшаяся область может обнуляться следующим образом (вариант 2 осуществления на основе обнуления).[137] According to an example, when the value of the flag indicating whether or not MTS is applied is 1, i.e. when another transformation (DST7 or DCT8) other than DCT2 is applicable for the horizontal direction and the vertical direction, the transformation coefficients can only be left in the upper left region, and the remaining region can be reset as follows (nulling-based embodiment 2).

[138] - Когда ширина (w) равна или выше 2n, только коэффициенты преобразования, соответствующие длине в w/2p слева, могут оставляться, и оставшиеся коэффициенты преобразования могут задаваться фиксированно равными нулям (обнуляться).[138] - When the width (w) is equal to or greater than 2 n , only the transform coefficients corresponding to the length in w/2 p on the left can be retained, and the remaining transform coefficients can be set fixed to zero (zeroed).

[139] - Когда высота (h) равна или выше 2m, только коэффициенты преобразования, соответствующие длине в h/2q сверху, и остающиеся коэффициентами преобразования, могут задаваться фиксированно равными нулям (обнуляться).[139] - When the height (h) is equal to or greater than 2 m , only the transformation coefficients corresponding to the length in h/2 q above and remaining transformation coefficients can be set fixed to zero (zeroed).

[140] Здесь, m, n, p и q могут быть целыми числами, равными или большими 0, и конкретно могут быть следующими:[140] Here, m, n, p and q may be integers equal to or greater than 0, and specifically may be the following:

[141] 1) (m, n, p, q)=(5, 5, 1, 1)[141] 1) (m, n, p, q)=(5, 5, 1, 1)

[142] 2) (m, n, p, q)=(4, 4, 1, 1)[142] 2) (m, n, p, q)=(4, 4, 1, 1)

[143] В конфигурации 1), коэффициенты преобразования остаются только в левой верхней области 16×16 в TU 32×16, и коэффициенты преобразования остаются только в левой верхней области 8×16 в TU 8×32.[143] In configuration 1), the transform coefficients remain only in the left upper region 16×16 in the TU 32×16, and the transform coefficients remain only in the left upper region 8×16 in the TU 8×32.

[144] Этот способ обнуления может применяться только к остаточному сигналу, к которому применяется внутреннее прогнозирование, либо может применяться только к остаточному сигналу, к которому применяется взаимное прогнозирование. Альтернативно, способ обнуления может применяться как к остаточному сигналу, к которому применяется внутреннее прогнозирование, так и к остаточному сигналу, к которому применяется взаимное прогнозирование.[144] This nulling method may be applied only to a residual signal to which intra prediction is applied, or may be applied only to a residual signal to which inter prediction is applied. Alternatively, the nulling method may be applied to both the residual signal to which the intra prediction is applied and the residual signal to which the inter prediction is applied.

[145] Альтернативно, согласно другому примеру, когда значение флага, указывающее то, применяется или нет MTS, равно 1, т.е. когда другое преобразование (DST7 или DCT8), отличное от DCT2, является применимым для горизонтального направления и вертикального направления, коэффициенты преобразования могут оставляться только в левой верхней области, и оставшаяся область может обнуляться следующим образом (вариант 3 осуществления на основе обнуления).[145] Alternatively, according to another example, when the value of the flag indicating whether or not MTS is applied is 1, i.e. when another transformation (DST7 or DCT8) other than DCT2 is applicable for the horizontal direction and the vertical direction, the transformation coefficients can only be left in the upper left region, and the remaining region can be reset as follows (nulling-based embodiment 3).

[146] - Когда высота (h) равна или выше ширины (w) и равна или выше 2n, только коэффициенты преобразования в левой верхней области wx(h/2p) могут оставляться, и оставшиеся коэффициенты преобразования могут задаваться фиксированно равными нулям (обнуляться).[146] - When height (h) is equal to or greater than width (w) and equal to or greater than 2 n , only the transform coefficients in the upper left region wx(h/2 p ) may be retained, and the remaining transform coefficients may be set fixed to zero ( reset to zero).

[147] - Когда ширина (w) превышает высоту (h) и равна или выше 2m, только коэффициенты преобразования в левой верхней области (w/2q)xh, и оставшиеся коэффициенты преобразования могут задаваться фиксированно равными нулям (обнуляться).[147] - When the width (w) exceeds the height (h) and is equal to or greater than 2 m , only the transform coefficients in the upper left region (w/2 q )xh, and the remaining transform coefficients can be set fixed to zero (zeroed).

[148] В вышеуказанных условиях, когда высота (h) и ширина (w) являются идентичными, длина по вертикали уменьшается (h/2p), но длина по горизонтали может уменьшаться (w/2q).[148] Under the above conditions, when the height (h) and width (w) are identical, the vertical length decreases (h/2 p ), but the horizontal length can decrease (w/2 q ).

[149] Здесь, m, n, p и q могут быть целыми числами, равными или большими 0, и конкретно могут быть следующими:[149] Here, m, n, p and q may be integers equal to or greater than 0, and specifically may be the following:

[150] 1) (m, n, p, q)=(4, 4, 1, 1)[150] 1) (m, n, p, q)=(4, 4, 1, 1)

[151] 2) (m, n, p, q)=(5, 5, 1, 1)[151] 2) (m, n, p, q)=(5, 5, 1, 1)

[152] В конфигурации 1), коэффициенты преобразования остаются только в левой верхней области 16×16 в TU 32×16, и коэффициенты преобразования остаются только в левой верхней области 8×8 в TU 8×16.[152] In configuration 1), the transform coefficients remain only in the left upper region 16×16 in the TU 32×16, and the transform coefficients remain only in the left upper region 8×8 in the TU 8×16.

[153] Этот способ обнуления может применяться только к остаточному сигналу, к которому применяется внутреннее прогнозирование, либо может применяться только к остаточному сигналу, к которому применяется взаимное прогнозирование. Альтернативно, способ обнуления может применяться как к остаточному сигналу, к которому применяется внутреннее прогнозирование, так и к остаточному сигналу, к которому применяется взаимное прогнозирование.[153] This nulling method may be applied only to a residual signal to which intra prediction is applied, or may be applied only to a residual signal to which inter prediction is applied. Alternatively, the nulling method may be applied to both the residual signal to which the intra prediction is applied and the residual signal to which the inter prediction is applied.

[154] В вышеприведенных вариантах осуществления, область коэффициентов преобразования ограничена в зависимости от того, в каком месте значение флага, указывающее то, применяется или нет MTS, равно 0, или в каком месте значение флага, указывающее то, применяется или нет MTS, равно 1. Согласно одному примеру, комбинации этих вариантов осуществления являются возможными.[154] In the above embodiments, the range of conversion coefficients is limited depending on where the value of the flag indicating whether or not MTS is applied is 0, or where the value of the flag indicating whether or not MTS is applied is 1. According to one example, combinations of these embodiments are possible.

[155] 1) Вариант 1 осуществления на основе обнуления + вариант 2 осуществления на основе обнуления[155] 1) Null-based embodiment 1 + Null-based embodiment 2

[156] 2) Вариант 1 осуществления на основе обнуления + вариант 3 осуществления на основе обнуления[156] 2) Null-based embodiment 1 + Null-based embodiment 3

[157] Как упомянуто в варианте 2 осуществления на основе обнуления и в варианте 3 осуществления на основе обнуления, обнуление может применяться только к остаточному сигналу, к которому применяется внутреннее прогнозирование, либо может применяться только к остаточному сигналу, к которому применяется взаимное прогнозирование. Альтернативно, способ обнуления может применяться как к остаточному сигналу, к которому применяется внутреннее прогнозирование, так и к остаточному сигналу, к которому применяется взаимное прогнозирование. Соответственно, когда MTS-флаг равен 1, следующая таблица может быть сконфигурирована (когда MTS-флаг равен 0, вариант 1 осуществления на основе обнуления может применяться).[157] As mentioned in nulling-based Embodiment 2 and nulling-based Embodiment 3, nulling may be applied only to a residual signal to which intra prediction is applied, or may be applied only to a residual signal to which inter prediction is applied. Alternatively, the nulling method may be applied to both the residual signal to which the intra prediction is applied and the residual signal to which the inter prediction is applied. Accordingly, when the MTS flag is 1, the following table can be configured (when the MTS flag is 0, the nulling-based embodiment 1 can be applied).

[158] Табл. 5[158] Tab. 5

Индекс конфигурацииConfiguration Index Остаточные сигналы внутреннего прогнозированияResidual internal prediction signals Остаточные сигналы взаимного прогнозированияResidual mutual prediction signals 11 Обнуление не применяетсяZeroing does not apply Обнуление не применяетсяZeroing does not apply 22 Обнуление не применяетсяZeroing does not apply Вариант 2 осуществления на основе обнуленияEmbodiment 2 based on zeroing 33 Обнуление не применяетсяZeroing does not apply Вариант 3 осуществления на основе обнуленияEmbodiment 3 based on zeroing 44 Вариант 2 осуществления на основе обнуленияEmbodiment 2 based on zeroing Обнуление не применяетсяZeroing does not apply 55 Вариант 2 осуществления на основе обнуленияEmbodiment 2 based on zeroing Вариант 2 осуществления на основе обнуленияEmbodiment 2 based on zeroing 66 Вариант 2 осуществления на основе обнуленияEmbodiment 2 based on zeroing Вариант 3 осуществления на основе обнуленияEmbodiment 3 based on zeroing 77 Вариант 3 осуществления на основе обнуленияEmbodiment 3 based on zeroing Обнуление не применяетсяZeroing does not apply 33 Вариант 3 осуществления на основе обнуленияEmbodiment 3 based on zeroing Вариант 2 осуществления на основе обнуленияEmbodiment 2 based on zeroing 99 Вариант 3 осуществления на основе обнуленияEmbodiment 3 based on zeroing Вариант 3 осуществления на основе обнуленияEmbodiment 3 based on zeroing

[159] В варианте 1 осуществления на основе обнуления, в варианте 2 осуществления на основе обнуления и в варианте 3 осуществления на основе обнуления, область, неизбежно включающая в себя значение в 0 в TU, четко задается. Таким образом, область, отличная от левой верхней области, в которой коэффициенту преобразования разрешается существовать, обнуляется. Соответственно, согласно варианту осуществления, может задаваться конфигурация с возможностью обходить область, в которой коэффициент преобразования определенно имеет значение 0, в результате энтропийного кодирования остаточного сигнала, вместо выполнения остаточного кодирования. Например, следующая конфигурация является возможной.[159] In the nulling-based Embodiment 1, the nulling-based Embodiment 2, and the nulling-based Embodiment 3, a region necessarily including a value of 0 in the TU is clearly defined. Thus, the region other than the upper left region in which the transform coefficient is allowed to exist is set to zero. Accordingly, according to an embodiment, it can be configured to bypass a region in which the transform coefficient is definitely set to 0 by entropy encoding the residual signal, instead of performing residual encoding. For example, the following configuration is possible.

[160] 1) В HEVC или VVC, флаг, указывающий то, существует или нет ненулевой коэффициент преобразования в одной группе коэффициентов (CG, которая может представлять собой 4×4 или 2×2 в зависимости от форм субблока и TU-блока и компонента сигнала яркости/компонент сигнала цветности), кодируется (subblock_flag). Только тогда, когда subblock_flag равен 1, внутренняя часть CG сканируется, и значения уровня коэффициентов кодируются. Соответственно, для CG, принадлежащих области, в которой обнуление выполняется, subblock_flag может задаваться равным значению 0 по умолчанию вместо кодирования.[160] 1) In HEVC or VVC, a flag indicating whether or not a non-zero transform coefficient exists in one coefficient group (CG, which may be 4x4 or 2x2 depending on the shapes of the subblock and TU block and component luminance signal/chrominance signal component), encoded (subblock_flag). Only when subblock_flag is 1 is the interior of the CG scanned and the coefficient level values are encoded. Accordingly, for CGs belonging to the region in which nulling is performed, subblock_flag may be set to a default value of 0 instead of encoding.

[161] 2) В HEVC или VVC, позиция последнего коэффициента (last_coefficient_position_x в направлении по оси X и last_coefficient_position_y в направлении по оси Y) в прямом порядке сканирования кодируется сначала. Обычно, last_coefficient_position_x и last_coefficient_position_y могут иметь максимальное значение (ширина TU-1) и максимальное значение (высота TU-1), соответственно. Тем не менее, когда область, в которой может существовать ненулевой коэффициент, ограничена вследствие обнуления, максимальные значения last_coefficient_position_x и last_coefficient_position_y также ограничены. Соответственно, максимальные значения last_coefficient_position_x и last_coefficient_position_y могут быть ограничены с учетом обнуления и затем могут кодироваться. Например, когда способ преобразования в двоичную форму, применяемый к last_coefficient_position_x, и last_coefficient_position_y, представляет собой усеченное унарное преобразование в двоичную форму, максимальная длина усеченного унарного кода (длина кодового слова, которую last_coefficient_position_x и last_coefficient_position_y могут иметь) может уменьшаться на основе отрегулированных максимальных значений.[161] 2) In HEVC or VVC, the position of the last coefficient (last_coefficient_position_x in the X-axis direction and last_coefficient_position_y in the Y-axis direction) in forward scanning order is encoded first. Typically, last_coefficient_position_x and last_coefficient_position_y can have a maximum value (TU-1 width) and a maximum value (TU-1 height), respectively. However, when the region in which a non-zero coefficient can exist is limited due to nulling, the maximum values of last_coefficient_position_x and last_coefficient_position_y are also limited. Accordingly, the maximum values of last_coefficient_position_x and last_coefficient_position_y can be limited to zero and can then be encoded. For example, when the binarization method applied to last_coefficient_position_x and last_coefficient_position_y is a truncated unary binarization, the maximum length of the truncated unary code (the codeword length that last_coefficient_position_x and last_coefficient_position_y can have) may be reduced based on the adjusted maximum values.

[162] Как описано выше, обнуление может применяться, в частности, в случае, если левая верхняя область 32×32 представляет собой область низкочастотных коэффициентов преобразования (в дальнейшем в этом документе называется "32-точечным сокращенным MTS" или "RMTS32"), в случае, если MTS-схема применяется, и в любом случае, если применяется 32-точечное DST7 или 32-точечное DCT8.[162] As described above, nulling can be applied, in particular, in the case where the left upper region 32×32 is a region of low frequency transform coefficients (hereinafter referred to as “32-point reduced MTS” or “RMTS32”), in case the MTS scheme is used, and in any case if the 32-point DST7 or 32-point DCT8 is used.

[163] Фиг. 5 иллюстрирует 32-точечное обнуление согласно примеру настоящего раскрытия сущности.[163] FIG. 5 illustrates 32-point nulling according to an example of the present disclosure.

[164] Как показано на фиг. 5, когда блок разделяется, и преобразование применяется к области A, DST7 или DCT8 могут применяться к каждой стороне, и пара преобразований, применяемая в горизонтальном и вертикальном направлениях, не ограничена примером, проиллюстрированным на фиг. 5. На фиг. 5, ширина и высота всего блока обозначаются посредством w и h, соответственно, и ширина и высота блока, к которому фактически применяется разделимое преобразование, выражаются как пара (ширина, высота), которая составляет (w1, h) или (w, h1); w1 может быть равна 1/2 или 1/4 от w, и h1 также может быть равна 1/2 или 1/4 от h.[164] As shown in FIG. 5, when a block is divided and a transform is applied to area A, DST7 or DCT8 may be applied to each side, and the pair of transforms applied in the horizontal and vertical directions is not limited to the example illustrated in FIG. 5. In FIG. 5, the width and height of the entire block are denoted by w and h, respectively, and the width and height of the block to which the separable transformation is actually applied are expressed as a pair (width, height), which is (w1, h) or (w, h1) ; w1 can be equal to 1/2 or 1/4 of w, and h1 can also be equal to 1/2 or 1/4 of h.

[165] Блок, к которому применяется преобразование, может позиционироваться слева или справа либо сверху или снизу во всем блоке, как показано на фиг. 5. Дополнительно, блок по фиг. 5 может представлять собой остаточный сигнал, сформированный посредством взаимного прогнозирования. Флаг, указывающий то, следует или нет применять преобразование только к одному субблоку остаточного сигнала, сегментированного так, как показано на фиг. 5, может передаваться в служебных сигналах, и когда флаг равен 1, флаг, указывающий то, представляет собой или нет блок 16×32 как показано на фиг. 5, также может задаваться посредством передачи служебных сигналов.[165] The block to which the transformation is applied may be positioned on the left or right, or at the top or bottom of the entire block, as shown in FIG. 5. Additionally, the block of FIG. 5 may be a residual signal generated by inter-prediction. A flag indicating whether or not the transform should be applied to only one sub-block of the residual signal segmented as shown in FIG. 5 may be signaled, and when the flag is 1, a flag indicating whether or not it is a 16×32 block as shown in FIG. 5 may also be specified by signaling.

[166] Флаг, указывающий то, позиционируется или нет блок A, к которому фактически применяется преобразование, слева или справа во всем блоке, либо флаг, указывающий то, позиционируется или нет блок A сверху или снизу, также может передаваться в служебных сигналах.[166] A flag indicating whether or not block A to which the transformation is actually applied is positioned to the left or right in the entire block, or a flag indicating whether block A is positioned above or below may also be signaled.

[167] Как проиллюстрировано на фиг. 5, когда горизонтальное преобразование и вертикальное преобразование определяются для конкретного блока, вместо обозначения горизонтального преобразования и вертикального преобразования посредством передачи служебных MTS-сигналов, если горизонтальная сторона и вертикальная сторона имеют длину в 32, RMTS32, предложенный выше, может применяться в каждом направлении. Например, когда блок вертикально сегментируется на фиг. 5, если высота блока A равна 32, обнуление может применяться в вертикальном направлении. В частности, когда блок A составляет 16×32, левый верхний блок 16×16 может обнуляться, и в силу этого значимый коэффициент может существовать только в соответствующей области размера. В RMTS32, остаточное кодирование может опускаться для области, которая обнуляется, либо только область, которая не обнуляется, может сканироваться и может подвергаться остаточному кодированию.[167] As illustrated in FIG. 5, when horizontal transform and vertical transform are determined for a particular block, instead of designating horizontal transform and vertical transform by MTS signaling, if the horizontal side and vertical side have a length of 32, RMTS32 proposed above can be applied in each direction. For example, when a block is vertically segmented in FIG. 5, if the height of block A is 32, zeroing can be applied in the vertical direction. In particular, when block A is 16x32, the top left 16x16 block may be set to zero, and therefore a significant coefficient can only exist in the corresponding size region. In RMTS32, residual coding may be omitted for the region that is being nulled, or only the region that is not nulling may be scanned and may be subject to residual coding.

[168] Фиг. 6 иллюстрирует сегмент остаточного блока согласно варианту осуществления настоящего раскрытия сущности.[168] FIG. 6 illustrates a residual block segment according to an embodiment of the present disclosure.

[169] Остаточный блок может сегментироваться, как показано на фиг. 6, и ширина и высота блока A, к которому фактически применяется преобразование, может составлять w/4 и h/4, соответственно, в связи с шириной (w) и высотой (h) исходного блока преобразования.[169] The residual block may be segmented as shown in FIG. 6, and the width and height of the block A to which the transformation is actually applied may be w/4 and h/4, respectively, due to the width (w) and height (h) of the original transformation block.

[170] В общих словах, RMTS32 может применяться к любому блоку, к которому применяется преобразование, если DST7 или DCT8, имеющее длину 32, является применимым в каждом из горизонтального направления и вертикального направления. То, DST7 или DCT8, имеющее длину в 32, применяется, может определяться посредством предварительно установленной передачи служебных сигналов или может определяться без передачи служебных сигналов согласно предварительно определенному условию кодирования.[170] In general, RMTS32 can be applied to any block to which the transform is applied if DST7 or DCT8 having a length of 32 is applicable in each of the horizontal direction and the vertical direction. Whether DST7 or DCT8 having a length of 32 is applied may be determined by predetermined signaling or may be determined without signaling according to a predetermined encoding condition.

[171] Текст спецификации, описывающий обнуление согласно вариантам осуществления по фиг. 5 и фиг. 6, проиллюстрирован в следующей таблице. В следующей таблице, преобразование может применяться к остаточному сигналу, сформированному через взаимное прогнозирование, и может называться "субблочным преобразованием (SBT)". Остаточный сигнальный блок сегментируется на два блока сегментов посредством SBT, и отдельное преобразование может применяться только к одному из сегментированных блоков.[171] Specification text describing nulling according to the embodiments of FIG. 5 and fig. 6 is illustrated in the following table. In the following table, the transform may be applied to the residual signal generated through inter-prediction, and may be called "sub-block transform (SBT)". The residual signal block is segmented into two segment blocks by SBT, and a separate transformation can be applied to only one of the segmented blocks.

[172] Табл. 6[172] Tab. 6

7.3.4.6. Синтаксис единицы кодирования7.3.4.6. Coding Unit Syntax

[173] Таблица 6 показывает синтаксис CU, к которой применяется взаимное прогнозирование, и форма сегмента, в которой применяется SBT, может определяться посредством четырех синтаксических элементов в таблице 6.[173] Table 6 shows the syntax of the CU to which inter-prediction is applied, and the segment shape to which SBT is applied can be determined by the four syntax elements in Table 6.

[174] - cu_sbt_flag указывает то, применяется или нет SBT к CU, и cu_sbt_quad_flag представляет собой информацию флага, указывающую то, составляет или нет блок, к которому применяется преобразование, 1/4 от всего блока, когда одна CU сегментируется на два блока сегментов. Когда cu_sbt_quad_flag равен 0, блок сегментов имеет размер в 1/2 от всего блока. Когда cu_sbt_quad_flag равен 1, блок сегментов имеет размер в 1/4 от ширины или высоты CU. Когда ширина CU составляет w, и ее высота составляет h, высота блока сегментов может составлять h1=(1/4) x h, или ширина блока сегментов может составлять w1=(1/4) x w.[174] - cu_sbt_flag indicates whether or not SBT is applied to a CU, and cu_sbt_quad_flag is flag information indicating whether or not the block to which the transformation is applied constitutes 1/4 of the entire block when one CU is segmented into two segment blocks . When cu_sbt_quad_flag is 0, the segment block is 1/2 the size of the entire block. When cu_sbt_quad_flag is 1, the segment block is 1/4 the size of the CU width or height. When the width of the CU is w and its height is h, the height of the segment block may be h1=(1/4) x h, or the width of the segment block may be w1=(1/4) x w.

[175] - cu_sbt_horizontal_flag, равный 1, указывает то, что CU горизонтально сегментируется, и cu_sbt_horizontal_flag, равный 0, указывает то, что CU вертикально сегментируется.[175] - cu_sbt_horizontal_flag equal to 1 indicates that the CU is horizontally segmented, and cu_sbt_horizontal_flag equal to 0 indicates that the CU is vertically segmented.

[176] Относительно cu_sbt_pos_flag, значение флага, равное 0, указывает то, что преобразование применяется к верхнему или левому блоку сегментов в горизонтальном или вертикальном сегменте, и значение флага, равное 1, указывает то, что преобразование применяется к нижнему или правому блоку сегментов.[176] With respect to cu_sbt_pos_flag, a flag value of 0 indicates that the transformation is applied to the top or left block of segments in a horizontal or vertical segment, and a flag value of 1 indicates that the transformation is applied to the bottom or right block of segments.

[177] Следующая таблица иллюстрирует trTypeHor и trTypeVer согласно cu_sbt_horizontal_flag и cu_sbt_pos_flag.[177] The following table illustrates trTypeHor and trTypeVer according to cu_sbt_horizontal_flag and cu_sbt_pos_flag.

[178] Табл. 7[178] Tab. 7

[179] Как описано выше, когда ядро горизонтального преобразования обозначается посредством trTypeHor, и ядро вертикального преобразования обозначается посредством trTypeVer, значение trTypeHor или trTypeVer в 0 может задаваться для DCT2, значение trTypeHor или trTypeVer в 1 может задаваться для DST7, и значение trTypeHor или trTypeVer в 2 может задаваться для DCT8. Соответственно, когда длина, по меньшей мере, одной стороны блока сегментов, к которому применяется преобразование, равна 64 или больше, DCT2 может применяться как в горизонтальном направлении, так и в вертикальном направлении, и в противном случае, DST7 или DCT8 может применяться.[179] As described above, when the horizontal transform kernel is designated by trTypeHor and the vertical transform kernel is designated by trTypeVer, a trTypeHor or trTypeVer value of 0 may be set to DCT2, a trTypeHor or trTypeVer value to 1 may be set to DST7, and a trTypeHor or trTypeVer value may be set to 1. 2 can be set for DCT8. Accordingly, when the length of at least one side of the block of segments to which the transformation is applied is 64 or greater, DCT2 may be applied in both the horizontal direction and the vertical direction, and otherwise, DST7 or DCT8 may be applied.

[180] Табл. 8[180] Tab. 8

7.3.4.11. Синтаксис единицы преобразования7.3.4.11. Conversion unit syntax

[181] Табл. 9[181] Tab. 9

7.3.4.12. Синтаксис остаточного кодирования7.3.4.12. Residual encoding syntax

[182] Таблица 8 показывает часть TU-синтаксиса согласно примеру, и таблица 9 показывает часть синтаксиса остаточного кодирования.[182] Table 8 shows part of the TU syntax according to the example, and Table 9 shows part of the residual encoding syntax.

[183] В таблице 8, tu_mts_idx[x0][y0] обозначает MTS-индекс, применяемый к блоку преобразования, и trTypeHor и trTypeVer могут определяться согласно MTS-индексу, как показано в таблице 1.[183] In Table 8, tu_mts_idx[x0][y0] denotes the MTS index applied to the transform block, and trTypeHor and trTypeVer may be determined according to the MTS index, as shown in Table 1.

[184] Синтаксические элементы last_sig_coeff_x_prefix, last_sig_coeff_y_prefix, last_sig_coeff_x_suffix и last_sig_coeff_y_suffix в таблице 9 обозначают информацию позиции (x, y) относительно последнего ненулевого коэффициента преобразования в блоке преобразования. В частности, last_sig_coeff_x_prefix обозначает префикс позиции столбца последнего значимого коэффициента в порядке сканирования в блоке преобразования, last_sig_coeff_y_prefix обозначает префикс позиции строки последнего значимого коэффициента в порядке сканирования в блоке преобразования, last_sig_coeff_x_suffix обозначает суффикс позиции столбца последнего значимого коэффициента в порядке сканирования в блоке преобразования, и last_sig_coeff_y_suffix обозначает суффикс позиции строки последнего значимого коэффициента в порядке сканирования в блоке преобразования. Здесь, значимый коэффициент может означать ненулевой коэффициент. Порядок сканирования может представлять собой порядок сканирования вправо вверх по диагонали. Альтернативно, порядок сканирования может представлять собой горизонтальный порядок сканирования или вертикальный порядок сканирования. Порядок сканирования может определяться на основе того, применяется или нет внутреннее/взаимное прогнозирование к целевому блоку (CB или CB, включающему в себя TB), и/или конкретного режима внутреннего/взаимного прогнозирования.[184] The syntax elements last_sig_coeff_x_prefix, last_sig_coeff_y_prefix, last_sig_coeff_x_suffix and last_sig_coeff_y_suffix in Table 9 denote position information (x, y) relative to the last non-zero transform coefficient in the transform block. Specifically, last_sig_coeff_x_prefix denotes the column position prefix of the last significant coefficient in scan order in the transform block, last_sig_coeff_y_prefix denotes the row position prefix of the last significant coefficient in scan order in the transform block, last_sig_coeff_x_suffix denotes the column position suffix of the last significant coefficient in scan order in the transform block, and last_sig_coeff_y_suffix denotes the row position suffix of the last significant coefficient in scan order in the transform block. Here, a significant coefficient may mean a non-zero coefficient. The scanning order may be a right-up diagonal scanning order. Alternatively, the scanning order may be a horizontal scanning order or a vertical scanning order. The scanning order may be determined based on whether or not intra/inter prediction is applied to the target block (CB or CB including TB), and/or a particular intra/inter prediction mode.

[185] Область обнуления может задаваться при остаточном кодировании таблицы 9 на основе tu_mts_idx[x0][y0] в таблице 8.[185] The nulling region may be specified in table 9 residual encoding based on tu_mts_idx[x0][y0] in table 8.

[186] Когда cu_sbt_flag равен 1, высота блока, к которому применяется преобразование, равна 32 или меньше (log2TbHeight<6), и его ширина равна 32 (log2TbWidth<6 andand log2TbWidth>4), ширина блока преобразования задается равной 16 (log2TbWidth=4). В других случаях, в которых cu_sbt_flag не равен 1, высота блока преобразования превышает 32, или ширина блока преобразования не равна 32, ширина блока преобразования может задаваться равной меньшему значению из ширины блока преобразования и 32. Таким образом, максимальная ширина блока преобразования может быть ограничена 32 посредством обнуления.[186] When cu_sbt_flag is 1, the height of the block to which the transform is applied is 32 or less (log2TbHeight<6), and its width is 32 (log2TbWidth<6 andand log2TbWidth>4), the width of the transform block is set to 16 (log2TbWidth= 4). In other cases in which cu_sbt_flag is not equal to 1, the height of the transform block is greater than 32, or the width of the transform block is not 32, the width of the transform block may be set to the lesser of the transform block width and 32. Thus, the maximum width of the transform block may be limited 32 by resetting.

[187] Аналогично, когда cu_sbt_flag равен 1, ширина блока, к которому применяется преобразование, равна 32 или меньше (log2TbWidth<6), и его высота равна 32 (log2TbHeight<6 andand log2TbHeight>4), высота блока преобразования задается равной 16 (log2TbHeight=4). В других случаях, в которых cu_sbt_flag не равен 1, ширина блока преобразования превышает 32, или высота блока преобразования не равна 32, высота блока преобразования может задаваться равной меньшему значению из высоты блока преобразования и 32. Таким образом, максимальная высота блока преобразования может быть ограничена 32 посредством обнуления.[187] Similarly, when cu_sbt_flag is 1, the width of the block to which the transform is applied is 32 or less (log2TbWidth<6) and its height is 32 (log2TbHeight<6 andand log2TbHeight>4), the height of the transform block is set to 16 ( log2TbHeight=4). In other cases in which cu_sbt_flag is not equal to 1, the transform block width is greater than 32, or the transform block height is not 32, the transform block height may be set to the lesser of the transform block height and 32. Thus, the maximum transform block height may be limited 32 by resetting.

[188] Согласно таблице 7, когда длина, по меньшей мере, одной стороны блока сегментов равна 64 или больше, DCT2 может применяться как в горизонтальном направлении, так и в вертикальном направлении, и в противном случае, DST7 или DCT8 может применяться. Соответственно, когда SBT применяется, обнуление может выполняться посредством применения RMTS32 только тогда, когда все две стороны блока сегментов, к которому применяется преобразование, имеют длину 32 или меньше. Таким образом, когда длина блока в каждом направлении равна 32, только 16 коэффициентов преобразования могут оставляться посредством применения DST7 или DCT8, имеющего длину 32.[188] According to Table 7, when the length of at least one side of the segment block is 64 or more, DCT2 can be applied in both the horizontal direction and the vertical direction, and otherwise, DST7 or DCT8 can be applied. Accordingly, when SBT is applied, nulling can be performed by applying RMTS32 only when all two sides of the block of segments to which the transformation is applied have a length of 32 or less. Thus, when the block length in each direction is 32, only 16 transform coefficients can be left by using DST7 or DCT8 having a length of 32.

[189] Как показано в таблице 9, при применении RMTS32, кодирование может выполняться с учетом ширины и высоты оставшейся области (области низкочастотных коэффициентов преобразования), которая не обнуляется, в качестве фактической ширины и высоты TU, вместо использования ширины и высоты исходной единицы преобразования для кодирования (log2TbWidth=Min(log2TbWidth, 5) или log2TbHeight=Min(log2TbHeight, 5)).[189] As shown in Table 9, when using RMTS32, encoding can be performed by considering the width and height of the remaining region (low frequency transform coefficient region) that is not zeroed as the actual width and height of the TU, instead of using the width and height of the original transform unit for encoding (log2TbWidth=Min(log2TbWidth, 5) or log2TbHeight=Min(log2TbHeight, 5)).

[190] Например, когда высота x ширина исходной TU составляет 32×16, если RMTS32 применяется, ненулевой коэффициент существует только в левой верхней области 16×16 посредством обнуления. Соответственно, ширина и высота TU может задаваться равной 16 и 16, соответственно, и затем синтаксические элементы (например, last_sig_coeff_x_prefix и last_sig_coeff_y_prefix) могут кодироваться.[190] For example, when the height x width of the original TU is 32×16, if RMTS32 is applied, a non-zero coefficient exists only in the upper left region of 16×16 by zeroing. Accordingly, the width and height of the TU may be set to 16 and 16, respectively, and then the syntax elements (eg, last_sig_coeff_x_prefix and last_sig_coeff_y_prefix) may be encoded.

[191] В общих словах, согласно остаточному кодированию таблицы 9, фактическая ширина и высота TU изменяется посредством изменения значений log2TbWidth и log2TbHeight до кодирования last_sig_coeff_x_prefix, и синтаксические элементы затем кодируются согласно измененным значениям.[191] In general, according to the residual encoding of Table 9, the actual width and height of the TU are changed by changing the values of log2TbWidth and log2TbHeight before encoding last_sig_coeff_x_prefix, and the syntax elements are then encoded according to the changed values.

[192] Когда TU-размер уменьшается до области низкочастотных коэффициентов преобразования вследствие обнуления высокочастотного коэффициента преобразования, семантика синтаксических элементов таблицы 9 проиллюстрирована в таблице 10.[192] When the TU size is reduced to the region of low-frequency transform coefficients due to zeroing of the high-frequency transform coefficient, the semantics of the syntax elements of Table 9 are illustrated in Table 10.

[193] Табл. 10[193] Tab. 10

- last_sig_coeff_x_prefix указывает префикс позиции столбца последнего значимого коэффициента в порядке сканирования в блоке преобразования. Значения last_sig_coeff_x_prefix должны составлять в диапазоне от 0 до (log2TbWidth<<1)-1, включительно.
Когда last_sig_coeff_x_prefix не присутствует, он логически выводится равным 0.
- last_sig_coeff_y_prefix указывает префикс позиции строки последнего значимого коэффициента в порядке сканирования в блоке преобразования. Значения last_sig_coeff_y_prefix должны составлять в диапазоне от 0 до (log2TbHeight<<1)-1, включительно.
Когда last_sig_coeff_y_prefix не присутствует, он логически выводится равным 0.
- last_sig_coeff_x_prefix specifies the column position prefix of the last significant coefficient in scan order in the transform block. Last_sig_coeff_x_prefix values must be in the range 0 to (log2TbWidth<<1)-1, inclusive.
When last_sig_coeff_x_prefix is not present, it is logically output to 0.
- last_sig_coeff_y_prefix specifies the line position prefix of the last significant coefficient in scan order in the transform block. Last_sig_coeff_y_prefix values must be in the range 0 to (log2TbHeight<<1)-1, inclusive.
When last_sig_coeff_y_prefix is not present, it is logically output to 0.

[194] Ссылаясь на таблицу 10, last_sig_coeff_x_prefix и last_sig_coeff_y_prefix ограничены значениями в пределах от 0 до (log2TbWidth<<1)-1 или (log2TbHeight<<1)-1, где log2TbWidth или log2TbHeight может представлять собой ширину или высоту блока преобразования с уменьшенным размером, как показано в таблице 9.[194] Referring to Table 10, last_sig_coeff_x_prefix and last_sig_coeff_y_prefix are limited to values ranging from 0 to (log2TbWidth<<1)-1 or (log2TbHeight<<1)-1, where log2TbWidth or log2TbHeight may be the width or height of the reduced transform block size as shown in Table 9.

[195] Когда размер блока преобразования изменяется, размер блока преобразования, используемого для выбора контекста last_sig_coeff_x_prefix и last_sig_coeff_y_prefix, также может изменяться. Таблица 11 иллюстрирует процесс извлечения контекстного приращения (ctxInc) для извлечения last_sig_coeff_x_prefix и last_sig_coeff_y_prefix, и таблица 12 иллюстрирует преобразование в двоичную форму last_sig_coeff_x_prefix и last_sig_coeff_y_prefix с учетом сокращенной TU. Поскольку контекст может выбираться и разделяться посредством контекстного приращения, контекстная модель может извлекаться на основе контекстного приращения.[195] When the size of the transform block is changed, the size of the transform block used to select the last_sig_coeff_x_prefix and last_sig_coeff_y_prefix contexts may also change. Table 11 illustrates the context increment (ctxInc) extraction process to extract last_sig_coeff_x_prefix and last_sig_coeff_y_prefix, and Table 12 illustrates the binarization of last_sig_coeff_x_prefix and last_sig_coeff_y_prefix given the shortened TU. Since the context can be selected and divided by context increment, the context model can be retrieved based on the context increment.

[196] Табл. 11[196] Tab. eleven

9.5.4.2.4. Процесс извлечения ctxInc для синтаксических элементов last_sig_coeff_x_prefix и last_sig_coeff_y_prefix
Вводы в этот процесс представляют собой переменную binIdx, индекс cIdx цветового компонента, двоичный логарифм ширины log2TbWidth блока преобразования и высоты log2TbHeight блока преобразования.
Вывод этого процесса представляет собой переменную ctxInc.
Переменная log2TbSize извлекается следующим образом:
- Если синтаксический элемент, который должен синтаксически анализироваться, представляет собой last_sig_coeff_x_prefix, log2TbSize задается равным log2TbWidth.
- Иначе (синтаксический элемент, который должен синтаксически анализироваться, представляет собой last_sig_coeff_y_prefix), log2TbSize задается равным log2TbHeight.
Переменные ctxOffset и ctxShift извлекаются следующим образом:
- Если cIdx равен 0, ctxOffset задается равной 3*(log2TbSize-2)+((log2TbSize-1)>>2), и ctxShift задается равной (log2ThSize+1)>>2.
- Иначе (cIdx превышает 0), ctxOffset задается равной21, и ctxShift задается равной Clip3 (0, 2, 2log2TbSize>>3).
Переменная ctxInc извлекается следующим образом:
- ctxInc=(binIdx>>ctxShift)+ctxOffset (9-31)
9.5.4.2.4. ctxInc extraction process for last_sig_coeff_x_prefix and last_sig_coeff_y_prefix syntax elements
The inputs to this process are the variable binIdx, the color component index cIdx, the binary logarithm of the transform block width log2TbWidth, and the transform block height log2TbHeight.
The output of this process is the variable ctxInc.
The log2TbSize variable is retrieved as follows:
- If the syntax element to be parsed is last_sig_coeff_x_prefix, log2TbSize is set to log2TbWidth.
- Otherwise (the syntax element to be parsed is last_sig_coeff_y_prefix), log2TbSize is set to log2TbHeight.
The ctxOffset and ctxShift variables are retrieved as follows:
- If cIdx is 0, ctxOffset is set to 3*(log2TbSize-2)+((log2TbSize-1)>>2), and ctxShift is set to (log2ThSize+1)>>2.
- Otherwise (cIdx greater than 0), ctxOffset is set to 21, and ctxShift is set to Clip3 (0, 2, 2 log2TbSize >>3).
The ctxInc variable is retrieved as follows:
- ctxInc=(binIdx>>ctxShift)+ctxOffset (9-31)

[197] Табл. 12[197] Tab. 12

[198] Как показано в таблице 11, переменная log2TbSize задается равной log2TbWidth, когда last_sig_coeff_x_prefix синтаксически анализируется, и равной log2TbHeight, когда last_sig_coeff_y_prefix синтаксически анализируется, где log2TbWidth и log2TbHeight обозначают ширину и высоту сокращенной TU, такой как область низкочастотных коэффициентов преобразования.[198] As shown in Table 11, the log2TbSize variable is set to log2TbWidth when last_sig_coeff_x_prefix is parsed and to log2TbHeight when last_sig_coeff_y_prefix is parsed, where log2TbWidth and log2TbHeight denote the width and height of a shortened TU, such as the low frequency transform coefficient region.

[199] Дополнительно, максимальные значения (cMax) last_sig_coeff_x_prefix и last_sig_coeff_y_prefix в таблице 12 также задаются на основе ширины и высоты сокращенной TU, такой как область низкочастотных коэффициентов преобразования (cMax=(log2TbWidth<<1)-1, cMax=(log2TbHeight<<1)-1). Когда усеченное унарное преобразование в двоичную форму используется для преобразования в двоичную форму last_sig_coeff_x_prefix и last_sig_coeff_y_prefix, максимальные значения (cMax) last_sig_coeff_x_prefix и last_sig_coeff_y_prefix могут задаваться идентичными максимальным значениям кодовых слов, используемых для преобразования в двоичную форму last_sig_coeff_x_prefix и last_sig_coeff_y_prefix. Следовательно, максимальная длина префиксного кодового слова, указывающего информацию префикса последнего значимого коэффициента, может извлекаться на основе размера обнуляемого блока.[199] Additionally, the maximum values (cMax) of last_sig_coeff_x_prefix and last_sig_coeff_y_prefix in Table 12 are also set based on the width and height of the shortened TU, such as the low-frequency transform coefficient region (cMax=(log2TbWidth<<1)-1, cMax=(log2TbHeight<< 1)-1). When truncated unary to binary is used to binarize last_sig_coeff_x_prefix and last_sig_coeff_y_prefix, the maximum values (cMax) of last_sig_coeff_x_prefix and last_sig_coeff_y_prefix can be set to be identical to the maximum values of the codewords used to binarize last_sig_coeff_x_prefix and last_s ig_coeff_y_prefix. Therefore, the maximum length of the prefix codeword indicating the prefix information of the last significant coefficient can be extracted based on the size of the nullable block.

[200] Вариант осуществления настоящего раскрытия сущности предлагает применение размера исходной TU, а не сокращенной TU области низкочастотных коэффициентов преобразования для CABAC-контекста для двух синтаксических элементов, т.е. last_sig_coeff_x_prefix и last_sig_coeff_y_prefix.[200] An embodiment of the present disclosure proposes using the size of the original TU rather than the reduced TU region of low-frequency transform coefficients for the CABAC context for two syntax elements, i.e. last_sig_coeff_x_prefix and last_sig_coeff_y_prefix.

[201] Таблица 13 показывает синтаксические элементы остаточного кодирования и семантику, соответствующую им, согласно варианту осуществления.[201] Table 13 shows the residual encoding syntactic elements and the semantics corresponding to them, according to an embodiment.

[202] Табл. 13[202] Tab. 13


- last_sig_coeff_x_prefix указывает префикс позиции столбца последнего значимого коэффициента в порядке сканирования в блоке преобразования. Значения last_sig_coeff_x_prefix должны составлять в диапазоне от 0 до (log2ZoTbWidth<<1)-1, включительно. Когда last_sig_coeff_x_prefix не присутствует, он логически выводится равным 0.
- last_sig_coeff_y_prefix указывает префикс позиции строки последнего значимого коэффициента в порядке сканирования в блоке преобразования. Значения last_sig_coeff_y_prefix должны составлять в диапазоне от 0 до (log2ZoTbHeight<<1)-1, включительно. Когда last_sig_coeff_y_prefix не присутствует, он логически выводится равным 0.

- last_sig_coeff_x_prefix specifies the column position prefix of the last significant coefficient in scan order in the transform block. Last_sig_coeff_x_prefix values must be in the range 0 to (log2ZoTbWidth<<1)-1, inclusive. When last_sig_coeff_x_prefix is not present, it is logically output to 0.
- last_sig_coeff_y_prefix specifies the line position prefix of the last significant coefficient in scan order in the transform block. Last_sig_coeff_y_prefix values must be in the range 0 to (log2ZoTbHeight<<1)-1, inclusive. When last_sig_coeff_y_prefix is not present, it is logically output to 0.

[203] Согласно таблице 13, могут предлагаться две новых переменные (log2ZoTbWidth и log2ZoTbHeight), указывающие сокращенную ширину и сокращенную высоту. TU-размер может в завершение обновляться на log2ZoTbWidth и log2ZoTbHeight после синтаксического анализа синтаксиса позиции последнего значимого коэффициента (log2TbWidth = log2ZoTbWidth, log2TbHeight = log2ZoTbHeight).[203] According to Table 13, two new variables (log2ZoTbWidth and log2ZoTbHeight) may be proposed indicating the shortened width and shortened height. The TU size may finally be updated to log2ZoTbWidth and log2ZoTbHeight after parsing the position syntax of the last significant coefficient (log2TbWidth = log2ZoTbWidth, log2TbHeight = log2ZoTbHeight).

[204] Таким образом, согласно настоящему варианту осуществления, остаточные выборки могут извлекаться на основе информации позиции относительно последнего значимого коэффициента, в котором контекстная модель может извлекаться на основе размера исходного блока преобразования, размер которого является неизменным, и позиция последнего значимого коэффициента может извлекаться на основе размера обнуляемого блока. Здесь, размер, в частности, ширина или высота, обнуляемого блока меньше размера, ширины или высоты, исходного блока преобразования.[204] Thus, according to the present embodiment, residual samples can be retrieved based on position information relative to the last significant coefficient, in which the context model can be retrieved based on the size of the original transform block, the size of which is constant, and the position of the last significant coefficient can be retrieved by based on the size of the block being reset. Here, the size, specifically the width or height, of the nullable block is less than the size, width or height, of the original transform block.

[205] Когда контекстная модель извлекается на основе размера исходного блока преобразования, размер которого является неизменным, log2TbWidth и log2TbHeight, используемые для извлечения контекстного приращения (ctxInc) в таблице 11, могут интерпретироваться в качестве ширины и высоты исходного блока преобразования.[205] When the context model is extracted based on the size of the original transform block, the size of which is constant, log2TbWidth and log2TbHeight used to extract the context increment (ctxInc) in Table 11 can be interpreted as the width and height of the original transform block.

[206] Согласно таблице 13, таблица 12, в которой позиция последнего значимого коэффициента извлекается на основе размера (log2ZoTbWidth и log2ZoTbHeight) обнуляемого блока, может изменяться на таблицу 14.[206] According to Table 13, Table 12, in which the position of the last significant coefficient is retrieved based on the size (log2ZoTbWidth and log2ZoTbHeight) of the block being nulled, can be changed to Table 14.

[207] Табл. 14[207] Tab. 14

[208] Согласно таблице 14, максимальные значения (cMax) last_sig_coeff_x_prefix и last_sig_coeff_y_prefix задаются на основе log2ZoTbWidth и log2ZoTbHeight, соответствующих ширине и высоте сокращенной TU, такой как область низкочастотных коэффициентов преобразования (cMax=(log2ZoTbWidth<<1)-1, cMax=(log2ZoTbHeight<<1)-1). Когда усеченное унарное преобразование в двоичную форму используется для преобразования в двоичную форму last_sig_coeff_x_prefix и last_sig_coeff_y_prefix, максимальные значения (cMax) last_sig_coeff_x_prefix и last_sig_coeff_y_prefix могут задаваться идентичными максимальным значениям кодовых слов, используемых для преобразования в двоичную форму last_sig_coeff_x_prefix и last_sig_coeff_y_prefix. Следовательно, максимальная длина префиксного кодового слова, указывающего информацию префикса последнего значимого коэффициента, может извлекаться на основе размера обнуляемого блока.[208] According to Table 14, the maximum values (cMax) of last_sig_coeff_x_prefix and last_sig_coeff_y_prefix are set based on log2ZoTbWidth and log2ZoTbHeight corresponding to the width and height of the shortened TU, such as the low-frequency transform coefficient region (cMax=(log2ZoTbWidth<<1)-1, cMax=( log2ZoTbHeight<<1)-1). When truncated unary to binary is used to binarize last_sig_coeff_x_prefix and last_sig_coeff_y_prefix, the maximum values (cMax) of last_sig_coeff_x_prefix and last_sig_coeff_y_prefix can be set to be identical to the maximum values of the codewords used to binarize last_sig_coeff_x_prefix and last_s ig_coeff_y_prefix. Therefore, the maximum length of the prefix codeword indicating the prefix information of the last significant coefficient can be extracted based on the size of the nullable block.

[209] Таблица 15 показывает результат тестирования для выполнения выбора контекста посредством применения размера сокращенной TU на основе теста, в котором выбор контекста выполняется на основе размера исходной TU.[209] Table 15 shows the test result for performing context selection by applying the size of the reduced TU based on a test in which context selection is performed based on the size of the original TU.

[210] Табл. 15[210] Tab. 15

Главный профиль 10, полностью внутреннийMain profile 10, completely internal По сравнению с VTM-4.0Compared to VTM-4.0 YY UU VV EncTEncT DecTDecT Класс A1Class A1 0,24%0.24% 0,19%0.19% 0,15%0.15% 101%101% 103%103% Класс A2Class A2 0,12%0.12% 0,20%0.20% 0,06%0.06% 101%101% 103%103% Класс BClass B 0,10%0.10% 0,13%0.13% 0,11%0.11% 100%100% 100%100% Класс CClass C 0,03%0.03% -0,03%-0.03% 0,02%0.02% 101%101% 105%105% Класс EClass E 0,03%0.03% 0,07%0.07% -0,05%-0.05% 103%103% 107%107% В целомGenerally 0,10%0.10% 0,11%0.11% 0,06%0.06% 101%101% 103%103% Класс DClass D 0,02%0.02% -0,15%-0.15% -0,14%-0.14% 102%102% 108%108% Класс FClass F 0,01%0.01% 0,04%0.04% 0,04%0.04% 103%103% 105%105% Класс SCCSCC class 0,02%0.02% 0,00%0.00% -0,01%-0.01% 103%103% 102%102%

[211] Как показано в таблице 15, когда выбор контекста выполняется посредством применения сокращенного TU-размера, уменьшение BD-коэффициента приблизительно в 0,10% наблюдается по сравнению с тестом, в котором выбор контекста выполняется на основе размера исходной TU. Таким образом, чтобы повышать эффективность при остаточном кодировании, предлагается выполнять выбор контекста на основе исходной TU, а не сокращенной TU, т.е. области низкочастотных коэффициентов преобразования.[211] As shown in Table 15, when context selection is performed by applying the reduced TU size, a reduction in the BD coefficient of approximately 0.10% is observed compared to a test in which context selection is performed based on the size of the original TU. Thus, to improve efficiency in residual coding, it is proposed to perform context selection based on the original TU rather than the shortened TU, i.e. areas of low-frequency conversion coefficients.

[212] Нижеприведенные чертежи предоставляются для того, чтобы описывать конкретные примеры настоящего раскрытия сущности. Поскольку конкретные обозначения устройств или обозначения конкретных сигналов/сообщений/полей, проиллюстрированных на чертежах, предоставляются для иллюстрации, технические признаки настоящего раскрытия сущности не ограничены конкретными обозначениями, используемыми на нижеприведенных чертежах.[212] The following drawings are provided to describe specific examples of the present disclosure. While specific device designations or designations of particular signals/messages/fields illustrated in the drawings are provided for illustrative purposes, the technical features of the present disclosure are not limited to the specific designations used in the drawings below.

[213] Фиг. 7 является блок-схемой последовательности операций способа, иллюстрирующей работу аппаратуры декодирования видео согласно варианту осуществления настоящего раскрытия сущности.[213] FIG. 7 is a flowchart illustrating the operation of a video decoding apparatus according to an embodiment of the present disclosure.

[214] Фиг. 7 является блок-схемой последовательности операций способа, иллюстрирующей работу аппаратуры декодирования согласно варианту осуществления, и фиг. 8 является блок-схемой, иллюстрирующей конфигурацию аппаратуры декодирования согласно варианту осуществления.[214] FIG. 7 is a flowchart illustrating operation of the decoding apparatus according to the embodiment, and FIG. 8 is a block diagram illustrating the configuration of decoding equipment according to the embodiment.

[215] Каждая операция, проиллюстрированная на фиг. 7, может выполняться посредством аппаратуры 300 декодирования, проиллюстрированного на фиг. 3. В частности, S700 и S710 могут выполняться посредством энтропийного декодера 310, проиллюстрированного на фиг. 3, S720 может выполняться посредством деквантователя 321, проиллюстрированного на фиг. 3, S730 может выполняться посредством обратного преобразователя 322, проиллюстрированного на фиг. 3, и S740 может выполняться посредством сумматора 340, проиллюстрированного на фиг. 3. Операции согласно S700-S740 основаны на некоторых вышеприведенных подробностях, поясненных со ссылкой на фиг. 4-6. Следовательно, описание конкретных подробностей, перекрывающихся с подробностями, поясненными выше со ссылкой на фиг. 4-6, опускается или приводится кратко.[215] Each operation illustrated in FIG. 7 may be performed by the decoding apparatus 300 illustrated in FIG. 3. In particular, S700 and S710 may be performed by the entropy decoder 310 illustrated in FIG. 3, S720 may be performed by the dequantizer 321 illustrated in FIG. 3, S730 may be performed by the inverse converter 322 illustrated in FIG. 3, and S740 may be performed by the adder 340 illustrated in FIG. 3. The operations of S700 to S740 are based on some of the above details explained with reference to FIGS. 4-6. Therefore, a description of specific details overlapping with the details explained above with reference to FIG. 4-6, omitted or given briefly.

[216] Как показано на фиг. 8, аппаратура декодирования согласно варианту осуществления может включать в себя энтропийный декодер 310, деквантователь 321, обратный преобразователь 322 и сумматор 340. Тем не менее, в некоторых случаях, все компоненты, показанные на фиг. 8, могут не представлять собой существенные компоненты аппаратуры декодирования, и аппаратура декодирования может быть сконфигурирована с большим или меньшим числом компонентов относительно компонентов, показанных на фиг. 8.[216] As shown in FIG. 8, the decoding apparatus of an embodiment may include an entropy decoder 310, a dequantizer 321, an inverter 322, and an adder 340. However, in some cases, all of the components shown in FIG. 8 may not represent essential components of the decoding hardware, and the decoding hardware may be configured with more or fewer components than those shown in FIG. 8.

[217] В аппаратуре декодирования согласно варианту осуществления, энтропийный декодер 310, деквантователь 321, обратный преобразователь 322 и сумматор 340 могут быть сконфигурированы как отдельные микросхемы, или, по меньшей мере, два компонента могут быть сконфигурированы как одна микросхема.[217] In the decoding apparatus according to an embodiment, the entropy decoder 310, dequantizer 321, inverter 322, and adder 340 may be configured as separate chips, or at least two components may be configured as a single chip.

[218] Аппаратура декодирования согласно варианту осуществления может принимать поток битов, включающий в себя остаточную информацию (S700). В частности, энтропийный декодер 310 аппаратуры декодирования может принимать поток битов, включающий в себя остаточную информацию.[218] The decoding apparatus according to the embodiment may receive a bit stream including residual information (S700). In particular, the entropy decoder 310 of the decoding apparatus may receive a bit stream including residual information.

[219] Аппаратура декодирования согласно варианту осуществления может извлекать квантованные коэффициенты преобразования для текущего блока на основе остаточной информации, включенной в поток битов (S710). В частности, энтропийный декодер 310 аппаратуры декодирования может квантованные коэффициенты преобразования для текущего блока на основе остаточной информации, включенной в поток битов.[219] The decoding apparatus according to the embodiment can extract quantized transform coefficients for the current block based on residual information included in the bitstream (S710). In particular, the entropy decoder 310 of the decoding apparatus can quantize transform coefficients for the current block based on the residual information included in the bit stream.

[220] Аппаратура декодирования согласно варианту осуществления может преобразовывать коэффициенты из квантованных коэффициентов преобразования на основе процесса деквантования. В частности, деквантователь 321 аппаратуры декодирования может извлекать коэффициенты преобразования из квантованных коэффициентов преобразования на основе процесса деквантования.[220] The decoding apparatus according to an embodiment can convert coefficients from quantized transform coefficients based on a dequantization process. In particular, the dequantizer 321 of the decoding apparatus can extract transform coefficients from the quantized transform coefficients based on a dequantization process.

[221] Аппаратура декодирования согласно варианту осуществления может извлекать остаточные выборки для текущего блока посредством применения обратного преобразования к извлеченным коэффициентам преобразования (S720). В частности, обратное преобразование 322 аппаратуры декодирования может извлекать остаточные выборки для текущего блока посредством применения обратного преобразования к извлеченным коэффициентам преобразования.[221] The decoding apparatus according to the embodiment can extract residual samples for the current block by applying an inverse transform to the extracted transform coefficients (S720). In particular, the inverse transform 322 of the decoding apparatus may extract residual samples for the current block by applying an inverse transform to the extracted transform coefficients.

[222] Аппаратура декодирования согласно варианту осуществления может формировать восстановленный кадр на основе остаточных выборок для текущего блока (S740). В частности, сумматор 340 аппаратуры декодирования может формировать восстановленный кадр на основе остаточных выборок для текущего блока.[222] The decoding apparatus according to the embodiment can generate a reconstructed frame based on the residual samples for the current block (S740). In particular, the decoding apparatus adder 340 may generate a reconstructed frame based on the residual samples for the current block.

[223] В варианте осуществления, единица текущего блока может представлять собой блок преобразования (TB).[223] In an embodiment, the unit of the current block may be a transform block (TB).

[224] В варианте осуществления, каждый из коэффициентов преобразования для текущего блока может быть связан с областью высокочастотных коэффициентов преобразования, включающей в себя коэффициент преобразования в 0, или с областью низкочастотных коэффициентов преобразования, включающей в себя, по меньшей мере, один значимый коэффициент преобразования.[224] In an embodiment, each of the transform coefficients for the current block may be associated with a high frequency transform coefficient region including a transform coefficient of 0, or a low frequency transform coefficient region including at least one significant transform coefficient .

[225] В варианте осуществления, остаточная информация может включать в себя информацию префикса последнего значимого коэффициента и информацию суффикса последнего значимого коэффициента относительно позиции последнего значимого коэффициента преобразования из числа коэффициентов преобразования для текущего блока.[225] In an embodiment, the residual information may include last significant coefficient prefix information and last significant coefficient suffix information regarding the position of the last significant transform coefficient among the transform coefficients for the current block.

[226] В одном примере, информации префикса последнего значимого коэффициента можно определять максимальное значение на основе размера обнуляемого блока.[226] In one example, the last significant coefficient prefix information may determine a maximum value based on the size of the block being reset.

[227] В варианте осуществления, позиция последнего значимого коэффициента преобразования может определяться на основе префиксного кодового слова, указывающего информацию префикса последнего значимого коэффициента и информацию суффикса последнего значимого коэффициента.[227] In an embodiment, the position of the last significant transform coefficient may be determined based on a prefix codeword indicating the last significant coefficient prefix information and the last significant coefficient suffix information.

[228] В варианте осуществления, максимальная длина префиксного кодового слова может определяться на основе области низкочастотных коэффициентов преобразования, т.е. размера обнуляемого блока.[228] In an embodiment, the maximum length of the prefix codeword may be determined based on the region of low frequency transform coefficients, i.e. the size of the block being reset.

[229] В варианте осуществления, размер обнуляемого блока может определяться на основе ширины и высоты текущего блока.[229] In an embodiment, the size of a nullable block may be determined based on the width and height of the current block.

[230] В варианте осуществления, информация префикса последнего значимого коэффициента может включать в себя информацию префикса по оси X и информацию префикса по оси Y, и префиксное кодовое слово может представлять собой кодовое слово для информации префикса по оси X и кодовое слово для информации префикса по оси Y.[230] In an embodiment, the last significant coefficient prefix information may include X-axis prefix information and Y-axis prefix information, and the prefix codeword may be a codeword for X-axis prefix information and a codeword for X-axis prefix information. Y axis

[231] В одном примере, информация префикса по оси X может выражаться как last_sig_coeff_x_prefix, информация префикса по оси Y может выражаться как last_sig_coeff_y_prefix, и позиция последнего значимого коэффициента преобразования может выражаться как (LastSignificantCoeffX, LastSignificantCoeffY).[231] In one example, the X-axis prefix information may be expressed as last_sig_coeff_x_prefix, the Y-axis prefix information may be expressed as last_sig_coeff_y_prefix, and the position of the last significant conversion coefficient may be expressed as (LastSignificantCoeffX, LastSignificantCoeffY).

[232] В варианте осуществления, остаточная информация может включать в себя информацию относительно размера обнуляемого блока.[232] In an embodiment, the residual information may include information regarding the size of the block being reset.

[233] Фиг. 9 является блок-схемой последовательности операций способа, иллюстрирующей процесс извлечения остаточной выборки согласно варианту осуществления настоящего раскрытия сущности.[233] FIG. 9 is a flowchart illustrating a residual sample extraction process according to an embodiment of the present disclosure.

[234] Каждая операция, проиллюстрированная на фиг. 9, может выполняться посредством аппаратуры 300 декодирования, проиллюстрированного на фиг. 3. В частности, S900 и S940 могут выполняться посредством энтропийного декодера 310, проиллюстрированного на фиг. 3.[234] Each operation illustrated in FIG. 9 may be performed by the decoding apparatus 300 illustrated in FIG. 3. In particular, S900 and S940 may be performed by the entropy decoder 310 illustrated in FIG. 3.

[235] Во-первых, как показано, обнуляемый блок для текущего блока может извлекаться (S900). Как описано выше, обнуляемый блок означает область низкочастотных коэффициентов преобразования, включающую в себя ненулевой значимый коэффициент преобразования, и ширина или высота обнуляемого блока может извлекаться на основе ширины или высоты текущего блока.[235] First, as shown, a nullable block for the current block may be retrieved (S900). As described above, a nullable block means a region of low frequency transform coefficients including a non-zero significant transform coefficient, and the width or height of the nullable block can be derived based on the width or height of the current block.

[236] Альтернативно, ширина или высота обнуляемого блока может извлекаться на основе информации флага, указывающей то, сегментируется текущий блок на субблоки и затем преобразуется или нет. Например, когда значение флага, указывающее то, сегментируется текущий блок на субблоки и затем преобразуется или нет, равно 1, ширина сегментированных субблоков равна 32, и высота субблоков меньше 64, ширина субблоков может задаваться равной 16. Альтернативно, когда значение флага, указывающее то, сегментируется текущий блок на субблоки и затем преобразуется или нет, равно 1, высота сегментированных субблоков равна 32, и ширина субблоков меньше 64, высота субблоков может задаваться равной 16.[236] Alternatively, the width or height of the nullable block may be retrieved based on flag information indicating whether the current block is segmented into subblocks and then converted or not. For example, when the value of the flag indicating whether the current block is segmented into subblocks and then converted or not is 1, the width of the segmented subblocks is 32, and the height of the subblocks is less than 64, the width of the subblocks may be set to 16. Alternatively, when the value of the flag indicating that , whether the current block is segmented into subblocks and then converted or not is 1, the height of the segmented subblocks is 32, and the width of the subblocks is less than 64, the height of the subblocks can be set to 16.

[237] Альтернативно, ширина или высота обнуляемого блока может извлекаться на основе MTS-индекса текущего блока или информации, указывающей то, применяется или нет MTS к преобразованию текущего блока.[237] Alternatively, the width or height of the nullable block may be retrieved based on the MTS index of the current block or information indicating whether or not the MTS is applied to the transformation of the current block.

[238] Размер обнуляемого блока может быть меньше размера текущего блока. В частности, ширина обнуляемого блока может быть меньше ширины текущего блока, и высота обнуляемого блока может быть меньше высоты текущего блока.[238] The size of the block being reset may be smaller than the size of the current block. In particular, the width of the nullable block may be less than the width of the current block, and the height of the nullable block may be less than the height of the current block.

[239] В частности, когда ширина текущего блока равна 32, и высота текущего блока равна 32 или меньше, ширина обнуляемого блока может задаваться равной 16. Альтернативно, в одном примере, ширина обнуляемого блока может ограничиваться случаем, в котором DST7 или DCT8, а не DCT2 применяется в качестве ядра преобразования, используемого для обратного первичного преобразования.[239] Specifically, when the width of the current block is 32, and the height of the current block is 32 or less, the width of the nullable block may be set to 16. Alternatively, in one example, the width of the nullable block may be limited to the case in which DST7 or DCT8 and DCT2 is not used as the conversion kernel used for the inverse primary conversion.

[240] Когда вышеприведенное условие не удовлетворяется, т.е. когда ширина текущего блока не равна 32, или высота текущего блока равна 64 или больше, ширина обнуляемого блока может задаваться равной меньшему значению из ширины текущего блока и 32.[240] When the above condition is not satisfied, i.e. When the width of the current block is not 32, or the height of the current block is 64 or greater, the width of the nullable block can be set to the lesser of the current block width and 32.

[241] Дополнительно, в частности, когда высота текущего блока равна 32, и ширина текущего блока равна 32 или меньше, высота обнуляемого блока может задаваться равной 16. Альтернативно, в одном примере, высота обнуляемого блока может ограничиваться случаем, в котором DST7 или DCT8, а не DCT2 применяется в качестве ядра преобразования, используемого для обратного первичного преобразования.[241] Additionally, in particular, when the height of the current block is 32, and the width of the current block is 32 or less, the height of the nullable block may be set to 16. Alternatively, in one example, the height of the nullable block may be limited to the case in which DST7 or DCT8 , rather than DCT2, is used as the transformation kernel used for the inverse primary transformation.

[242] Когда вышеприведенное условие не удовлетворяется, т.е. когда высота текущего блока не равна 32, или ширина текущего блока равна 64 или больше, высота обнуляемого блока может задаваться равной меньшему значению из высоты текущего блока и 32.[242] When the above condition is not satisfied, i.e. When the current block's height is not 32, or the current block's width is 64 or greater, the height of the nullable block can be set to the lesser of the current block's height and 32.

[243] В варианте осуществления, размер обнуляемого блока может составлять одно из 32×16, 16×32, 16×16 или 32×32.[243] In an embodiment, the size of the nullable block may be one of 32×16, 16×32, 16×16, or 32×32.

[244] В варианте осуществления, размер текущего блока может составлять 64×64, и размер обнуляемого блока может составлять 32×32.[244] In an embodiment, the size of the current block may be 64×64, and the size of the reset block may be 32×32.

[245] Аппаратура декодирования может извлекать контекстную модель для информации позиции последнего значимого коэффициента на основе ширины или высоты текущего блока (S910).[245] The decoding apparatus may extract a context model for position information of the last significant coefficient based on the width or height of the current block (S910).

[246] Согласно варианту осуществления, контекстная модель может извлекаться на основе размера исходного блока преобразования, а не размера обнуляемого блока. В частности, контекстное приращение для информации префикса по оси X и информации префикса по оси Y, соответствующей информации префикса последнего значимого коэффициента, может извлекаться на основе размера исходного блока преобразования.[246] According to an embodiment, the context model may be retrieved based on the size of the original transform block rather than the size of the nullable block. Specifically, the context increment for the X-axis prefix information and the Y-axis prefix information corresponding to the last significant coefficient prefix information can be extracted based on the size of the original transform block.

[247] Аппаратура декодирования может извлекать значение позиции последнего значимого коэффициента на основе извлеченной контекстной модели (S920).[247] The decoding apparatus may extract the position value of the last significant coefficient based on the extracted context model (S920).

[248] Как описано выше, информация позиции последнего значимого коэффициента может включать в себя информацию префикса последнего значимого коэффициента и информацию суффикса последнего значимого коэффициента, и значение позиции последнего значимого коэффициента может извлекаться на основе контекстной модели.[248] As described above, the last significant coefficient position information may include last significant coefficient prefix information and last significant coefficient suffix information, and the last significant coefficient position value may be retrieved based on the context model.

[249] Аппаратура декодирования может извлекать позицию последнего значимого коэффициента на основе извлеченного значения информации позиции последнего значимого коэффициента и ширины или высоты обнуляемого блока (S930).[249] The decoding apparatus may extract the position of the last significant coefficient based on the extracted value of the position information of the last significant coefficient and the width or height of the block being reset (S930).

[250] В одном примере, аппаратура декодирования может извлекать позицию последнего значимого коэффициента в пределах диапазона размера обнуляемого блока, меньшего диапазона размера текущего блока, а не исходного текущего блока. Таким образом, коэффициент преобразования, к которому применяется преобразование, может извлекаться в пределах диапазона размера обнуляемого блока, а не текущего блока.[250] In one example, the decoding apparatus may retrieve the position of the last significant coefficient within a nullable block size range smaller than the current block size range, rather than the original current block. Thus, the transform factor to which the transform is applied can be retrieved within the size range of the block being zeroed rather than the current block.

[251] В одном примере, информации префикса последнего значимого коэффициента можно определять максимальное значение на основе размера обнуляемого блока.[251] In one example, the last significant coefficient prefix information may determine a maximum value based on the size of the block being reset.

[252] В одном примере, позиция последнего значимого коэффициента может извлекаться на основе префиксного кодового слова, указывающего информацию префикса последнего значимого коэффициента и информацию суффикса последнего значимого коэффициента, и максимальная длина префиксного кодового слова может определяться на основе размера обнуляемого блока.[252] In one example, the position of the last significant coefficient may be retrieved based on a prefix codeword indicating the last significant coefficient prefix information and the last significant coefficient suffix information, and the maximum length of the prefix codeword may be determined based on the size of the nullable block.

[253] Аппаратура декодирования может извлекать остаточные выборки на основе позиции последнего значимого коэффициента, извлекаемой на основе ширины или высоты обнуляемого блока (S940).[253] The decoding apparatus may extract residual samples based on the position of the last significant coefficient extracted based on the width or height of the nullable block (S940).

[254] Нижеприведенные чертежи предоставляются для того, чтобы описывать конкретные примеры настоящего раскрытия сущности. Поскольку конкретные обозначения устройств или обозначения конкретных сигналов/сообщений/полей, проиллюстрированных на чертежах, предоставляются для иллюстрации, технические признаки настоящего раскрытия сущности не ограничены конкретными обозначениями, используемыми на нижеприведенных чертежах.[254] The following drawings are provided to describe specific examples of the present disclosure. While specific device designations or designations of particular signals/messages/fields illustrated in the drawings are provided for illustrative purposes, the technical features of the present disclosure are not limited to the specific designations used in the drawings below.

[255] Фиг. 10 является блок-схемой последовательности операций способа, иллюстрирующей работу аппаратуры кодирования видео согласно варианту осуществления настоящего раскрытия сущности, и фиг. 11 является блок-схемой, иллюстрирующей конфигурацию аппаратуры кодирования согласно варианту осуществления.[255] FIG. 10 is a flowchart illustrating operation of a video encoding apparatus according to an embodiment of the present disclosure, and FIG. 11 is a block diagram illustrating the configuration of encoding equipment according to the embodiment.

[256] Аппаратура кодирования согласно фиг. 10 и фиг. 11 может выполнять операции, соответствующие операциям аппаратуры декодирования согласно фиг. 7 и фиг. 8. Следовательно, операции аппаратуры декодирования, проиллюстрированного выше на фиг. 7 и фиг. 8, могут в равной степени применяться к аппаратуре кодирования согласно фиг. 10 и фиг. 11.[256] The encoding apparatus of FIG. 10 and fig. 11 can perform operations corresponding to the operations of the decoding apparatus according to FIG. 7 and fig. 8. Therefore, the operations of the decoding apparatus illustrated in FIG. 7 and fig. 8 can be equally applied to the encoding apparatus of FIG. 10 and fig. eleven.

[257] Каждая операция, проиллюстрированная на фиг. 10, может выполняться посредством аппаратуры 200 кодирования, проиллюстрированной на фиг. 2. В частности, S1000 может выполняться посредством вычитателя 231, проиллюстрированного на фиг. 2, S1010 может выполняться посредством преобразователя 232, проиллюстрированного на фиг. 2, и S1020 может выполняться посредством квантователя 233, и S1030 может выполняться посредством энтропийного кодера 240, проиллюстрированного на фиг. 2. Операции согласно S1000-S1030 основаны на части контента, описанного на фиг. 4-6. Следовательно, описание конкретных подробностей, перекрывающихся с подробностями, поясненными выше со ссылкой на фиг. 4-6, опускается или приводится кратко.[257] Each operation illustrated in FIG. 10 may be performed by the encoding apparatus 200 illustrated in FIG. 2. In particular, S1000 may be performed by the subtractor 231 illustrated in FIG. 2, S1010 may be performed by the converter 232 illustrated in FIG. 2, and S1020 may be performed by the quantizer 233, and S1030 may be performed by the entropy encoder 240 illustrated in FIG. 2. Operations according to S1000-S1030 are based on a portion of the content described in FIG. 4-6. Therefore, a description of specific details overlapping with the details explained above with reference to FIG. 4-6, omitted or given briefly.

[258] Как показано на фиг. 11, аппаратура кодирования согласно варианту осуществления может включать в себя вычитатель 231, преобразователь 232, квантователь 233 и энтропийный кодер 240. Тем не менее, в некоторых случаях, все компоненты, показанные на фиг. 11, могут не представлять собой существенные компоненты аппаратуры кодирования, и аппаратура кодирования может быть сконфигурирована с большим или меньшим числом компонентов относительно компонентов, показанных на фиг. 11.[258] As shown in FIG. 11, the encoding apparatus according to an embodiment may include a subtractor 231, a converter 232, a quantizer 233, and an entropy encoder 240. However, in some cases, all of the components shown in FIG. 11 may not represent essential components of the encoding hardware, and the encoding hardware may be configured with more or fewer components than those shown in FIG. eleven.

[259] В аппаратуре кодирования согласно варианту осуществления, вычитатель 231, преобразователь 232, квантователь 233 и энтропийный кодер 240 могут быть сконфигурированы как отдельные микросхемы, или, по меньшей мере, два компонента могут быть сконфигурированы как одна микросхема.[259] In the encoding apparatus according to an embodiment, the subtractor 231, converter 232, quantizer 233, and entropy encoder 240 may be configured as separate chips, or at least two components may be configured as a single chip.

[260] Аппаратура кодирования согласно варианту осуществления может извлекать остаточные выборки для текущего блока (S1000). В частности, вычитатель 231 аппаратуры кодирования может извлекать остаточные выборки для текущего блока.[260] The encoding apparatus according to the embodiment may extract residual samples for the current block (S1000). In particular, the encoder subtractor 231 may extract residual samples for the current block.

[261] Аппаратура кодирования согласно варианту осуществления может преобразовывать остаточные выборки для текущего блока, за счет этого извлекая коэффициенты преобразования для текущего блока (S1010). В частности, преобразователь 232 аппаратуры кодирования может преобразовывать остаточные выборки для текущего блока, за счет этого извлекая коэффициенты преобразования для текущего блока.[261] The encoding apparatus according to the embodiment can transform the residual samples for the current block, thereby extracting transform coefficients for the current block (S1010). In particular, the encoder transformer 232 may transform the residual samples for the current block, thereby extracting transform coefficients for the current block.

[262] Аппаратура кодирования согласно варианту осуществления может извлекать квантованные коэффициенты преобразования из коэффициентов преобразования на основе квантования (S1020). В частности, квантователь 233 аппаратуры кодирования может извлекать квантованные коэффициенты преобразования из коэффициентов преобразования на основе квантования.[262] The encoding apparatus according to the embodiment can extract quantized transform coefficients from the transform coefficients based on quantization (S1020). In particular, the encoding apparatus quantizer 233 can extract quantized transform coefficients from the transform coefficients based on quantization.

[263] Аппаратура кодирования согласно варианту осуществления может кодировать остаточную информацию, включающую в себя информацию относительно квантованных коэффициентов преобразования (S1030). В частности, энтропийный кодер 240 аппаратуры кодирования может кодировать остаточную информацию, включающую в себя информацию относительно квантованных коэффициентов преобразования.[263] The encoding apparatus according to the embodiment can encode residual information including information regarding quantized transform coefficients (S1030). In particular, the entropy encoder 240 of the encoding apparatus may encode residual information including information regarding quantized transform coefficients.

[264] В варианте осуществления, каждый из коэффициентов преобразования для текущего блока может быть связан с областью высокочастотных коэффициентов преобразования, включающей в себя коэффициент преобразования в 0, или с областью низкочастотных коэффициентов преобразования, включающей в себя, по меньшей мере, один значимый коэффициент преобразования, т.е. обнуляемый блок.[264] In an embodiment, each of the transform coefficients for the current block may be associated with a high frequency transform coefficient region including a transform coefficient of 0, or with a low frequency transform coefficient region including at least one significant transform coefficient , i.e. resettable block.

[265] В варианте осуществления, остаточная информация может включать в себя информацию префикса последнего значимого коэффициента и информацию суффикса последнего значимого коэффициента относительно позиции последнего значимого коэффициента преобразования из числа коэффициентов преобразования для текущего блока.[265] In an embodiment, the residual information may include last significant coefficient prefix information and last significant coefficient suffix information regarding the position of the last significant transform coefficient among the transform coefficients for the current block.

[266] В варианте осуществления, позиция последнего значимого коэффициента преобразования может определяться на основе префиксного кодового слова, указывающего информацию префикса последнего значимого коэффициента и информацию суффикса последнего значимого коэффициента.[266] In an embodiment, the position of the last significant transform coefficient may be determined based on a prefix codeword indicating the last significant coefficient prefix information and the last significant coefficient suffix information.

[267] В одном примере, информации префикса последнего значимого коэффициента можно определять максимальное значение на основе размера обнуляемого блока.[267] In one example, the last significant coefficient prefix information may determine a maximum value based on the size of the block being reset.

[268] В варианте осуществления, максимальная длина префиксного кодового слова может определяться на основе размера обнуляемого блока.[268] In an embodiment, the maximum length of a prefix codeword may be determined based on the size of the nullable block.

[269] В варианте осуществления, размер обнуляемого блока может определяться на основе ширины и высоты текущего блока.[269] In an embodiment, the size of a nullable block may be determined based on the width and height of the current block.

[270] В варианте осуществления, информация префикса последнего значимого коэффициента может включать в себя информацию префикса по оси X и информацию префикса по оси Y, и префиксное кодовое слово может представлять собой кодовое слово для информации префикса по оси X и кодовое слово для информации префикса по оси Y.[270] In an embodiment, the last significant coefficient prefix information may include X-axis prefix information and Y-axis prefix information, and the prefix codeword may be a codeword for X-axis prefix information and a codeword for X-axis prefix information. Y axis

[271] В одном примере, информация префикса по оси X может выражаться как last_sig_coeff_x_prefix, информация префикса по оси Y может выражаться как last_sig_coeff_y_prefix, и позиция последнего значимого коэффициента преобразования может выражаться как (LastSignificantCoeffX, LastSignificantCoeffY).[271] In one example, the X-axis prefix information may be expressed as last_sig_coeff_x_prefix, the Y-axis prefix information may be expressed as last_sig_coeff_y_prefix, and the position of the last significant conversion coefficient may be expressed as (LastSignificantCoeffX, LastSignificantCoeffY).

[272] В варианте осуществления, остаточная информация может включать в себя информацию относительно размера обнуляемого блока.[272] In an embodiment, the residual information may include information regarding the size of the block being reset.

[273] Фиг. 12 является блок-схемой последовательности операций способа, иллюстрирующей процесс кодирования остаточной информации согласно варианту осуществления настоящего раскрытия сущности.[273] FIG. 12 is a flowchart illustrating a process of encoding residual information according to an embodiment of the present disclosure.

[274] Каждая операция, проиллюстрированная на фиг. 12, может выполняться посредством аппаратуры 200 кодирования, проиллюстрированного на фиг. 2. В частности, S1200 и S1230 могут выполняться посредством энтропийного кодера 240, проиллюстрированного на фиг. 2.[274] Each operation illustrated in FIG. 12 may be performed by the encoding apparatus 200 illustrated in FIG. 2. In particular, S1200 and S1230 may be performed by the entropy encoder 240 illustrated in FIG. 2.

[275] Во-первых, как показано, может извлекаться обнуляемый блок для текущего блока (S1200). Как описано выше, обнуляемый блок означает область низкочастотных коэффициентов преобразования, включающую в себя ненулевой значимый коэффициент преобразования, и ширина или высота обнуляемого блока может извлекаться на основе ширины или высоты текущего блока.[275] First, as shown, a nullable block for the current block can be retrieved (S1200). As described above, a nullable block means a region of low frequency transform coefficients including a non-zero significant transform coefficient, and the width or height of the nullable block can be derived based on the width or height of the current block.

[276] Альтернативно, ширина или высота обнуляемого блока может извлекаться на основе информации флага, указывающей то, сегментируется текущий блок на субблоки и затем преобразуется или нет. Например, когда значение флага, указывающее то, сегментируется текущий блок на субблоки и затем преобразуется или нет, равно 1, ширина сегментированных субблоков равна 32, и высота субблоков меньше 64, ширина субблоков может задаваться равной 16. Альтернативно, когда значение флага, указывающее то, сегментируется текущий блок на субблоки и затем преобразуется или нет, равно 1, высота сегментированных субблоков равна 32, и ширина субблоков меньше 64, высота субблоков может задаваться равной 16.[276] Alternatively, the width or height of the nullable block may be retrieved based on flag information indicating whether the current block is segmented into subblocks and then converted or not. For example, when the value of the flag indicating whether the current block is segmented into subblocks and then converted or not is 1, the width of the segmented subblocks is 32, and the height of the subblocks is less than 64, the width of the subblocks may be set to 16. Alternatively, when the value of the flag indicating that , whether the current block is segmented into subblocks and then converted or not is 1, the height of the segmented subblocks is 32, and the width of the subblocks is less than 64, the height of the subblocks can be set to 16.

[277] Альтернативно, ширина или высота обнуляемого блока может извлекаться на основе MTS-индекса текущего блока или информации, указывающей то, применяется или нет MTS к преобразованию текущего блока.[277] Alternatively, the width or height of the nullable block may be retrieved based on the MTS index of the current block or information indicating whether or not the MTS is applied to the transformation of the current block.

[278] Размер обнуляемого блока может быть меньше размера текущего блока. В частности, ширина обнуляемого блока может быть меньше ширины текущего блока, и высота обнуляемого блока может быть меньше высоты текущего блока.[278] The size of the block being reset may be smaller than the size of the current block. In particular, the width of the nullable block may be less than the width of the current block, and the height of the nullable block may be less than the height of the current block.

[279] В частности, когда ширина текущего блока равна 32, и высота текущего блока равна 32 или меньше, ширина обнуляемого блока может задаваться равной 16. Альтернативно, в одном примере, ширина обнуляемого блока может ограничиваться случаем, в котором DST7 или DCT8, а не DCT2 применяется в качестве ядра преобразования, используемого для первичного преобразования.[279] Specifically, when the width of the current block is 32, and the height of the current block is 32 or less, the width of the nullable block may be set to 16. Alternatively, in one example, the width of the nullable block may be limited to the case in which DST7 or DCT8 and DCT2 is not used as the conversion kernel used for primary conversion.

[280] Когда вышеприведенное условие не удовлетворяется, т.е. когда ширина текущего блока не равна 32, или высота текущего блока равна 64 или больше, ширина обнуляемого блока может задаваться равной меньшему значению из ширины текущего блока и 32.[280] When the above condition is not satisfied, i.e. When the width of the current block is not 32, or the height of the current block is 64 or greater, the width of the nullable block can be set to the lesser of the current block width and 32.

[281] Дополнительно, в частности, когда высота текущего блока равна 32, и ширина текущего блока равна 32 или меньше, высота обнуляемого блока может задаваться равной 16. Альтернативно, в одном примере, высота обнуляемого блока может ограничиваться случаем, в котором DST7 или DCT8, а не DCT2 применяется в качестве ядра преобразования, используемого для первичного преобразования.[281] Additionally, in particular, when the height of the current block is 32, and the width of the current block is 32 or less, the height of the nullable block may be set to 16. Alternatively, in one example, the height of the nullable block may be limited to the case in which DST7 or DCT8 , rather than DCT2, is used as the transformation kernel used for the primary transformation.

[282] Когда вышеприведенное условие не удовлетворяется, т.е. когда высота текущего блока не равна 32, или ширина текущего блока равна 64 или больше, высота обнуляемого блока может задаваться равной меньшему значению из высоты текущего блока и 32.[282] When the above condition is not satisfied, i.e. When the current block's height is not 32, or the current block's width is 64 or greater, the height of the nullable block can be set to the lesser of the current block's height and 32.

[283] В варианте осуществления, размер обнуляемого блока может составлять одно из 32×16, 16×32, 16×16 или 32×32.[283] In an embodiment, the size of the nullable block may be one of 32×16, 16×32, 16×16, or 32×32.

[284] В варианте осуществления, размер текущего блока может составлять 64×64, и размер обнуляемого блока может составлять 32×32.[284] In an embodiment, the size of the current block may be 64×64, and the size of the reset block may be 32×32.

[285] Аппаратура кодирования может извлекать позицию последнего значимого коэффициента на основе извлеченной ширины или высоты обнуляемого блока (S1210).[285] The encoding apparatus may extract the position of the last significant coefficient based on the extracted width or height of the nullable block (S1210).

[286] В одном примере, аппаратура кодирования может извлекать позицию последнего значимого коэффициента в пределах диапазона размера обнуляемого блока, меньшего или равного диапазону размера текущего блока, а не исходного текущего блока. Таким образом, коэффициент преобразования, к которому применяется преобразование, может извлекаться в пределах диапазона размера обнуляемого блока, а не текущего блока.[286] In one example, the encoding apparatus may extract the position of the last significant coefficient within a nullable block size range less than or equal to the current block size range, rather than the original current block. Thus, the transform factor to which the transform is applied can be retrieved within the size range of the block being zeroed rather than the current block.

[287] В одном примере, позиция последнего значимого коэффициента может извлекаться на основе префиксного кодового слова, указывающего информацию префикса последнего значимого коэффициента и информацию суффикса последнего значимого коэффициента, и максимальная длина префиксного кодового слова может определяться на основе размера обнуляемого блока.[287] In one example, the position of the last significant coefficient may be retrieved based on a prefix codeword indicating the last significant coefficient prefix information and the last significant coefficient suffix information, and the maximum length of the prefix codeword may be determined based on the size of the nullable block.

[288] Аппаратура кодирования может извлекать контекстную модель для информации позиции последнего значимого коэффициента на основе ширины или высоты текущего блока (S1220).[288] The encoding apparatus may extract a context model for the position information of the last significant coefficient based on the width or height of the current block (S1220).

[289] Согласно варианту осуществления, контекстная модель может извлекаться на основе размера исходного блока преобразования, а не размера обнуляемого блока. В частности, контекстное приращение для информации префикса по оси X и информации префикса по оси Y, соответствующей информации префикса последнего значимого коэффициента, может извлекаться на основе размера исходного блока преобразования.[289] According to an embodiment, the context model may be retrieved based on the size of the original transform block rather than the size of the nullable block. Specifically, the context increment for the X-axis prefix information and the Y-axis prefix information corresponding to the last significant coefficient prefix information can be extracted based on the size of the original transform block.

[290] Аппаратура кодирования может кодировать информацию позиции относительно значения позиции последнего значимого коэффициента на основе извлеченной контекстной модели (S1230).[290] The encoding apparatus may encode the position information relative to the position value of the last significant coefficient based on the extracted context model (S1230).

[291] Как описано выше, информация позиции последнего значимого коэффициента может включать в себя информацию префикса последнего значимого коэффициента и информацию суффикса последнего значимого коэффициента, и значение позиции последнего значимого коэффициента может кодироваться на основе контекстной модели.[291] As described above, the last significant coefficient position information may include last significant coefficient prefix information and last significant coefficient suffix information, and the last significant coefficient position value may be encoded based on the context model.

[292] В настоящем раскрытии сущности, по меньшей мере, одно из квантования/деквантования и/или преобразования/обратного преобразования может опускаться. Когда квантование/деквантование опускается, квантованный коэффициент преобразования может называться "коэффициентом преобразования". Когда преобразование/обратное преобразование опускается, коэффициент преобразования может называться "коэффициентом" или "остаточным коэффициентом" либо по-прежнему может называться "коэффициентом преобразования" для согласованности выражения.[292] In the present disclosure, at least one of quantization/dequantization and/or transform/de-transform may be omitted. When quantization/dequantization is omitted, the quantized conversion factor may be referred to as a "transformation factor". When the transform/inverse transform is omitted, the conversion factor may be called the "coefficient" or "residual coefficient" or may still be called the "transform factor" for consistency of expression.

[293] Дополнительно, в настоящем раскрытии сущности, квантованный коэффициент преобразования и коэффициент преобразования могут называться "коэффициентом преобразования" и "масштабированным коэффициентом преобразования", соответственно. В этом случае, остаточная информация может включать в себя информацию относительно коэффициента(ов) преобразования, и информация относительно коэффициента(ов) преобразования может передаваться в служебных сигналах через синтаксис остаточного кодирования. Коэффициенты преобразования могут извлекаться на основе остаточной информации (или информации относительно коэффициента(ов) преобразования), и масштабированные коэффициенты преобразования могут извлекаться через обратное преобразование (масштабирование) коэффициентов преобразования. Остаточные выборки могут извлекаться на основе обратного преобразования (преобразования) масштабированных коэффициентов преобразования. Эти подробности также могут применяться/выражаться в других частях настоящего раскрытия сущности.[293] Additionally, in the present disclosure, the quantized transform coefficient and the transform coefficient may be referred to as the “transform coefficient” and the “scaled transform coefficient,” respectively. In this case, the residual information may include information regarding the transform coefficient(s), and the information regarding the transform coefficient(s) may be signaled through a residual encoding syntax. Transform coefficients can be extracted based on residual information (or information regarding the transform coefficient(s)), and scaled transform coefficients can be extracted through inverse transform (scaling) of the transform coefficients. Residual samples can be extracted based on the inverse transform (transform) of the scaled transform coefficients. These details may also be applied/expressed in other parts of this disclosure.

[294] В вышеописанных вариантах осуществления, способы поясняются на основе блок-схем последовательности операций способа посредством последовательности этапов или блоков, но настоящее раскрытие сущности не ограничено порядком этапов, и определенный этап может выполняться в порядке или этапе, отличающемся от порядка или этапа, описанного выше, либо одновременно с другим этапом. Дополнительно, специалистам в данной области техники очевидно, что этапы, показанные на блок-схеме последовательности операций способа, не являются единственно возможными, и что другой этап может быть включен, либо один или более этапов блок-схемы последовательности операций способа могут удаляться без влияния на объем настоящего раскрытия сущности.[294] In the above-described embodiments, the methods are explained on the basis of flowcharts of the method through a sequence of steps or blocks, but the present disclosure is not limited to the order of the steps, and a certain step may be performed in an order or step different from the order or step described higher, or simultaneously with another stage. Additionally, those skilled in the art will appreciate that the steps shown in the flowchart are not the only ones possible, and that another step may be included or one or more steps of the flowchart may be deleted without affecting scope of this disclosure.

[295] Вышеописанные способы согласно настоящему раскрытию сущности могут реализовываться как программная форма, и аппаратура кодирования, и/или аппаратура декодирования согласно раскрытию сущности может включаться в устройство для обработки изображений, к примеру, в телевизор, компьютер, смартфон, абонентскую приставку, устройство отображения и т.п.[295] The above-described methods according to the present disclosure may be implemented in software form, and the encoding equipment and/or decoding equipment according to the disclosure may be included in an image processing device, for example, a television, a computer, a smartphone, a set-top box, a display device and so on.

[296] Когда варианты осуществления в настоящем раскрытии сущности осуществляются посредством программного обеспечения, вышеописанные способы могут осуществляться в качестве модулей (процессов, функций и т.п.), чтобы выполнять вышеописанные функции. Модули могут сохраняться в запоминающем устройстве и могут выполняться посредством процессора. Запоминающее устройство может находиться внутри или снаружи процессора и может соединяться с процессором различными известными способами. Процессор может включать в себя специализированную интегральную схему (ASIC), другой набор микросхем, логическую схему и/или устройство обработки данных. Запоминающее устройство может включать в себя постоянное запоминающее устройство (ROM), оперативное запоминающее устройство (RAM), флэш-память, карту памяти, носитель хранения данных и/или другое устройство хранения данных. Таким образом, варианты осуществления, описанные в настоящем раскрытии сущности, могут осуществляться и выполняться в процессоре, микропроцессоре, контроллере или микросхеме. Например, функциональные модули, показанные на каждом чертеже, могут осуществляться и выполняться на компьютере, в процессоре, микропроцессоре, контроллере или микросхеме.[296] When the embodiments in the present disclosure are implemented by software, the above-described methods may be implemented as modules (processes, functions, etc.) to perform the above-described functions. The modules may be stored in a memory device and may be executed by a processor. The storage device may be located inside or outside the processor and may be coupled to the processor in a variety of known ways. The processor may include an application specific integrated circuit (ASIC), another chipset, logic circuit, and/or data processing device. The storage device may include read-only memory (ROM), random access memory (RAM), flash memory, memory card, storage medium, and/or other data storage device. Thus, the embodiments described in the present disclosure may be implemented and executed in a processor, microprocessor, controller, or chip. For example, the functional modules shown in each drawing may be implemented and executed on a computer, processor, microprocessor, controller, or chip.

[297] Дополнительно, аппаратура декодирования и аппаратура кодирования, к которой применяется настоящее раскрытие сущности, могут включаться в широковещательное мультимедийное приемо-передающее устройство, терминал мобильной связи, видеоустройство системы домашнего кинотеатра, видеоустройство системы цифрового кинотеатра, камеру наблюдения, устройство проведения видеочатов, устройство связи в реальном времени, к примеру, видеосвязи, мобильное устройство потоковой передачи, носитель хранения данных, записывающую видеокамеру, устройство предоставления услуг на основе технологии "видео по запросу" (VoD), видеоустройство поверх сетей (OTT), устройство предоставления услуг потоковой передачи по Интернету, трехмерное видеоустройство, видеоустройство системы видеотелефонии и медицинское видеоустройство, и могут использоваться для того, чтобы обрабатывать видеосигнал или сигнал данных. Например, видеоустройство поверх сетей (OTT) может включать в себя игровую приставку, Blu-Ray-проигрыватель, телевизор с доступом в Интернет, систему домашнего кинотеатра, смартфон, планшетный PC, цифровое записывающее видеоустройство (DVR) и т.п.[297] Additionally, the decoding apparatus and encoding apparatus to which the present disclosure applies may be included in a multimedia broadcasting device, a mobile communication terminal, a home theater system video device, a digital cinema system video device, a surveillance camera, a video chat device, a real-time communications such as video communications, mobile streaming device, storage medium, video recording camera, video-on-demand (VoD) service delivery device, over-the-top (OTT) video device, over-the-top streaming service device Internet, a three-dimensional video device, a video telephony system video device and a medical video device, and can be used for processing a video signal or a data signal. For example, an over-the-top (OTT) video device may include a game console, Blu-ray player, Internet-enabled television, home theater system, smartphone, tablet PC, digital video recorder (DVR), etc.

[298] Помимо этого, способ обработки, к которому применяется настоящее раскрытие сущности, может формироваться в форме программы, выполняемой посредством компьютера, и сохраняться на компьютерно-читаемом носителе записи. Мультимедийные данные, имеющие структуру данных согласно настоящему раскрытию сущности, также могут сохраняться на компьютерно-читаемом носителе записи. Компьютерно-читаемый носитель записи включает в себя все виды устройств хранения данных и устройств распределенного хранения данных, на которых сохраняются компьютерно-читаемые данные. Компьютерно-читаемый носитель записи может включать в себя, например, Blu-Ray-диск (BD), универсальную последовательную шину (USB), ROM, PROM, EPROM, EEPROM, RAM, CD-ROM, магнитную ленту, гибкий диск и оптическое устройство хранения данных. Дополнительно, компьютерно-читаемый носитель записи включает в себя среды, осуществленные в форме несущей волны (например, передачи по Интернету). Помимо этого, поток битов, сформированный посредством способа кодирования, может сохраняться на компьютерно-читаемом носителе записи или передаваться через сеть проводной или беспроводной связи. Дополнительно, варианты осуществления настоящего раскрытия сущности могут осуществляться в качестве компьютерного программного продукта посредством программных кодов, и программные коды могут выполняться на компьютере посредством вариантов осуществления настоящего раскрытия сущности. Программные коды могут сохраняться на компьютерно-читаемом носителе.[298] In addition, the processing method to which the present disclosure applies may be formed in the form of a program executed by a computer and stored on a computer-readable recording medium. Multimedia data having a data structure according to the present disclosure may also be stored on a computer-readable recording medium. The computer-readable recording medium includes all kinds of storage devices and distributed storage devices on which computer-readable data is stored. The computer-readable recording medium may include, for example, a Blu-ray disc (BD), a universal serial bus (USB), a ROM, a PROM, an EPROM, an EEPROM, a RAM, a CD-ROM, a magnetic tape, a floppy disk, and an optical device. data storage. Additionally, the computer-readable recording medium includes media implemented in the form of a carrier wave (eg, Internet transmissions). In addition, the bitstream generated by the encoding method may be stored in a computer-readable recording medium or transmitted through a wired or wireless communication network. Additionally, embodiments of the present disclosure may be implemented as a computer program product through program codes, and the program codes may be executed on a computer by embodiments of the present disclosure. The program codes may be stored on a computer-readable medium.

[299] Фиг. 13 иллюстрирует структуру системы потоковой передачи контента, к которой применяется настоящее раскрытие сущности.[299] FIG. 13 illustrates the structure of a content streaming system to which the present disclosure applies.

[300] Дополнительно, система потоковой передачи контента, к которой применяется настоящее раскрытие сущности, может включать в себя главным образом сервер кодирования, потоковый сервер, веб-сервер, хранилище мультимедиа, абонентское оборудование и устройство ввода мультимедиа.[300] Additionally, the content streaming system to which the present disclosure applies may mainly include an encoding server, a streaming server, a web server, a media storage, a user equipment, and a media input device.

[301] Сервер кодирования функционирует для того, чтобы сжимать в цифровые данные контент, вводимый из устройств ввода мультимедиа, таких как смартфон, камера, записывающая видеокамера и т.п., чтобы формировать поток битов и передавать его на потоковый сервер. В качестве другого примера, в случае если устройство ввода мультимедиа, такое как смартфон, камера, записывающая видеокамера и т.п., непосредственно формирует поток битов, сервер кодирования может опускаться. Поток битов может формироваться посредством способа кодирования или способа формирования потоков битов, к которому применяется настоящее раскрытие сущности. Кроме того, потоковый сервер может сохранять поток битов временно во время процесса, чтобы передавать или принимать поток битов.[301] The encoding server functions to digitally compress content input from media input devices such as a smartphone, camera, video recorder, etc. to form a bit stream and transmit it to the streaming server. As another example, in case a media input device such as a smartphone, camera, video recorder, etc. directly generates a bit stream, the encoding server may be omitted. The bitstream may be generated by an encoding method or a bitstream generation method to which the present disclosure applies. In addition, the streaming server may store the bitstream temporarily during a process to transmit or receive the bitstream.

[302] Потоковый сервер передает мультимедийные данные в абонентское оборудование на основе запроса пользователя через веб-сервер, который функционирует в качестве инструментария, который информирует пользователя в отношении того, какая услуга предусмотрена. Когда пользователь запрашивает услугу, которую пользователь хочет, веб-сервер передает запрос на потоковый сервер, и потоковый сервер передает мультимедийные данные пользователю. В этом отношении, система потоковой передачи контента может включать в себя отдельный сервер управления, и в этом случае, сервер управления функционирует для того, чтобы управлять командами/ответами между соответствующим оборудованием в системе потоковой передачи контента.[302] The streaming server transmits multimedia data to the user equipment based on a user's request through a web server, which functions as a tool that informs the user as to what service is provided. When a user requests a service that the user wants, the web server passes the request to the streaming server and the streaming server streams the media data to the user. In this regard, the content streaming system may include a separate control server, in which case, the control server functions to manage commands/responses between associated equipment in the content streaming system.

[303] Потоковый сервер может принимать контент из хранилища мультимедиа и/или сервера кодирования. Например, в случае, если контент принимается из сервера кодирования, контент может приниматься в реальном времени. В этом случае, потоковый сервер может сохранять поток битов в течение предварительно определенного периода времени, чтобы плавно предоставлять услугу потоковой передачи.[303] The streaming server may receive content from a media storage and/or encoding server. For example, in case the content is received from an encoding server, the content may be received in real time. In this case, the streaming server can store the bit stream for a predetermined period of time to smoothly provide the streaming service.

[304] Например, абонентское оборудование может включать в себя мобильный телефон, смартфон, переносной компьютер, цифровой широковещательный терминал, персональное цифровое устройство (PDA), портативный мультимедийный проигрыватель (PMP), навигационное устройство, грифельный планшетный PC, планшетный PC, ультрабук, носимое устройство (например, терминал в виде часов (интеллектуальные часы), терминал в виде очков (интеллектуальные очки), наголовный дисплей (HMD)), цифровой телевизор, настольный компьютер, систему цифровых информационных табло и т.п. Каждый из серверов в системе потоковой передачи контента может работать в качестве распределенного сервера, и в этом случае, данные, принимаемые посредством каждого сервера, могут обрабатываться распределенным способом.[304] For example, subscriber equipment may include a mobile phone, smartphone, laptop computer, digital broadcast terminal, personal digital assistant (PDA), portable media player (PMP), navigation device, tablet PC, tablet PC, ultrabook, wearable device (for example, a watch terminal (smart watch), a glasses terminal (smart glasses), a head-mounted display (HMD)), a digital TV, a desktop computer, a digital signage system, etc. Each of the servers in the content streaming system may operate as a distributed server, in which case, data received through each server may be processed in a distributed manner.

[305] Формула изобретения, раскрытая в данном документе, может комбинироваться различным способом. Например, технические признаки пунктов формулы изобретения на способ настоящего раскрытия сущности могут комбинироваться с возможностью реализовываться или выполняться в аппаратуре, и технические признаки пунктов формулы изобретения на аппаратуру могут комбинироваться с возможностью реализовываться или выполняться в способе. Дополнительно, технические признаки пунктов формулы изобретения на способ и пунктов формулы изобретения на аппаратуру могут комбинироваться с возможностью реализовываться или выполняться в аппаратуре, и технические признаки пунктов формулы изобретения на способ и пунктов формулы изобретения на аппаратуру могут комбинироваться с возможностью реализовываться или выполняться в способе.[305] The claims disclosed herein may be combined in various ways. For example, the technical features of the method claims of the present disclosure may be combined with the ability to be implemented or performed in hardware, and the technical features of the hardware claims may be combined with the ability to be implemented or performed in the method. Additionally, the technical features of the method claims and the hardware claims can be combined with the ability to be implemented or performed in the hardware, and the technical features of the method claims and the hardware claims can be combined with the ability to be implemented or performed in the method.

1. Способ декодирования изображений, осуществляемый посредством аппаратуры декодирования, при этом способ содержит этапы, на которых:1. A method for decoding images, carried out by means of decoding equipment, the method comprising the steps of:

- принимают поток битов, содержащий остаточную информацию;- receive a bit stream containing residual information;

- извлекают коэффициенты преобразования для текущего блока на основе остаточной информации;- extracting conversion coefficients for the current block based on the residual information;

- извлекают остаточные выборки для текущего блока на основе коэффициентов преобразования; и- extract residual samples for the current block based on the transform coefficients; And

- формируют восстановленный кадр на основе остаточных выборок,- form a reconstructed frame based on residual samples,

при этом остаточная информация содержит информацию позиции последнего значимого коэффициента, иwherein the residual information contains information about the position of the last significant coefficient, and

при этом извлечение остаточных выборок содержит этапы, на которых:in this case, the extraction of residual samples contains stages in which:

- извлекают обнуляемый блок для текущего блока;- retrieve a nullable block for the current block;

- извлекают контекстную модель для информации позиции последнего значимого коэффициента на основе ширины или высоты текущего блока;- extracting a context model for the position information of the last significant coefficient based on the width or height of the current block;

- извлекают значение информации позиции последнего значимого коэффициента на основе контекстной модели; и- extract the position information value of the last significant coefficient based on the context model; And

- извлекают позицию последнего значимого коэффициента на основе значения информации позиции последнего значимого коэффициента и ширины или высоты обнуляемого блока.- extracting the position of the last significant coefficient based on the value of the position information of the last significant coefficient and the width or height of the block being reset.

2. Способ декодирования изображений по п. 1, в котором ширина обнуляемого блока меньше ширины текущего блока.2. The method of decoding images according to claim 1, in which the width of the block being reset is less than the width of the current block.

3. Способ декодирования изображений по п. 1, в котором высота обнуляемого блока меньше высоты текущего блока.3. The method of decoding images according to claim 1, in which the height of the block being reset is less than the height of the current block.

4. Способ декодирования изображений по п. 1, в котором информация позиции последнего значимого коэффициента содержит информацию префикса последнего значимого коэффициента и информацию суффикса последнего значимого коэффициента,4. The image decoding method according to claim 1, wherein the last significant coefficient position information contains last significant coefficient prefix information and last significant coefficient suffix information,

при этом информация префикса последнего значимого коэффициента содержит информацию префикса по оси X и информацию префикса по оси Y, иwherein the last significant coefficient prefix information comprises X-axis prefix information and Y-axis prefix information, and

при этом контекстное приращение для информации префикса по оси X и информации префикса по оси Y извлекается на основе ширины или высоты текущего блока.wherein the context increment for the X-axis prefix information and the Y-axis prefix information is retrieved based on the width or height of the current block.

5. Способ декодирования изображений по п. 4, в котором максимальное значение, разрешенное для информации префикса последнего значимого коэффициента, извлекается на основе размера обнуляемого блока.5. The image decoding method of claim 4, wherein the maximum value allowed for the last significant coefficient prefix information is extracted based on the size of the nullable block.

6. Способ декодирования изображений по п. 1, в котором ширина или высота обнуляемого блока извлекается на основе ширины или высоты текущего блока.6. The image decoding method of claim 1, wherein the width or height of a block to be reset is retrieved based on the width or height of the current block.

7. Способ декодирования изображений по п. 6, в котором на основе ширины текущего блока, равной 32, и высоты текущего блока, равной 32 или меньше, ширина обнуляемого блока задается равной 16, и7. The image decoding method as set forth in claim 6, wherein, based on a current block width of 32 and a current block height of 32 or less, a nullable block width is set to 16, and

при этом на основе ширины текущего блока, не равной 32, или высоты текущего блока, равной 64 или больше, ширина обнуляемого блока задается равной меньшему значению из ширины текущего блока и 32.wherein, based on the width of the current block not being 32 or the height of the current block being 64 or greater, the width of the nullable block is set to the lesser of the current block width and 32.

8. Способ декодирования изображений по п. 6, в котором на основе высоты текущего блока, равной 32, и ширины текущего блока, равной 32 или меньше, высота обнуляемого блока задается равной 16, и8. The image decoding method as set forth in claim 6, wherein based on the height of the current block being 32 and the width of the current block being 32 or less, the height of the nullable block is set to 16, and

при этом на основе высоты текущего блока, не равной 32, или ширины текущего блока, равной 64 или больше, высота обнуляемого блока задается равной меньшему значению из высоты текущего блока и 32.wherein, based on the height of the current block not being 32 or the width of the current block being 64 or greater, the height of the nullable block is set to the lesser of the height of the current block and 32.

9. Способ кодирования изображений, осуществляемый посредством аппаратуры кодирования изображений, при этом способ содержит этапы, на которых:9. A method for encoding images, carried out by means of image encoding equipment, the method comprising the steps of:

- извлекают остаточные выборки для текущего блока;- extract residual samples for the current block;

- извлекают квантованные коэффициенты преобразования на основе остаточных выборок для текущего блока; и- extract quantized transform coefficients based on residual samples for the current block; And

- кодируют остаточную информацию, содержащую информацию относительно квантованных коэффициентов преобразования,- encode residual information containing information regarding the quantized transformation coefficients,

при этом остаточная информация содержит информацию позиции последнего значимого коэффициента, иwherein the residual information contains information about the position of the last significant coefficient, and

при этом кодирование остаточной информации содержит этапы, на которых:in this case, coding of residual information contains stages in which:

- извлекают обнуляемый блок для текущего блока;- retrieve a nullable block for the current block;

- извлекают позицию последнего значимого коэффициента на основе ширины или высоты обнуляемого блока;- extracting the position of the last significant coefficient based on the width or height of the block being reset;

- извлекают контекстную модель для информации позиции последнего значимого коэффициента на основе ширины или высоты текущего блока; и- extracting a context model for the position information of the last significant coefficient based on the width or height of the current block; And

- кодируют информацию позиции последнего значимого коэффициента на основе контекстной модели.- encoding information about the position of the last significant coefficient based on the context model.

10. Способ кодирования изображений по п. 9, в котором ширина обнуляемого блока меньше ширины текущего блока.10. The image encoding method according to claim 9, in which the width of the block being reset is less than the width of the current block.

11. Способ кодирования изображений по п. 9, в котором высота обнуляемого блока меньше высоты текущего блока.11. The image encoding method according to claim 9, in which the height of the block being reset is less than the height of the current block.

12. Способ кодирования изображений по п. 9, в котором информация позиции последнего значимого коэффициента содержит информацию префикса последнего значимого коэффициента и информацию суффикса последнего значимого коэффициента,12. The image encoding method according to claim 9, wherein the last significant coefficient position information contains last significant coefficient prefix information and last significant coefficient suffix information,

при этом информация префикса последнего значимого коэффициента содержит информацию префикса по оси X и информацию префикса по оси Y, иwherein the last significant coefficient prefix information comprises X-axis prefix information and Y-axis prefix information, and

при этом контекстное приращение для информации префикса по оси X и информации префикса по оси Y извлекается на основе ширины или высоты текущего блока.wherein the context increment for the X-axis prefix information and the Y-axis prefix information is retrieved based on the width or height of the current block.

13. Способ кодирования изображений по п. 12, в котором максимальное значение, разрешенное для информации префикса последнего значимого коэффициента, извлекается на основе размера обнуляемого блока.13. The image encoding method of claim 12, wherein the maximum value allowed for the last significant coefficient prefix information is extracted based on the size of the nullable block.

14. Способ кодирования изображений по п. 9, в котором ширина или высота обнуляемого блока извлекается на основе ширины или высоты текущего блока.14. The image encoding method of claim 9, wherein the width or height of a block to be nulled is retrieved based on the width or height of the current block.

15. Компьютерно-читаемый цифровой носитель хранения данных, который сохраняет информацию индикатора, чтобы предписывать выполнение способа декодирования изображений, при этом способ декодирования изображений содержит:15. A computer-readable digital storage medium that stores indicator information to instruct execution of an image decoding method, wherein the image decoding method comprises:

- прием потока битов, содержащего остаточную информацию;- receiving a bit stream containing residual information;

- извлечение квантованных коэффициентов преобразования для текущего блока на основе остаточной информации;- extracting quantized transformation coefficients for the current block based on residual information;

- извлечение остаточных выборок для текущего блока на основе квантованных коэффициентов преобразования; и- extracting residual samples for the current block based on quantized transform coefficients; And

- формирование восстановленного кадра на основе остаточных выборок,- formation of a reconstructed frame based on residual samples,

при этом остаточная информация содержит информацию позиции последнего значимого коэффициента, иwherein the residual information contains information about the position of the last significant coefficient, and

при этом извлечение остаточной выборки содержит:whereby the residual sample extraction contains:

- извлечение обнуляемого блока для текущего блока;- retrieving a reset block for the current block;

- извлечение контекстной модели для информации позиции последнего значимого коэффициента на основе ширины или высоты текущего блока;- extracting a context model for position information of the last significant coefficient based on the width or height of the current block;

- извлечение значения информации позиции последнего значимого коэффициента на основе контекстной модели; и- extracting the position information value of the last significant coefficient based on the context model; And

- извлечение позиции последнего значимого коэффициента на основе значения информации позиции последнего значимого коэффициента и ширины или высоты обнуляемого блока.- extracting the position of the last significant coefficient based on the value of the position information of the last significant coefficient and the width or height of the block being reset.

Claims (37)

1. Способ декодирования изображений, осуществляемый посредством аппаратуры декодирования, при этом способ содержит этапы, на которых:1. A method for decoding images, carried out by means of decoding equipment, the method comprising the steps of: - принимают поток битов, содержащий остаточную информацию;- receive a bit stream containing residual information; - извлекают коэффициенты преобразования для текущего блока посредством выполнения остаточного кодирования на основе остаточной информации; - extracting transform coefficients for the current block by performing residual encoding based on the residual information; - извлекают остаточные выборки путем процесса преобразования для коэффициентов преобразования; - extracting residual samples through a transformation process for transformation coefficients; при этом выполнение остаточного кодирования содержит этапы, на которых:in this case, the implementation of residual encoding contains stages in which: - извлекают обнуляемый блок для текущего блока на основе информации флага, связанной с тем, используется ли преобразование субблока для текущего блока, значения, связанного с множественным выбором преобразования, и ширины и высоты текущего блока;- extracting a nullable block for the current block based on flag information associated with whether a subblock transformation is used for the current block, a value associated with the transformation multiple selection, and the width and height of the current block; - декодируют информацию позиции последнего значимого коэффициента для текущего блока; и- decode position information of the last significant coefficient for the current block; And - декодируют коэффициенты преобразования для текущего блока;- decode the transformation coefficients for the current block; причем декодирование информации позиции последнего значимого коэффициента содержит этапы, на которых:wherein decoding the position information of the last significant coefficient contains the steps of: - извлекают контекстную модель для информации позиции последнего значимого коэффициента; и- extracting a context model for information about the position of the last significant coefficient; And - извлекают значение информации позиции последнего значимого коэффициента на основе контекстной модели; - extract the position information value of the last significant coefficient based on the context model; причем контекстную модель извлекают на основе ширины и высоты текущего блока, иwherein the context model is retrieved based on the width and height of the current block, and причем значение информации позиции последнего значимого коэффициента извлекают на основе ширины и высоты обнуляемого блока.wherein the position information value of the last significant coefficient is retrieved based on the width and height of the block being reset. 2. Способ декодирования изображений по п. 1, в котором ширина обнуляемого блока меньше ширины текущего блока.2. The method of decoding images according to claim 1, in which the width of the block being reset is less than the width of the current block. 3. Способ декодирования изображений по п. 1, в котором высота обнуляемого блока меньше высоты текущего блока.3. The method of decoding images according to claim 1, in which the height of the block being reset is less than the height of the current block. 4. Способ декодирования изображений по п. 1, в котором информация позиции последнего значимого коэффициента содержит информацию префикса последнего значимого коэффициента и информацию суффикса последнего значимого коэффициента,4. The image decoding method according to claim 1, wherein the last significant coefficient position information contains last significant coefficient prefix information and last significant coefficient suffix information, при этом информация префикса последнего значимого коэффициента содержит информацию префикса по оси X и информацию префикса по оси Y, иwherein the last significant coefficient prefix information comprises X-axis prefix information and Y-axis prefix information, and при этом контекстное приращение для информации префикса по оси X и информации префикса по оси Y извлекается на основе ширины или высоты текущего блока.wherein the context increment for the X-axis prefix information and the Y-axis prefix information is retrieved based on the width or height of the current block. 5. Способ декодирования изображений по п. 4, в котором максимальное значение, разрешенное для информации префикса последнего значимого коэффициента, извлекается на основе размера обнуляемого блока.5. The image decoding method of claim 4, wherein the maximum value allowed for the last significant coefficient prefix information is extracted based on the size of the nullable block. 6. Способ кодирования изображений, осуществляемый посредством аппаратуры кодирования изображений, при этом способ содержит этапы, на которых:6. A method for encoding images, carried out by means of image encoding equipment, the method comprising the steps of: - извлекают остаточные выборки для текущего блока;- extract residual samples for the current block; - извлекают коэффициенты преобразования путем процесса преобразования для остаточных выборок; и- extracting transformation coefficients through a transformation process for the residual samples; And - кодируют информацию изображения, содержащую информацию по коэффициентам преобразования, посредством выполнения остаточного кодирования,- encoding image information containing information on transform coefficients by performing residual encoding, при этом выполнение остаточного кодирования содержит этапы, на которых:in this case, the implementation of residual encoding contains stages in which: - извлекают обнуляемый блок для текущего блока на основе того, используется ли преобразование субблока для текущего блока, значения, связанного с множественным выбором преобразования, и ширины и высоты текущего блока;- extracting a nullable block for the current block based on whether a subblock transformation is used for the current block, the value associated with the transformation multiple selection, and the width and height of the current block; - извлекают значение информации позиции последнего значимого коэффициента для текущего блока;- extracting the position information value of the last significant coefficient for the current block; - извлекают контекстную модель для информации позиции последнего значимого коэффициента;- extracting a context model for information about the position of the last significant coefficient; - кодируют информацию позиции последнего значимого коэффициента на основе контекстной модели; и- encoding information about the position of the last significant coefficient based on the context model; And - кодируют коэффициенты преобразования для текущего блока,- encode the transformation coefficients for the current block, причем контекстную модель извлекают на основе ширины и высоты текущего блока, иwherein the context model is retrieved based on the width and height of the current block, and причем значение информации позиции последнего значимого коэффициента извлекают на основе ширины и высоты обнуляемого блока.wherein the position information value of the last significant coefficient is retrieved based on the width and height of the block being reset. 7. Способ кодирования изображений по п. 6, в котором ширина обнуляемого блока меньше ширины текущего блока.7. The image encoding method according to claim 6, in which the width of the block being reset is less than the width of the current block. 8. Способ кодирования изображений по п. 6, в котором высота обнуляемого блока меньше высоты текущего блока.8. The image encoding method according to claim 6, in which the height of the block being reset is less than the height of the current block. 9. Способ кодирования изображений по п. 6, в котором информация позиции последнего значимого коэффициента содержит информацию префикса последнего значимого коэффициента и информацию суффикса последнего значимого коэффициента,9. The image encoding method according to claim 6, wherein the last significant coefficient position information contains last significant coefficient prefix information and last significant coefficient suffix information, при этом информация префикса последнего значимого коэффициента содержит информацию префикса по оси X и информацию префикса по оси Y, иwherein the last significant coefficient prefix information comprises X-axis prefix information and Y-axis prefix information, and при этом контекстное приращение для информации префикса по оси X и информации префикса по оси Y извлекается на основе ширины или высоты текущего блока.wherein the context increment for the X-axis prefix information and the Y-axis prefix information is retrieved based on the width or height of the current block. 10. Способ кодирования изображений по п. 9, в котором максимальное значение, разрешенное для информации префикса последнего значимого коэффициента, извлекается на основе размера обнуляемого блока.10. The image encoding method of claim 9, wherein the maximum value allowed for the last significant coefficient prefix information is extracted based on the size of the nullable block.
RU2022125133A 2019-03-12 2020-03-12 Image coding method based on transformation and a device RU2805218C2 (en)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US62/817,494 2019-03-12
US62/817,490 2019-03-12
US62/822,000 2019-03-21
US62/823,571 2019-03-25

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
RU2021129459A Division RU2780814C1 (en) 2019-03-12 2020-03-12 Method for encoding images based on conversion and a device for this

Publications (2)

Publication Number Publication Date
RU2022125133A RU2022125133A (en) 2022-10-04
RU2805218C2 true RU2805218C2 (en) 2023-10-12

Family

ID=

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130003856A1 (en) * 2011-07-01 2013-01-03 Samsung Electronics Co. Ltd. Mode-dependent transforms for residual coding with low latency
WO2013006446A1 (en) * 2011-07-01 2013-01-10 Qualcomm Incorporated Context adaptive entropy coding for non-square blocks in video coding
US8902988B2 (en) * 2010-10-01 2014-12-02 Qualcomm Incorporated Zero-out of high frequency coefficients and entropy coding retained coefficients using a joint context model
RU2576590C2 (en) * 2011-06-28 2016-03-10 Квэлкомм Инкорпорейтед Derivation of position in scanning order of last significant transform coefficient in video coding
EP3229473A1 (en) * 2011-04-15 2017-10-11 BlackBerry Limited Methods and devices for coding and decoding the position of the last significant coefficient

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8902988B2 (en) * 2010-10-01 2014-12-02 Qualcomm Incorporated Zero-out of high frequency coefficients and entropy coding retained coefficients using a joint context model
EP3229473A1 (en) * 2011-04-15 2017-10-11 BlackBerry Limited Methods and devices for coding and decoding the position of the last significant coefficient
RU2576590C2 (en) * 2011-06-28 2016-03-10 Квэлкомм Инкорпорейтед Derivation of position in scanning order of last significant transform coefficient in video coding
US20130003856A1 (en) * 2011-07-01 2013-01-03 Samsung Electronics Co. Ltd. Mode-dependent transforms for residual coding with low latency
WO2013006446A1 (en) * 2011-07-01 2013-01-10 Qualcomm Incorporated Context adaptive entropy coding for non-square blocks in video coding

Similar Documents

Publication Publication Date Title
KR102602614B1 (en) Image coding method based on Transformation and apparatus
KR102642220B1 (en) Image decoding method using context-coded sign flag in image coding system and apparatus therefor
KR20210133299A (en) Video coding method and apparatus based on BDPCM
KR20210105996A (en) Video decoding method and apparatus using residual information in video coding system
KR20210089171A (en) Video coding method and apparatus based on quadratic transformation
AU2024200638A1 (en) Transform-based image coding method and device therefor
US20230421780A1 (en) Video coding method on basis of transformation, and device therefor
KR102605674B1 (en) Video coding method and apparatus using deblocking filtering
JP7453347B2 (en) Image decoding method and device using simplified residual data coding in image coding system
US20220295105A1 (en) Image or video coding based on escape binarization in palette mode
RU2805218C2 (en) Image coding method based on transformation and a device
RU2780814C1 (en) Method for encoding images based on conversion and a device for this
KR20240014631A (en) Transform coefficient coding method and apparatus
RU2806813C2 (en) Method and device for image coding based on bdpcm
RU2815810C2 (en) Encoding information on set of transformation kernels
RU2792223C1 (en) Information coding regarding a set of transformation kernels
RU2806796C1 (en) Method for encoding conversion factor based on high frequency zeroing and equipment for this
RU2808004C2 (en) Method and device for internal prediction based on internal subsegments in image coding system
RU2795696C2 (en) Image encoding transformation based on internal prediction
RU2781079C1 (en) Transformation when encoding images based on internal prediction
RU2804732C2 (en) Method and device for image encoding/decoding for transmission of color signal component prediction in service signals according to whether palette mode is applicable or not, and method for bit stream transmission
RU2817300C2 (en) Method and apparatus for encoding/decoding images for transmitting carrier chrominance signal components prediction information in service signals according to whether or not palette mode is applicable, and method for transmitting bitstream
RU2783336C1 (en) Bdpcm-based method for encoding images and apparatus therefor
RU2809518C2 (en) Method and device for encoding/decoding images using filtering and method for transmitting a bit stream
RU2803457C2 (en) Image encoding method based on transformation and device for its implementation