RU2776033C1 - Method for encoding the conversion coefficient based on high-frequency zeroing and equipment therefor - Google Patents

Method for encoding the conversion coefficient based on high-frequency zeroing and equipment therefor Download PDF

Info

Publication number
RU2776033C1
RU2776033C1 RU2021109669A RU2021109669A RU2776033C1 RU 2776033 C1 RU2776033 C1 RU 2776033C1 RU 2021109669 A RU2021109669 A RU 2021109669A RU 2021109669 A RU2021109669 A RU 2021109669A RU 2776033 C1 RU2776033 C1 RU 2776033C1
Authority
RU
Russia
Prior art keywords
information
prefix
current block
last
transform coefficient
Prior art date
Application number
RU2021109669A
Other languages
Russian (ru)
Inventor
Дзунгах ЧОИ
Сунми ЙОО
Дзин ХЕО
Линг ЛИ
Дзангвон ЧОЙ
Сеунгхван КИМ
Original Assignee
ЭлДжи ЭЛЕКТРОНИКС ИНК.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ЭлДжи ЭЛЕКТРОНИКС ИНК. filed Critical ЭлДжи ЭЛЕКТРОНИКС ИНК.
Application granted granted Critical
Publication of RU2776033C1 publication Critical patent/RU2776033C1/en

Links

Images

Abstract

FIELD: encoding.
SUBSTANCE: invention relates to image encoding tools. Residual discrete samples are obtained for the current block. Conversion coefficients are obtained for the current block based on the residual discrete samples for the current block. The residual information associated with the conversion coefficients is encoded. The current block therein includes an area of low-frequency conversion coefficients, including at least one significant conversion coefficient, and an area other than the area of low-frequency conversion coefficients, including a zero conversion coefficient. The residual information includes the prefix information of the last significant coefficient and the suffix information of the last significant coefficient with respect to the position of the last non-zero conversion coefficient from the conversion coefficients for the current block. The position of the last non-zero conversion coefficient is based on the prefix code word and the suffix information of the last significant coefficient.
EFFECT: increase in the efficiency of encoding.
16 cl, 13 dwg, 13 tbl

Description

Уровень техникиState of the art

Область техники, к которой относится изобретениеThe technical field to which the invention belongs

[1] Настоящее раскрытие относится к технологии кодирования изображений, а более конкретно, к способу кодирования коэффициента преобразования на основе высокочастотного обнуления в системе кодирования изображений и к оборудованию для этого.[1] The present disclosure relates to an image coding technology, and more specifically, to a method for encoding a transform coefficient based on high-frequency nulling in an image coding system, and equipment therefor.

Описание предшествующего уровня техникиDescription of the prior art

[2] В наше время спрос на высококачественные изображения/видео высокого разрешения, к примеру, 4K, 8K или изображения/видео еще более сверхвысокой четкости (UHD) растет в различных областях техники. По мере того, как данные изображений/видео приобретают все более высокое разрешение и более высокое качество, передаваемый объем информации или объем в битах увеличивается по сравнению с традиционными данными изображений. Следовательно, когда данные изображений передаются с использованием такой среды, как традиционная проводная/беспроводная широкополосная линия, или данные изображений/видео сохраняются с использованием существующего носителя хранения данных, затраты на передачу и затраты на хранение для них увеличиваются.[2] Nowadays, the demand for high-quality high-definition images/videos, such as 4K, 8K or even higher ultra-high definition (UHD) images/videos, is growing in various fields of technology. As image/video data becomes higher resolution and higher quality, the amount of information or bits to be transmitted increases compared to conventional image data. Therefore, when image data is transmitted using a medium such as a conventional wired/wireless broadband line, or image/video data is stored using an existing storage medium, transmission costs and storage costs increase therefor.

[3] Дополнительно, в наше время интерес и спрос на иммерсивное мультимедиа, такое как контент виртуальной реальности (VR), искусственной реальности (AR) или голограмма и т.п., растет, и широковещательная передача для изображений/видео, имеющих признаки изображений, отличающиеся от признаков действительных изображений, таких как игровое изображение, увеличивается.[3] Additionally, nowadays, the interest and demand for immersive media such as virtual reality (VR), artificial reality (AR) or hologram content, etc. is growing, and broadcasting for images/videos having image features , different from the features of the actual images, such as the game image, is increased.

[4] Соответственно, имеется потребность в высокоэффективной технологии сжатия изображений/видео для эффективного сжатия и передачи либо сохранения и воспроизведения информации высококачественных изображений/видео высокого разрешения, имеющих различные признаки, как описано выше.[4] Accordingly, there is a need for a high-performance image/video compression technology for efficiently compressing and transmitting or storing and reproducing high-quality high-resolution image/video information having various features as described above.

Сущность изобретенияThe essence of the invention

[5] Техническая проблема, которая должна разрешаться посредством настоящего раскрытия, заключается в предоставлении способа и оборудования, которые повышают эффективность кодирования изображений.[5] The technical problem to be solved by the present disclosure is to provide a method and equipment that improves image coding efficiency.

[6] Другая техническая проблема, которая должна разрешаться посредством настоящего раскрытия, заключается в предоставлении способа и оборудования, которые повышают эффективность остаточного кодирования.[6] Another technical problem to be solved by the present disclosure is to provide a method and equipment that improves the efficiency of residual coding.

[7] Еще одна другая техническая проблема, которая должна разрешаться посредством настоящего раскрытия, заключается в предоставлении способа и оборудования, которые повышают эффективность кодирования на уровне коэффициентов преобразования.[7] Yet another technical problem to be solved by the present disclosure is to provide a method and equipment that improves coding efficiency at the transform coefficient level.

[8] Еще одна другая техническая проблема, которая должна разрешаться посредством настоящего раскрытия, заключается в предоставлении способа и оборудования, которые повышают эффективность остаточного кодирования посредством кодирования коэффициента преобразования на основе высокочастотного обнуления.[8] Yet another technical problem to be solved by the present disclosure is to provide a method and equipment that improves residual coding efficiency by high-frequency nulling-based transform coefficient coding.

[9] Еще одна другая проблема, которая должна разрешаться посредством настоящего раскрытия, заключается в предоставлении способа и оборудования, которые кодируют информацию позиции последнего значимого коэффициента в текущем блоке (или текущем блоке преобразования) на основе высокочастотного обнуления.[9] Yet another problem to be solved by the present disclosure is to provide a method and equipment that encodes position information of the last significant coefficient in the current block (or current transform block) based on high frequency nulling.

[10] Еще одна другая техническая проблема, которая должна разрешаться посредством настоящего раскрытия, заключается в предоставлении способа и оборудования, которые извлекают максимальную длину кодового слова, представляющего последний значимый коэффициент преобразования, на основе размера области в текущем блоке, к которому не применяется высокочастотное обнуление, когда коэффициенты преобразования для текущего блока (или текущего блока преобразования) кодируются на основе высокочастотного обнуления.[10] Yet another technical problem to be solved by the present disclosure is to provide a method and equipment that extracts the maximum length of a codeword representing the last significant transform coefficient based on the size of a region in the current block to which no high-frequency nulling is applied. when the transform coefficients for the current block (or current transform block) are encoded based on high-frequency nulling.

[11] Еще одна другая техническая проблема, которая должна разрешаться посредством настоящего раскрытия, заключается в предоставлении способа и оборудования, которые преобразуют в двоичную форму информацию префикса последнего значимого коэффициента и информацию суффикса последнего значимого коэффициента, когда выполняется высокочастотное обнуление.[11] Yet another technical problem to be solved by the present disclosure is to provide a method and equipment that binarizes the last significant coefficient prefix information and the last significant coefficient suffix information when high frequency nulling is performed.

[12] Согласно примеру настоящего раскрытия, предусмотрен способ декодирования изображений, который осуществляется посредством оборудования декодирования. Способ включает в себя прием потока битов, включающего в себя остаточную информацию; извлечение квантованных коэффициентов преобразования для текущего блока на основе остаточной информации, включенной в поток битов; извлечение коэффициентов преобразования для текущего блока из квантованных коэффициентов преобразования на основе процесса обратного квантования; извлечение остаточных выборок для текущего блока посредством применения обратного преобразования к извлеченным коэффициентам преобразования; и формирование восстановленного кадра на основе остаточных выборок для текущего блока, при этом каждый из коэффициентов преобразования для текущего блока связан с областью высокочастотных коэффициентов преобразования, состоящей из коэффициента преобразования 0, или с областью низкочастотных коэффициентов преобразования, включающей в себя, по меньшей мере, один значимый коэффициент преобразования, остаточная информация включает в себя информацию префикса последнего значимого коэффициента и информацию суффикса последнего значимого коэффициента касаемо позиции последнего ненулевого коэффициента преобразования из числа коэффициентов преобразования для текущего блока, позиция последнего ненулевого коэффициента преобразования определяется на основе префиксного кодового слова, которое представляет информацию префикса последнего значимого коэффициента и информацию суффикса последнего значимого коэффициента, и максимальная длина префиксного кодового слова определяется на основе размера области низкочастотных коэффициентов преобразования.[12] According to an example of the present disclosure, an image decoding method is provided, which is performed by decoding equipment. The method includes receiving a bitstream including residual information; extracting quantized transform coefficients for the current block based on the residual information included in the bitstream; extracting transform coefficients for the current block from the quantized transform coefficients based on an inverse quantization process; extracting residual samples for the current block by applying an inverse transform to the extracted transform coefficients; and generating a reconstructed frame based on the residual samples for the current block, wherein each of the transform coefficients for the current block is associated with a high frequency transform coefficient region consisting of a transform coefficient of 0, or with a low frequency transform coefficient region including at least one significant transform coefficient, the residual information includes the last significant coefficient prefix information and the last significant coefficient suffix information regarding the position of the last non-zero transform coefficient among the transform coefficients for the current block, the position of the last non-zero transform coefficient is determined based on the prefix codeword that represents the prefix information the last significant coefficient and the suffix information of the last significant coefficient, and the maximum length of the prefix codeword is determined based on the area size low-frequency conversion coefficients.

[13] Согласно другому примеру настоящего раскрытия, предусмотрено оборудование декодирования для выполнения декодирования изображений. Оборудование декодирования включает в себя энтропийный декодер, который принимает поток битов, включающий в себя остаточную информацию, и извлекает квантованные коэффициенты преобразования для текущего блока на основе остаточной информации, включенной в поток битов; деквантователь, который извлекает коэффициенты преобразования для текущего блока из квантованных коэффициентов преобразования на основе процесса обратного квантования; обратный преобразователь, который извлекает остаточные выборки для текущего блока посредством применения обратного преобразования к извлеченным коэффициентам преобразования; и сумматор, который формирует восстановленный кадр на основе остаточных выборок для текущего блока, при этом каждый из коэффициентов преобразования для текущего блока связан с областью высокочастотных коэффициентов преобразования, состоящей из коэффициента преобразования 0, или с областью низкочастотных коэффициентов преобразования, включающей в себя, по меньшей мере, один значимый коэффициент преобразования, остаточная информация включает в себя информацию префикса последнего значимого коэффициента и информацию суффикса последнего значимого коэффициента касаемо позиции последнего ненулевого коэффициента преобразования из числа коэффициентов преобразования для текущего блока, позиция последнего ненулевого коэффициента преобразования определяется на основе префиксного кодового слова, которое представляет информацию префикса последнего значимого коэффициента и информацию суффикса последнего значимого коэффициента, и максимальная длина префиксного кодового слова определяется на основе размера области низкочастотных коэффициентов преобразования.[13] According to another example of the present disclosure, decoding equipment is provided to perform image decoding. The decoding equipment includes an entropy decoder that receives a bitstream including residual information and extracts quantized transform coefficients for a current block based on the residual information included in the bitstream; a dequantizer that extracts transform coefficients for the current block from the quantized transform coefficients based on an inverse quantization process; an inverse transform that extracts residual samples for the current block by applying an inverse transform to the extracted transform coefficients; and an adder that generates a reconstructed frame based on the residual samples for the current block, wherein each of the transform coefficients for the current block is associated with a high frequency transform coefficient region consisting of a transform coefficient of 0, or with a low frequency transform coefficient region including at least least one significant transform coefficient, the residual information includes the last significant coefficient prefix information and the last significant coefficient suffix information regarding the position of the last non-zero transform coefficient among the transform coefficients for the current block, the position of the last non-zero transform coefficient is determined based on the prefix codeword, which represents the last significant coefficient prefix information and the last significant coefficient suffix information, and the maximum length of the prefix codeword is determined based on times a measure of the region of low-frequency transform coefficients.

[14] Согласно еще одному другому примеру раскрытия, предусмотрен способ кодирования изображений, который осуществляется посредством оборудования кодирования. Способ включает в себя извлечение остаточных выборок для текущего блока; извлечение коэффициентов преобразования для текущего блока посредством преобразования остаточных выборок для текущего блока; извлечение квантованных коэффициентов преобразования из коэффициентов преобразования на основе процесса квантования; и кодирование остаточной информации, включающей в себя информацию относительно квантованных коэффициентов преобразования, при этом каждый из коэффициентов преобразования для текущего блока связан с областью высокочастотных коэффициентов преобразования, состоящей из коэффициента преобразования 0, или с областью низкочастотных коэффициентов преобразования, включающей в себя, по меньшей мере, один значимый коэффициент преобразования, остаточная информация включает в себя информацию префикса последнего значимого коэффициента и информацию суффикса последнего значимого коэффициента касаемо позиции последнего ненулевого коэффициента преобразования из числа коэффициентов преобразования для текущего блока, позиция последнего ненулевого коэффициента преобразования основана на префиксном кодовом слове, которое представляет информацию префикса последнего значимого коэффициента и информацию суффикса последнего значимого коэффициента, и максимальная длина префиксного кодового слова определяется на основе размера области низкочастотных коэффициентов преобразования.[14] According to yet another example of the disclosure, an image encoding method is provided, which is performed by encoding equipment. The method includes extracting residual samples for the current block; extracting transform coefficients for the current block by transforming the residual samples for the current block; extracting quantized transform coefficients from the transform coefficients based on the quantization process; and encoding the residual information including information regarding the quantized transform coefficients, wherein each of the transform coefficients for the current block is associated with a high frequency transform coefficient region consisting of a transform coefficient of 0, or with a low frequency transform coefficient region including at least , one significant transform coefficient, the residual information includes the last significant coefficient prefix information and the last significant coefficient suffix information regarding the position of the last non-zero transform coefficient among the transform coefficients for the current block, the position of the last non-zero transform coefficient is based on the prefix codeword that represents the information the last significant coefficient prefix and the last significant coefficient suffix information, and the maximum length of the prefix codeword is determined by o again the size of the region of low-frequency transform coefficients.

[15] Согласно еще одному другому примеру настоящего раскрытия, предусмотрено оборудование кодирования для выполнения кодирования изображений. Оборудование кодирования включает в себя вычитатель, который извлекает остаточные выборки для текущего блока; преобразователь, который извлекает коэффициенты преобразования для текущего блока посредством преобразования остаточных выборок для текущего блока; квантователь, который извлекает квантованные коэффициенты преобразования из коэффициентов преобразования на основе процесса квантования; и энтропийный кодер, который кодирует остаточную информацию, включающую в себя информацию относительно квантованных коэффициентов преобразования, при этом каждый из коэффициентов преобразования для текущего блока связан с областью высокочастотных коэффициентов преобразования, состоящей из коэффициента преобразования 0, или с областью низкочастотных коэффициентов преобразования, включающей в себя, по меньшей мере, один значимый коэффициент преобразования, остаточная информация включает в себя информацию префикса последнего значимого коэффициента и информацию суффикса последнего значимого коэффициента касаемо позиции последнего ненулевого коэффициента преобразования из числа коэффициентов преобразования для текущего блока, позиция последнего ненулевого коэффициента преобразования основана на префиксном кодовом слове, которое представляет информацию префикса последнего значимого коэффициента и информацию суффикса последнего значимого коэффициента, и максимальная длина префиксного кодового слова определяется на основе размера области низкочастотных коэффициентов преобразования.[15] According to yet another example of the present disclosure, coding equipment is provided for performing image coding. The encoding hardware includes a subtractor that extracts residual samples for the current block; a transformer that extracts transform coefficients for the current block by transforming the residual samples for the current block; a quantizer that extracts quantized transform coefficients from the transform coefficients based on the quantization process; and an entropy encoder that encodes residual information including information about quantized transform coefficients, wherein each of the transform coefficients for the current block is associated with a high frequency transform coefficient region consisting of a transform coefficient of 0, or with a low frequency transform coefficient region including , at least one significant transform coefficient, the residual information includes the last significant coefficient prefix information and the last significant coefficient suffix information regarding the position of the last non-zero transform coefficient among the transform coefficients for the current block, the position of the last non-zero transform coefficient is based on the prefix codeword , which represents the last significant coefficient prefix information and the last significant coefficient suffix information, and the maximum length of the prefix code words is determined based on the size of the region of low-frequency transform coefficients.

[16] Согласно еще одному другому примеру настоящего раскрытия, предусмотрен декодерочитаемый носитель данных, который хранит информацию относительно инструкций, которые инструктируют оборудованию декодирования видео осуществлять способы декодирования согласно некоторым примерам.[16] According to yet another example of the present disclosure, a decoder-readable storage medium is provided that stores information regarding instructions that instruct video decoding equipment to perform decoding methods according to some examples.

[17] Согласно еще одному другому примеру настоящего раскрытия, предусмотрен декодерочитаемый носитель данных, который хранит информацию относительно инструкций, которые инструктируют оборудованию декодирования видео осуществлять способ декодирования согласно примеру. Способ декодирования согласно примеру включает в себя прием потока битов, включающего в себя остаточную информацию; извлечение квантованных коэффициентов преобразования для текущего блока на основе остаточной информации, включенной в поток битов; извлечение коэффициентов преобразования для текущего блока из квантованных коэффициентов преобразования на основе процесса обратного квантования; извлечение остаточных выборок для текущего блока посредством применения обратного преобразования к извлеченным коэффициентам преобразования; и формирование восстановленного кадра на основе остаточных выборок для текущего блока, при этом каждый из коэффициентов преобразования для текущего блока связан с областью высокочастотных коэффициентов преобразования, состоящей из коэффициента преобразования 0, или с областью низкочастотных коэффициентов преобразования, включающей в себя, по меньшей мере, один значимый коэффициент преобразования, остаточная информация включает в себя информацию префикса последнего значимого коэффициента и информацию суффикса последнего значимого коэффициента касаемо позиции последнего ненулевого коэффициента преобразования из числа коэффициентов преобразования для текущего блока, позиция последнего ненулевого коэффициента преобразования определяется на основе префиксного кодового слова, которое представляет информацию префикса последнего значимого коэффициента и информацию суффикса последнего значимого коэффициента, и максимальная длина префиксного кодового слова определяется на основе размера области низкочастотных коэффициентов преобразования.[17] According to still another example of the present disclosure, a decoder-readable storage medium is provided that stores information on instructions that instruct video decoding equipment to perform the decoding method according to the example. The decoding method according to the example includes receiving a bit stream including residual information; extracting quantized transform coefficients for the current block based on the residual information included in the bitstream; extracting transform coefficients for the current block from the quantized transform coefficients based on an inverse quantization process; extracting residual samples for the current block by applying an inverse transform to the extracted transform coefficients; and generating a reconstructed frame based on the residual samples for the current block, wherein each of the transform coefficients for the current block is associated with a high frequency transform coefficient region consisting of a transform coefficient of 0, or with a low frequency transform coefficient region including at least one significant transform coefficient, the residual information includes the last significant coefficient prefix information and the last significant coefficient suffix information regarding the position of the last non-zero transform coefficient among the transform coefficients for the current block, the position of the last non-zero transform coefficient is determined based on the prefix codeword that represents the prefix information the last significant coefficient and the suffix information of the last significant coefficient, and the maximum length of the prefix codeword is determined based on the area size low-frequency conversion coefficients.

[18] Согласно настоящему раскрытию, можно повысить общую эффективность сжатия изображений/видео.[18] According to the present disclosure, the overall efficiency of image/video compression can be improved.

[19] Согласно настоящему раскрытию, можно повысить эффективность остаточного кодирования.[19] According to the present disclosure, it is possible to improve the efficiency of residual coding.

[20] Согласно настоящему раскрытию, можно повысить эффективность кодирования на уровне коэффициентов преобразования.[20] According to the present disclosure, it is possible to improve coding efficiency at the level of transform coefficients.

[21] Согласно настоящему раскрытию, можно повысить эффективность остаточного кодирования посредством кодирования коэффициента преобразования на основе высокочастотного обнуления (или высокочастотного сведения к нулю).[21] According to the present disclosure, it is possible to improve the efficiency of residual coding by encoding a transform coefficient based on high frequency nulling (or high frequency nulling).

[22] Согласно настоящему раскрытию, можно повысить эффективность кодирования изображений посредством кодирования информацию позиции последнего значимого коэффициента преобразования в текущем блоке (или текущем блоке преобразования) на основе высокочастотного обнуления.[22] According to the present disclosure, it is possible to improve image coding efficiency by encoding the position information of the last significant transform coefficient in the current block (or current transform block) based on high-frequency nulling.

[23] Согласно настоящему раскрытию, можно повысить эффективность кодирования изображений посредством извлечения максимальной длины кодового слова, представляющего последний значимый коэффициент преобразования, на основе размера области в текущем блоке, к которому не применяется высокочастотное обнуление, когда коэффициенты преобразования для текущего блока (или текущего блока преобразования) кодируются на основе высокочастотного обнуления.[23] According to the present disclosure, it is possible to improve image coding efficiency by extracting the maximum length of a codeword representing the last significant transform coefficient based on the size of an area in the current block to which no high-frequency nulling is applied when the transform coefficients for the current block (or the current block transforms) are encoded based on high-frequency nulling.

[24] Согласно настоящему раскрытию, когда высокочастотное обнуление применяется посредством выполнения преобразования в двоичную форму для синтаксического элемента на основе размера области низкочастотного обнуления (или области, к которой высокочастотное обнуление не применяется), можно выполнять кодирование более эффективно и повысить пропускную способность CABAC посредством уменьшения числа контекстно-кодированных элементов разрешения.[24] According to the present disclosure, when high-frequency nulling is applied by performing binarization on the syntax element based on the size of the low-frequency nulling region (or the region to which high-frequency nulling is not applied), it is possible to perform coding more efficiently and improve the throughput of CABAC by reducing the number of context-encoded permission elements.

Краткое описание чертежейBrief description of the drawings

[25] Фиг. 1 схематично представляет пример системы кодирования видео/изображений, к которой может применяться настоящее раскрытие.[25] FIG. 1 schematically represents an example of a video/image coding system to which the present disclosure may apply.

[26] Фиг. 2 является схемой, схематично описывающей конфигурацию оборудования кодирования видео/изображений, к которому может применяться настоящее раскрытие.[26] FIG. 2 is a diagram schematically describing the configuration of video/image coding equipment to which the present disclosure may apply.

[27] Фиг. 3 является схемой, схематично описывающей конфигурацию оборудования декодирования видео/изображений, к которому может применяться настоящее раскрытие.[27] FIG. 3 is a diagram schematically describing the configuration of video/image decoding equipment to which the present disclosure may be applied.

[28] Фиг. 4A и 4B являются чертежом для пояснения конфигурации и работы энтропийного кодера согласно примеру.[28] FIG. 4A and 4B are a drawing for explaining the configuration and operation of an entropy encoder according to an example.

[29] Фиг. 5A и 5B являются чертежом для пояснения конфигурации и способа работы энтропийного декодера согласно примеру.[29] FIG. 5A and 5B are drawings for explaining the configuration and operation method of the entropy decoder according to an example.

[30] Фиг. 6 является чертежом для пояснения высокочастотного обнуления согласно примеру.[30] FIG. 6 is a drawing for explaining high frequency nulling according to an example.

[31] Фиг. 7 является блок-схемой последовательности операций способа, показывающей работу оборудования кодирования согласно примеру.[31] FIG. 7 is a flowchart showing the operation of the encoding equipment according to the example.

[32] Фиг. 8 является блок-схемой, показывающей конфигурацию оборудования кодирования согласно примеру.[32] FIG. 8 is a block diagram showing a configuration of an encoding equipment according to an example.

[33] Фиг. 9 является блок-схемой последовательности операций способа, показывающей работу оборудования декодирования согласно примеру.[33] FIG. 9 is a flowchart showing the operation of the decoding equipment according to an example.

[34] Фиг. 10 является блок-схемой, показывающей конфигурацию оборудования декодирования согласно примеру.[34] FIG. 10 is a block diagram showing a configuration of decoding equipment according to an example.

[35] Фиг. 11 представляет пример системы потоковой передачи контента, к которой может применяться раскрытие настоящего документа.[35] FIG. 11 represents an example of a content streaming system to which the disclosure of this document may apply.

Подробное описание вариантов осуществленияDetailed description of embodiments

[36] Согласно примеру настоящего раскрытия, предусмотрен способ декодирования изображений, который осуществляется посредством оборудования декодирования. Способ включает в себя прием потока битов, включающего в себя остаточную информацию; извлечение квантованных коэффициентов преобразования для текущего блока на основе остаточной информации, включенной в поток битов; извлечение коэффициентов преобразования для текущего блока из квантованных коэффициентов преобразования на основе процесса обратного квантования; извлечение остаточных выборок для текущего блока посредством применения обратного преобразования к извлеченным коэффициентам преобразования; и формирование восстановленного кадра на основе остаточных выборок для текущего блока, при этом каждый из коэффициентов преобразования для текущего блока связан с областью высокочастотных коэффициентов преобразования, состоящей из коэффициента преобразования 0, или с областью низкочастотных коэффициентов преобразования, включающей в себя, по меньшей мере, один значимый коэффициент преобразования, остаточная информация включает в себя информацию префикса последнего значимого коэффициента и информацию суффикса последнего значимого коэффициента касаемо позиции последнего ненулевого коэффициента преобразования из числа коэффициентов преобразования для текущего блока, позиция последнего ненулевого коэффициента преобразования определяется на основе префиксного кодового слова, которое представляет информацию префикса последнего значимого коэффициента и информацию суффикса последнего значимого коэффициента, и максимальная длина префиксного кодового слова определяется на основе размера области низкочастотных коэффициентов преобразования.[36] According to an example of the present disclosure, an image decoding method is provided, which is performed by decoding equipment. The method includes receiving a bitstream including residual information; extracting quantized transform coefficients for the current block based on the residual information included in the bitstream; extracting transform coefficients for the current block from the quantized transform coefficients based on an inverse quantization process; extracting residual samples for the current block by applying an inverse transform to the extracted transform coefficients; and generating a reconstructed frame based on the residual samples for the current block, wherein each of the transform coefficients for the current block is associated with a high frequency transform coefficient region consisting of a transform coefficient of 0, or with a low frequency transform coefficient region including at least one significant transform coefficient, the residual information includes the last significant coefficient prefix information and the last significant coefficient suffix information regarding the position of the last non-zero transform coefficient among the transform coefficients for the current block, the position of the last non-zero transform coefficient is determined based on the prefix codeword that represents the prefix information the last significant coefficient and the suffix information of the last significant coefficient, and the maximum length of the prefix codeword is determined based on the area size low-frequency conversion coefficients.

[37] Хотя настоящее раскрытие может подвергаться различным модификациям и включает в себя различные варианты осуществления, его конкретные варианты осуществления показаны на чертежах в качестве примера и подробно описываются ниже. Тем не менее, это не имеет намерение ограничивать настоящее раскрытие конкретными вариантами осуществления, раскрытыми в данном документе. Термины, используемые в данном документе, служат только для цели описания конкретных вариантов осуществления и не имеют намерение ограничивать техническую идею настоящего раскрытия. Формы единственного числа могут включать в себя формы множественного числа, если контекст явно не указывает иное. Такие термины, как "содержать", "включать в себя" и т.п., предназначены для того, чтобы указывать то, что существуют признаки, числа, этапы, операции, элементы, компоненты либо комбинации вышеозначенного, используемые в нижеприведенном описании, и в силу этого не следует понимать, что заранее исключается возможность наличия или добавления одного или более других признаков, чисел, этапов, операций, элементов, компонентов либо комбинаций вышеозначенного.[37] Although the present disclosure is subject to various modifications and includes various embodiments, its specific embodiments are shown in the drawings by way of example and are described in detail below. However, it is not intended to limit the present disclosure to the specific embodiments disclosed herein. The terms used herein are for the purpose of describing specific embodiments only and are not intended to limit the technical idea of the present disclosure. Singular forms may include plural forms unless the context clearly indicates otherwise. Terms such as "comprise", "include" and the like are intended to indicate that there are features, numbers, steps, operations, elements, components, or combinations of the foregoing used in the description below, and therefore, it should not be understood that the presence or addition of one or more other features, numbers, steps, operations, elements, components, or combinations of the above is precluded.

[38] Между тем, каждый компонент на чертежах, описанных в данном документе, проиллюстрирован независимо для удобства описания в отношении характеристических функций, отличающихся друг от друга, и тем не менее, не подразумевается то, что каждый компонент осуществляется посредством отдельных аппаратных средств или программного обеспечения. Например, любые два или более из этих компонентов могут комбинироваться, чтобы формировать один компонент, и любой один компонент может разделяться на несколько компонентов. Варианты осуществления, в которых компоненты комбинируются и/или разделяются, должны попадать в пределы объема патентного права настоящего раскрытия при условии, что они не отступают от сущности настоящего раскрытия.[38] Meanwhile, each component in the drawings described herein is independently illustrated for convenience of description with respect to characteristic functions different from each other, and yet, it is not implied that each component is implemented by separate hardware or software. security. For example, any two or more of these components may be combined to form one component, and any one component may be split into multiple components. Embodiments in which the components are combined and/or separated should fall within the scope of the patent law of the present disclosure, provided that they do not depart from the spirit of the present disclosure.

[39] В дальнейшем в этом документе, подробнее поясняются предпочтительные варианты осуществления настоящего раскрытия со ссылкой на прилагаемые чертежи. В дальнейшем в этом документе, идентичные ссылки с номерами используются для идентичных компонентов на чертежах, и повторные описания для идентичных компонентов могут опускаться.[39] Hereinafter in this document, the preferred embodiments of the present disclosure are explained in more detail with reference to the accompanying drawings. Hereinafter in this document, identical reference numbers are used for identical components in the drawings, and repeated descriptions for identical components may be omitted.

[40] Фиг. 1 схематично представляет пример системы кодирования видео/изображений, к которой может применяться настоящее раскрытие.[40] FIG. 1 schematically represents an example of a video/image coding system to which the present disclosure may apply.

[41] Этот документ относится к кодированию видео/изображений. Например, способы/варианты осуществления, раскрытые в этом документе, могут применяться к способу, раскрытому в стандарте универсального кодирования видео (VVC), стандарте EVC (фундаментального кодирования видео), стандарте AOMedia Video 1 (AV1), стандарте второго поколения кодирования аудио/видео (AVS2) или стандарте кодирования видео/изображений следующего поколения (например, H.267 или H.268 и т.д.).[41] This document relates to video/image coding. For example, the methods/embodiments disclosed in this document may be applied to the method disclosed in the Universal Video Coding (VVC) standard, the EVC (Fundamental Video Coding) standard, the AOMedia Video 1 (AV1) standard, the second generation audio/video coding standard. (AVS2) or next generation video/image coding standard (eg H.267 or H.268 etc.).

[42] Этот документ представляет различные варианты осуществления кодирования видео/изображений, и варианты осуществления могут выполняться в комбинации между собой, если не указано иное.[42] This document presents various embodiments of video/image coding, and the embodiments may be performed in combination with each other unless otherwise noted.

[43] В этом документе, видео может означать последовательность изображений во времени. Кадр, в общем, означает единицу, представляющую одно изображение в конкретной временной зоне, и срез/плитка (slice/tile) представляет собой единицу, составляющую часть кадра при кодировании. Срез/плитка может включать в себя одну или более единиц дерева кодирования (CTU). Один кадр может состоять из одного или более срезов/плиток. Один кадр может состоять из одной или более групп плиток. Одна группа плиток может включать в себя одну или более плиток. Кирпич (brick) может представлять прямоугольную область строк CTU в плитке в кадре. Плитка может сегментироваться на несколько кирпичей, каждый из которых состоит из одной или более строк CTU в плитке. Плитка, которая не сегментируется на несколько кирпичей, также может называться "кирпичом". Кирпичное сканирование представляет собой конкретное последовательное упорядочение CTU, сегментирующих кадр, при котором CTU упорядочиваются последовательно в растровом сканировании CTU в кирпиче, кирпичи внутри плитки упорядочиваются последовательно в растровом сканировании кирпичей плитки, и плитки в кадре упорядочиваются последовательно в растровом сканировании плиток кадра. Плитка представляет собой прямоугольную область CTU в конкретном столбце плиток и конкретной строке плиток в кадре. Столбец плиток представляет собой прямоугольную область CTU, имеющих высоту, равную высоте кадра, и ширину, указываемую посредством синтаксических элементов в наборе параметров кадра. Строка плиток представляет собой прямоугольную область CTU, имеющих высоту, указываемую посредством синтаксических элементов в наборе параметров кадра, и ширину, равную ширине кадра. Сканирование плиток представляет собой конкретное последовательное упорядочение CTU, сегментирующих кадр, при котором CTU упорядочиваются последовательно в растровом сканировании CTU в плитке, тогда как плитки в кадре упорядочиваются последовательно в растровом сканировании плиток кадра. Срез включает в себя собой целое число кирпичей кадра, которые могут содержаться исключительно в одной NAL-единице. Срез может состоять либо из определенного числа полных плиток, либо только из жесткой последовательности полных кирпичей одной плитки. Группы плиток и срезы могут использоваться взаимозаменяемо в этом документе. Например, в этом документе, группа плиток/заголовок группы плиток может называться "срезом/заголовком среза".[43] In this document, video can mean a sequence of images over time. A frame generally means a unit representing one image in a particular time zone, and a slice/tile is a unit constituting a frame when encoded. A slice/tile may include one or more coding tree units (CTUs). One frame may consist of one or more slices/tiles. One frame may consist of one or more tile groups. One group of tiles may include one or more tiles. A brick may represent a rectangular area of CTU rows in a tile in a frame. A tile can be segmented into multiple bricks, each consisting of one or more rows of CTUs in the tile. A tile that does not segment into multiple bricks may also be referred to as a "brick". Brickscan is a particular sequential ordering of CTUs segmenting a frame, where CTUs are ordered sequentially in a CTU raster scan in a brick, bricks within a tile are ordered sequentially in a tile bricks raster scan, and tiles in a frame are ordered sequentially in a frame tile raster scan. A tile is a rectangular area of the CTU in a particular column of tiles and a particular row of tiles in a frame. The tile column is a rectangular area of CTUs having a height equal to the height of the frame and a width specified by syntax elements in the frame parameter set. The row of tiles is a rectangular area of CTUs having a height indicated by syntax elements in the frame parameter set and a width equal to the frame width. Tile scanning is a particular sequential ordering of CTUs segmenting a frame, whereby CTUs are ordered sequentially in a raster scan of the CTUs in a tile, while tiles in a frame are ordered sequentially in a raster scan of the tiles of the frame. A slice includes an integer number of frame bricks that can only be contained in one NAL unit. A slice can either consist of a certain number of full tiles, or only a rigid sequence of full bricks of a single tile. Tile groups and slices can be used interchangeably throughout this document. For example, in this document, a tile group/tile group header may be referred to as a "slice/slice header".

[44] Пиксел или пел может означать наименьшую единицу, составляющую один кадр (или изображение). Кроме того, “дискретны отсчет” ("выборка") может использоваться в качестве термина, соответствующего пикселу. Выборка, в общем, может представлять пиксел или значение пиксела и может представлять только пиксел/пиксельное значение компонента сигнала яркости либо только пиксел/пиксельное значение компонента сигнала цветности.[44] A pixel or pel can mean the smallest unit that makes up one frame (or image). In addition, "discrete reading" ("sampling") can be used as a term corresponding to a pixel. A sample may generally represent a pixel or a pixel value, and may represent only a pixel/pixel value of a luma component, or only a pixel/pixel value of a chroma component.

[45] Единица может представлять базовую единицу обработки изображений. Единица может включать в себя, по меньшей мере, одно из конкретной области кадра и информации, связанной с областью. Одна единица может включать в себя один блок сигналов яркости и два блока сигналов цветности (например, cb, cr). Единица может использоваться взаимозаменяемо с такими терминами, как блок или зона в некоторых случаях. В общем случае, блок MxN может включать в себя выборки (или массивы выборок) либо набор (или массив) коэффициентов преобразования из M столбцов и N строк.[45] The unit may represent a basic image processing unit. The unit may include at least one of a specific area of the frame and information associated with the area. One unit may include one luminance block and two chrominance blocks (eg, cb, cr). The unit can be used interchangeably with terms such as block or zone in some cases. In general, an MxN block may include samples (or arrays of samples) or a set (or array) of transform coefficients of M columns and N rows.

[46] В этом документе, термин "/" и "" должен интерпретироваться как указывающий "и/или". Например, выражение "A/B" может означать "A и/или B". Дополнительно, "A, B" может означать "A и/или B". Дополнительно, "A/B/C" может означать "по меньшей мере, одно из A, B и/или C". Кроме того, "A/B/C" может означать "по меньшей мере, одно из A, B и/или C".[46] In this document, the terms "/" and "" are to be interpreted as indicating "and/or". For example, the expression "A/B" can mean "A and/or B". Additionally, "A, B" may mean "A and/or B". Additionally, "A/B/C" may mean "at least one of A, B and/or C". In addition, "A/B/C" may mean "at least one of A, B and/or C".

[47] Дополнительно, в документе, термин "или" должен интерпретироваться как указывающий "и/или". Например, выражение "A или B" может содержать 1) только A, 2) только B и/или 3) как A, так и B. Другими словами, термин "или" в этом документе должен интерпретироваться как указывающий "дополнительно или альтернативно".[47] Additionally, in the document, the term "or" should be interpreted as indicating "and/or". For example, the expression "A or B" may contain 1) only A, 2) only B, and/or 3) both A and B. In other words, the term "or" in this document is to be interpreted as indicating "in addition or alternatively" .

[48] Ссылаясь на фиг. 1, система кодирования видео/изображений может включать в себя первое устройство (исходное устройство) и второе устройство (приемное устройство). Исходное устройство может доставлять кодированную информацию или данные видео/изображений в форме файла или потоковой передачи в приемное устройство через цифровой носитель хранения данных или сеть.[48] Referring to FIG. 1, the video/image coding system may include a first device (source device) and a second device (receiver device). The source device may deliver the encoded information or video/image data in file or streaming form to the destination device via a digital storage medium or a network.

[49] Исходное устройство может включать в себя видеоисточник, оборудование кодирования и передатчик. Приемное устройство может включать в себя приемник, оборудование декодирования и модуль рендеринга. Оборудование кодирования может называться "оборудованием кодирования видео/изображений", и оборудование декодирования может называться "оборудованием декодирования видео/изображений". Передатчик может включаться в оборудование кодирования. Приемник может включаться в оборудование декодирования. Модуль рендеринга может включать в себя дисплей, и дисплей может быть сконфигурирован как отдельное устройство или внешний компонент.[49] The source device may include a video source, encoding equipment, and a transmitter. The receiver may include a receiver, decoding hardware, and a renderer. The encoding equipment may be referred to as "video/image coding equipment", and the decoding equipment may be referred to as "video/image decoding equipment". The transmitter may be included in the encoding equipment. The receiver may be included in decoding equipment. The renderer may include a display, and the display may be configured as a separate device or an external component.

[50] Видеоисточник может получать видео/изображение посредством процесса захвата, синтезирования или формирования видео/изображения. Видеоисточник может включать в себя устройство захвата видео/изображений и/или устройство формирования видео/изображений. Устройство захвата видео/изображений может включать в себя, например, одну или более камер, архивы видео/изображений, включающие в себя ранее захваченные видео/изображения, и т.п. Устройство формирования видео/изображений может включать в себя, например, компьютеры, планшетные компьютеры и смартфоны и может (электронно) формировать видео/изображения. Например, виртуальное видео/изображение может формироваться через компьютер и т.п. В этом случае, процесс захвата видео/изображений может заменяться посредством процесса формирования связанных данных.[50] A video source may acquire a video/image through a process of capturing, synthesizing, or generating a video/image. The video source may include a video/image capture device and/or a video/image generation device. The video/image capture device may include, for example, one or more cameras, video/image archives including previously captured videos/images, and the like. The video/image generation apparatus may include, for example, computers, tablet computers, and smartphones, and may (electronically) generate video/images. For example, the virtual video/image may be generated via a computer or the like. In this case, the video/image capturing process may be replaced by a linked data generation process.

[51] Оборудование кодирования может кодировать входное видео/изображение. Оборудование кодирования может выполнять последовательность процедур, таких как прогнозирование (предсказание), преобразование и квантование, для эффективности сжатия и кодирования. Кодированные данные (кодированная информация видео/изображений) могут выводиться в форме потока битов.[51] The encoding equipment may encode the input video/image. The encoding equipment may perform a series of procedures such as prediction (prediction), transformation, and quantization for compression and encoding efficiency. Encoded data (encoded video/picture information) may be output in the form of a bit stream.

[52] Передатчик может передавать информацию или данные кодированных изображений/изображений, выводимую в форме потока битов, в приемник приемного устройства через цифровой носитель хранения данных или сеть в форме файла или потоковой передачи. Цифровой носитель хранения данных может включать в себя различные носители хранения данных, такие как, USB, SD, CD, DVD, Blu-Ray, HDD, SSD и т.п. Передатчик может включать в себя элемент для формирования мультимедийного файла через предварительно определенный формат файлов и может включать в себя элемент для передачи через широковещательную передачу/сеть связи. Приемник может принимать/извлекать поток битов и передавать принимаемый поток битов в оборудование декодирования.[52] The transmitter may transmit information or coded image/image data output in the form of a bit stream to the receiver of the receiving device via a digital storage medium or a network in the form of a file or streaming. The digital storage medium may include various storage media such as USB, SD, CD, DVD, Blu-ray, HDD, SSD, and the like. The transmitter may include an element for generating a media file via a predetermined file format and may include an element for transmission via a broadcast/communication network. The receiver may receive/retrieve the bitstream and transmit the received bitstream to the decoding equipment.

[53] Оборудование декодирования может декодировать видео/изображение посредством выполнения последовательности процедур, таких как деквантование, обратное преобразование и прогнозирование, соответствующих работе оборудования кодирования.[53] The decoding equipment can decode the video/image by performing a sequence of procedures such as dequantization, inverse transformation, and prediction corresponding to the operation of the encoding equipment.

[54] Модуль рендеринга может подготавливать посредством рендеринга декодированное видео/изображение. Подготовленное посредством рендеринга видео/изображение может отображаться через дисплей.[54] The rendering module may prepare a decoded video/image by rendering. The rendered video/image can be displayed through the display.

[55] Фиг. 2 является схемой, схематично описывающей конфигурацию оборудования кодирования видео/изображений, к которому может применяться настоящее раскрытие. В дальнейшем в этом документе, то, что называется "оборудованием кодирования видео", может включать в себя оборудование кодирования изображений.[55] FIG. 2 is a diagram schematically describing the configuration of video/image coding equipment to which the present disclosure may apply. Hereinafter in this document, what is referred to as "video encoding equipment" may include image encoding equipment.

[56] Ссылаясь на фиг. 2, оборудование 200 кодирования включает в себя модуль 210 сегментации изображений, модуль 220 прогнозирования, остаточный процессор 230 и энтропийный кодер 240, сумматор 250, фильтр 260 и запоминающее устройство 270. Модуль 220 прогнозирования может включать в себя модуль 221 взаимного (интер) прогнозирования и модуль 222 внутреннего (интра) прогнозирования. Остаточный процессор 230 может включать в себя преобразователь 232, квантователь 233, деквантователь 234 и обратный преобразователь 235. Остаточный процессор 230 дополнительно может включать в себя вычитатель 231. Сумматор 250 может называться "модулем восстановления" или "формирователем восстановленных блоков". Модуль 210 сегментации изображений, модуль 220 прогнозирования, остаточный процессор 230, энтропийный кодер 240, сумматор 250 и фильтр 260 могут быть сконфигурированы, по меньшей мере, посредством одного аппаратного компонента (например, набора микросхем или процессора кодера) согласно варианту осуществления. Помимо этого, запоминающее устройство 270 может включать в себя буфер декодированных кадров (DPB) или может быть сконфигурировано посредством цифрового носителя хранения данных. Аппаратный компонент дополнительно может включать в себя запоминающее устройство 270 в качестве внутреннего/внешнего компонента.[56] Referring to FIG. 2, the encoding equipment 200 includes an image segmentation module 210, a prediction module 220, a residual processor 230 and an entropy encoder 240, an adder 250, a filter 260, and a memory 270. The prediction module 220 may include an inter (inter) prediction module 221 and module 222 internal (intra) prediction. Residual processor 230 may include a transformer 232, a quantizer 233, a dequantizer 234, and an inverse transformer 235. Residual processor 230 may further include a subtractor 231. Adder 250 may be referred to as a "rebuilder" or "recovered block generator". Image segmentation module 210, prediction module 220, residual processor 230, entropy encoder 240, adder 250, and filter 260 may be configured by at least one hardware component (e.g., chipset or encoder processor) according to an embodiment. In addition, the memory 270 may include a decoded frame buffer (DPB) or may be configured by a digital storage medium. The hardware component may further include a storage device 270 as an internal/external component.

[57] Модуль 210 сегментации изображений может сегментировать входное изображение (либо кадр или картинку), вводимое в оборудование 200 кодирования, на один более блоков обработки. Например, блок обработки может называться "единицей кодирования (CU)". В этом случае, единица кодирования может рекурсивно сегментироваться согласно структуре в виде дерева квадрантов, двоичного дерева и троичного дерева (QTBTTT) из единицы дерева кодирования (CTU) или наибольшей единицы кодирования (LCU). Например, одна единица кодирования может сегментироваться на множество единиц кодирования большей глубины на основе структуры в виде дерева квадрантов, структуры в виде двоичного дерева и/или троичной структуры. В этом случае, например, сначала может применяться структура в виде дерева квадрантов, и впоследствии может применяться структура в виде двоичного дерева и троичная структура. Альтернативно, сначала может применяться структура в виде двоичного дерева. Процедура кодирования согласно этому документу может выполняться на основе конечной единицы кодирования, которая более не сегментируется. В этом случае, наибольшая единица кодирования может использоваться в качестве конечной единицы кодирования на основе эффективности кодирования согласно характеристикам изображений, или при необходимости, единица кодирования может рекурсивно сегментироваться на единицы кодирования большей глубины, и единица кодирования, имеющая оптимальный размер, может использоваться в качестве конечной единицы кодирования. Здесь, процедура кодирования может включать в себя процедуру прогнозирования, преобразования и восстановления, которая описывается ниже. В качестве другого примера, блок обработки дополнительно может включать в себя единицу прогнозирования (PU) или единицу преобразования (TU). В этом случае, единица прогнозирования и единица преобразования могут разбиваться или сегментироваться из вышеуказанной конечной единицы кодирования. Единица прогнозирования может представлять собой единицу выборочного прогнозирования, и единица преобразования может представлять собой единицу для извлечения коэффициента преобразования и/или единицу для извлечения остаточного сигнала из коэффициента преобразования.[57] The image segmentation unit 210 may segment an input image (either a frame or a picture) input to the encoding equipment 200 into one more processing units. For example, a processing unit may be referred to as a "coding unit (CU)". In this case, a coding unit may be recursively segmented according to a quadtree, binary tree, and ternary tree (QTBTTT) structure from a coding tree unit (CTU) or a largest coding unit (LCU). For example, one coding unit may be segmented into multiple coding units of greater depth based on a quadtree structure, a binary tree structure, and/or a ternary structure. In this case, for example, a quadtree structure may be applied first, and a binary tree structure and a ternary structure may subsequently be applied. Alternatively, a binary tree structure may be applied first. The encoding procedure according to this document may be performed on the basis of a final encoding unit that is no longer segmented. In this case, the largest coding unit may be used as the final coding unit based on the coding efficiency according to the characteristics of the images, or if necessary, the coding unit may be recursively segmented into coding units of greater depth, and the coding unit having the optimal size may be used as the final coding units. Here, the encoding procedure may include a prediction, transformation, and restoration procedure, which is described below. As another example, the processing unit may further include a prediction unit (PU) or a transformation unit (TU). In this case, the prediction unit and the transformation unit may be split or segmented from the above final coding unit. The prediction unit may be a selective prediction unit, and the transform unit may be a unit for extracting a transform coefficient and/or a unit for extracting a residual signal from a transform coefficient.

[58] Единица может использоваться взаимозаменяемо с такими терминами, как блок или зона в некоторых случаях. В общем случае, блок MxN может представлять набор выборок или коэффициентов преобразования, состоящих из M столбцов и N строк. Выборка, в общем, может представлять пиксел или значение пиксела, может представлять только пиксел/пиксельное значение компонента сигнала яркости либо представлять только пиксел/пиксельное значение компонента сигнала цветности. Выборка может использоваться в качестве термина, соответствующего одному кадру (или изображению) для пиксела или пела.[58] The unit can be used interchangeably with terms such as block or zone in some cases. In general, an MxN block may represent a set of samples or transform coefficients consisting of M columns and N rows. The sample, in general, may represent a pixel or pixel value, may represent only a pixel/pixel value of the luminance signal component, or represent only a pixel/pixel value of the chrominance signal component. Sampling can be used as a term corresponding to one frame (or image) for a pixel or pel.

[59] В оборудовании 200 кодирования, прогнозный сигнал (прогнозированный блок, массив прогнозных выборок), выводимый из модуля 221 взаимного прогнозирования или модуля 222 внутреннего прогнозирования, вычитается из сигнала входного изображения (исходного блока, массива исходных выборок), чтобы формировать остаточный сигнал (остаточный блок, массив остаточных выборок), и сформированный остаточный сигнал передается в преобразователь 232. В этом случае, как показано, модуль для вычитания прогнозного сигнала (прогнозированного блока, массива прогнозных выборок) из сигнала входного изображения (исходного блока, массива исходных выборок) в кодере 200 может называться "вычитателем 231". Модуль прогнозирования может выполнять прогнозирование в отношении блока, который должен обрабатываться (в дальнейшем в этом документе, называемого "текущим блоком"), и формировать прогнозированный блок, включающий в себя прогнозные выборки для текущего блока. Модуль прогнозирования может определять, применяется внутреннее прогнозирование или взаимное прогнозирование, на основе текущего блока или CU. Как описано ниже в описании каждого режима прогнозирования, модуль прогнозирования может формировать различную информацию, связанную с прогнозированием, к примеру, информацию режима прогнозирования, и передавать сформированную информацию в энтропийный кодер 240. Информация относительно прогнозирования может кодироваться в энтропийном кодере 240 и выводиться в форме потока битов.[59] In the coding equipment 200, the prediction signal (predicted block, array of predictive samples) output from the inter prediction unit 221 or intra prediction unit 222 is subtracted from the input image signal (original block, array of original samples) to generate a residual signal ( residual block, residual sample array), and the generated residual signal is passed to converter 232. In this case, as shown, a module for subtracting the prediction signal (predicted block, predictive sample array) from the input image signal (original block, original sample array) in encoder 200 may be referred to as "subtractor 231". The prediction module may perform prediction on a block to be processed (hereinafter referred to as "current block") and generate a prediction block including prediction samples for the current block. The prediction module may determine whether intra prediction or inter prediction is applied based on the current block or CU. As described below in the description of each prediction mode, the prediction module may generate various prediction-related information, such as prediction mode information, and pass the generated information to the entropy encoder 240. The prediction information may be encoded in the entropy encoder 240 and output in the form of a stream. bits.

[60] Модуль 222 внутреннего прогнозирования может прогнозировать текущий блок посредством обращения к выборкам в текущем кадре. Выборки для обращения могут быть расположены в окружении текущего блока или могут быть расположены независимо согласно режиму прогнозирования. При внутреннем прогнозировании режимы прогнозирования могут включать в себя множество ненаправленных режимов и множество направленных режимов. Ненаправленный режим может включать в себя, например, DC-режим и планарный режим. Направленный режим может включать в себя, например, 33 режима направленного прогнозирования или 65 режимов направленного прогнозирования согласно степени детальности направления прогнозирования. Тем не менее, это представляет собой просто пример, большее или меньшее число режимов направленного прогнозирования может использоваться в зависимости от настройки. Модуль 222 внутреннего прогнозирования может определять режим прогнозирования, применяемый к текущему блоку, посредством использования режима прогнозирования, применяемого к соседнему блоку.[60] The intra prediction module 222 may predict the current block by referring to the samples in the current frame. The inversion samples may be located in the surroundings of the current block, or may be independently located according to the prediction mode. In intra prediction, the prediction modes may include a plurality of non-directional modes and a plurality of directional modes. The non-directional mode may include, for example, a DC mode and a planar mode. The directional mode may include, for example, 33 directional prediction modes or 65 directional prediction modes according to the granularity of the prediction direction. However, this is just an example, more or less directional prediction modes may be used depending on the setting. The intra prediction unit 222 may determine the prediction mode applied to the current block by using the prediction mode applied to the neighboring block.

[61] Модуль 221 взаимного прогнозирования может извлекать прогнозированный блок для текущего блока на основе опорного блока (массива опорных выборок), указываемого посредством вектора движения для опорного кадра. Здесь, чтобы уменьшать объем информации движения, передаваемой в режиме взаимного прогнозирования, информация движения может прогнозироваться в единицах блоков, субблоков или выборок на основе корреляции информации движения между соседним блоком и текущим блоком. Информация движения может включать в себя вектор движения и индекс опорного кадра. Информация движения дополнительно может включать в себя информацию направления взаимного прогнозирования (L0-прогнозирование, L1-прогнозирование, бипрогнозирование и т.д.). В случае взаимного прогнозирования соседний блок может включать в себя пространственный соседний блок, присутствующий в текущем изображении, и временной соседний блок, присутствующий в опорном изображении. Опорный кадр, включающий в себя опорный блок, и опорный кадр, включающий в себя временной соседний блок, могут быть идентичными или отличающимися. Временной соседний блок может называться "совместно размещенным опорным блоком", "совместно размещенной CU (colCU)" и т.п., и опорный кадр, включающий в себя временной соседний блок, может называться "совместно размещенным кадром (colPic)". Например, модуль 221 взаимного прогнозирования может конфигурировать список возможных вариантов информации движения на основе соседних блоков и формировать информацию, указывающую то, какой возможный вариант используется для того, чтобы извлекать вектор движения и/или индекс опорного кадра текущего блока. Взаимное прогнозирование может выполняться на основе различных режимов прогнозирования. Например, в случае режима пропуска и режима объединения, модуль 221 взаимного прогнозирования может использовать информацию движения соседнего блока в качестве информации движения текущего блока. В режиме пропуска, в отличие от режима объединения, остаточный сигнал может не передаваться. В случае режима прогнозирования векторов движения (MVP), вектор движения соседнего блока может использоваться в качестве предиктора вектора движения, и вектор движения текущего блока может указываться посредством передачи в служебных сигналах разности векторов движения.[61] The inter prediction unit 221 may derive a predicted block for the current block based on a reference block (reference sample array) indicated by a motion vector for the reference frame. Here, in order to reduce the amount of motion information transmitted in the inter-prediction mode, the motion information may be predicted in units of blocks, sub-blocks, or samples based on the correlation of the motion information between the adjacent block and the current block. The motion information may include a motion vector and a reference frame index. The motion information may further include inter-prediction direction information (L0 prediction, L1 prediction, bi-prediction, etc.). In the case of inter prediction, an adjacent block may include a spatial adjacent block present in the current picture and a temporal adjacent block present in the reference picture. The reference frame including the reference block and the reference frame including the temporal neighbor block may be the same or different. The temporal neighbor block may be referred to as a "collocated reference block", "collocated CU (colCU)" or the like, and a reference frame including the temporal neighbor block may be referred to as a "collocated frame (colPic)". For example, the inter-prediction unit 221 may configure a list of motion information candidates based on neighboring blocks, and generate information indicating which candidate is used to derive the motion vector and/or the reference frame index of the current block. Inter prediction may be performed based on various prediction modes. For example, in the case of the skip mode and the merge mode, the inter prediction unit 221 may use the neighboring block motion information as the current block motion information. In the skip mode, unlike the merge mode, the residual signal may not be transmitted. In the case of a motion vector prediction (MVP) mode, the motion vector of an adjacent block may be used as a motion vector predictor, and the motion vector of the current block may be indicated by signaling a motion vector difference.

[62] Модуль 220 прогнозирования может формировать прогнозный сигнал на основе различных способов прогнозирования, описанных ниже. Например, модуль прогнозирования может не только применять внутреннее прогнозирование или взаимное прогнозирование для того, чтобы прогнозировать один блок, но также и одновременно применять как внутренние прогнозирование, так и взаимное прогнозирование. Это может называться "комбинированным взаимным и внутренним прогнозированием (CIIP)". Помимо этого, модуль прогнозирования может быть основан на режиме прогнозирования на основе внутриблочного копирования (IBC) либо на палитровом режиме для прогнозирования блока. Режим IBC-прогнозирования или палитровый режим может использоваться для кодирования изображений/видео контента игры и т.п., например, для кодирования экранного контента (SCC). IBC по существу выполняет прогнозирование в текущем кадре, но может выполняться аналогично взаимному прогнозированию, в котором опорный блок извлекается в текущем кадре. Таким образом, IBC может использовать, по меньшей мере, одну из технологий взаимного прогнозирования, описанных в этом документе. Палитровый режим может рассматриваться как пример внутреннего кодирования или внутреннего прогнозирования. Когда палитровый режим применяется, выборочное значение в кадре может передаваться в служебных сигналах на основе информации относительно таблицы палитр и индекса палитры.[62] The prediction module 220 may generate a prediction signal based on various prediction methods described below. For example, the prediction module may not only apply intra prediction or inter prediction to predict one block, but also apply both intra prediction and inter prediction at the same time. This may be referred to as "combined mutual and intra prediction (CIIP)". In addition, the prediction module may be based on an intra-block copy (IBC) prediction mode or a palette mode for block prediction. The IBC prediction mode or palette mode can be used for image/video coding of game content and the like, such as screen content coding (SCC). IBC essentially performs prediction in the current frame, but may be performed similar to inter-prediction in which the reference block is retrieved in the current frame. Thus, the IBC may use at least one of the inter-prediction technologies described in this document. Palette mode can be considered as an example of intra coding or intra prediction. When the palette mode is applied, a sample value in a frame may be signaled based on information regarding the palette table and palette index.

[63] Прогнозный сигнал, сформированный посредством модуля прогнозирования (включающего в себя модуль 221 взаимного прогнозирования и/или модуль 222 внутреннего прогнозирования), может использоваться для того, чтобы формировать восстановленный сигнал или формировать остаточный сигнал. Преобразователь 232 может формировать коэффициенты преобразования посредством применения технологии преобразования к остаточному сигналу. Например, технология преобразования может включать в себя, по меньшей мере, одно из дискретного косинусного преобразования (DCT), дискретного синусного преобразования (DST), преобразования Карунена-Лоэва (KLT), преобразования на основе графа (GBT) или условно нелинейного преобразования (CNT). Здесь, GBT означает преобразование, полученное из графа, когда информация взаимосвязи между пикселами представляется посредством графа. CNT означает преобразование, сформированное на основе прогнозного сигнала, сформированного с использованием всех ранее восстановленных пикселов. Помимо этого, процесс преобразования может применяться к квадратным пиксельным блокам, имеющим идентичный размер, или может применяться к блокам, имеющим переменный размер, а не к квадратным.[63] The prediction signal generated by the prediction module (including the inter prediction module 221 and/or the intra prediction module 222) may be used to generate a recovered signal or generate a residual signal. Converter 232 may generate transform coefficients by applying a transform technique to the residual signal. For example, the transform technology may include at least one of Discrete Cosine Transform (DCT), Discrete Sine Transform (DST), Karhunen-Loeve Transform (KLT), Graph Based Transform (GBT), or Conditionally Nonlinear Transform (CNT). ). Here, GBT means a transformation obtained from a graph when relationship information between pixels is represented by a graph. CNT means a transform generated based on a predictive signal generated using all previously reconstructed pixels. In addition, the transformation process may be applied to square pixel blocks having the same size, or may be applied to blocks having a variable size rather than square ones.

[64] Квантователь 233 может квантовать коэффициенты преобразования и передавать их в энтропийный кодер 240, и энтропийный кодер 240 может кодировать квантованный сигнал (информацию относительно квантованных коэффициентов преобразования) и выводить поток битов. Информация относительно квантованных коэффициентов преобразования может называться "остаточной информацией". Квантователь 233 может перекомпоновывать блочные квантованные коэффициенты преобразования в одномерную векторную форму на основе порядка сканирования коэффициентов и формировать информацию относительно квантованных коэффициентов преобразования на основе квантованных коэффициентов преобразования в одномерной векторной форме. Информация относительно коэффициентов преобразования может формироваться. Энтропийный кодер 240 может выполнять различные способы кодирования, такие как, например, экспоненциальный код Голомба, контекстно-адаптивное кодирование переменной длины (CAVLC), контекстно-адаптивное двоичное арифметическое кодирование (CABAC) и т.п. Энтропийный кодер 240 может кодировать информацию, необходимую для видео/восстановления изображений, отличную от квантованных коэффициентов преобразования (например, значений синтаксических элементов и т.д.), вместе или отдельно. Кодированная информация (например, кодированная информация видео/изображений), может передаваться или сохраняться в единицах NAL (слоя абстрагирования от сети) в форме потока битов. Информация видео/изображений дополнительно может включать в себя информацию относительно различных наборов параметров, таких как набор параметров адаптации (APS), набор параметров кадра (PPS), набор параметров последовательности (SPS) или набор параметров видео (VPS). Помимо этого, информация видео/изображений дополнительно может включать в себя общую информацию ограничений. В этом документе, информация и/или синтаксические элементы, передаваемые/передаваемые в служебных сигналах из оборудования кодирования в оборудование декодирования, могут включаться в информацию видео/кадров. Информация видео/изображений может кодироваться через вышеописанную процедуру кодирования и включаться в поток битов. Поток битов может передаваться по сети или может сохраняться на цифровом носителе хранения данных. Сеть может включать в себя широковещательную сеть и/или сеть связи, и цифровой носитель хранения данных может включать в себя различные носители хранения данных, такие как, USB, SD, CD, DVD, Blu-Ray, HDD, SSD и т.п. Передатчик (не показан), передающий сигнал, выводимый из энтропийного кодера 240, и/или модуль хранения (не показан), сохраняющий сигнал, могут включаться в качестве внутреннего/внешнего элемента оборудования 200 кодирования, и альтернативно, передатчик может включаться в энтропийный кодер 240.[64] The quantizer 233 may quantize the transform coefficients and pass them to the entropy encoder 240, and the entropy encoder 240 may encode the quantized signal (information regarding the quantized transform coefficients) and output a bitstream. The information regarding the quantized transform coefficients may be referred to as "residual information". The quantizer 233 may repackage the block quantized transform coefficients into one-dimensional vector form based on the scan order of the coefficients, and generate information about the quantized transform coefficients based on the quantized transform coefficients in one-dimensional vector form. Information regarding transform coefficients may be generated. Entropy encoder 240 may perform various coding methods such as exponential Golomb code, context adaptive variable length coding (CAVLC), context adaptive binary arithmetic coding (CABAC), and the like, for example. Entropy encoder 240 may encode information needed for video/image reconstruction other than quantized transform coefficients (eg, syntax element values, etc.) together or separately. Encoded information (eg, encoded video/image information) may be transmitted or stored in NAL (Network Abstraction Layer) units in the form of a bit stream. The video/image information may further include information regarding various parameter sets such as an adaptation parameter set (APS), a frame parameter set (PPS), a sequence parameter set (SPS), or a video parameter set (VPS). In addition, the video/image information may further include general restriction information. In this document, information and/or syntax elements transmitted/signaled from encoding equipment to decoding equipment may be included in video/frame information. The video/image information may be encoded through the above-described encoding procedure and included in the bitstream. The bit stream may be transmitted over a network or may be stored on a digital storage medium. The network may include a broadcast network and/or a communication network, and the digital storage medium may include various storage media such as USB, SD, CD, DVD, Blu-ray, HDD, SSD, and the like. A transmitter (not shown), transmitting a signal output from the entropy encoder 240, and/or a storage module (not shown) storing the signal may be included as an internal/external member of the encoding equipment 200, and alternatively, a transmitter may be included in the entropy encoder 240 .

[65] Квантованные коэффициенты преобразования, выводимые из квантователя 233, могут использоваться для того, чтобы формировать прогнозный сигнал. Например, остаточный сигнал (остаточный блок или остаточные выборки) может восстанавливаться посредством применения деквантования и обратного преобразования к квантованным коэффициентам преобразования через деквантователь 234 и обратный преобразователь 235. Сумматор 250 суммирует восстановленный остаточный сигнал с прогнозным сигналом, выводимым из модуля 221 взаимного прогнозирования или модуля 222 внутреннего прогнозирования, чтобы формировать восстановленный сигнал (восстановленный кадр, восстановленный блок, массив восстановленных выборок). Если отсутствует остаток для блока, который должен обрабатываться, к примеру, в случае, в котором режим пропуска применяется, прогнозированный блок может использоваться в качестве восстановленного блока. Сумматор 250 может называться "модулем восстановления" или "формирователем восстановленных блоков". Сформированный восстановленный сигнал может использоваться для внутреннего прогнозирования следующего блока, который должен обрабатываться в текущем кадре, и может использоваться для взаимного прогнозирования следующего кадра посредством фильтрации, как описано ниже.[65] The quantized transform coefficients output from quantizer 233 may be used to generate a predictive signal. For example, the residual signal (residual block or residual samples) may be recovered by applying dequantization and inverse transform to the quantized transform coefficients via dequantizer 234 and inverse transform 235. Summer 250 adds the recovered residual signal to the predictive signal output from inter prediction module 221 or module 222 intra-prediction to generate a reconstructed signal (recovered frame, reconstructed block, reconstructed sample array). If there is no remainder for a block to be processed, such as in a case in which the skip mode is applied, the predicted block may be used as the reconstructed block. The adder 250 may be referred to as a "recovery module" or "recovered block generator". The generated recovered signal may be used to intra-predict the next block to be processed in the current frame, and may be used to inter-predict the next frame through filtering as described below.

[66] Между тем, преобразование сигнала яркости с масштабированием сигнала цветности (LMCS) может применяться во время кодирования и/или восстановления кадров.[66] Meanwhile, luminance chrominance scaling (LMCS) transform may be applied during encoding and/or frame reconstruction.

[67] Фильтр 260 может повышать субъективное/объективное качество изображений посредством применения фильтрации к восстановленному сигналу. Например, фильтр 260 может формировать модифицированный восстановленный кадр посредством применения различных способов фильтрации к восстановленному кадру и сохранять модифицированный восстановленный кадр в запоминающем устройстве 270, а именно, в DPB запоминающего устройства 270. Различные способы фильтрации могут включать в себя, например, фильтрацию для удаления блочности, дискретизированное адаптивное смещение, адаптивный контурный фильтр, билатеральный фильтр и т.п. Фильтр 260 может формировать различную информацию, связанную с фильтрацией, и передавать сформированную информацию в энтропийный кодер 240, как описано ниже в описании каждого способа фильтрации. Информация, связанная с фильтрацией, может кодироваться посредством энтропийного кодера 240 и выводиться в форме потока битов.[67] The filter 260 can improve subjective/objective image quality by applying filtering to the reconstructed signal. For example, filter 260 may generate a modified reconstructed frame by applying various filtering methods to the reconstructed frame and store the modified reconstructed frame in memory 270, namely the DPB of memory 270. Various filtering methods may include, for example, filtering to deblock , sampled adaptive bias, adaptive loop filter, bilateral filter, etc. The filter 260 may generate various filtering-related information and pass the generated information to the entropy encoder 240 as described below in the description of each filtering method. Filtering related information may be encoded by entropy encoder 240 and output in the form of a bitstream.

[68] Модифицированный восстановленный кадр, передаваемый в запоминающее устройство 270, может использоваться в качестве опорного кадра в модуле 221 взаимного прогнозирования. Когда взаимное прогнозирование применяется посредством оборудования кодирования, рассогласование прогнозирования между оборудованием 200 кодирования и оборудованием декодирования может исключаться, и эффективность кодирования может повышаться.[68] The modified reconstructed frame transmitted to the memory 270 may be used as a reference frame in the inter prediction module 221 . When inter prediction is applied by the encoding equipment, prediction mismatch between the encoding equipment 200 and the decoding equipment can be eliminated, and encoding efficiency can be improved.

[69] DPB запоминающего устройства 270 может сохранять модифицированный восстановленный кадр для использования в качестве опорного кадра в модуле 221 взаимного прогнозирования. Запоминающее устройство 270 может сохранять информацию движения блока, из которой информация движения в текущем кадре извлекается (или кодируется), и/или информацию движения блоков в кадре, которые уже восстановлены. Сохраненная информация движения может передаваться в модуль 221 взаимного прогнозирования и использоваться в качестве информации движения пространственного соседнего блока или информации движения временного соседнего блока. Запоминающее устройство 270 может сохранять восстановленные выборки восстановленных блоков в текущем кадре и может передавать восстановленные выборки в модуль 222 внутреннего прогнозирования.[69] The DPB of the memory 270 may store the modified reconstructed frame for use as a reference frame in the inter prediction module 221 . The memory 270 may store block motion information from which motion information in the current frame is extracted (or encoded) and/or motion information of blocks in the frame that have already been recovered. The stored motion information may be transmitted to the inter-prediction unit 221 and used as spatial neighbor block motion information or temporal neighbor block motion information. The memory 270 may store the recovered samples of the recovered blocks in the current frame and may pass the recovered samples to the intra prediction module 222 .

[70] Фиг. 3 является принципиальной схемой, иллюстрирующей конфигурацию оборудования декодирования видео/изображений, к которому может применяться вариант(ы) осуществления настоящего документа.[70] FIG. 3 is a schematic diagram illustrating the configuration of video/image decoding equipment to which the embodiment(s) of the present document may be applied.

[71] Ссылаясь на фиг. 3, оборудование 300 декодирования может включать в себя энтропийный декодер 310, остаточный процессор 320, модуль 330 прогнозирования, сумматор 340, фильтр 350, запоминающее устройство 360. Модуль 330 прогнозирования может включать в себя модуль 331 взаимного прогнозирования и модуль 332 внутреннего прогнозирования. Остаточный процессор 320 может включать в себя деквантователь 321 и обратный преобразователь 321. Энтропийный декодер 310, остаточный процессор 320, модуль 330 прогнозирования, сумматор 340 и фильтр 350 могут быть сконфигурированы посредством аппаратного компонента (например, набора микросхем или процессора декодера) согласно варианту осуществления. Помимо этого, запоминающее устройство 360 может включать в себя буфер декодированных кадров (DPB) или может быть сконфигурировано посредством цифрового носителя хранения данных. Аппаратный компонент дополнительно может включать в себя запоминающее устройство 360 в качестве внутреннего/внешнего компонента.[71] Referring to FIG. 3, the decoding equipment 300 may include an entropy decoder 310, a residual processor 320, a prediction unit 330, an adder 340, a filter 350, a memory 360. The prediction unit 330 may include an inter prediction unit 331 and an intra prediction unit 332. Residual processor 320 may include a dequantizer 321 and an inverse converter 321. Entropy decoder 310, residual processor 320, predictor 330, adder 340, and filter 350 may be configured by a hardware component (eg, a chipset or decoder processor) according to an embodiment. In addition, the storage device 360 may include a decoded frame buffer (DPB) or may be configured with a digital storage medium. The hardware component may further include a storage device 360 as an internal/external component.

[72] Когда поток битов, включающий в себя информацию видео/изображений, вводится, оборудование 300 декодирования может восстанавливать изображение, соответствующее процессу, в котором информация видео/изображений обрабатывается в оборудовании кодирования по фиг. 2. Например, оборудование 300 декодирования может извлекать единицы/блоки на основе связанной с сегментацией на блоки информации, полученной из потока битов. Оборудование 300 декодирования может выполнять декодирование с использованием блока обработки, применяемого в оборудовании кодирования. Таким образом, блок обработки декодирования, например, может представлять собой единицу кодирования, и единица кодирования может сегментироваться согласно структуре в виде дерева квадрантов, структуре в виде двоичного дерева и/или структуре в виде троичного дерева из единицы дерева кодирования или наибольшей единицы кодирования. Одна или более единиц преобразования могут извлекаться из единицы кодирования. Восстановленный сигнал изображения, декодированный и выводимый посредством оборудования 300 декодирования, может воспроизводиться посредством оборудования воспроизведения.[72] When a bitstream including video/image information is input, the decoding equipment 300 can reconstruct an image corresponding to the process in which the video/image information is processed in the encoding equipment of FIG. 2. For example, decoding equipment 300 may extract units/blocks based on block segmentation-related information obtained from the bit stream. The decoding equipment 300 may perform decoding using a processing unit used in the encoding equipment. Thus, the decoding processing unit may, for example, be a coding unit, and the coding unit may be segmented according to a quadtree structure, a binary tree structure, and/or a ternary tree structure from the coding tree unit or the largest coding unit. One or more transformation units may be derived from a coding unit. The reconstructed image signal decoded and output by the decoding equipment 300 can be reproduced by the playback equipment.

[73] Оборудование 300 декодирования может принимать сигнал, выводимый из оборудования кодирования по фиг. 2 в форме потока битов, и принимаемый сигнал может декодироваться через энтропийный декодер 310. Например, энтропийный декодер 310 может синтаксически анализировать поток битов, чтобы извлекать информацию (например, информацию видео/изображений), необходимую для восстановления изображений (или восстановления кадров). Информация видео/изображений дополнительно может включать в себя информацию относительно различных наборов параметров, таких как набор параметров адаптации (APS), набор параметров кадра (PPS), набор параметров последовательности (SPS) или набор параметров видео (VPS). Помимо этого, информация видео/изображений дополнительно может включать в себя общую информацию ограничений. Оборудование декодирования дополнительно может декодировать кадр на основе информации относительно набора параметров и/или общей информации ограничений. Передаваемая в служебных сигналах/принимаемая информация и/или синтаксические элементы, описанные далее в этом документе, могут декодироваться, может декодировать процедуру декодирования и получаться из потока битов. Например, энтропийный декодер 310 декодирует информацию в потоке битов на основе способа кодирования, такого как кодирование экспоненциальным кодом Голомба, CAVLC или CABAC, и выходных синтаксических элементов, требуемых для восстановления изображений, и квантованных значений коэффициентов преобразования для остатка. Более конкретно, способ энтропийного CABAC-декодирования может принимать элемент разрешения (bin), соответствующий каждому синтаксическому элементу в потоке битов, определять контекстную модель с использованием информации целевого синтаксического элемента декодирования, информации декодирования целевого блока декодирования или информации символа/элемента разрешения, декодированного в предыдущей стадии, и выполнять арифметическое декодирование для элемента разрешения посредством прогнозирования вероятности появления элемента разрешения согласно определенной контекстной модели и формировать символ, соответствующий значению каждого синтаксического элемента. В этом случае, способ энтропийного CABAC-декодирования может обновлять контекстную модель посредством использования информации декодированного символа/элемента разрешения для контекстной модели следующего символа/элемента разрешения после определения контекстной модели. Информация, связанная с прогнозированием, из информации, декодированной посредством энтропийного декодера 310, может предоставляться в модуль прогнозирования (модуль 332 взаимного прогнозирования и модуль 331 внутреннего прогнозирования), и остаточное значение, для которого энтропийное декодирование выполнено в энтропийном декодере 310, т.е. квантованные коэффициенты преобразования и связанная информация параметров, может вводиться в остаточный процессор 320. Остаточный процессор 320 может извлекать остаточный сигнал (остаточный блок, остаточные выборки, массив остаточных выборок). Помимо этого, информация относительно фильтрации из информации, декодированной посредством энтропийного декодера 310, может предоставляться в фильтр 350. Между тем, приемник (не показан) для приема сигнала, выводимого из оборудования кодирования, может быть дополнительно сконфигурирован в качестве внутреннего/внешнего элемента оборудования 300 декодирования, либо приемник может представлять собой компонент энтропийного декодера 310. Между тем, оборудование декодирования согласно этому документу может называться "оборудованием декодирования видео/изображений/кадров", и оборудование декодирования может классифицироваться на информационный декодер (декодер информации видео/изображений/кадров) и выборочный декодер (декодер выборок видео/изображений/кадров). Информационный декодер может включать в себя энтропийный декодер 310, и выборочный декодер может включать в себя, по меньшей мере, одно из деквантователя 321, обратного преобразователя 322, сумматора 340, фильтра 350, запоминающего устройства 360, модуля 332 взаимного прогнозирования и модуля 331 внутреннего прогнозирования.[73] The decoding equipment 300 may receive a signal output from the encoding equipment of FIG. 2 in the form of a bitstream, and the received signal may be decoded via entropy decoder 310. For example, entropy decoder 310 may parse the bitstream to extract information (eg, video/image information) needed for image recovery (or frame recovery). The video/image information may further include information regarding various parameter sets such as an adaptation parameter set (APS), a frame parameter set (PPS), a sequence parameter set (SPS), or a video parameter set (VPS). In addition, the video/image information may further include general restriction information. The decoding equipment may further decode the frame based on the parameter set information and/or general constraint information. Signaling/receiving information and/or syntax elements described later in this document may be decoded, may be decoded by a decoding procedure, and obtained from a bitstream. For example, entropy decoder 310 decodes information in the bitstream based on an encoding method such as Exponential Golomb, CAVLC, or CABAC coding and output syntax elements required for image reconstruction and quantized transform coefficient values for the remainder. More specifically, the CABAC entropy decoding method may receive a bin corresponding to each syntax element in the bit stream, determine a context model using decoding target syntax element information, decoding target decoding block decoding information, or symbol/bin information decoded in the previous stage, and perform arithmetic decoding for the permission element by predicting the occurrence probability of the permission element according to the determined context model, and generating a symbol corresponding to the value of each syntax element. In this case, the CABAC entropy decoding method can update the context model by using the decoded symbol/bin information for the context model of the next symbol/bin after the context model is determined. Prediction related information from the information decoded by the entropy decoder 310 may be provided to the prediction unit (inter prediction unit 332 and intra prediction unit 331) and the residual value for which entropy decoding is performed in the entropy decoder 310, i. the quantized transform coefficients and associated parameter information may be input to residual processor 320. Residual processor 320 may extract the residual signal (residual block, residual samples, residual sample array). In addition, filtering information from the information decoded by the entropy decoder 310 may be provided to the filter 350. Meanwhile, a receiver (not shown) for receiving a signal output from the encoding equipment may be further configured as an internal/external member of the equipment 300 decoding equipment, or the receiver may be a component of the entropy decoder 310. Meanwhile, the decoding equipment according to this document may be referred to as "video/image/frame decoding equipment", and the decoding equipment may be classified into an information decoder (video/image/frame information decoder) and selective decoder (decoder of video/image/frame samples). The information decoder may include an entropy decoder 310, and the selective decoder may include at least one of a dequantizer 321, an inverse transform 322, an adder 340, a filter 350, a memory 360, an inter prediction unit 332, and an intra prediction unit 331. .

[74] Деквантователь 321 может деквантовать квантованные коэффициенты преобразования и выводить коэффициенты преобразования. Деквантователь 321 может перекомпоновывать квантованные коэффициенты преобразования в форме двумерной блочной формы. В этом случае, перекомпоновка может выполняться на основе порядка сканирования коэффициентов, выполняемого в оборудовании кодирования. Деквантователь 321 может выполнять деквантование для квантованных коэффициентов преобразования посредством использования параметра квантования (например, информации размера шага квантования) и получать коэффициенты преобразования.[74] The dequantizer 321 may dequantize the quantized transform coefficients and output the transform coefficients. The dequantizer 321 may recompose the quantized transform coefficients into a two-dimensional block form. In this case, the reassembly may be performed based on the coefficient scan order performed in the encoding equipment. The dequantizer 321 may perform dequantization on the quantized transform coefficients by using a quantization parameter (eg, quantization step size information) and obtain the transform coefficients.

[75] Обратный преобразователь 322 обратно преобразует коэффициенты преобразования, чтобы получать остаточный сигнал (остаточный блок, массив остаточных выборок).[75] The detransformer 322 inversely transforms the transform coefficients to obtain a residual signal (residual block, array of residual samples).

[76] Модуль 230 прогнозирования может выполнять прогнозирование для текущего блока и может формировать прогнозированный блок, включающий в себя прогнозные выборки для текущего блока. Модуль прогнозирования может определять то, применяется внутреннее прогнозирование или взаимное прогнозирование к текущему блоку, на основе информации относительно прогнозирования, выводимой из энтропийного декодера 310, и может определять конкретный режим внутреннего/взаимного прогнозирования.[76] Prediction module 230 may perform prediction for the current block and may generate a predicted block including prediction samples for the current block. The prediction module may determine whether intra prediction or inter prediction is applied to the current block based on the prediction information output from the entropy decoder 310, and may determine a specific intra/inter prediction mode.

[77] Модуль 320 прогнозирования может формировать прогнозный сигнал на основе различных способов прогнозирования, описанных ниже. Например, модуль прогнозирования может не только применять внутреннее прогнозирование или взаимное прогнозирование для того, чтобы прогнозировать один блок, но также и одновременно применять внутреннее прогнозирование и взаимное прогнозирование. Это может называться "комбинированным взаимным и внутренним прогнозированием (CIIP)". Помимо этого, модуль прогнозирования может быть основан на режиме прогнозирования на основе внутриблочного копирования (IBC) либо на палитровом режиме для прогнозирования блока. Режим IBC-прогнозирования или палитровый режим может использоваться для кодирования изображений/видео контента игры и т.п., например, для кодирования экранного контента (SCC). IBC по существу выполняет прогнозирование в текущем кадре, но может выполняться аналогично взаимному прогнозированию, в котором опорный блок извлекается в текущем кадре. Таким образом, IBC может использовать, по меньшей мере, одну из технологий взаимного прогнозирования, описанных в этом документе. Палитровый режим может рассматриваться как пример внутреннего кодирования или внутреннего прогнозирования. Когда палитровый режим применяется, выборочное значение в кадре может передаваться в служебных сигналах на основе информации относительно таблицы палитр и индекса палитры.[77] Prediction module 320 may generate a predictive signal based on various prediction methods described below. For example, the prediction module may not only apply intra prediction or inter prediction in order to predict one block, but also apply intra prediction and inter prediction at the same time. This may be referred to as "combined mutual and intra prediction (CIIP)". In addition, the prediction module may be based on an intra-block copy (IBC) prediction mode or a palette mode for block prediction. The IBC prediction mode or palette mode can be used for image/video coding of game content and the like, such as screen content coding (SCC). IBC essentially performs prediction in the current frame, but may be performed similar to inter-prediction in which the reference block is retrieved in the current frame. Thus, the IBC may use at least one of the inter-prediction technologies described in this document. Palette mode can be considered as an example of intra coding or intra prediction. When the palette mode is applied, a sample value in a frame may be signaled based on information regarding the palette table and palette index.

[78] Модуль 331 внутреннего прогнозирования может прогнозировать текущий блок посредством ссылки на выборки в текущем кадре. Выборки для ссылки могут быть расположены в окружении текущего блока или могут быть расположены независимо согласно режиму прогнозирования. При внутреннем прогнозировании, режимы прогнозирования могут включать в себя множество ненаправленных режимов и множество направленных режимов. Модуль 331 внутреннего прогнозирования может определять режим прогнозирования, применяемый к текущему блоку, посредством использования режима прогнозирования, применяемого к соседнему блоку.[78] The intra prediction module 331 may predict the current block by referring to the samples in the current frame. The reference samples may be located in the surroundings of the current block, or may be independently located according to the prediction mode. In intra prediction, the prediction modes may include a plurality of non-directional modes and a plurality of directional modes. The intra prediction unit 331 may determine the prediction mode applied to the current block by using the prediction mode applied to the adjacent block.

[79] Модуль 332 взаимного прогнозирования может извлекать прогнозированный блок для текущего блока на основе опорного блока (массива опорных выборок), указываемого посредством вектора движения для опорного кадра. В этом случае, чтобы уменьшать объем информации движения, передаваемой в режиме взаимного прогнозирования, информация движения может прогнозироваться в единицах блоков, субблоков или выборок на основе корреляции информации движения между соседним блоком и текущим блоком. Информация движения может включать в себя вектор движения и индекс опорного кадра. Информация движения дополнительно может включать в себя информацию направления взаимного прогнозирования (L0-прогнозирование, L1-прогнозирование, бипрогнозирование и т.д.). В случае взаимного прогнозирования, соседний блок может включать в себя пространственный соседний блок, присутствующий в текущем изображении, и временной соседний блок, присутствующий в опорном изображении. Например, модуль 332 взаимного прогнозирования может конфигурировать список возможных вариантов информации движения на основе соседних блоков и извлекать вектор движения текущего блока и/или индекс опорного кадра на основе принимаемой информации выбора возможных вариантов. Взаимное прогнозирование может выполняться на основе различных режимов прогнозирования, и информация относительно прогнозирования может включать в себя информацию, указывающую режим взаимного прогнозирования для текущего блока.[79] The inter prediction unit 332 may derive a predicted block for the current block based on a reference block (reference sample array) indicated by a motion vector for the reference frame. In this case, in order to reduce the amount of motion information transmitted in the inter-prediction mode, the motion information may be predicted in units of blocks, sub-blocks, or samples based on the correlation of the motion information between the adjacent block and the current block. The motion information may include a motion vector and a reference frame index. The motion information may further include inter-prediction direction information (L0 prediction, L1 prediction, bi-prediction, etc.). In the case of inter prediction, the neighbor block may include a spatial neighbor present in the current picture and a temporal neighbor present in the reference picture. For example, inter-prediction unit 332 may configure a motion information candidate list based on adjacent blocks, and derive the current block's motion vector and/or reference frame index based on the received candidate selection information. Inter prediction may be performed based on various prediction modes, and the prediction information may include information indicative of the inter prediction mode for the current block.

[80] Сумматор 340 может формировать восстановленный сигнал (восстановленный кадр, восстановленный блок, массив восстановленных выборок) посредством суммирования полученного остаточного сигнала с прогнозным сигналом (прогнозированным блоком, массивом прогнозированных выборок), выводимым из модуля прогнозирования (включающего в себя модуль 332 взаимного прогнозирования и/или модуль 331 внутреннего прогнозирования). Если отсутствует остаток для блока, который должен обрабатываться, к примеру, когда режим пропуска применяется, прогнозированный блок может использоваться в качестве восстановленного блока.[80] The adder 340 may generate a reconstructed signal (recovered frame, reconstructed block, array of reconstructed samples) by summing the obtained residual signal with the predictive signal (predicted block, array of predicted samples) output from the prediction module (including the inter prediction module 332 and /or internal prediction module 331). If there is no remainder for the block to be processed, for example, when the skip mode is applied, the predicted block may be used as the reconstructed block.

[81] Сумматор 340 может называться "модулем восстановления" или "формирователем восстановленных блоков". Сформированный восстановленный сигнал может использоваться для внутреннего прогнозирования следующего блока, который должен обрабатываться в текущем кадре, может выводиться посредством фильтрации, как описано ниже, или может использоваться для взаимного прогнозирования следующего кадра.[81] The adder 340 may be referred to as a "recovery module" or "recovered block generator". The generated recovered signal may be used for intra-prediction of the next block to be processed in the current frame, may be output by filtering as described below, or may be used for inter-prediction of the next frame.

[82] Между тем, преобразование сигнала яркости с масштабированием сигнала цветности (LMCS) может применяться в процессе декодирования кадров.[82] Meanwhile, luminance chrominance scaling (LMCS) transform may be applied in the frame decoding process.

[83] Фильтр 350 может повышать субъективное/объективное качество изображений посредством применения фильтрации к восстановленному сигналу. Например, фильтр 350 может формировать модифицированный восстановленный кадр посредством применения различных способов фильтрации к восстановленному кадру и сохранять модифицированный восстановленный кадр в запоминающем устройстве 360, а именно, в DPB запоминающего устройства 360. Различные способы фильтрации могут включать в себя, например, фильтрацию для удаления блочности, дискретизированное адаптивное смещение, адаптивный контурный фильтр, билатеральный фильтр и т.п.[83] The filter 350 can improve subjective/objective image quality by applying filtering to the reconstructed signal. For example, filter 350 may generate a modified reconstructed frame by applying various filtering methods to the reconstructed frame and store the modified reconstructed frame in memory 360, namely the DPB of memory 360. Various filtering methods may include, for example, filtering to deblock , sampled adaptive bias, adaptive loop filter, bilateral filter, etc.

[84] (Модифицированный) восстановленный кадр, сохраненный в DPB запоминающего устройства 360, может использоваться в качестве опорного кадра в модуле 332 взаимного прогнозирования. Запоминающее устройство 360 может сохранять информацию движения блока, из которой информация движения в текущем кадре извлекается (или декодируется), и/или информацию движения блоков в кадре, которые уже восстановлены. Сохраненная информация движения может передаваться в модуль 260 взаимного прогнозирования, так что она используется в качестве информации движения пространственного соседнего блока или информации движения временного соседнего блока. Запоминающее устройство 360 может сохранять восстановленные выборки восстановленных блоков в текущем кадре и передавать восстановленные выборки в модуль 331 внутреннего прогнозирования.[84] The (modified) reconstructed frame stored in the DPB of the storage device 360 may be used as a reference frame in the inter prediction module 332 . The memory 360 may store block motion information from which motion information in the current frame is extracted (or decoded) and/or motion information of blocks in the frame that have already been recovered. The stored motion information may be transmitted to the inter-prediction unit 260 so that it is used as spatial neighbor block motion information or temporal neighbor block motion information. The memory device 360 may store the reconstructed samples of the reconstructed blocks in the current frame and pass the reconstructed samples to the intra prediction module 331 .

[85] В настоящем раскрытии варианты осуществления, описанные в фильтре 260, модуле 221 взаимного прогнозирования и модуле 222 внутреннего прогнозирования оборудования 200 кодирования могут быть идентичными надлежащим образом применяться, так что они соответствуют фильтру 350, модулю 332 взаимного прогнозирования и модулю 331 внутреннего прогнозирования оборудования 300 декодирования. То же также может применяться к модулю 332 и модулю 331 внутреннего прогнозирования.[85] In the present disclosure, the embodiments described in the filter 260, the inter prediction unit 221, and the intra prediction unit 222 of the coding equipment 200 may be identical to properly applied so that they correspond to the filter 350, the inter prediction unit 332, and the intra prediction unit 331 of the equipment 300 decoding. The same can also be applied to module 332 and module 331 internal prediction.

[86] Как описано выше, прогнозирование выполняется для того, чтобы повышать эффективность сжатия при выполнении кодирования видео. За счет этого, может формироваться прогнозированный блок, включающий в себя прогнозные выборки для текущего блока, который представляет собой целевой блок кодирования. Здесь, прогнозированный блок включает в себя прогнозные выборки в пространственной области (или пиксельной области). Прогнозированный блок может идентично извлекаться в оборудовании кодирования и оборудовании декодирования, и оборудование кодирования может повышать эффективность кодирования изображений посредством передачи в служебных сигналах в оборудование декодирования не исходного выборочного значения самого исходного блока, а информации относительно остатка (остаточной информации) между исходным блоком и прогнозированным блоком. Оборудование декодирования может извлекать остаточный блок, включающий в себя остаточные выборки на основе остаточной информации, формировать восстановленный блок, включающий в себя восстановительные выборки, посредством суммирования остаточного блока с прогнозированным блоком и формировать восстановленный кадр, включающий в себя восстановленные блоки.[86] As described above, prediction is performed in order to improve the compression efficiency when performing video encoding. Due to this, a predicted block including the predictive samples for the current block, which is the coding target block, can be generated. Here, the prediction block includes prediction samples in the spatial domain (or pixel domain). The predicted block can be identically retrieved in the encoding equipment and the decoding equipment, and the encoding equipment can improve image encoding efficiency by signaling to the decoding equipment not the original sample value of the original block itself, but information regarding the residual (residual information) between the original block and the predicted block . The decoding equipment can extract a residual block including residual samples based on the residual information, generate a reconstructed block including reconstruction samples by summing the residual block with the predicted block, and generate a reconstructed frame including the reconstructed blocks.

[87] Остаточная информация может формироваться через процедуры преобразования и квантования. Например, оборудование кодирования может извлекать остаточный блок между исходным блоком и прогнозированным блоком, извлекать коэффициенты преобразования посредством выполнения процедуры преобразования для остаточных выборок (массива остаточных выборок), включенных в остаточный блок, и извлекать квантованные коэффициенты преобразования посредством выполнения процедуры квантования для коэффициентов преобразования, так что оно может передавать в служебных сигналах ассоциированную остаточную информацию в оборудование декодирования (через поток битов). Здесь, остаточная информация может включать в себя информацию значений, информацию позиции, технологию преобразования, ядро преобразования, параметр квантования и т.п. квантованных коэффициентов преобразования. Оборудование декодирования может выполнять процедуру квантования/деквантования и извлекать остаточные выборки (или блок остаточных выборок), на основе остаточной информации. Оборудование декодирования может формировать восстановленный блок на основе прогнозированного блока и остаточного блока. Оборудование кодирования может извлекать остаточный блок посредством деквантования/обратного преобразования квантованных коэффициентов преобразования для ссылки для взаимного прогнозирования следующего кадра и может формировать восстановленный кадр на его основе.[87] The residual information may be generated through transformation and quantization procedures. For example, the encoding equipment can extract the residual block between the original block and the predicted block, extract transform coefficients by performing a transform procedure on the residual samples (array of residual samples) included in the residual block, and extract quantized transform coefficients by performing a quantization procedure on the transform coefficients, so that it can signal the associated residual information to the decoding equipment (via the bitstream). Here, the residual information may include value information, position information, transformation technology, transformation kernel, quantization parameter, and the like. quantized transformation coefficients. The decoding equipment may perform a quantization/dequantization procedure and extract residual samples (or block of residual samples) based on the residual information. The decoding equipment may generate a reconstructed block based on the predicted block and the residual block. The coding equipment may extract the residual block by dequantizing/inverse transforming the quantized transform coefficients for a reference for inter-prediction of the next frame, and may generate a reconstructed frame based on it.

[88] Фиг. 4A и 4B являются чертежом для пояснения конфигурации и работы энтропийного кодера согласно варианту осуществления.[88] FIG. 4A and 4B are a drawing for explaining the configuration and operation of an entropy encoder according to an embodiment.

[89] Ссылаясь на фиг. 4A и 4B, оборудование кодирования (энтропийный кодер) может выполнять процедуру остаточного кодирования для (квантованных) коэффициентов преобразования. Оборудование кодирования может выполнять остаточное кодирование для (квантованных) коэффициентов преобразования в текущем блоке (в текущем блоке кодирования (CB) или в текущем блоке преобразования (TB)) согласно порядку сканирования, как описано ниже на фиг. 6. Оборудование кодирования, например, может формировать и кодировать различные синтаксические элементы, связанные с остаточной информацией, как описано в нижеприведенной таблице 1. S400 и S410 могут быть включены в процедуру кодирования остаточной информации по фиг. 2.[89] Referring to FIG. 4A and 4B, the encoding equipment (entropy encoder) may perform a residual encoding procedure for the (quantized) transform coefficients. The coding equipment may perform residual coding for the (quantized) transform coefficients in the current block (in the current coding block (CB) or in the current transform block (TB)) according to the scan order, as described below in FIG. 6. The encoding equipment, for example, may generate and encode various syntax elements associated with the residual information as described in Table 1 below. S400 and S410 may be included in the residual information encoding procedure of FIG. 2.

[90] Табл. 1[90] Tab. one

Figure 00000001
Figure 00000001

Figure 00000002
Figure 00000002

Figure 00000003
Figure 00000003

Figure 00000004
Figure 00000004

Figure 00000005
Figure 00000005

[91] Оборудование кодирования может выполнять преобразование в двоичную форму для синтаксических элементов, связанных с остатком, включающих в себя last_sig_coeff_x_prefix и last_sig_coeff_y_prefix (S400); last_sig_coeff_x_prefix и last_sig_coeff_y_prefix могут извлекаться на основе позиции последнего значимого коэффициента в текущем блоке.[91] The encoding equipment may perform binarization for syntax elements associated with the remainder, including last_sig_coeff_x_prefix and last_sig_coeff_y_prefix (S400); last_sig_coeff_x_prefix and last_sig_coeff_y_prefix may be derived based on the position of the last significant coefficient in the current block.

[92] last_sig_coeff_x_prefix и last_sig_coeff_y_prefix могут представлять пример информации префикса последнего значимого коэффициента касаемо позиции последнего ненулевого коэффициента преобразования из числа коэффициентов преобразования для текущего блока. Более конкретно, last_sig_coeff_x_prefix может представлять пример информации префикса по оси X, которая представляет собой одно из информации префикса последнего значимого коэффициента, и last_sig_coeff_y_prefix может представлять пример информации префикса по оси Y, которая представляет собой одно из информации префикса последнего значимого коэффициента.[92] last_sig_coeff_x_prefix and last_sig_coeff_y_prefix may represent an example of the last significant coefficient prefix information regarding the position of the last non-zero transform coefficient among the transform coefficients for the current block. More specifically, last_sig_coeff_x_prefix may represent an example of X-axis prefix information that is one of the last significant coefficient prefix information, and last_sig_coeff_y_prefix may represent an example of Y-axis prefix information that is one of the last significant coefficient prefix information.

[93] В этом случае, нуль может использоваться в качестве значения cRiceParam. Оборудование кодирования может извлекать строку элементов разрешения для каждого из last_sig_coeff_x_prefix и last_sig_coeff_y_prefix через процедуру преобразования в двоичную форму. Процедура преобразования в двоичную форму может выполняться посредством модуля 242 преобразования в двоичную форму в энтропийном кодере 240.[93] In this case, zero can be used as the value of cRiceParam. The encoding equipment may extract the bin string for each of last_sig_coeff_x_prefix and last_sig_coeff_y_prefix through a binarization procedure. The binarization procedure may be performed by a binarizer 242 in entropy encoder 240.

[94] Согласно варианту осуществления, значение cMax для каждого из last_sig_coeff_x_prefix и last_sig_coeff_y_prefix может извлекаться на основе того, применяется или нет высокочастотное обнуление. Ниже на фиг. 6 описывается конкретное уравнение для извлечения cMax; cMax может представлять максимальную длину кодового слова (строки элементов разрешения), извлекаемого в процедуре преобразования в двоичную форму для last_sig_coeff_x_prefix или last_sig_coeff_y_prefix. При снижении значения cMax, может эффективно сокращаться длина кодового слова для last_sig_coeff_x_prefix или last_sig_coeff_y_prefix. Кроме того, поскольку кодированный элемент разрешения, уменьшенный посредством сокращения кодового слова, представляет собой контекстно-кодированный элемент разрешения, может обеспечиваться преимущество с точки зрения пропускной способности кодирования изображений.[94] According to an embodiment, a cMax value for each of last_sig_coeff_x_prefix and last_sig_coeff_y_prefix may be derived based on whether high frequency nulling is applied or not. Below in FIG. 6 describes a specific equation for extracting cMax; cMax may represent the maximum length of the codeword (bin string) extracted in the binarization procedure for last_sig_coeff_x_prefix or last_sig_coeff_y_prefix. By reducing the value of cMax, the length of the codeword for last_sig_coeff_x_prefix or last_sig_coeff_y_prefix can be effectively reduced. In addition, since the encoded bin reduced by codeword reduction is a context-encoded bin, an advantage in terms of image coding throughput can be provided.

[95] Между тем, преобразование в двоичную форму может продолжаться для остальных синтаксических элементов таблицы 1 согласно предварительно определенному способу. Например, преобразование в двоичную форму может выполняться для transform_skip_flag, last_sig_coeff_x_suffix, last_sig_coeff_y_suffix, coded_sub_block_flag, sig_coeff_flag, par_level_flag, rem_abs_gt1_flag, rem_abs_gt2_flag, coeff_sign_flag, mts_idx и т.п. согласно процессу преобразования в двоичную форму кодом фиксированной длины, и для abs_remainder может выполняться преобразование в двоичную форму, соответствующее ему.[95] Meanwhile, binarization may continue for the remaining syntax elements of Table 1 according to a predetermined method. For example, binarization may be performed on transform_skip_flag, last_sig_coeff_x_suffix, last_sig_coeff_y_suffix, coded_sub_block_flag, sig_coeff_flag, par_level_flag, rem_abs_gt1_flag, rem_abs_gt2_flag, coeff_sign_flag, mts_idx, and the like. according to the fixed length code binarization process, and abs_remainder can be binarized corresponding to it.

[96] Оборудование кодирования может выполнять энтропийное кодирование в отношении синтаксических элементов, связанных с остаточным кодированием, включающих в себя last_sig_coeff_x_prefix и last_sig_coeff_y_prefix (S410). Оборудование кодирования может выполнять энтропийное кодирование на основе строки элементов разрешения для каждого из last_sig_coeff_x_prefix и last_sig_coeff_y_prefix. Оборудование кодирования может выполнять контекстное или обходное кодирование строки элементов разрешения на основе технологии энтропийного кодирования, такой как контекстно-адаптивное арифметическое кодирование (CABAC) или контекстно-адаптивное кодирование переменной длины (CAVLC), и его вывод может быть включен в поток битов. Процедура энтропийного кодирования может выполняться посредством процессора 244 энтропийного кодирования в энтропийном кодере 240. Поток битов может включать в себя различную информацию для декодирования изображений/видео, к примеру, информацию прогнозирования и т.п., за исключением остаточной информации, включающей в себя информацию относительно last_sig_coeff_x_prefix и last_sig_coeff_y_prefix, как описано выше. Поток битов может передаваться в оборудование декодирования через (цифровой) носитель хранения данных или сеть.[96] The encoding equipment may perform entropy encoding on syntax elements associated with residual encoding, including last_sig_coeff_x_prefix and last_sig_coeff_y_prefix (S410). The encoding hardware may perform entropy coding based on the bin string for each of last_sig_coeff_x_prefix and last_sig_coeff_y_prefix. The encoding equipment may perform context or bypass encoding of a bin string based on an entropy encoding technology such as context adaptive arithmetic coding (CABAC) or context adaptive variable length coding (CAVLC) and its output may be included in a bit stream. The entropy encoding procedure may be performed by the entropy encoding processor 244 in the entropy encoder 240. The bit stream may include various image/video decoding information such as prediction information and the like, except for residual information including information regarding last_sig_coeff_x_prefix and last_sig_coeff_y_prefix as described above. The bit stream may be transmitted to the decoding equipment via a (digital) storage medium or a network.

[97] Фиг. 5A и 5B являются чертежом для пояснения конфигурации и способа работы энтропийного декодера согласно варианту осуществления.[97] FIG. 5A and 5B are a drawing for explaining the configuration and operation method of the entropy decoder according to the embodiment.

[98] Ссылаясь на фиг. 5A и 5B, оборудование декодирования (энтропийный декодер) может извлекать (квантованные) коэффициенты преобразования посредством декодирования кодированной остаточной информации. Оборудование декодирования может извлекать (квантованные) коэффициенты преобразования посредством декодирования кодированной остаточной информации для текущего блока (текущего CB или текущего TB), как описано ниже на фиг. 6. Например, оборудование декодирования может декодировать различные синтаксические элементы, связанные с такой остаточной информацией, записанной в таблице 1, анализировать значения ассоциированных синтаксических элементов и извлекать (квантованные) коэффициенты преобразования на основе значения проанализированных синтаксических элементов. S500-S510 могут быть включены в процедуру, которая извлекает вышеописанные (квантованные) коэффициенты преобразования по фиг. 3.[98] Referring to FIG. 5A and 5B, the decoding equipment (entropy decoder) can extract (quantized) transform coefficients by decoding the encoded residual information. The decoding equipment can extract (quantized) transform coefficients by decoding the encoded residual information for the current block (current CB or current TB) as described below in FIG. 6. For example, the decoding equipment may decode the various syntax elements associated with such residual information recorded in Table 1, parse the values of the associated syntax elements, and extract (quantized) transform coefficients based on the value of the parsed syntax elements. S500-S510 may be included in a procedure that extracts the above-described (quantized) transform coefficients of FIG. 3.

[99] Оборудование декодирования может выполнять преобразование в двоичную форму в отношении синтаксических элементов, связанных с остатком, включающих в себя last_sig_coeff_x_prefix и last_sig_coeff_y_prefix (S500). В этом случае, нуль может использоваться в качестве значения cRiceParam. Оборудование кодирования может извлекать доступную строку элементов разрешения для каждого доступного значения last_sig_coeff_x_prefix и last_sig_coeff_y_prefix через процедуру преобразования в двоичную форму. Процедура преобразования в двоичную форму может выполняться посредством модуля 312 преобразования в двоичную форму в энтропийном декодере 310. Согласно варианту осуществления, значение cMax для каждого из last_sig_coeff_x_prefix и last_sig_coeff_y_prefix может извлекаться на основе того, применяется или нет высокочастотное обнуление. Ниже на фиг. 6 описывается конкретное уравнение для извлечения cMax.[99] The decoding equipment may perform binarization on the syntax elements associated with the remainder, including last_sig_coeff_x_prefix and last_sig_coeff_y_prefix (S500). In this case, zero can be used as the value of cRiceParam. The encoding hardware may extract the available bin string for each available value of last_sig_coeff_x_prefix and last_sig_coeff_y_prefix via a binarization procedure. The binarization procedure may be performed by a binarizer 312 in the entropy decoder 310. According to an embodiment, a cMax value for each of last_sig_coeff_x_prefix and last_sig_coeff_y_prefix may be derived based on whether high frequency nulling is applied or not. Below in FIG. 6 describes a specific equation for extracting cMax.

[100] cMax может представлять максимальную длину кодового слова (строки элементов разрешения), извлекаемого в процедуре преобразования в двоичную форму для last_sig_coeff_x_prefix или last_sig_coeff_y_prefix. При снижении значения cMax, может эффективно сокращаться длина кодового слова для last_sig_coeff_x_prefix или last_sig_coeff_y_prefix. Кроме того, поскольку кодированный элемент разрешения, уменьшенный посредством сокращения кодового слова, представляет собой контекстно-кодированный элемент разрешения, может обеспечиваться преимущество с точки зрения пропускной способности кодирования изображений.[100] cMax may represent the maximum length of the codeword (string of bins) extracted in the binarization procedure for last_sig_coeff_x_prefix or last_sig_coeff_y_prefix. By reducing the value of cMax, the length of the codeword for last_sig_coeff_x_prefix or last_sig_coeff_y_prefix can be effectively reduced. In addition, since the encoded bin reduced by codeword reduction is a context-encoded bin, an advantage in terms of image coding throughput can be provided.

[101] Между тем, преобразование в двоичную форму может продолжаться для остальных синтаксических элементов таблицы 1 согласно предварительно определенному способу. Например, преобразование в двоичную форму может выполняться для transform_skip_flag, last_sig_coeff_x_suffix, last_sig_coeff_y_suffix, coded_sub_block_flag, sig_coeff_flag, par_level_flag, rem_abs_gt1_flag, rem_abs_gt2_flag, coeff_sign_flag, mts_idx и т.п. согласно процессу преобразования в двоичную форму кодом фиксированной длины, и для abs_remainder может выполняться преобразование в двоичную форму, соответствующее ему.[101] Meanwhile, binarization may continue for the remaining syntax elements of Table 1 according to a predetermined method. For example, binarization may be performed on transform_skip_flag, last_sig_coeff_x_suffix, last_sig_coeff_y_suffix, coded_sub_block_flag, sig_coeff_flag, par_level_flag, rem_abs_gt1_flag, rem_abs_gt2_flag, coeff_sign_flag, mts_idx, and the like. according to the fixed length code binarization process, and abs_remainder can be binarized corresponding to it.

[102] Оборудование декодирования может выполнять энтропийное декодирование в отношении синтаксических элементов, связанных с остаточным кодированием, включающих в себя last_sig_coeff_x_prefix и last_sig_coeff_y_prefix (S510). Оборудование декодирования может сравнивать извлекаемую строку элементов разрешения с доступными строками элементов разрешения при синтаксическом анализе и декодировании последовательно каждого из элементов разрешения для last_sig_coeff_x_prefix. Когда извлеченная строка элементов разрешения является идентичной одной из доступных строк элементов разрешения, значение, соответствующее строке элементов разрешения, может извлекаться в качестве значения last_sig_coeff_x_prefix. Когда извлеченная строка элементов разрешения не является идентичной ни одной из доступных строк элементов разрешения, процедура сравнения может выполняться после дополнительного синтаксического анализа и декодирования следующего бита в потоке битов. Дополнительно, оборудование декодирования может сравнивать извлекаемую строку элементов разрешения с доступными строками элементов разрешения при синтаксическом анализе и декодировании последовательно каждого из элементов разрешения для last_sig_coeff_y_prefix. Когда извлеченная строка элементов разрешения является идентичной одной из доступных строк элементов разрешения, значение, соответствующее строке элементов разрешения, может извлекаться в качестве значения last_sig_coeff_y_prefix. Когда извлеченная строка элементов разрешения не является идентичной ни одной из доступных строк элементов разрешения, процедура сравнения может выполняться после дополнительного синтаксического анализа и декодирования следующего бита в потоке битов. Посредством этих процессов, без использования начального бита или конечного бита для конкретной информации (конкретного синтаксического элемента) в потоке битов, информация может передаваться в служебных сигналах с использованием бита переменной длины, в силу чего относительно меньший бит может назначаться низкому значению, за счет этого повышая общую эффективность кодирования.[102] The decoding equipment may perform entropy decoding on syntax elements associated with residual coding including last_sig_coeff_x_prefix and last_sig_coeff_y_prefix (S510). The decoding hardware may compare the retrieved bin string with the available bin strings when parsing and decoding each of the bins for last_sig_coeff_x_prefix in sequence. When the retrieved bin string is identical to one of the available bin strings, the value corresponding to the bin string may be retrieved as the value of last_sig_coeff_x_prefix. When the extracted bin string is not identical to any of the available bin strings, a comparison procedure may be performed after additional parsing and decoding of the next bit in the bitstream. Additionally, the decoding hardware may compare the retrieved bin string with the available bin strings when parsing and decoding each of the bins for last_sig_coeff_y_prefix in sequence. When the retrieved bin string is identical to one of the available bin strings, the value corresponding to the bin string may be retrieved as the value of last_sig_coeff_y_prefix. When the extracted bin string is not identical to any of the available bin strings, a comparison procedure may be performed after additional parsing and decoding of the next bit in the bitstream. Through these processes, without using a start bit or end bit for particular information (a particular syntax element) in the bit stream, information can be signaled using a variable length bit, whereby a relatively smaller bit can be assigned to a low value, thereby increasing overall coding efficiency.

[103] Оборудование декодирования может выполнять контекстное или обходное декодирование в отношении каждого из элементов разрешения в строке элементов разрешения из потока битов на основе технологии энтропийного кодирования, такой как CABAC, CAVLC и т.п. Процедура энтропийного декодирования может выполняться посредством процессора 314 энтропийного декодирования в энтропийном декодере 310. Оборудование декодирования может извлекать позицию последнего значимого коэффициента на основе значения last_sig_coeff_x_prefix и значения last_sig_coeff_y_prefix. Конкретное вычисление, например, может выполняться на основе нижеприведенной таблицы 2.[103] The decoding equipment may perform contextual or bypass decoding on each of the bins in the bin string from the bitstream based on entropy coding technology such as CABAC, CAVLC, and the like. The entropy decoding procedure may be performed by the entropy decoding processor 314 in the entropy decoder 310. The decoding hardware may extract the position of the last significant coefficient based on the last_sig_coeff_x_prefix value and the last_sig_coeff_y_prefix value. Specific calculation, for example, may be performed based on Table 2 below.

[104] Табл. 2[104] Tab. 2

Позиция столбца последнего значимого коэффициента в порядке сканирования в блоке LastSignificantCoeffX преобразования извлекается следующим образом: //Если last_sig_coeff_x_suffix не присутствует, следующее применимо: LastSignificantCoeffX=last_sig_coeff_x_prefix // Иначе (last_sig_coeff_x_suffix присутствует), следующее применимо: LastSignificantCoeffX=(1<<((last_sig_coeff_x_prefix>>1)-1))*(2+(last_sig_coeff_x_prefixand1))+last_sig_coeff_x_suffix // Позиция строки последнего значимого коэффициента в порядке сканирования в блоке преобразования LastSignificantCoeffY извлекается h следующим образом: // Если last_sig_coeff_y_suffix не присутствует, следующее применимо: LastSignificantCoeffY=last_sigcoeff_y_prefix // Иначе (last_sig_coeff_y_suffix присутствует), следующее применимо: LastSignificantCoeffY=(1<<((last_sig_coeff_y_prefix>>1)-))*(2+(last_sig_c-oeff_y_prefixand1))+last_sig_coeff_y_suffixThe column position of the last significant coefficient in the scan order in the LastSignificantCoeffX block of the transform is retrieved as follows: //If last_sig_coeff_x_suffix is not present, the following applies: LastSignificantCoeffX=last_sig_coeff_x_prefix // Otherwise (last_sig_coeff_x_suffix is present), the following applies: LastSignificantCoeffX=(1<<((last_sig_coeff_x_prefix> >1)-1))*(2+(last_sig_coeff_x_prefixand1))+last_sig_coeff_x_suffix // The row position of the last significant coeff in scan order in the LastSignificantCoeffY transform block is retrieved h as follows: // If last_sig_coeff_y_suffix is not present, the following applies: LastSignificantCoeffY=last_sigcoeff_y_prefix / / Otherwise (last_sig_coeff_y_suffix is present), the following applies: LastSignificantCoeffY=(1<<((last_sig_coeff_y_prefix>>1)-))*(2+(last_sig_c-oeff_y_prefixand1))+last_sig_coeff_y_suffix

[105] В таблице 2, LastSignificantCoeffX может представлять позицию по оси X последнего ненулевого значимого коэффициента в текущем блоке (преобразования), и LastSignificantCoeffY может представлять позицию по оси Y последнего ненулевого значимого коэффициента в текущем блоке (преобразования).[105] In Table 2, LastSignificantCoeffX may represent the x-axis position of the last non-zero significant coefficient in the current block (transform), and LastSignificantCoeffY may represent the y-axis position of the last non-zero significant coefficient in the current block (transform).

[106] Поток битов может включать в себя различную информацию для декодирования изображений/видео, к примеру, информацию прогнозирования и т.п., за исключением остаточной информации, включающей в себя информацию относительно last_sig_coeff_x_prefix и last_sig_coeff_y_prefix, как описано выше. Как описано выше, поток битов может передаваться в оборудование декодирования через (цифровой) носитель хранения данных или сеть.[106] The bitstream may include various information for image/video decoding, such as prediction information and the like, except for residual information including information regarding last_sig_coeff_x_prefix and last_sig_coeff_y_prefix as described above. As described above, the bit stream may be transmitted to the decoding equipment via a (digital) storage medium or a network.

[107] Оборудование декодирования может извлекать остаточные выборки для текущего блока посредством выполнения процедуры деквантования и/или процедуры обратного преобразования на основе (квантованных) коэффициентов преобразования. Восстановленные выборки могут формироваться на основе остаточных выборок и прогнозных выборок, извлекаемых через взаимное/внутреннее прогнозирование, и может формироваться восстановленный кадр, включающий в себя восстановленные выборки.[107] The decoding equipment may extract residual samples for the current block by performing a dequantization procedure and/or an inverse transform procedure based on the (quantized) transform coefficients. The reconstructed samples may be generated based on the residual samples and the predictive samples derived via inter/intra prediction, and a reconstructed frame including the reconstructed samples may be generated.

[108] Фиг. 6 является чертежом для пояснения высокочастотного обнуления согласно примеру.[108] FIG. 6 is a drawing for explaining high frequency nulling according to an example.

[109] В настоящем описании изобретения, "высокочастотное обнуление" означает процесс, посредством которого коэффициенты преобразования, связанные с частотой, равной или превышающей определенное значение в блоке (преобразования), имеющем первый размер W1 по ширине (или длину) и первый размер H1 по высоте (или длину), обнуляются (т.е. определяются в качестве нуля). Когда высокочастотное обнуление применяется, значения коэффициентов преобразования коэффициентов преобразования за пределами области низкочастотных коэффициентов преобразования, сконфигурированной на основе второго размера W2 по ширине и второго размера H2 по высоте из числа коэффициентов преобразования в блоке (преобразования), могут определяться (задаваться) в качестве нуля. Наружная часть по отношению к области низкочастотных коэффициентов преобразования может называться "областью высокочастотных коэффициентов преобразования". В примере, область низкочастотных коэффициентов преобразования может представлять собой область прямоугольной формы, расположенную с левого верхнего конца блока (преобразования).[109] In the present specification, "high-frequency nulling" means a process by which transform coefficients associated with a frequency equal to or greater than a certain value in a block (transform) having a first width (or length) dimension W 1 and a first dimension H 1 in height (or length) are set to zero (i.e. defined as zero). When high-frequency nulling is applied, transform coefficient values of transform coefficients outside the low-frequency transform coefficient region configured based on the second width dimension W 2 and the second height dimension H 2 of the transform coefficients in the block (transform) may be determined (set) as zero. The outer portion with respect to the low-frequency transform coefficient region may be referred to as the "high-frequency transform coefficient region". In an example, the area of low-frequency transform coefficients may be a rectangular area located at the upper left end of the block (transform).

[110] В настоящем описании изобретения конкретный термин или предложение используется для задания конкретной информации или понятия. Например, в настоящем описании изобретения, как описано выше, процесс, посредством которого обнуляются коэффициенты преобразования, связанные с частотой, равной или превышающей определенное значение в блоке (преобразования), имеющем первый размер W1 по ширине (или длину) и первый размер H1 по высоте (или длину), задается как "высокочастотное обнуление"; область, в которой обнуление выполнено через высокочастотное обнуление, задается как "область высокочастотных коэффициентов преобразования"; и область, для которой обнуление не выполняется, задается как "область низкочастотных коэффициентов преобразования". Чтобы представлять размер области низкочастотных коэффициентов преобразования, второй размер W2 по ширине (или длина) и второй размер H2 по высоте (или длина) используются.[110] In the present description of the invention, a specific term or sentence is used to specify specific information or concepts. For example, in the present specification, as described above, a process by which transform coefficients associated with a frequency equal to or greater than a certain value in a block (transform) having a first width (or length) dimension W 1 and a first dimension H 1 height (or length), set as "high-frequency zeroing"; the region in which the nulling is performed through the high-frequency nulling is set as the "high-frequency transform coefficient region"; and a region for which zeroing is not performed is set as "a region of low-frequency transform coefficients". To represent the size of the low-frequency transform coefficient region, a second width dimension W 2 (or length) and a second height dimension H 2 (or length) are used.

[111] Тем не менее, термин "высокочастотное обнуление" может заменяться различными терминами, такими как высокочастотное обнуление, высокочастотное сведение к нулю, сведение к нулю и т.п.; термин "область высокочастотных коэффициентов преобразования" - различными терминами, такими как область применения высокочастотного обнуления, область высокочастотного обнуления, высокочастотная область, область высокочастотных коэффициентов, область высокочастотного сведения к нулю, область сведения к нулю и т.п.; и термин "область низкочастотных коэффициентов преобразования" - различными терминами, такими как область без применения высокочастотного обнуления, низкочастотная область, область низкочастотных коэффициентов, ограниченная область и т.п. Таким образом, в настоящем описании изобретения при интерпретации во всем подробном описании конкретного термина или предложения, используемого для определения конкретной информации или понятия, необходимо обращать внимание на различные операции, функции и преимущества согласно контенту, который должен представлять термин, и не ограничиваться его названием.[111] However, the term "high frequency nulling" may be replaced by various terms such as high frequency nulling, high frequency nulling, nulling, and the like; the term "high-frequency transform coefficient region" with various terms such as high-frequency nulling application region, high-frequency nulling region, high-frequency region, high-frequency coefficient region, high-frequency nulling region, nulling region, and the like; and the term "low-frequency transform coefficient region" by various terms such as a region without applying high-frequency nulling, a low-frequency region, a region of low-frequency coefficients, a limited region, and the like. Thus, in the present description of the invention, when interpreting throughout the detailed description of a particular term or sentence used to define a particular information or concept, it is necessary to pay attention to various operations, functions and advantages according to the content that the term should represent, and not be limited to its name.

[112] В примере, может предлагаться способ для выполнения преобразования в двоичную форму синтаксических элементов, last_sig_coeff_x_prefix и last_sig_coeff_y_prefix, для блока (преобразования) (TB, TU или CB), к которому применяется высокочастотное обнуление; last_sig_coeff_x_prefix и last_sig_coeff_y_prefix могут преобразовываться в двоичную форму с усеченным кодом Райса, и в это время, значение cRiceParam может использовать 0. Значение cMax, используемого в преобразовании в двоичную форму для усеченного кода Райса, может определяться на основе уравнения 1 при выполнении преобразования в двоичную форму last_sig_coeff_x_prefix и определяться на основе уравнения 2 при выполнении преобразования в двоичную форму last_sig_coeff_y_prefix.[112] In an example, a method may be provided for performing binarization of the syntax elements, last_sig_coeff_x_prefix and last_sig_coeff_y_prefix, on a block (transformation) (TB, TU, or CB) to which high-frequency nulling is applied; last_sig_coeff_x_prefix and last_sig_coeff_y_prefix may be binarized with truncated Rice code, and at this time, the value of cRiceParam may use 0. The value of cMax used in binarization for truncated Rice code may be determined based on Equation 1 when performing binarization last_sig_coeff_x_prefix and be determined based on Equation 2 when binarizing last_sig_coeff_y_prefix.

[113] уравнение 1[113] Equation 1

[114] cMax=(log2W1<<1)-1[114] cMax=(log2W 1< <1)-1

[115] уравнение 2[115] Equation 2

[116] cMax=(log2H1<<1)-1,[116] cMax=(log 2 H 1< <1)-1,

[117] где W1 может представлять длину по ширине (или ширину) блока (преобразования) и H1 может представлять длину по высоте (или высоту) блока (преобразования). Например, в случае блока преобразования 64×32, как показано на фиг. 6, W1 равно 64, и H1 равно 32. Следовательно, значение cMax для преобразования в двоичную форму last_sig_coeff_x_prefix может быть равно 11, и значение cMax для преобразования в двоичную форму last_sig_coeff_y_prefix может быть равно 9.[117] where W 1 may represent the width (or width) of the box (transform) and H 1 may represent the height (or height) of the box (transform). For example, in the case of a 64x32 transform block, as shown in FIG. 6, W 1 is 64, and H 1 is 32. Therefore, the last_sig_coeff_x_prefix binarization cMax value may be 11, and the last_sig_coeff_y_prefix binarization cMax value may be 9.

[118] Нижеприведенная таблица 3 представляет преобразование в двоичную форму, когда W1 или H1 равно 32, и нижеприведенная таблица 4 представляет кодовое слово преобразования в двоичную форму, когда W1 или H1 равно 64. В примере, преобразование в двоичную форму усеченным кодом Райса может выполняться на основе размера блока преобразования, и в силу этого, как указано в нижеприведенной таблице 4, кодовое слово last_sig_coeff_x_prefix или last_sig_coeff_y_prefix для кодирования для значения LastSignificantCoeffX или LastSignificantCoeffY, равного 32-47, может представлять собой "11111111110", и кодовое слово last_sig_coeff_x_prefix или last_sig_coeff_y_prefix для кодирования для значения LastSignificantCoeffX или LastSignificantCoeffY, равного 48-63, может представлять собой "11111111111". В обоих случаях, преобразование в двоичную форму может выполняться на основе 11 элементов разрешения. Кодовое слово может называться "строкой элементов разрешения".[118] Table 3 below represents binarization when W 1 or H 1 is 32, and Table 4 below represents binarization codeword when W 1 or H 1 is 64. In the example, binarization is truncated Rice code may be performed based on the transform block size, and because of this, as indicated in Table 4 below, the last_sig_coeff_x_prefix or last_sig_coeff_y_prefix codeword for encoding for a LastSignificantCoeffX or LastSignificantCoeffY value of 32-47 may be "11111111110", and the codeword last_sig_coeff_x_prefix or last_sig_coeff_y_prefix to encode for a LastSignificantCoeffX or LastSignificantCoeffY value of 48-63 may be "11111111111". In both cases, binarization can be performed based on 11 bins. The codeword may be referred to as a "string of permission elements".

[119] Табл. 3[119] Tab. 3

Figure 00000006
Figure 00000006

[120] Табл. 4[120] Tab. four

Figure 00000007
Figure 00000007

[121] Как показано в вышеприведенной таблице 1, когда значение last_sig_coeff_x_prefix превышает 3, last_sig_coeff_x_suffix дополнительно может передаваться в служебных сигналах, и LastSignificantCoeffX может извлекаться на основе значения last_sig_coeff_x_suffix. Например, кодовое слово last_sig_coeff_x_prefix для кодирования для значения LastSignificantCoeffX, равного 32-47, может представлять собой "11111111110", и то, какое значение из 32-47 используется, может определяться на основе значения last_sig_coeff_x_suffix. Как показано в вышеприведенной таблице 1, когда значение last_sig_coeff_y_prefix превышает 3, last_sig_coeff_y_suffix дополнительно может передаваться в служебных сигналах, и LastSignificantCoeffY может извлекаться на основе значения last_sig_coeff_y_suffix. Например, кодовое слово last_sig_coeff_x_prefix для кодирования для значения LastSignificantCoeffY, равного 32-47, может представлять собой "11111111110", и то, какое значение из 32-47 используется, может определяться на основе значения last_sig_coeff_y_suffix.[121] As shown in Table 1 above, when the value of last_sig_coeff_x_prefix exceeds 3, last_sig_coeff_x_suffix may additionally be signaled, and LastSignificantCoeffX may be derived based on the value of last_sig_coeff_x_suffix. For example, the codeword last_sig_coeff_x_prefix to encode for a LastSignificantCoeffX value of 32-47 may be "11111111110", and which value of 32-47 is used may be determined based on the value of last_sig_coeff_x_suffix. As shown in Table 1 above, when the value of last_sig_coeff_y_prefix exceeds 3, last_sig_coeff_y_suffix may additionally be signaled, and LastSignificantCoeffY may be derived based on the value of last_sig_coeff_y_suffix. For example, the codeword last_sig_coeff_x_prefix to encode for a LastSignificantCoeffY value of 32-47 may be "11111111110", and which value of 32-47 is used may be determined based on the value of last_sig_coeff_y_suffix.

[122] Конкретное вычисление для извлечения LastSignificantCoeffX или LastSignificantCoeffY может выполняться, например, следующим образом.[122] A specific calculation for extracting LastSignificantCoeffX or LastSignificantCoeffY may be performed, for example, as follows.

[123] Табл. 5[123] Tab. 5

Позиция столбца последнего значимого коэффициента в порядке сканирования в блоке LastSignificantCoeffX преобразования извлекается следующим образом: // Если last_sig_coeff_x_suffix не присутствует, следующее применимо: LastSignificantCoeffX=last_sig_coeff_x_prefix//Иначе (last_sig_coeff_x_suffix присутствует), следующее применимо: LastSignificantCoeffX=(1<<((last_sig_coeff_x_prefix>>1)-1))*(2+(last_sig_coeff_x_prefix&1))+last_sig_coeff_x_suffix // Позиция строки последнего значимого коэффициента в порядке сканирования в блоке преобразования LastSignificantCoeffY извлекается следующим образом: // Если last_sig_coeff_y_suffix не присутствует, следующее применимо: LastSignificantCoeffY=last_sigcoeff_y_prefix // Иначе (last_sig_coeff_y_suffix присутствует), следующее применимо: LastSignificantCoeffY=(1<<((last_sig_coeff_y_prefix>>1)-))*(2+(last_sig_c-oeff_y_prefix&1))+last_sig_coeff_y_suffixThe column position of the last significant coefficient in the scan order in the LastSignificantCoeffX block of the transform is retrieved as follows: // If last_sig_coeff_x_suffix is not present, the following applies: LastSignificantCoeffX=last_sig_coeff_x_prefix // Else (last_sig_coeff_x_suffix is present), the following applies: LastSignificantCoeffX=(1<<((last_sig_coeff_x_prefix> >1)-1))*(2+(last_sig_coeff_x_prefix&1))+last_sig_coeff_x_suffix // The row position of the last significant coeff in scan order in the LastSignificantCoeffY transform block is retrieved as follows: // If last_sig_coeff_y_suffix is not present, the following applies: LastSignificantCoeffY=last_sigcoeff_y_prefix // Otherwise (last_sig_coeff_y_suffix is present), the following applies: LastSignificantCoeffY=(1<<((last_sig_coeff_y_prefix>>1)-))*(2+(last_sig_c-oeff_y_prefix&1))+last_sig_coeff_y_suffix

[124] Высокочастотное обнуление означает обнуление коэффициентов с частотой, превышающей определенное значение в блоке преобразования, имеющем первый размер W1 по ширине или первый размер H1 по высоте (т.е. определенном в качестве нуля), и ограничение остаточных коэффициентов преобразования вторым размером W2 по ширине или вторым размером H2 по высоте. В это время, в примере, может рассматриваться способ, в котором преобразование в двоичную форму выполняется на основе усеченного кода Райса на основе размера (второго размера по ширине или второго размера по высоте) ограниченной области, извлекаемой через высокочастотное обнуление, а не способ, в котором преобразование в двоичную форму выполняется на основе усеченного кода Райса на основе размера (первого размера по ширине или первого размера по высоте) блока преобразования. После задания cMax для last_sig_coeff_x_prefix и cMax для last_sig_coeff_y_prefix в качестве уравнений 3 и 4, соответственно, с использованием второго размера по ширине и второго размера по высоте, может формироваться усеченный код Райса.[124] High-frequency zeroing means zeroing coefficients with a frequency greater than a certain value in a transform block having a first dimension Wone in width or first dimension Hone in height (i.e. defined as zero), and limiting the residual transform coefficients to the second dimension W2 in width or second dimension H2 in height. At this time, in an example, a method in which binarization is performed based on a truncated Rice code based on a size (a second width dimension or a second height dimension) of a restricted area extracted through high-frequency zeroing, rather than a method in which in which binarization is performed based on the truncated Rice code based on the size (first width dimension or first height dimension) of the conversion block. After setting cMax for last_sig_coeff_x_prefix and cMax for last_sig_coeff_y_prefix as Equations 3 and 4, respectively, using the second width dimension and the second height dimension, a truncated Rice code can be generated.

[125] уравнение 3[125] Equation 3

[126] cMax=(log2(min(W1, W2))<<1)-1[126] cMax=(log 2 (min(W 1 , W 2 ))<<1)-1

[127] уравнение 4[127] Equation 4

[128] cMax=(log2(min(H1, H2))<<1)-1[128] cMax=(log 2 (min(H 1 , H 2 ))<<1)-1

[129] В примере, когда первый размер по ширине или первый размер по высоте равен 64, и второй размер по ширине или второй размер по высоте равен 32, усеченный код Райса, извлекаемый на основе уравнений 3 и 4, может быть таким, как указано в нижеприведенной таблице 6. Через высокочастотное обнуление, остаточный коэффициент преобразования исчезает из высокочастотных коэффициентов в области высокочастотных коэффициентов преобразования, сформированной за пределами второго размера по ширине или второго размера по высоте, так что можно проектировать кодовое слово преобразования в двоичную форму так, как указано в нижеприведенной таблице 6.[129] In an example where the first width dimension or the first height dimension is 64 and the second width dimension or the second height dimension is 32, the truncated Rice code derived based on equations 3 and 4 may be as indicated in Table 6 below. Through the high-frequency nulling, the residual transform coefficient disappears from the high-frequency coefficients in the region of the high-frequency transform coefficients formed beyond the second width dimension or the second height dimension, so that it is possible to design the binarization codeword as indicated in Table 6 below.

[130] В примере, W2 и H2 могут задаваться в качестве фиксированного значения. Альтернативно, W2 и H2 могут определяться на основе W1 и H1. Альтернативно, информация, указывающая W2 и H2, может передаваться в служебных сигналах из оборудования кодирования в оборудование декодирования. В примере, W2 и H2 могут задаваться в качестве 32 или 16, соответственно. В другом примере, W2 и H2 могут извлекаться в качестве половины W1 и половины H1, соответственно. В еще одном другом примере, W2 и H2 могут извлекаться в качестве половины max(W1, H1). Тем не менее, они представляют собой примеры, и W2 и H2 могут определяться согласно различным другим способам, заданным в оборудовании кодирования и оборудовании декодирования. Через предложенный способ, можно эффективно уменьшать длину кодового слова для некоторых значений LastSignificantCoeffX или LastSignificantCoeffY. Дополнительно, поскольку кодированный элемент разрешения, уменьшенный за счет этого, представляет собой контекстно-кодированный элемент разрешения, может обеспечиваться преимущество с точки зрения пропускной способности.[130] In an example, W 2 and H 2 may be set as a fixed value. Alternatively, W 2 and H 2 may be determined based on W 1 and H 1 . Alternatively, information indicating W 2 and H 2 may be signaled from the encoding equipment to the decoding equipment. In an example, W 2 and H 2 may be set to 32 or 16, respectively. In another example, W 2 and H 2 may be extracted as half W 1 and half H 1 , respectively. In yet another example, W 2 and H 2 may be extracted as half of max(W 1 , H 1 ). However, they are examples, and W 2 and H 2 may be determined according to various other methods defined in the encoding equipment and the decoding equipment. Through the proposed method, it is possible to effectively reduce the codeword length for some LastSignificantCoeffX or LastSignificantCoeffY values. Additionally, since the encoded bin reduced thereby is a context-encoded bin, an advantage in terms of throughput can be provided.

[131] Табл. 6[131] Tab. 6

Figure 00000008
Figure 00000008

[132] В примере, способ остаточного кодирования, описанный выше на фиг. 4A-5B, может осуществляться на основе примеров, описанных на фиг. 6. В другом примере, способ кодирования, который описывается ниже на фиг. 7, либо способ декодирования, который описывается ниже на фиг. 9, может осуществляться на основе примеров, описанных на фиг. 6.[132] In an example, the residual encoding method described above in FIG. 4A-5B may be based on the examples described in FIGS. 6. In another example, the encoding method which is described below in FIG. 7 or the decoding method as described below in FIG. 9 may be based on the examples described in FIG. 6.

[133] Фиг. 7 является блок-схемой последовательности операций способа, показывающей работу оборудования кодирования согласно примеру, и фиг. 8 является блок-схемой, показывающей конфигурацию оборудования кодирования согласно примеру.[133] FIG. 7 is a flowchart showing the operation of the encoding equipment according to the example, and FIG. 8 is a block diagram showing a configuration of an encoding equipment according to an example.

[134] Оборудование кодирования согласно фиг. 7 и 8 может выполнять работу, соответствующую работе оборудования декодирования согласно фиг. 9 и 10. Следовательно, операции оборудования декодирования, которые описываются ниже на фиг. 9 и 10, вероятно, могут применяться к оборудованию кодирования согласно фиг. 7 и 8.[134] The encoding equipment of FIG. 7 and 8 can perform an operation corresponding to that of the decoding equipment of FIG. 9 and 10. Therefore, the operations of the decoding equipment, which are described below in FIG. 9 and 10 are likely to apply to the encoding equipment of FIG. 7 and 8.

[135] Каждый из этапов, раскрытых на фиг. 7, может выполняться посредством оборудования 200 кодирования, раскрытого на фиг. 2. Более конкретно, S700 может выполняться посредством вычитателя 231, раскрытого на фиг. 2; S710 посредством преобразователя 232, раскрытого на фиг. 2; S720 посредством квантователя 233, раскрытого на фиг. 2; и S730 посредством энтропийного кодера 240, раскрытого на фиг. 2. Дополнительно, операции согласно S700-S730 основаны на части контента, описанного выше на фиг. 4-6. Следовательно, пояснение для конкретного контента, дублированного с контентом, описанным выше на фиг. 2 и 4-6, опускается или приводится кратко.[135] Each of the steps disclosed in FIG. 7 may be performed by the encoding equipment 200 disclosed in FIG. 2. More specifically, S700 may be performed by the subtractor 231 disclosed in FIG. 2; S710 through converter 232 disclosed in FIG. 2; S720 through the quantizer 233 disclosed in FIG. 2; and S730 through the entropy encoder 240 disclosed in FIG. 2. Additionally, the operations of S700-S730 are based on a portion of the content described above in FIG. 4-6. Therefore, the explanation for the specific content duplicated with the content described above in FIG. 2 and 4-6 is omitted or given briefly.

[136] Как показано на фиг. 8, оборудование кодирования согласно примеру может включать в себя вычитатель 231, преобразователь 232, квантователь 233 и энтропийный кодер 240. Тем не менее, согласно обстоятельствам, все компоненты, показанные на фиг. 8, могут не представлять собой существенные компоненты оборудования кодирования, и оборудование кодирования может осуществляться посредством большего или меньшего числа компонентов относительно числа компонентов, показанных на фиг. 8.[136] As shown in FIG. 8, the encoding equipment according to the example may include a subtractor 231, a transformer 232, a quantizer 233, and an entropy encoder 240. However, according to the circumstances, all of the components shown in FIG. 8 may not be essential components of the encoding equipment, and the encoding equipment may be implemented with more or fewer components relative to the number of components shown in FIG. eight.

[137] В оборудовании кодирования согласно примеру, каждый из вычитателя 231, преобразователя 232, квантователя 233 и энтропийного кодера 240 может осуществляться посредством отдельной микросхемы, либо, по меньшей мере, два или более компонентов могут осуществляться через одну микросхему.[137] In the encoding equipment of the example, subtractor 231, converter 232, quantizer 233, and entropy encoder 240 may each be implemented on a separate chip, or at least two or more components may be implemented on a single chip.

[138] Оборудование кодирования согласно примеру может извлекать остаточные выборки для текущего блока (S700). Более конкретно, вычитатель 231 оборудования кодирования может извлекать остаточные выборки для текущего блока.[138] The encoding equipment according to the example may extract residual samples for the current block (S700). More specifically, the coding equipment subtractor 231 may extract residual samples for the current block.

[139] Оборудование кодирования согласно примеру может извлекать коэффициенты преобразования для текущего блока посредством преобразования остаточных выборок для текущего блока (S710). Более конкретно, преобразователь 232 оборудования кодирования может извлекать коэффициенты преобразования для текущего блока посредством преобразования остаточных выборок для текущего блока.[139] The encoding equipment according to the example may derive transform coefficients for the current block by transforming the residual samples for the current block (S710). More specifically, the coding equipment transform 232 may derive transform coefficients for the current block by transforming the residual samples for the current block.

[140] Оборудование кодирования согласно примеру может извлекать квантованные коэффициенты преобразования из коэффициентов преобразования на основе процесса квантования (S720). Более конкретно, квантователь 233 оборудования кодирования может извлекать квантованные коэффициенты преобразования из коэффициентов преобразования на основе процесса квантования.[140] The encoding equipment according to the example can extract quantized transform coefficients from the transform coefficients based on a quantization process (S720). More specifically, the encoding equipment quantizer 233 may extract quantized transform coefficients from the transform coefficients based on a quantization process.

[141] Оборудование кодирования согласно примеру может кодировать остаточную информацию, включающую в себя информацию относительно квантованных коэффициентов преобразования (S730). Более конкретно, кодер 240 оборудования кодирования может кодировать остаточную информацию, включающую в себя информацию относительно квантованных коэффициентов преобразования.[141] The encoding equipment according to the example may encode residual information including information regarding quantized transform coefficients (S730). More specifically, the coding equipment encoder 240 may encode residual information including information regarding quantized transform coefficients.

[142] В примере, каждый из коэффициентов преобразования для текущего блока может быть связан с областью высокочастотных коэффициентов преобразования, состоящей из коэффициента преобразования 0, или с областью низкочастотных коэффициентов преобразования, включающей в себя, по меньшей мере, один значимый коэффициент преобразования.[142] In an example, each of the transform coefficients for the current block may be associated with a high-frequency transform coefficient region consisting of a transform coefficient of 0, or with a low-frequency transform coefficient region including at least one significant transform coefficient.

[143] В примере, остаточная информация включает в себя информацию префикса последнего значимого коэффициента и информацию суффикса последнего значимого коэффициента касаемо позиции последнего ненулевого коэффициента преобразования из числа коэффициентов преобразования для текущего блока.[143] In an example, the residual information includes last significant coefficient prefix information and last significant coefficient suffix information regarding the position of the last non-zero transform coefficient among the transform coefficients for the current block.

[144] В примере, позиция последнего ненулевого коэффициента преобразования может быть основана на префиксном кодовом слове, которое представляет информацию префикса последнего значимого коэффициента и информацию суффикса последнего значимого коэффициента.[144] In an example, the position of the last non-zero transform coefficient may be based on a prefix codeword that represents the last significant coefficient prefix information and the last significant coefficient suffix information.

[145] В примере, максимальная длина префиксного кодового слова может определяться на основе размера области низкочастотных коэффициентов преобразования.[145] In an example, the maximum length of the prefix codeword may be determined based on the size of the region of low-frequency transform coefficients.

[146] Согласно оборудованию кодирования и способу работы оборудования кодирования по фиг. 7 и 8, оборудование кодирования может извлекать остаточные выборки для текущего блока (S700), извлекать коэффициенты преобразования для текущего блока посредством преобразования остаточных выборок для текущего блока (S710), извлекать квантованные коэффициенты преобразования из коэффициентов преобразования на основе процесса квантования (S720) и кодировать остаточную информацию, включающую в себя информацию относительно квантованных коэффициентов преобразования (S730), при этом каждый из коэффициентов преобразования для текущего блока может быть связан с областью высокочастотных коэффициентов преобразования, состоящей из коэффициента преобразования 0, или с областью низкочастотных коэффициентов преобразования, включающей в себя, по меньшей мере, один значимый коэффициент преобразования, остаточная информация может включать в себя информацию префикса последнего значимого коэффициента и информацию суффикса последнего значимого коэффициента касаемо позиции последнего ненулевого коэффициента преобразования из числа коэффициентов преобразования для текущего блока, позиция последнего ненулевого коэффициента преобразования может быть основана на префиксном кодовом слове, которое представляет информацию префикса последнего значимого коэффициента и информацию суффикса последнего значимого коэффициента, и максимальная длина префиксного кодового слова может определяться на основе размера области низкочастотных коэффициентов преобразования. Таким образом, согласно настоящему раскрытию, когда высокочастотное обнуление применяется посредством выполнения преобразования в двоичную форму для синтаксического элемента на основе размера области высокочастотного обнуления (более корректно, области, к которой высокочастотное обнуление не применяется), можно выполнять кодирование более эффективно и повышать пропускную способность CABAC посредством уменьшения числа контекстно-кодированных элементов разрешения.[146] According to the encoding equipment and the operation method of the encoding equipment of FIG. 7 and 8, the encoding equipment may extract the residual samples for the current block (S700), extract the transform coefficients for the current block by transforming the residual samples for the current block (S710), extract the quantized transform coefficients from the transform coefficients based on the quantization process (S720), and encode residual information including information on quantized transform coefficients (S730), wherein each of the transform coefficients for the current block may be associated with a high-frequency transform coefficient region consisting of a transform coefficient of 0, or with a low-frequency transform coefficient region including, at least one significant transform coefficient, the residual information may include last significant coefficient prefix information and last significant coefficient suffix information regarding the position of the last non-zero coefficient and transforms from among the transform coefficients for the current block, the position of the last non-zero transform coefficient may be based on a prefix codeword that represents the prefix information of the last significant coefficient and the suffix information of the last significant coefficient, and the maximum length of the prefix codeword may be determined based on the size of the low frequency region. conversion coefficients. Thus, according to the present disclosure, when high-frequency nulling is applied by performing binarization on a syntax element based on the size of the high-frequency nulling region (more correctly, the region to which high-frequency nulling is not applied), it is possible to perform encoding more efficiently and improve CABAC throughput. by reducing the number of context-encoded permission elements.

[147] Фиг. 9 является блок-схемой последовательности операций способа, показывающей работу оборудования декодирования согласно примеру, и фиг. 10 является блок-схемой, показывающей конфигурацию оборудования декодирования согласно примеру.[147] FIG. 9 is a flowchart showing the operation of the decoding equipment according to the example, and FIG. 10 is a block diagram showing a configuration of decoding equipment according to an example.

[148] Каждый из этапов, раскрытых на фиг. 9, может выполняться посредством оборудования 300 декодирования, раскрытого на фиг. 3. Более конкретно, S900 и S910 могут выполняться посредством энтропийного декодера 310, раскрытого на фиг. 3; S920 посредством деквантователя 321, раскрытого на фиг. 3; S930 посредством обратного преобразователя 322, раскрытого на фиг. 3; и S940 посредством сумматора 340, раскрытого на фиг. 3. Дополнительно, операции согласно S900-S940 основаны на части контента, описанного выше на фиг. 4-6. Следовательно, пояснение для конкретного контента, дублированного с контентом, описанным выше на фиг. 3-6, опускается или приводится кратко.[148] Each of the steps disclosed in FIG. 9 may be performed by the decoding equipment 300 disclosed in FIG. 3. More specifically, S900 and S910 may be performed by the entropy decoder 310 disclosed in FIG. 3; S920 through the dequantizer 321 disclosed in FIG. 3; S930 through the inverse converter 322 disclosed in FIG. 3; and S940 through the adder 340 disclosed in FIG. 3. Additionally, the operations of S900-S940 are based on a portion of the content described above in FIG. 4-6. Therefore, the explanation for the specific content duplicated with the content described above in FIG. 3-6 is omitted or given briefly.

[149] Как показано на фиг. 10, оборудование декодирования согласно примеру может включать в себя энтропийный декодер 310, деквантователь 321, обратный преобразователь 322 и сумматор 340. Тем не менее, согласно обстоятельствам, все компоненты, показанные на фиг. 10, могут не представлять собой существенные компоненты оборудования декодирования, и оборудование декодирования может осуществляться посредством большего или меньшего числа компонентов относительно числа компонентов, показанных на фиг. 10.[149] As shown in FIG. 10, the decoding equipment according to the example may include an entropy decoder 310, a dequantizer 321, an inverse transform 322, and an adder 340. However, according to the circumstances, all of the components shown in FIG. 10 may not be essential components of the decoding equipment, and the decoding equipment may be implemented with more or fewer components relative to the number of components shown in FIG. ten.

[150] В оборудовании декодирования согласно примеру, каждый из энтропийного декодера 310, деквантователя 321, обратного преобразователя 322 и сумматора 340 может осуществляться посредством отдельной микросхемы, либо, по меньшей мере, два или более компонентов могут осуществляться через одну микросхему.[150] In the decoding equipment of the example, entropy decoder 310, dequantizer 321, inverse converter 322, and adder 340 may each be implemented by a separate chip, or at least two or more components may be implemented by a single chip.

[151] Оборудование декодирования согласно примеру может принимать поток битов, включающий в себя остаточную информацию (S900). Более конкретно, энтропийный декодер 310 оборудования декодирования может принимать поток битов, включающий в себя остаточную информацию.[151] The decoding equipment according to an example may receive a bitstream including residual information (S900). More specifically, the entropy decoder 310 of the decoding equipment may receive a bit stream including residual information.

[152] Оборудование декодирования согласно примеру может извлекать квантованные коэффициенты преобразования для текущего блока на основе остаточной информации, включенной в поток битов (S910). Более конкретно, энтропийный декодер 310 оборудования декодирования может извлекать квантованный коэффициент преобразования для текущего блока на основе остаточной информации, включенной в поток битов.[152] The decoding equipment according to the example may derive quantized transform coefficients for the current block based on the residual information included in the bitstream (S910). More specifically, the entropy decoder 310 of the decoding equipment may derive a quantized transform coefficient for the current block based on the residual information included in the bitstream.

[153] Оборудование декодирования согласно примеру может извлекать коэффициенты преобразования из квантованных коэффициентов преобразования на основе процесса деквантования (S920). Более конкретно, деквантователь 321 оборудования декодирования может извлекать коэффициенты преобразования из квантованных коэффициентов преобразования на основе процесса деквантования.[153] The decoding equipment according to the example can extract transform coefficients from the quantized transform coefficients based on a dequantization process (S920). More specifically, the dequantizer 321 of the decoding equipment may extract transform coefficients from the quantized transform coefficients based on a dequantization process.

[154] Оборудование декодирования согласно примеру может извлекать остаточные выборки для текущего блока посредством применения обратного преобразования к извлеченным коэффициентам преобразования (S920). Более конкретно, обратный преобразователь 322 оборудования декодирования может извлекать остаточные выборки для текущего блока посредством применения обратного преобразования к извлеченным коэффициентам преобразования.[154] The decoding equipment according to the example can extract residual samples for the current block by applying an inverse transform to the extracted transform coefficients (S920). More specifically, the inverse transform 322 of the decoding equipment may extract the residual samples for the current block by applying an inverse transform to the extracted transform coefficients.

[155] Оборудование декодирования согласно примеру может формировать восстановленный кадр на основе остаточной выборки для текущего блока (S940). Более конкретно, сумматор 340 оборудования декодирования может формировать восстановленный кадр на основе остаточной выборки для текущего блока.[155] The decoding equipment according to the example may generate a reconstructed frame based on the residual sample for the current block (S940). More specifically, the adder 340 of the decoding equipment may generate a reconstructed frame based on the residual sample for the current block.

[156] В примере, единица текущего блока может представлять собой блок TB преобразования.[156] In an example, the current block unit may be a transform block TB.

[157] В примере, каждый из коэффициентов преобразования для текущего блока может быть связан с областью высокочастотных коэффициентов преобразования, состоящей из коэффициента преобразования 0, или с областью низкочастотных коэффициентов преобразования, включающей в себя, по меньшей мере, один значимый коэффициент преобразования.[157] In an example, each of the transform coefficients for the current block may be associated with a high-frequency transform coefficient region consisting of a transform coefficient of 0, or with a low-frequency transform coefficient region including at least one significant transform coefficient.

[158] В примере, остаточная информация может включать в себя информацию префикса последнего значимого коэффициента и информацию суффикса последнего значимого коэффициента касаемо позиции последнего ненулевого коэффициента преобразования из числа коэффициентов преобразования для текущего блока.[158] In an example, the residual information may include last significant coefficient prefix information and last significant coefficient suffix information regarding the position of the last non-zero transform coefficient among the transform coefficients for the current block.

[159] В примере, позиция последнего ненулевого коэффициента преобразования может определяться на основе префиксного кодового слова, которое представляет информацию префикса последнего значимого коэффициента и информацию суффикса последнего значимого коэффициента.[159] In an example, the position of the last non-zero transform coefficient may be determined based on a prefix codeword that represents the last significant coefficient prefix information and the last significant coefficient suffix information.

[160] В примере, максимальная длина префиксного кодового слова может определяться на основе размера области низкочастотных коэффициентов преобразования. Максимальная длина префиксного кодового слова может выражаться как cMax.[160] In an example, the maximum length of the prefix codeword may be determined based on the size of the region of low-frequency transform coefficients. The maximum length of the prefix codeword may be expressed as cMax.

[161] В примере, размер области низкочастотных коэффициентов преобразования может определяться на основе ширины и высоты области низкочастотных коэффициентов преобразования.[161] In an example, the size of the low-frequency transform coefficient region may be determined based on the width and height of the low-frequency transform coefficient region.

[162] В примере, информация префикса последнего значимого коэффициента может включать в себя информацию префикса по оси X и информацию префикса по оси Y, и префиксное кодовое слово может представлять собой кодовое слово для информации префикса по оси X либо кодовое слово для информации префикса по оси Y.[162] In an example, the prefix information of the last significant coefficient may include the X-axis prefix information and the Y-axis prefix information, and the prefix codeword may be a codeword for the X-axis prefix information or a codeword for the X-axis prefix information. Y.

[163] В примере, информация префикса по оси X может выражаться как last_sig_coeff_x_prefix; информация префикса по оси Y может выражаться как last_sig_coeff_y_prefix; и позиция последнего ненулевого коэффициента преобразования может выражаться как (LastSignificantCoeffX, LastSignificantCoeffY).[163] In an example, the x-axis prefix information may be expressed as last_sig_coeff_x_prefix; the y-axis prefix information may be expressed as last_sig_coeff_y_prefix; and the position of the last non-zero transform coefficient may be expressed as (LastSignificantCoeffX, LastSignificantCoeffY).

[164] В примере, максимальная длина кодового слова, которое указывает информацию префикса по оси X, может определяться как равная 9 на основе определения того, что ширина области низкочастотных коэффициентов преобразования равна 32.[164] In an example, the maximum length of a codeword that indicates prefix information on the x-axis may be determined to be 9 based on determining that the width of the low-frequency transform coefficient region is 32.

[165] В примере, максимальная длина кодового слова, которое указывает информацию префикса по оси Y, может определяться как равная 9 на основе определения того, что высота области низкочастотных коэффициентов преобразования равна 32.[165] In an example, the maximum length of a codeword that indicates prefix information along the Y-axis may be determined to be 9 based on determining that the height of the low-frequency transform coefficient region is 32.

[166] В примере, максимальное преобразованное в двоичную форму значение кодового слова для информации префикса по оси X может определяться как составляющее 111111111 на основе определения того, что ширина текущего блока превышает 32, и того, что ширина области низкочастотных коэффициентов преобразования равна 32.[166] In an example, the maximum binarized codeword value for the X-axis prefix information may be determined to be 111111111 based on determining that the width of the current block is greater than 32 and that the width of the low-frequency transform coefficient region is 32.

[167] В примере, максимальное преобразованное в двоичную форму значение кодового слова для информации префикса по оси Y может определяться как составляющее 111111111 на основе определения того, что высота текущего блока превышает 32, и того, что высота области низкочастотных коэффициентов преобразования равна 32.[167] In an example, the maximum binarized codeword value for the Y-axis prefix information may be determined to be 111111111 based on determining that the height of the current block is greater than 32 and that the height of the low-frequency transform coefficient region is 32.

[168] В примере, максимальная длина кодового слова для информации префикса по оси X может определяться на основе нижеприведенного уравнения 5.[168] In an example, the maximum codeword length for X-axis prefix information may be determined based on Equation 5 below.

[169] уравнение 5[169] Equation 5

[170] cMaxx=(log2(min(W1, W2))<<1)-1[170] cMax x =(log 2 (min(W 1 , W 2 ))<<1)-1

[171] В уравнении 5, cMaxx может быть максимальной длиной кодового слова для информации префикса по оси X; W1 может быть шириной текущего блока; и W2 может быть шириной области низкочастотных коэффициентов преобразования.[171] In Equation 5, cMax x may be the maximum codeword length for X-axis prefix information; W 1 may be the width of the current block; and W 2 may be the width of the region of the low-frequency transform coefficients.

[172] В примере, ширина области низкочастотных коэффициентов преобразования может быть равна 32, и максимальная длина кодового слова для информации префикса по оси X может определяться на основе нижеприведенного уравнения 6.[172] In the example, the width of the region of low-frequency transform coefficients may be equal to 32, and the maximum codeword length for X-axis prefix information may be determined based on Equation 6 below.

[173] уравнение 6[173] Equation 6

[174] cMaxx=(min(log2W1, 5))<<1)-1[174] cMax x =(min(log 2 W 1 , 5))<<1)-1

[175] В уравнении 6, cMaxx может быть максимальной длиной кодового слова для информации префикса по оси X, и W1 может быть шириной текущего блока.[175] In Equation 6, cMax x may be the maximum codeword length for X-axis prefix information, and W 1 may be the width of the current block.

[176] В примере, максимальная длина кодового слова для информации префикса по оси Y может определяться на основе нижеприведенного уравнения 7.[176] In an example, the maximum codeword length for the Y-axis prefix information may be determined based on Equation 7 below.

[177] уравнение 7[177] Equation 7

[178] cMaxy=(log2(min(H1, H2))<<1)-1[178] cMax y =(log 2 (min(H 1 , H 2 ))<<1)-1

[179] В уравнении 7, cMaxy может быть максимальной длиной кодового слова для информации префикса по оси Y; H1 может быть высотой текущего блока; и H2 может быть высотой области низкочастотных коэффициентов преобразования.[179] In Equation 7, cMax y may be the maximum codeword length for the Y-axis prefix information; H 1 can be the height of the current block; and H 2 may be the height of the region of low-frequency transform coefficients.

[180] В примере, высота области низкочастотных коэффициентов преобразования может быть равна 32, и максимальная длина кодового слова для информации префикса по оси Y может определяться на основе нижеприведенного уравнения 8.[180] In the example, the height of the low-frequency transform coefficient region may be 32, and the maximum codeword length for the Y-axis prefix information may be determined based on Equation 8 below.

[181] уравнение 8[181] Equation 8

[182] cMaxy=(min(log2H1, 5))<<1)-1[182] cMax y =(min(log 2 H 1 , 5))<<1)-1

[183] В уравнении 8, cMaxy может быть максимальной длиной кодового слова для информации префикса по оси X, и H1 может быть высотой текущего блока.[183] In Equation 8, cMax y may be the maximum codeword length for X-axis prefix information, and H 1 may be the height of the current block.

[184] В примере, префиксное кодовое слово может представлять собой усеченный код Райса на основе процесса преобразования в двоичную форму усеченным кодом Райса.[184] In an example, the prefix codeword may be a truncated Rice code based on a truncated Rice code binarization process.

[185] В примере, текущий блок может представлять собой квадратный блок или неквадратный блок. Ширина области низкочастотных коэффициентов преобразования может определяться как равная 32 на основе определения того, что ширина текущего блока равна 64, и высота области низкочастотных коэффициентов преобразования может определяться как равная 32 на основе определения того, что высота текущего блока равна 64.[185] In an example, the current block may be a square block or a non-square block. The width of the low pass transform coefficient region may be determined to be 32 based on determining that the current block width is 64, and the height of the low pass transform coefficient region may be determined to be 32 based on determining that the current block height is 64.

[186] В примере, размер области низкочастотных коэффициентов преобразования может представлять собой одно из 32×16, 16×32, 16×16 или 32×32.[186] In an example, the size of the low-frequency transform coefficient region may be one of 32×16, 16×32, 16×16, or 32×32.

[187] В примере, размер области низкочастотных коэффициентов преобразования может определяться на основе размера текущего блока.[187] In an example, the size of the region of low-frequency transform coefficients may be determined based on the size of the current block.

[188] В примере, остаточная информация может включать в себя информацию относительно размера области низкочастотных коэффициентов преобразования.[188] In an example, the residual information may include information regarding the size of the region of low-frequency transform coefficients.

[189] В примере, размер текущего блока может составлять 64×64; размер области низкочастотных коэффициентов преобразования может составлять 32×32; и максимальная длина префиксного кодового слова может составлять 9.[189] In the example, the size of the current block may be 64×64; the size of the region of low-frequency transform coefficients may be 32×32; and the maximum length of the prefix codeword may be 9.

[190] Согласно оборудованию декодирования и способу работы оборудования декодирования по фиг. 9 и 10, оборудование декодирования может принимать поток битов, включающий в себя остаточную информацию (S900), извлекать квантованные коэффициенты преобразования для текущего блока на основе остаточной информации, включенной в поток битов (S910), извлекать коэффициенты преобразования из квантованных коэффициентов преобразования на основе процесса деквантования (S920) и извлекать остаточные выборки для текущего блока посредством применения обратного преобразования к извлеченным коэффициентам преобразования (S930), и формировать восстановленный кадр на основе остаточных выборок для текущего блока (S940), при этом каждый из коэффициентов преобразования для текущего блока может быть связан с областью высокочастотных коэффициентов преобразования, состоящей из коэффициента преобразования 0, или с областью низкочастотных коэффициентов преобразования, включающей в себя, по меньшей мере, один значимый коэффициент преобразования, остаточная информация может включать в себя информацию префикса последнего значимого коэффициента и информацию суффикса последнего значимого коэффициента касаемо позиции последнего ненулевого коэффициента преобразования из числа коэффициентов преобразования для текущего блока, позиция последнего ненулевого коэффициента преобразования может определяться на основе префиксного кодового слова, которое представляет информацию префикса последнего значимого коэффициента и информацию суффикса последнего значимого коэффициента, и максимальная длина префиксного кодового слова может определяться на основе размера области низкочастотных коэффициентов преобразования. Таким образом, согласно настоящему раскрытию, когда высокочастотное обнуление применяется посредством выполнения преобразования в двоичную форму для синтаксического элемента на основе размера области высокочастотного обнуления (более корректно, области, к которой высокочастотное обнуление не применяется), можно выполнять кодирование более эффективно и повышать пропускную способность CABAC посредством уменьшения числа контекстно-кодированных элементов разрешения.[190] According to the decoding equipment and the operation method of the decoding equipment of FIG. 9 and 10, the decoding equipment may receive a bitstream including the residual information (S900), extract quantized transform coefficients for the current block based on the residual information included in the bitstream (S910), extract transform coefficients from the quantized transform coefficients based on a process dequantizing (S920), and extracting the residual samples for the current block by applying an inverse transform to the extracted transform coefficients (S930), and generating a reconstructed frame based on the residual samples for the current block (S940), wherein each of the transform coefficients for the current block can be associated with a high-frequency transform coefficient region consisting of a transform coefficient of 0, or with a low-frequency transform coefficient region including at least one significant transform coefficient, the residual information may include prefix information n last significant coefficient and last significant coefficient suffix information regarding the position of the last non-zero transform coefficient among the transform coefficients for the current block, the position of the last non-zero transform coefficient may be determined based on a prefix codeword that represents the last significant coefficient prefix information and the last significant coefficient suffix information, and the maximum length of the prefix codeword may be determined based on the size of the region of the low-frequency transform coefficients. Thus, according to the present disclosure, when high-frequency nulling is applied by performing binarization on a syntax element based on the size of the high-frequency nulling region (more correctly, the region to which high-frequency nulling is not applied), it is possible to perform encoding more efficiently and improve CABAC throughput. by reducing the number of context-encoded permission elements.

[191] В примере, процесс остаточного кодирования, описанный выше на фиг. 4-10, может быть основан на содержании нижеприведенного подробного описания на английском языке.[191] In an example, the residual encoding process described above in FIG. 4-10 may be based on the contents of the English detailed description below.

[192] РЕФЕРАТ[192] ABSTRACT

[193] В этом предложении, преобразование в двоичную форму позиции последнего значимого коэффициента модифицируется, чтобы сокращать максимальное число контекстно-кодированных элементов разрешения. В частности, число контекстно-кодированных элементов разрешения для большого блока (т.е. 64×64, 64xN, Nx64) в сценарии по принципу наихудшего случая уменьшается с 11 до 9. Экспериментальные результаты показывают 0,01%-е, 0%-е и -0,02%-е уменьшения BD-коэффициента для компонентов Y, Cb и Cr, соответственно, по сравнению с VTM3.0 в полностью внутренней конфигурации, и 0,01%-е, -0,01%- и -0,01%-е уменьшения BD-коэффициента в конфигурации произвольного доступа.[193] In this proposal, the binarization of the position of the last significant coefficient is modified to reduce the maximum number of context-encoded bins. In particular, the number of context-coded bins for a large block (i.e. 64x64, 64xN, Nx64) in the worst-case scenario is reduced from 11 to 9. Experimental results show 0.01%, 0%- e and -0.02% reduction in BD-factor for components Y, Cb and Cr, respectively, compared to VTM3.0 in a fully internal configuration, and 0.01%-e, -0.01%- and - 0.01% reduction in BD ratio in random access configuration.

[194] 1. Введение [194] 1. Introduction

[195] Известно, что большая сегментация на блоки, типично представляет меньше остатков, и энергия является более сконцентрированной в низкочастотных коэффициентах в области преобразования. В VTM3.0 [1], высокочастотные коэффициенты преобразования сводятся к нулю для блоков преобразования с размером (шириной или высотой либо как шириной, так и высотой), равным 64. Таким образом, для блока WxH преобразования, где W указывает ширину блока, а H указывает высоту блока, только левые верхние (W==64?32:W)x(H==64?32:H) коэффициентов преобразования сохраняются.[195] It is known that more block segmentation typically represents fewer residues, and the energy is more concentrated in the low frequency coefficients in the transform region. In VTM3.0 [1], high-frequency transform coefficients are reduced to zero for transform blocks with a size (width or height, or both width and height) equal to 64. Thus, for a WxH transform block, where W indicates the width of the block and H specifies the block height, only the top left (W==64?32:W)x(H==64?32:H) of the transform coefficients are kept.

[196] В [1], префикс last_sig_coeff_x_prefix и last_sig_coeff_y_prefix контекстно кодируется с использованием преобразования в двоичную форму усеченным кодом Райса с cMax=(log2TbSize<<1)-1. Здесь, если синтаксический элемент, который должен синтаксически анализироваться, представляет собой last_sig_coeff_x_prefix, log2TbSize задается равным log2TbWidth и иначе, log2TbSize задается равным log2TbHeight. Таким образом, максимальная возможная абсолютная величина определяется посредством ширины или высоты блока преобразования. В сценарии по принципу наихудшего случая, число элементов разрешения, которые используют контекстное моделирование, равно 11. Таблица 7 показывает преобразование в двоичную форму для W=64 или H=64 в VTM3.0, при этом X означает 0 или 1.[196] In [1], the prefix last_sig_coeff_x_prefix and last_sig_coeff_y_prefix are context-encoded using truncated Rice binarization with cMax=(log2TbSize<<1)-1. Here, if the syntax element to be parsed is last_sig_coeff_x_prefix, log2TbSize is set to log2TbWidth and otherwise, log2TbSize is set to log2TbHeight. Thus, the maximum possible absolute value is determined by the width or height of the transform block. In the worst-case scenario, the number of bins that use context modeling is 11. Table 7 shows the binarization for W=64 or H=64 in VTM3.0, with X meaning 0 or 1.

[197] Табл. 7[197] Tab. 7

Figure 00000009
Figure 00000009

[198] 2. Предлагаемый способ [198] 2. The proposed method

[199] Эта работа предлагается в дополнение к JVET-M0250 [2]. В предложенном способе, проверяется то, принадлежит или нет текущая группа коэффициентов области высокочастотного обнуления. При использовании этой информации, может пропускаться необязательное кодирование на основе coded_sub_block_flag (CSBF) для области высокочастотного обнуления.[199] This work is proposed in addition to JVET-M0250 [2]. In the proposed method, it is checked whether or not the current group of coefficients belongs to the high-frequency zeroing region. When using this information, optional coding based on the coded_sub_block_flag (CSBF) for the high frequency nulling region can be skipped.

[200] В одном варианте осуществления, может предлагаться способ CSBF-кодирования с учетом области высокочастотного обнуления. Если первое условие для последней или первой группы коэффициентов удовлетворяется, значение CSBF может логически выводиться как равное 1. Если первое условие для последней или первой группы коэффициентов не удовлетворяется, второе условие для области высокочастотного обнуления проверяется. Если второе условие для области высокочастотного обнуления удовлетворяется, CSBF-кодирование не выполняется. Если второе условие для высокочастотного обнуления не удовлетворяется, индекс контекста извлекается, и CSBF-кодирование выполняется.[200] In one embodiment, a CSBF coding method considering a high frequency nulling region may be provided. If the first condition for the last or first coefficient group is satisfied, the CSBF value may be inferred to be 1. If the first condition for the last or first coefficient group is not satisfied, the second condition for the high frequency null region is checked. If the second condition for the high frequency nulling region is satisfied, no CSBF encoding is performed. If the second condition for high frequency nulling is not satisfied, the context index is retrieved and CSBF encoding is performed.

[201] Схема кодирования по последней позиции предлагается для преобразования с большими размерами блоков. По сравнению с VTM3.0, предложенная схема кодирования использует меньшее число контекстно-кодированных элементов разрешения в сценарии по принципу наихудшего случая. Кодовое слово в предложенной схеме по-прежнему начинается с усеченного кода Райса, и далее следует код фиксированной длины. После высокочастотного обнуления, для блока преобразования WxH, сохраняются только левые верхние min(W, 32)xmin(H, 32) коэффициентов преобразования. Таким образом, максимальная возможная длина кодовых слов префикса last_sig_coeff_x_prefix или last_sig_coeff_y_prefix извлекается в качестве:[201] The last position coding scheme is proposed for conversion with large block sizes. Compared to VTM3.0, the proposed encoding scheme uses fewer context-encoded bins in a worst-case scenario. The code word in the proposed scheme still begins with a truncated Rice code, followed by a fixed length code. After high-frequency zeroing, for the WxH transform block, only the upper left min(W, 32)xmin(H, 32) of the transform coefficients are stored. Thus, the maximum possible length of last_sig_coeff_x_prefix or last_sig_coeff_y_prefix prefix codewords is extracted as:

[202] cMax=(min(log2TbSize, 5)<<1)-1.[202] cMax=(min(log 2 TbSize, 5)<<1)-1.

[203] Таблица 8 показывает преобразование в двоичную форму для W=64 или H=64, при этом X означает 0 или 1. Здесь, различные части подчеркиваются.[203] Table 8 shows the binarization for W=64 or H=64, with X meaning 0 or 1. Here, various parts are underlined.

[204] Табл. 8[204] Tab. eight

Figure 00000010
Figure 00000010

[205] Табл. 9[205] Tab. 9

Figure 00000011
Figure 00000011

[206] Таблица 9 показывает сравнение длины кодовых слов для префикса (контекстно-кодированных элементов разрешения), когда W=64 или H=64 и VTM3.0. Контекстно-кодированные элементы разрешения могут присутствовать в числе до 9 в предложенном способе, тогда как предусмотрено вплоть до 11 элементов разрешения в VTM3.0. Следует отметить, что когда абсолютная величина компонента последней позиции составляет в диапазоне 24-31, число контекстно-кодированных элементов разрешения уменьшается с 10 до 9.[206] Table 9 shows a comparison of the length of prefix codewords (context-encoded bins) when W=64 or H=64 and VTM3.0. Context-encoded permission elements may be present up to 9 in the proposed method, while up to 11 permission elements are provided in VTM3.0. It should be noted that when the absolute value of the last position component is in the range of 24-31, the number of context-coded bins is reduced from 10 to 9.

[207] 3. Экспериментальные результаты [207] 3. Experimental results

[208] Предложенный способ реализован в программном обеспечении VTM3.0. Моделирования выполнены согласно общим тестовым условиям, заданным в JVET-L1010 [3]. В каждом случае, привязка представляет собой программное обеспечение VTM3.0. Время кодирования и время декодирования исходят из результатов перекрестной проверки [4]. Таблица 10 показывает экспериментальные результаты для тестового условия для полностью внутреннего (AI) режима; привязка представляет собой VTM3.0.[208] The proposed method is implemented in the VTM3.0 software. Simulations are performed according to the general test conditions specified in JVET-L1010 [3]. In each case, the binding is the VTM3.0 software. Encoding time and decoding time come from the results of cross-validation [4]. Table 10 shows the experimental results for the test condition for all indoor (AI) mode; the binding is VTM3.0.

[209] Табл. 10[209] Tab. ten

Полностью внутренний режим, профиль Main10Fully internal mode, profile Main10 На базе VTM3.0Based on VTM3.0 YY UU VV EncTEnct DecTDecT Класс A1Class A1 0,03%0.03% -0,07%-0.07% 0,03%0.03% 100%100% 101%101% Класс A2Class A2 0,02%0.02% 0,00%0.00% -0,03%-0.03% 100%100% 100%100% Класс BClass B 0,01%0.01% 0,05%0.05% -0,02%-0.02% 100%100% 102%102% Класс CClass C 0,00%0.00% 0,01%0.01% -0,03%-0.03% 100%100% 101%101% Класс EClass E 0,02%0.02% -0,02%-0.02% -0,03%-0.03% 100%100% 99%99% ВсегоTotal 0,01%0.01% 0,00%0.00% -0,02%-0.02% 100%100% 101%101% Класс DClass D 0,00%0.00% 0,01%0.01% -0,01%-0.01% 100%100% 100%100% Класс FClass F -0,01%-0.01% 0,03%0.03% 0,02%0.02% 100%100% 99%99%

[210] Таблица 11 показывает экспериментальные результаты для тестового условия для режима произвольного доступа (RA); привязка представляет собой VTM3.0.[210] Table 11 shows the experimental results for the test condition for the random access (RA) mode; the binding is VTM3.0.

[211] Табл. 11[211] Tab. eleven

Режим произвольного доступа, профиль Main10Random access mode, profile Main10 На базе VTM3.0Based on VTM3.0 YY UU VV EncTEnct DecTDecT Класс A1Class A1 0,05%0.05% -0,09%-0.09% 0,00%0.00% Класс A2Class A2 0,01%0.01% 0,07%0.07% 0,03%0.03% Класс BClass B -0,01%-0.01% -0,02%-0.02% -0,04%-0.04% 100%100% 100%100% Класс CClass C 0,00%0.00% 0,02%0.02% -0,01%-0.01% 99%99% 100%100% Класс EClass E ВсегоTotal 0,01%0.01% -0,01%-0.01% -0,01%-0.01% Класс DClass D 0,00%0.00% 0,03%0.03% 0,06%0.06% 100%100% 100%100% Класс FClass F -0,01%-0.01% -0,03%-0.03% -0,07%-0.07% 100%100% 99%99%

[212] 4. Ссылочные материалы [212] 4. References

[213] [1] B. Bross и др. "Versatile Video Coding (Draft 3)", Joint Video Exploration Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC1/SC 29/WG 11 JVET-L1001, 12-я конференция, Макао, Китай, 3-12 октября 2018 года.[213] [1] B. Bross et al. "Versatile Video Coding (Draft 3)", Joint Video Exploration Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC1/SC 29/WG 11 JVET- L1001, 12th Conference, Macau, China, October 3-12, 2018.

[214] [2] J. Choi и др. "Non-CE7: Simplified CSBF coding for large block-size transforms", Joint Video Exploration Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC1/SC 29/WG 11 JVET-M0250, 13-я конференция, Марракеш, Марокко, 9-18 января 2019 года.[214] [2] J. Choi et al. "Non-CE7: Simplified CSBF coding for large block-size transforms", Joint Video Exploration Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC1/SC 29/WG 11 JVET-M0250, 13th Conference, Marrakech, Morocco, January 9-18, 2019.

[215] [3] F. Bossen и др. "JVET common test conditions and software reference configurations for SDR video" Joint Video Exploration Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC1/SC 29/WG 11 JVET-L1010, 12-я конференция, Макао, Китай, 3-12 октября 2018 года.[215] [3] F. Bossen et al. "JVET common test conditions and software reference configurations for SDR video" Joint Video Exploration Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC1/SC 29/WG 11 JVET-L1010, 12th Conference, Macau, China, October 3-12, 2018.

[216] [4] H. Schwarz "Crosscheck of JVET-M0251 (Non-CE7: Last position coding for large block-size transforms)", Joint Video Exploration Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC1/SC 29/WG 11 JVET-M0646, 13-я конференция, Марракеш, Марокко, 9-18 января 2019 года.[216] [4] H. Schwarz "Crosscheck of JVET-M0251 (Non-CE7: Last position coding for large block-size transforms)", Joint Video Exploration Team (JVET) of ITU-T SG 16 WP 3 and ISO/ IEC JTC1/SC 29/WG 11 JVET-M0646, 13th Conference, Marrakesh, Morocco, January 9-18, 2019.

[217] 5. Заявление о патентных правах [217] 5. Patent Rights Statement

[218] Компания LG Electronics Inc. может иметь текущие или находящиеся на рассмотрении патентные права, связанные с технологией, описанной в этой работе, и в соответствии с принципом взаимности, готова к выдаче лицензий согласно обоснованным и недискриминационным условиям при необходимости для реализации результирующей рекомендации ITU-T/Международного стандарта ISO/IEC (согласно разделу 2 заявления на патент ITU-T/ITU-R/ISO/IEC и форме лицензионной декларации).[218] LG Electronics Inc. may have current or pending patent rights related to the technology described in this work, and in accordance with the principle of reciprocity, is ready to grant licenses under reasonable and non-discriminatory conditions, if necessary, to implement the resulting ITU-T/ISO/IEC International Standard recommendation (according to section 2 of the ITU-T/ITU-R/ISO/IEC patent application and the license declaration form).

[219] 6. Спецификация [219] 6. Specification

[220] Табл. 12[220] Tab. 12

Figure 00000012
Figure 00000012

Figure 00000013
Figure 00000013

Figure 00000014
Figure 00000014

Figure 00000015
Figure 00000015

Figure 00000016
Figure 00000016

Figure 00000017
Figure 00000017

[221] last_sig_coeff_x_prefix указывает префикс позиции столбца последнего значимого коэффициента в порядке сканирования в блоке преобразования. Значения last_sig_coeff_x_prefix должны составлять в диапазоне от 0 до (Min(log2TbWidth, 5)<<1)-1, включительно.[221] last_sig_coeff_x_prefix indicates the prefix of the column position of the last significant coefficient in the scan order in the transform block. Last_sig_coeff_x_prefix values must be between 0 and (Min(log 2 TbWidth, 5)<<1)-1, inclusive.

[222] last_sig_coeff_y_prefix указывает префикс позиции строки последнего значимого коэффициента в порядке сканирования в блоке преобразования. Значения last_sig_coeff_y_prefix должны составлять в диапазоне от 0 до (Min(log2TbHeight, 5)<<1)-1, включительно.[222] last_sig_coeff_y_prefix indicates the prefix of the row position of the last significant coefficient in the scan order in the transform block. Last_sig_coeff_y_prefix values must be between 0 and (Min(log 2 TbHeight, 5)<<1)-1, inclusive.

[223] Нижеприведенная таблица 13 показывает синтаксические элементы и ассоциированные преобразования в двоичную форму.[223] Table 13 below shows the syntax elements and associated binarizations.

[224] Табл. 13[224] Tab. 13

[225]

Figure 00000018
[225]
Figure 00000018

[226]

Figure 00000019
[226]
Figure 00000019

[227]

Figure 00000020
[227]
Figure 00000020

[228]

Figure 00000021
[228]
Figure 00000021

[229] В вышеописанном примере, способы поясняются на основе блок-схемы последовательности операций способа посредством последовательности этапов или блоков, но настоящее раскрытие не ограничено порядком этапов, и определенный этап может возникать в другом порядке или одновременно с этапами, отличающимися от этапов, описанных выше. Дополнительно, специалистам в данной области техники очевидно, что этапы, показанные на блок-схеме последовательности операций способа, не являются единственно возможными, и что другой этап может быть включен, либо один или более этапов блок-схемы последовательности операций способа могут удаляться без влияния на объем настоящего раскрытия.[229] In the above example, the methods are explained based on the flowchart by means of a sequence of steps or blocks, but the present disclosure is not limited to the order of the steps, and a certain step may occur in a different order or simultaneously with steps other than the steps described above. . Additionally, those skilled in the art will appreciate that the steps shown in the flowchart are not the only ones possible, and that another step may be included, or one or more steps in the flowchart may be removed without affecting scope of this disclosure.

[230] Вышеприведенные способы согласно раскрытию могут реализовываться как программная форма, и оборудование кодирования и/или оборудование декодирования согласно раскрытию могут включаться в оборудование для выполнения обработки изображений, например, телевизора, компьютера, смартфона, абонентской приставки и устройства отображения.[230] The above methods according to the disclosure may be implemented in software form, and the encoding equipment and/or decoding equipment according to the disclosure may be included in equipment to perform image processing, such as a TV, computer, smartphone, set-top box, and display device.

[231] В раскрытии, когда примеры осуществляются посредством программного обеспечения, вышеприведенные способы могут осуществляться с помощью модулей (процесса, функция и т.п.) для выполнения вышеописанных функций. Модули могут сохраняться в запоминающем устройстве и могут выполняться посредством процессора. Запоминающее устройство может находиться внутри или снаружи процессора и может соединяться с процессором через известные различные средства. Процессор может включать в себя специализированную интегральную схему (ASIC), различный набор микросхем, логическую схему и/или процессор данных. Запоминающее устройство может включать в себя постоянное запоминающее устройство (ROM), оперативное запоминающее устройство (RAM), флэш-память, карту памяти, носитель хранения данных и/или другое устройство хранения данных. Таким образом, примеры, описанные в настоящем раскрытии, могут осуществляться и выполняться в процессоре, микропроцессоре, контроллере или микросхеме. Например, функциональные модули, показанные на каждом чертеже, могут осуществляться и выполняться в процессоре, микропроцессоре, контроллере или микросхеме. В этом случае, информация или алгоритм для осуществления (например, информация относительно инструкции) могут сохраняться на цифровом носителе хранения данных.[231] In the disclosure, when the examples are implemented by software, the above methods can be implemented using modules (process, function, etc.) to perform the above functions. The modules may be stored in a storage device and may be executed by a processor. The storage device may be located inside or outside the processor and may be connected to the processor through various known means. The processor may include an application specific integrated circuit (ASIC), various chipsets, logic, and/or a data processor. The storage device may include Read Only Memory (ROM), Random Access Memory (RAM), flash memory, a memory card, storage media, and/or other storage device. Thus, the examples described in this disclosure may be implemented and executed in a processor, microprocessor, controller, or chip. For example, the functional modules shown in each figure may be implemented and executed in a processor, microprocessor, controller, or chip. In this case, the information or algorithm to be implemented (eg, information regarding the instruction) may be stored in the digital storage medium.

[232] Дополнительно, оборудование декодирования и оборудование кодирования, к которым применяется настоящее раскрытие, могут включаться в широковещательное мультимедийное приемо-передающее устройство, терминал мобильной связи, видеоустройство системы домашнего кинотеатра, видеоустройство системы цифрового кинотеатра, камеру наблюдения, устройство проведения видеочатов, устройство связи в реальном времени, к примеру, видеосвязи, мобильное устройство потоковой передачи, носитель хранения данных, записывающую видеокамеру, устройство предоставления услуг на основе технологии "видео по запросу" (VoD), видеоустройство поверх сетей (OTT), устройство предоставления услуг потоковой передачи по Интернету, трехмерное видеоустройство, устройство в стиле виртуальной реальности, устройство в стиле дополненной реальности (расширенной реальности), видеоустройство системы видеотелефонии, терминал в средстве транспортировки (например, терминал в транспортном средстве (в том числе в автономном транспортном средстве), терминал в воздушном судне, терминал в морском судне и т.д.) и медицинское видеоустройство и могут использоваться для того, чтобы обрабатывать видеосигнал или сигнал данных. Например, видеоустройство поверх сетей (OTT) может включать в себя игровую приставку, Blu-Ray-проигрыватель, телевизор с доступом в Интернет, систему домашнего кинотеатра, смартфон, планшетный PC, цифровое записывающее видеоустройство (DVR) и т.п.[232] Additionally, the decoding equipment and encoding equipment to which the present disclosure applies may be included in a broadcast multimedia transceiver, a mobile communication terminal, a home theater system video device, a digital cinema system video device, a surveillance camera, a video chat device, a communication device real-time, such as video communication, mobile streaming device, storage media, video recording camera, video-on-demand (VoD) service provider, video device over networks (OTT), Internet streaming service provider , a 3D video device, a virtual reality style device, an augmented reality (augmented reality) style device, a video telephony system video device, a terminal in a vehicle (for example, a terminal in a vehicle (including an autonomous vehicle). equipment), an aircraft terminal, a ship terminal, etc.) and a medical video device, and can be used to process a video signal or a data signal. For example, a video over network (OTT) device may include a game console, a Blu-ray player, an Internet access TV, a home theater system, a smartphone, a tablet PC, a digital video recorder (DVR), and the like.

[233] Помимо этого, способ обработки, к которому применяется настоящее раскрытие, может формироваться в форме программы, выполняемой посредством компьютера, и сохраняться на машиночитаемом носителе записи. Мультимедийные данные, имеющие структуру данных согласно настоящему раскрытию, также могут сохраняться на машиночитаемом носителе записи. Машиночитаемый носитель записи включает в себя все виды устройств хранения данных и устройств распределенного хранения данных, на которых сохраняются машиночитаемые данные. Машиночитаемый носитель записи может включать в себя, например, Blu-Ray-диск (BD), универсальную последовательную шину (USB), ROM, PROM, EPROM, EEPROM, RAM, CD-ROM, магнитную ленту, гибкий диск и оптическое устройство хранения данных. Дополнительно, машиночитаемый носитель записи также включает в себя среды, осуществленные в форме несущей волны (например, передачи по Интернету). Помимо этого, поток битов, сформированный посредством способа кодирования, может сохраняться на машиночитаемом носителе записи или передаваться через сеть проводной или беспроводной связи.[233] In addition, the processing method to which the present disclosure applies may be formed in the form of a program executable by a computer and stored in a computer-readable recording medium. Multimedia data having a data structure according to the present disclosure may also be stored on a computer-readable recording medium. The computer-readable recording medium includes all kinds of storage devices and distributed storage devices that store computer-readable data. The computer-readable recording medium may include, for example, a Blu-ray Disc (BD), Universal Serial Bus (USB), ROM, PROM, EPROM, EEPROM, RAM, CD-ROM, magnetic tape, floppy disk, and optical storage. . Additionally, the computer-readable recording medium also includes media implemented in the form of a carrier wave (eg, transmission over the Internet). In addition, the bitstream generated by the encoding method may be stored in a computer-readable recording medium or transmitted via a wired or wireless communication network.

[234] Дополнительно, примеры настоящего раскрытия могут осуществляться в качестве компьютерного программного продукта посредством программных кодов, и программные коды могут выполняться в компьютере посредством примеров настоящего раскрытия. Программные коды могут сохраняться на машиночитаемом носителе; этапы, отличающиеся от этапов, описанных выше. Дополнительно, специалистам в данной области техники очевидно, что этапы, показанные на блок-схеме последовательности операций способа, не являются единственно возможными, и что:[234] Additionally, examples of the present disclosure may be implemented as a computer program product by means of program codes, and the program codes may be executed on a computer by means of the examples of this disclosure. The program codes may be stored on a computer-readable medium; steps other than those described above. Additionally, it will be apparent to those skilled in the art that the steps shown in the flowchart are not the only ones possible, and that:

[235] Фиг. 11 представляет пример системы потоковой передачи контента, к которой может применяться раскрытие настоящего документа.[235] FIG. 11 represents an example of a content streaming system to which the disclosure of this document may apply.

[236] Ссылаясь на фиг. 11, система потоковой передачи контента, к которой применяется вариант(ы) осуществления настоящего документа, может включать в себя, главным образом, сервер кодирования, потоковый сервер, веб-сервер, хранилище мультимедиа, пользовательское устройство и устройство ввода мультимедиа.[236] Referring to FIG. 11, the content streaming system to which the embodiment(s) of the present document is applied may mainly include an encoding server, a streaming server, a web server, a media storage, a user device, and a media input device.

[237] Сервер кодирования сжимает контент, вводимый из устройств ввода мультимедиа, таких как смартфон, камера, записывающая видеокамера и т.д., в цифровые данные для того, чтобы формировать поток битов и передавать поток битов на потоковый сервер. В качестве другого примера, когда устройства ввода мультимедиа, такие как смартфоны, камеры, записывающие видеокамеры и т.д., непосредственно формируют поток битов, сервер кодирования может опускаться.[237] The encoding server compresses content input from media input devices such as a smartphone, a camera, a camcorder, etc. into digital data in order to generate a bit stream and transmit the bit stream to the stream server. As another example, when media input devices such as smartphones, cameras, camcorder recorders, etc. directly generate a bitstream, the encoding server may be omitted.

[238] Поток битов может формироваться посредством способа кодирования или способа формирования потока битов, к которому применяется вариант(ы) осуществления настоящего документа, и потоковый сервер может временно сохранять поток битов в процессе передачи или приема потока битов.[238] The bit stream may be generated by the encoding method or the bit stream generation method to which the embodiment(s) of the present document is applied, and the stream server may temporarily store the bit stream in the process of transmitting or receiving the bit stream.

[239] Потоковый сервер передает мультимедийные данные в пользовательское устройство на основе запроса пользователя через веб-сервер, и веб-сервер служит в качестве среды для информирования пользователя в отношении услуги. Когда пользователь запрашивает требуемую услугу из веб-сервера, веб-сервер доставляет ее на потоковый сервер, и потоковый сервер передает мультимедийные данные пользователю. В этом случае, система потоковой передачи контента может включать в себя отдельный сервер управления. В этом случае, сервер управления служит для того, чтобы управлять командой/ответом между устройствами в системе потоковой передачи контента.[239] The streaming server transmits media data to the user device based on the user's request through the web server, and the web server serves as a medium for informing the user about the service. When a user requests a desired service from a web server, the web server delivers it to the streaming server, and the streaming server transmits media data to the user. In this case, the content streaming system may include a separate control server. In this case, the control server serves to manage the command/response between devices in the content streaming system.

[240] Потоковый сервер может принимать контент из хранилища мультимедиа и/или сервера кодирования. Например, когда контент принимается из сервера кодирования, контент может приниматься в реальном времени. В этом случае, чтобы предоставлять плавную услугу потоковой передачи, потоковый сервер может сохранять поток битов в течение предварительно определенного времени.[240] The streaming server may receive content from a media store and/or an encoding server. For example, when content is received from an encoding server, the content may be received in real time. In this case, in order to provide a smooth streaming service, the streaming server may keep the bitstream for a predetermined time.

[241] Примеры пользовательского устройства могут включать в себя мобильный телефон, смартфон, переносной компьютер, цифровой широковещательный терминал, персональное цифровое устройство (PDA), портативный мультимедийный проигрыватель (PMP), навигационное устройство, грифельный планшетный PC, планшетные PC, ультрабуки, носимые устройства (например, интеллектуальные часы, интеллектуальные очки, наголовные дисплеи), цифровые телевизоры, настольные компьютеры, систему цифровых информационных табло и т.п. Каждый сервер в системе потоковой передачи контента может работать в качестве распределенного сервера, причем в этом случае данные, принимаемые из каждого сервера, могут быть распределены.[241] Examples of the user device may include a mobile phone, smartphone, laptop computer, digital broadcast terminal, personal digital assistant (PDA), portable media player (PMP), navigation device, stylus tablet PC, tablet PCs, ultrabooks, wearable devices (e.g., smart watches, smart glasses, head-mounted displays), digital TVs, desktop computers, digital signage system, etc. Each server in the content streaming system may operate as a distributed server, in which case the data received from each server may be distributed.

[242] Каждый из серверов в системе потоковой передачи контента может работать в качестве распределенного сервера, и в этом случае, данные, принимаемые посредством каждого сервера, могут распределенно обрабатываться.[242] Each of the servers in the content streaming system can operate as a distributed server, in which case, data received by each server can be distributed processed.

Claims (55)

1. Способ декодирования изображений, выполняемый посредством оборудования декодирования, при этом способ содержит этапы, на которых:1. An image decoding method performed by decoding equipment, the method comprising the steps of: принимают поток битов, включающий в себя остаточную информацию;receiving a bit stream including the residual information; получают коэффициенты преобразования для текущего блока на основе остаточной информации;obtaining transform coefficients for the current block based on the residual information; получают остаточные дискретные отсчеты для текущего блока посредством применения обратного преобразования к полученным коэффициентам преобразования; иobtaining residual discrete samples for the current block by applying an inverse transform to the obtained transform coefficients; and формируют восстановленный кадр на основе остаточных дискретных отсчетов для текущего блока, при этомa reconstructed frame is formed on the basis of residual discrete samples for the current block, while текущий блок включает в себя область низкочастотных коэффициентов преобразования, включающую в себя по меньшей мере один значимый коэффициент преобразования, и область, отличную от области низкочастотных коэффициентов преобразования, включающую в себя нулевой коэффициент преобразования,the current block includes a low-frequency transform coefficient region including at least one significant transform coefficient, and a region other than the low-frequency transform coefficient region including a zero transform coefficient, остаточная информация включает в себя информацию префикса последнего значимого коэффициента и информацию суффикса последнего значимого коэффициента касаемо позиции последнего ненулевого коэффициента преобразования из числа коэффициентов преобразования для текущего блока,the residual information includes last significant coefficient prefix information and last significant coefficient suffix information regarding the position of the last non-zero transform coefficient among the transform coefficients for the current block, позиция последнего ненулевого коэффициента преобразования определяется на основе префиксного кодового слова и информации суффикса последнего значимого коэффициента, причем префиксное кодовое слово связано с информацией префикса последнего значимого коэффициента, иthe position of the last non-zero transform coefficient is determined based on the prefix codeword and the suffix information of the last significant coefficient, wherein the prefix codeword is associated with the prefix information of the last significant coefficient, and максимальная длина префиксного кодового слова определяется на основе размера области низкочастотных коэффициентов преобразования.the maximum length of the prefix codeword is determined based on the size of the region of low-frequency transform coefficients. 2. Способ декодирования изображений по п.1, в котором размер области низкочастотных коэффициентов преобразования определяется на основе ширины и высоты области низкочастотных коэффициентов преобразования, и информация префикса последнего значимого коэффициента включает в себя информацию префикса по оси X и информацию префикса по оси Y, и префиксное кодовое слово представляет собой кодовое слово для информации префикса по оси X либо кодовое слово для информации префикса по оси Y.2. The image decoding method of claim 1, wherein the size of the low pass transform coefficient region is determined based on the width and height of the low pass transform coefficient region, and the last significant coefficient prefix information includes X-axis prefix information and Y-axis prefix information, and the prefix codeword is a codeword for the x-axis prefix information or a codeword for the y-axis prefix information. 3. Способ декодирования изображений по п.2, в котором максимальная длина кодового слова, которое указывает информацию префикса по оси X, определяется как равная 9 на основе ширины области низкочастотных коэффициентов преобразования, равной 32, и максимальная длина кодового слова, которое указывает информацию префикса по оси Y, определяется как равная 9 на основе высоты области низкочастотных коэффициентов преобразования, равной 32.3. The image decoding method according to claim 2, wherein the maximum length of a codeword that indicates prefix information along the X-axis is determined to be 9 based on the width of the region of low-frequency transform coefficients of 32, and the maximum length of a codeword that indicates prefix information on the Y-axis is determined to be 9 based on the height of the low-frequency transform coefficient region of 32. 4. Способ декодирования изображений по п.3, в котором максимальное преобразованное в двоичную форму значение кодового слова для информации префикса по оси X определяется как составляющее 111111111 на основе ширины текущего блока, превышающей 32, и ширины области низкочастотных коэффициентов преобразования, равной 32, и максимальное преобразованное в двоичную форму значение кодового слова для информации префикса по оси Y определяется как составляющее 111111111 на основе высоты текущего блока, превышающей 32, и высоты области низкочастотных коэффициентов преобразования, равной 32.4. The image decoding method of claim 3, wherein the maximum binarized codeword value for the X-axis prefix information is determined to be 111111111 based on a current block width greater than 32 and a low-pass transform coefficient region width of 32, and the maximum binarized codeword value for the Y-axis prefix information is determined to be 111111111 based on the height of the current block being greater than 32 and the height of the low-frequency transform coefficient region being 32. 5. Способ декодирования изображений по п.2, в котором максимальная длина кодового слова для информации префикса по оси X определяется на основе cMaxx, при этом cMaxx вычисляется на основе следующего уравнения:5. The image decoding method according to claim 2, wherein the maximum codeword length for the x-axis prefix information is determined based on cMax x , cMax x is calculated based on the following equation: cMaxx=(log2(min(W1, W2))<<1)-1,cMax x =(log 2 (min(W 1 , W 2 ))<<1)-1, где cMaxx равно максимальной длине кодового слова для информации префикса по оси X, W1 является шириной текущего блока, и W2 является шириной области низкочастотных коэффициентов преобразования.where cMax x is equal to the maximum codeword length for the X-axis prefix information, W 1 is the width of the current block, and W 2 is the width of the region of the low-frequency transform coefficients. 6. Способ декодирования изображений по п.5, в котором ширина области низкочастотных коэффициентов преобразования равна 32, и максимальная длина кодового слова для информации префикса по оси X определяется на основе cMaxx, при этом cMaxx вычисляется на основе следующего уравнения:6. The image decoding method according to claim 5, wherein the width of the region of low-frequency transform coefficients is 32, and the maximum codeword length for the X-axis prefix information is determined based on cMax x , wherein cMax x is calculated based on the following equation: cMaxx=(min(log2W1, 5))<<1)-1,cMax x =(min(log 2 W 1 , 5))<<1)-1, где cMaxx равно максимальной длине кодового слова для информации префикса по оси X, и W1 является шириной текущего блока.where cMax x is equal to the maximum codeword length for x-axis prefix information, and W 1 is the width of the current block. 7. Способ декодирования изображений по п.2, в котором максимальная длина кодового слова для информации префикса по оси Y определяется на основе cMaxy, при этом cMaxy вычисляется на основе следующего уравнения:7. The image decoding method according to claim 2, wherein the maximum codeword length for the Y-axis prefix information is determined based on cMax y , wherein cMax y is calculated based on the following equation: cMaxy=(log2(min(H1, H2))<<1)-1,cMax y =(log 2 (min(H 1 , H 2 ))<<1)-1, где cMaxy равно максимальной длине кодового слова для информации префикса по оси Y, H1 является высотой текущего блока, и H2 является высотой области низкочастотных коэффициентов преобразования.where cMax y is equal to the maximum codeword length for the y-axis prefix information, H 1 is the height of the current block, and H 2 is the height of the low-frequency transform coefficient region. 8. Способ декодирования изображений по п.7, в котором высота области низкочастотных коэффициентов преобразования равна 32, и максимальная длина кодового слова для информации префикса по оси Y определяется на основе Maxy, при этом cMaxy вычисляется на основе следующего уравнения:8. The image decoding method according to claim 7, wherein the height of the low-frequency transform coefficient region is 32, and the maximum codeword length for the Y-axis prefix information is determined based on Max y , cMax y is calculated based on the following equation: cMaxy=(min(log2H1, 5))<<1)-1,cMax y =(min(log 2 H 1 , 5))<<1)-1, где cMaxy равно максимальной длине кодового слова для информации префикса по оси Y, и H1 является высотой текущего блока.where cMax y is equal to the maximum codeword length for prefix information along the y-axis, and H 1 is the height of the current block. 9. Способ декодирования изображений по п.1, в котором9. The image decoding method according to claim 1, wherein текущий блок представляет собой квадратный блок или неквадратный блок,the current block is a square block or a non-square block, ширина области низкочастотных коэффициентов преобразования определяется как равная 32 на основе ширины текущего блока, равной 64, иthe width of the region of low-frequency transform coefficients is determined to be 32 based on the current block width of 64, and высота области низкочастотных коэффициентов преобразования определяется как равная 32 на основе высоты текущего блока, равной 64.the height of the low-frequency transform coefficient region is determined to be 32 based on the height of the current block being 64. 10. Способ декодирования изображений по п.1, в котором размер области низкочастотных коэффициентов преобразования представляет собой одно из 32˟16, 16˟32, 16˟16 и 32˟32.10. The image decoding method according to claim 1, wherein the size of the low-frequency transform coefficient region is one of 32˟16, 16˟32, 16˟16, and 32˟32. 11. Способ декодирования изображений по п.1, в котором размер области низкочастотных коэффициентов преобразования определяется на основе размера текущего блока.11. The image decoding method of claim 1, wherein the size of the low-frequency transform coefficient region is determined based on the size of the current block. 12. Способ декодирования изображений по п.1, в котором остаточная информация включает в себя информацию касаемо размера области низкочастотных коэффициентов преобразования.12. The image decoding method according to claim 1, wherein the residual information includes information regarding the size of the low-frequency transform coefficient region. 13. Способ декодирования изображений по п.1, в котором размер текущего блока составляет 64˟64, размер области низкочастотных коэффициентов преобразования составляет 32˟32, и максимальная длина префиксного кодового слова составляет 9.13. The image decoding method according to claim 1, wherein the current block size is 64˟64, the size of the low-frequency transform coefficient region is 32˟32, and the maximum prefix codeword length is 9. 14. Способ кодирования изображений, выполняемый посредством оборудования кодирования, при этом способ содержит этапы, на которых:14. An image encoding method performed by encoding equipment, the method comprising the steps of: получают остаточные дискретные отсчеты для текущего блока;getting residual discrete samples for the current block; получают коэффициенты преобразования для текущего блока на основе остаточных дискретных отсчетов для текущего блока; иobtaining transform coefficients for the current block based on the residual discrete samples for the current block; and кодируют остаточную информацию, связанную с коэффициентами преобразования, при этомencode the residual information associated with the transformation coefficients, while текущий блок включает в себя область низкочастотных коэффициентов преобразования, включающую в себя по меньшей мере один значимый коэффициент преобразования, и область, отличную от области низкочастотных коэффициентов преобразования, включающую в себя нулевой коэффициент преобразования,the current block includes a low-frequency transform coefficient region including at least one significant transform coefficient, and a region other than the low-frequency transform coefficient region including a zero transform coefficient, остаточная информация включает в себя информацию префикса последнего значимого коэффициента и информацию суффикса последнего значимого коэффициента касаемо позиции последнего ненулевого коэффициента преобразования из числа коэффициентов преобразования для текущего блока,the residual information includes last significant coefficient prefix information and last significant coefficient suffix information regarding the position of the last non-zero transform coefficient among the transform coefficients for the current block, позиция последнего ненулевого коэффициента преобразования основывается на префиксном кодовом слове и информации суффикса последнего значимого коэффициента, причем префиксное кодовое слово связано с информацией префикса последнего значимого коэффициента, иthe position of the last non-zero transform coefficient is based on the prefix codeword and the suffix information of the last significant coefficient, wherein the prefix codeword is associated with the prefix information of the last significant coefficient, and максимальная длина префиксного кодового слова определяется на основе размера области низкочастотных коэффициентов преобразования.the maximum length of the prefix codeword is determined based on the size of the region of low-frequency transform coefficients. 15. Энергонезависимый машиночитаемый носитель данных, на котором сохранены инструкции, которые при их исполнении вычислительным устройством предписывают вычислительному устройству осуществлять способ формирования потока битов, при этом способ содержит: 15. A non-volatile computer-readable storage medium that stores instructions that, when executed by a computing device, instruct the computing device to carry out a method for generating a bit stream, the method comprising: получение остаточных дискретных отсчетов для текущего блока;obtaining residual discrete readings for the current block; получение коэффициентов преобразования для текущего блока на основе остаточных дискретных отсчетов для текущего блока;obtaining transform coefficients for the current block based on the residual discrete samples for the current block; кодирование остаточной информации, связанной с коэффициентами преобразования, чтобы сформировать поток битов, при этом encoding the residual information associated with the transform coefficients to form a bitstream, wherein текущий блок включает в себя область низкочастотных коэффициентов преобразования, включающую в себя по меньшей мере один значимый коэффициент преобразования, и область, отличную от области низкочастотных коэффициентов преобразования, включающую в себя нулевой коэффициент преобразования, the current block includes a low-frequency transform coefficient region including at least one significant transform coefficient, and a region other than the low-frequency transform coefficient region including a zero transform coefficient, остаточная информация включает в себя информацию префикса последнего значимого коэффициента и информацию суффикса последнего значимого коэффициента касаемо позиции последнего ненулевого коэффициента преобразования из числа коэффициентов преобразования для текущего блока, the residual information includes last significant coefficient prefix information and last significant coefficient suffix information regarding the position of the last non-zero transform coefficient among the transform coefficients for the current block, позиция последнего ненулевого коэффициента преобразования основывается на префиксном кодовом слове и информации суффикса последнего значимого коэффициента, причем префиксное кодовое слово связано с информацией префикса последнего значимого коэффициента, и the position of the last non-zero transform coefficient is based on the prefix codeword and the suffix information of the last significant coefficient, wherein the prefix codeword is associated with the prefix information of the last significant coefficient, and максимальная длина префиксного кодового слова определяется на основе размера области низкочастотных коэффициентов преобразования.the maximum length of the prefix codeword is determined based on the size of the region of low-frequency transform coefficients. 16. Способ передачи данных для информации изображения, содержащий этапы, на которых: 16. A method for transmitting data for image information, comprising the steps of: получают поток битов информации изображения, включающий в себя остаточную информацию, при этом остаточная информация сформирована посредством получения остаточных дискретных отсчетов для текущего блока, получения коэффициентов преобразования для текущего блока на основе остаточных дискретных отсчетов для текущего блока и кодирования остаточной информации, связанной с коэффициентами преобразования, чтобы сформировать поток битов; иobtaining an image information bitstream including residual information, wherein the residual information is generated by obtaining residual discrete samples for the current block, obtaining transform coefficients for the current block based on the residual discrete samples for the current block, and encoding the residual information associated with the transform coefficients, to form a bitstream; and передают данные, содержащие поток битов информации изображения, включающий в себя остаточную информацию, при этом transmitting data containing an image information bit stream including residual information, wherein текущий блок включает в себя область низкочастотных коэффициентов преобразования, включающую в себя по меньшей мере один значимый коэффициент преобразования, и область, отличную от области низкочастотных коэффициентов преобразования, включающую в себя нулевой коэффициент преобразования, the current block includes a low-frequency transform coefficient region including at least one significant transform coefficient, and a region other than the low-frequency transform coefficient region including a zero transform coefficient, остаточная информация включает в себя информацию префикса последнего значимого коэффициента и информацию суффикса последнего значимого коэффициента касаемо позиции последнего ненулевого коэффициента преобразования из числа коэффициентов преобразования для текущего блока, the residual information includes last significant coefficient prefix information and last significant coefficient suffix information regarding the position of the last non-zero transform coefficient among the transform coefficients for the current block, позиция последнего ненулевого коэффициента преобразования основывается на префиксном кодовом слове и информации суффикса последнего значимого коэффициента, причем префиксное кодовое слово связано с информацией префикса последнего значимого коэффициента, и the position of the last non-zero transform coefficient is based on the prefix codeword and the suffix information of the last significant coefficient, wherein the prefix codeword is associated with the prefix information of the last significant coefficient, and максимальная длина префиксного кодового слова определяется на основе размера области низкочастотных коэффициентов преобразования.the maximum length of the prefix codeword is determined based on the size of the region of low-frequency transform coefficients.
RU2021109669A 2018-11-12 2019-11-12 Method for encoding the conversion coefficient based on high-frequency zeroing and equipment therefor RU2776033C1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US62/760,033 2018-11-12
US62/792,824 2019-01-15

Related Child Applications (1)

Application Number Title Priority Date Filing Date
RU2022118183A Division RU2789446C2 (en) 2018-11-12 2019-11-12 Method for encoding conversion factor based on high-frequency zero and equipment for it

Publications (1)

Publication Number Publication Date
RU2776033C1 true RU2776033C1 (en) 2022-07-12

Family

ID=

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013006446A1 (en) * 2011-07-01 2013-01-10 Qualcomm Incorporated Context adaptive entropy coding for non-square blocks in video coding
WO2013107908A1 (en) * 2012-01-20 2013-07-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Transform coefficient coding
US9357185B2 (en) * 2011-11-08 2016-05-31 Qualcomm Incorporated Context optimization for last significant coefficient position coding
US9668001B2 (en) * 2011-06-28 2017-05-30 Samsung Electronics Co., Ltd. Method and apparatus for coding video and method and apparatus for decoding video accompanied with arithmetic coding
RU2628130C2 (en) * 2011-12-28 2017-08-15 Шарп Кабусики Кайся Arithmetic decoding device, image decoding device and arithmetic coding device
WO2018011303A1 (en) * 2016-07-15 2018-01-18 Thomson Licensing Last coefficient coding for adaptive transform based video compression

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9668001B2 (en) * 2011-06-28 2017-05-30 Samsung Electronics Co., Ltd. Method and apparatus for coding video and method and apparatus for decoding video accompanied with arithmetic coding
WO2013006446A1 (en) * 2011-07-01 2013-01-10 Qualcomm Incorporated Context adaptive entropy coding for non-square blocks in video coding
US9357185B2 (en) * 2011-11-08 2016-05-31 Qualcomm Incorporated Context optimization for last significant coefficient position coding
RU2628130C2 (en) * 2011-12-28 2017-08-15 Шарп Кабусики Кайся Arithmetic decoding device, image decoding device and arithmetic coding device
WO2013107908A1 (en) * 2012-01-20 2013-07-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Transform coefficient coding
WO2018011303A1 (en) * 2016-07-15 2018-01-18 Thomson Licensing Last coefficient coding for adaptive transform based video compression

Similar Documents

Publication Publication Date Title
CN114390280B (en) Image decoding method, image encoding method, and data transmitting method
US11706419B2 (en) Conversion factor level coding method and device therefor
US20230319278A1 (en) Residual coding method and device for same
US11431985B2 (en) Method and device for signaling information on chroma format
US11843778B2 (en) Transform coefficient coding method and device therefor
US11245904B2 (en) Method for coding transform coefficient and device therefor
JP7400082B2 (en) Image or video coding based on palette mode
JP2023158204A (en) Image or video coding based on signaling of transform skip- and palette coding-related information
US20240056579A1 (en) Method of determining transform coefficient scan order based on high frequency zeroing and apparatus thereof
US20220295105A1 (en) Image or video coding based on escape binarization in palette mode
RU2776033C1 (en) Method for encoding the conversion coefficient based on high-frequency zeroing and equipment therefor
RU2789446C2 (en) Method for encoding conversion factor based on high-frequency zero and equipment for it
US20220014787A1 (en) Transform coefficient coding method and device
RU2806796C1 (en) Method for encoding conversion factor based on high frequency zeroing and equipment for this
RU2792223C1 (en) Information coding regarding a set of transformation kernels
US11632557B2 (en) Method and device for decoding video using residual sign related information in video coding system
US20210321135A1 (en) Image coding method and apparatus using transform skip flag
US20230007267A1 (en) Method and apparatus for decoding imaging related to sign data hiding
US20220417506A1 (en) Deblocking filtering method and apparatus in video/image coding system
US20220021882A1 (en) Method and device for coding transform skip flag