RU2610589C2

RU2610589C2 - High-precision upsampling with scalable coding of video images with high bit depth

Info

Publication number: RU2610589C2
Application number: RU2015123238A
Authority: RU
Inventors: Пэн ИНЬ; Таожань Лу; Тао ЧЭНЬ
Original assignee: Долби Лабораторис Лайсэнзин Корпорейшн
Priority date: 2012-12-21
Filing date: 2013-12-04
Publication date: 2017-02-13
Also published as: RU2017102758A; US11570455B2; US20230164335A1; US20200021825A1; BR112015014277A2; BR122017002044A2; KR101985647B1; US10958922B2; CN108055543A; US10165288B2; JP2016507947A; WO2014099370A1; HK1208577A1; RU2015123238A; US11792416B2; MY202235A; EP2936820B1; TW201433148A; RU2728738C1; EP2936820A1

Abstract

FIELD: computer engineering.SUBSTANCE: invention relates to computer engineering. In a scalable video system method of upsampling image data from a first level to a second level includes determination of parameters of scaling and rounding-off in response to requirements of scalable video system to bit depth. Input data are first filtered according to a first spatial direction using a first parameter of rounding in order to generate first upsampled data. By scaling first upsampled data using a first shift parameter, first intermediate data are generated, which are then filtered according to a second spatial direction using a second parameter of rounding in order to generate second upsampled data. Then by scaling second upsampled data using second shift parameter, second intermediate data are generated. Final upsampled data can be generated by cutting off second intermediate data.EFFECT: technical result consists in maintaining accuracy of upsampling operations.13 cl, 3 dwg

Description

ПЕРЕКРЕСТНАЯ ССЫЛКА НА РОДСТВЕННЫЕ ЗАЯВКИCROSS REFERENCE TO RELATED APPLICATIONS

[0001] Данная заявка заявляет приоритет предварительной заявки на патент США №61/745050, поданной 21 декабря 2012 г., которая посредством ссылки полностью включается в настоящий документ.[0001] This application claims the priority of provisional application for US patent No. 61/745050, filed December 21, 2012, which by reference is fully incorporated herein.

ОБЛАСТЬ ТЕХНИКИFIELD OF TECHNOLOGY

[0002] Настоящее изобретение в целом относится к изображениям. В частности, один из вариантов осуществления настоящего изобретения относится к высокоточной повышающей дискретизации в масштабируемых видеокодеках для видеоизображений с высокой битовой глубиной.[0002] The present invention generally relates to images. In particular, one of the embodiments of the present invention relates to high-precision upsampling in scalable video codecs for video with high bit depth.

УРОВЕНЬ ТЕХНИКИ BACKGROUND

[0003] Сжатие звука и видеоизображений является ключевой составляющей при разработке, хранении, распространении и потреблении мультимедийного содержимого. Выбор способа сжатия включает компромиссы между эффективностью кодирования, сложностью кодирования и задержкой. По мере того, как увеличивается отношение вычислительной мощности к вычислительным затратам, оно позволяет разрабатывать более сложные методики сжатия, делающие возможным более эффективное сжатие. В качестве примера в сжатии видеоизображений Экспертная группа по вопросам движущегося изображения (MPEG) из Международной организации по стандартам (ISO) продолжила совершенствовать первоначальный видеостандарт MPEG-1, выпустив стандарты кодирования MPEG-2, MPEG-4 (part 2) и H.264/AVC (или MPEG-4, part 10). [0003] Compression of sound and video is a key component in the development, storage, distribution and consumption of multimedia content. Choosing a compression method involves the trade-offs between coding efficiency, coding complexity, and delay. As the ratio of computing power to computing costs increases, it allows the development of more sophisticated compression techniques that make more efficient compression possible. As an example in video compression, the Moving Image Expert Group (MPEG) from the International Organization for Standards (ISO) continued to refine the original MPEG-1 video standard with the release of the MPEG-2, MPEG-4 (part 2) and H.264 encoding standards / AVC (or MPEG-4, part 10).

[0004] Несмотря на эффективность кодирования и успех H.264, в настоящее время в разработке находится технология сжатия видеоизображений нового поколения, известная как высокоэффективное кодирование видеоизображений (HEVC). Технология HEVC, проект которой доступен в документе JCTVC-K1003 Объединенной команды по кодированию видеоизображений ITU-T/ISO/IEC (JCT-VC) «High efficiency video coding (HEVC) text specification draft 9», октябрь 2012 г., авторы B. Bross, W.-J. Han, G. J. Sullivan, J.-R. Ohm, T. Wiegand, который посредством ссылки полностью включается в настоящий документ, направлен на обеспечение способности к сжатию, улучшенной относительно существующего стандарта H.264 (так же известного как AVC), опубликованного как документ «Advanced Video Coding for generic audio-visual services», ITU T Rec. H.264, и стандарта ISO/IEC 14496-10, которые посредством ссылки полностью включаются в настоящий документ.[0004] Despite the coding efficiency and success of H.264, a new generation of video compression technology, known as High Performance Video Coding (HEVC), is currently under development. HEVC technology, a draft of which is available in document JCTVC-K1003 of the Joint ITU-T / ISO / IEC (JCT-VC) Video Efficiency Coding Team (HEVC) text specification draft 9, October 2012, authors B. Bross, W.-J. Han, G. J. Sullivan, J.-R. Ohm, T. Wiegand, which is incorporated herein by reference in its entirety, is intended to provide compression capabilities improved over the existing H.264 standard (also known as AVC), published as Advanced Video Coding for generic audio-visual services ”, ITU T Rec. H.264, and ISO / IEC 14496-10, which are incorporated herein by reference in their entirety.

[0005] Видеосигналы можно охарактеризовать множеством параметров, таких как битовая глубина, цветовое пространство, цветовая гамма и разрешение. Современные телевизоры и устройства для воспроизведения видеоизображений (например, проигрыватели Blu-ray) поддерживают различные разрешения, в том числе стандартную четкость (например, 720×480i) и высокую четкость (HD; например, 1090×1080р). Форматом разрешения следующего поколения является сверхвысокая четкость (UHD) с разрешением 3840×2160. Сверхвысокую четкость также можно именовать Ultra HD, UHDTV или Super High-Vision. В рамках настоящего документа «UHD» обозначает любое разрешение выше, чем разрешение HD.[0005] Video signals can be characterized by a variety of parameters, such as bit depth, color space, color gamut, and resolution. Modern televisions and video playback devices (such as Blu-ray players) support a variety of resolutions, including standard definition (e.g. 720x480i) and high definition (HD; e.g. 1,090x1080p). The next-generation resolution format is ultra-high definition (UHD) with a resolution of 3840 × 2160. Ultra-high definition can also be called Ultra HD, UHDTV or Super High-Vision. As used herein, “UHD” means any resolution higher than HD resolution.

[0006] Другой особенностью характеристики сигнала является его динамический диапазон. Динамический диапазон HD представляет собой диапазон интенсивности (например, яркости, luma) на изображении, например, от самых темных до самых ярких. В рамках настоящего документа термин «динамический диапазон» (DR) может относиться к способности психовизуальной системы человека (HVS) воспринимать диапазон интенсивности (например, яркости, luma) на изображении, например, от самых темных до самых ярких. В этом смысле, DR относится к интенсивности «в отношении сцены». DR также может относиться к способности устройства отображения приемлемо или приблизительно представлять диапазон интенсивности определенной ширины. В этом смысле, DR относится к интенсивности «в отношении дисплея». Если определенное значение не обусловлено в прямой форме как имеющее определенную значимость в любом месте настоящего документа, следует делать вывод о том, что этот термин можно использовать в любом смысле, например, взаимозаменяемо.[0006] Another feature of a signal characteristic is its dynamic range. The HD dynamic range is the range of intensity (e.g. brightness, luma) in an image, for example, from the darkest to the brightest. For the purposes of this document, the term “dynamic range” (DR) may refer to the ability of the human psychovisual system (HVS) to perceive a range of intensity (eg, brightness, luma) in an image, for example, from the darkest to the brightest. In this sense, DR refers to intensity "in relation to the scene." DR may also relate to the ability of the display device to acceptable or approximately represent an intensity range of a certain width. In this sense, DR refers to the intensity “in relation to the display”. If a certain meaning is not directly defined as having a certain significance anywhere in this document, it should be concluded that this term can be used in any sense, for example, interchangeably.

[0007] В настоящем документе термин «расширенный динамический диапазон» (HDR) относится к ширине DR, охватывающей около 14—15 порядков величины зрительной системы человека (HVS). Например, хорошо приспособленные люди с, по существу, нормальным зрением (например, в одном или нескольких следующих смыслах: статистическом, биометрическом или офтальмологическом) имеют диапазон интенсивности, охватывающий около 15 порядков величины. Приспособленные люди могут воспринимать тусклые источники света всего лишь в единицы фотонов. Даже более, те же самые люди могут воспринимать почти болезненно яркую интенсивность полуденного солнца в пустыне, на море или на снегу (или даже при взгляде на солнце, однако кратком — во избежание повреждений). Такой охват, тем не менее, доступен «приспособленным» людям, например людям, HVS которых имеет время для восстановления и корректировки.[0007] As used herein, the term "enhanced dynamic range" (HDR) refers to a width of DR spanning about 14-15 orders of magnitude of the human visual system (HVS). For example, well-adapted people with essentially normal vision (for example, in one or more of the following senses: statistical, biometric, or ophthalmic) have a range of intensity spanning about 15 orders of magnitude. Adapted people can perceive dim light sources in only units of photons. Even more, the same people can perceive the almost painfully bright intensity of the midday sun in the desert, on the sea or in the snow (or even when looking at the sun, but briefly, to avoid damage). Such coverage, however, is available to “fit” people, such as people whose HVS has time to recover and adjust.

[0008] Для сравнения, DR, в котором человек может одновременно воспринимать обширную ширину в диапазоне интенсивностей, может быть весьма усеченным относительно HDR. В рамках настоящего документа термины «повышенный динамический диапазон» (EDR), «зрительный динамический диапазон» или «переменный динамический диапазон» (VDR) могут по отдельности или взаимозаменяемо относиться к DR, одновременно воспринимаемому HVS. В рамках настоящего документа EDR может относиться к DR, охватывающему 5—6 порядков величины. Поэтому EDR, являющийся в некоторой степени более узким в отношении истинной картины HDR, тем не менее, отображает большую ширину DR. В рамках настоящего документа термин «одновременный динамический диапазон» может относиться к EDR.[0008] For comparison, DR, in which a person can simultaneously perceive an extensive width in the range of intensities, can be very truncated relative to HDR. For the purposes of this document, the terms “enhanced dynamic range” (EDR), “visual dynamic range”, or “variable dynamic range” (VDR) may individually or interchangeably refer to DR concurrently perceived by HVS. As used herein, EDR may refer to DR spanning 5-6 orders of magnitude. Therefore, the EDR, which is somewhat narrower with respect to the true HDR picture, nevertheless displays a large DR width. As used herein, the term “simultaneous dynamic range” may refer to EDR.

[0009] В рамках настоящего документа термин «битовая глубина» изображения или видеоизображения обозначает количество битов, используемых для представления или хранения значений пикселов цветовой составляющей изображения в видеосигнале. Например, термин «N-битное видеоизображение» (например, N=8) обозначает, что значения пикселов цветовой составляющей (например, R, G или B) на этом видеоизображении может принимать значения в интервале от 0 до 2^N–1.[0009] As used herein, the term "bit depth" of an image or video image refers to the number of bits used to represent or store pixel values of the color component of an image in a video signal. For example, the term “N-bit video image” (for example, N = 8) means that the pixel values of the color component (for example, R, G or B) in this video image can take values in the range from 0 to 2 ^N –1.

[00010] В рамках настоящего документа термин «высокая битовая глубина» обозначает любые значения битовой глубины больше 8 битов (например, N=10 битов). Следует отметить, что хотя с высокой битовой глубиной, как правило, ассоциируются изображения и видеосигналы HDR, изображение с высокой битовой глубиной необязательно имеет расширенный динамический диапазон. Поэтому в рамках настоящего документа изображения с высокой битовой глубиной могут ассоциироваться как с изображениями HDR, так и с изображениями SDR.[00010] As used herein, the term “high bit depth” means any bit depth value greater than 8 bits (eg, N = 10 bits). It should be noted that although HDR images and video signals are generally associated with high bit depth, a high bit depth image does not necessarily have an extended dynamic range. Therefore, in the context of this document, high bit depth images can be associated with both HDR images and SDR images.

[00011] Для поддержки обратной совместимости с унаследованными воспроизводящими устройствами, а также новых дисплейных технологий для доставки видеоданных UHD и HDR (или SDR) от устройства в восходящем направлении к устройствам в нисходящем направлении можно использовать несколько уровней. При условии наличия такой многоуровневой системы унаследованные декодеры могут использовать базовый уровень для воссоздания версии HD SDR содержимого. Передовые декодеры могут использовать как базовый уровень, так и уровни расширения для воссоздания версии UHD EDR содержимого с целью представления его на более приспособленных дисплеях. Как оценили авторы изобретения, желательными здесь являются усовершенствованные методики кодирования видеоизображений с высокой битовой глубиной с использованием масштабируемых кодеков.[00011] Several levels can be used to support backward compatibility with legacy playback devices, as well as new display technologies for delivering UHD and HDR (or SDR) video data from a device in an upstream direction to devices in a downstream direction. Given such a layered system, legacy decoders can use the base layer to recreate the HD SDR version of the content. Advanced decoders can use both the basic level and the extension levels to recreate the UHD EDR version of the content in order to present it on more suitable displays. As appreciated by the inventors, desirable here are improved techniques for encoding video images with high bit depth using scalable codecs.

[00012] Подходы, описываемые в данном разделе, представляют собой подходы, которые можно было бы осуществить, но необязательно подходы, понятые и осуществленные ранее. Поэтому, если не указано иное, не следует полагать, что любой из подходов, описанных в данном разделе, квалифицируется как предшествующий уровень техники единственно в силу его включения в этот раздел. Аналогично, если не указано иное, проблемы, установленные на основании этого раздела в связи с одним или несколькими подходами, не следует полагать признанными где-либо на предшествующем уровне техники.[00012] The approaches described in this section are approaches that could be implemented, but not necessarily the approaches understood and implemented previously. Therefore, unless otherwise indicated, it should not be assumed that any of the approaches described in this section qualifies as prior art solely by virtue of its inclusion in this section. Similarly, unless otherwise indicated, problems identified based on this section in connection with one or more approaches should not be considered to be recognized elsewhere in the prior art.

КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВBRIEF DESCRIPTION OF GRAPHIC MATERIALS

[00013] Один из вариантов осуществления настоящего изобретения проиллюстрирован на неограничивающем примере на чертежах сопроводительных графических материалов, в которых подобные ссылочные позиции относятся к аналогичным элементам и в которых:[00013] One embodiment of the present invention is illustrated by a non-limiting example in the drawings of the accompanying graphic materials in which like reference numerals refer to like elements and in which:

[00014] ФИГ. 1 - одно из иллюстративных воплощений системы масштабируемого кодирования в соответствии с одним из вариантов осуществления данного изобретения.FIG. 1 is one illustrative embodiment of a scalable coding system in accordance with one embodiment of the present invention.

[00015] ФИГ. 2 - одно из иллюстративных воплощений масштабируемой системы декодирования в соответствии с одним из вариантов осуществления данного изобретения.FIG. 2 is one illustrative embodiment of a scalable decoding system in accordance with one embodiment of the present invention.

[00016] ФИГ. 3 изображает один из примеров процесса повышающей дискретизации данных изображения в соответствии с одним из вариантов осуществления данного изобретения.FIG. 3 depicts one example of an upsampling process of image data in accordance with one embodiment of the present invention.

ОПИСАНИЕ ИЛЛЮСТРАТИВНЫХ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯDESCRIPTION OF ILLUSTRATIVE EMBODIMENTS OF THE INVENTION

[00017] В настоящем документе описана высокоточная повышающая дискретизация при масштабируемом кодировании входных видеоизображений с высокой битовой глубиной. При заданных параметрах, относящихся к битовой глубине промежуточных результатов, битовой глубине внутреннего ввода и битовой глубине точности фильтра, для сохранения точности операций и предотвращения переполнения определяются коэффициенты масштабирования и факторы округления.[00017] This document describes high-precision upsampling for scalable coding of input video images with a high bit depth. Given the parameters relating to the bit depth of the intermediate results, the bit depth of the internal input and the bit depth of the filter accuracy, scaling factors and rounding factors are determined to preserve the accuracy of operations and prevent overflow.

[00018] В нижеследующем описании в целях разъяснения с тем, чтобы обеспечить полное понимание настоящего изобретения, изложены многочисленные конкретные подробности. Однако, как будет очевидно, настоящее изобретение может быть применено на практике без этих конкретных подробностей. В других случаях хорошо известные конструкции и устройства не описаны в исчерпывающих подробностях во избежание излишнего затруднения понимания изобретения.[00018] In the following description, for purposes of explanation, in order to provide a thorough understanding of the present invention, numerous specific details are set forth. However, as will be apparent, the present invention may be practiced without these specific details. In other cases, well-known structures and devices are not described in detail in order to avoid unnecessary difficulty in understanding the invention.

Сущность изобретения SUMMARY OF THE INVENTION

[00019] Иллюстративные варианты осуществления изобретения, описываемые в настоящем документе, относятся к высокоточной повышающей дискретизации при многоуровневом кодировании и декодировании видеосигналов с высокой битовой глубиной. В ответ на требования к битовой глубине системы кодирования или декодирования видеоизображений, для раздельного фильтра повышающей дискретизации определяются входные данные, коэффициенты фильтрации, параметры масштабирования и округления. Входные данные сначала подвергаются фильтрации по первому пространственному направлению с использованием первого параметра округления с целью генерирования первых данных с повышенной дискретизацией. Первые промежуточные данные генерируются путем масштабирования первых данных с повышенной дискретизацией с использованием первого параметра сдвига. Затем эти промежуточные данные фильтруются по второму пространственному направлению с использованием второго параметра округления с целью генерирования вторых данных с повышенной дискретизацией. Вторые промежуточные данные генерируются путем масштабирования вторых данных с повышенной дискретизацией с использованием второго параметра сдвига. Окончательные данные с повышенной дискретизацией могут генерироваться путем отсечения вторых промежуточных данных. [00019] Illustrative embodiments of the invention described herein relate to high-precision upsampling for multi-level coding and decoding of high bit depth video signals. In response to the requirements for the bit depth of a video encoding or decoding system, input data, filtering coefficients, scaling and rounding parameters are determined for a separate upsampling filter. The input data is first filtered in the first spatial direction using the first rounding parameter to generate the first data with upsampling. The first intermediate data is generated by scaling the first upsampled data using the first shift parameter. Then, this intermediate data is filtered in a second spatial direction using a second rounding parameter to generate second upsampling data. The second intermediate data is generated by scaling the second upsampled data using a second shift parameter. Final data with upsampling can be generated by clipping the second intermediate data.

Высокоточная раздельная повышающая дискретизация High precision split upsampling

[00020] Существующие отображающие и воспроизводящие устройства, такие как телевизоры HDTV, телевизионные приставки или проигрыватели Blu-ray, как правило, поддерживают сигналы с разрешением HD 1080p (1920×1080 при скорости 60 кадров в секунду). Для потребительских приложений такие сигналы в настоящее время, как правило, сжимают с использованием битовой глубины 8 битов на пиксел для каждой цветовой составляющей в цветовом формате luma-chroma, где, как правило, составляющие chroma имеют меньшее разрешение, чем составляющая luma (например, в цветовом формате YCbCr или YUV 4:2:0). По причине 8-битной глубины и соответствующего узкого динамического диапазона такие сигналы, как правило, именуются сигналами со стандартным динамическим диапазоном (SDR).[00020] Existing display and playback devices, such as HDTVs, set-top boxes or Blu-ray players, typically support HD 1080p (1920 × 1080 resolution at 60 frames per second) signals. For consumer applications, such signals are currently typically compressed using a bit depth of 8 bits per pixel for each color component in the luma-chroma color format, where, as a rule, chroma components have lower resolution than the luma component (for example, YCbCr or YUV 4: 2: 0 color format). Due to the 8-bit depth and the corresponding narrow dynamic range, such signals are usually referred to as standard dynamic range (SDR) signals.

[00021] По мере разработки новых стандартов телевидения, таких как сверхвысокая четкость (UHD), желательно кодировать в масштабируемом формате сигналы с улучшенным разрешением и/или более высокой битовой глубиной.[00021] As new television standards, such as ultra-high definition (UHD), are developed, it is desirable to encode signals with improved resolution and / or higher bit depth in a scalable format.

[00022] ФИГ. 1 изображает один из вариантов осуществления иллюстративной реализации системы масштабируемого кодирования. В одном из иллюстративных вариантов осуществления изобретения входной сигнал 104 базового уровня (BL) может представлять сигнал HD SDR, а ввод 102 уровня расширения (EL) может представлять сигнал UHD HDR (или SDR) с высокой битовой глубиной. Ввод 104 BL является сжатым (или кодированным) с использованием кодера 105 BL для генерирования битового потока 107 BL. Кодер 105 BL может сжимать или кодировать входной сигнал 104 с использованием любого из известных или будущих алгоритмов сжатия видеоизображений, таких, как MPEG-2, MPEG-4, part 2, H.264, HEVC, VP8 и т.п.FIG. 1 depicts one embodiment of an illustrative implementation of a scalable coding system. In one illustrative embodiment of the invention, the input signal base level (BL) may represent a signal HD SDR, and the input 102 of the extension level (EL) may represent a signal UHD HDR (or SDR) with a high bit depth. BL input 104 is compressed (or encoded) using the BL encoder 105 to generate the BL bitstream 107. The BL encoder 105 may compress or encode the input signal 104 using any of the known or future video compression algorithms, such as MPEG-2, MPEG-4, part 2, H.264, HEVC, VP8 and the like.

[00023] Для заданного ввода 104 BL система 100 кодирования генерирует не только битовый поток 107 BL, но также и сигнал 112 BL, который представляет сигнал 107 BL так, как он будет декодироваться соответствующим приемником. В некоторых вариантах осуществления изобретения сигнал 112 может генерироваться отдельным декодером (110) BL, следующим за кодером 105 BL. В некоторых других вариантах осуществления изобретения сигнал 112 может генерироваться контуром обратной связи, используемым для выполнения компенсации движения в кодере 105 BL. Как изображено на ФИГ. 1, сигнал 112 может быть обработан модулем 115 межуровневой обработки данных с целью генерирования сигнала, подходящего для использования процессом 120 межуровневого предсказания. В некоторых вариантах осуществления изобретения модуль 115 межуровневой обработки данных увеличивает масштаб сигнала 112 для его приведения в соответствие пространственному разрешению ввода 102 EL (например, от разрешения HD к разрешению UHD). Вслед за межуровневым предсказанием 120 вычисляется остаточный сигнал 127, который впоследствии кодируется кодером 132 с целью генерирования кодированного битового потока 132 EL. Битовый поток 107 BL и битовый поток 132 EL, как правило, уплотняют в единый кодированный битовый поток, который передается в подходящие приемники.[00023] For a given BL input 104, the coding system 100 generates not only the BL bitstream 107, but also the BL signal 112, which represents the BL signal 107 as it will be decoded by the corresponding receiver. In some embodiments, the signal 112 may be generated by a separate BL decoder (110) following the BL encoder 105. In some other embodiments, the signal 112 may be generated by a feedback loop used to perform motion compensation in the BL encoder 105. As depicted in FIG. 1, a signal 112 may be processed by an inter-layer data processing unit 115 to generate a signal suitable for use by the inter-layer prediction process 120. In some embodiments, the inter-layer data processing module 115 zooms in on the signal 112 to match the spatial resolution of the EL input 102 (e.g., from HD resolution to UHD resolution). Following inter-layer prediction 120, a residual signal 127 is computed, which is subsequently encoded by encoder 132 to generate an encoded EL bitstream 132. The BL bit stream 107 and the EL bit stream 132 are typically compressed into a single coded bit stream, which is transmitted to suitable receivers.

[00024] Термин «SHVC» обозначает масштабируемое расширение технологии сжатия видеоизображений нового поколения, известной как Высокоэффективное кодирование видеоизображений (HEVC) [1], которая делает возможной существенно более высокую способность к сжатию, чем у существующего стандарта AVC (H.264) [2]. SHVC в настоящее время совместно разрабатывают группы ISO/IEC MPEG и ITU-T WP3/16. Одной из ключевых особенностей SHVC является пространственная масштабируемость, где наиболее значимый выигрыш обеспечивает межуровневое предсказание текстуры (например, 120 или 210). На ФИГ. 2 показан один из примеров декодера SHVC. Как часть межуровневого предсказания, процесс (220) повышающей дискретизации выполняет повышающую дискретизацию, или повышающее преобразование, пиксельных данных из базового уровня (215) для их приведения в соответствие разрешению в пикселах для данных, принимаемых на уровне (например, 202 или 230) расширения. В одном их вариантов осуществления изобретения, процесс повышающей дискретизации можно выполнять путем применения фильтра повышающей дискретизации, или интерполирующего фильтра. В программном обеспечении масштабируемого расширения H.264 (SVC), или SHVC SMuCO.1.1 [3], применяется раздельный многофазный фильтр повышающей дискретизации/интерполяции. Несмотря на то, что такие фильтры эффективны для входных данных со стандартной битовой глубиной (например, для изображений, использующих 8 битов на пиксел для каждой цветовой составляющей), они могут переполняться входными данными с высокой битовой глубиной (например, изображениями, использующими 10 или более битов на пиксел для каждой цветовой составляющей). [00024] The term “SHVC” refers to a scalable expansion of a new generation of video compression technology known as High Performance Video Coding (HEVC) [1], which makes it possible to significantly compress better than the existing AVC (H.264) standard [2 ]. SHVC is currently being jointly developed by ISO / IEC MPEG and ITU-T WP3 / 16. One of the key features of SHVC is spatial scalability, where the most significant gain is provided by inter-layer texture prediction (for example, 120 or 210). In FIG. 2 shows one example of an SHVC decoder. As part of the inter-layer prediction, the upsampling process (220) performs upsampling, or upconversion, of the pixel data from the base layer (215) to match the pixel resolution for the data received at the extension level (e.g., 202 or 230). In one embodiment of the invention, the upsampling process can be performed by applying an upsampling filter, or an interpolating filter. H.264 Scalable Extension (SVC) software, or SHVC SMuCO.1.1 [3], uses a separate multiphase upsampling / interpolation filter. Although these filters are effective for input with a standard bit depth (for example, for images using 8 bits per pixel for each color component), they can overflow with input data with a high bit depth (for example, images using 10 or more bits per pixel for each color component).

[00025] В двумерных процессах повышающей дискретизации, или интерполяции, для снижения сложности обработки данных общепринятой практикой является применение раздельных фильтров. Такой фильтр сначала выполняет повышающую дискретизацию изображения в одном пространственном направлении (например, горизонтальном или вертикальном), а затем в другом направлении (например, вертикальном или горизонтальном). Без потери общности, в нижеследующем описании предполагается, что вертикальная повышающая дискретизация следует за горизонтальной повышающей дискретизацией. Тогда процесс фильтрации можно описать как[00025] In two-dimensional upsampling, or interpolation, processes, it is common practice to use separate filters to reduce data processing complexity. Such a filter first performs up-sampling of the image in one spatial direction (for example, horizontal or vertical), and then in another direction (for example, vertical or horizontal). Without loss of generality, the following description assumes that vertical upsampling follows horizontal upsampling. Then the filtering process can be described as

Горизонтальная повышающая дискретизацияHorizontal upsampling

Вертикальная повышающая дискретизацияVertical upsampling

где eF хранит коэффициенты многофазного фильтра повышающей дискретизации, refSampleArray содержит опорные дискретные значения из воссозданного базового уровня, tempArray хранит промежуточное значение после первой одномерной фильтрации, predArray хранит окончательное значение после второй одномерной фильтрации, xRef и yRef соответствуют относительному положению пикселов для повышающей дискретизации, nshift обозначает параметр масштабирования, или нормирования, offset обозначает параметр округления, и Clip ( ) обозначает функцию отсечения. Например, для заданных данных х и пороговых значений A и B в одном из вариантов осуществления изобретения функция y=Clip(x, A, B) обозначаетwhere eF stores the multiphase upsampling filter coefficients, refSampleArray contains reference discrete values from the reconstructed base level, tempArray stores the intermediate value after the first one-dimensional filtering, predArray stores the final value after the second one-dimensional filtering, xRef and yRef correspond to the relative pixel position for upsampling, nshift stands for the scaling or normalization parameter, offset denotes the rounding parameter, and Clip () denotes the clipping function. For example, for given data x and threshold values A and B in one embodiment of the invention, the function y = Clip (x, A, B) denotes

Например, для N-битных данных изображения иллюстративные значения А и В могут включать A=0 и В=2^Ν–1.For example, for N-bit image data, exemplary values A and B may include A = 0 and B = 2 ^Ν –1.

В уравнении (2) операция a=b>>c обозначает, что b делится на 2^с (например, а=b/2^с) путем сдвига двоичного представления b вправо на с битов. Следует отметить, что в уравнении (1) для первой ступени фильтрации операции отсечения или сдвига не применяются. Также следует отметить, что в данной реализации порядок горизонтальной и вертикальной фильтраций не имеет значения. Применение сначала вертикальной фильтрации, а затем горизонтальной фильтрации приводит к тем же результатам, что и применение сначала горизонтальной фильтрации, а затем вертикальной фильтрации.In equation (2), the operation a = b >> c means that b is divisible by 2 ^s (for example, a = b / 2 ^s ) by shifting the binary representation of b to the right by s bits. It should be noted that in equation (1), the clipping or shearing operations are not applied to the first filtering stage. It should also be noted that in this implementation the order of horizontal and vertical filtering does not matter. The use of vertical filtration first and then horizontal filtration leads to the same results as the use of horizontal filtration first and then vertical filtration.

[00026] В SMuCO.01 [3] точность фильтра (обозначаемая как US_FILTER_PREC) для eF приравнена 6 битам. Если внутренняя битовая глубина refSampleArray равна 8 битов, то tempArray можно сохранить в пределах битовой глубины целевой реализации (например, 14 битов или 16 битов). Однако если внутренняя битовая глубина refSampleArray больше 8 битов (например, 10 битов), то вывод уравнения (1) может переполняться.[00026] In SMuCO.01 [3], the filter accuracy (denoted by US_FILTER_PREC) for eF is 6 bits. If the internal bit depth of refSampleArray is 8 bits, then tempArray can be stored within the bit depth of the target implementation (for example, 14 bits or 16 bits). However, if the internal bit depth of refSampleArray is greater than 8 bits (for example, 10 bits), then the output of equation (1) may overflow.

[00027] В одном из вариантов осуществления изобретения это можно предотвратить путем (а) фиксации порядка операций в процессе повышающей дискретизации, (b) введения промежуточных операций масштабирования. В одном из вариантов осуществления изобретения, если за горизонтальной фильтрацией следует вертикальная фильтрация, то повышающую дискретизацию можно реализовать следующим образом.[00027] In one embodiment, this can be prevented by (a) fixing the order of operations in the upsampling process, (b) introducing intermediate scaling operations. In one embodiment, if horizontal filtering is followed by vertical filtering, then upsampling can be implemented as follows.

Горизонтальная повышающая дискретизация Horizontal upsampling

[00028] Без потери общности, пусть INTERM_BITDEPTH обозначает требование к битовой глубине (или разрешению в битах) для промежуточной обработки данных фильтром; то есть ни один результат нельзя представить большим количеством битов, чем INTERM_BITDEPTH (например, INTERM_BITDEPTH=16). Пусть INTERNAL_INPUT_BITDEPTH обозначает битовую глубину, используемую для представления входного видеосигнала в процессоре. Следует отметить, что битовая глубина INTERNAL_INPUT_BITDEPTH может быть больше или равна первоначальной битовой глубине входного сигнала. Например, в некоторых вариантах осуществления изобретения 8-битные входные видеоданные можно внутренне представить с использованием INTERNAL_INPUT_BITDEPTH=10. В качестве альтернативы, в другом примере 14-битное видеоизображение можно представить битовой глубиной INTERN AL_INPUT_BITDEPTH=14.[00028] Without loss of generality, let INTERM_BITDEPTH denote the requirement for bit depth (or resolution in bits) for intermediate data processing by a filter; that is, no result can be represented with more bits than INTERM_BITDEPTH (for example, INTERM_BITDEPTH = 16). Let INTERNAL_INPUT_BITDEPTH denote the bit depth used to represent the input video signal in the processor. It should be noted that the bit depth INTERNAL_INPUT_BITDEPTH may be greater than or equal to the original bit depth of the input signal. For example, in some embodiments, 8-bit video input can be internally represented using INTERNAL_INPUT_BITDEPTH = 10. Alternatively, in another example, a 14-bit video image can be represented as a bit depth INTERN AL_INPUT_BITDEPTH = 14.

[00029] В одном из вариантов осуществления изобретения параметры масштабирования в уравнениях (3) и (4) можно вычислить как[00029] In one embodiment, the scaling parameters in equations (3) and (4) can be calculated as

В одном из вариантов осуществления изобретения для nShift1 и nShift2 могут не допускаться отрицательные значения. Например, отрицательное значение для nShift1 указывает на то, что разрешение в битах, допущенное для промежуточных результатов, больше приемлемого для предотвращения переполнения; поэтому в случае отрицательных значений параметр nShift1 может быть приравнен нулю.In one embodiment, negative values may not be allowed for nShift1 and nShift2. For example, a negative value for nShift1 indicates that the bit resolution allowed for intermediate results is more than acceptable to prevent overflow; therefore, in the case of negative values, the parameter nShift1 can be equal to zero.

[00030] Если в (3) и (4) используется округление (наибольшая сложность, наибольшая точность), то[00030] If rounding is used in (3) and (4) (the greatest complexity, the greatest accuracy), then

iOffset1=1<<(nShift1–1), (7)iOffset1 = 1 << (nShift1–1), (7)

iOffset2=1<<(nShift2–1), (8)iOffset2 = 1 << (nShift2–1), (8)

где a=1<<c обозначает двоичный сдвиг «1» влево на с битов, то есть a=2^с.where a = 1 << c denotes the binary shift “1” to the left by s bits, that is, a = 2 ^s .

[00031] В качестве альтернативы, если в (3) и (4) округление не используется (наименьшая сложность, наименьшая точность), то[00031] Alternatively, if rounding is not used in (3) and (4) (least complexity, least accuracy), then

iOffset1=0, (9)iOffset1 = 0, (9)

iOffset2=0. (10)iOffset2 = 0. (10)

[00032] В качестве альтернативы, если округление используется в (3), но не используется в (4), то[00032] Alternatively, if rounding is used in (3) but not used in (4), then

iOffset1=1<<(nShift1–1), (11)iOffset1 = 1 << (nShift1–1), (11)

iOffset2=0. (12)iOffset2 = 0. (12)

[00033] В качестве альтернативы, если округление используется в (4), но не используется в (3), то[00033] Alternatively, if rounding is used in (4) but not used in (3), then

iOffset1=0, (13)iOffset1 = 0, (13)

iOffset2=1<<(nShift2–1). (14)iOffset2 = 1 << (nShift2–1). (fourteen)

[00034] В одном из иллюстративных вариантов осуществления изобретения, пусть INTERM_BITDEPTH=14, US_FILTER_PREC=6 и INTERNAL_INPUT_BITDEPTH=8, тогда исходя из уравнений (5) и (6), nShift1=0, и nShift2=12. В другом примере при US_FILTER_PREC=6, если INTERN AL_INPUT_BITDEPTH=10, и INTERM_BITDEPTH=14, то nShift1=2, и iOffset1=0 или 2 в зависимости от выбранного режима округления. Кроме того, nShift2=10, и iOffset2=0 или 2⁹ в зависимости от выбранного режима округления.[00034] In one illustrative embodiment of the invention, let INTERM_BITDEPTH = 14, US_FILTER_PREC = 6 and INTERNAL_INPUT_BITDEPTH = 8, then based on equations (5) and (6), nShift1 = 0, and nShift2 = 12. In another example, with US_FILTER_PREC = 6, if INTERN AL_INPUT_BITDEPTH = 10 and INTERM_BITDEPTH = 14, then nShift1 = 2, and iOffset1 = 0 or 2 depending on the selected rounding mode. In addition, nShift2 = 10, and iOffset2 = 0 or 2 ⁹ depending on the selected rounding mode.

[00035] Следует отметить, что при использовании реализации, изображенной в уравнениях (3) и (4), вертикальная фильтрация, за которой следует горизонтальная фильтрация, может приводить к иным результатам, чем горизонтальная фильтрация, за которой следует вертикальная фильтрация, поэтому надлежащую фильтрацию в декодере можно либо фиксировать и предварительно определить для всех декодеров (например, посредством стандарта декодирования или технических условий), либо в некоторых вариантах осуществления изобретения надлежащий порядок можно сигнализировать из кодера в декодер с использованием соответствующего флага в метаданных.[00035] It should be noted that when using the implementation depicted in equations (3) and (4), vertical filtering followed by horizontal filtering can lead to different results than horizontal filtering followed by vertical filtering, therefore proper filtering in the decoder can either be fixed and pre-determined for all decoders (for example, by means of a decoding standard or specifications), or in some embodiments of the invention, the proper order can be to code from the encoder to the decoder using the corresponding flag in the metadata.

[00036] ФИГ. 3 изображает один из примеров процесса повышающей дискретизации данных изображения в соответствии с одним из вариантов осуществления данного изобретения. Вначале (305) кодер или декодер в системе многоуровневого кодирования определяет надлежащий порядок фильтрации (например, горизонтальную фильтрацию, за которой следует вертикальная фильтрация) и параметры масштабирования и округления. В одном из вариантов осуществления изобретения параметры масштабирования и округления можно определить в соответствии с уравнениями (5)—(14) на основе требуемых битовых глубин для промежуточного сохранения (например, INTERM_BITDEPTH), коэффициентов фильтра (например, US_FILTER_PREC) и внутреннего представления ввода (например, INTERNAL_INPUT_BITDEPTH). На этапе 310 данные изображения подвергают повышающей дискретизации в первом направлении (например, горизонтальном). Выходные результаты этой ступени округляют и масштабируют перед промежуточным сохранением с использованием первого параметра сдвига (например, nShift1) и первого параметра округления (например, iOffset1). Затем (315) промежуточные результаты подвергают повышающей дискретизации во втором направлении (например, вертикальном). Выходные результаты этой ступени округляют и масштабируют с использованием второго параметра сдвига (например, nShift2) и второго параметра округления (например, iOffset2). В заключение (320) выходные данные второй ступени подвергают отсечению перед окончательным выводом или сохранением.FIG. 3 depicts one example of an upsampling process of image data in accordance with one embodiment of the present invention. Initially (305), an encoder or decoder in a multi-level coding system determines the proper filtering order (e.g., horizontal filtering followed by vertical filtering) and the scaling and rounding parameters. In one embodiment of the invention, the scaling and rounding parameters can be determined in accordance with equations (5) to (14) based on the required bit depths for intermediate storage (e.g. INTERM_BITDEPTH), filter coefficients (e.g. US_FILTER_PREC) and internal input representation (e.g. , INTERNAL_INPUT_BITDEPTH). At 310, the image data is up-sampled in a first direction (e.g., horizontal). The output from this stage is rounded and scaled before staging using the first shift parameter (e.g., nShift1) and the first rounding parameter (e.g., iOffset1). Then (315) the intermediate results are up-sampled in a second direction (e.g., vertical). The output from this stage is rounded and scaled using a second shift parameter (e.g. nShift2) and a second round parameter (e.g. iOffset2). In conclusion (320), the output of the second stage is cut off before final output or storage.

[00037] Способы, описанные в настоящем документе, также могут быть применимы к другим приложениям формирования изображений, которые используют раздельную фильтрацию данных изображения с высокой битовой глубиной, таким, как понижающая дискретизация, фильтрация шума или преобразования в частотной области.[00037] The methods described herein may also be applicable to other imaging applications that use separate filtering of image data with a high bit depth, such as downsampling, noise filtering, or frequency domain transform.

Иллюстративное воплощение компьютерной системыIllustrative embodiment of a computer system

[00038] Варианты осуществления настоящего изобретения можно реализовать в компьютерной системе, системах, сконфигурированных на электронной схеме и компонентах, интегральном микросхемном (IC) устройстве, таком как микроконтроллер, вентильная матрица с эксплуатационным программированием (FPGA) или другое конфигурируемое или программируемое логическое устройство (PLD), в процессоре с дискретным временем или процессоре цифровой обработки сигналов (DSP), специализированной интегральной микросхеме (ASIC) и/или в устройстве, содержащем одну или несколько таких систем, устройств или компонентов. Компьютер и/или IC может выполнять, контролировать или исполнять команды, относящиеся к описанной в настоящем документе высокоточной повышающей дискретизации. Компьютер и/или IC может вычислять любой из множества параметров или значений, относящихся к описанной в настоящем документе высокоточной повышающей дискретизации. Варианты осуществления кодирования и декодирования можно реализовать как аппаратное обеспечение, программное обеспечение, программно-аппаратное обеспечение и различные их сочетания.[00038] Embodiments of the present invention can be implemented in a computer system, systems configured on an electronic circuit and components, an integrated microcircuit (IC) device, such as a microcontroller, field programmable gate array (FPGA), or other configurable or programmable logic device (PLD) ), in a discrete-time processor or digital signal processor (DSP), a specialized integrated circuit (ASIC) and / or in a device containing one or several ko such systems, devices or components. The computer and / or IC may execute, monitor, or execute instructions related to high-precision upsampling described herein. The computer and / or IC may calculate any of a variety of parameters or values related to the high-precision upsampling described herein. Embodiments of encoding and decoding can be implemented as hardware, software, firmware and various combinations thereof.

[00039] Некоторые реализации изобретения включают компьютерные процессоры, исполняющие команды программного обеспечения, которые вызывают выполнение процессором способа изобретения. Например, способы, относящиеся к вышеописанной высокоточной повышающей дискретизации, могут быть реализованы одним или несколькими процессорами дисплея, кодера, телевизионной приставки, преобразователя кода и т.п. путем исполнения ими команд программного обеспечения, доступных для этих процессоров. Изобретение также может быть предусмотрено в форме программного продукта. Этот программный продукт может включать любой носитель данных, несущий набор машиночитаемых сигналов, содержащих команды, которые при их исполнении процессором данных вызывают исполнение этим процессором данных способа изобретения. Программные продукты в соответствии с изобретением могут находиться в любой из широкого разнообразия форм. Этот программный продукт может включать, например, физические носители данных, такие как магнитные носители данных, в том числе дискеты, жесткие диски, оптические носители данных, в том числе диски CD ROM, диски DVD, электронные носители данных, в том числе запоминающие устройства ROM, флэш-память RAM и т.п. Машиночитаемые сигналы в программном продукте могут, необязательно, быть сжатыми или зашифрованными.[00039] Some implementations of the invention include computer processors executing software instructions that cause the processor to execute a method of the invention. For example, methods related to the above-described high-precision upsampling may be implemented by one or more display processors, an encoder, a set-top box, a code converter, and the like. by executing the software instructions available for these processors. The invention may also be provided in the form of a software product. This software product may include any storage medium that carries a set of computer-readable signals containing instructions that, when executed by a data processor, cause the processor to execute the data of the method of the invention. Software products in accordance with the invention may be in any of a wide variety of forms. This software product may include, for example, physical storage media, such as magnetic storage media, including floppy disks, hard drives, optical storage media, including CD ROMs, DVDs, electronic storage media, including ROM storage devices , flash memory RAM, etc. Machine-readable signals in a software product may optionally be compressed or encrypted.

[00040] Там, где выше упоминается компонент (например, модуль программного обеспечения, процессор, компоновочный узел, устройство, схема и т.д.), если не указано иное, ссылку на этот компонент (в том числе ссылку на «средства») следует истолковывать как включающую в качестве эквивалентов этого компонента, любой компонент, выполняющий функцию описываемого компонента (например, являющийся функционально эквивалентным), в том числе компоненты, не являющиеся конструктивно эквивалентными раскрываемой конструкции, выполняющие эту функцию в проиллюстрированных иллюстративных вариантах осуществления изобретения.[00040] Where a component is mentioned above (for example, a software module, processor, assembly, device, circuit, etc.), unless otherwise indicated, a link to this component (including a link to "tools") should be construed as including, as equivalents to this component, any component that performs the function of the described component (for example, which is functionally equivalent), including components that are not structurally equivalent to the disclosed structure, that perform this function in detail Update illustrative embodiments.

Эквиваленты, расширения, альтернативы и прочееEquivalents, extensions, alternatives and more

[00041] Таким образом, описаны иллюстративные варианты осуществления изобретения, относящиеся к высокоточной повышающей дискретизации при масштабируемом кодировании видеоизображений с высокой битовой глубиной. В предшествующем описании варианты осуществления настоящего изобретения были описаны со ссылкой на многочисленные конкретные подробности, которые могут изменяться от реализации к реализации. Поэтому единственным и исключительным указателем того, что представляет собой изобретение, является набор, изложенный в формуле изобретения, вытекающей из данной заявки, в той конкретной форме, в которой вытекает эта формула изобретения, включая любую последующую правку. Любые определения, в прямой форме изложенные в настоящем документе для терминов, содержащихся в указанной формуле изобретения, должны иметь преимущественную силу значений этих терминов, используемых в формуле изобретения. Таким образом, никакое ограничение, элемент, свойство, характерный признак, преимущество или атрибут, не изложенный в прямой форме в формуле изобретения, никоим образом не должен ограничивать объем этой формулы изобретения. Соответственно, описание и графические материалы следует рассматривать в иллюстративном, а не в ограничивающем смысле.[00041] Thus, illustrative embodiments of the invention are described with respect to high-precision upsampling for scalable encoding of high bit depth video images. In the foregoing description, embodiments of the present invention have been described with reference to numerous specific details that may vary from implementation to implementation. Therefore, the only and exclusive indicator of what constitutes an invention is the kit set forth in the claims arising from this application, in the specific form in which the claims follow, including any subsequent revision. Any definitions expressly set forth herein for terms contained in a specified claims should take precedence over the meanings of these terms used in the claims. Thus, no limitation, element, property, characteristic, advantage or attribute, not expressly stated in the claims, should in no way limit the scope of this claims. Accordingly, the description and graphic materials should be considered in an illustrative and not in a limiting sense.

Источники информацииInformation sources

[1] B. Bross, W.-J. Han, G. J. Sullivan, J.-R. Ohm, and T. Wiegand, «High efficiency video coding (HEVC) text specification draft 9», ITU-T/ISO/IEC Joint Collaborative Team on Video Coding (JCT-VC) document JCTVC-K1003, Oct. 2012. [1] B. Bross, W.-J. Han, G. J. Sullivan, J.-R. Ohm, and T. Wiegand, “High efficiency video coding (HEVC) text specification draft 9”, ITU-T / ISO / IEC Joint Collaborative Team on Video Coding (JCT-VC) document JCTVC-K1003, Oct. 2012.

[2] ITU-T and ISO/IEC JTC 1, «Advanced Video Coding for generic audio-visual services», ITU T Rec. H.264 and ISO/IEC 14496-10 (AVC).[2] ITU-T and ISO / IEC JTC 1, “Advanced Video Coding for generic audio-visual services”, ITU T Rec. H.264 and ISO / IEC 14496-10 (AVC).

[3] SMuCO.1.1 software for SHVC (scalable extension of HEVC): https:/hevc.hhi.fraunhofer.de/svn/'svn_SMuCSoftware/tags/0.1.1/. [3] SMuCO.1.1 software for SHVC (scalable extension of HEVC): https: /hevc.hhi.fraunhofer.de/svn/'svn_SMuCSoftware/tags/0.1.1/.

Claims

1. In a scalable video image system, a method of upsampling image data from a first level to a second level, where the method includes:

determination by the processor of scaling and rounding parameters in response to the requirements of the system of scalable video images to the bit depth, while the requirements of the system of scalable video images to the bit depth include intermediate values of the bit depth, the bit depth of the internal input and the bit depth of the accuracy of the filter coefficients;

generating first upsampling data by filtering image data from a first level, wherein this filtering of image data is performed in a first spatial direction using a first rounding parameter;

generating first intermediate data by scaling the first upsampled data by the first shift parameter;

generating second data with increased sampling by filtering the first intermediate data, while filtering the first intermediate data in a second spatial direction using a second rounding parameter;

generating second intermediate data by scaling the second upsampled data by the second shift parameter and

generating discretized output data for a second layer by clipping the second intermediate data,

the determination of the first shift parameter includes adding the bit depth data for the bit depth of the internal input with the bit depth of the filter coefficient accuracy and subtracting the intermediate bit depth values from their sum, while determining the second shift parameter involves subtracting the first shift parameter from the doubled bit depth of the filter coefficient accuracy .

2. The method of claim 1, wherein the scalable video image system comprises a video image encoder.

3. The method of claim 1, wherein the scalable video image system comprises a video image decoder.

4. The method of claim 1, wherein determining the first and second rounding parameters includes calculating

iOffset1 = 1 << (nShift1–1) and

iOffset2 = 1 << (nShift2–1),

iOffset1 is the first rounding parameter, iOffset2 is the second rounding parameter, nShift1 is the first shift parameter and nShift2 is the second shift parameter.

5. The method of claim 1, wherein the first and second rounding parameters are determined to be zero.

6. The method of claim 1, wherein determining the first and second rounding parameters includes calculating

iOffset1 = 1 << (nShift1–1) and

iOffset2 = 0,

iOffset1 is the first rounding parameter, iOffset2 is the second rounding parameter and nShift1 is the first shift parameter.

7. The method of claim 1, wherein determining the first and second rounding parameters includes calculating

iOffset1 = 0, and

iOffset2 = 1 << (nShift2–1),

iOffset1 is the first rounding parameter, iOffset2 is the second rounding parameter and nShift2 is the second shift parameter.

8. The method of claim 1, wherein the first spatial direction is a horizontal direction and the second spatial direction is a vertical direction.

9. The method of claim 1, wherein the first spatial direction is a vertical direction and the second spatial direction is a horizontal direction.

10. The method according to p. 1, in which the first spatial direction is a fixed and predefined technical conditions of the standard for decoding video images.

11. The method of claim 1, wherein the first spatial direction is determined by the encoder and communicated by the encoder to the decoder.

12. A device comprising a processor and configured to perform the method described in paragraph 1.

13. A non-transitory computer-readable storage medium containing computer-readable instructions stored thereon for executing a method according to claim 1.