RU2610589C2 - High-precision upsampling with scalable coding of video images with high bit depth - Google Patents

High-precision upsampling with scalable coding of video images with high bit depth Download PDF

Info

Publication number
RU2610589C2
RU2610589C2 RU2015123238A RU2015123238A RU2610589C2 RU 2610589 C2 RU2610589 C2 RU 2610589C2 RU 2015123238 A RU2015123238 A RU 2015123238A RU 2015123238 A RU2015123238 A RU 2015123238A RU 2610589 C2 RU2610589 C2 RU 2610589C2
Authority
RU
Russia
Prior art keywords
data
bit depth
rounding
parameter
spatial direction
Prior art date
Application number
RU2015123238A
Other languages
Russian (ru)
Other versions
RU2015123238A (en
Inventor
Пэн ИНЬ
Таожань Лу
Тао ЧЭНЬ
Original Assignee
Долби Лабораторис Лайсэнзин Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Долби Лабораторис Лайсэнзин Корпорейшн filed Critical Долби Лабораторис Лайсэнзин Корпорейшн
Publication of RU2015123238A publication Critical patent/RU2015123238A/en
Application granted granted Critical
Publication of RU2610589C2 publication Critical patent/RU2610589C2/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)

Abstract

FIELD: computer engineering.SUBSTANCE: invention relates to computer engineering. In a scalable video system method of upsampling image data from a first level to a second level includes determination of parameters of scaling and rounding-off in response to requirements of scalable video system to bit depth. Input data are first filtered according to a first spatial direction using a first parameter of rounding in order to generate first upsampled data. By scaling first upsampled data using a first shift parameter, first intermediate data are generated, which are then filtered according to a second spatial direction using a second parameter of rounding in order to generate second upsampled data. Then by scaling second upsampled data using second shift parameter, second intermediate data are generated. Final upsampled data can be generated by cutting off second intermediate data.EFFECT: technical result consists in maintaining accuracy of upsampling operations.13 cl, 3 dwg

Description

ПЕРЕКРЕСТНАЯ ССЫЛКА НА РОДСТВЕННЫЕ ЗАЯВКИCROSS REFERENCE TO RELATED APPLICATIONS

[0001] Данная заявка заявляет приоритет предварительной заявки на патент США №61/745050, поданной 21 декабря 2012 г., которая посредством ссылки полностью включается в настоящий документ.[0001] This application claims the priority of provisional application for US patent No. 61/745050, filed December 21, 2012, which by reference is fully incorporated herein.

ОБЛАСТЬ ТЕХНИКИFIELD OF TECHNOLOGY

[0002] Настоящее изобретение в целом относится к изображениям. В частности, один из вариантов осуществления настоящего изобретения относится к высокоточной повышающей дискретизации в масштабируемых видеокодеках для видеоизображений с высокой битовой глубиной.[0002] The present invention generally relates to images. In particular, one of the embodiments of the present invention relates to high-precision upsampling in scalable video codecs for video with high bit depth.

УРОВЕНЬ ТЕХНИКИ BACKGROUND

[0003] Сжатие звука и видеоизображений является ключевой составляющей при разработке, хранении, распространении и потреблении мультимедийного содержимого. Выбор способа сжатия включает компромиссы между эффективностью кодирования, сложностью кодирования и задержкой. По мере того, как увеличивается отношение вычислительной мощности к вычислительным затратам, оно позволяет разрабатывать более сложные методики сжатия, делающие возможным более эффективное сжатие. В качестве примера в сжатии видеоизображений Экспертная группа по вопросам движущегося изображения (MPEG) из Международной организации по стандартам (ISO) продолжила совершенствовать первоначальный видеостандарт MPEG-1, выпустив стандарты кодирования MPEG-2, MPEG-4 (part 2) и H.264/AVC (или MPEG-4, part 10). [0003] Compression of sound and video is a key component in the development, storage, distribution and consumption of multimedia content. Choosing a compression method involves the trade-offs between coding efficiency, coding complexity, and delay. As the ratio of computing power to computing costs increases, it allows the development of more sophisticated compression techniques that make more efficient compression possible. As an example in video compression, the Moving Image Expert Group (MPEG) from the International Organization for Standards (ISO) continued to refine the original MPEG-1 video standard with the release of the MPEG-2, MPEG-4 (part 2) and H.264 encoding standards / AVC (or MPEG-4, part 10).

[0004] Несмотря на эффективность кодирования и успех H.264, в настоящее время в разработке находится технология сжатия видеоизображений нового поколения, известная как высокоэффективное кодирование видеоизображений (HEVC). Технология HEVC, проект которой доступен в документе JCTVC-K1003 Объединенной команды по кодированию видеоизображений ITU-T/ISO/IEC (JCT-VC) «High efficiency video coding (HEVC) text specification draft 9», октябрь 2012 г., авторы B. Bross, W.-J. Han, G. J. Sullivan, J.-R. Ohm, T. Wiegand, который посредством ссылки полностью включается в настоящий документ, направлен на обеспечение способности к сжатию, улучшенной относительно существующего стандарта H.264 (так же известного как AVC), опубликованного как документ «Advanced Video Coding for generic audio-visual services», ITU T Rec. H.264, и стандарта ISO/IEC 14496-10, которые посредством ссылки полностью включаются в настоящий документ.[0004] Despite the coding efficiency and success of H.264, a new generation of video compression technology, known as High Performance Video Coding (HEVC), is currently under development. HEVC technology, a draft of which is available in document JCTVC-K1003 of the Joint ITU-T / ISO / IEC (JCT-VC) Video Efficiency Coding Team (HEVC) text specification draft 9, October 2012, authors B. Bross, W.-J. Han, G. J. Sullivan, J.-R. Ohm, T. Wiegand, which is incorporated herein by reference in its entirety, is intended to provide compression capabilities improved over the existing H.264 standard (also known as AVC), published as Advanced Video Coding for generic audio-visual services ”, ITU T Rec. H.264, and ISO / IEC 14496-10, which are incorporated herein by reference in their entirety.

[0005] Видеосигналы можно охарактеризовать множеством параметров, таких как битовая глубина, цветовое пространство, цветовая гамма и разрешение. Современные телевизоры и устройства для воспроизведения видеоизображений (например, проигрыватели Blu-ray) поддерживают различные разрешения, в том числе стандартную четкость (например, 720×480i) и высокую четкость (HD; например, 1090×1080р). Форматом разрешения следующего поколения является сверхвысокая четкость (UHD) с разрешением 3840×2160. Сверхвысокую четкость также можно именовать Ultra HD, UHDTV или Super High-Vision. В рамках настоящего документа «UHD» обозначает любое разрешение выше, чем разрешение HD.[0005] Video signals can be characterized by a variety of parameters, such as bit depth, color space, color gamut, and resolution. Modern televisions and video playback devices (such as Blu-ray players) support a variety of resolutions, including standard definition (e.g. 720x480i) and high definition (HD; e.g. 1,090x1080p). The next-generation resolution format is ultra-high definition (UHD) with a resolution of 3840 × 2160. Ultra-high definition can also be called Ultra HD, UHDTV or Super High-Vision. As used herein, “UHD” means any resolution higher than HD resolution.

[0006] Другой особенностью характеристики сигнала является его динамический диапазон. Динамический диапазон HD представляет собой диапазон интенсивности (например, яркости, luma) на изображении, например, от самых темных до самых ярких. В рамках настоящего документа термин «динамический диапазон» (DR) может относиться к способности психовизуальной системы человека (HVS) воспринимать диапазон интенсивности (например, яркости, luma) на изображении, например, от самых темных до самых ярких. В этом смысле, DR относится к интенсивности «в отношении сцены». DR также может относиться к способности устройства отображения приемлемо или приблизительно представлять диапазон интенсивности определенной ширины. В этом смысле, DR относится к интенсивности «в отношении дисплея». Если определенное значение не обусловлено в прямой форме как имеющее определенную значимость в любом месте настоящего документа, следует делать вывод о том, что этот термин можно использовать в любом смысле, например, взаимозаменяемо.[0006] Another feature of a signal characteristic is its dynamic range. The HD dynamic range is the range of intensity (e.g. brightness, luma) in an image, for example, from the darkest to the brightest. For the purposes of this document, the term “dynamic range” (DR) may refer to the ability of the human psychovisual system (HVS) to perceive a range of intensity (eg, brightness, luma) in an image, for example, from the darkest to the brightest. In this sense, DR refers to intensity "in relation to the scene." DR may also relate to the ability of the display device to acceptable or approximately represent an intensity range of a certain width. In this sense, DR refers to the intensity “in relation to the display”. If a certain meaning is not directly defined as having a certain significance anywhere in this document, it should be concluded that this term can be used in any sense, for example, interchangeably.

[0007] В настоящем документе термин «расширенный динамический диапазон» (HDR) относится к ширине DR, охватывающей около 14—15 порядков величины зрительной системы человека (HVS). Например, хорошо приспособленные люди с, по существу, нормальным зрением (например, в одном или нескольких следующих смыслах: статистическом, биометрическом или офтальмологическом) имеют диапазон интенсивности, охватывающий около 15 порядков величины. Приспособленные люди могут воспринимать тусклые источники света всего лишь в единицы фотонов. Даже более, те же самые люди могут воспринимать почти болезненно яркую интенсивность полуденного солнца в пустыне, на море или на снегу (или даже при взгляде на солнце, однако кратком — во избежание повреждений). Такой охват, тем не менее, доступен «приспособленным» людям, например людям, HVS которых имеет время для восстановления и корректировки.[0007] As used herein, the term "enhanced dynamic range" (HDR) refers to a width of DR spanning about 14-15 orders of magnitude of the human visual system (HVS). For example, well-adapted people with essentially normal vision (for example, in one or more of the following senses: statistical, biometric, or ophthalmic) have a range of intensity spanning about 15 orders of magnitude. Adapted people can perceive dim light sources in only units of photons. Even more, the same people can perceive the almost painfully bright intensity of the midday sun in the desert, on the sea or in the snow (or even when looking at the sun, but briefly, to avoid damage). Such coverage, however, is available to “fit” people, such as people whose HVS has time to recover and adjust.

[0008] Для сравнения, DR, в котором человек может одновременно воспринимать обширную ширину в диапазоне интенсивностей, может быть весьма усеченным относительно HDR. В рамках настоящего документа термины «повышенный динамический диапазон» (EDR), «зрительный динамический диапазон» или «переменный динамический диапазон» (VDR) могут по отдельности или взаимозаменяемо относиться к DR, одновременно воспринимаемому HVS. В рамках настоящего документа EDR может относиться к DR, охватывающему 5—6 порядков величины. Поэтому EDR, являющийся в некоторой степени более узким в отношении истинной картины HDR, тем не менее, отображает большую ширину DR. В рамках настоящего документа термин «одновременный динамический диапазон» может относиться к EDR.[0008] For comparison, DR, in which a person can simultaneously perceive an extensive width in the range of intensities, can be very truncated relative to HDR. For the purposes of this document, the terms “enhanced dynamic range” (EDR), “visual dynamic range”, or “variable dynamic range” (VDR) may individually or interchangeably refer to DR concurrently perceived by HVS. As used herein, EDR may refer to DR spanning 5-6 orders of magnitude. Therefore, the EDR, which is somewhat narrower with respect to the true HDR picture, nevertheless displays a large DR width. As used herein, the term “simultaneous dynamic range” may refer to EDR.

[0009] В рамках настоящего документа термин «битовая глубина» изображения или видеоизображения обозначает количество битов, используемых для представления или хранения значений пикселов цветовой составляющей изображения в видеосигнале. Например, термин «N-битное видеоизображение» (например, N=8) обозначает, что значения пикселов цветовой составляющей (например, R, G или B) на этом видеоизображении может принимать значения в интервале от 0 до 2N–1.[0009] As used herein, the term "bit depth" of an image or video image refers to the number of bits used to represent or store pixel values of the color component of an image in a video signal. For example, the term “N-bit video image” (for example, N = 8) means that the pixel values of the color component (for example, R, G or B) in this video image can take values in the range from 0 to 2 N –1.

[00010] В рамках настоящего документа термин «высокая битовая глубина» обозначает любые значения битовой глубины больше 8 битов (например, N=10 битов). Следует отметить, что хотя с высокой битовой глубиной, как правило, ассоциируются изображения и видеосигналы HDR, изображение с высокой битовой глубиной необязательно имеет расширенный динамический диапазон. Поэтому в рамках настоящего документа изображения с высокой битовой глубиной могут ассоциироваться как с изображениями HDR, так и с изображениями SDR.[00010] As used herein, the term “high bit depth” means any bit depth value greater than 8 bits (eg, N = 10 bits). It should be noted that although HDR images and video signals are generally associated with high bit depth, a high bit depth image does not necessarily have an extended dynamic range. Therefore, in the context of this document, high bit depth images can be associated with both HDR images and SDR images.

[00011] Для поддержки обратной совместимости с унаследованными воспроизводящими устройствами, а также новых дисплейных технологий для доставки видеоданных UHD и HDR (или SDR) от устройства в восходящем направлении к устройствам в нисходящем направлении можно использовать несколько уровней. При условии наличия такой многоуровневой системы унаследованные декодеры могут использовать базовый уровень для воссоздания версии HD SDR содержимого. Передовые декодеры могут использовать как базовый уровень, так и уровни расширения для воссоздания версии UHD EDR содержимого с целью представления его на более приспособленных дисплеях. Как оценили авторы изобретения, желательными здесь являются усовершенствованные методики кодирования видеоизображений с высокой битовой глубиной с использованием масштабируемых кодеков.[00011] Several levels can be used to support backward compatibility with legacy playback devices, as well as new display technologies for delivering UHD and HDR (or SDR) video data from a device in an upstream direction to devices in a downstream direction. Given such a layered system, legacy decoders can use the base layer to recreate the HD SDR version of the content. Advanced decoders can use both the basic level and the extension levels to recreate the UHD EDR version of the content in order to present it on more suitable displays. As appreciated by the inventors, desirable here are improved techniques for encoding video images with high bit depth using scalable codecs.

[00012] Подходы, описываемые в данном разделе, представляют собой подходы, которые можно было бы осуществить, но необязательно подходы, понятые и осуществленные ранее. Поэтому, если не указано иное, не следует полагать, что любой из подходов, описанных в данном разделе, квалифицируется как предшествующий уровень техники единственно в силу его включения в этот раздел. Аналогично, если не указано иное, проблемы, установленные на основании этого раздела в связи с одним или несколькими подходами, не следует полагать признанными где-либо на предшествующем уровне техники.[00012] The approaches described in this section are approaches that could be implemented, but not necessarily the approaches understood and implemented previously. Therefore, unless otherwise indicated, it should not be assumed that any of the approaches described in this section qualifies as prior art solely by virtue of its inclusion in this section. Similarly, unless otherwise indicated, problems identified based on this section in connection with one or more approaches should not be considered to be recognized elsewhere in the prior art.

КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВBRIEF DESCRIPTION OF GRAPHIC MATERIALS

[00013] Один из вариантов осуществления настоящего изобретения проиллюстрирован на неограничивающем примере на чертежах сопроводительных графических материалов, в которых подобные ссылочные позиции относятся к аналогичным элементам и в которых:[00013] One embodiment of the present invention is illustrated by a non-limiting example in the drawings of the accompanying graphic materials in which like reference numerals refer to like elements and in which:

[00014] ФИГ. 1 - одно из иллюстративных воплощений системы масштабируемого кодирования в соответствии с одним из вариантов осуществления данного изобретения.FIG. 1 is one illustrative embodiment of a scalable coding system in accordance with one embodiment of the present invention.

[00015] ФИГ. 2 - одно из иллюстративных воплощений масштабируемой системы декодирования в соответствии с одним из вариантов осуществления данного изобретения.FIG. 2 is one illustrative embodiment of a scalable decoding system in accordance with one embodiment of the present invention.

[00016] ФИГ. 3 изображает один из примеров процесса повышающей дискретизации данных изображения в соответствии с одним из вариантов осуществления данного изобретения.FIG. 3 depicts one example of an upsampling process of image data in accordance with one embodiment of the present invention.

ОПИСАНИЕ ИЛЛЮСТРАТИВНЫХ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯDESCRIPTION OF ILLUSTRATIVE EMBODIMENTS OF THE INVENTION

[00017] В настоящем документе описана высокоточная повышающая дискретизация при масштабируемом кодировании входных видеоизображений с высокой битовой глубиной. При заданных параметрах, относящихся к битовой глубине промежуточных результатов, битовой глубине внутреннего ввода и битовой глубине точности фильтра, для сохранения точности операций и предотвращения переполнения определяются коэффициенты масштабирования и факторы округления.[00017] This document describes high-precision upsampling for scalable coding of input video images with a high bit depth. Given the parameters relating to the bit depth of the intermediate results, the bit depth of the internal input and the bit depth of the filter accuracy, scaling factors and rounding factors are determined to preserve the accuracy of operations and prevent overflow.

[00018] В нижеследующем описании в целях разъяснения с тем, чтобы обеспечить полное понимание настоящего изобретения, изложены многочисленные конкретные подробности. Однако, как будет очевидно, настоящее изобретение может быть применено на практике без этих конкретных подробностей. В других случаях хорошо известные конструкции и устройства не описаны в исчерпывающих подробностях во избежание излишнего затруднения понимания изобретения.[00018] In the following description, for purposes of explanation, in order to provide a thorough understanding of the present invention, numerous specific details are set forth. However, as will be apparent, the present invention may be practiced without these specific details. In other cases, well-known structures and devices are not described in detail in order to avoid unnecessary difficulty in understanding the invention.

Сущность изобретения SUMMARY OF THE INVENTION

[00019] Иллюстративные варианты осуществления изобретения, описываемые в настоящем документе, относятся к высокоточной повышающей дискретизации при многоуровневом кодировании и декодировании видеосигналов с высокой битовой глубиной. В ответ на требования к битовой глубине системы кодирования или декодирования видеоизображений, для раздельного фильтра повышающей дискретизации определяются входные данные, коэффициенты фильтрации, параметры масштабирования и округления. Входные данные сначала подвергаются фильтрации по первому пространственному направлению с использованием первого параметра округления с целью генерирования первых данных с повышенной дискретизацией. Первые промежуточные данные генерируются путем масштабирования первых данных с повышенной дискретизацией с использованием первого параметра сдвига. Затем эти промежуточные данные фильтруются по второму пространственному направлению с использованием второго параметра округления с целью генерирования вторых данных с повышенной дискретизацией. Вторые промежуточные данные генерируются путем масштабирования вторых данных с повышенной дискретизацией с использованием второго параметра сдвига. Окончательные данные с повышенной дискретизацией могут генерироваться путем отсечения вторых промежуточных данных. [00019] Illustrative embodiments of the invention described herein relate to high-precision upsampling for multi-level coding and decoding of high bit depth video signals. In response to the requirements for the bit depth of a video encoding or decoding system, input data, filtering coefficients, scaling and rounding parameters are determined for a separate upsampling filter. The input data is first filtered in the first spatial direction using the first rounding parameter to generate the first data with upsampling. The first intermediate data is generated by scaling the first upsampled data using the first shift parameter. Then, this intermediate data is filtered in a second spatial direction using a second rounding parameter to generate second upsampling data. The second intermediate data is generated by scaling the second upsampled data using a second shift parameter. Final data with upsampling can be generated by clipping the second intermediate data.

Высокоточная раздельная повышающая дискретизация High precision split upsampling

[00020] Существующие отображающие и воспроизводящие устройства, такие как телевизоры HDTV, телевизионные приставки или проигрыватели Blu-ray, как правило, поддерживают сигналы с разрешением HD 1080p (1920×1080 при скорости 60 кадров в секунду). Для потребительских приложений такие сигналы в настоящее время, как правило, сжимают с использованием битовой глубины 8 битов на пиксел для каждой цветовой составляющей в цветовом формате luma-chroma, где, как правило, составляющие chroma имеют меньшее разрешение, чем составляющая luma (например, в цветовом формате YCbCr или YUV 4:2:0). По причине 8-битной глубины и соответствующего узкого динамического диапазона такие сигналы, как правило, именуются сигналами со стандартным динамическим диапазоном (SDR).[00020] Existing display and playback devices, such as HDTVs, set-top boxes or Blu-ray players, typically support HD 1080p (1920 × 1080 resolution at 60 frames per second) signals. For consumer applications, such signals are currently typically compressed using a bit depth of 8 bits per pixel for each color component in the luma-chroma color format, where, as a rule, chroma components have lower resolution than the luma component (for example, YCbCr or YUV 4: 2: 0 color format). Due to the 8-bit depth and the corresponding narrow dynamic range, such signals are usually referred to as standard dynamic range (SDR) signals.

[00021] По мере разработки новых стандартов телевидения, таких как сверхвысокая четкость (UHD), желательно кодировать в масштабируемом формате сигналы с улучшенным разрешением и/или более высокой битовой глубиной.[00021] As new television standards, such as ultra-high definition (UHD), are developed, it is desirable to encode signals with improved resolution and / or higher bit depth in a scalable format.

[00022] ФИГ. 1 изображает один из вариантов осуществления иллюстративной реализации системы масштабируемого кодирования. В одном из иллюстративных вариантов осуществления изобретения входной сигнал 104 базового уровня (BL) может представлять сигнал HD SDR, а ввод 102 уровня расширения (EL) может представлять сигнал UHD HDR (или SDR) с высокой битовой глубиной. Ввод 104 BL является сжатым (или кодированным) с использованием кодера 105 BL для генерирования битового потока 107 BL. Кодер 105 BL может сжимать или кодировать входной сигнал 104 с использованием любого из известных или будущих алгоритмов сжатия видеоизображений, таких, как MPEG-2, MPEG-4, part 2, H.264, HEVC, VP8 и т.п.FIG. 1 depicts one embodiment of an illustrative implementation of a scalable coding system. In one illustrative embodiment of the invention, the input signal base level (BL) may represent a signal HD SDR, and the input 102 of the extension level (EL) may represent a signal UHD HDR (or SDR) with a high bit depth. BL input 104 is compressed (or encoded) using the BL encoder 105 to generate the BL bitstream 107. The BL encoder 105 may compress or encode the input signal 104 using any of the known or future video compression algorithms, such as MPEG-2, MPEG-4, part 2, H.264, HEVC, VP8 and the like.

[00023] Для заданного ввода 104 BL система 100 кодирования генерирует не только битовый поток 107 BL, но также и сигнал 112 BL, который представляет сигнал 107 BL так, как он будет декодироваться соответствующим приемником. В некоторых вариантах осуществления изобретения сигнал 112 может генерироваться отдельным декодером (110) BL, следующим за кодером 105 BL. В некоторых других вариантах осуществления изобретения сигнал 112 может генерироваться контуром обратной связи, используемым для выполнения компенсации движения в кодере 105 BL. Как изображено на ФИГ. 1, сигнал 112 может быть обработан модулем 115 межуровневой обработки данных с целью генерирования сигнала, подходящего для использования процессом 120 межуровневого предсказания. В некоторых вариантах осуществления изобретения модуль 115 межуровневой обработки данных увеличивает масштаб сигнала 112 для его приведения в соответствие пространственному разрешению ввода 102 EL (например, от разрешения HD к разрешению UHD). Вслед за межуровневым предсказанием 120 вычисляется остаточный сигнал 127, который впоследствии кодируется кодером 132 с целью генерирования кодированного битового потока 132 EL. Битовый поток 107 BL и битовый поток 132 EL, как правило, уплотняют в единый кодированный битовый поток, который передается в подходящие приемники.[00023] For a given BL input 104, the coding system 100 generates not only the BL bitstream 107, but also the BL signal 112, which represents the BL signal 107 as it will be decoded by the corresponding receiver. In some embodiments, the signal 112 may be generated by a separate BL decoder (110) following the BL encoder 105. In some other embodiments, the signal 112 may be generated by a feedback loop used to perform motion compensation in the BL encoder 105. As depicted in FIG. 1, a signal 112 may be processed by an inter-layer data processing unit 115 to generate a signal suitable for use by the inter-layer prediction process 120. In some embodiments, the inter-layer data processing module 115 zooms in on the signal 112 to match the spatial resolution of the EL input 102 (e.g., from HD resolution to UHD resolution). Following inter-layer prediction 120, a residual signal 127 is computed, which is subsequently encoded by encoder 132 to generate an encoded EL bitstream 132. The BL bit stream 107 and the EL bit stream 132 are typically compressed into a single coded bit stream, which is transmitted to suitable receivers.

[00024] Термин «SHVC» обозначает масштабируемое расширение технологии сжатия видеоизображений нового поколения, известной как Высокоэффективное кодирование видеоизображений (HEVC) [1], которая делает возможной существенно более высокую способность к сжатию, чем у существующего стандарта AVC (H.264) [2]. SHVC в настоящее время совместно разрабатывают группы ISO/IEC MPEG и ITU-T WP3/16. Одной из ключевых особенностей SHVC является пространственная масштабируемость, где наиболее значимый выигрыш обеспечивает межуровневое предсказание текстуры (например, 120 или 210). На ФИГ. 2 показан один из примеров декодера SHVC. Как часть межуровневого предсказания, процесс (220) повышающей дискретизации выполняет повышающую дискретизацию, или повышающее преобразование, пиксельных данных из базового уровня (215) для их приведения в соответствие разрешению в пикселах для данных, принимаемых на уровне (например, 202 или 230) расширения. В одном их вариантов осуществления изобретения, процесс повышающей дискретизации можно выполнять путем применения фильтра повышающей дискретизации, или интерполирующего фильтра. В программном обеспечении масштабируемого расширения H.264 (SVC), или SHVC SMuCO.1.1 [3], применяется раздельный многофазный фильтр повышающей дискретизации/интерполяции. Несмотря на то, что такие фильтры эффективны для входных данных со стандартной битовой глубиной (например, для изображений, использующих 8 битов на пиксел для каждой цветовой составляющей), они могут переполняться входными данными с высокой битовой глубиной (например, изображениями, использующими 10 или более битов на пиксел для каждой цветовой составляющей). [00024] The term “SHVC” refers to a scalable expansion of a new generation of video compression technology known as High Performance Video Coding (HEVC) [1], which makes it possible to significantly compress better than the existing AVC (H.264) standard [2 ]. SHVC is currently being jointly developed by ISO / IEC MPEG and ITU-T WP3 / 16. One of the key features of SHVC is spatial scalability, where the most significant gain is provided by inter-layer texture prediction (for example, 120 or 210). In FIG. 2 shows one example of an SHVC decoder. As part of the inter-layer prediction, the upsampling process (220) performs upsampling, or upconversion, of the pixel data from the base layer (215) to match the pixel resolution for the data received at the extension level (e.g., 202 or 230). In one embodiment of the invention, the upsampling process can be performed by applying an upsampling filter, or an interpolating filter. H.264 Scalable Extension (SVC) software, or SHVC SMuCO.1.1 [3], uses a separate multiphase upsampling / interpolation filter. Although these filters are effective for input with a standard bit depth (for example, for images using 8 bits per pixel for each color component), they can overflow with input data with a high bit depth (for example, images using 10 or more bits per pixel for each color component).

[00025] В двумерных процессах повышающей дискретизации, или интерполяции, для снижения сложности обработки данных общепринятой практикой является применение раздельных фильтров. Такой фильтр сначала выполняет повышающую дискретизацию изображения в одном пространственном направлении (например, горизонтальном или вертикальном), а затем в другом направлении (например, вертикальном или горизонтальном). Без потери общности, в нижеследующем описании предполагается, что вертикальная повышающая дискретизация следует за горизонтальной повышающей дискретизацией. Тогда процесс фильтрации можно описать как[00025] In two-dimensional upsampling, or interpolation, processes, it is common practice to use separate filters to reduce data processing complexity. Such a filter first performs up-sampling of the image in one spatial direction (for example, horizontal or vertical), and then in another direction (for example, vertical or horizontal). Without loss of generality, the following description assumes that vertical upsampling follows horizontal upsampling. Then the filtering process can be described as

Горизонтальная повышающая дискретизацияHorizontal upsampling

Figure 00000001
Figure 00000001

Вертикальная повышающая дискретизацияVertical upsampling

Figure 00000002
Figure 00000002

где eF хранит коэффициенты многофазного фильтра повышающей дискретизации, refSampleArray содержит опорные дискретные значения из воссозданного базового уровня, tempArray хранит промежуточное значение после первой одномерной фильтрации, predArray хранит окончательное значение после второй одномерной фильтрации, xRef и yRef соответствуют относительному положению пикселов для повышающей дискретизации, nshift обозначает параметр масштабирования, или нормирования, offset обозначает параметр округления, и Clip ( ) обозначает функцию отсечения. Например, для заданных данных х и пороговых значений A и B в одном из вариантов осуществления изобретения функция y=Clip(x, A, B) обозначаетwhere eF stores the multiphase upsampling filter coefficients, refSampleArray contains reference discrete values from the reconstructed base level, tempArray stores the intermediate value after the first one-dimensional filtering, predArray stores the final value after the second one-dimensional filtering, xRef and yRef correspond to the relative pixel position for upsampling, nshift stands for the scaling or normalization parameter, offset denotes the rounding parameter, and Clip () denotes the clipping function. For example, for given data x and threshold values A and B in one embodiment of the invention, the function y = Clip (x, A, B) denotes

Figure 00000003
Figure 00000003

Например, для N-битных данных изображения иллюстративные значения А и В могут включать A=0 и В=2Ν–1.For example, for N-bit image data, exemplary values A and B may include A = 0 and B = 2 Ν –1.

В уравнении (2) операция a=b>>c обозначает, что b делится на 2с (например, а=b/2с) путем сдвига двоичного представления b вправо на с битов. Следует отметить, что в уравнении (1) для первой ступени фильтрации операции отсечения или сдвига не применяются. Также следует отметить, что в данной реализации порядок горизонтальной и вертикальной фильтраций не имеет значения. Применение сначала вертикальной фильтрации, а затем горизонтальной фильтрации приводит к тем же результатам, что и применение сначала горизонтальной фильтрации, а затем вертикальной фильтрации.In equation (2), the operation a = b >> c means that b is divisible by 2 s (for example, a = b / 2 s ) by shifting the binary representation of b to the right by s bits. It should be noted that in equation (1), the clipping or shearing operations are not applied to the first filtering stage. It should also be noted that in this implementation the order of horizontal and vertical filtering does not matter. The use of vertical filtration first and then horizontal filtration leads to the same results as the use of horizontal filtration first and then vertical filtration.

[00026] В SMuCO.01 [3] точность фильтра (обозначаемая как US_FILTER_PREC) для eF приравнена 6 битам. Если внутренняя битовая глубина refSampleArray равна 8 битов, то tempArray можно сохранить в пределах битовой глубины целевой реализации (например, 14 битов или 16 битов). Однако если внутренняя битовая глубина refSampleArray больше 8 битов (например, 10 битов), то вывод уравнения (1) может переполняться.[00026] In SMuCO.01 [3], the filter accuracy (denoted by US_FILTER_PREC) for eF is 6 bits. If the internal bit depth of refSampleArray is 8 bits, then tempArray can be stored within the bit depth of the target implementation (for example, 14 bits or 16 bits). However, if the internal bit depth of refSampleArray is greater than 8 bits (for example, 10 bits), then the output of equation (1) may overflow.

[00027] В одном из вариантов осуществления изобретения это можно предотвратить путем (а) фиксации порядка операций в процессе повышающей дискретизации, (b) введения промежуточных операций масштабирования. В одном из вариантов осуществления изобретения, если за горизонтальной фильтрацией следует вертикальная фильтрация, то повышающую дискретизацию можно реализовать следующим образом.[00027] In one embodiment, this can be prevented by (a) fixing the order of operations in the upsampling process, (b) introducing intermediate scaling operations. In one embodiment, if horizontal filtering is followed by vertical filtering, then upsampling can be implemented as follows.

Горизонтальная повышающая дискретизация Horizontal upsampling

Figure 00000004
Figure 00000004

Вертикальная повышающая дискретизацияVertical upsampling

Figure 00000005
Figure 00000005

[00028] Без потери общности, пусть INTERM_BITDEPTH обозначает требование к битовой глубине (или разрешению в битах) для промежуточной обработки данных фильтром; то есть ни один результат нельзя представить большим количеством битов, чем INTERM_BITDEPTH (например, INTERM_BITDEPTH=16). Пусть INTERNAL_INPUT_BITDEPTH обозначает битовую глубину, используемую для представления входного видеосигнала в процессоре. Следует отметить, что битовая глубина INTERNAL_INPUT_BITDEPTH может быть больше или равна первоначальной битовой глубине входного сигнала. Например, в некоторых вариантах осуществления изобретения 8-битные входные видеоданные можно внутренне представить с использованием INTERNAL_INPUT_BITDEPTH=10. В качестве альтернативы, в другом примере 14-битное видеоизображение можно представить битовой глубиной INTERN AL_INPUT_BITDEPTH=14.[00028] Without loss of generality, let INTERM_BITDEPTH denote the requirement for bit depth (or resolution in bits) for intermediate data processing by a filter; that is, no result can be represented with more bits than INTERM_BITDEPTH (for example, INTERM_BITDEPTH = 16). Let INTERNAL_INPUT_BITDEPTH denote the bit depth used to represent the input video signal in the processor. It should be noted that the bit depth INTERNAL_INPUT_BITDEPTH may be greater than or equal to the original bit depth of the input signal. For example, in some embodiments, 8-bit video input can be internally represented using INTERNAL_INPUT_BITDEPTH = 10. Alternatively, in another example, a 14-bit video image can be represented as a bit depth INTERN AL_INPUT_BITDEPTH = 14.

[00029] В одном из вариантов осуществления изобретения параметры масштабирования в уравнениях (3) и (4) можно вычислить как[00029] In one embodiment, the scaling parameters in equations (3) and (4) can be calculated as

Figure 00000006
Figure 00000006

В одном из вариантов осуществления изобретения для nShift1 и nShift2 могут не допускаться отрицательные значения. Например, отрицательное значение для nShift1 указывает на то, что разрешение в битах, допущенное для промежуточных результатов, больше приемлемого для предотвращения переполнения; поэтому в случае отрицательных значений параметр nShift1 может быть приравнен нулю.In one embodiment, negative values may not be allowed for nShift1 and nShift2. For example, a negative value for nShift1 indicates that the bit resolution allowed for intermediate results is more than acceptable to prevent overflow; therefore, in the case of negative values, the parameter nShift1 can be equal to zero.

[00030] Если в (3) и (4) используется округление (наибольшая сложность, наибольшая точность), то[00030] If rounding is used in (3) and (4) (the greatest complexity, the greatest accuracy), then

iOffset1=1<<(nShift1–1), (7)iOffset1 = 1 << (nShift1–1), (7)

iOffset2=1<<(nShift2–1), (8)iOffset2 = 1 << (nShift2–1), (8)

где a=1<<c обозначает двоичный сдвиг «1» влево на с битов, то есть a=2с.where a = 1 << c denotes the binary shift “1” to the left by s bits, that is, a = 2 s .

[00031] В качестве альтернативы, если в (3) и (4) округление не используется (наименьшая сложность, наименьшая точность), то[00031] Alternatively, if rounding is not used in (3) and (4) (least complexity, least accuracy), then

iOffset1=0, (9)iOffset1 = 0, (9)

iOffset2=0. (10)iOffset2 = 0. (10)

[00032] В качестве альтернативы, если округление используется в (3), но не используется в (4), то[00032] Alternatively, if rounding is used in (3) but not used in (4), then

iOffset1=1<<(nShift1–1), (11)iOffset1 = 1 << (nShift1–1), (11)

iOffset2=0. (12)iOffset2 = 0. (12)

[00033] В качестве альтернативы, если округление используется в (4), но не используется в (3), то[00033] Alternatively, if rounding is used in (4) but not used in (3), then

iOffset1=0, (13)iOffset1 = 0, (13)

iOffset2=1<<(nShift2–1). (14)iOffset2 = 1 << (nShift2–1). (fourteen)

[00034] В одном из иллюстративных вариантов осуществления изобретения, пусть INTERM_BITDEPTH=14, US_FILTER_PREC=6 и INTERNAL_INPUT_BITDEPTH=8, тогда исходя из уравнений (5) и (6), nShift1=0, и nShift2=12. В другом примере при US_FILTER_PREC=6, если INTERN AL_INPUT_BITDEPTH=10, и INTERM_BITDEPTH=14, то nShift1=2, и iOffset1=0 или 2 в зависимости от выбранного режима округления. Кроме того, nShift2=10, и iOffset2=0 или 29 в зависимости от выбранного режима округления.[00034] In one illustrative embodiment of the invention, let INTERM_BITDEPTH = 14, US_FILTER_PREC = 6 and INTERNAL_INPUT_BITDEPTH = 8, then based on equations (5) and (6), nShift1 = 0, and nShift2 = 12. In another example, with US_FILTER_PREC = 6, if INTERN AL_INPUT_BITDEPTH = 10 and INTERM_BITDEPTH = 14, then nShift1 = 2, and iOffset1 = 0 or 2 depending on the selected rounding mode. In addition, nShift2 = 10, and iOffset2 = 0 or 2 9 depending on the selected rounding mode.

[00035] Следует отметить, что при использовании реализации, изображенной в уравнениях (3) и (4), вертикальная фильтрация, за которой следует горизонтальная фильтрация, может приводить к иным результатам, чем горизонтальная фильтрация, за которой следует вертикальная фильтрация, поэтому надлежащую фильтрацию в декодере можно либо фиксировать и предварительно определить для всех декодеров (например, посредством стандарта декодирования или технических условий), либо в некоторых вариантах осуществления изобретения надлежащий порядок можно сигнализировать из кодера в декодер с использованием соответствующего флага в метаданных.[00035] It should be noted that when using the implementation depicted in equations (3) and (4), vertical filtering followed by horizontal filtering can lead to different results than horizontal filtering followed by vertical filtering, therefore proper filtering in the decoder can either be fixed and pre-determined for all decoders (for example, by means of a decoding standard or specifications), or in some embodiments of the invention, the proper order can be to code from the encoder to the decoder using the corresponding flag in the metadata.

[00036] ФИГ. 3 изображает один из примеров процесса повышающей дискретизации данных изображения в соответствии с одним из вариантов осуществления данного изобретения. Вначале (305) кодер или декодер в системе многоуровневого кодирования определяет надлежащий порядок фильтрации (например, горизонтальную фильтрацию, за которой следует вертикальная фильтрация) и параметры масштабирования и округления. В одном из вариантов осуществления изобретения параметры масштабирования и округления можно определить в соответствии с уравнениями (5)—(14) на основе требуемых битовых глубин для промежуточного сохранения (например, INTERM_BITDEPTH), коэффициентов фильтра (например, US_FILTER_PREC) и внутреннего представления ввода (например, INTERNAL_INPUT_BITDEPTH). На этапе 310 данные изображения подвергают повышающей дискретизации в первом направлении (например, горизонтальном). Выходные результаты этой ступени округляют и масштабируют перед промежуточным сохранением с использованием первого параметра сдвига (например, nShift1) и первого параметра округления (например, iOffset1). Затем (315) промежуточные результаты подвергают повышающей дискретизации во втором направлении (например, вертикальном). Выходные результаты этой ступени округляют и масштабируют с использованием второго параметра сдвига (например, nShift2) и второго параметра округления (например, iOffset2). В заключение (320) выходные данные второй ступени подвергают отсечению перед окончательным выводом или сохранением.FIG. 3 depicts one example of an upsampling process of image data in accordance with one embodiment of the present invention. Initially (305), an encoder or decoder in a multi-level coding system determines the proper filtering order (e.g., horizontal filtering followed by vertical filtering) and the scaling and rounding parameters. In one embodiment of the invention, the scaling and rounding parameters can be determined in accordance with equations (5) to (14) based on the required bit depths for intermediate storage (e.g. INTERM_BITDEPTH), filter coefficients (e.g. US_FILTER_PREC) and internal input representation (e.g. , INTERNAL_INPUT_BITDEPTH). At 310, the image data is up-sampled in a first direction (e.g., horizontal). The output from this stage is rounded and scaled before staging using the first shift parameter (e.g., nShift1) and the first rounding parameter (e.g., iOffset1). Then (315) the intermediate results are up-sampled in a second direction (e.g., vertical). The output from this stage is rounded and scaled using a second shift parameter (e.g. nShift2) and a second round parameter (e.g. iOffset2). In conclusion (320), the output of the second stage is cut off before final output or storage.

[00037] Способы, описанные в настоящем документе, также могут быть применимы к другим приложениям формирования изображений, которые используют раздельную фильтрацию данных изображения с высокой битовой глубиной, таким, как понижающая дискретизация, фильтрация шума или преобразования в частотной области.[00037] The methods described herein may also be applicable to other imaging applications that use separate filtering of image data with a high bit depth, such as downsampling, noise filtering, or frequency domain transform.

Иллюстративное воплощение компьютерной системыIllustrative embodiment of a computer system

[00038] Варианты осуществления настоящего изобретения можно реализовать в компьютерной системе, системах, сконфигурированных на электронной схеме и компонентах, интегральном микросхемном (IC) устройстве, таком как микроконтроллер, вентильная матрица с эксплуатационным программированием (FPGA) или другое конфигурируемое или программируемое логическое устройство (PLD), в процессоре с дискретным временем или процессоре цифровой обработки сигналов (DSP), специализированной интегральной микросхеме (ASIC) и/или в устройстве, содержащем одну или несколько таких систем, устройств или компонентов. Компьютер и/или IC может выполнять, контролировать или исполнять команды, относящиеся к описанной в настоящем документе высокоточной повышающей дискретизации. Компьютер и/или IC может вычислять любой из множества параметров или значений, относящихся к описанной в настоящем документе высокоточной повышающей дискретизации. Варианты осуществления кодирования и декодирования можно реализовать как аппаратное обеспечение, программное обеспечение, программно-аппаратное обеспечение и различные их сочетания.[00038] Embodiments of the present invention can be implemented in a computer system, systems configured on an electronic circuit and components, an integrated microcircuit (IC) device, such as a microcontroller, field programmable gate array (FPGA), or other configurable or programmable logic device (PLD) ), in a discrete-time processor or digital signal processor (DSP), a specialized integrated circuit (ASIC) and / or in a device containing one or several ko such systems, devices or components. The computer and / or IC may execute, monitor, or execute instructions related to high-precision upsampling described herein. The computer and / or IC may calculate any of a variety of parameters or values related to the high-precision upsampling described herein. Embodiments of encoding and decoding can be implemented as hardware, software, firmware and various combinations thereof.

[00039] Некоторые реализации изобретения включают компьютерные процессоры, исполняющие команды программного обеспечения, которые вызывают выполнение процессором способа изобретения. Например, способы, относящиеся к вышеописанной высокоточной повышающей дискретизации, могут быть реализованы одним или несколькими процессорами дисплея, кодера, телевизионной приставки, преобразователя кода и т.п. путем исполнения ими команд программного обеспечения, доступных для этих процессоров. Изобретение также может быть предусмотрено в форме программного продукта. Этот программный продукт может включать любой носитель данных, несущий набор машиночитаемых сигналов, содержащих команды, которые при их исполнении процессором данных вызывают исполнение этим процессором данных способа изобретения. Программные продукты в соответствии с изобретением могут находиться в любой из широкого разнообразия форм. Этот программный продукт может включать, например, физические носители данных, такие как магнитные носители данных, в том числе дискеты, жесткие диски, оптические носители данных, в том числе диски CD ROM, диски DVD, электронные носители данных, в том числе запоминающие устройства ROM, флэш-память RAM и т.п. Машиночитаемые сигналы в программном продукте могут, необязательно, быть сжатыми или зашифрованными.[00039] Some implementations of the invention include computer processors executing software instructions that cause the processor to execute a method of the invention. For example, methods related to the above-described high-precision upsampling may be implemented by one or more display processors, an encoder, a set-top box, a code converter, and the like. by executing the software instructions available for these processors. The invention may also be provided in the form of a software product. This software product may include any storage medium that carries a set of computer-readable signals containing instructions that, when executed by a data processor, cause the processor to execute the data of the method of the invention. Software products in accordance with the invention may be in any of a wide variety of forms. This software product may include, for example, physical storage media, such as magnetic storage media, including floppy disks, hard drives, optical storage media, including CD ROMs, DVDs, electronic storage media, including ROM storage devices , flash memory RAM, etc. Machine-readable signals in a software product may optionally be compressed or encrypted.

[00040] Там, где выше упоминается компонент (например, модуль программного обеспечения, процессор, компоновочный узел, устройство, схема и т.д.), если не указано иное, ссылку на этот компонент (в том числе ссылку на «средства») следует истолковывать как включающую в качестве эквивалентов этого компонента, любой компонент, выполняющий функцию описываемого компонента (например, являющийся функционально эквивалентным), в том числе компоненты, не являющиеся конструктивно эквивалентными раскрываемой конструкции, выполняющие эту функцию в проиллюстрированных иллюстративных вариантах осуществления изобретения.[00040] Where a component is mentioned above (for example, a software module, processor, assembly, device, circuit, etc.), unless otherwise indicated, a link to this component (including a link to "tools") should be construed as including, as equivalents to this component, any component that performs the function of the described component (for example, which is functionally equivalent), including components that are not structurally equivalent to the disclosed structure, that perform this function in detail Update illustrative embodiments.

Эквиваленты, расширения, альтернативы и прочееEquivalents, extensions, alternatives and more

[00041] Таким образом, описаны иллюстративные варианты осуществления изобретения, относящиеся к высокоточной повышающей дискретизации при масштабируемом кодировании видеоизображений с высокой битовой глубиной. В предшествующем описании варианты осуществления настоящего изобретения были описаны со ссылкой на многочисленные конкретные подробности, которые могут изменяться от реализации к реализации. Поэтому единственным и исключительным указателем того, что представляет собой изобретение, является набор, изложенный в формуле изобретения, вытекающей из данной заявки, в той конкретной форме, в которой вытекает эта формула изобретения, включая любую последующую правку. Любые определения, в прямой форме изложенные в настоящем документе для терминов, содержащихся в указанной формуле изобретения, должны иметь преимущественную силу значений этих терминов, используемых в формуле изобретения. Таким образом, никакое ограничение, элемент, свойство, характерный признак, преимущество или атрибут, не изложенный в прямой форме в формуле изобретения, никоим образом не должен ограничивать объем этой формулы изобретения. Соответственно, описание и графические материалы следует рассматривать в иллюстративном, а не в ограничивающем смысле.[00041] Thus, illustrative embodiments of the invention are described with respect to high-precision upsampling for scalable encoding of high bit depth video images. In the foregoing description, embodiments of the present invention have been described with reference to numerous specific details that may vary from implementation to implementation. Therefore, the only and exclusive indicator of what constitutes an invention is the kit set forth in the claims arising from this application, in the specific form in which the claims follow, including any subsequent revision. Any definitions expressly set forth herein for terms contained in a specified claims should take precedence over the meanings of these terms used in the claims. Thus, no limitation, element, property, characteristic, advantage or attribute, not expressly stated in the claims, should in no way limit the scope of this claims. Accordingly, the description and graphic materials should be considered in an illustrative and not in a limiting sense.

Источники информацииInformation sources

[1] B. Bross, W.-J. Han, G. J. Sullivan, J.-R. Ohm, and T. Wiegand, «High efficiency video coding (HEVC) text specification draft 9», ITU-T/ISO/IEC Joint Collaborative Team on Video Coding (JCT-VC) document JCTVC-K1003, Oct. 2012.  [1] B. Bross, W.-J. Han, G. J. Sullivan, J.-R. Ohm, and T. Wiegand, “High efficiency video coding (HEVC) text specification draft 9”, ITU-T / ISO / IEC Joint Collaborative Team on Video Coding (JCT-VC) document JCTVC-K1003, Oct. 2012.

[2] ITU-T and ISO/IEC JTC 1, «Advanced Video Coding for generic audio-visual services», ITU T Rec. H.264 and ISO/IEC 14496-10 (AVC).[2] ITU-T and ISO / IEC JTC 1, “Advanced Video Coding for generic audio-visual services”, ITU T Rec. H.264 and ISO / IEC 14496-10 (AVC).

[3] SMuCO.1.1 software for SHVC (scalable extension of HEVC): https:/hevc.hhi.fraunhofer.de/svn/'svn_SMuCSoftware/tags/0.1.1/. [3] SMuCO.1.1 software for SHVC (scalable extension of HEVC): https: /hevc.hhi.fraunhofer.de/svn/'svn_SMuCSoftware/tags/0.1.1/.

Claims (29)

1. В системе масштабируемых видеоизображений способ повышающей дискретизации данных изображения c первого уровня на второй уровень, где способ включает:1. In a scalable video image system, a method of upsampling image data from a first level to a second level, where the method includes: определение процессором параметров масштабирования и округления в ответ на требования системы масштабируемых видеоизображений к битовой глубине, при этом требования системы масштабируемых видеоизображений к битовой глубине включают промежуточные значения битовой глубины, битовую глубину внутреннего ввода и битовую глубину точности коэффициентов фильтрации;determination by the processor of scaling and rounding parameters in response to the requirements of the system of scalable video images to the bit depth, while the requirements of the system of scalable video images to the bit depth include intermediate values of the bit depth, the bit depth of the internal input and the bit depth of the accuracy of the filter coefficients; генерирование первых данных с повышенной дискретизацией путем фильтрации данных изображения с первого уровня, при этом эту фильтрацию данных изображения выполняют по первому пространственному направлению с использованием первого параметра округления;generating first upsampling data by filtering image data from a first level, wherein this filtering of image data is performed in a first spatial direction using a first rounding parameter; генерирование первых промежуточных данных путем масштабирования первых данных с повышенной дискретизацией посредством первого параметра сдвига;generating first intermediate data by scaling the first upsampled data by the first shift parameter; генерирование вторых данных с повышенной дискретизацией путем фильтрации первых промежуточных данных, при этом фильтрацию первых промежуточных данных выполняют по второму пространственному направлению с использованием второго параметра округления;generating second data with increased sampling by filtering the first intermediate data, while filtering the first intermediate data in a second spatial direction using a second rounding parameter; генерирование вторых промежуточных данных путем масштабирования вторых данных с повышенной дискретизацией посредством второго параметра сдвига иgenerating second intermediate data by scaling the second upsampled data by the second shift parameter and генерирование выходных данных с повышенной дискретизацией для второго уровня путем подвергания отсечению вторых промежуточных данных, generating discretized output data for a second layer by clipping the second intermediate data, при этом определение первого параметра сдвига включает сложение данных битовой глубины для битовой глубины внутреннего ввода с битовой глубиной точности коэффициентов фильтрации и вычитание из их суммы промежуточных значений битовой глубины, при этом определение второго параметра сдвига включает вычитание первого параметра сдвига из удвоенной битовой глубины точности коэффициентов фильтрации.the determination of the first shift parameter includes adding the bit depth data for the bit depth of the internal input with the bit depth of the filter coefficient accuracy and subtracting the intermediate bit depth values from their sum, while determining the second shift parameter involves subtracting the first shift parameter from the doubled bit depth of the filter coefficient accuracy . 2. Способ по п. 1, в котором система масштабируемых видеоизображений содержит кодер видеоизображений.2. The method of claim 1, wherein the scalable video image system comprises a video image encoder. 3. Способ по п. 1, в котором система масштабируемых видеоизображений содержит декодер видеоизображений.3. The method of claim 1, wherein the scalable video image system comprises a video image decoder. 4. Способ по п. 1, в котором определение первого и второго параметров округления включает вычисление4. The method of claim 1, wherein determining the first and second rounding parameters includes calculating iOffset1=1<<(nShift1–1) иiOffset1 = 1 << (nShift1–1) and iOffset2=1<<(nShift2–1), iOffset2 = 1 << (nShift2–1), при этом iOffset1 — это первый параметр округления, iOffset2 — второй параметр округления, nShift1 — первый параметр сдвига и nShift2 — второй параметр сдвига.iOffset1 is the first rounding parameter, iOffset2 is the second rounding parameter, nShift1 is the first shift parameter and nShift2 is the second shift parameter. 5. Способ по п. 1, в котором первый и второй параметры округления определяют как равные нулю.5. The method of claim 1, wherein the first and second rounding parameters are determined to be zero. 6. Способ по п. 1, в котором определение первого и второго параметров округления включает вычисление6. The method of claim 1, wherein determining the first and second rounding parameters includes calculating iOffset1=1<<(nShift1–1) и iOffset1 = 1 << (nShift1–1) and iOffset2=0, iOffset2 = 0, при этом iOffset1 — это первый параметр округления, iOffset2 — второй параметр округления и nShift1 — первый параметр сдвига.iOffset1 is the first rounding parameter, iOffset2 is the second rounding parameter and nShift1 is the first shift parameter. 7. Способ по п. 1, в котором определение первого и второго параметров округления включает вычисление7. The method of claim 1, wherein determining the first and second rounding parameters includes calculating iOffset1=0, и iOffset1 = 0, and iOffset2=1<<(nShift2–1), iOffset2 = 1 << (nShift2–1), при этом iOffset1 — это первый параметр округления, iOffset2 — второй параметр округления и nShift2 — второй параметр сдвига.iOffset1 is the first rounding parameter, iOffset2 is the second rounding parameter and nShift2 is the second shift parameter. 8. Способ по п. 1, в котором первое пространственное направление представляет собой горизонтальное направление, а второе пространственное направление представляет собой вертикальное направление.8. The method of claim 1, wherein the first spatial direction is a horizontal direction and the second spatial direction is a vertical direction. 9. Способ по п. 1, в котором первое пространственное направление представляет собой вертикальное направление, а второе пространственное направление представляет собой горизонтальное направление.9. The method of claim 1, wherein the first spatial direction is a vertical direction and the second spatial direction is a horizontal direction. 10. Способ по п. 1, в котором первое пространственное направление является фиксированным и предварительно определенным техническими условиями стандарта декодирования видеоизображений.10. The method according to p. 1, in which the first spatial direction is a fixed and predefined technical conditions of the standard for decoding video images. 11. Способ по п. 1, в котором первое пространственное направление определяется кодером и сообщается кодером декодеру.11. The method of claim 1, wherein the first spatial direction is determined by the encoder and communicated by the encoder to the decoder. 12. Устройство, содержащее процессор и сконфигурированное для выполнения способа, изложенного в п. 1.12. A device comprising a processor and configured to perform the method described in paragraph 1. 13. Непреходящий машиночитаемый носитель данных, содержащий хранящиеся на нем машиночитаемые команды для исполнения способа по п. 1.13. A non-transitory computer-readable storage medium containing computer-readable instructions stored thereon for executing a method according to claim 1.
RU2015123238A 2012-12-21 2013-12-04 High-precision upsampling with scalable coding of video images with high bit depth RU2610589C2 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261745050P 2012-12-21 2012-12-21
US61/745,050 2012-12-21
PCT/US2013/073006 WO2014099370A1 (en) 2012-12-21 2013-12-04 High precision up-sampling in scalable coding of high bit-depth video

Related Child Applications (1)

Application Number Title Priority Date Filing Date
RU2017102758A Division RU2017102758A (en) 2012-12-21 2013-12-04 HIGH-PRECISION INCREASING DISCRETIZATION FOR SCALABLE ENCRYPTION VIDEO IMAGES WITH HIGH BIT DEPTH

Publications (2)

Publication Number Publication Date
RU2015123238A RU2015123238A (en) 2017-01-10
RU2610589C2 true RU2610589C2 (en) 2017-02-13

Family

ID=50031497

Family Applications (4)

Application Number Title Priority Date Filing Date
RU2015123238A RU2610589C2 (en) 2012-12-21 2013-12-04 High-precision upsampling with scalable coding of video images with high bit depth
RU2017102758A RU2017102758A (en) 2012-12-21 2013-12-04 HIGH-PRECISION INCREASING DISCRETIZATION FOR SCALABLE ENCRYPTION VIDEO IMAGES WITH HIGH BIT DEPTH
RU2019135853A RU2718159C1 (en) 2012-12-21 2019-11-08 High-precision upsampling under scalable encoding video images with high bit depth
RU2020110114A RU2728738C1 (en) 2012-12-21 2020-03-11 High-precision upsampling under scalable encoding video images with high bit depth

Family Applications After (3)

Application Number Title Priority Date Filing Date
RU2017102758A RU2017102758A (en) 2012-12-21 2013-12-04 HIGH-PRECISION INCREASING DISCRETIZATION FOR SCALABLE ENCRYPTION VIDEO IMAGES WITH HIGH BIT DEPTH
RU2019135853A RU2718159C1 (en) 2012-12-21 2019-11-08 High-precision upsampling under scalable encoding video images with high bit depth
RU2020110114A RU2728738C1 (en) 2012-12-21 2020-03-11 High-precision upsampling under scalable encoding video images with high bit depth

Country Status (12)

Country Link
US (6) US10165288B2 (en)
EP (2) EP2936820B1 (en)
JP (2) JP6034983B2 (en)
KR (4) KR101985647B1 (en)
CN (3) CN108055542B (en)
BR (2) BR112015014277B1 (en)
HK (1) HK1208577A1 (en)
IN (1) IN2015MN01331A (en)
MY (2) MY181150A (en)
RU (4) RU2610589C2 (en)
TW (3) TWI618397B (en)
WO (1) WO2014099370A1 (en)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI720543B (en) 2012-08-06 2021-03-01 美商Vid衡器股份有限公司 Method, device, system and non-transitory computer readable medium for multi-layer video coding and decoding
PL2941872T3 (en) * 2013-01-02 2019-03-29 Dolby Laboratories Licensing Corporation Backward-compatible coding for ultra high definition video signals with enhanced dynamic range
US9497473B2 (en) * 2013-10-03 2016-11-15 Qualcomm Incorporated High precision explicit weighted prediction for video coding
CN110708439A (en) * 2014-06-26 2020-01-17 松下知识产权经营株式会社 Display device and data output method
RU2661309C1 (en) * 2015-02-17 2018-07-13 Долби Лэборетериз Лайсенсинг Корпорейшн Interline prediction for signals with an improved dynamic range
US10257524B2 (en) * 2015-07-01 2019-04-09 Mediatek Inc. Residual up-sampling apparatus for performing transform block up-sampling and residual down-sampling apparatus for performing transform block down-sampling
EP3329676B1 (en) 2015-07-28 2020-07-29 Dolby Laboratories Licensing Corporation Sdr bit depth enhancement via codeword range amplification in a codec with inverse display management
WO2018212509A1 (en) 2017-05-15 2018-11-22 Samsung Electronics Co., Ltd. Method and apparatus for control resource set configuration and monitoring of downlink control channel in wireless communication system
US10609372B2 (en) * 2017-09-29 2020-03-31 Dolby Laboratories Licensing Corporation Up-conversion to content adaptive perceptual quantization video signals
US20200322656A1 (en) * 2019-04-02 2020-10-08 Nbcuniversal Media, Llc Systems and methods for fast channel changing
US11375219B2 (en) * 2019-09-24 2022-06-28 Tencent America LLC Coding method and system with improved dynamic internal bit depth
US11082473B1 (en) * 2020-03-15 2021-08-03 Tfi Digital Media Limited Method for complexity reduction in video coding by coding parameters reuse

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070160153A1 (en) * 2006-01-06 2007-07-12 Microsoft Corporation Resampling and picture resizing operations for multi-resolution video coding and decoding
RU2337503C1 (en) * 2004-10-18 2008-10-27 Самсунг Электроникс Ко., Лтд. Methods of coding and decoding video image using interlayer filtration, and video coder and decoder using methods
WO2010027634A2 (en) * 2008-08-25 2010-03-11 Microsoft Corporation Conversion operations in scalable video encoding and decoding
US7961963B2 (en) * 2005-03-18 2011-06-14 Sharp Laboratories Of America, Inc. Methods and systems for extended spatial scalability with picture-level adaptation
WO2012048052A1 (en) * 2010-10-05 2012-04-12 General Instrument Corporation Method and apparatus for feature based video coding

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7227895B1 (en) * 2000-12-12 2007-06-05 Sony Corporation System and method for generating decoded digital video image data
US7929610B2 (en) * 2001-03-26 2011-04-19 Sharp Kabushiki Kaisha Methods and systems for reducing blocking artifacts with reduced complexity for spatially-scalable video coding
WO2002089046A1 (en) * 2001-04-26 2002-11-07 Georgia Tech Research Corporation Video enhancement using multiple frame techniques
US7305034B2 (en) * 2002-04-10 2007-12-04 Microsoft Corporation Rounding control for multi-stage interpolation
US7620109B2 (en) * 2002-04-10 2009-11-17 Microsoft Corporation Sub-pixel interpolation in motion estimation and compensation
NO319629B1 (en) * 2003-11-28 2005-09-05 Tandberg Telecom As Procedure for correcting interpolated pixel values
US7379587B2 (en) * 2004-02-12 2008-05-27 Xerox Corporation Systems and methods for identifying regions within an image having similar continuity values
US8175168B2 (en) * 2005-03-18 2012-05-08 Sharp Laboratories Of America, Inc. Methods and systems for picture up-sampling
US8150684B2 (en) * 2005-06-29 2012-04-03 Panasonic Corporation Scalable decoder preventing signal degradation and lost data interpolation method
US7561478B2 (en) 2005-06-30 2009-07-14 Seiko Epson Corporation Integrated circuit device and electronic instrument
JP2007028393A (en) * 2005-07-20 2007-02-01 Matsushita Electric Ind Co Ltd Method for calculating motion vector of direct mode block in bidirectionally predictive coded picture
KR100718135B1 (en) * 2005-08-24 2007-05-14 삼성전자주식회사 apparatus and method for video prediction for multi-formet codec and the video encoding/decoding apparatus and method thereof.
CN101568036A (en) * 2005-10-11 2009-10-28 华为技术有限公司 Up-sampling method and system for spatial scalable coding video images
US8948260B2 (en) 2005-10-17 2015-02-03 Qualcomm Incorporated Adaptive GOP structure in video streaming
WO2007080477A2 (en) * 2006-01-10 2007-07-19 Nokia Corporation Switched filter up-sampling mechanism for scalable video coding
US8880571B2 (en) * 2006-05-05 2014-11-04 Microsoft Corporation High dynamic range data format conversions for digital media
CN101507282B (en) * 2006-07-10 2012-06-27 夏普株式会社 Methods and systems for combining layers in a multi-layer bitstream
US8774269B2 (en) * 2006-10-25 2014-07-08 Franuhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Quality scalable coding with mapping different ranges of bit depths
US20080101467A1 (en) * 2006-10-27 2008-05-01 Radiospire Networks, Inc. Method and system for secure and efficient wireless transmission of HDCP-encrypted HDMI/DVI signals
KR20080067922A (en) * 2007-01-17 2008-07-22 삼성전자주식회사 Method and apparatus for decoding video with image scale-down function
US8107571B2 (en) * 2007-03-20 2012-01-31 Microsoft Corporation Parameterized filters and signaling techniques
ATE484155T1 (en) * 2007-06-29 2010-10-15 Fraunhofer Ges Forschung SCALABLE VIDEO CODING THAT SUPPORTS PIXEL VALUE REFINEMENT SCALABILITY
DK2835976T3 (en) * 2008-04-16 2016-12-05 Ge Video Compression Llc Bit depth scalability
TWI383684B (en) 2008-11-18 2013-01-21 Univ Nat Taiwan System and method for dynamic video encoding in multimedia streaming
US9681142B2 (en) * 2009-02-03 2017-06-13 Thomson Licensing Dtv Methods and apparatus for motion compensation with smooth reference frame in bit depth scalability
CN101827264A (en) * 2009-03-06 2010-09-08 刘永 Hierarchical self-adaptive video frame sampling method
US9112618B2 (en) 2009-07-02 2015-08-18 Qualcomm Incorporated Coding latency reductions during transmitter quieting
US9161057B2 (en) * 2009-07-09 2015-10-13 Qualcomm Incorporated Non-zero rounding and prediction mode selection techniques in video encoding
TW201119396A (en) 2009-11-24 2011-06-01 Hon Hai Prec Ind Co Ltd Multi-standard video decoding system and method
US8908758B2 (en) * 2010-01-06 2014-12-09 Dolby Laboratories Licensing Corporation High performance rate control for multi-layered video coding applications
EP2559239A2 (en) * 2010-04-13 2013-02-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for intra predicting a block, apparatus for reconstructing a block of a picture, apparatus for reconstructing a block of a picture by intra prediction
US9185422B2 (en) 2010-07-15 2015-11-10 Qualcomm Incorporated Variable localized bit-depth increase for fixed-point transforms in video coding
US9532059B2 (en) * 2010-10-05 2016-12-27 Google Technology Holdings LLC Method and apparatus for spatial scalability for video coding
US8880573B2 (en) * 2010-10-12 2014-11-04 Dolby Laboratories Licensing Corporation System and method of dynamic precision operations
US9137539B2 (en) * 2010-12-22 2015-09-15 Panasonic Corporation Image coding apparatus, image decoding apparatus, image coding method, and image decoding method
CN106851319B (en) * 2011-06-10 2020-06-19 寰发股份有限公司 Derivation method and derivation device
TW201309036A (en) * 2011-06-28 2013-02-16 Samsung Electronics Co Ltd Method and apparatus for predicting chrominance component image using luminance component image
US9055304B2 (en) * 2011-07-01 2015-06-09 Qualcomm Incorporated Reduced resolution pixel interpolation
US10616581B2 (en) * 2012-01-19 2020-04-07 Huawei Technologies Co., Ltd. Modified coding for a transform skipped block for CABAC in HEVC
WO2013174254A1 (en) * 2012-05-21 2013-11-28 Mediatek Singapore Pte. Ltd. Method and apparatus of inter-layer filtering for scalable video coding
US9420280B2 (en) * 2012-06-08 2016-08-16 Qualcomm Incorporated Adaptive upsampling filters
CN102740078B (en) * 2012-07-12 2014-10-22 北方工业大学 Adaptive spatial scalable coding based on HEVC (high efficiency video coding) standard
BR112015000713A2 (en) 2012-07-16 2017-08-08 Formulatrix Inc fluid delivery systems, egg injection equipment, fluid pump and method of fluid delivery to plurality of delivery locations

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2337503C1 (en) * 2004-10-18 2008-10-27 Самсунг Электроникс Ко., Лтд. Methods of coding and decoding video image using interlayer filtration, and video coder and decoder using methods
US7961963B2 (en) * 2005-03-18 2011-06-14 Sharp Laboratories Of America, Inc. Methods and systems for extended spatial scalability with picture-level adaptation
US20070160153A1 (en) * 2006-01-06 2007-07-12 Microsoft Corporation Resampling and picture resizing operations for multi-resolution video coding and decoding
WO2010027634A2 (en) * 2008-08-25 2010-03-11 Microsoft Corporation Conversion operations in scalable video encoding and decoding
WO2012048052A1 (en) * 2010-10-05 2012-04-12 General Instrument Corporation Method and apparatus for feature based video coding

Also Published As

Publication number Publication date
RU2017102758A (en) 2018-12-20
US11570455B2 (en) 2023-01-31
US20230164335A1 (en) 2023-05-25
US20200021825A1 (en) 2020-01-16
BR112015014277A2 (en) 2017-07-11
BR122017002044A2 (en) 2019-09-03
KR101985647B1 (en) 2019-06-04
US10958922B2 (en) 2021-03-23
CN108055543A (en) 2018-05-18
US10165288B2 (en) 2018-12-25
JP2016507947A (en) 2016-03-10
WO2014099370A1 (en) 2014-06-26
HK1208577A1 (en) 2016-03-04
RU2015123238A (en) 2017-01-10
US11792416B2 (en) 2023-10-17
MY202235A (en) 2024-04-18
EP2936820B1 (en) 2020-07-15
TW201433148A (en) 2014-08-16
RU2728738C1 (en) 2020-07-30
EP2936820A1 (en) 2015-10-28
RU2718159C1 (en) 2020-03-30
IN2015MN01331A (en) 2015-08-14
US10516889B2 (en) 2019-12-24
TW201608873A (en) 2016-03-01
KR20190052165A (en) 2019-05-15
JP2017028713A (en) 2017-02-02
JP6034983B2 (en) 2016-11-30
EP3734975A1 (en) 2020-11-04
TWI521946B (en) 2016-02-11
BR112015014277B1 (en) 2022-12-13
TWI597968B (en) 2017-09-01
US20190058892A1 (en) 2019-02-21
US20210281866A1 (en) 2021-09-09
KR20150090148A (en) 2015-08-05
TW201731291A (en) 2017-09-01
US20150350661A1 (en) 2015-12-03
CN108055543B (en) 2021-08-17
BR122017002044B1 (en) 2022-12-20
JP6272419B2 (en) 2018-01-31
CN104871545B (en) 2018-02-23
KR20160110546A (en) 2016-09-21
KR20170060185A (en) 2017-05-31
KR101694139B1 (en) 2017-01-10
KR102052876B1 (en) 2019-12-09
US11284095B2 (en) 2022-03-22
MY181150A (en) 2020-12-19
US20220174297A1 (en) 2022-06-02
TWI618397B (en) 2018-03-11
CN104871545A (en) 2015-08-26
CN108055542B (en) 2021-08-13
CN108055542A (en) 2018-05-18

Similar Documents

Publication Publication Date Title
RU2718159C1 (en) High-precision upsampling under scalable encoding video images with high bit depth
CN106713912B (en) Method and apparatus for backward compatible encoding and decoding of video signals