RU2644065C1 - Декомпозиция уровней в иерархическом кодировании vdr - Google Patents

Декомпозиция уровней в иерархическом кодировании vdr Download PDF

Info

Publication number
RU2644065C1
RU2644065C1 RU2016112589A RU2016112589A RU2644065C1 RU 2644065 C1 RU2644065 C1 RU 2644065C1 RU 2016112589 A RU2016112589 A RU 2016112589A RU 2016112589 A RU2016112589 A RU 2016112589A RU 2644065 C1 RU2644065 C1 RU 2644065C1
Authority
RU
Russia
Prior art keywords
image
quantization
vdr
input
image data
Prior art date
Application number
RU2016112589A
Other languages
English (en)
Other versions
RU2644065C9 (ru
Inventor
Гань-Мин СУ
Шэн ЦЮЙ
Самир Н. ХУЛЬЯЛКАР
Тао ЧЭНЬ
Уолтер С. ГИШ
Хьюберт КЁПФЕР
Original Assignee
Долби Лабораторис Лайсэнзин Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Долби Лабораторис Лайсэнзин Корпорейшн filed Critical Долби Лабораторис Лайсэнзин Корпорейшн
Publication of RU2644065C1 publication Critical patent/RU2644065C1/ru
Application granted granted Critical
Publication of RU2644065C9 publication Critical patent/RU2644065C9/ru

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/98Adaptive-dynamic-range coding [ADRC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

Изобретение относится к вычислительной технике. Технический результат заключается в минимизации объема данных изображения с визуальным динамическим диапазоном (VDR), которые подлежат переносу на уровнях расширения. Способ кодирования включает прием входного VDR-изображения в последовательности входных изображений, где входное VDR-изображение содержит первую битовую глубину; выбор конкретной функции усовершенствованного квантования из одной или нескольких доступных функций усовершенствованного квантования, выбранных из глобального квантования, линейного квантования, линейного растяжения, квантования на основе кривой, квантования, оптимизированного функцией плотности вероятности (Pdf), квантования Ллойда-Макса, квантования на основе разделов, перцептивного квантования, векторного квантования; применение функции усовершенствованного квантования к входному VDR-изображению для генерирования входного изображения базового уровня, где входное изображение базового уровня содержит вторую битовую глубину, которая является меньшей, чем первая битовая глубина; сжатие данных изображения, полученных из входного изображения базового уровня, в видеосигнал базового уровня (BL); и сжатие по меньшей мере части данных изображения, полученных из входного VDR-изображения, в один или несколько видеосигналов уровня расширения (EL). 8 н. и 29 з.п. ф-лы, 9 ил.

Description

ПЕРЕКРЕСТНАЯ ССЫЛКА НА РОДСТВЕННЫЕ ЗАЯВКИ
[0001] Данная заявка заявляет приоритет предварительной заявки на патент США №61/555978, поданной 4 ноября 2011 г., и предварительной заявки на патент США №61/596600, поданной 8 февраля 2012 г., которые обе полностью включаются в настоящее раскрытие посредством ссылки.
ОБЛАСТЬ ТЕХНИКИ
[0002] Настоящее изобретение, в общем, относится к обработке изображений и, в частности, к кодированию, декодированию и представлению изображений с переменным динамическим диапазоном с использованием иерархического кодека VDR.
ПРЕДПОСЫЛКИ
[0003] Дисплейные технологии, разрабатываемые компанией Dolby Laboratories, Inc., и другими, способны воспроизводить изображения, имеющие расширенный динамический диапазон (HDR). Такие дисплеи могут воспроизводить изображения, которые более верно представляют сцены реального мира, чем традиционные дисплеи.
[0004] Для поддержки обратной совместимости, а также новых технологий HDR-дисплеев, при доставке видеоданных из устройства в восходящем направлении, такого, как многоуровневый видеокодер, к устройствам в нисходящем направлении может использоваться несколько уровней. Видеоданные со стандартным динамическим диапазоном (SDR), переносимые в базовом уровне (BL) из нескольких уровней, являются оптимизированными для режима просмотра на SDR-дисплеях, в то время как видеоданные с визуальным динамическим диапазоном (VDR), переносимые в комбинации базового уровня и уровня расширения (EL) из нескольких уровней, поддерживают режим просмотра VDR-дисплеев, имеющих более широкие динамические диапазоны, чем таковые для SDR-дисплеев. В том смысле, как они используются в настоящем раскрытии, кодеки, вовлеченные в кодирование и декодирование данных таких изображений, обозначаются как кодеки VDR, оптимизированные для SDR-дисплеев.
[0005] Данные изображения BL могут включать SDR-изображения с меньшей битовой глубиной (например, 8 битов на цветовую составляющую), полученные из исходных HDR-изображений с большей битовой глубиной (например, 12 или более битов на цветовую составляющую) из ввода данных изображения. SDR-изображения, кодированные в данных изображения BL, как правило, содержат корректуры цвета, выполняемые художниками-колористами для того, чтобы сделать SDR-изображения выглядящими как можно более реалистично в пределах относительно узкого, или стандартного, динамического диапазона. Например, информация цветовых тонов, относящаяся к некоторым или ко всем пикселам на входном HDR-изображении, может изменяться или корректироваться на SDR-изображении с целью создания реалистично выглядящего изображения в пределах стандартного динамического диапазона. Указанные корректуры цвета приводят к асимметричным отсечениям в различных цветовых каналах и вносят рукотворные изменения цвета, особенно, в относительно недодержанных или передержанных областях исходных HDR-изображений. SDR-изображение с корректурами цвета может позволять SDR-дисплеям демонстрировать детали изображения в темных областях и наиболее ярких участках исходного HDR-изображения.
[0006] Отсечение представляет собой один из типов изменения цвета, который изменяет/модифицирует значения пикселов за пределами границ в цветовых каналах так, чтобы результирующие значения пикселов находились в пределах целевого представляемого диапазона (который может находиться в пределах диапазона, поддерживаемого конкретным типом SDR-дисплеев, или в пределах диапазона, поддерживаемого каким-либо диапазоном SDR-дисплеев, или в пределах диапазона, поддерживаемого диапазоном VDR-дисплеев и т.д.). Отсечение может проявляться в нуле, одном или нескольких цветовых каналах (например, значения пикселов R, G и B в цветовом пространстве RGB в некоторой части HDR-изображения могут являться отсеченными на тонально отображенном изображении). Величины отсечения могут изменяться или могут не изменяться для цветовых каналов (например, большее отсечение - для зеленого, меньшее отсечение - для синего и т.д.).
[0007] Корректуры цвета, такие как отсечение, вносимые в SDR-изображения заставляют SDR-изображения содержать разное содержимое независимого происхождения из эквивалентных им VDR-изображений, и устройству в нисходящем направлении трудно или даже невозможно устранить их с целью реконструкции изображений с расширенным динамическим диапазоном без сложной обработки данных и без достаточно высокой битовой скорости передачи данных. Когда для передачи данных устройству в нисходящем направлении используется несколько уровней, обращение корректур цвета может потребовать передачи устройству в нисходящем направлении большого объема дополнительных данных изображения, например, на уровне расширения.
[0008] Подходы, описываемые в данном разделе, представляют собой подходы, который могут осуществляться, но необязательно являются подходами, которые были сформулированы или осуществлены ранее. Поэтому, если не указано иное, не следует полагать, что любой из подходов, описываемых в данном разделе, квалифицируется как известный уровень техники единственно в силу его включения в данный раздел. Аналогично, проблемы, распознаваемые в отношении одного или нескольких подходов, не следует полагать признанными на известном уровне техники на основе данного раздела, если не указано иное.
КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВ
[0009] Настоящее изобретение проиллюстрировано на примере, но не в качестве ограничения на фигурах сопроводительных графических материалов, на которых похожие ссылочные позиции относятся к сходным элементам, и на которых:
[00010] ФИГ. 1 иллюстрирует архитектуру кодека визуального динамического диапазона в базовом профиле в соответствии примерным вариантом осуществления;
[0010] ФИГ. 2 иллюстрирует архитектуру кодека визуального динамического диапазона в основном профиле в соответствии с примерным вариантом осуществления;
[0011] ФИГ. 3 иллюстрирует адаптирующееся к сцене квантование корректировки динамического диапазона, которое применяется в цветовом пространстве YCbCr, в соответствии с примерным вариантом осуществления;
[0012] ФИГ. 4А и ФИГ. 4B иллюстрируют примеры последовательностей операций процессов в соответствии с примерными вариантами осуществления настоящего изобретения;
[0013] ФИГ. 5 иллюстрирует примерную аппаратную платформу, на которой может быть реализован компьютер или вычислительное устройство, описываемое в настоящем раскрытии, согласно варианту осуществления настоящего изобретения; и
[0014] ФИГ. 6 иллюстрирует пример последовательности процесса обнаружения переходных последовательностей и выбора между двумя схемами квантования согласно одному варианту осуществления настоящего изобретения.
ОПИСАНИЕ ПРИМЕРНЫХ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ
[0015] В настоящем раскрытии описываются примерные варианты осуществления, которые относятся к кодированию, декодированию и представлению изображений с переменным динамическим диапазоном с использованием иерархического кодека VDR. В нижеследующем описании с целью разъяснения многочисленные конкретные подробности излагаются для того, чтобы обеспечить исчерпывающее понимание настоящего изобретения. Однако будет очевидно, что настоящее изобретение может применяться на практике без этих конкретных подробностей. В других случаях, хорошо известные конструкции и устройства не описываются в исчерпывающих подробностях с тем, чтобы избежать излишнего затруднения, усложнения или запутывания настоящего изобретения.
[0016] Примерные варианты осуществления описываются в настоящем раскрытии в соответствии со следующим планом:
1. ОБЩИЙ ОБЗОР
2. ИЕРАРХИЧЕСКАЯ ДОСТАВКА ВИДЕОИЗОБРАЖЕНИЙ
2.1. БАЗОВЫЙ ПРОФИЛЬ
2.2. ОСНОВНОЙ ПРОФИЛЬ
3. УСОВЕРШЕНСТВОВАННОЕ КВАНТОВАНИЕ
4. ЛИНЕЙНОЕ РАСТЯЖЕНИЕ
5. ПРИМЕРНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ ОПЕРАЦИЙ ПРОЦЕССОВ
6. АДАПТИВНАЯ КОРРЕКТИРОВКА ДИНАМИЧЕСКОГО ДИАПАЗОНА
7. МЕХАНИЗМЫ РЕАЛИЗАЦИИ - ОБЗОР АППАРАТНОГО ОБЕСПЕЧЕНИЯ
8. ЭКВИВАЛЕНТЫ, РАСШИРЕНИЯ, АЛЬТЕРНАТИВЫ И РАЗНОЕ
1. ОБЩИЙ ОБЗОР
[0017] Данный обзор представляет базовое описание некоторых особенностей примерного варианта осуществления настоящего изобретения. Следует отметить, что данный обзор не является всесторонним или исчерпывающим изложением особенностей примерного варианта осуществления. Более того, следует отметить, что данный обзор не следует понимать как идентифицирующий любые особенно значительные особенности или элементы примерного варианта осуществления, ни как очерчивающие какой-либо объем примерного варианта осуществления изобретения в частности, ни как очерчивающие изобретение в целом. Данный обзор лишь представляет в сжатой и упрощенной форме некоторые концепции, которые относятся к примерному варианту осуществления, и его следует понимать лишь как концептуальное вступление к более подробному описанию примерных вариантов осуществления изобретения, которое следует ниже.
[0018] В некоторых вариантах осуществления изобретения, иерархические кодеки VDR могут использоваться для доставки сжатых VDR-изображений (например, видеоизображений) в устройства обработки VDR-изображений (например, в VDR-дисплеи). В том смысле, как он используется в настоящем раскрытии, термин «иерархический кодек VDR» может относиться к кодеку VDR, где сам по себе базовый уровень может не просматриваться на SDR-дисплеях. В том смысле, как он используется в настоящем раскрытии, термин «VDR», или «визуальный динамический диапазон», может относиться к более широкому динамическому диапазону, чем стандартный динамический диапазон, и может включать широкий динамический диапазон вплоть до мгновенно воспринимаемого динамического диапазона и цветовую гамму, которую человеческое зрение может воспринимать в любой момент времени, но не ограничиваясь этим.
[0019] Иерархический кодек VDR, описываемый в настоящем раскрытии, который поддерживает VDR-изображения с большей битовой глубиной (например, 12+ битов), может реализовываться двумя или большим количеством кодеков с меньшей битовой глубиной (например, 8 битов) на нескольких уровнях. Несколько уровней могут включать базовый уровень и один или несколько уровней расширения.
[0020] В резком противоречии с другими методиками, данные изображения базового уровня согласно методикам, описываемым в настоящем раскрытии, не должны поддерживать оптимизированный просмотр на SDR-дисплеях или создание SDR-изображений, выглядящих как можно лучше и согласующихся с человеческим восприятием, в пределах стандартного динамического диапазона. Вместо этого, данные изображения базового уровня согласно методикам, описываемым в настоящем раскрытии, должны поддерживать оптимизированный просмотр на VDR-дисплеях. В примерном варианте осуществления данные изображения базового уровня согласно методикам, описываемым в настоящем раскрытии, содержат специфическую структуру версии данных VDR-изображения с меньшей битовой глубиной, а остаточная разность между базовым уровнем и оригинальным VDR-изображением переносится на уровне расширения.
[0021] Также, согласно другим методикам, данные VDR-изображения и данные SDR-изображения, относящиеся к одним и тем же исходным изображениям, содержат разное содержимое изображения. Например, данные SDR-изображения на вводе кодера содержат в данном конкретном случае независимые изменения, которые неизвестны или не могут быть определены исходя из данных VDR-изображения на вводе кодера. Часто корректуры цвета или результаты цветокоррекции художником-колористом должны подвергаться экспертному анализу путем сравнения данных SDR-изображения с VDR-изображением после того, как данные SDR-изображения уже были изменены, например, художником-колористом.
[0022] В резком противоречии, согласно методикам, описываемым в настоящем раскрытии, данные VDR-изображения могут использоваться для доставки данных изображения базового уровня (BL) посредством иерархической декомпозиции, например, усовершенствованного квантования с последующим многоуровневым кодированием. Конкретные способы, применяемые при усовершенствованном квантовании, известны и даже целенаправленно выбираются иерархическим кодером VDR. Выбор/определение конкретного усовершенствованного квантователя для выполнения усовершенствованного квантования может основываться, например, на том, каким на стороне декодера VDR может быть качество изображения реконструированных VDR-изображений. Таким образом, усовершенствованное квантование согласно способам, описываемым в настоящем раскрытии, представляет собой одну или несколько операций, известных заранее (например, перед тем, как генерируются входные несжатые данные базового уровня в обработке базового уровня), управляемых и реализуемых иерархическим кодеком VDR, описываемым в настоящем раскрытии. Таким образом, согласно методикам, описываемым в настоящем раскрытии, можно избежать и исключить сложный анализ для определения различий между данными VDR-изображения и данными SDR-изображения, которые, согласно другим методикам, изменялись или генерировались независимо.
[0023] Кодеки, реализующие методики, описываемые в настоящем раскрытии, могут конфигурироваться для включения в них инструментов межуровневого предсказания для того, чтобы в полной мере использовать статистическую избыточность между данными изображения базового уровня (BL) и данными оригинального VDR-изображения. Данные изображений EL могут (возможно, только) переносить остаточные (или разностные) данные изображения вместо переноса большого объема данных VDR-изображения без использования статистической избыточности в данных изображения на различных уровнях.
[0024] В некоторых вариантах осуществления для дальнейшей минимизации объема данных VDR-изображения, которые подлежат переносу на уровнях расширения, может использоваться предсказание. В качестве специфического применения усовершенствованного иерархического кодера VDR, иерархическим кодером VDR может устанавливаться соответствующая взаимосвязь между усовершенствованным квантованием и предсказанием. На основе специфического применения усовершенствованного квантования, используемого для получения входных несжатых данных базового уровня, для обработки базового уровня, иерархический кодер VDR может выбирать среди ряда доступных способов предсказания соответствующий конкретный способ предсказания. В одном из примеров, если для усовершенствованного квантования используется линейное квантование, для предсказания может использоваться способ предсказания на основе многочленов первого порядка. В другом примере, если при усовершенствованном квантовании используется кривая квантования (например, сигмоидальная кривая, функция вида мю, кривая на основе человеческого восприятия и т.д.), для предсказания может использоваться соответствующий кривой квантования способ предсказания на основе многочлена более высокого порядка (второго или более высокого порядка). В другом примере, если при усовершенствованном квантовании используется (векторное) квантование между цветовыми каналами (например, наклон/смещение/мощность/цветовой тон/насыщенность, используемые в операции первичной цветокоррекции), для предсказания может использоваться соответствующее предсказание между цветовыми каналами. В еще одном примере, если при усовершенствованном квантовании используется кусочное квантование, для предсказания может использоваться способ предсказания, соответствующий кусочному квантованию. Соответствующий способ предсказания может предварительно конфигурироваться или динамически выбираться иерархическим кодером VDR, поскольку иерархическому кодеру VDR заранее (например, без анализа результата усовершенствованного квантования) известно, использовалось ли при усовершенствованном квантовании какое-либо квантование, и какого типа квантование использовалось, например, линейное квантование, криволинейное квантование, квантование между цветовыми каналами, кусочное квантование, квантование на основе справочной таблицы (LUT), какое-либо специальное сочетание разных типов квантования и т.д.
[0025] В резком противоречии, согласно другим методикам, так как корректуры цвета в данных входного SDR-изображения на базовом уровне, такие, как корректуры, вносимые художником-колористом, выполняются независимо, трудно определить, какой способ следует применить для предсказания в отсутствие дорогостоящей обработки сравнения и анализа на независимо отличающемся содержимом изображений как для данных входного SDR-изображения на базовом уровне, так и для данных входного VDR-изображения.
[0026] Таким образом, согласно способам, описываемым в настоящем раскрытии, в некоторых вариантах осуществления можно исключить или избежать сложных и дорогостоящих анализов (например, в операциях предсказания) для определения различий в VDR-содержимом и независимо измененном содержимом базового уровня. Иерархический кодек VDR может реализовывать для корреляции усовершенствованного квантования с предсказанием логику усовершенствованного квантования и обработки.
[0027] В некоторых вариантах осуществления даже если иерархический кодек VDR не рассчитан на создание данных изображения базового уровня, оптимизированных для просмотра на SDR-дисплеях, иерархический кодек VDR по-прежнему может широко использовать повторно компоненты в кодеке VDR с оптимизацией базового уровня. В одном из вариантов осуществления иерархический кодер VDR может добавлять один или несколько модулей или модифицировать один или несколько модулей в инфраструктуре кодека VDR, оптимизированной для SDR-дисплеев с целью генерирования входного изображения базового уровня посредством усовершенствованного квантования при обработке базового уровня из данных VDR-изображения. Таким образом, иерархический кодер VDR может нуждаться только в единичном вводе содержимого изображения из данных входного VDR-изображения, а не одного ввода содержимого изображения для VDR и еще одного ввода отличающегося содержимого изображения для SDR. Например, модуль преобразования в иерархическом кодере VDR может реализовывать усовершенствованное квантование для преобразования 16-битных VDR-данных RGB в 8-битные данные YCbCr в качестве данных входного изображения базового уровня в обработку базового уровня.
[0028] В примерном варианте осуществления иерархический кодек VDR может конфигурироваться для широкой поддержки синтаксиса, описания и архитектуры кодирования обработки опорного значения VDR, определяемого, например, в промышленном стандарте, описании, защищенном правами собственности, расширении промышленного стандарта или в сочетании вышеизложенного. В примерном варианте осуществления один или несколько вводов и выводов иерархического кодека VDR (кодера и/или декодера) являются такими же или по существу сходными с таковыми, которые описываются техническими условиями или профилями VDR для кодека VDR, оптимизированного для SDR-дисплеев. Иерархический кодек VDR может представлять собой средство для обработки и представления 12+-битных VDR-изображений через два (недорогих) 8-битных декодера, избегая необходимости в использовании дорогого 12+-битного декодера для обеспечения для VDR-изображений качества изображения, сходного с точки зрения восприятия. В том смысле, как он используется в настоящем раскрытии, термин «N+-битное изображение» может относиться к изображениям, которые представляются с использованием N и более битов на каждую цветовую составляющую, и содержат по меньшей мере одну цветовую составляющую. В некоторых вариантах осуществления, для, по меньшей мере, некоторых операций в устройстве может параллельно действовать более одного декодера с меньшей битовой глубиной в кодеке и/или более одного кодера с меньшей битовой глубиной, и они могут совместно выполнять кодирование и декодирование данных VDR-изображения.
[0029] Практические выгоды вариантов осуществления, описываемых в настоящем раскрытии, включают в качестве неограничивающих примеров доставку высококачественных данных VDR-изображения конечным потребителям, которые озабочены только конечным качеством VDR и не заботятся или даже не смотрят на версию SDR, которая может быть сконструирована из данных изображения базового уровня.
[0030] В некоторых вариантах осуществления для действия в нескольких режимах может использоваться комбинированный кодек (который может представлять собой кодер VDR или декодер VDR). Один из рабочих режимов для комбинированного кодека может размещать комбинированный кодек для работы в качестве иерархического кодека VDR, в то время как один из других рабочих режимов для комбинированного кодека также может допускать кодирование базового уровня, которое является подходящим для просмотра на SDR-дисплеях. Как результат, в некоторых примерных вариантах осуществления кодированные битовые потоки, которые соответствуют любым из технических условий VDR, могут должным образом декодироваться комбинированным декодером VDR. Как результат, в некоторых примерных вариантах осуществления кодированные битовые потоки, которые соответствуют любым из технических условий VDR, могут должным образом генерироваться комбинированным кодером VDR.
[0031] В некоторых примерных вариантах осуществления изобретения, в данные изображения базового уровня и уровня расширения, подлежащие доставке из устройства в восходящем направлении в устройство в нисходящем направлении, также могут включаться данные, необходимые для других приложений. В некоторых примерных вариантах осуществления базовым уровнем и уровнем расширения, описываемым в настоящем раскрытии, могут поддерживаться дополнительные и/или независимые характерные признаки.
[0032] В некоторых примерных вариантах осуществления механизмы, описываемые в настоящем раскрытии, образуют часть системы обработки медиаданных, включающей в качестве неограничивающих примеров какое-либо из следующих устройств: карманное устройство, игровой автомат, телевизор, портативный персональный компьютер, нетбук, планшетный компьютер, сотовый радиотелефон, электронная книга, терминал торговой точки, настольный компьютер, автоматизированное рабочее место, компьютерный киоск или терминалы и модули обработки медиаданных других видов.
[0033] Специалистам в данной области техники будут легко видны различные модификации предпочтительных вариантов осуществления и общих принципов и характерных признаков, описываемых в настоящем раскрытии. Поэтому данное раскрытие не предполагается как ограничивающееся показанными вариантами осуществления, но должно согласовываться с самым широким объемом в соответствии с принципами и характерными признаками, описываемыми в настоящем раскрытии.
2. ИЕРАРХИЧЕСКАЯ ДОСТАВКА ВИДЕОИЗОБРАЖЕНИЙ
[0034] В некоторых вариантах осуществления базовый уровень и один или несколько уровней расширения могут использоваться, например, устройством в восходящем направлении (например, кодером 102 VDR-изображений по ФИГ. 1 или кодером 202 VDR-изображений по ФИГ. 2) для доставки данных изображения в одном или нескольких видеосигналах (или кодированных битовых потоках) устройству в нисходящем направлении (например, декодеру 150 VDR-изображений по ФИГ. 1). Данные изображения могут содержать данные изображения базового уровня с меньшей битовой глубиной, квантованного из VDR-изображения с большей битовой глубиной (например, 12+ битов) и переносимого в контейнере изображения базового уровня (контейнере изображения YCbCr 4:2:0), и данные изображения уровня расширения, содержащие остаточные значения между VDR-изображением и предсказанным кадром, генерируемым исходя из данных изображения базового уровня. Данные изображения базового уровня и данные изображения уровня расширения могут приниматься и использоваться устройством в нисходящем направлении для реконструкции версии VDR-изображения с большей битовой глубиной (12+ битов).
[0035] В некоторых вариантах осуществления данные изображения базового уровня не предназначены для генерирования SDR-изображения, оптимизированного для просмотра на SDR-дисплеях; вместо этого, данные изображения базового уровня совместно с данными изображения уровня расширения оптимизированы для реконструкции высококачественных VDR-изображений для просмотра на VDR-дисплеях.
2.1. БАЗОВЫЙ ПРОФИЛЬ
[0036] На ФИГ. 1 показана архитектура кодека VDR в базовом профиле в соответствии с примерным вариантом осуществления. В том смысле, как он используется в настоящем раскрытии, термин «базовый профиль» может относиться к простейшему профилю кодера в системе кодирования VDR. В варианте осуществления базовый профиль ограничивает всю обработку видеоданных на базовом уровне кодирования и уровне расширения цветовым пространством YCbCr 4:2:0. В примерном варианте осуществления изобретения, предсказание может осуществляться в пространстве YCbCr согласно схеме дискретизации 4:2:0; для предсказания может использоваться, например, способ многочленного предсказания/предсказания ID LUT. В некоторых вариантах осуществления изобретения, устройство в восходящем направлении, которое доставляет данные VDR-изображения в устройства в нисходящем направлении, может содержать кодер 102 VDR-изображений, реализующий одну или несколько методик, описываемых в настоящем раскрытии, и, в то же время, устройство в нисходящем направлении, которое принимает и обрабатывает видеосигналы из кодера 102 VDR-изображений, может содержать декодер 150 VDR-изображений, реализующий одну или несколько методик, описываемых в настоящем раскрытии. Каждое из указанных устройств, кодер 102 VDR-изображений и декодер 150 VDR-изображений, может реализовываться одним или несколькими вычислительными устройствами.
[0037] В примерном варианте осуществления кодер (102) VDR-изображений сконфигурирован для приема входного VDR-изображения (106). В том смысле, как он используется в настоящем раскрытии, термин «входное VDR-изображение» относится к данным изображения с широким или расширенным динамическим диапазоном, которые могут использоваться для получения VDR-версии исходного изображения (например, необработанное изображение, зафиксированное устройством высокого класса для получения изображений и т.д.), которое дает начало входному VDR-изображению. Входное VDR-изображение может находиться в любом цветовом пространстве, которое поддерживает цветовую гамму расширенного динамического диапазона. В некоторых вариантах осуществления входное VDR-изображение (106) является единственным вводом относительно исходного изображения, который доставляет данные изображения для кодера (102) VDR-изображений с целью кодирования; данные входного изображения относительно исходного изображения для обработки на базовом уровне согласно способам, раскрываемым в настоящем раскрытии, могут генерироваться на основе входного VDR-изображения (106) с использованием усовершенствованного квантования.
[0038] В примерном варианте осуществления входное VDR-изображение, как показано на ФИГ. 1, представляет собой 12+-битное изображение RGB в цветовом пространстве RGB. В одном из примеров, каждый пиксел, представленный на входном VDR-изображении, содержит значения пиксела для всех каналов (например, для красного, зеленого и синего цветовых каналов), определенных для цветового пространства (например, для цветового пространства RGB). Необязательно и/или в качестве альтернативы каждый пиксел может содержать значения пиксела, подвергнутые повышающей или понижающей дискретизации, для одного или нескольких каналов в цветовом пространстве. Следует отметить, что в некоторых вариантах осуществления в дополнение к трем основным цветам, таким, как красный, зеленый и синий, в цветовом пространстве, описываемом в настоящем раскрытии, могут одновременно использоваться и другие основные цвета, например, для поддержки широкой цветовой гаммы; в таких вариантах осуществления данные изображения, описываемые в настоящем раскрытии, содержат дополнительные значения пиксела для этих других основных цветов, и они могут одновременно обрабатываться по методикам, описываемым в настоящем раскрытии.
[0039] В примерном варианте осуществления кодер (102) VDR-изображений сконфигурирован для преобразования значений пикселов входного VDR-изображения из первого цветового пространства (например, цветового пространства RGB) во второе цветовое пространство (например, в цветовое пространство YCbCr). Преобразование цветового пространства может выполняться, например, модулем (108) RGB-2-YCbCr в кодере (102) VDR-изображений.
[0040] В примерном варианте осуществления кодер (102) VDR-изображений или понижающий дискретизатор (например, понижающий дискретизатор ПО в диапазоне 444-420) в нем, сконфигурирован для понижающей дискретизации VDR-изображения (например, в формате дискретизации 4:4:4) в цветовом пространстве YCbCr в подвергнутое понижающей дискретизации 12+-битное VDR-изображение 112 (например, в формате дискретизации 4:2:0). Без учета эффектов сжатия, общий объем данных изображения в канале цветности 12+-битного VDR-изображения (112), подвергнутого понижающей дискретизации, может составлять в размере одну четверть от общего объема данных изображения в канале светимости 12+-битного VDR-изображения (112), подвергнутого понижающей дискретизации.
[0041] В примерном варианте осуществления кодер (102) VDR-изображений сконфигурирован для выполнения усовершенствованного квантования на данных изображения YCbCr (в настоящем примере, в формате дискретизации 4:2:0), как подвергнутых понижающей дискретизации из VDR-изображения (в формате дискретизации 4:4:4), с целью генерирования 8-битного изображения (114) BL в цветовом пространстве YCbCr. Как проиллюстрировано на ФИГ. 1, оба изображения, 12+-битное VDR-изображение (112) и 8-битное изображение (114) BL, генерируются после одной и той же понижающей дискретизации цветности и поэтому содержат одно и то же содержимое изображения (например, 8-битное изображение 114 BL является более грубо квантованным, чем 12+-битное VDR-изображение 112).
[0042] В примерном варианте осуществления кодер (102) VDR-изображений, или первый кодер (116-1) в нем, сконфигурирован для кодирования/форматирования 8-битного изображения (214) BL в цветовом пространстве YCbCr в данные изображения в контейнере изображения базового уровня в формате дискретизации 4:2:0. В некоторых вариантах осуществления указанные данные изображения в контейнере изображения базового уровня не предназначены для генерирования SDR-изображений, оптимизированных для просмотра на SDR-дисплеях; точнее, данные изображения в контейнере изображения базового уровня оптимизированы для содержания оптимального объема данных изображения базового уровня в контейнере изображения с меньшей битовой глубиной с целью минимизации общей потребности в битах для данных VDR-изображения, подлежащих переносу на нескольких уровнях с целью реконструкции в VDR-изображение, оптимизированное для VDR-дисплеев. В том смысле, как он используется в настоящем раскрытии, термин «меньшая битовая глубина» относится к данным изображения, квантованным в кодовом пространстве, которое имеет меньшую битовую глубину; один из примеров меньшей битовой глубины содержит 8 битов, в то время как термин «большая битовая глубина» относится к данным изображения, квантованным в кодовом пространстве, которое имеет большую битовую глубину; одним из примеров большей битовой глубины является битовая глубина 12 битов или более. В частности, термины «меньшая битовая глубина» и «большая битовая глубина» не относятся к самым младшим битам или самым старшим битам значения пиксела.
[0043] В примерном варианте осуществления кодер (102) VDR-изображений генерирует на основе данных изображения в контейнере изображения базового уровня видеосигнал базового уровня, который может выводиться в видеодекодер (например, в декодер 150 VDR-изображений или в первый декодер 152-1 в нем) в устройстве в нисходящем направлении.
[0044] В примерном варианте осуществления декодер (120) в кодере (102) VDR-изображений декодирует данные изображения в контейнере изображения базового уровня в декодированное изображение базового уровня, в настоящем примере, в формате дискретизации 4:2:0. Декодированное изображение базового уровня отличается от 8-битного изображения (114) BL, поскольку декодированное изображение базового уровня содержит кодовые изменения, ошибки округления и приближения, вносимые в операции кодирования и декодирования, выполняемые первым кодером (116-1) и декодером (120).
[0045] Данные реконструкции VDR-изображения в дополнение к тем, которые содержатся в видеосигнале базового уровня, могут доставляться кодером VDR-изображений в устройство в нисходящем направлении на одном или нескольких уровнях расширения, отдельных от базового уровня. В некоторых вариантах осуществления изобретения VDR-изображение (112) с большей битовой глубиной в цветовом пространстве YCbCr может предсказываться исходя либо из соседних дискретных значений в том же самом кадре изображения (с использованием внутреннего предсказания), либо из дискретных значений кадров ранее декодированного изображения (внешнее предсказание), которые принадлежат одному и тому же уровню и буферизуются как опорные значения предсказания с компенсацией движения в буфере предсказанного кадра изображения. Межуровневое предсказание также может, по меньшей мере, частично основываться на декодированной информации из других уровней (например, из базового уровня).
[0046] В примерном варианте осуществления кодер (102) VDR-изображений содержит модуль (122) обработки предсказания, который выполняет одну или несколько операций, относящихся к предсказанию. Предсказание, реализуемое модулем обработки предсказания (например, модулем 122), может уменьшать непроизводительные затраты при реконструкции VDR-изображения VDR-видеодекодером (например, 150 по ФИГ. 1). В примерном варианте осуществления кодер (102) VDR-изображений сконфигурирован для определения, по меньшей мере, частично на основе 12+-битного VDR-изображения (112) и декодированного изображения базового уровня, посредством внешнего или внутреннего предсказания (или оценки, или других способов), набора параметров отображения для предсказания (134). Модуль (122) обработки предсказания может генерировать 12+-битное предсказанное изображение в цветовом пространстве YCbCr на основе набора параметров (134) отображения и декодированного изображения базового уровня. В том смысле, как они используются в настоящем раскрытии, примеры параметров отображения могут включать, но ограничиваться только параметрами многочлена, используемого для предсказания.
[0047] В примерном варианте осуществления кодер (102) VDR-изображений сконфигурирован для генерирования остаточных значений (130) между 12+-битным VDR-изображением (112) и предсказанным изображением, генерируемым модулем (122) обработки предсказания. Остаточные значения в цветовом канале (например, в канале светимости) могут представлять собой разности, полученные посредством операций вычитания (например, 126) в линейной или логарифмической области. В альтернативном варианте и/или необязательно, остаточные значения в цветовом канале (например, в канале светимости) могут представлять собой отношения, полученные посредством операций деления в линейной или логарифмической области. В различных примерных вариантах осуществления с целью генерирования остаточных значений (130) между 12+-битным VDR-изображением (112) и предсказанным изображением может использоваться одно или несколько математических представлений и соответствующих операций.
[0048] В варианте осуществления, если не принимать во внимание разности, вносимые путем усовершенствованного квантования (или процесса псевдоцветокоррекции), 12+-битное VDR-изображение (112) и 8-битное изображение (114) BL содержат одно и то же содержимое изображения. В варианте осуществления 12+-битное VDR-изображение (112) содержит такую же информацию цветности, что и 8-битное изображение (114) BL, если не принимать во внимание шумы квантования или разности, вносимые усовершенствованным квантованием (или процессом псевдоцветокоррекции). В варианте осуществления области средних тонов и темные области на 12+-битном изображении (112) могут кодироваться на базовом уровне в условиях усовершенствованного квантования, где наиболее яркие области на 12+-битном изображении (112) могут кодироваться на уровнях расширения в условиях того же усовершенствованного квантования.
[0049] В дополнение и/или необязательно, на пути обработки от 8-битного изображения (114) BL к предсказанному изображению первым модулем (116-1) кодирования, модулем (120) декодирования или модулем (122) обработки предсказания только в обработку базового уровня не вносятся корректуры/изменения/искажение цветов (например, отсечение). В примерном варианте осуществления предсказанное изображение содержит такую же информацию цветности, что и 8-битное изображение (114) BL за исключением возможных искажений, которые могут неотъемлемо присутствовать на пути обработки (например, искажений базового уровня, вызываемых кодеком базового уровня).
[0050] В примерном варианте осуществления нелинейный квантователь (NLQ) 128 в кодере (102) VDR-изображений сконфигурирован для квантования остаточных значений (130) в 12+-битном цифровом представлении в 8-битное цифровое представление (или 8-битные остаточные значения в цветовом пространстве YCbCr) с использованием одного или нескольких параметров NLQ.
[0051] В примерном варианте осуществления кодер (102) VDR-изображений, или второй кодер (116-2) в нем, сконфигурирован для кодирования 8-битных остаточных значений в контейнере изображения уровня расширения, например, в формате дискретизации 4:2:0. Контейнер изображения уровня расширения является логически отдельным от контейнера изображения базового уровня на базовом уровне.
[0052] В примерном варианте осуществления кодер (102) VDR-изображений генерирует на основе 8-битных остаточных значений в контейнере изображения уровня расширения видеосигнал уровня расширения, который может выводиться в видеодекодер (например, декодер 150 VDR-изображений или второй декодер 152-2 в нем).
[0053] В примерном варианте осуществления набор параметров (134) отображения и параметров (132) NLQ может передаваться в устройство в нисходящем направлении (например, в декодер 150 VDR-изображений) как часть вспомогательной информации расширения (SEI) или других аналогичных носителей метаданных, доступных в битовых видеопотоках (например, на уровнях расширения).
[0054] Одно или несколько из таких устройств, как первый кодер (116-1), второй кодер (116-2) и декодер (120) (и 152-1, 152-2), могут быть реализованы с использованием одного или нескольких кодеков из ряда таких кодеков, как H.264/AVC/HEVC, MPEG-2, VP8, VC-1 и/или другие.
[0055] В примерном варианте осуществления декодер (150) VDR-изображений сконфигурирован для приема входных видеосигналов на нескольких уровнях (или в нескольких битовых потоках), содержащих базовый уровень и один или несколько уровней расширения. В том смысле, как он используется в настоящем раскрытии, термин «многоуровневый», или «несколько уровней», может относиться к двум или большему количеству битовых потоков, которые переносят видеосигналы или сигналы изображений, содержащие одно или несколько логических отношений зависимости друг от друга (для видеосигналов).
[0056] В примерном варианте осуществления первый декодер (152-1) в декодере (150) VDR-изображений сконфигурирован для генерирования на основе видеосигнала базового уровня декодированного изображения базового уровня. В некоторых вариантах осуществления первый декодер (152-1) в декодере (150) VDR-изображений может быть таким же или по существу аналогичным декодеру (120) в декодере (102) VDR-изображений. Аналогично, декодированное изображение базового уровня в декодере (150) VDR-изображений и декодированное изображение базового уровня могут быть одинаковы или аналогичны по существу при условии, что декодированные изображения базового уровня происходят из одного и того же VDR-изображения (например, 106).
[0057] В примерном варианте осуществления VDR-видеодекодер (150) содержит модуль (158) обработки предсказания, который выполняет одну или несколько операций, относящихся к предсказанию. Предсказание, реализуемое модулем обработки предсказания, может использоваться для эффективной реконструкции VDR-изображений в VDR-видеодекодере (например, 150 по ФИГ. 1). Модуль (158) обработки предсказания сконфигурирован для приема набора параметров (134) отображения и для генерирования 12+-битного предсказанного изображения, по меньшей мере, частично на основе указанного набора параметров (134) отображения и декодированного изображения базового уровня.
[0058] В примерном варианте осуществления второй декодер (152-2) в декодере (150) VDR-изображений сконфигурирован для отыскания на основе одного или нескольких видеосигналов расширения 8-битных остаточных значений в контейнере изображения уровня расширения.
[0059] В примерном варианте осуществления нелинейный деквантователь (NLdQ) 154 в декодере (150) VDR-изображений сконфигурирован для приема одного или нескольких параметров NLQ через уровни расширения и для деквантования 8-битных остаточных значений в 12+-битное цифровое представление (или 12+-битные остаточные значения в цветовом пространстве YCbCr) с использованием одного или нескольких параметров NLQ.
[0060] В примерном варианте осуществления декодер (150) VDR-изображений сконфигурирован для генерирования реконструированного VDR-изображения (160) на основе 12+-битных остаточных значений (130) и 12+-битного предсказанного изображения, генерируемого модулем (158) обработки предсказания. Реконструированные значения пикселов в цветовом канале (например, в канале светимости) могут представлять собой суммы, генерируемые путем операций сложения (например, 162) в линейной или логарифмической области. В качестве альтернативы и/или необязательно, реконструированные значения в цветовом канале (например, в канале светимости) могут представлять собой произведения, генерируемые посредством операций умножения в линейной или логарифмической области. В различных примерных вариантах осуществления с целью генерирования реконструированных значений (160) пикселов исходя из остаточных значений и предсказанного изображения может использоваться одно или несколько других математических представлений и соответствующих операций.
2.2. ОСНОВНОЙ ПРОФИЛЬ
[0061] На ФИГ. 2 показана архитектура кодека VDR в основном профиле в соответствии с примерным вариантом осуществления. В том смысле, как он используется в настоящем раскрытии, термин «основной профиль» может относиться к профилю, который допускает большую сложность, чем базовый профиль в системе кодирования VDR. Например, основной профиль может допускать операции цветовых пространствах как YCbCr, так и RGB, а также может допускать операции в ряде форматов субдискретизации, в том числе 4:2:0, 4:2:2, и 4:4:4. В примерном варианте осуществления предсказания могут выполняться в цветовом пространстве RGB по схеме дискретизации 4:4:4; для предсказания может, например, использоваться способ предсказания на основе многочлена/предсказания ID LUT. В некоторых вариантах осуществления устройство в восходящем направлении, которое доставляет данные VDR-изображения в устройства в нисходящем направлении, может, как проиллюстрировано на ФИГ. 2, содержать кодер 202 VDR-изображений, в то время как устройство в нисходящем направлении, которое принимает и обрабатывает данные VDR-изображения может содержать декодер 250 VDR-изображений. Каждое из устройств, кодер 202 VDR-изображений и декодер 250 VDR-изображений, может реализовываться одним или несколькими вычислительными устройствами.
[0062] В примерном варианте осуществления кодер (202) VDR-изображений сконфигурирован для приема входного VDR-изображения (206). Входное VDR-изображение (206) может находиться в любом цветовом пространстве, которое поддерживает цветовую гамму расширенного динамического диапазона.
[0063] В примерном варианте осуществления входное VDR-изображение, как проиллюстрировано на ФИГ. 2, представляет собой 12+-битное изображение RGB в цветовом пространстве RGB. В одном из примеров, каждый пиксел на входном VDR-изображении содержит значения пиксела для красного, зеленого и синего цветовых каналов, определенных в цветовом пространстве RGB. Каждый пиксел может, необязательно и/или в качестве альтернативы, содержать значения пиксела, подвергнутые повышающей дискретизации или понижающей дискретизации, для одного или нескольких из каналов в цветовом пространстве.
[0064] В примерном варианте осуществления кодер (202) VDR-изображений сконфигурирован для выполнения усовершенствованного квантования на данных 12+-битного изображения RGB в VDR-изображении 206 (в настоящем примере, в формате дискретизации 4:4:4) для генерирования 8-битных данных VDR-изображения RGB.
[0065] В примерном варианте осуществления кодер (202) VDR-изображений сконфигурирован для преобразования 8-битных данных VDR-изображения RGB из первого цветового пространства (в настоящем примере цветового пространства RGB) во второе цветовое пространство (например, в цветовое пространство YCbCr). Преобразование цветового пространства может выполняться, например, модулем (208) RGB-2-YCbCr в кодере (202) VDR-изображений.
[0066] В примерном варианте осуществления, кодер (202) VDR-изображений, или понижающий дискретизатор (например, понижающий дискретизатор 210 в диапазоне 444-420) в нем, сконфигурирован для понижающей дискретизации 8-битных данных VDR в цветовом пространстве YCbCr в 8-битное изображение 214 BL, подвергнутое понижающей дискретизации (например, в формате дискретизации 4:2:0).
[0067] В примерном варианте осуществления кодер (202) VDR-изображений, или первый кодер (216-1) в нем, сконфигурирован для кодирования 8-битного изображения (214) BL, подвергнутого понижающей дискретизации, в данные изображения в контейнере изображения базового уровня. В примерном варианте осуществления данные изображения в контейнере изображения базового уровня не оптимизированы для просмотра на SDR-дисплеях; точнее, данные изображения в контейнере изображения базового уровня оптимизированы для содержания максимального объема реконструируемой информации для представления данных VDR-изображения с большей битовой глубиной в контейнер изображения с меньшей битовой глубиной и для минимизации объема данных реконструкции VDR-изображения (например, остаточных значений 230), которые требуют переноса в уровнях расширения.
[0068] В примерном варианте осуществления кодер (202) VDR-изображений генерирует, на основе данных изображения в контейнере изображения базового уровня, видеосигнал базового уровня, который может выводиться в видеодекодер (например, в декодер 250 изображений VDR или в первый декодер 252-1 в нем) в устройстве в нисходящем направлении.
[0069] В примерном варианте осуществления декодер (220) в кодере (202) VDR-изображений декодирует данные изображения в контейнере изображения базового уровня в декодированное изображение базового уровня, в настоящем примере, в формате дискретизации 4:2:0. Декодированное изображение базового уровня отличается от 8-битного изображения (214) BL, поскольку декодированное изображение базового уровня содержит изменения и ошибки, такие, как ошибки округления и приближения, вносимые в операции кодирования и декодирования, выполняемые первым кодером (216-1) и декодером (220).
[0070] Данные реконструкции VDR-изображения в дополнение к видеосигналу базового уровня могут доставляться кодером VDR-изображений в устройство в нисходящем направлении на одном или нескольких уровнях расширения, отдельных от базового уровня. VDR-изображение (206) в цветовом пространстве RGB может предсказываться исходя либо из соседних дискретных значений в том же кадре изображения (с использованием внутреннего предсказания), либо из дискретных значений ранее декодированных кадров изображения (внешнее предсказание), которые принадлежат к одному и тому же уровню и буферизуются как опорные значения предсказания с компенсацией движения в буфере предсказанного кадра изображения. Межуровневое предсказание может также, по меньшей мере, частично основываться на декодированной информации из других уровней (например, из базового уровня).
[0071] В примерном варианте осуществления кодер (202) VDR-изображений, или повышающий дискретизатор (например, повышающий дискретизатор 212 в диапазоне 420-444) в нем, сконфигурирован для повышающей дискретизации декодированного изображения базового уровня в формате дискретизации 4:2:0 в 8-битные данные изображения, подвергнутого повышающей дискретизации (в настоящем примере, в формате дискретизации 4:4:4).
[0072] В примерном варианте осуществления кодер (202) VDR-изображений, или модуль (например, 236) YCbCr-2-RGB в нем, сконфигурирован для преобразования 8-битных данных изображения, подвергнутого повышающей дискретизации, из цветового пространства не для предсказания (в настоящем примере, цветового пространства YCbCr) в цветовое пространство предсказания (например, в цветовое пространство RGB).
[0073] В примерном варианте осуществления кодер (202) VDR-изображений содержит модуль (222) обработки предсказания, который выполняет одну или несколько операций, относящихся к предсказанию. Предсказание, реализуемое модулем (например, 222) обработки предсказания, может уменьшать непроизводительные издержки при реконструкции VDR-изображения VDR-видеодекодером (например, декодером 250 по ФИГ. 2).
[0074] В примерном варианте осуществления кодер (202) VDR-изображений сконфигурирован для определения, по меньшей мере, частично на основе 12+-битного VDR-изображения (206) и данных изображения, подвергнутого повышающей дискретизации при преобразовании в цветовое пространство предсказания, посредством внутреннего или внешнего предсказания (или оценки, или других способов), набора параметров (234) отображения для предсказания. Модуль (222) обработки предсказания может генерировать, на основе набора параметров (234) отображения и данных изображения, подвергнутого повышающей дискретизации при преобразовании в цветовое пространство предсказания, 12+-битное предсказанное изображение в цветовом пространстве RGB.
[0075] В примерном варианте осуществления кодер (202) VDR-изображений сконфигурирован для генерирования остаточных значений (230) (RGB) между 12+-битным VDR-изображением (206) и предсказанным изображением. Остаточные значения в цветовом канале (например, в канале G) могут представлять собой разности, генерируемые посредством операций (например, 126) вычитания в линейной или логарифмической области. В альтернативном варианте и/или необязательно, остаточные значения в цветовом канале (например, в канале G) могут представлять собой отношения, генерируемые посредством операций деления в линейной или логарифмической области. В различных примерных вариантах осуществления с целью генерирования остаточных значений (230) между 12+-битным VDR-изображением (206) и предсказанным изображением могут использоваться и другие математические представления и соответствующие операции/отображения/функции.
[0076] В варианте осуществления 12+-битное VDR-изображение (206) содержит такую же информацию цветности, что и 8-битные VDR-данные RGB, за исключением различий квантования или шумов, вносимых усовершенствованным квантованием (или процессом псевдоцветокоррекции). В варианте осуществления области средних тонов и темные области на 12+-битном VDR-изображении (206) могут кодироваться на базовом уровне в соответствии с усовершенствованным квантованием, в то время как наиболее яркие области на 12+-битном VDR-изображении (206) могут кодироваться на уровнях расширения в соответствии с тем же усовершенствованным квантованием.
[0077] В примерном варианте осуществления модулем (208) RGB-2-YCbCr, понижающим дискретизатором (210), первым модулем (216-1) кодирования, модулем (220) декодирования, повышающим дискретизатором (212), модулем (236) YCbCr-2-RGB или модулем (222) обработки предсказания на пути обработки от 8-битных VDR-данных RGB к предсказанному изображению не вносятся дополнительные корректуры/изменения/искажения цвета (например, отсечение). В примерном варианте осуществления предсказанное изображение содержит такую же информацию цветности, что и 8-битные VDR-данные RGB, за исключением возможных искажений, которые могут неотъемлемо присутствовать на пути обработки (например, искажения базового уровня, вызываемые кодеком базового уровня, или ошибки из-за переформатирования цветности при понижающей и повышающей дискретизации).
[0078] В примерном варианте осуществления модуль 228 понижающей дискретизации 444-В-420 и нелинейного квантования (444-В-420 и NLQ) в кодере (202) VDR-изображений сконфигурирован для понижающей дискретизации и квантования остаточных значений (230) из 12+-битного цифрового представления в формате дискретизации 4:4:4 в 8-битное цифровое представление (или 8-битные остаточные значения RGB) в формате дискретизации 4:2:0 с использованием одного или нескольких параметров NLQ.
[0079] В примерном варианте осуществления кодер (202) VDR-изображений, или второй кодер (216-2) в нем, сконфигурирован для кодирования 8-битных остаточных значений в контейнере изображения уровня расширения. Контейнер изображения уровня расширения является логически отдельным от контейнера изображения базового уровня.
[0080] В примерном варианте осуществления кодер (202) VDR-изображений генерирует на основе 8-битных остаточных значений в контейнере изображения уровня расширения видеосигнал уровня расширения, который может выводиться в видеодекодер (например, в декодер 250 VDR-изображений или во второй декодер 252-2 в нем).
[0081] В примерном варианте осуществления набор параметров (234) отображения и параметров (232) NLQ может передаваться в устройство в нисходящем направлении (например, в декодер 250 VDR-изображений) как часть вспомогательной информации расширения (SEI) или других аналогичных носителей метаданных, доступных в битовых видеопотоках (например, на уровнях расширения).
[0082] Одно или несколько из устройств, первый кодер (216-1), второй кодер (216-2) и декодер (220) (252-1 и 252-2), может реализовываться с использованием одного или нескольких кодеков из ряда таких кодеков, как H.264/AVC/HEVC, MPEG2, VP8, VC-1 и/или другие.
[0083] В примерном варианте осуществления декодер (250) VDR-изображений сконфигурирован для приема входных видеосигналов на нескольких уровнях (или в нескольких битовых потоках), включающих базовый уровень и один или несколько уровней расширения.
[0084] В примерном варианте осуществления первый декодер (252-1) в декодере (250) VDR-изображений сконфигурирован для генерирования на основе видеосигнала базового уровня декодированного (YCbCr) изображения базового уровня. В некоторых вариантах осуществления первый декодер (252-1) в декодере (250) VDR-изображений может быть таким же или по существу аналогичным декодеру (220) в декодере (202) VDR-изображений. Аналогично, декодированное изображение базового уровня в декодере (250) VDR-изображений и декодированное изображение базового уровня могут быть одинаковыми или по существу одинаковыми при условии, что декодированные изображения базового уровня происходят из одного и того же VDR-изображения (например, 206).
[0085] В примерном варианте осуществления декодер (250) VDR-изображений, или повышающий дискретизатор (например, повышающий дискретизатор 266 в диапазоне 420-444) в нем, сконфигурирован для повышающей дискретизации декодированного изображения базового уровня в формате дискретизации 4:2:0 в 8-битные данные изображения, подвергнутого повышающей дискретизации, в настоящем примере, в формате дискретизации 4:4:4.
[0086] В примерном варианте осуществления декодер (250) VDR-изображений, или модуль RGB-2-YCbCr (например, модуль 264) в нем, сконфигурирован для преобразования 8-битных данных изображения, подвергнутого повышающей дискретизации, из цветового пространства не для предсказания (в настоящем примере, цветового пространства YCbCr) в цветовое пространство предсказания (например, в цветовое пространство RGB).
[0087] В примерном варианте осуществления декодер (250) VDR-изображений содержит модуль (258) обработки предсказания, который выполняет одну или несколько операций, относящихся к предсказанию. Предсказание, реализуемое модулем обработки предсказания, может использоваться для эффективной реконструкции VDR-изображений в VDR-видеодекодере (например, 250 по ФИГ. 2). Модуль (258) обработки предсказания сконфигурирован для приема набора параметров (234) отображения и для генерирования, по меньшей мере, частично на основе набора параметров (234) отображения и 8-битных данных изображения, подвергнутого повышающей дискретизации и находящегося в цветовом пространстве предсказания, в 12+-битное предсказанное изображение.
[0088] В примерном варианте осуществления второй декодер (252-2) в декодере (250) VDR-изображений сконфигурирован для отыскания на основе одного или нескольких видеосигналов расширения 8-битных остаточных значений (RGB) в контейнере изображения уровня расширения.
[0089] В примерном варианте осуществления нелинейный деквантователь (NLdQ) 254 в декодере (250) VDR-изображений и повышающий дискретизатор (268) 420-В-444 сконфигурированы для приема посредством уровней расширения одного или нескольких параметров NLQ и для деквантования и повышающей дискретизации 8-битных остаточных значений в формате дискретизации 4:2:0 в 12+-битное цифровое представление (или 12+-битные остаточные значения в цветовом пространстве RGB) в формате дискретизации 4:4:4 с использованием указанного одного или нескольких параметров NLQ.
[0090] В примерном варианте осуществления декодер (250) VDR-изображений сконфигурирован для генерирования реконструированного VDR-изображения (260) на основе 12+-битных остаточных значений (230) и 12+-битного предсказанного изображения, генерируемого модулем (258) обработки предсказания. Реконструированные значения пикселов в цветовом канале (например, в канале G) могут представлять собой суммы, генерируемые посредством операций (например, 262) сложения в линейной или логарифмической области. В качестве альтернативы и/или необязательно, реконструированные значения в цветовом канале (например, в канале G) могут представлять собой произведения, генерируемые посредством операций умножения в линейной или логарифмической области. В различных примерных вариантах осуществления с целью генерирования реконструированных значений (260) пикселов исходя из указанных остаточных значений и предсказанного изображения могут использоваться и другие математические представления и соответствующие операции/функции/отображения.
[0091] В качестве альтернативы и/или необязательно, видеокодером или видеодекодером, описываемым в настоящем раскрытии, может выполняться одна или несколько из следующих операций: преобразование, квантование, энтропийное кодирование, буферизация изображения, фильтрация дискретных значений, понижающая дискретизация, повышающая дискретизация, интерполяция, уплотнение, разуплотнение, чередование, повышение разрешения, понижение разрешения, компенсация движения, оценка рассогласования, компенсация рассогласования, оценка глубины, компенсация глубины, кодирование, декодирование и т.д.
3. УСОВЕРШЕНСТВОВАННОЕ КВАНТОВАНИЕ
[0092] В некоторых вариантах осуществления изобретения усовершенствованное квантование, такое, как квантование, выполняемое кодером VDR-изображений (кодером 102 по ФИГ. 1 или кодером 202 по ФИГ. 2) рассчитано и реализуется для фиксации/сбережения максимально возможного количества деталей изображения на базовом уровне. Это минимизирует количество остаточных значений (например, 130 по ФИГ. 1 или 230 по ФИГ. 2), которые нуждаются в кодировании в видеосигнал уровня расширения. Кроме того, детали изображения, зафиксированные/сберегаемые на базовом уровне, обеспечивают поддержку при эффективной реконструкции VDR-изображений устройством в нисходящем направлении, таким, как декодер (например, 150) VDR-изображений. Присутствие точных деталей изображения ослабляет/уменьшает/устраняет видимые артефакты, которые иначе могли бы генерироваться/усиливаться в ходе операций сжатия с потерями.
[0093] Как обсуждалось, в отличие от оптимизированного для SDR-дисплеев SDR-изображения базового уровня, генерируемого другими методиками, декодированное изображение базового уровня согласно методикам, описываемым в настоящем раскрытии, не предназначено для просмотра на SDR-дисплеях. Точнее, декодированное изображение базового уровня согласно методикам, описываемым в настоящем раскрытии, служит в качестве промежуточных данных изображения для дальнейшего генерирования остаточных значений в кодере VDR-изображений и для дальнейшей реконструкции VDR-изображений с большей битовой глубиной в декодере VDR-изображений.
[0094] Согласно методикам, описываемым в настоящем раскрытии, процесс цветокоррекции, рассчитанный на генерирование наилучшего режима просмотра на SDR-дисплеях, не является необходимым и может быть отключен или отменен. Отменяются или отключаются внешние или управляемые пользователем корректуры цвета, которые вызывают асимметричное (или другое) отсечение на пути обработки уровня расширения и пути обработки базового уровня. Уровни отсечения на путях обработки как уровня расширения, так и базового уровня, полностью управляются кодером VDR-изображений согласно методикам, описываемым в настоящем раскрытии. Пикселы, которые являются подвергнутыми отсечению цвета в данных изображения базового уровня, также могут являться подвергнутыми отсечению цвета в данных изображения уровня расширения.
[0095] Методики, описываемые в настоящем раскрытии, могут использоваться для уменьшения вычислительной сложности предсказания, в том числе межуровневого предсказания, включающего данные SDR-изображения на базовом уровне и данные VDR-изображения на уровнях расширения, и являются ориентированными на системы на кристалле (SoC). Например, процесс предсказания, описываемый в настоящем раскрытии, может реализовываться как процесс, обратный усовершенствованному квантованию (или псевдоцветокоррекции), описываемому в настоящем раскрытии. Так как усовершенствованное квантование может полностью управляться кодером VDR-изображений, описываемым в настоящем раскрытии, то процесс предсказания также может быть полностью управляемым. В некоторых вариантах осуществления уровни отсечения и пикселы, подвергнутые отсечению цвета, могут полностью управляться на пути обработки уровня расширения и пути обработки базового уровня так, чтобы для генерирования и реконструкции предсказанных изображений было достаточно такого эффективного в вычислительном отношении способа, как отображение посредством многочлена первого порядка.
[0096] В примерном варианте осуществления при усовершенствованном квантовании (например, на ФИГ. 1 или ФИГ. 2) VDR-данные с большими битовыми глубинами (например, 16-битные) квантуются при помощи линейного квантователя непосредственно в данные изображений базового уровня с меньшими битовыми глубинами (8-битные).
[0097] В некоторых примерных вариантах осуществления для квантования данных изображений с большей битовой глубиной (например, 12+битов) в данные изображения с меньшей битовой глубиной (например, 8 битов) может использоваться один или несколько линейных или нелинейных квантователей. Можно выбрать разные квантователи в разных цветовых пространствах и/или в разных цветовых каналах. Например, для ослабления/уменьшения/устранения контурных артефактов (например, в областях плавного перехода) и других артефактов, видеосигналы могут квантоваться в разных цветовых пространствах и/или разными способами усовершенствованного квантования. В некоторых вариантах осуществления усовершенствованное квантование, описываемое в настоящем раскрытии, может включать одно или несколько из линейного квантования; линейного растяжения, квантования на основе кривой/неравномерного квантования; квантования, оптимизированного функцией плотности вероятности (Pdf) (например, квантование Ллойда-Макса), основанного на гистограммах для кадра, нескольких кадров, сцены, нескольких сцен или одного или нескольких разделов в пределах кадра, и т.д.; перцептивного квантования; векторного квантования; любого сочетания вышеупомянутых способов (например, перцептивного квантования с последующим квантованием, оптимизированным Pdf, в перцептивном пространстве). В некоторых вариантах осуществления конкретный тип усовершенствованного квантования может обладать соответствующей взаимосвязью с одним или несколькими способами предсказания. Например, когда в качестве усовершенствованного квантования применяется равномерное квантование, способ предсказания соответствующего типа, используемый при предсказании, может основываться на многочлене первого порядка.
[0098] Квантование может выполняться на основе отдельных каналов или на основе двух или большего количества каналов одновременно. В примерном варианте осуществления векторное квантование может выполняться по двум или большему количеству цветовых каналов. Например, система координат (например, трехмерная декартова) может задаваться с использованием в качестве осей цветовых каналов в цветовом пространстве. Для создания новых осей, которые определяются как комбинации (или суммы проекций) двух или большего количества цветовых каналов в цветовом пространстве, в системе координат может выполняться такое пространственное преобразование, как вращение. Значения пиксела в двух или большем количестве цветовых каналов проецируются таким образом, чтобы одна из указанных новых осей могла совместно квантоваться квантователем по одной из новых осей.
[0099] В некоторых вариантах осуществления конкретный способ усовершенствованного квантования может выбираться на основе того, насколько хорошо он может сжимать данные выходного многоуровневого VDR-изображения, по-прежнему сохраняя высокое воспринимаемое качество сжатых данных выходного VDR-изображения на стороне декодера VDR.
[00100] В некоторых вариантах осуществления конкретный способ усовершенствованного квантования может выбираться так, чтобы он компенсировал недостатки кодеков. Например, кодек может не действовать хорошо при сжатии черных областей и даже может выводить контурные артефакты на реконструированном VDR-изображении. Для генерирования данных изображения с меньшим количеством контурных артефактов, видимых на реконструированном VDR-изображении, усовершенствованное квантование, описываемое в настоящем раскрытии, может использовать специальную кривую (например, сигмоидальную кривую, функцию вида мю, кривую на основе человеческого восприятия и т.д.).
[0100] Кодер VDR согласно способам, описываемым в настоящем раскрытии, может принимать данные входного VDR-изображения в качестве единственного ввода для содержимого изображения, которое подлежит обработке кодером VDR. Несмотря на то, что данные входного VDR-изображения могут доставляться в обработку данных уровня расширения, для генерирования данных входного изображения для обработки данных базового уровня, описываемой в настоящем раскрытии, может использоваться усовершенствованное квантование, которое может выполняться оперативно (например, с такой же соответствующей среде передачи данных скоростью, с какой ввод VDR вводится в кодер VDR).
[0101] В некоторых вариантах осуществления этапу (например, 128 по ФИГ. 1 или 228 по ФИГ. 2) 8-битного квантования, описываемому в настоящем раскрытии, может предшествовать преобразование для создания видеосигнала (например, VDR) в большей степени выглядящего как SDR-сигнал, поскольку существующие кодеры, такие, как Н.264, могут быть приспособлены для обработки SDR-сигнала. Для сдвига динамического диапазона VDR-сигнала так, чтобы он выглядел в большей степени как SDR-сигнал, может использоваться множество методик усовершенствованного квантования. В примерном варианте осуществления для преобразования разреженных данных в целенаправленные диапазоны может использоваться способ обратимой цветокоррекции (например, наклон + смещение + мощность + цветовой тон + насыщение, или SOP+HS). В другом примерном варианте осуществления для преобразования VDR-сигнала так, чтобы он выглядел в большей степени как SDR-сигнал, при управлении отображением может использоваться кривая тонального отображения. Здесь, термин «управление отображением» относится к одной или нескольким операциям, которые выполняются с целью адаптации VDR-видеосигнала к динамическому диапазону, который поддерживается конкретным дисплеем или конкретным рядом дисплеев.
[0102] Усовершенствованное квантование, описываемое в настоящем раскрытии, может выполняться одним или несколькими разными способами. Усовершенствованное квантование может выполнять глобальное квантование, при котором с использованием единственной настойки квантуется весь кадр или вся сцена. Усовершенствованное квантование также может выполнять квантование на основе разделов (локальное), при котором каждый кадр разбивается на ряд неперекрывающихся областей, и каждая из неперекрывающихся областей квантуется с использованием ее собственной настройки. Усовершенствованное квантование может выполнять квантование на основе разделов (локальное), при котором каждый кадр разбивается на ряд неперекрывающихся областей, и каждая из неперекрывающихся областей квантуется с использованием ее собственной настройки, но настройки квантователя для конкретной неперекрывающейся области определяются на основе данных анализа, полученных из одной или нескольких перекрывающихся областей. Усовершенствованное квантование может применяться в любом из одного или нескольких разных цветовых пространств. Примеры цветовых пространств, в которых может применяться усовершенствованное квантование, включают в качестве неограничивающих примеров любое из следующих пространств: цветовые пространства RGB, цветовые пространства YCbCr, цветовые пространства YCoCg, цветовые пространства ACES или другие цветовые пространства.
[0103] В некоторых вариантах осуществления цветовое пространство, в котором применяется квантование, остается таким же, как цветовое пространство, в котором выполняется предсказание. Это может быть как в процессе кодирования VDR-изображения, так и в процессе декодирования VDR-изображения. Преобразование цветового пространства может при необходимости выполняться, если цветовое пространство, в котором происходит представление изображения, отличается от цветового пространства, в котором происходит квантование.
4. ЛИНЕЙНОЕ РАСТЯЖЕНИЕ
[0104] В примерном варианте осуществления при усовершенствованном квантовании, проиллюстрированном на ФИГ. 1 и ФИГ. 2, в цветовом пространстве YCbCr, как проиллюстрировано на ФИГ. 3, или в цветовом пространстве RGB может применяться адаптирующийся к сцене способ квантования корректировки динамического диапазона. Максимальное значение в цветовом канале i в одной рассматриваемой сцене можно обозначить как νi,max. Минимальное значение в цветовом канале i в одной рассматриваемой сцене можно обозначить как νi,min. Диапазон, определяемый минимумом и максимумом, и/или распределением точек данных в пределах диапазона может изменяться на основе содержимого изображения от кадра к кадру, от нескольких кадров к нескольким кадрам, от сцены к сцене, от нескольких сцен к нескольким сценам, от программы к программе и т.д.
[0105] Значение подлежащего обработке пиксела в цветовом канале i можно обозначить как νi. Там, где пространство кодирования VDR (например, светимости) имеет глубину 16 битов (или 12+битов по ФИГ. 1 и ФИГ. 2), сохраняет справедливость следующее выражение:
Figure 00000001
[0106] Адаптирующийся к сцене способ квантования корректировки динамического диапазона отображает весь диапазон
Figure 00000002
в стандартный диапазон 8-битного YCbCr 709
Figure 00000003
следующим образом:
Figure 00000004
где si обозначает преобразованное значение пиксела в данных изображения, генерируемых посредством усовершенствованного квантования, проиллюстрированного на ФИГ. 1 и ФИГ. 2. В выражении (2) оператор round() обеспечивает то, что вывод будет целым числом. За округлением также может следовать функция отсечения. Например, отрицательные значения могут отсекаться до нуля, а положительные значения больше 255 могут отсекаться до 255.
[0107] Как проиллюстрировано на ФИГ. 3, адаптирующееся к сцене квантование корректировки динамического диапазона может использоваться для того, чтобы полностью использовать весь 8-битный динамический диапазон. Горизонтальная ось графика диапазон квантования-индекс кадра по ФИГ. 3 представляет переменную индекса кадра. Минимальное значение для линейного растяжения, si,min в каждом кадре, как указывается графиком 302, может устанавливаться таким же, как минимальное значение νi,min в этом кадре, как указывается графиком 304. Максимальное значение линейного растяжения, si,max в каждом кадре, как указывается графиком 306, однако, может устанавливаться как не меньшее, чем максимальное значение, νi,max в этом кадре, как указывается графиком 308. Как изображено на ФИГ. 3, в кадре 2200, согласно другим методикам кодирования (например, иным, чем методики кодирования с линейным растяжением), максимальное значение составляет около 140. Для сравнения, при использовании методик линейного растяжения, описываемых в настоящем раскрытии, максимальное значение для кадра 2200 расширяется до примерно 225. Таким образом, линейное растяжение, описываемое в настоящем раскрытии, обеспечивает больше этапов квантования относительно других методик кодирования и, поэтому, обеспечивает лучшую разрешающую способность для деталей. Как проиллюстрировано, отсечение начинает происходить в кадре возле кадра 2400 и продолжается до кадра 2600 как для линейного растяжения, так и для других методик.
5. ПРИМЕРНЫЕ ПОСЛЕДОВАТЕЛЬНОСТИ ОПЕРАЦИЙ ПРОЦЕССОВ
[0108] На ФИГ. 4А показана примерная последовательность операций процесса согласно примерному варианту осуществления настоящего изобретения. В некоторых примерных вариантах осуществления эту последовательность операций процесса может выполнять одно или несколько вычислительных устройств или компонентов. В блоке 402 многоуровневый VDR-видеокодер (например, 102 по ФИГ. 1) принимает входное изображение с визуальным динамическим диапазоном (VDR) в последовательности входных изображений.
[0109] В блоке 404 многоуровневый VDR-видеокодер (102) выбирает конкретный способ усовершенствованного квантования из одного или нескольких доступных способов усовершенствованного квантования.
[0110] В блоке 406 многоуровневый VDR-видеокодер (102) применяет конкретный способ усовершенствованного квантования к входному VDR-изображению, генерируя входное изображение базового уровня. В примерном варианте осуществления входное VDR-изображение содержит данные VDR-изображения с большей битовой глубиной, в то время как входное изображение базового уровня содержит данные VDR-изображения с меньшей битовой глубиной.
[0111] В блоке 408 многоуровневый VDR-видеокодер (102) сжимает данные изображения, полученные из входного изображения базового уровня в видеосигнал базового уровня (BL).
[0112] В блоке 410 многоуровневый VDR-видеокодер (102) сжимает, по меньшей мере, часть данных изображения, полученных из входного VDR-изображения, в один или несколько видеосигналов уровня расширения (EL).
[0113] В примерном варианте осуществления многоуровневый VDR-видеокодер (102) декодирует изображение базового уровня из видеосигнала BL, где изображение базового уровня соответствует входному изображению базового уровня; выбирает способ предсказания из одного или нескольких способов предсказания; генерирует предсказанное изображение, по меньшей мере, частично на основе изображения базового уровня с использованием способа предсказания; генерирует остаточные значения на основе предсказанного изображения и входного VDR-изображения; применяет нелинейное квантование к остаточным значениям для генерирования данных выходного изображения EL, где остаточные значения содержат значения с большей битовой глубиной, и данные выходного изображения EL содержат значения с меньшей битовой глубиной; и сжимает данные выходного изображения EL в один или несколько видеосигналов EL.
[0114] В примерном варианте осуществления способ предсказания выбирается на основе отношения соответствия между способом усовершенствованного квантования и способом предсказания.
[0115] В примерном варианте осуществления способ усовершенствованного квантования содержит один или несколько из следующих способов: глобальное квантование, линейное квантование, линейное растяжение, квантование на основе кривой, квантование, оптимизированное функцией плотности вероятности (Pdf), квантование Ллойда-Макса, квантование на основе разделов, перцептивное квантование, векторное квантование или другие типы квантования.
[0116] В примерном варианте осуществления последовательность входных изображений содержит второе, отличающееся входное VDR-изображение; и многоуровневый видеокодер (102) выбирает второй, отличающийся конкретный способ усовершенствованного квантования из одного или нескольких доступных способов усовершенствованного квантования; применяет второй, отличающийся конкретный способ усовершенствованного квантования ко второму входному VDR-изображению для генерирования второго входного изображения базового уровня; сжимает вторые данные изображения, полученные из второго входного изображения базового уровня, в видеосигнал базового уровня (BL); и сжимает, по меньшей мере, часть данных изображения, полученных из второго входного VDR-изображения, в один или несколько видеосигналов уровня расширения (EL).
[0117] В примерном варианте осуществления многоуровневый видеокодер (102) декодирует второе, отличающееся изображение BL из указанного видеосигнала базового уровня, где второе изображение BL соответствует второму входному изображению BL; выбирает второй, отличающийся способ предсказания из одного или нескольких способов предсказания; генерирует второе предсказанное изображение, по меньшей мере, частично на основе второго изображения BL с использованием второго способа предсказания; вычисляет вторые, отличающиеся остаточные значения на основе второго предсказанного изображения и второго входного VDR-изображения; применяет нелинейное квантование ко вторым остаточным значениям для генерирования данных второго выходного изображения EL, где вторые остаточные значения содержат значения с большей битовой глубиной, и данные второго выходного изображения EL содержат значения с меньшей битовой глубиной; и сжимает данные выходного изображения EL в один или несколько видеосигналов EL.
[0118] В примерном варианте осуществления данные изображения во входном изображении базового уровня сжимаются в видеосигнал BL первым 8-битным кодером в кодере VDR, в то время, как, по меньшей мере, часть данных изображения во входном VDR-изображении сжимается в один или несколько видеосигналов уровня расширения (EL) вторым 8-битным кодером в кодере VDR.
[0119] В примерном варианте осуществления способ усовершенствованного квантования выбирается на основе одного или нескольких факторов, включающих в качестве неограничивающего примера минимизацию количества данных изображения, подлежащих кодированию в один или несколько видеосигналов EL, относительно входного VDR-изображения.
[0120] В примерном варианте осуществления способ усовершенствованного квантования выбирается на основе одного или нескольких факторов, включающих в качестве неограничивающих примеров любую из одной или нескольких характеристик, определяемых исходя из входного VDR-изображения.
[0121] В примерном варианте осуществления, цветокоррекция художником-колористом исключается после приема входного VDR-изображения многоуровневым видеокодером (102).
[0122] В примерном варианте осуществления для хранения данных изображения, полученных из входного изображения базового уровня, используется первый контейнер изображения, в то время как второй, отличающийся контейнер изображения используется для хранения, по меньшей мере, части данных изображения во входном VDR-изображении. В примерном варианте осуществления по меньшей мере один из первого контейнера изображения или второго контейнера изображения, содержит значения пикселов в одном или нескольких каналах в цветовом пространстве. В примерном варианте осуществления по меньшей мере один из первого контейнера изображения или второго контейнера изображения, выбирается из ряда контейнеров изображений, связанных с рядом схем дискретизации, где ряд схем дискретизации содержит любую из следующих схем: схема дискретизации 4:4:4, схема дискретизации 4:2:2, схема дискретизации 4:4:0 или другие схемы дискретизации.
[0123] В примерном варианте осуществления многоуровневый видеокодер (102) преобразовывает один или несколько входных VDR-изображений, представляемых, принимаемых, передаваемых или хранимых одним или несколькими входными видеосигналами, в одно или несколько выходных VDR-изображений, представляемых, принимаемых, передаваемых или хранимых одним или несколькими выходными видеосигналами.
[0124] В примерном варианте осуществления по меньшей мере одно из входного VDR-изображения и одного или нескольких видеосигналов EL, содержит данные изображения, кодированные в одном из следующих форматов: формат изображения с расширенным динамическим диапазоном (HDR), цветовое пространство RGB, связанное со стандартом «спецификация академии, определяющая параметры цветового кодирования» (ACES) Американской академии кинематографических искусств и наук (AMPAS), стандарт цветового пространства РЗ Организации инициативных исследований в области цифровой кинематографии, стандарт «метрика образцового входного материала/метрика образцового выходного материала» (RIMM/ROMM), цветовое пространство sRGB или цветовое пространство RGB, связанное со стандартом «рекомендация ВТ.709» Международного союза электросвязи (ITU).
[0125] На ФИГ. 4B показана примерная последовательность операций процесса согласно примерному варианту осуществления настоящего изобретения. В некоторых примерных вариантах осуществления эту последовательность операций процесса может выполнять одно или несколько вычислительных устройств или компонентов. В блоке 452 многоуровневый видеодекодер (например, 150 по ФИГ. 1) генерирует, по меньшей мере, часть данных изображения для VDR-изображения в последовательности входных изображений на основе одного или нескольких видеосигналов уровня расширения (EL).
[0126] В блоке 454 многоуровневый видеодекодер (150) генерирует изображение базового уровня на основе видеосигнала базового уровня (BL), где изображение базового уровня содержит данные VDR-изображения с меньшей битовой глубиной для VDR-изображения, генерируемого конкретным способом усовершенствованного квантования, выбранным из одного или нескольких доступных способов усовершенствованного квантования.
[0127] В блоке 456 многоуровневый видеодекодер (150) реконструирует версию VDR-изображения с большей битовой глубиной на основе изображения базового уровня и, по меньшей мере, части данных изображения.
[0128] В примерном варианте осуществления многоуровневый видеодекодер (150) принимает метаданные предсказания, содержащие набор параметров отображения, но не ограничиваясь этим; определяет способ предсказания на основе метаданных предсказания; генерирует предсказанное изображение, по меньшей мере, частично на основе изображения базового уровня с использованием способа предсказания; реконструирует версию VDR-изображения с большей битовой глубиной путем объединения предсказанного изображения с, по меньшей мере, частью данных изображения, полученных из одного или нескольких видеосигналов EL.
[0129] В примерном варианте осуществления способ предсказания соответствует способу усовершенствованного квантования.
[0130] В примерном варианте осуществления способ усовершенствованного квантования содержит один или несколько из следующих способов: глобальное квантование, линейное квантование, линейное растяжение, квантование на основе кривой, квантование, оптимизированное функцией плотности вероятности (Pdf), квантование Ллойда-Макса, квантование на основе разделов, перцептивное квантование, векторное квантование или другие типы квантования.
[0131] В примерном варианте осуществления изображение базового уровня получают первым 8-битным декодером в декодере VDR из видеосигнала BL, в то время как, по меньшей мере, часть данных изображения в VDR-изображении получают вторым 8-битным декодером в декодере VDR из одного или нескольких видеосигналов уровня расширения (EL).
[0132] В примерном варианте осуществления способ усовершенствованного квантования выбирается на основе одного или нескольких факторов, включающих в качестве неограничивающего примера минимизацию объема данных изображения, подлежащих доставке из одного или нескольких видеосигналов EL, относительно исходного VDR-изображения.
[0133] В примерном варианте осуществления для хранения данных изображения в изображении базового уровня используется первый контейнер изображения, в то время как второй, отличающийся контейнер изображения используется для хранения, по меньшей мере, части данных изображения для VDR-изображения. В примерном варианте осуществления по меньшей мере один из первого контейнера изображения или второго контейнера изображения содержит значения пикселов в одном или нескольких каналах в цветовом пространстве. В примерном варианте осуществления по меньшей мере один из первого контейнера изображения или второго контейнера изображения выбирается из ряда контейнеров изображений, связанных с рядом схем дискретизации, где ряд схем дискретизации содержит любую из следующих схем: схема дискретизации 4:4:4, схема дискретизации 4:2:2, схема дискретизации 4:4:0 или другие схемы дискретизации.
[0134] В примерном варианте осуществления многоуровневый видеодекодер (150) обрабатывает одно или несколько VDR-изображений, представляемых, принимаемых, передаваемых или хранимых одним или несколькими входными видеосигналами.
[0135] В примерном варианте осуществления, по меньшей мере, часть версии VDR-изображения с большей битовой глубиной содержит данные изображения, кодированные в одном из следующих форматов: формат изображения с расширенным динамическим диапазоном (HDR), цветовое пространство RGB, связанное со стандартом «спецификация академии, определяющая параметры цветового кодирования» (ACES) Американской академии кинематографических искусств и наук (AMPAS), стандарт цветового пространства РЗ организации инициативных исследований в области цифровой кинематографии, стандарт «метрика образцового входного материала/метрика образцового выходного материала» (RIMM/ROMM), цветовое пространство sRGB или цветовое пространство RGB, связанное со стандартом «рекомендация BT.709» Международного союза электросвязи (ITU).
[0136] В различных примерных вариантах осуществления кодер, декодер, система, устройство и одно или несколько других вычислительных устройств выполняют любой из вышеописанных способов или его часть.
6. АДАПТИВНАЯ КОРРЕКТИРОВКА ДИНАМИЧЕСКОГО ДИАПАЗОНА
[0137] Постепенные проявления и исчезновения изображения представляют собой специальные эффекты при переходах между сценами, которые обычно используются в видеопроизводстве. При постепенном проявлении изображения яркость постепенно увеличивается до тех пор, пока сцена не будет иметь полную яркость. В ходе постепенного исчезновения изображения сцена начинается при полной яркости и постепенно исчезает. По причине изменения светимости в ходе этих переходов, методики оценки движения могут терпеть неудачу при точном определении наилучших векторов движения, что в результате приводит к большим остаткам и менее эффективному кодированию видеоизображений.
[0138] В некоторых вариантах осуществления, где применяется квантователь с линейным растяжением (например, по уравнению (2)), желательно поддерживать относительно постоянный VDR для этапа квантования базового уровня (BL) в пределах сцены. Это подход, обозначаемый в настоящем раскрытии как «адаптация на основе сцены», уменьшает объем относящихся к квантованию метаданных, которые необходимо передавать из кодера в декодер, и, таким образом, поддерживает в сцене относительно постоянную яркость, что способствует последующему процессу сжатия. Однако такой подход может не являться подходящим в ходе постепенного проявления или исчезновения изображения. Как описывается в настоящем раскрытии, для подобных переходов может лучше подходить «адаптация на покадровой основе».
[0139] Предположим, что в ходе перехода с постепенным проявлением или исчезновением изображения имеется F кадров. Для некоторой цветовой составляющей (например, для светимости Y) для i-го кадра в оригинальной VDR-последовательности, обозначим максимальные и минимальные значения для этой цветовой составляющей, соответственно, как νH,i и νL,i (i=0, …, F-1). Аналогично, обозначим максимальное и минимальное значения для соответствующей цветовой составляющей в i-м кадре BL, соответственно, как cH,i и cL,i (i=0, …, F-1). С использованием способа квантования посредством линейного растяжения по уравнению (2), значение j-го пиксела в i-м кадре квантованного потока базового уровня можно выразить как:
Figure 00000005
[0140] где νji обозначает значение j-го пиксела в i-м VDR-кадре, и O обозначает смещение при округлении (например, O=0,5 или O=0). В том смысле, как она применяется в настоящем раскрытии, функция округления в меньшую сторону [x] вычисляет самое большое целое число, меньшее или равное x.
[0141] Для сцены с постепенным исчезновением изображения первый кадр должен иметь максимальный динамический диапазон, а именно: νH,0≥νH,i для 0<i<F.
[0142] Для сцены с постепенным проявлением изображения, последний кадр должен иметь максимальный динамический диапазон, а именно: νH,F-1≥νH,i для 0≤i≤F.
[0143] Для данной выше формулы, задача, которая возникает, заключается в том, как в уравнении (3) можно адаптивно корректировать параметры
Figure 00000006
и
Figure 00000007
с целью оптимизации последующего выполнения кодирования.
Способ полного перебора
[0144] В одном из вариантов осуществления можно испытать все возможные сочетания
Figure 00000008
и
Figure 00000009
, и выбрать те переменные, которые обеспечивают наилучшее общее сжатие. Однако даже если приравнять cL,i=0 для 8-битных данных, для cH,i существует 255F возможных сочетаний, испытывать и проверять которые при кодировании в реальном времени может оказаться непрактичным.
Способ равных максимальных значений
[0145] В другом варианте осуществления изобретения, можно приравнять все значения cH.i (i=0, …, F-1) зависящему от сцены максимальному значению, cH,max. В одном из вариантов осуществления cH,max может представлять значение, которое используется либо в предыдущей, либо в следующей сцене с постоянной яркостью, а именно: в сцене с отсутствием постепенного проявления или исчезновения изображения (например, cH,i=cH,max=255 для всех i в интервале [0,F-1]). Аналогично, cL,i может приравниваться минимальному значению, cL,min, которое использовалось в предыдущей или следующей сцене без постепенного проявления/исчезновения изображения (например, cL,i=cL,min=0 для всех i в интервале [0,F-1]). В таком варианте осуществления изобретения, все кадры BL в пределах сцены с постепенным проявлением или исчезновением изображения будут иметь одинаковый динамический диапазон
Figure 00000010
; однако этап квантования VDR в BL может отличаться от кадра к кадру. Исходя из уравнения (3), данный подход к адаптивному квантованию (также именуемый покадровой адаптацией) для переходов постепенного проявления и исчезновения изображения можно выразить как:
[0146]
Figure 00000011
[0147] Далее описывается алгоритм принятия решения при определении того, следует применять адаптацию на основе сцены (например, применять уравнения (2) или (3) с постоянным квантованием для всей сцены) или покадровую адаптацию (например, применять уравнение (4)).
Алгоритм принятия решения
[0148] В одном из вариантов осуществления рассмотрим два последовательных VDR-кадра, скажем, кадры νi-1 и νi. Тогда алгоритм принятия решения можно получить путем сравнения гистограмм соответствующих квантованных кадров BL si-1 и si. Несмотря на то, что алгоритм описывается для единственной цветовой составляющей (например, светимости), операции могут повторяться для всех цветовых составляющих.
Этап 1. Предполагая покадровое
Figure 00000012
адаптивное квантование, вычислить значения BL для пикселов. Для заданных кадров νi-1 и νi можно применить уравнение (4) для вычисления значений пикселов в соответствующих кадрах BL как:
(a) Для кадра i-1:
Figure 00000013
(b) Для кадра i:
Figure 00000014
[0149] Без потери общности, допуская 8 битов на цветовую составляющую в потоке BL, для кадров si-1 и si можно использовать выходные данные уравнений (5) и (6) для вычисления соответствующих гистограмм с 256 двоичных чисел каждая, как
Figure 00000015
и
Figure 00000016
для n=0, 1, …, 255. В том смысле, как он используется в настоящем раскрытии, термин «гистограмма» обозначает функцию, которая подсчитывает количество наблюдаемых пикселов, которое подпадает под каждый из возможных отдельных значений пиксела. Например,
Figure 00000017
обозначает, что 10 пикселов в кадре i-1 имеют значение 20.
Этап 2. Вычислить среднеквадратичную разность между
Figure 00000018
и
Figure 00000019
.
[0150] Для данных гистограмм, вычисленных на этапе 1, можно вычислить их среднеквадратичные разности как
Figure 00000020
[0151] Данный процесс теперь можно повторить в предположении использования адаптивного квантования на основе сцены (sb).
Этап 3. Вычислить минимальное и максимальное значения пикселов для кадров i-1 и i
Figure 00000021
,
и
Figure 00000022
.
[0152] Затем для заданных кадров νi-1 и νi можно применить эти значения и уравнение (3) для вычисления соответствующих значений пикселов BL как
Figure 00000023
и
Figure 00000024
[0153] Используя выходные данные уравнений (8) и (9), можно вычислить гистограммы кадров
Figure 00000025
и
Figure 00000026
для n=0, 1, …, 255.
Этап 4. Вычислить среднеквадратичную разность между
Figure 00000027
и
Figure 00000028
Figure 00000029
[0154] Этап 5. Адаптивное решение о применении либо покадровой адаптации, либо адаптации на основе сцены может основываться на разности между двумя среднеквадратичными разностями:
если
Figure 00000030
, использовать покадровую корректировку,
иначе
использовать корректировку на основе сцены.
На ФИГ. 6 кратко сформулирован один из вариантов осуществления алгоритма принятия решения, описываемого в настоящем раскрытии. На этапе 610 процесс получает доступ к двум последовательным изображениям (или кадрам) в последовательности входных VDR-изображений. Используя способы, описываемые в настоящем раскрытии, этапы 625 и 630 вычисляют два альтернативных представления соответствующих изображений BL. Этап 625 вычисляет кадры BL, используя покадровую адаптацию (например, с использованием уравнений (5) и (6)). Этап 630 вычисляет изображения BL, используя адаптацию на основе сцены (например, с использованием уравнений (8) и (9)). На основе вычисленных изображений BL этапы 625 и 630 могут вычислять соответствующие гистограммы (например,
Figure 00000031
,
Figure 00000032
,
Figure 00000033
и
Figure 00000034
. При заданных гистограммах, для каждого набора гистограмм этапы 635 и 640 могут вычислять первую и вторую среднеквадратичные разности (например,
Figure 00000035
- по уравнению (7), и
Figure 00000036
- по уравнению (10)). В конечном итоге, на этапе 650 могут сравниваться две среднеквадратичные разности и делаться выбор в качестве способа квантования того способа, который приводит к гистограммам с наименьшей среднеквадратичной разностью.
7. МЕХАНИЗМЫ РЕАЛИЗАЦИИ - ОБЗОР АППАРАТНОГО ОБЕСПЕЧЕНИЯ
[0155] Согласно одному из вариантов осуществления методики, описываемые в настоящем раскрытии, реализуются одним или несколькими специализированными вычислительными устройствами. Специализированные вычислительные устройства могут представлять собой аппаратные решения, предназначенные для выполнения методик, или могут содержать такие цифровые электронные устройства, как одна или несколько специализированных интегральных микросхем (ASIC) или программируемых вентильных матриц (FPGA), которые являются постоянно запрограммированными для выполнения методик, или могут содержать один или несколько аппаратных процессоров общего назначения, запрограммированных для выполнения методик в соответствии с программными командами в программно-аппаратном обеспечении, памяти, другом носителе данных или их сочетании. Для выполнения методик указанные специализированные вычислительные устройства также могут объединять настраиваемую аппаратную логику, микросхемы ASIC или матрицы FPGA с программированием по заказу. Вычислительные устройства специального назначения могут представлять собой настольные компьютерные системы, переносные компьютерные системы, карманные устройства, сетевые устройства или любые другие устройства, которые объединяют аппаратную и/или программную логику для реализации указанных методик.
[0156] Например, ФИГ. 5 представляет собой блок-схему, которая иллюстрирует компьютерную систему 500, в которой может реализовываться примерный вариант осуществления изобретения. Компьютерная система 500 содержит шину 502 или другой механизм связи, предназначенный для передачи информации, и предназначенный для обработки информации аппаратный процессор 504, соединенный с шиной 502. Аппаратный процессор 504 может представлять собой, например, микропроцессор общего назначения.
[0157] Компьютерная система 500 также содержит основную память 506, такую, как память с произвольным доступом (RAM) или другое динамическое запоминающее устройство, соединенное с шиной 502 и предназначенное для хранения информации и команд, подлежащих исполнению процессором 504. Основная память 506 также может использоваться для хранения временных переменных или другой промежуточной информации в ходе исполнения команд, подлежащих исполнению процессором 504. Указанные команды при хранении в памяти постоянного носителя данных, доступной для процессора 504, превращают компьютерную систему 500 в специализированную машину, которая является настроенной для выполнения операций, обусловленных командами.
[0158] Компьютерная система 500 дополнительно содержит постоянное запоминающее устройство (ROM) 508 или другой статический носитель данных, соединенный с шиной 502 и предназначенный для хранения статической информации и команд для процессора 504. Запоминающее устройство 510, такое, как магнитный диск или оптический диск, предусмотрено и соединено с шиной 502 для хранения информации и команд.
[0159] Компьютерная система 500 может соединяться посредством шины 502 с дисплеем 512, таким, как жидкокристаллический дисплей, предназначенным для отображения информации пользователю компьютера. Устройство 514 ввода, содержащее буквенно-цифровые и другие клавиши, соединяется с шиной 502 для передачи информации и выбора команд для процессора 504. Другим типом устройства ввода является устройство 516 управления курсором, такое как мышь, шаровой манипулятор или клавиши управления курсором, предназначенные для передачи информации направления и выбора команд для процессора 504, а также для управления перемещением курсора на дисплее 512. Это устройство ввода, как правило, имеет две степени свободы по двум осям, первой оси (например, x) и второй оси (например, y), что позволяет устройству точно определять положения в плоскости.
[0160] Компьютерная система 500 может реализовывать методики, описываемые в настоящем раскрытии, с использованием настраиваемой аппаратной логики, одной или нескольких микросхем ASIC или матриц FPGA, аппаратной и/или программной логики, которая в сочетании с компьютерной системой обуславливает или программирует компьютерную систему 500 как специализированную машину. Согласно одному варианту осуществления методики, описываемые в настоящем раскрытии, выполняются компьютерной системой 500 в ответ на исполнение процессором 504 одной или нескольких последовательностей из одной или нескольких команд, содержащихся в основной памяти 506. Указанные команды могут считываться в основную память 506 из другого носителя данных, такого, как запоминающее устройство 510. Исполнение последовательностей команд, содержащихся в основной памяти 506, вызывает выполнение процессором 504 этапов процесса, описываемых в настоящем раскрытии. В альтернативных вариантах осуществления вместо команд программного обеспечения или в сочетании с ними может использоваться аппаратная схематика.
[0161] Термин «носитель данных» в том смысле, как он используется в настоящем раскрытии, относится к любым постоянным носителям, которые хранят данные и/или команды, которые вызывают действие машины специфическим образом. Указанные носители данных могут включать энергонезависимые и/или энергозависимые носители. Энергонезависимые носители включают, например, оптические или магнитные диски, такие как запоминающее устройство 510. Энергозависимые носители включают такую динамическую память, как основная память 506. Общеизвестные формы носителей данных включают, например, дискету, гибкий диск, жесткий диск, твердотельный накопитель, магнитную ленту или любой другой магнитный носитель данных, CD-ROM, любой другой оптический носитель данных, любой физический носитель со структурой отверстий, RAM, PROM и EPROM, FLASH-EPROM, NVRAM, любую другую микросхему или кассету памяти.
[0162] Носители данных отличаются, но могут использоваться в сочетании со средствами связи. Средства связи принимают участие в передаче информации между носителями данных. Например, средства связи включают коаксиальный кабель, медную проволоку и волоконную оптику, включая провода, которые включают шину 502. Средства связи также могут принимать форму звуковых или световых волн, таких, как волны, генерируемые в ходе передачи данных через радиоволны и инфракрасные волны.
[0163] В перенос одной или нескольких последовательностей одной или нескольких команд к процессору 504 с целью исполнения могут вовлекаться различные формы носителей. Например, команды могут изначально переноситься на магнитном диске или твердотельном накопителе отдаленного компьютера. Удаленный компьютер может загружать команды в его динамическую память и отправлять команды по телефонной линии с использованием модема. Модем, локальный для компьютерной системы 500, может принимать данные по телефонной линии и использовать инфракрасный передатчик для преобразования данных в инфракрасный сигнал. Инфракрасный детектор может принимать данные, переносимые в инфракрасном сигнале, а соответствующая схематика может помещать данные на шину 502. Шина 502 переносит данные в основную память 506, в которой процессор 504 отыскивает и исполняет команды. Команды, принятые основной памятью 506 могут, необязательно, храниться в запоминающем устройстве 510 либо перед, либо после исполнения процессором 504.
[0164] Компьютерная система 500 также содержит интерфейс 518 связи, соединенный с шиной 502. Интерфейс 518 связи обеспечивает подключение двусторонней передачи данных к сетевой линии 520 связи, которая подключена к локальной сети 522. Например, интерфейс 518 связи может представлять собой карту глобальной цифровой сети с интеграцией служб (ISDN), кабельный модем, спутниковый модем или модем, предназначенный для обеспечения соединения передачи данных с телефонной линией соответствующего типа. В качестве другого примера, интерфейс 518 связи может представлять собой карту локальной сети (LAN), предназначенную для обеспечения соединения передачи данных с совместимой LAN. Также могут реализовываться беспроводные линии связи. В любой такой реализации, интерфейс 518 связи отправляет и принимает электрические, электромагнитные или оптические сигналы, которые переносят потоки цифровых данных, представляющие разные типы информации.
[0165] Сетевая линия 520 связи, как правило, обеспечивает передачу данных через одну или несколько сетей другим устройствам передачи данных. Например, сетевая линия 520 связи может обеспечивать соединение через локальную сеть 522 с главным компьютером 524 или с оборудованием передачи данных, управляемым поставщиком услуг Internet (ISP) 526. ISP 526, в свою очередь, обеспечивает услуги передачи данных через всемирную сеть передачи пакетных данных, в настоящее время обычно именуемую «Интернет» 528. Обе сети, локальная сеть 522 и Интернет 528, используют электрические, электромагнитные или оптические сигналы, которые переносят потоки цифровых данных. Примерами форм средств связи являются сигналы через различные сети и сигналы в сетевой линии 520 связи и через интерфейс 518 связи, которые переносят цифровые данные в компьютерную систему 500 и из нее.
[0166] Компьютерная система 500 может отправлять сообщения и принимать данные, включающие программный код, через сеть (сети), сетевую линию 520 связи и интерфейс 518 связи. В примере Интернета, сервер 530 может передавать затребованный код для прикладной программы через Интернет 528, ISP 526, локальную сеть 522 и интерфейс 518 связи.
[0167] Принимаемый код может исполняться процессором 504 по мере приема и/или сохраняться в запоминающем устройстве 510 или другом энергонезависимом носителе для последующего исполнения.
8. ЭКВИВАЛЕНТЫ, РАСШИРЕНИЯ, АЛЬТЕРНАТИВЫ И РАЗНОЕ
[0168] В предшествующем описании примерные варианты осуществления изобретения были описаны со ссылкой на многочисленные специфические подробности, которые могут меняться от реализации к реализации. Поэтому единственным и исключительным указателем на то, что является изобретением и предполагается заявителями как являющееся изобретением, является набор пунктов формулы изобретения, которые вытекают из данной заявки, в указанной конкретной форме, в которой изложены указанные пункты формулы изобретения, включая любую последующую правку. Любые определения, в прямой форме изложенные в настоящем раскрытии для терминов, содержащихся в указанной формуле изобретения, должны определять смысл указанных терминов, используемых в формуле изобретения. Таким образом, ни одно ограничение, элемент, свойство, признак, преимущество или особенность, которая не перечислена в прямой форме в пункте формулы изобретения, во всяком случае не должна ограничивать объем указанного пункта формулы изобретения. Соответственно, описание и графические материалы следует рассматривать в иллюстративном, а не в ограничительном смысле.

Claims (102)

1. Способ кодирования, включающий:
прием входного изображения с визуальным динамическим диапазоном (VDR) в последовательности входных изображений, где входное VDR-изображение содержит первую битовую глубину;
выбор конкретной функции усовершенствованного квантования из одной или нескольких доступных функций усовершенствованного квантования, выбранных из глобального квантования, линейного квантования, линейного растяжения, квантования на основе кривой, квантования, оптимизированного функцией плотности вероятности (Pdf), квантования Ллойда-Макса, квантования на основе разделов, перцептивного квантования, векторного квантования;
применение функции усовершенствованного квантования к входному VDR-изображению для генерирования входного изображения базового уровня, где входное изображение базового уровня содержит вторую битовую глубину, которая является меньшей, чем первая битовая глубина;
сжатие данных изображения, полученных из входного изображения базового уровня, в видеосигнал базового уровня (BL); и
сжатие по меньшей мере части данных изображения, полученных из входного VDR-изображения, в один или несколько видеосигналов уровня расширения (EL),
причем функцию усовершенствованного квантования выбирают на основе одного или нескольких факторов, включая минимизацию объема данных изображения, подлежащих кодированию в один или несколько видеосигналов EL относительно входного VDR-изображения.
2. Способ по п. 1, отличающийся тем, что дополнительно включает:
декодирование изображения BL из видеосигнала BL, при этом изображение BL соответствует входному изображению BL;
выбор способа предсказания из одного или нескольких способов предсказания;
генерирование предсказанного изображения по меньшей мере частично на основе изображения BL с использованием способа предсказания;
генерирование остаточных значений на основе предсказанного изображения и входного VDR-изображения;
применение нелинейного квантования к остаточным значениям для генерирования данных выходного изображения EL, при этом остаточные значения содержат значения с большей битовой глубиной, и данные выходного изображения EL содержат значения с меньшей битовой глубиной; и
сжатие данных выходного изображения EL в один или несколько видеосигналов EL.
3. Способ по п. 2, отличающийся тем, что способ предсказания выбирают на основе отношения соответствия между функцией усовершенствованного квантования и способом предсказания.
4. Способ по п. 1, отличающийся тем, что последовательность входных изображений содержит второе, отличающееся входное VDR-изображение; и способ дополнительно включает:
выбор второй, отличающейся конкретной функции усовершенствованного квантования из одной или нескольких доступных фукнций усовершенствованного квантования;
применение второй конкретной функции усовершенствованного квантования к второму входному VDR-изображению для генерирования второго входного изображения BL;
сжатие данных второго изображения, полученных из второго входного изображения базового уровня, в видеосигнал BL; и
сжатие по меньшей мере части данных изображения, полученных из второго входного VDR-изображения, в один или несколько видеосигналов EL.
5. Способ по п. 4, отличающийся тем, что дополнительно включает:
декодирование второго, отличающегося изображения BL из видеосигнала BL, при этом второе изображение BL соответствует второму входному изображению BL;
выбор второго, отличающегося способа предсказания из одного или нескольких способов предсказания;
генерирование второго предсказанного изображения по меньшей мере частично на основе второго изображения BL с использованием второго способа предсказания;
генерирование вторых, отличающихся остаточных значений на основе второго предсказанного изображения и второго входного VDR-изображения;
применение нелинейного квантования ко вторым остаточным значениям для генерирования данных второго выходного изображения EL, при этом вторые остаточные значения содержат значения с большей битовой глубиной, а данные второго выходного изображения EL содержат значения с меньшей битовой глубиной; и
сжатие данных выходного изображения EL в один или несколько видеосигналов EL.
6. Способ по п. 1, отличающийся тем, что данные изображения во входном изображении BL сжимают первым 8-битным кодером в кодере VDR в видеосигнал BL, и при этом по меньшей мере часть данных изображения во входном VDR-изображении сжимают вторым 8-битным кодером в кодере VDR в один или несколько видеосигналов EL.
7. Способ по п. 6, отличающийся тем, что по меньшей мере один из первого 8-битного кодера и второго 8-битного кодера содержит один из следующих кодеров: кодер усовершенствованного видеокодирования (AVC), кодер экспертной группы по вопросам движущегося изображения (MPEG-2) или кодер высокоэффективного видеокодирования (HEVC).
8. Способ по п. 1, отличающийся тем, что функцию усовершенствованного квантования выбирают на основе одного или нескольких факторов, включающих одну или несколько характеристик, определяемых исходя из входного VDR-изображения.
9. Способ по п. 1, отличающийся тем, что после приема входного VDR-изображения не осуществляют ручную цветокоррекцию.
10. Способ по п. 1, отличающийся тем, что для хранения данных изображения, полученных из входного изображения BL, используют первый контейнер изображения, и при этом для хранения по меньшей мере части данных изображения во входном VDR-изображении используют второй, отличающийся контейнер изображения.
11. Способ по п. 10, отличающийся тем, что по меньшей мере один из первого контейнера изображения и второго контейнера изображения содержит значения пикселов в одном или нескольких каналах в цветовом пространстве.
12. Способ по п. 10, отличающийся тем, что по меньшей мере один из первого контейнера изображения и второго контейнера изображения выбирают из ряда контейнеров изображения, связанных с рядом схем дискретизации, и при этом ряд схем дискретизации содержит любую из следующих схем: схема дискретизации 4:4:4, схема дискретизации 4:2:2, схема дискретизации 4:2:0.
13. Способ по п. 1, отличающийся тем, что дополнительно включает преобразование одного или нескольких входных VDR-изображений, представляемых, принимаемых, передаваемых или хранимых одним или несколькими входными видеосигналами, в одно или несколько выходных VDR-изображений, представляемых, принимаемых, передаваемых или хранимых одним или несколькими выходными видеосигналами.
14. Способ по п. 1, отличающийся тем, что по меньшей мере одно из входного VDR-изображения и одного или нескольких видеосигналов EL содержит данные изображения, кодированные в одном или нескольких из следующих форматов: формат изображения с расширенным динамическим диапазоном (HDR), цветовое пространство RGB, связанное со стандартом «спецификация академии, определяющая параметры цветового кодирования» (ACES) Американской академии кинематографических искусств и наук (AMPAS), стандарт цветового пространства РЗ организации инициативных исследований в области цифровой кинематографии, стандарт «метрика образцового входного материала/метрика образцового выходного материала» (RIMM/ROMM), цветовое пространство sRGB, или цветовое пространство RGB, или цветовое пространство YCbCr.
15. Способ по п. 1, отличающийся тем, что дополнительно включает:
определение заданного профиля для обработки входного VDR-изображения в видеосигналы BL и EL; и
выполнение одной или нескольких операций, относящихся к заданному профилю, при обработке входного VDR-изображения в видеосигналы BL и EL.
16. Способ по п. 1, отличающийся тем, что выбранная функция усовершенствованного квантования содержит функцию линейного растяжения
Figure 00000037
где νji обозначает j-й пиксел для i-го входного VDR-изображения в последовательности входных изображений, sji обозначает j-й пиксел генерируемого i-го входного изображения базового уровня, νL,i и νH,i обозначают минимальное и максимальное значения пикселов среди пикселов на i-м входном VDR-изображении, cL,i и cH,i обозначают минимальное и максимальное значения пикселов среди пикселов на генерируемом i-м входном изображении базового уровня, и О представляет собой постоянную округления.
17. Способ по п. 1, отличающийся тем, что выбранная функция усовершенствованного квантования содержит функцию адаптации на основе сцены
Figure 00000038
где νji обозначает j-й пиксел на i-м входном VDR-изображении в сцене в последовательности входных изображений, sji обозначает j-й пиксел генерируемого i-го входного изображения базового уровня в сцене, νL,min и νH,max обозначают минимальное и максимальное значения среди значений пикселов на входном VDR-изображении в сцене, cL,min и cH,max обозначают минимальное и максимальное значения пикселов среди пикселов на генерируемых входных изображениях базового уровня в сцене, и О представляет собой постоянную округления.
18. Способ по п. 1, отличающийся тем, что выбранная функция усовершенствованного квантования содержит функцию адаптации на покадровой основе
Figure 00000039
где νji обозначает j-й пиксел на i-м входном VDR-изображении в переходной сцене в последовательности входных изображений, обозначает j-й пиксел генерируемого i-го входного изображения базового уровня в переходной сцене, νL,i и νH,i обозначают минимальное и максимальное значения среди значений пикселов на i-м входном VDR-изображении в переходной сцене, cL, min и cH, max обозначают минимальное и максимальное значения пикселов среди пикселов на генерируемых входных изображениях базового уровня в переходной сцене, и О представляет собой постоянную округления.
19. Способ по п. 18, отличающийся тем, что переходная сцена содержит сцену с постепенным проявлением изображения или сцену с постепенным исчезновением изображения.
20. Способ декодирования, включающий:
генерирование по меньшей мере части данных изображения для VDR-изображения в последовательности входных изображений на основе одного или нескольких видеосигналов уровня расширения (EL);
генерирование изображения базового уровня (BL) на основе видеосигнала BL, при этом изображение BL содержит данные VDR-изображения базового уровня для VDR-изображения, генерируемого конкретной функцией усовершенствованного квантования, выбранной из одной или нескольких доступных функций усовершенствованного квантования, выбранных из глобального квантования, линейного квантования, линейного растяжения, квантования на основе кривой, квантования, оптимизированного функцией плотности вероятности (Pdf), квантования Ллойда-Макса, квантования на основе разделов, перцептивного квантования, векторного квантования; и
реконструирование версии VDR-изображения на основе изображения BL и по меньшей мере части данных изображения, при этом версия VDR-изображения содержит первую битовую глубину, большую, чем вторая битовая глубина, которую содержит изображение BL,
причем функцию усовершенствованного квантования выбирают на основе одного или нескольких факторов, включая минимизацию объема данных изображения, подлежащих получению из одного или нескольких видеосигналов EL относительно входного VDR-изображения.
21. Способ по п. 20, отличающийся тем, что дополнительно включает:
прием метаданных предсказания, содержащих набор параметров отображения;
определение способа прогнозирования на основе метаданных прогнозирования;
генерирование предсказанного изображения по меньшей мере частично на основе изображения BL с использованием способа предсказания;
реконструирование версии VDR-изображения с большей битовой глубиной путем объединения предсказанного изображения с по меньшей мере частью данных изображения, полученных из одного или нескольких видеосигналов EL.
22. Способ по п. 21, отличающийся тем, что способ предсказания соответствует функции усовершенствованного квантования.
23. Способ по п. 21, отличающийся тем, что изображение BL получают первым 8-битным декодером в декодере VDR из видеосигнала BL, и при этом по меньшей мере часть данных изображения в VDR-изображении получают вторым 8-битным декодером в декодере VDR из одного или нескольких видеосигналов уровня расширения (EL).
24. Способ по п. 23, отличающийся тем, что по меньшей мере один из первого 8-битного кодера и второго 8-битного кодера содержит один из следующих кодеров: кодер усовершенствованного видеокодирования (AVC), кодер экспертной группы по вопросам движущегося изображения (MPEG-2) или кодер высокоэффективного видеокодирования (HEVC).
25. Способ по п. 20, отличающийся тем, что для хранения данных изображения в изображении BL используют первый контейнер изображения, и при этом для хранения по меньшей мере части данных изображения в VDR-изображении используют второй, отличающийся контейнер изображения.
26. Способ по п. 25, отличающийся тем, что по меньшей мере один из первого контейнера изображения и второго контейнера изображения содержит значения пикселов в одном или нескольких каналах в цветовом пространстве.
27. Способ по п. 25, отличающийся тем, что по меньшей мере один из первого контейнера изображения и второго контейнера изображения выбирают из ряда контейнеров изображения, связанных с рядом схем дискретизации, и при этом ряд схем дискретизации содержит по меньшей мере схему дискретизации 4:4:4, схему дискретизации 4:2:2, схему дискретизации 4:2:0.
28. Способ по п. 20, отличающийся тем, что дополнительно включает обработку одного или нескольких VDR-изображений, представляемых, принимаемых, передаваемых или хранимых одним или несколькими входными видеосигналами.
29. Способ по п. 20, отличающийся тем, что по меньшей мере часть версии VDR-изображения с большей битовой глубиной содержит данные изображения, кодированные в одном из следующих форматов: формат изображения с расширенным динамическим диапазоном (HDR), цветовые пространства RGB, связанные со стандартом «спецификация академии, определяющая параметры цветового кодирования» (ACES) Американской академии кинематографических искусств и наук (AMPAS), стандарт цветового пространства РЗ организации инициативных исследований в области цифровой кинематографии, стандарт «метрика образцового входного материала/метрика образцового выходного материала» (RIMM/ROMM), цветовое пространство sRGB или цветовое пространство RGB, связанное со стандартом «рекомендация ВТ.709» Международного союза электросвязи (ITU).
30. Способ по п. 20, отличающийся тем, что дополнительно включает:
определение конкретного профиля, относящегося к видеосигналам BL и EL; и
выполнение одной или нескольких операций, относящихся к конкретному профилю, при реконструкции версии VDR-изображения с большей битовой глубиной исходя из видеосигналов BL и EL.
31. Кодер, выполняющий любой из способов по пп. 1-19.
32. Декодер, выполняющий любой из способов по пп. 20-30.
33. Система для обработки медиаданных, выполняющая любой из способов по пп. 1-19.
34. Система для обработки медиаданных, выполняющая любой из способов по пп. 20-30.
35. Система для обработки медиаданных, содержащая: кодер, сконфигурированный для выполнения:
приема входного изображения с визуальным динамическим диапазоном (VDR) в последовательности входных изображений;
выбора конкретной функции усовершенствованного квантования из одной или нескольких доступных функций усовершенствованного квантования, выбранных из глобального квантования, линейного квантования, линейного растяжения, квантования на основе кривой, квантования, оптимизированного функцией плотности вероятности (Pdf), квантования Ллойда-Макса, квантования на основе разделов, перцептивного квантования, векторного квантования;
применения конкретной функции усовершенствованного квантования к входному VDR-изображению для генерирования входного изображения базового уровня, при этом входное VDR-изображение содержит данные VDR-изображения с большей битовой глубиной, а входное изображение базового уровня содержит данные VDR-изображения с меньшей битовой глубиной;
сжатия данных изображения, полученных из входного изображения базового уровня в видеосигнал базового уровня (BL); и
сжатия по меньшей мере части данных изображения, полученных из входного VDR-изображения, в один или несколько видеосигналов уровня расширения (EL);
причем функцию усовершенствованного квантования выбирают на основе одного или нескольких факторов, включая минимизацию объема данных изображения, подлежащих кодированию в один или несколько видеосигналов EL относительно входного VDR-изображения,
декодер, сконфигурированный для выполнения:
генерирования по меньшей мере части данных входного изображения для входного VDR-изображения на основе одного или нескольких видеосигналов уровней расширения (EL);
генерирования изображения BL на основе видеосигнала BL; и
реконструирования версии входного VDR-изображения с большей битовой глубиной на основе изображения BL и по меньшей мере части данных входного изображения.
36. Способ кодирования, включающий:
прием входного изображения с визуальным динамическим диапазоном (VDR) в последовательности входных изображений, где входное VDR-изображение содержит первую битовую глубину;
выбор конкретной функции усовершенствованного квантования из одной или нескольких доступных функций усовершенствованного квантования, выбранных из глобального квантования, линейного квантования, линейного растяжения, квантования на основе кривой, квантования, оптимизированного функцией плотности вероятности (Pdf), квантования Ллойда-Макса, квантования на основе разделов, перцептивного квантования, векторного квантования;
применение функции усовершенствованного квантования к входному VDR-изображению для генерирования входного изображения базового уровня, где входное изображение базового уровня содержит вторую битовую глубину, которая является меньшей, чем первая битовая глубина;
сжатие данных изображения, полученных из входного изображения базового уровня, в видеосигнал базового уровня (BL); и
сжатие по меньшей мере части данных изображения, полученных из входного VDR-изображения, в один или несколько видеосигналов уровня расширения (EL),
причем выбор конкретной функции усовершенствованного квантования из одной или нескольких доступных функций усовершенствованного квантования дополнительно включает:
выбор двух последовательных входных VDR-изображений в последовательности входных изображений;
применение первой функции адаптации для вычисления первого набора из двух соответствующих изображений базового уровня (BL);
применение второй функции адаптации для вычисления второго набора из двух соответствующих изображений BL;
вычисление первого набора гистограмм на основе первого набора изображений BL;
вычисление второго набора гистограмм на основе второго набора изображений BL;
вычисление первой среднеквадратичной разности на основе первого набора гистограмм;
вычисление второй среднеквадратичной разности на основе второго набора гистограмм;
сравнение первой среднеквадратичной разности со второй среднеквадратичной разностью; и
выбор первой функции адаптации, если первая среднеквадратичная разность меньше второй среднеквадратичной разности.
37. Способ по п. 36, отличающийся тем, что первая функция адаптации представляет собой функцию адаптации на покадровой основе, а вторая функция адаптации представляет собой функцию адаптации на основе сцены.
RU2016112589A 2011-11-04 2012-11-01 Декомпозиция уровней в иерархическом кодировании vdr RU2644065C9 (ru)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201161555978P 2011-11-04 2011-11-04
US61/555,978 2011-11-04
US201261596600P 2012-02-08 2012-02-08
US61/596,600 2012-02-08

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
RU2014117573/08A Division RU2586572C2 (ru) 2011-11-04 2012-11-01 Декомпозиция уровней в иерархическом кодировании vdr

Publications (2)

Publication Number Publication Date
RU2644065C1 true RU2644065C1 (ru) 2018-02-07
RU2644065C9 RU2644065C9 (ru) 2018-04-04

Family

ID=47222304

Family Applications (2)

Application Number Title Priority Date Filing Date
RU2016112589A RU2644065C9 (ru) 2011-11-04 2012-11-01 Декомпозиция уровней в иерархическом кодировании vdr
RU2014117573/08A RU2586572C2 (ru) 2011-11-04 2012-11-01 Декомпозиция уровней в иерархическом кодировании vdr

Family Applications After (1)

Application Number Title Priority Date Filing Date
RU2014117573/08A RU2586572C2 (ru) 2011-11-04 2012-11-01 Декомпозиция уровней в иерархическом кодировании vdr

Country Status (10)

Country Link
US (2) US9497456B2 (ru)
EP (2) EP3468203B1 (ru)
JP (4) JP5666756B2 (ru)
KR (1) KR101912249B1 (ru)
CN (3) CN105744277B (ru)
BR (1) BR112014010311B1 (ru)
HK (2) HK1225540A1 (ru)
RU (2) RU2644065C9 (ru)
TW (1) TWI575933B (ru)
WO (1) WO2013067101A1 (ru)

Families Citing this family (70)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7515710B2 (en) 2006-03-14 2009-04-07 Divx, Inc. Federated digital rights management scheme including trusted systems
CN105072454B (zh) 2009-01-07 2019-04-19 索尼克Ip股份有限公司 针对在线内容的媒体指南的特定化、集中式、自动化创建
EP2507995A4 (en) 2009-12-04 2014-07-09 Sonic Ip Inc SYSTEMS AND METHODS FOR TRANSPORTING ELEMENTARY BIT TRAIN CRYPTOGRAPHIC MATERIAL
US11231787B2 (en) 2010-10-06 2022-01-25 Nuvasive, Inc. Imaging system and method for use in surgical and interventional medical procedures
US9247312B2 (en) 2011-01-05 2016-01-26 Sonic Ip, Inc. Systems and methods for encoding source media in matroska container files for adaptive bitrate streaming using hypertext transfer protocol
US9467708B2 (en) 2011-08-30 2016-10-11 Sonic Ip, Inc. Selection of resolutions for seamless resolution switching of multimedia content
US8964977B2 (en) 2011-09-01 2015-02-24 Sonic Ip, Inc. Systems and methods for saving encoded media streamed using adaptive bitrate streaming
US8909922B2 (en) 2011-09-01 2014-12-09 Sonic Ip, Inc. Systems and methods for playing back alternative streams of protected content protected using common cryptographic information
TWI575933B (zh) * 2011-11-04 2017-03-21 杜比實驗室特許公司 階層式視覺動態範圍編碼中之層分解技術
KR101654750B1 (ko) 2012-03-12 2016-09-06 돌비 레버러토리즈 라이쎈싱 코오포레이션 3d 시각적 다이나믹 레인지 코딩
US9219916B2 (en) 2012-06-12 2015-12-22 Dolby Laboratories Licensing Corporation Joint base layer and enhancement layer quantizer adaptation in EDR video coding
JP6060394B2 (ja) * 2012-06-27 2017-01-18 インテル・コーポレーション クロスレイヤー・クロスチャネル残差予測
CN109068136B (zh) 2012-12-18 2022-07-19 索尼公司 图像处理装置和图像处理方法、计算机可读存储介质
US9313510B2 (en) 2012-12-31 2016-04-12 Sonic Ip, Inc. Use of objective quality measures of streamed content to reduce streaming bandwidth
US9191457B2 (en) 2012-12-31 2015-11-17 Sonic Ip, Inc. Systems, methods, and media for controlling delivery of content
CN105580369B (zh) 2013-03-11 2019-04-26 杜比实验室特许公司 使用分层编码对多格式高动态范围视频进行编解码的方法、装置及系统
US9906785B2 (en) 2013-03-15 2018-02-27 Sonic Ip, Inc. Systems, methods, and media for transcoding video data according to encoding parameters indicated by received metadata
RU2619886C2 (ru) 2013-03-26 2017-05-19 Долби Лабораторис Лайсэнзин Корпорейшн Кодирование перцепционно-квантованного видеоконтента в многоуровневом кодировании vdr
US9094737B2 (en) 2013-05-30 2015-07-28 Sonic Ip, Inc. Network video streaming with trick play based on separate trick play files
WO2014204865A1 (en) 2013-06-17 2014-12-24 Dolby Laboratories Licensing Corporation Adaptive reshaping for layered coding of enhanced dynamic range signals
US9712834B2 (en) * 2013-10-01 2017-07-18 Dolby Laboratories Licensing Corporation Hardware efficient sparse FIR filtering in video codec
US9648351B2 (en) 2013-10-24 2017-05-09 Dolby Laboratories Licensing Corporation Error control in multi-stream EDR video codec
US10027963B2 (en) 2013-11-12 2018-07-17 Dolby Laboratories Licensing Corporation Pre-dithering in high dynamic range video coding
KR101683175B1 (ko) * 2014-03-06 2016-12-06 삼성전자주식회사 영상 복호화 방법 및 그 장치, 영상 부호화 방법 및 그 장치
US9866878B2 (en) * 2014-04-05 2018-01-09 Sonic Ip, Inc. Systems and methods for encoding and playing back video at different frame rates using enhancement layers
US10136147B2 (en) 2014-06-11 2018-11-20 Dolby Laboratories Licensing Corporation Efficient transcoding for backward-compatible wide dynamic range codec
RU2017101574A (ru) * 2014-06-19 2018-07-19 Вид Скейл, Инк. Системы и способы для оптимизации параметра модели в основанном на трехмерном представлении отображении цветов
US9866734B2 (en) 2014-08-26 2018-01-09 Dolby Laboratories Licensing Corporation Scene-change detection using video stream pairs
EP3198556B1 (en) 2014-09-26 2018-05-16 Dolby Laboratories Licensing Corp. Encoding and decoding perceptually-quantized video content
EP3213291B1 (en) 2014-10-27 2019-11-06 Dolby Laboratories Licensing Corporation Content mapping using extended color range
CN110214446B (zh) * 2015-02-17 2020-07-24 杜比实验室特许公司 用于具有增强动态范围的信号的层间预测
US10419762B2 (en) 2015-03-02 2019-09-17 Dolby Laboratories Licensing Corporation Content-adaptive perceptual quantizer for high dynamic range images
JP6374614B2 (ja) 2015-03-20 2018-08-15 ドルビー ラボラトリーズ ライセンシング コーポレイション 信号再整形近似
WO2016172091A1 (en) 2015-04-22 2016-10-27 Dolby Laboratories Licensing Corporation Signal reshaping and coding in the ipt-pq color space
US10244245B2 (en) * 2015-06-08 2019-03-26 Qualcomm Incorporated Content-adaptive application of fixed transfer function to high dynamic range (HDR) and/or wide color gamut (WCG) video data
EP3314893A1 (en) * 2015-06-30 2018-05-02 Dolby Laboratories Licensing Corporation Real-time content-adaptive perceptual quantizer for high dynamic range images
EP4020995A1 (en) 2015-07-16 2022-06-29 Dolby Laboratories Licensing Corporation Signal reshaping and coding for hdr and wide color gamut signals
US10575005B2 (en) * 2015-07-22 2020-02-25 Dolby Laboratories Licensing Corporation Video coding and delivery with both spatial and dynamic range scalability
CN107852502B (zh) 2015-07-28 2021-07-20 杜比实验室特许公司 用于增强视频信号的位深的方法、编码器、解码器和系统
US10129558B2 (en) 2015-09-21 2018-11-13 Qualcomm Incorporated Supplement enhancement information (SEI) messages for high dynamic range and wide color gamut video coding
US10244249B2 (en) 2015-09-21 2019-03-26 Qualcomm Incorporated Fixed point implementation of range adjustment of components in video coding
CN108141599B (zh) * 2015-09-23 2022-01-18 杜比实验室特许公司 在视频编解码器中保留纹理/噪声一致性
EP3151562B1 (en) 2015-09-29 2020-06-17 Dolby Laboratories Licensing Corporation Feature based bitrate allocation in non-backward compatible multi-layer codec via machine learning
US10283032B2 (en) 2015-10-07 2019-05-07 Samsung Display Co., Ltd. Integrated circuit for nonlinear data encoding
US10311558B2 (en) * 2015-11-16 2019-06-04 Dolby Laboratories Licensing Corporation Efficient image processing on content-adaptive PQ signal domain
CN108370446B (zh) * 2015-12-09 2022-02-25 杜比实验室特许公司 具有减小的内插误差的低复杂度查找表构造
US10032262B2 (en) * 2016-02-02 2018-07-24 Dolby Laboratories Licensing Corporation Block-based content-adaptive reshaping for high dynamic range images
WO2017165494A2 (en) 2016-03-23 2017-09-28 Dolby Laboratories Licensing Corporation Encoding and decoding reversible production-quality single-layer video signals
US10904534B2 (en) 2016-04-19 2021-01-26 Dolby Laboratories Licensing Corporation Enhancement layer masking for high-dynamic range video coding
US10074162B2 (en) * 2016-08-11 2018-09-11 Intel Corporation Brightness control for spatially adaptive tone mapping of high dynamic range (HDR) images
CN108632192B (zh) 2017-03-24 2020-04-03 华为技术有限公司 数据传输的方法、设备和系统
EP3386198A1 (en) * 2017-04-07 2018-10-10 Thomson Licensing Method and device for predictive picture encoding and decoding
CN110770787B (zh) 2017-06-16 2023-04-07 杜比实验室特许公司 高效端到端单层逆向显示管理编码
CN110999300B (zh) * 2017-07-24 2023-03-28 杜比实验室特许公司 用于图像/视频处理的单通道逆映射
FR3076386B1 (fr) * 2017-12-29 2020-02-07 Ateme Methode de compression dynamique
BR112020016821B1 (pt) 2018-02-28 2022-08-09 Dolby Laboratories Licensing Corporation Método de geração de metadados de remodelagem de luma e croma com um sistema de processamento, meio legível por máquina e sistema de gerenciamento de exibição
EP3782365A1 (en) * 2018-04-16 2021-02-24 InterDigital VC Holdings, Inc. Quantization parameter prediction for video encoding and decoding
US10796200B2 (en) * 2018-04-27 2020-10-06 Intel Corporation Training image signal processors using intermediate loss functions
TW201946430A (zh) * 2018-04-30 2019-12-01 圓剛科技股份有限公司 影像訊號轉換裝置及方法
US11151748B2 (en) * 2018-07-13 2021-10-19 Electronics And Telecommunications Research Institute 3D point cloud data encoding/decoding method and apparatus
EP3864845A1 (en) * 2018-10-09 2021-08-18 V-Nova International Ltd Dynamic range support within a multi-layer hierarchical coding scheme
CN111191783B (zh) * 2018-11-15 2024-04-05 嘉楠明芯(北京)科技有限公司 一种自适应量化方法及装置、设备、介质
CN110730350B (zh) * 2019-09-25 2021-08-24 杭州电子科技大学 结合编码深度估计和贝叶斯判决的shvc快速编码方法
JP7391214B2 (ja) * 2019-11-27 2023-12-04 ドルビー ラボラトリーズ ライセンシング コーポレイション Hdr画像化におけるレート制御認識リシェーピング
US11923070B2 (en) 2019-11-28 2024-03-05 Braid Health Inc. Automated visual reporting technique for medical imaging processing system
CN111402380B (zh) * 2020-03-12 2023-06-30 杭州小影创新科技股份有限公司 一种gpu压缩纹理处理方法
CN112040240B (zh) * 2020-11-03 2021-08-27 深圳市大疆创新科技有限公司 数据处理方法、设备和存储介质
KR102566794B1 (ko) * 2021-05-17 2023-08-14 엘지전자 주식회사 디스플레이 장치 및 그의 동작 방법
EP4349012A1 (en) 2021-06-01 2024-04-10 Dolby Laboratories Licensing Corporation Rotation-enabled high dynamic range video encoding
CN117354534B (zh) * 2023-12-04 2024-02-02 上海方诚光电科技有限公司 一种自适应图像无损压缩方法、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090046207A1 (en) * 2006-12-18 2009-02-19 Emanuele Salvucci Multi-compatible low and high dynamic range and high bit-depth texture and video encoding system
RU2378790C1 (ru) * 2005-09-27 2010-01-10 Квэлкомм Инкорпорейтед Методики масштабируемости на основе информации содержимого
EP2144444A1 (en) * 2008-07-10 2010-01-13 The University Of Warwick HDR video data compression devices and methods
WO2010105036A1 (en) * 2009-03-13 2010-09-16 Dolby Laboratories Licensing Corporation Layered compression of high dynamic range, visual dynamic range, and wide color gamut video
US20110090959A1 (en) * 2008-04-16 2011-04-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Bit-depth scalability

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9102220D0 (en) 1991-02-01 1991-03-20 British Telecomm Method and apparatus for decoding video signals
US6111596A (en) * 1995-12-29 2000-08-29 Lucent Technologies Inc. Gain and offset correction for efficient stereoscopic coding and improved display
US6118820A (en) * 1998-01-16 2000-09-12 Sarnoff Corporation Region-based information compaction as for digital images
US6275531B1 (en) 1998-07-23 2001-08-14 Optivision, Inc. Scalable video coding method and apparatus
US8218625B2 (en) * 2004-04-23 2012-07-10 Dolby Laboratories Licensing Corporation Encoding, decoding and representing high dynamic range images
CN101742306A (zh) 2006-01-23 2010-06-16 马普科技促进协会 高动态范围编解码器
US8014445B2 (en) 2006-02-24 2011-09-06 Sharp Laboratories Of America, Inc. Methods and systems for high dynamic range video coding
KR101267178B1 (ko) * 2006-09-30 2013-05-24 톰슨 라이센싱 비디오에 대하여 색 인핸스먼트 계층을 인코딩 및 디코딩하기 위한 방법 및 디바이스
BRPI0622064A2 (pt) * 2006-10-25 2014-05-27 Thomson Licensing Novos elementos de sintaxe para padrões de codificação de vídeo com fornecimento de suporte para capacitação de profundidade de bit de cor
CN101589625B (zh) * 2006-10-25 2011-09-21 弗劳恩霍夫应用研究促进协会 质量可缩放编码
US8503524B2 (en) 2007-01-23 2013-08-06 Sharp Laboratories Of America, Inc. Methods and systems for inter-layer image prediction
CN101663896A (zh) * 2007-04-23 2010-03-03 汤姆森许可贸易公司 用于对视频数据进行编码的方法和设备、用于对编码的视频数据和编码的视频信号进行解码的方法和设备
TW200845723A (en) 2007-04-23 2008-11-16 Thomson Licensing Method and apparatus for encoding video data, method and apparatus for decoding encoded video data and encoded video signal
US8737474B2 (en) 2007-06-27 2014-05-27 Thomson Licensing Method and apparatus for encoding and/or decoding video data using enhancement layer residual prediction for bit depth scalability
KR101366249B1 (ko) 2007-06-28 2014-02-21 삼성전자주식회사 스케일러블 영상 부호화장치 및 방법과 그 영상 복호화장치및 방법
WO2009003499A1 (en) 2007-06-29 2009-01-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Scalable video coding supporting pixel value refinement scalability
CN101828401B (zh) 2007-10-16 2013-07-17 汤姆森许可贸易公司 用于比特深度缩放的伪像去除的方法和设备
US9571856B2 (en) 2008-08-25 2017-02-14 Microsoft Technology Licensing, Llc Conversion operations in scalable video encoding and decoding
US8867616B2 (en) * 2009-02-11 2014-10-21 Thomson Licensing Methods and apparatus for bit depth scalable video encoding and decoding utilizing tone mapping and inverse tone mapping
TWI559779B (zh) 2010-08-25 2016-11-21 杜比實驗室特許公司 擴展影像動態範圍
US8537900B2 (en) * 2010-10-04 2013-09-17 Vidyo, Inc. Automatic temporal layer bit allocation
MX2013003868A (es) * 2010-10-05 2013-06-24 Gen Instrument Corp Metodo y aparatoo para codificacion de video basado en las caracteristicas.
CN103493489B (zh) 2011-04-14 2016-10-19 杜比实验室特许公司 基于原色分级模型的图像预测
WO2012148883A1 (en) 2011-04-25 2012-11-01 Dolby Laboratories Licensing Corporation Non-linear vdr residual quantizer
US9451274B2 (en) 2011-04-28 2016-09-20 Koninklijke Philips N.V. Apparatuses and methods for HDR image encoding and decoding
CN103535038B (zh) 2011-05-16 2017-10-13 杜比实验室特许公司 用于分层vdr编码的有效架构
US9060180B2 (en) * 2011-06-10 2015-06-16 Dolby Laboratories Licensing Corporation Drift-free, backwards compatible, layered VDR coding
TWI575933B (zh) * 2011-11-04 2017-03-21 杜比實驗室特許公司 階層式視覺動態範圍編碼中之層分解技術

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2378790C1 (ru) * 2005-09-27 2010-01-10 Квэлкомм Инкорпорейтед Методики масштабируемости на основе информации содержимого
US20090046207A1 (en) * 2006-12-18 2009-02-19 Emanuele Salvucci Multi-compatible low and high dynamic range and high bit-depth texture and video encoding system
US20110090959A1 (en) * 2008-04-16 2011-04-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Bit-depth scalability
EP2144444A1 (en) * 2008-07-10 2010-01-13 The University Of Warwick HDR video data compression devices and methods
WO2010105036A1 (en) * 2009-03-13 2010-09-16 Dolby Laboratories Licensing Corporation Layered compression of high dynamic range, visual dynamic range, and wide color gamut video

Also Published As

Publication number Publication date
CN105657425A (zh) 2016-06-08
JP2014534743A (ja) 2014-12-18
BR112014010311A2 (pt) 2017-04-18
WO2013067101A1 (en) 2013-05-10
JP2016213849A (ja) 2016-12-15
RU2586572C2 (ru) 2016-06-10
KR101912249B1 (ko) 2018-10-29
EP3468203B1 (en) 2023-09-20
HK1225540A1 (zh) 2017-09-08
KR20140098072A (ko) 2014-08-07
US20140247869A1 (en) 2014-09-04
CN105657425B (zh) 2020-02-14
CN105744277B (zh) 2019-12-24
EP2774370B1 (en) 2018-12-12
US20170019670A1 (en) 2017-01-19
TWI575933B (zh) 2017-03-21
JP2015084560A (ja) 2015-04-30
JP5959607B2 (ja) 2016-08-02
JP5970501B2 (ja) 2016-08-17
CN104322072A (zh) 2015-01-28
BR112014010311B1 (pt) 2022-05-10
US9924171B2 (en) 2018-03-20
CN105744277A (zh) 2016-07-06
JP2014197893A (ja) 2014-10-16
HK1202742A1 (zh) 2015-10-02
CN104322072B (zh) 2016-04-20
US9497456B2 (en) 2016-11-15
TW201332363A (zh) 2013-08-01
RU2644065C9 (ru) 2018-04-04
EP3468203A1 (en) 2019-04-10
EP2774370A1 (en) 2014-09-10
RU2014117573A (ru) 2015-11-10
JP5666756B2 (ja) 2015-02-12
JP6182644B2 (ja) 2017-08-16

Similar Documents

Publication Publication Date Title
RU2644065C1 (ru) Декомпозиция уровней в иерархическом кодировании vdr
US10237552B2 (en) Multiple color channel multiple regression predictor
CN109416832B (zh) 高效的基于直方图的亮度外观匹配
US10311558B2 (en) Efficient image processing on content-adaptive PQ signal domain
EP2807823B1 (en) Piecewise cross color channel predictor
KR20180043807A (ko) 비디오 디코더에서의 높은 동적 범위 적응 동작들
US11388408B2 (en) Interpolation of reshaping functions
TWI812874B (zh) 張量乘積之b平滑曲線預測子
US20170034521A1 (en) Weighted multi-band cross color channel predictor
US8971408B2 (en) Piecewise cross color channel predictor

Legal Events

Date Code Title Description
TH4A Reissue of patent specification