RU2518406C2 - Сообщение и использование информации о позиции выборки насыщенности цвета - Google Patents

Сообщение и использование информации о позиции выборки насыщенности цвета Download PDF

Info

Publication number
RU2518406C2
RU2518406C2 RU2009131597/07A RU2009131597A RU2518406C2 RU 2518406 C2 RU2518406 C2 RU 2518406C2 RU 2009131597/07 A RU2009131597/07 A RU 2009131597/07A RU 2009131597 A RU2009131597 A RU 2009131597A RU 2518406 C2 RU2518406 C2 RU 2518406C2
Authority
RU
Russia
Prior art keywords
information
color saturation
dimension
phase
image data
Prior art date
Application number
RU2009131597/07A
Other languages
English (en)
Other versions
RU2009131597A (ru
Inventor
Сридхар СРИНИВАСАН
Чэнцзе ТУ
Шанкар РЕГУНАТХАН
Гари Дж САЛЛИВАН
Original Assignee
Майкрософт Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Майкрософт Корпорейшн filed Critical Майкрософт Корпорейшн
Publication of RU2009131597A publication Critical patent/RU2009131597A/ru
Application granted granted Critical
Publication of RU2518406C2 publication Critical patent/RU2518406C2/ru

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Color Television Systems (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

Изобретение относится к кодированию и декодированию данных цифровых носителей. Техническим результатом является повышение эффективности кодирования/декодирования информации о позиции насыщенности цвета. Указанный технический результат достигается тем, что предложен способ кодирования данных цифрового изображения с информацией о позиции насыщенности цвета, содержащий определенные правила для сообщения и интерпретации позиции насыщенности цвета. Короткое правило определяет 15 дискретных позиций центрирования насыщенности цвета и соответствующий 4-битовый элемент синтаксиса. Расширенное правило определяет 81 дискретную позицию центрирования насыщенности цвета и соответствующие 7-битовые элементы синтаксиса. Предложенный способ включает в себя принятие данных цифровых носителей кодером данных цифровых носителей, определение информации о позиции насыщенности цвета для принятых данных цифровых носителей и представление информации о позиции насыщенности цвета посредством одного или более элементов синтаксиса в кодированном битовом потоке. Один или более элементы синтаксиса способны сообщить информацию о позиции насыщенности цвета декодеру цифровых носителей, а информация о позиции насыщенности цвета облегчает вращение изображения или зеркальное отражение. 5 н. и 19 з.п. ф-лы, 2 табл., 7 ил.

Description

СУЩНОСТЬ ИЗОБРЕТЕНИЯ
Кратко, подробное описание предназначено для аспектов кодирования и декодирования данных цифровых носителей, и, в частности, кодирования и декодирования данных цифровых носителей в кодерах цифровых носителей и декодерах.
Например, описаны правила для сообщения и интерпретации позиции насыщенности цвета. Одно правило, названное коротким правилом, определяет пятнадцать дискретных позиций центрирования насыщенности цвета и соответствующий 4-битовый элемент синтаксиса. Другое правило, названное расширенным правилом, определяет 81 дискретную позицию центрирования насыщенности цвета и соответствующие 7-битовые элементы синтаксиса. Изменения этих правил и другие аспекты также описаны.
В одном аспекте, способ содержит получение данных цифровых носителей в кодере цифровых носителей; определение позиции насыщенности цвета для полученных данных цифровых носителей; представление информации о позиции насыщенности цвета одним или более элементами синтаксиса в кодированном битовом потоке, причем элемент синтаксиса способен сообщить информацию о позиции насыщенности цвета на декодер цифровых носителей, и причем информация о позиции насыщенности цвета облегчает вращение изображения или зеркальное отражение; и вывод кодированного битового потока. В другом аспекте, декодирована информация о позиции насыщенности цвета.
Это краткое описание предназначено для введения выбора понятий в упрощенной форме, которые дополнительно описаны ниже в подробном описании. Это резюме не предназначено для идентификации ключевых признаков или существенных признаков требуемого предмета, и не предназначено для ограничения области охвата требуемого предмета.
Предшествующие и другие объекты, признаки и преимущества станут более очевидными из последующего подробного описания, которое продолжится со ссылками на сопровождающие чертежи.
КРАТКОЕ ОПИСАНИЕ ФИГУР ЧЕРТЕЖЕЙ
Фиг.1 - блок-схема соответствующей вычислительной среды для реализации методики и инструментальные средства для сообщения и использования информации о позиции насыщенности цвета в одной или более описанных реализаций.
Фиг.2 - схема, показывающая первый пример правила позиции выборки насыщенности цвета.
Фиг.3 - схема, показывающая второй пример правила позиции выборки насыщенности цвета.
Фиг.4 - схема, показывающая уменьшение дискретизации насыщенности цвета данных развертки.
Фиг.5 - блок-схема основанного на блочном преобразовании кодека.
Фиг.6 - схема алгоритма операций типичного кодера.
Фиг.7 - схема алгоритма операций типичного декодера.
ПОДРОБНОЕ ОПИСАНИЕ
Настоящее изобретение имеет отношение к методикам и инструментальным средствам для эффективного сжатия и распаковки данных цифровых носителей. В различных описанных вариантах воплощения до сих пор кодер изображения и/или декодер содержат методики для сжатия и/или распаковки данных изображения.
Различные альтернативы к реализациям, описанным здесь, возможны. Например, методики, описанные со ссылкой на чертежи блок-схемы, могут быть изменены, посредством изменения стадий, показанных на блок-схемах, повторяя или опуская определенные стадии, и т.д. Как другой пример, хотя некоторые реализации описаны со ссылкой на конкретные форматы цифровых носителей, также могут использоваться другие форматы.
Различные методики и инструментальные средства могут использоваться в комбинации или независимо. Различные варианты воплощения реализуют одну или более из описанных методик и инструментальных средств. Некоторые методики и инструментальные средства, описанные здесь, могут использоваться до сих пор в кодерах изображения или декодерах, или в некоторой другой системе, не ограниченной только кодированием изображения или декодированием.
I. Вычислительные среды
Фиг.1 поясняет обобщенный пример соответствующей вычислительной среды 100, в которой могут быть реализованы несколько из описанных вариантов воплощения. Вычислительная среда 100 не предназначена для наложения любых ограничений охвата использования или функциональности, поскольку методики и инструментальные средства могут быть реализованы в различных вычислительных средах общего или специального назначения.
В отношении фиг.1, вычислительная среда 100 включает в себя, по меньшей мере, один процессор 110 и память 120. На фиг.1 эта базовая конфигурация 130 находится в пределах пунктирной линии. Процессор 110 выполняет исполняемые компьютером команды и может быть реальным или виртуальным микропроцессором. В многопроцессорной системе набор процессоров выполняют исполняемые компьютером команды для увеличения мощности обработки. Памятью 120 может быть кратковременная память (например, регистры, кэш, оперативная память), долговременная память (например, ROM, EEPROM, флэш-память и т.д.) или некоторая комбинация этих двух.
Память 120 хранит программное обеспечение 180, реализующее кодер цифровых носителей или декодер с одной или более из описанных методик и инструментальных средств.
У вычислительной среды могут быть дополнительные признаки. Например, вычислительная среда 100 включает в себя устройство хранения 140, одно или более устройства ввода данных 150, одно или более устройства вывода 160, и одно или более соединений связи 170. Механизм соединения (не показанный), такой как шина, контроллер, или сеть связывает компоненты вычислительной среды 100. Как правило, программное обеспечение операционной системы (не показанное) предоставляет среду для другого программного обеспечения, выполняющегося в вычислительной среде 100, и координирует действия компонентов вычислительной среды 100.
Устройство хранения 140 может быть сменным или фиксированным и включает в себя магнитные диски, магнитные ленты или кассеты, CD-ROM, DVD (включая высококачественные DVD), или любую другую среду, которая может использоваться для хранения информации и к которой можно обратиться в пределах вычислительной среды 100. Устройство хранения 140 хранит команды для программного обеспечения 180, реализующие кодер цифровых носителей или декодер.
Устройство(а) ввода данных 150 может быть сенсорным устройством ввода данных, таким как клавиатура, мышь, перо или шаровой указатель, голосовое устройство ввода данных, сканирующее устройство, а также прибор ввода изображения (например, цифровая камера), или другой прибор, который обеспечивает ввод для вычислительной среды 100. Для звукового или видеокодирования, устройство(а) ввода данных 150 может быть звуковой платой, видеоплатой, платой телевизионного блока настройки, или подобным прибором, который принимает звуковой или видеоввод в аналоговой или цифровой форме, или CD-ROM или CD-RW, который читает звуковые или видеовыборки для вычислительной среды 100. Устройство(а) вывода 160 может быть дисплеем, принтером, динамиком, CD или DWD записывающим устройством, или другим прибором, который обеспечивает вывод для вычислительной среды 100.
Соединение(я) связи 170 делает возможной связь через среду связи к другому вычислительному объекту. Среда связи передает информацию, такую как исполнимые компьютером команды, ввод для цифровых носителей или вывод, или другие данные в модулированном информационном сигнале. Модулированный информационный сигнал - это сигнал, который имеет один или более из наборов характеристик или измененный таким образом, чтобы кодировать информацию в сигнале. Для примера, но не для ограничения, среды связи включают в себя проводные или беспроводные методики, реализованные посредством электрического, оптического, RF, инфракрасного, звукового или другого носителя.
Методики и инструментальные средства могут быть описаны в общем контексте читаемых компьютером носителей. Читаемые компьютером носители - это любые доступные носители, к которым можно обратиться в пределах вычислительной среды.
Для примера, но не для ограничения, с вычислительной средой 100, читаемые компьютером носители включают в себя память 120, устройства хранения 140, среду связи, и комбинации любого из вышеупомянутых.
Методики и инструментальные средства могут быть описаны в общем контексте исполняемых компьютером команд, таких как содержащихся в программных модулях, выполняемых в вычислительной среде на целевом реальном или виртуальном процессоре. В общем, программные модули включают в себя подпрограммы, программы, библиотеки, объекты, классы, компоненты, структуры данных и т.д., которые выполняют отдельные задачи или реализуют отдельные абстрактные типы данных. Функциональность программных модулей может быть комбинирована или разделена между программными модулями по предпочтению в различных вариантах воплощения. Исполняемые компьютером команды для программных модулей могут выполняться в локальной или распределенной вычислительной среде.
Ради пояснения, подробное описание использует такие термины как "выбирать" и "принимать", чтобы описать компьютерные операции в вычислительной среде. Эти термины являются высокоуровневыми абстракциями для операций, исполняемых компьютером, и не должны быть спутаны с действиями, совершаемыми человеком. Фактические компьютерные операции, соответствующие этим терминам, изменяются в зависимости от реализации.
II. Сообщение и использование информации о позиции выборки насыщенности цвета
Описанные варианты воплощения обеспечивают улучшенные признаки битового потока изображения для кодека, включая возможность выполнять основные вращения и зеркальные отображения изображения без полного декодирования и повторного кодирования. Этот признак может быть поддержан многими методиками разработки, включающими в себя:
1. Биортогональное преобразование с перекрытием (LBT)-
a) Симметрия базисных функций LBT позволяет зеркальное отображение пространственных данных в пределах блока преобразования, просто изменяя знак нечетно-симметричных коэффициентов преобразования. Это верно для обоих пространственных направлений X и Y.
b) Изотропная природа базисных функций LBT позволяет переставлять пространственные данные в пределах блока преобразования, просто переставляя коэффициенты преобразования. Основные вращения могут быть реализованы как комбинации перестановок и зеркальных отображений.
2. Блок, макроблок и элемент мозаики пространственных иерархий
a) Чтобы выполнить зеркальное отображение в пределах макроблока данных, измененные блоки преобразования просматриваются в поперечно обратной последовательности (в X и/или Y в зависимости от требования). Аналогично, в пределах элемента мозаики, измененные макроблоки просматриваются в поперечно обратном порядке, и в пределах изображения измененные элементы мозаики просматриваются в поперечно обратном порядке.
b) Чтобы выполнить перестановку, измененные блоки, макроблоки и элементы мозаики переставляются. Основные вращения могут быть реализованы как комбинации перестановок и зеркальных отображений.
3. Сообщение вписанной области в пределах расширенной области кадра - это позволяет свободно зеркально отражать или вращать не выровненные по макроблокам изображения и ненулевое смещение изображения в сетке макроблоков допускается в любом направлении, а не только вправо и вниз.
4. Сообщение позиции выборки насыщенности цвета - это позволяет вращение таких форматов подвыборки насыщенности цвета, как YUV4:2:0 и YUV4:2:2, разрешая независимое определение локализации выборки насыщенности цвета. Это также позволяет сообщение относительных расположений позиций выборки яркости/насыщенности цвета декодеру, таким образом фильтр повышения дискретизации с подходящей фазой может быть выбран.
Сообщение позиций выборок насыщенности цвета описывается подробно ниже. Описанные методики сообщения позволяют вращать изображения в пределах сжатого домена без потери информации и без существенного изменения сжатого размера. Это является желательным признаком битового потока и имеет преимущества в сложности алгоритма.
А. Центрирование насыщенности цвета
Изображение состоит из многих плоскостей данных. В исходном пространстве, изображение обычно составляется из 3 цветовых плоскостей, соответствующих соответственно красному, зеленому и синему (R, G и B) каналам. Во внутреннем цветовом пространстве, используемом в большинстве популярных кодеков, изображение составляется из 3 переделанных цветовых плоскостей, часто называемых Y, U и V. Компонент Y называют яркостью или плоскостью яркости, которая примерно соответствует полутоновому отображению изображения. U и V компоненты упоминаются как насыщенность цвета, информация о цвете или плоскости различия цветов. Терминология Y, U, V используется здесь в общем смысле с пониманием того, что описанные методики и инструментальные средства применимы ко множеству "YUV типов" форматов цветов, таких как YCbCr, YCoCg и т.д.
У цветного формата под названием YUV 4:4:4 есть одна U и одна V выборка для каждой выборки Y.
Человеческий глаз очень чувствителен к изменению интенсивности и разрешающей способности канала яркости. Он относительно менее чувствителен к насыщенности цвета. Это позволяет простое средство сокращения числа пикселей изображения в данных посредством подвыборки или понижением разрешения компонент насыщенности цвета (U и V).
Две методики подвыборки насыщенности цвета популярны.
1. YUV 4:2:2 - здесь пространственная разрешающая способность U и V в направлении X уменьшена вдвое (обычно с некоторым фильтром сглаживания).
2. YUV 4:2:0 - здесь пространственная разрешающая способность U и V и в X и в Y направлениях уменьшена вдвое.
Для YUV 4:2:2 случая, каждая выборка насыщенности цвета соответствует двум выборкам яркости. Аналогично, для YUV 4:2:0 случая каждая выборка насыщенности цвета соответствует четырем выборкам яркости. Подвыборка насыщенности цвета обычно выполняется после фильтрации выборок с фильтром сглаживания.
Фаза этого фильтра определяет относительную позицию выборок яркости и насыщенности цвета.
При обратном преобразовании из этих форматов к YUV 4:4:4 для целей показа или печати, знание относительных позиций выборок должно быть доступным так, чтобы подходящий фильтр повышения дискретизации мог использоваться.
Один из подходов к этой задаче состоит в том, чтобы или делегировать выбор или сообщить точный фильтр повышения дискретизации, который должен использоваться. Но, этот подход налагает дополнительные требования на систему, и может быть не совместим с остальными стандартами промышленности.
Более простое и более гибкое решение сообщения, как реконструировать полные данные разрешения из выбранного варианта подвыборки, это сообщение информации о "позиции" относительного выравнивания выборок яркости и насыщенности цвета. Этот подход позволяет декодеру использовать любой фильтр повышения дискретизации, фаза которого согласована с информацией о позиции.
В то время как этот подход не определяет уникальное правило восстановления (то есть уникальный фильтр повышения дискретизации), он имеет достаточно хорошую производительность и имеет широкую распространенность.
"Позиция" точки подвыборки - это расположение или фаза этой величины в пределах сетки полного разрешения. Информация о позиции используется для выбора между фильтрами повышения дискретизации, которые совместимы с фазовым ограничением. Информация о позиции, вообще, имеет две размерности - сдвиг определен и в горизонтальном, и в вертикальном направлениях.
Фиг.2 и 3 показывают примеры двух обычных правил позиции насыщенности цвета, используемых для YUV 4:2:0. На фиг.2, фаза = (0,0), и на фиг.3, фаза=(0,5, 0,5) в пикселях яркости.
B. Насыщенность цвета, центрированная с вращением/отображением изображения
Два примера, показанные на фиг.2 и 3, является наиболее общими случаями для YUV 4:2:0 подвыборки насыщенности цвета. Эти два правила центрирования обычно достаточны для видеоданных, но обычно недостаточны для данных изображения. Различие между видео и изображениями заключается в том, что видео редко вращается, или зеркально отображается, тогда как изображения очень часто вращаются и/или зеркально отображаются.
Чтобы понять, почему два правила центрирования обычно недостаточны для данных изображения, рассмотрим следующие случаи.
Случай 1: Рассмотрим зеркальное отображение вдоль горизонтального направления для примера центрирования 1. Теперь выборка насыщенности цвета совмещена не с левой верхней позицией выборки яркости, а с правой верхней позицией выборки яркости. Соответствующая фаза насыщенности цвета равна (1,0) в пикселях яркости, которая не определена правилами, показанными на фиг.2 и 3.
Случай 2: Аналогично, зеркальное отображение изображения вдоль вертикального направления с позицией насыщенности цвета, показанной в примере 1, приведет к позиции насыщенности цвета равной (0,1) фазы в пикселях яркости, которая не определена правилами, показанными на фиг.2 и 3.
Вышеупомянутые случаи показывают полезность определения дополнительных правил центрирования насыщенности цвета, как побочной информации к битовому потоку, чтобы помочь процессу правильного восстановления, когда изображение подвергается базовым операциям основных вращений и зеркальным отображениям.
C. Насыщенность цвета, центрированная с чередованием данных.
Другое осложнение введено чересстрочным видео. Кадр чересстрочного видео содержит два поля - верхнее поле и нижнее поле. Поле видео может быть сохранено с его полным разрешением без уменьшения дискретизации выборки насыщенности цвета. Более типично, это проводится в форме уменьшения дискретизации выборки насыщенности цвета, такой как YUV 4:2:2, где насыщенность цвета субдискретизована в направлении X вдвое, и соответствует разрешению яркости в направлении Y. В последних видеокодеках, однако, поле чересстрочного видео определено в YUV 4:2:0 пространстве таким образом, что насыщенность цвета субдискретизована вдвое и в X и в Y направлениях.
Эта операция часто приводит к центрированию насыщенности цвета с фазовым сдвигом 0,25 или 0,75 (в пикселях яркости) в вертикальном направлении в зависимости от того, является ли это верхним или нижним полем, соответственно. Такое центрирование может использоваться, чтобы гарантировать следующее.
1. Переменные линии насыщенности цвета в кадре производятся переменными полями. Центрирование насыщенности цвета является однородным сквозь последовательные линии кадра.
Уменьшение дискретизации выборки насыщенности цвета чередующихся данных показано на фиг.4. Ось X уменьшения дискретизации может иметь любую фазу, и не существенна для этого обсуждения. Поэтому чертеж показывает только центрирование и смещение по оси Y.
D. Позиции насыщенности цвета
Помня вышеупомянутое, определяем два правила для позиции насыщенности цвета. Первое правило, названное коротким правилом, определяет 15 фаз центрирования насыщенности цвета. Об этом правиле сообщают, используя 4-битовое слово в пределах битового потока изображения. Таблица 1 перечисляет значения и соответствующие фазы элемента синтаксиса CHROMA_CENTERING_SHORT в одной из реализаций. В примере, показанном в Таблице 1, CHROMA_CENTERING_SHORT может иметь значения между 0 и 15, но значение 14 зарезервировано и не используется.
CHROMA_CENTERING_SHORT можно сообщить, например, в заголовке изображения или заголовке плоскости изображения.
Таблица 1:
Перечисление значений CHROMA_CENTERING_SHORT и соответствующих фаз
CHROMA_CENTERING_SHORT X фаза = 0 X фаза = 0.5 X фаза = 1
Y фаза = 0 0 10 1
Y фаза=0,25 6 12 7
Y фаза=0,5 4 15 5
Y фаза=0,75 8 13 9
Y фаза=1 2 11 3
Второе и более полное правило центрирования насыщенности цвета, названное расширенным правилом, также описано. Это правило имеет преимущество в том, что разрешает изображению быть отображенным, без потери данных, любым целым числом пикселей. Это в добавление к вращению и зеркальному отображению.
В одной из реализаций, о расширенном правиле сообщают семи битовым словом (CHROMA_CENTERING_LONG) в пределах битового потока изображения, и перечисление фаз, соответствующих элементу синтаксиса CHROMA_CENTERING_LONG, следующее.
CHROMA_CENTERING_LONG=CHROMA_CENTERING_X+CHROMA_CENTERING_Y*9, где CHROMA_CENTERING_X и CHROMA_CENTERING_Y - элементы синтаксиса, определяющие фазу в X и Y направлениях как показано ниже в Таблице 2. CHROMA_CENTERING_X и CHROMA_CENTERING_Y имеют значения между 0 и 8. Поэтому CHROMA_CENTERING_LONG может иметь значения между 0 и 80. Значения вне этого интервала зарезервированы. CHROMA_CENTERING_LONG, CHROMA_CENTERING_X и/или CHROMA_CENTERING_Y могут быть сообщены, например, в заголовке изображения или заголовке плоскости изображения.
Таблица 2:
Перечисление значений CHROMA_CENTERING_X и CHROMA_CENTERING_Y и соответствующие фазы
CHROMA_CENTERING_X или Y Фаза X или Y
8 -0,5
7 -0,25
0 0
1 0,25
2 0,5
3 0,75
4 1,0
5 1,25
6 1,5
Возможно использование других отображений вместо Таблиц 1 и 2. Также возможно использовать другое кодирование элементов CHROMA_CENTERING, такое как коды переменной длины.
III. Кодирование, основанное на блочных преобразованиях.
Кодирование, основанное на преобразованиях? - это методика сжатия, используемая во многих системах сжатия цифровых носителей (например, аудио, изображение и видео). Распакованное цифровое изображение и видео обычно представлены или зафиксированы как выборки элементов изображения или цветов в позициях в кадре изображения или видео, расположенных в двумерной (2D) сетке. Это упоминается как представление пространственных областей изображения или видео.
Например, типичный формат для изображений состоит из потока 24-битовых выборок элементов цветного изображения, расположенных как сетка. Каждая выборка - это номер, представляющий цветовые компоненты в позиции пикселя в сетке в пределах цветового пространства, такого как RGB, или YIQ, среди прочих. Различные системы изображений и видео могут использовать различное цветовое, пространственное и временное разрешение выборки. Точно также цифровая звукозапись обычно представляет временную выборку потока звукового сигнала. Например, типичные звуковые форматы состоят из потока 16-битовых амплитудных выборок звукового сигнала, взятые через регулярные интервалы времени.
Распакованная цифровая звукозапись, изображение и видеосигналы могут потреблять значительные ресурсы памяти и передачи. Кодирование преобразования уменьшает размер цифровой звукозаписи, изображений и видео, преобразовывая представление пространственной области сигнала в частотный интервал (или другую схожую область преобразования) представления, и затем уменьшая разрешение определенных, в целом менее воспринимаемых, частотных составляющих представления области преобразования. Это в целом производит намного менее заметное ухудшение цифрового сигнала по сравнению с уменьшением цветового или пространственного разрешения изображений или видео в пространственной области, или аудио во временной области.
Более определенно, типичная, основанная на блочных преобразованиях, система кодера/декодера 500 (также называемая "кодеком"), показанная на фиг.5 разделяет пиксели распакованного цифрового изображения на двумерные блоки фиксированного размера (X1,..., XN), каждый блок, возможно, перекрывается с другими блоками. В кодере 510, линейное преобразование 520-521, которое осуществляет пространственный частотный анализ, применяется к каждому блоку, что преобразовывает пространственные выборки в блоке в ряд частотных (или преобразования) коэффициентов, в целом представляющие интенсивность цифрового сигнала в соответствующих полосах частот по интервалу блока. Для сжатия коэффициенты преобразования могут быть выборочно квантованы 530 (то есть уменьшены в разрешении посредством пропуска наименее значащих битов значений коэффициентов, или, иначе, отображая значения набора высокого разрешения в набор с более низким разрешением), и также энтропия или длины переменных кодируются 530 в сжатый поток данных. При декодировании, коэффициенты преобразования инверсно преобразуют 570-571, чтобы приблизительно реконструировать исходные цветовые/пространственные выборки сигнала изображения/видео (реконструированные блоки X1, …, XN).
Блочное преобразование 520-521 может быть определено как математическое действие на векторе x размера N. Чаще всего, эта операция является линейным произведением, производя вывод области преобразования y=Mx, M - матрица преобразования. Когда входные данные произвольно длинны, осуществляется сегментирование на вектора размера N и блочное преобразование применяется к каждому сегменту.
С целью сжатия данных выбраны обратимые блочные преобразования. Другими словами, матрицы М обратимы. Для многих размерностей (например, для изображения и видео), блочные преобразования обычно реализуются как отдельные операции. Матричное умножение применяется отдельно для каждой размерности данных (то есть для строк и столбцов).
Для сжатия коэффициенты преобразования (компоненты вектора y) могут быть выборочно квантованы (то есть уменьшены в разрешении, пропуская наименее значащие биты значений коэффициентов, или, иначе, отображая значения набора высокого разрешения на набор более низкого разрешения), и также энтропия или длины переменных кодируются в сжатый поток данных.
При декодировании в декодере 550 инверсия этих операций (обратное квантование/декодирование энтропии 560 и обратное блочное преобразование 570-571) применяются в декодере 550, как показано на фиг.5. При восстановлении данных обратная матрица М' (обратное преобразование 570-571) применяется как множитель к данным области преобразования. При применении к данным области преобразования обратное преобразование приблизительно реконструирует исходную временную область или пространственную область цифрового носителя.
Во многих основанных на блочных преобразовании приложениях кодирования желательно, чтобы преобразование было обратимым для поддержки сжатия без потерь и с потерями в зависимости от коэффициента квантования. Без квантования (в общем, представленное как коэффициент квантования 1), например, кодек, использующий обратимое преобразование, может точно воспроизвести входные данные при декодировании. Но, требование обратимости в этих приложениях ограничивает выбор преобразований, для которых может быть разработан кодек.
Многие системы сжатия изображения и видео, такие как MPEG и Windows Media, среди других, используют преобразования, основанные на Дискретном Косинусном Преобразовании (DCT). DCT, как известно, имеет благоприятные энергетические свойства уплотнения, которые приводят к почти оптимальному сжатию данных. В этих системах сжатия, обратный DCT (IDCT) используется в циклах восстановления и в кодере и в декодере системы сжатия для реконструкции отдельных блоков изображения.
IV. Типичная реализация кодера/декодера
Фиг.6 и 7 - это обобщенные схемы процессов, используемых в типичном кодере 2-мерных (2D) данных 600 и декодере 700. Фигуры представляют обобщенный или упрощенный пример системы сжатия/распаковки, которая может использоваться для реализации описанных методик и инструментальных средств. В альтернативных системах сжатия/распаковки, дополнительные, или только некоторые процессы из показанных, в этих типичных кодере и декодере, могут использоваться для сжатия 2D данных. Например, некоторые кодеры/декодеры могут также включать в себя преобразование цветов, форматы цветов, масштабируемое кодирование, кодирование без потерь, макроблочные режимы и т.д. Система сжатия (кодер и декодер) может обеспечить сжатие без потерь и/или с потерями 2D данных, в зависимости от квантования, которое может быть основано на параметре квантования, изменяющемся от режима без потерь до режима с потерями.
Кодер 2D данных 600 производит сжатый битовый поток 620, который является более компактным представлением (для типичного ввода) 2D данных 610, представленных как ввод для кодера. Например, ввод 2D данных может быть изображением, кадром видеопоследовательности, или другими данными, имеющими две размерности. Кодер 2D данных делит кадр входных данных на блоки (поясняемое в целом на фиг.6 как разделение 630), которые в поясняемой реализации являются неперекрывающимися блоками 4×4 пикселя, формирующими регулярную структуру через плоскость кадра. Эти блоки сгруппированы в кластеры, называемые макроблоками, размерами 16×16 пикселей в этом типичном кодере. В свою очередь, макроблоки сгруппированы в регулярные структуры, называемые элементами мозаики. Элементы мозаики также формируют регулярную структуру через изображение, таким образом, что элементы мозаики в горизонтальной строке имеют одинаковую высоту и выровнены, а элементы мозаики в вертикальном столбце имеют одинаковую ширину и выровнены. В типичном кодере элементы мозаики могут быть произвольного размера, который является множителем 16 в горизонтальном и/или вертикальном направлениях. Альтернативные реализации кодера могут разделять изображение на блок, макроблок, элементы мозаики или другие блоки иного размера и структуры.
Оператор 640 "прямого перекрытия" применяется к каждому краю между блоками, после которого каждый 4x4 блок преобразуется с использованием блочного преобразования 650. Это блочное преобразование 650 может быть обратимым, 2D масштабно независимым преобразованием, описанным Srinivasan, патент США номер заявки 11/015707, озаглавленный "Обратимое преобразование для сжатия 2D данных без потерь и с потерями", зарегистрированный 17 декабря 2004. Оператор 640 перекрытия может быть обратимым оператором перекрытия, описанным Tu и др., патент США номер заявки 11/015148, озаглавленный "Обратимый оператор перекрытия для эффективного сжатия данных без потерь", зарегистрированный 17 декабря 2004; и Tu и др., патент США номер заявки 11/035991, озаглавленный "Обратимая 2-мерная до/после фильтрация для перекрывающихся биортогональных преобразований", зарегистрированный 14 января 2005. Альтернативно, дискретное косинусное преобразование или другие блочные преобразования и операторы перекрытия могут использоваться. Следующий за преобразованием, коэффициент DC 660 каждого 4×4 блока преобразования является предметом схожей цепочки обработки (фрагментация изображения, прямое перекрытие с последующим 4х4 блочным преобразованием). Результирующие коэффициенты преобразования DC и коэффициенты преобразования AC 662 квантованы 670, энтропия кодирована 680 и разбита на пакеты 690.
Декодер выполняет обратный процесс. На стороне декодера биты коэффициентов преобразования извлекаются 710 из их соответствующих пакетов, из которых коэффициенты сами декодируются 720 и обратно квантуются 730. Коэффициенты DC 740 восстанавливаются посредством обратного преобразования и плоскость коэффициентов DC "перекрывается в обратном порядке" с использованием подходящих операторов сглаживания, применяемых ко всем краям блока DC. Затем все данные восстанавливаются с помощью 4×4 обратного преобразования 750 к коэффициентам DC и коэффициентам AC 742, декодированным из битового потока. Наконец, края блоков в результирующей плоскости изображения, перекрытые в обратном порядке, фильтруются 760. Это порождает реконструированный вывод 790 2D данных.
В типичной реализации кодер 600 (фиг.6) сжимает входное изображение в сжатый битовый поток 620 (например, файл), и декодер 700 (фиг.7) реконструирует первоначальный ввод или его приближение, на основании с или без потерь кодирование используется. Процесс кодирования включает в себя использование преобразования с прямым перекрытием (LT), обсуждаемое ниже, которое реализовано с обратимой 2-мерной до/после фильтрацией, также описанной более полно ниже. Процесс декодирования включает в себя использование обратного преобразования с перекрытием (ILT) с использованием обратимой 2-мерной до/после фильтрацией.
Поясняемый LT и ILT - инверсии друг друга в точном смысле, и поэтому могут вместе упоминаться как обратимое преобразование с перекрытием. Как обратимое преобразование, пара LT/ILT может использоваться для сжатия изображения без потерь.
Входные данные 610, сжатые поясняемыми кодером 600/декодером 700, могут быть изображениями различных цветовых форматов (например, RGB/YUV4:4:4, YUV4:2:2 или YUV4:2:0 форматы цветных изображений). Как правило, у входного изображения всегда есть компонент яркости (Y). Если это RGB/YUV4:4:4, YUV4:2:2 или изображение YUV4:2:0, у изображения также есть компоненты насыщенности цвета, такие как компонент U и компонент V. Отдельные цветовые плоскости или компоненты изображения могут иметь различные пространственные разрешения. В случае входного изображения в YUV 4:2:0 цветовом формате, например, U и V компоненты имеют половину ширины и высоты компонента Y.
Как обсуждалось выше, кодер 600 делит входной образ или изображение на макроблоки. В типичной реализации кодер 600 делит входной образ на области по 16×16 пикселей (называемые "макроблоками") в канале Y (которые могут быть 16×16, 16×8 или 8×8 областями в каналах U и V в зависимости от цветового формата).
Каждая цветовая плоскость макроблока разделена на области по 4×4 пикселя или блоки. Поэтому макроблок составлен для различных цветовых форматов следующим образом для данной типичной реализации кодера.
• Для полутонового изображения каждый макроблок содержит в себе 16 4×4 блоков яркости (Y).
• Для YUV4:2:0 цветового формата изображения каждый макроблок содержит в себе 16 4×4 Y блоков и 4 каждый по 4×4 (U и V) блока насыщенности цвета.
• Для YUV4:2:2 цветового формата изображения каждый макроблок содержит в себе 16 4×4 Y блоков, и 8 каждый по 4×4 (U и V) блоков насыщенности цвета.
• Для RGB или YUV4:4:4 цветового формата изображения, каждый макроблок содержит 16 блоков каждого из Y, U и V каналов.
Соответственно, после преобразования макроблок в данном типичном кодере 600/декодере 700 имеет три частотные субполосы: DC субполоса (макроблок DC), субполоса нижних частот (макроблок нижних частот) и субполоса высоких частот (макроблок высоких частот). В типичной системе субполосы нижних/высоких частот являются опциональными в битовом потоке - эти субполосы могут быть полностью пропущены.
Дополнительно сжатые данные могут быть упакованы в битовый поток в одном из двух порядков: пространственный порядок и частотный порядок. Для пространственного порядка различные субполосы одного и того же макроблока в пределах элемента мозаики упорядочены вместе и результирующий битовый поток каждого элемента мозаики записывается в один пакет. Для частотного порядка одна и та же субполоса от различных макроблоков в пределах элемента мозаики группируется вместе, и таким образом битовый поток элемента мозаики записывается в три пакета: DC пакет элемента мозаики, пакет нижних частот элемента мозаики и пакет высоких частот элемента мозаики. В добавление могут быть другие уровни данных.
Таким образом, для типичной системы изображение организовано в следующих "размерностях":
• Пространственная размерность: Кадр → Элемент мозаики → Макроблок;
• Частотная размерность: DC|Нижние частоты|Высокие частоты; и
• Размерность канала: яркость | насыщенность цвета_0 | насыщенность цвета_l... (например, как Y|U|V).
Стрелки выше обозначают иерархию, тогда как вертикальные штрихи обозначают разделение.
Хотя типичная система организовывает сжатые данные цифровых носителей в пространственных, частотных размерностях и размерностях каналов, гибкий подход квантования, описанный здесь, может быть применен в альтернативных кодер/декодер системах, которые организовывают свои данные по меньшим, дополнительным или другим размерностям.
Например, гибкий подход квантования может быть применен к кодированию с использованием большего числа полос частот, других форматов цветовых каналов (например, YIQ, RGB и т.д.), дополнительных каналов изображения (например, для системы стерео видения или других многочисленных матриц камер).
Имея описания и пояснения принципов нашего изобретения в отношении различных вариантов воплощения, можно оценить, что различные варианты воплощения могут быть изменены в расположении и в деталях, не отступая от данных принципов. Необходимо понимать, что программы, процессы или способы, описанные здесь, не связаны или ограничены любым конкретным типом вычислительной среды, если не обозначено иначе. Различные типы универсальных или специализированных вычислительных сред могут использоваться или выполнять операции в соответствии с идеей, описанной здесь. Элементы вариантов воплощения, показанных в программном обеспечении, могут быть реализованы в аппаратных средствах и наоборот.
В перспективе многих возможных вариантов воплощения, к которым могут быть применены принципы раскрытого изобретения, необходимо понимать, что показанные варианты воплощения являются только предпочтительными примерами изобретения и не должны быть использованы как ограничение области охвата изобретения. Вместо этого, область охвата изобретения определяется в соответствии с последующей формулой изобретения.

Claims (24)

1. Способ кодирования данных цифрового изображения с информацией о позиции насыщенности цвета, содержащий:
прием данных цифрового изображения для изображения в кодере неподвижного изображения, причем данные цифрового изображения содержат субдискретизованную информацию насыщенности цвета;
определение информации о позиции насыщенности цвета для субдискретизованной информации насыщенности цвета согласно правилу позиции насыщенности цвета, которое отображает информацию о позиции насыщенности цвета на информацию о фазе в Х размерности и информацию о фазе в Y размерности, причем правило позиции насыщенности цвета обеспечивает горизонтальное и вертикальное зеркальное отражение или вращение изображения без полного декодирования и повторного кодирования изображения посредством разрешения независимого определения информации о фазе в Х размерности и информации о фазе в Y размерности;
представление информации о позиции насыщенности цвета элементами синтаксиса в кодированном битовом потоке, причем элементы синтаксиса содержат первый элемент синтаксиса, который представляет информацию о фазе в Х размерности, и второй элемент синтаксиса, который представляет информацию о фазе в Y размерности; и
вывод кодированного битового потока из кодера неподвижного изображения.
2. Способ по п.1, в котором информация насыщенности цвета субдискретизована с коэффициентом два в одной или более размерностях.
3. Способ по п.1, в котором информация о фазе в Х размерности содержит информацию о фазе половины блока пикселей.
4. Способ по п.1, в котором информация о фазе в Y размерности или в Х размерности содержит информацию о фазе четверти блока пикселей.
5. Способ по п.1, в котором правило позиции насыщенности цвета отображает информацию о позиции насыщенности цвета на фазы центрирования насыщенности цвета, которые включают в себя позиции фаз по Х 0; 0,5 и 1 и позиции фаз по Y 0; 0,25; 0,5; 0,75 и 1, где позиции фаз являются позициями в блоках пикселей.
6. Способ по п.1, в котором один или более элементов синтаксиса являются элементами синтаксиса в заголовке плоскости изображения.
7. Способ по п.1, в котором данные цифрового изображения содержат чередованные данные цифрового изображения.
8. Способ по п.1, в котором правило позиции насыщенности цвета отображает информацию о позиции насыщенности цвета на фазы центрирования насыщенности цвета, которые включают в себя позиции фаз 0,5; -0,25; 0; 0,25; 0,5; 0,75; 1; 1,25 и 1,5, где позиции фаз являются позициями в блоках пикселей.
9. Способ по п.8, в котором правило позиции насыщенности цвета также обеспечивает перенос изображения на целое число пикселей без полного декодирования и повторного кодирования изображения.
10. Способ по п.1, дополнительно содержащий использование информации о позиции насыщенности цвета для повышающей дискретизации субдискретизованной информации насыщенности цвета.
11. Способ декодирования данных цифрового изображения с использованием информации о позиции насыщенности цвета, содержащий:
прием кодированных данных цифрового изображения для изображения в декодере неподвижного изображения, причем кодированные данные цифрового изображения содержат субдискретизированную информацию насыщенности цвета и информацию о позиции насыщенности цвета, кодированную посредством синтаксических элементов в кодированных данных цифрового изображения;
декодирование информации о позиции насыщенности цвета из синтаксических элементов в кодированных данных цифрового изображения, причем информация о позиции насыщенности цвета определена согласно правилу позиции насыщенности цвета, которое отображает информацию о позиции насыщенности цвета на информацию о фазе в Х размерности и информацию о фазе в Y размерности, и при этом синтаксические элементы содержат первый синтаксический элемент, который представляет информацию о фазе в Х размерности, и второй синтаксический элемент, который представляет информацию о фазе в Y размерности; и
вывод изображения из декодера неподвижного изображения.
12. Способ по п.11, в котором информация насыщенности цвета субдискретизована с коэффициентом два в одной или более размерностях.
13. Способ по п.11, в котором информация о фазе в Х размерности содержит информацию о фазе половины блока пикселей.
14. Способ по п.11, в котором информация о фазе в Y размерности или Х размерности содержит информацию о фазе четверти блока пикселей.
15. Способ по п.11, в котором синтаксические элементы кодированы в заголовке плоскости изображения кодированных данных цифрового изображения.
16. Способ по п.11, дополнительно содержащий использование информации о позиции насыщенности цвета для повышающей дискретизации субдискретизованной информации насыщенности цвета.
17. Способ по п.11, дополнительно содержащий использование информации о позиции насыщенности цвета для выполнения горизонтального зеркального отражения, вертикального зеркального отражения или вращения кодированного изображения без полного декодирования кодированного изображения.
18. Способ использования информации о позиции насыщенности цвета для выполнения преобразования изображения, содержащий:
прием кодированных данных цифрового изображения для неподвижного изображения, при этом кодированные данные цифрового изображения содержат информацию насыщенности цвета;
декодирование информации о позиции насыщенности цвета для субдискретизованной информации насыщенности цвета; и
повторное кодирование, по меньшей мере, части принятых данных цифрового изображения при преобразовании, причем преобразование представляет собой горизонтальное зеркальное отражение, вертикальное зеркальное отражение, вращение или кадрирование;
причем повторное кодирование содержит изменение информации о позиции насыщенности цвета для воспроизведения преобразования.
19. Способ по п.18, в котором повторное кодирование содержит кодирование без потерь.
20. Способ по п.18, в котором повторное кодирование содержит кодирование с потерями.
21. Способ по п.18, в котором повторное кодирование содержит кодирование с преобразованием области.
22. Способ по п.18, в котором информация о позиции насыщенности цвета декодируется из элементов синтаксиса в заголовке плоскости изображения кодированных данных цифрового изображения.
23. Машиночитаемый носитель, содержащий исполняемые компьютером инструкции, которые при исполнении компьютером побуждают компьютер выполнять способ кодирования неподвижного изображения, причем способ содержит:
прием данных цифрового изображения для изображения в кодере неподвижного изображения, причем данные цифрового изображения содержат субдискретизованную информацию насыщенности цвета;
определение информации о позиции насыщенности цвета для субдискретизованной информации насыщенности цвета согласно правилу позиции насыщенности цвета, которое отображает информацию о позиции насыщенности цвета на информацию о фазе в Х размерности и информацию о фазе в Y размерности, причем правило позиции насыщенности цвета обеспечивает горизонтальное и вертикальное зеркальное отражение или вращение изображения без полного декодирования и повторного кодирования изображения посредством разрешения независимого определения информации о фазе в Х размерности и информации о фазе в Y размерность-представление информации о позиции насыщенности цвета элементами синтаксиса в кодированном битовом потоке, причем элементы синтаксиса содержат первый элемент синтаксиса, который представляет информацию о фазе в Х размерности, и второй элемент синтаксиса, который представляет информацию о фазе в Y размерности; и
вывод кодированного битового потока из кодера неподвижного изображения.
24. Машиночитаемый носитель, содержащий исполняемые компьютером инструкции, которые при исполнении компьютером побуждают компьютер выполнять способ декодирования неподвижного изображения, причем способ содержит:
прием кодированных данных цифрового изображения для изображения в декодере неподвижного изображения, причем кодированные данные цифрового изображения содержат субдискретизированную информацию насыщенности цвета и информацию о позиции насыщенности цвета, кодированную посредством синтаксических элементов в кодированных данных цифрового изображения;
декодирование информации о позиции насыщенности цвета из синтаксических элементов в кодированных данных цифрового изображения, причем информация о позиции насыщенности цвета определена согласно правилу позиции насыщенности цвета, которое отображает информацию о позиции насыщенности цвета на информацию о фазе в Х размерности и информацию о фазе в Y размерности, и при этом синтаксические элементы содержат первый синтаксический элемент, который представляет информацию о фазе в Х размерности, и второй синтаксический элемент, который представляет информацию о фазе в Y размерности; и
вывод изображения из декодера неподвижного изображения.
RU2009131597/07A 2007-02-21 2008-02-20 Сообщение и использование информации о позиции выборки насыщенности цвета RU2518406C2 (ru)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US89103007P 2007-02-21 2007-02-21
US60/891,030 2007-02-21
US11/772,070 2007-06-29
US11/772,070 US8054886B2 (en) 2007-02-21 2007-06-29 Signaling and use of chroma sample positioning information
PCT/US2008/054481 WO2008103774A2 (en) 2007-02-21 2008-02-20 Signaling and use of chroma sample positioning information

Publications (2)

Publication Number Publication Date
RU2009131597A RU2009131597A (ru) 2011-02-27
RU2518406C2 true RU2518406C2 (ru) 2014-06-10

Family

ID=39706639

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2009131597/07A RU2518406C2 (ru) 2007-02-21 2008-02-20 Сообщение и использование информации о позиции выборки насыщенности цвета

Country Status (11)

Country Link
US (1) US8054886B2 (ru)
EP (1) EP2123057B1 (ru)
JP (1) JP5149310B2 (ru)
KR (1) KR101465817B1 (ru)
CN (1) CN101617540B (ru)
BR (1) BRPI0807189B1 (ru)
HK (1) HK1140342A1 (ru)
IL (1) IL199957A (ru)
RU (1) RU2518406C2 (ru)
TW (1) TWI454154B (ru)
WO (1) WO2008103774A2 (ru)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8880571B2 (en) * 2006-05-05 2014-11-04 Microsoft Corporation High dynamic range data format conversions for digital media
US8369638B2 (en) 2008-05-27 2013-02-05 Microsoft Corporation Reducing DC leakage in HD photo transform
US8447591B2 (en) * 2008-05-30 2013-05-21 Microsoft Corporation Factorization of overlapping tranforms into two block transforms
US8275209B2 (en) 2008-10-10 2012-09-25 Microsoft Corporation Reduced DC gain mismatch and DC leakage in overlap transform processing
US8194977B2 (en) * 2008-12-09 2012-06-05 Microsoft Corporation Remote desktop protocol compression acceleration using single instruction, multiple dispatch instructions
CN105357509B (zh) * 2009-01-29 2017-09-15 杜比实验室特许公司 视频编码方法、视频信号解码方法及视频装置
US20110026593A1 (en) * 2009-02-10 2011-02-03 New Wei Lee Image processing apparatus, image processing method, program and integrated circuit
US20100226437A1 (en) * 2009-03-06 2010-09-09 Sony Corporation, A Japanese Corporation Reduced-resolution decoding of avc bit streams for transcoding or display at lower resolution
KR101066117B1 (ko) * 2009-11-12 2011-09-20 전자부품연구원 스케일러블 영상 코딩 방법 및 장치
US9712847B2 (en) 2011-09-20 2017-07-18 Microsoft Technology Licensing, Llc Low-complexity remote presentation session encoder using subsampling in color conversion space
JP5653328B2 (ja) * 2011-09-26 2015-01-14 株式会社東芝 画像処理装置及び画像処理システム
FR2989856B1 (fr) * 2012-04-23 2014-11-28 Assistance Tech Et Etude De Materiels Electroniques Compression/decompression progressive d'un flux numerique video comprenant au moins une image entrelacee
US10448032B2 (en) 2012-09-04 2019-10-15 Qualcomm Incorporated Signaling of down-sampling location information in scalable video coding
US9979960B2 (en) 2012-10-01 2018-05-22 Microsoft Technology Licensing, Llc Frame packing and unpacking between frames of chroma sampling formats with different chroma resolutions
US9661340B2 (en) 2012-10-22 2017-05-23 Microsoft Technology Licensing, Llc Band separation filtering / inverse filtering for frame packing / unpacking higher resolution chroma sampling formats
US20140198855A1 (en) * 2013-01-14 2014-07-17 Qualcomm Incorporated Square block prediction
KR20160132857A (ko) * 2014-03-14 2016-11-21 삼성전자주식회사 스케일러블 비디오 부호화/복호화 방법 및 장치
JP2017520871A (ja) * 2014-06-12 2017-07-27 エー2ゼットロジックス,インコーポレーテッド 画像データ内の間引きされた色チャネルの送信、受信、及び復元を行うシステム及び方法
US10412387B2 (en) 2014-08-22 2019-09-10 Qualcomm Incorporated Unified intra-block copy and inter-prediction
US9918105B2 (en) * 2014-10-07 2018-03-13 Qualcomm Incorporated Intra BC and inter unification
US10405000B2 (en) * 2014-11-21 2019-09-03 Vid Scale, Inc. One-dimensional transform modes and coefficient scan order
US9749646B2 (en) 2015-01-16 2017-08-29 Microsoft Technology Licensing, Llc Encoding/decoding of high chroma resolution details
US9854201B2 (en) 2015-01-16 2017-12-26 Microsoft Technology Licensing, Llc Dynamically updating quality to higher chroma sampling rate
KR102440941B1 (ko) 2015-03-03 2022-09-05 삼성전자주식회사 이미지 처리 정보에 따라 크기와 방향을 갖는 초기 위상을 계산할 수 있는 이미지 처리 장치들
US10368080B2 (en) 2016-10-21 2019-07-30 Microsoft Technology Licensing, Llc Selective upsampling or refresh of chroma sample values

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0692915A2 (en) * 1994-07-15 1996-01-17 Matsushita Electric Industrial Co., Ltd. Method for MPEG-2 4:2:2 and 4:2:0 chroma format conversion
WO1999059329A2 (en) * 1998-05-14 1999-11-18 Interval Research Corporation Video compression with storage reduction, color rotation, combined signal and border filtering
RU2003108435A (ru) * 2003-03-26 2004-10-10 Майкрософт Корпорейшн Система и способ последовательного преобразования и кодирования цифровых данных
RU2005107478A (ru) * 2003-07-18 2006-07-27 Сони Корпорейшн (JP) Устройство и способ кодирования информации изображения, а также устройство и способ декорирования информации изображения

Family Cites Families (85)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5776634A (en) * 1980-10-31 1982-05-13 Hitachi Ltd Digital signal processor
US4626825A (en) * 1985-07-02 1986-12-02 Vlsi Technology, Inc. Logarithmic conversion apparatus
USRE35910E (en) 1989-05-11 1998-09-29 Matsushita Electric Industrial Co., Ltd. Moving image signal encoding apparatus and decoding apparatus
JP3303869B2 (ja) 1990-11-30 2002-07-22 株式会社日立製作所 画像符号化方法、画像符号化装置、画像復号化方法
JP3191935B2 (ja) 1990-11-30 2001-07-23 株式会社日立製作所 画像符号化方法、画像符号化装置、画像復号化方法
US5611038A (en) 1991-04-17 1997-03-11 Shaw; Venson M. Audio/video transceiver provided with a device for reconfiguration of incompatibly received or transmitted video and audio information
US5414469A (en) 1991-10-31 1995-05-09 International Business Machines Corporation Motion video compression system with multiresolution features
US5257215A (en) * 1992-03-31 1993-10-26 Intel Corporation Floating point and integer number conversions in a floating point adder
GB9224952D0 (en) 1992-11-28 1993-01-20 Ibm Improvements in image processing
US5467134A (en) * 1992-12-22 1995-11-14 Microsoft Corporation Method and system for compressing video data
US5544286A (en) * 1993-01-29 1996-08-06 Microsoft Corporation Digital video data compression technique
KR970000683B1 (ko) 1993-05-31 1997-01-16 삼성전자 주식회사 해상도 가변 적응적 화상압축/복원방법 및 장치
US5465118A (en) * 1993-12-17 1995-11-07 International Business Machines Corporation Luminance transition coding method for software motion video compression/decompression
US5828421A (en) 1994-10-11 1998-10-27 Hitachi America, Ltd. Implementation efficient digital picture-in-picture decoding methods and apparatus
US5821986A (en) 1994-11-03 1998-10-13 Picturetel Corporation Method and apparatus for visual communications in a scalable network environment
JPH08163562A (ja) * 1994-12-06 1996-06-21 Matsushita Electric Ind Co Ltd 映像信号処理装置
US6002801A (en) 1995-04-18 1999-12-14 Advanced Micro Devices, Inc. Method and apparatus for improved video decompression by selection of IDCT method based on image characteristics
US5864637A (en) 1995-04-18 1999-01-26 Advanced Micro Devices, Inc. Method and apparatus for improved video decompression by selective reduction of spatial resolution
US5699124A (en) * 1995-06-28 1997-12-16 General Instrument Corporation Of Delaware Bandwidth efficient communication of user data in digital television data stream
US5995670A (en) 1995-10-05 1999-11-30 Microsoft Corporation Simplified chain encoding
US6957350B1 (en) 1996-01-30 2005-10-18 Dolby Laboratories Licensing Corporation Encrypted and watermarked temporal and resolution layering in advanced television
US5737023A (en) * 1996-02-05 1998-04-07 International Business Machines Corporation Hierarchical motion estimation for interlaced video
US6246787B1 (en) * 1996-05-31 2001-06-12 Texas Instruments Incorporated System and method for knowledgebase generation and management
JP3466032B2 (ja) 1996-10-24 2003-11-10 富士通株式会社 動画像符号化装置および復号化装置
US5801975A (en) * 1996-12-02 1998-09-01 Compaq Computer Corporation And Advanced Micro Devices, Inc. Computer modified to perform inverse discrete cosine transform operations on a one-dimensional matrix of numbers within a minimal number of instruction cycles
US6256347B1 (en) * 1996-12-17 2001-07-03 Thomson Licensing S.A. Pixel block compression apparatus in an image processing system
US6259810B1 (en) * 1997-04-15 2001-07-10 Microsoft Corporation Method and system of decoding compressed image data
KR19980082906A (ko) * 1997-05-09 1998-12-05 김영환 부동 소수점 숫자의 정수형으로의 변환 방법
SE509582C2 (sv) * 1997-06-05 1999-02-08 Telia Ab System vid telekommunikationsnät
JPH11122624A (ja) * 1997-10-16 1999-04-30 Matsushita Electric Ind Co Ltd ビデオデコーダ処理量を低減する方法および装置
US6061782A (en) * 1997-11-29 2000-05-09 Ip First Llc Mechanism for floating point to integer conversion with RGB bias multiply
WO1999029112A1 (en) 1997-12-01 1999-06-10 Matsushita Electric Industrial Co., Ltd. Image processor, image data processor and variable length encoder/decoder
US6519288B1 (en) * 1998-03-06 2003-02-11 Mitsubishi Electric Research Laboratories, Inc. Three-layer scaleable decoder and method of decoding
US6560285B1 (en) * 1998-03-30 2003-05-06 Sarnoff Corporation Region-based information compaction as for digital images
US6239815B1 (en) * 1998-04-03 2001-05-29 Avid Technology, Inc. Video data storage and transmission formats and apparatus and methods for processing video data in such formats
US5995122A (en) * 1998-04-30 1999-11-30 Intel Corporation Method and apparatus for parallel conversion of color values from a single precision floating point format to an integer format
US6563953B2 (en) * 1998-11-30 2003-05-13 Microsoft Corporation Predictive image compression using a single variable length code for both the luminance and chrominance blocks for each macroblock
US6983018B1 (en) 1998-11-30 2006-01-03 Microsoft Corporation Efficient motion vector coding for video compression
US6418166B1 (en) 1998-11-30 2002-07-09 Microsoft Corporation Motion estimation and block matching pattern
US6259741B1 (en) * 1999-02-18 2001-07-10 General Instrument Corporation Method of architecture for converting MPEG-2 4:2:2-profile bitstreams into main-profile bitstreams
US6499060B1 (en) 1999-03-12 2002-12-24 Microsoft Corporation Media coding for loss recovery with remotely predicted data units
US6115031A (en) * 1999-04-23 2000-09-05 Lexmark International, Inc. Method of converting color values
US6396422B1 (en) * 1999-06-09 2002-05-28 Creoscitex Corporation Ltd. Methods for quantizing and compressing digital image data
US20020145610A1 (en) 1999-07-16 2002-10-10 Steve Barilovits Video processing engine overlay filter scaler
EP1145563A1 (en) * 1999-10-28 2001-10-17 Koninklijke Philips Electronics N.V. Color video encoding method based on a wavelet decomposition
AU2578001A (en) * 1999-12-10 2001-06-18 Broadcom Corporation Apparatus and method for reducing precision of data
JP3474173B2 (ja) * 2000-02-25 2003-12-08 株式会社ソニー・コンピュータエンタテインメント 画像出力装置に応じた画像データを作成する情報処理装置およびそのための記録媒体
JP3593944B2 (ja) * 2000-03-08 2004-11-24 日本電気株式会社 画像データ処理装置及びそれに用いる動き補償処理方法
US6510177B1 (en) 2000-03-24 2003-01-21 Microsoft Corporation System and method for layered video coding enhancement
US6647061B1 (en) 2000-06-09 2003-11-11 General Instrument Corporation Video size conversion and transcoding from MPEG-2 to MPEG-4
US6438168B2 (en) * 2000-06-27 2002-08-20 Bamboo Media Casting, Inc. Bandwidth scaling of a compressed video stream
US6961063B1 (en) * 2000-06-30 2005-11-01 Intel Corporation Method and apparatus for improved memory management of video images
KR100370076B1 (ko) 2000-07-27 2003-01-30 엘지전자 주식회사 다운 컨버젼 기능을 갖는 비디오 디코더 및 비디오 신호를디코딩 하는 방법
US6937291B1 (en) 2000-08-31 2005-08-30 Intel Corporation Adaptive video scaler
DE10048735A1 (de) 2000-09-29 2002-04-11 Bosch Gmbh Robert Verfahren zur Codierung und Decodierung von Bildsequenzen sowie Einrichtungen hierzu
US6606418B2 (en) 2001-01-16 2003-08-12 International Business Machines Corporation Enhanced compression of documents
US6898323B2 (en) * 2001-02-15 2005-05-24 Ricoh Company, Ltd. Memory usage scheme for performing wavelet processing
US8374237B2 (en) * 2001-03-02 2013-02-12 Dolby Laboratories Licensing Corporation High precision encoding and decoding of video images
US6850571B2 (en) * 2001-04-23 2005-02-01 Webtv Networks, Inc. Systems and methods for MPEG subsample decoding
US7206453B2 (en) 2001-05-03 2007-04-17 Microsoft Corporation Dynamic filtering for lossy compression
US7242717B2 (en) * 2001-06-08 2007-07-10 Sharp Laboratories Of America, Inc. Wavelet domain motion compensation system
EP1393296A4 (en) * 2001-06-08 2008-09-03 Univ Southern California PICTURE EDITING WITH BIG DYNAMIC CIRCUMFERENCE
US8526751B2 (en) * 2001-08-24 2013-09-03 International Business Machines Corporation Managing image storage size
EP1313066B1 (en) * 2001-11-19 2008-08-27 STMicroelectronics S.r.l. A method for merging digital images to obtain a high dynamic range digital image
US7006699B2 (en) * 2002-03-27 2006-02-28 Microsoft Corporation System and method for progressively transforming and coding digital data
US7136417B2 (en) * 2002-07-15 2006-11-14 Scientific-Atlanta, Inc. Chroma conversion optimization
US6909459B2 (en) * 2002-08-21 2005-06-21 Alpha Innotech Corporation Method of and apparatus for extending signal ranges of digital images
US7072394B2 (en) 2002-08-27 2006-07-04 National Chiao Tung University Architecture and method for fine granularity scalable video coding
US7379496B2 (en) 2002-09-04 2008-05-27 Microsoft Corporation Multi-resolution video coding and decoding
SE0300286D0 (sv) * 2003-02-05 2003-02-05 Axis Ab Method and apparatus for combining video signals to one comprehensive video signal
US7187811B2 (en) * 2003-03-18 2007-03-06 Advanced & Wise Technology Corp. Method for image resolution enhancement
KR20060109247A (ko) * 2005-04-13 2006-10-19 엘지전자 주식회사 베이스 레이어 픽처를 이용하는 영상신호의 엔코딩/디코딩방법 및 장치
US20040190771A1 (en) * 2003-03-27 2004-09-30 Michel Eid Integer format for efficient image data processing
US6879731B2 (en) * 2003-04-29 2005-04-12 Microsoft Corporation System and process for generating high dynamic range video
JP4207684B2 (ja) 2003-06-27 2009-01-14 富士電機デバイステクノロジー株式会社 磁気記録媒体の製造方法、および、製造装置
US7502415B2 (en) * 2003-07-18 2009-03-10 Microsoft Corporation Range reduction
US7876974B2 (en) * 2003-08-29 2011-01-25 Vladimir Brajovic Method for improving digital images and an image sensor for sensing the same
US8014450B2 (en) * 2003-09-07 2011-09-06 Microsoft Corporation Flexible range reduction
US7519274B2 (en) * 2003-12-08 2009-04-14 Divx, Inc. File format for multiple track digital data
US7649539B2 (en) * 2004-03-10 2010-01-19 Microsoft Corporation Image formats for video capture, processing and display
US20050243176A1 (en) * 2004-04-30 2005-11-03 James Wu Method of HDR image processing and manipulation
JP4609155B2 (ja) 2005-03-30 2011-01-12 セイコーエプソン株式会社 画像圧縮方法、画像圧縮装置、画像圧縮プログラム及び画像読み取り装置
US8036274B2 (en) * 2005-08-12 2011-10-11 Microsoft Corporation SIMD lapped transform-based digital media encoding/decoding
US20070160134A1 (en) * 2006-01-10 2007-07-12 Segall Christopher A Methods and Systems for Filter Characterization
US8880571B2 (en) * 2006-05-05 2014-11-04 Microsoft Corporation High dynamic range data format conversions for digital media

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0692915A2 (en) * 1994-07-15 1996-01-17 Matsushita Electric Industrial Co., Ltd. Method for MPEG-2 4:2:2 and 4:2:0 chroma format conversion
WO1999059329A2 (en) * 1998-05-14 1999-11-18 Interval Research Corporation Video compression with storage reduction, color rotation, combined signal and border filtering
RU2003108435A (ru) * 2003-03-26 2004-10-10 Майкрософт Корпорейшн Система и способ последовательного преобразования и кодирования цифровых данных
RU2005107478A (ru) * 2003-07-18 2006-07-27 Сони Корпорейшн (JP) Устройство и способ кодирования информации изображения, а также устройство и способ декорирования информации изображения

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HD PHOTO, Photographic Still Image File Format, Bitstream Specification, Version 1.0, Microsoft Corporation, 07 November 2006, abstract. SHIJUN SUN et al, Unified Solution for Spatial Scalability, Joint Video Team (JVT) of ISO/IEC MPEG & ITU-T VCEG, JVT-R018, Thailand, 14-20 January 2006. GARY J. SULLIVAN, Position Calculation for SVC Upsampling, Joint Video Team (JVT) of ISO/IEC MPEG & ITU-T VCEG, JVT-S067, Geneva, 31 March - 7 April 2006. GARY SULLIVAN, Adaptive quantization encoding technique using an equal expected-value rule, Joint Video Team (JVT) of ISO/IEC MPEG & ITU-T VCEG, JVT-N011, Hong Kong, 18-21 Jan. 2005. WOO-SHIK KIM, Color Format Extension, Joint Video Team (JVT) of ISO/IEC MPEG & ITU-T VCEG, JVT-H018, Geneva, 23-27 May 2003 *

Also Published As

Publication number Publication date
RU2009131597A (ru) 2011-02-27
BRPI0807189B1 (pt) 2020-05-26
TWI454154B (zh) 2014-09-21
WO2008103774A3 (en) 2008-10-16
US8054886B2 (en) 2011-11-08
US20080198936A1 (en) 2008-08-21
WO2008103774A2 (en) 2008-08-28
IL199957A0 (en) 2010-04-15
BRPI0807189A2 (pt) 2014-05-27
EP2123057A4 (en) 2011-11-16
EP2123057B1 (en) 2016-08-03
IL199957A (en) 2013-07-31
HK1140342A1 (en) 2010-10-08
KR101465817B1 (ko) 2014-12-11
JP2010521083A (ja) 2010-06-17
JP5149310B2 (ja) 2013-02-20
EP2123057A2 (en) 2009-11-25
CN101617540A (zh) 2009-12-30
CN101617540B (zh) 2012-09-05
KR20090123861A (ko) 2009-12-02
TW200847801A (en) 2008-12-01

Similar Documents

Publication Publication Date Title
RU2518406C2 (ru) Сообщение и использование информации о позиции выборки насыщенности цвета
US8515194B2 (en) Signaling and uses of windowing information for images
US6259819B1 (en) Efficient method of image compression comprising a low resolution image in the bit stream
KR101507183B1 (ko) 변환-기반 디지털 미디어 코덱에서의 계산 복잡도 및 정밀도 제어
US7215708B2 (en) Resolution downscaling of video images
US20020196970A1 (en) Image compression apparatus, image decompression apparatus, image compression method, image decompression method, computer program product, and recording medium
Nageswara et al. Image compression using discrete cosine transform
KR20150010903A (ko) 모바일 단말 화면을 위한 3k해상도를 갖는 디스플레이 영상 생성 방법 및 장치
CN107483942B (zh) 视频数据压缩码流的解码、视频数据的编码方法及装置
KR101683313B1 (ko) 중첩 변환 처리에서의 감소된 dc 이득 부정합 및 dc 누설
AU2003291058C1 (en) Apparatus and method for multiple description encoding
EP3714430A1 (en) Signal encoding
AU727869B2 (en) An efficient method of image compression comprising a low resolution image in the bit stream

Legal Events

Date Code Title Description
PC41 Official registration of the transfer of exclusive right

Effective date: 20150526