RU2273112C2 - Сжатие изображения с использованием дискретного косинусного преобразования адаптивно определенного размера блока на основании дисперсии - Google Patents

Сжатие изображения с использованием дискретного косинусного преобразования адаптивно определенного размера блока на основании дисперсии Download PDF

Info

Publication number
RU2273112C2
RU2273112C2 RU2002115290/09A RU2002115290A RU2273112C2 RU 2273112 C2 RU2273112 C2 RU 2273112C2 RU 2002115290/09 A RU2002115290/09 A RU 2002115290/09A RU 2002115290 A RU2002115290 A RU 2002115290A RU 2273112 C2 RU2273112 C2 RU 2273112C2
Authority
RU
Russia
Prior art keywords
block
threshold
pixel data
pixel
blocks
Prior art date
Application number
RU2002115290/09A
Other languages
English (en)
Other versions
RU2002115290A (ru
Inventor
Када м ТИАГАРАДЖАН (US)
Кадаям ТИАГАРАДЖАН
Майкл МЕРРИТТ (US)
Майкл МЕРРИТТ
Original Assignee
Квэлкомм Инкорпорейтед
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Квэлкомм Инкорпорейтед filed Critical Квэлкомм Инкорпорейтед
Publication of RU2002115290A publication Critical patent/RU2002115290A/ru
Application granted granted Critical
Publication of RU2273112C2 publication Critical patent/RU2273112C2/ru

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Изобретение относится к схеме сжатия для сигналов изображения, использующей блоки и подблоки адаптивно определенных размеров данных коэффициентов дискретного косинусного преобразования (ДКП). Техническим результатом является повышение вычислительной эффективности этапов сжания сигналов изображения без потери уровня качества видеосигналов. Технический результат достигается тем, что элемент назначения размера блока в кодировщике выбирает блок или подблок обрабатываемого входного блока пикселей. Выбор основан на дисперсии величин пикселей. Блоки с дисперсиями, большими, чем порог, подразделяются, тогда как блоки с дисперсиями, меньшими, чем порог, не подразделяются. Элемент преобразования преобразует величины пикселей выбранных блоков в частотную область. Значения в частотной области могут быть затем квантованы, преобразованы в последовательную форму и закодированы с переменной длиной при подготовке к передаче. 4 н. и 30 з.п. ф-лы, 5 ил.

Description

I. Область изобретения
Настоящее изобретение относится к обработке изображения. Более конкретно, настоящее изобретение относится к схеме сжатия для сигналов изображения, использующей блоки и подблоки адаптивно определенных размеров закодированных данных коэффициентов дискретного косинусного преобразования.
II. Предшествующий уровень техники
В области передачи и приема видеосигналов, таких, которые используются для проецирования "фильмов" или "кинофильмов", делаются различные усовершенствования для способов сжатия изображения. Многие из общераспространенных и предложенных видеосистем используют способы цифрового кодирования. Цифровое кодирование обеспечивает надежность линии связи, которая противостоит искажениям в линии связи, таким как, многомаршрутное затухание и преднамеренные радиопомехи или помехи сигнала, каждое из которых иначе могло бы серьезно ухудшить качество изображения. Кроме того, цифровые способы облегчают использование способов шифрования сигналов, которые оказываются полезными или даже необходимыми для правительственных и многих вновь разрабатываемых коммерческих приложений широковещательной передачи.
Видео высокого разрешения является областью, которая использует преимущества из усовершенствованных способов сжатия изображения. Когда была впервые предложена передача по эфиру видеосигналов высокого разрешения (или даже передача через провода или волоконно-оптические кабели) казалась непрактичной из-за чрезмерных требований к полосе частот. Типичные беспроводные и другие системы передачи, будучи сконструированы, нелегко приспосабливали достаточную полосу частот. Однако, было осознано, что сжатие цифровых видеосигналов может быть выполнено до уровня, который дает возможность передачи с использованием приемлемых полос частот. Такие уровни сжатия сигнала, связанные с цифровой передачей сигнала, позволят видеосистеме передавать с меньшим уровнем мощности с большей устойчивостью к искажениям в канале, в то же время занимая более желательную и пригодную полосу частот.
Один способ сжатия, способный предложить значительные уровни сжатия и в то же время сохраняющий желаемый уровень качества для видеосигналов, использует блоки и подблоки адаптивно определенных размеров закодированных данных коэффициентов дискретного косинусного преобразования (ДКП). Этот способ далее будет упоминаться как способ дифференциального косинусного преобразования адаптивного размера блока (ДКПАРБ). Этот способ раскрыт в патенте США №5021891, озаглавленном "Способ и система сжатия изображения адаптивного размера блока", права на который переданы владельцу настоящего изобретения и включенном в настоящее описание в качестве ссылки. Способы ДКП также раскрыты в патенте США №5107345, озаглавленном "Способ и система сжатия изображения адаптивного размера блока", права на который переданы владельцу настоящего изобретения и включенном в настоящее описание в качестве ссылки. Кроме того, использование способа ДКПАРБ в сочетании со способом дифференциального преобразования дерева квадрантов раскрыт в патенте США №5452104, озаглавленном "Способ и система сжатия изображения адаптивного размера блока", права на который также переданы владельцу настоящего изобретения и включенном в настоящее описание в качестве ссылки. Системы, раскрытые в этих патентах, используют, так называемое, "внутрикадровое" кодирование, где каждый кадр данных изображения кодируется, не обращая внимание на содержание любого другого кадра. Используя способ ДКПАРБ, достижимая скорость данных может быть уменьшена приблизительно от 1,5 миллиардов бит в секунду приблизительно до 50 миллионов бит в секунду без заметного ухудшения качества изображения.
Способ ДКПАРБ может использоваться для сжатия либо черно-белого, либо цветного изображения или сигнала, представляющего изображение. Цветной входной сигнал может быть в формате YIQ (яркость/цвет), где Y является выборкой яркости или освещенности, а I и Q являются выборками цветности или цвета для каждого блока 4х4 пиксел. Также могут использоваться другие известные форматы, такие как, форматы YUV и RGB (красный-зеленый-синий). Из-за низкой пространственной чувствительности глаза к цвету большинство исследований показало, что подвыборка составляющих цвета с коэффициентом четыре в горизонтальном и вертикальном направлениях является приемлемой. Таким образом, видеосигнал может быть представлен четырьмя составляющими яркости и двумя составляющими цветности.
Используя ДКПАРБ, видео сигнал будет обычно сегментирован на блоки пиксел для обработки. Для каждого блока составляющие яркости и цветности передаются в блочный перемежитель. Например, блок 16×16 (пиксел) может быть подан в блочный перемежитель, который упорядочивает или организует выборки изображения внутри каждого блока 16×16 для того, чтобы создать блоки и составные подблоки данных для анализа дискретного косинусного преобразования (ДКП). Операция ДКП является одним способом преобразования квантованного по времени сигнала в частотное представление того же самого сигнала. При преобразовании в частотное представление было показано, что способы ДКП дают возможность очень высоких степеней сжатия, так как устройство квантования может быть сконструировано так, чтобы воспользоваться преимуществом характеристик частотного распределения изображения. В предпочтительном осуществлении одно ДКП 16×16 применяется для первого упорядочения, четыре ДКП 8×8 применяются для второго упорядочения, 16 ДКП 4×4 применяются для третьего упорядочения и 64 ДКП 2×2 применяются для четвертого упорядочения.
Операция ДКП уменьшает пространственную избыточность, присущую источнику видеосигнала. После того, как ДКП выполнено, большая часть энергии видеосигнала стремится концентрироваться в нескольких коэффициентах ДКП. Дополнительное преобразование, дифференциальное преобразование дерева квадрантов (ДПДК) может быть использовано для уменьшения избыточности среди коэффициентов ДКП.
Для блока 16×16 и каждого подблока значения коэффициентов ДКП и значение ДПДК (если используется ДПДК) анализируются для того, чтобы определить число бит, требуемых для того, чтобы закодировать блок или подблок. Затем блок или сочетание подблоков, который требует наименьшего числа бит для кодирования, выбирается для того, чтобы представить сегмент изображения. Например, два подблока 8×8, шесть подблоков 4×4 и восемь подблоков 2×2 могут быть выбраны для того, чтобы представить сегмент изображения.
Выбранный блок или сочетание подблоков затем соответствующим образом располагаются в последовательности в блок 16×16. Значения коэффициентов ДКП/ДПДК могут затем подвергаться частотному взвешиванию, квантованию и кодированию (такому, как кодирование переменной длины) при подготовке к передаче.
Несмотря на то, что способ ДКПАРБ, описанный выше, выполняется необыкновенно хорошо, он требует больших вычислительных затрат. Следовательно, компактная реализация технического обеспечения способа может быть затруднительной. Желателен альтернативный способ, который делал бы реализацию технического обеспечения более эффективной. Способ и система сжатия изображения, которые являются вычислительно более эффективными, предоставляются настоящим изобретением определенным образом, описанным ниже.
Краткое изложение изобретения
Настоящее изобретение является системой и способом сжатия изображения, которые используют блоки и подблоки, адаптивно определенных размеров данных коэффициентов дискретного косинусного преобразования. В одном осуществлении блок 16×16 пиксел вводится в кодировщик. Кодировщик содержит элемент назначения размера блока, который сегментирует введенный блок пиксел для обработки. Назначение размера блока основано на дисперсиях входного блока и подразделенных блоков. Обычно области с большими дисперсиями будут подразделены на меньшие блоки, тогда как области с меньшими дисперсиями не будут подразделены, при условии, что средние величины блока и подблока попадают в различные заранее определенные диапазоны. Следовательно, сначала порог дисперсии блока модифицируется из его номинальной величины, в зависимости от его средней величины, а затем дисперсия блока сравнивается с порогом и, если дисперсия больше, чем порог, тогда блок подразделяется.
Информация о назначении размера блока подается в элемент преобразования, который преобразует данные пикселей в данные частотной области. Преобразование выполняется только относительно блока и подблоков, выбранных посредством назначения размера блока. Данные преобразования затем подвергаются квантованию и преобразованию в последовательную форму. Например, зигзагообразное сканирование может быть использовано для преобразования данных в последовательную форму для того, чтобы создать поток данных. Поток данных затем может быть закодирован с помощью кодировщика переменной длины при подготовке к передаче. Закодированные данные посылаются через канал передачи в декодер, где данные пикселей восстанавливаются при подготовке к отображению.
Краткое описание чертежей
Признаки, задачи и преимущества настоящего изобретения станут более понятными из подробного описания, приведенного ниже, взятого совместно с чертежами, на которых одинаковые ссылочные символы соответственно указаны по всем чертежам и на которых:
фиг.1 - блок-схема системы обработки изображения, которая содержит систему и способ назначения размера блока на основании дисперсии настоящего изобретения;
фиг.2 - последовательность операций, иллюстрирующая шаги обработки, включенные в назначение размера блока на основании дисперсии;
фиг.3а, фиг.3b и фиг.3с иллюстрируют пример назначения размера блока, соответствующего декомпозиции дерева квадрантов, и соответствующие данные PQR.
Подробное описание предпочтительных осуществлений
Для того чтобы облегчить цифровую передачу цифровых сигналов и воспользоваться соответствующими преимуществами, обычно необходимо использовать некоторый вид сжатия сигнала. Для того чтобы достичь высокого разрешения в результирующем изображении, также важно, чтобы поддерживалось высокое качество изображения. Кроме того, вычислительная эффективность желательна для компактной реализации технического обеспечения, которая важна во многих приложениях.
Настоящее изобретение предоставляет систему или устройство и способ сжатия изображения, которые учитывают как качество изображения, так и вычислительную эффективность при выполнении сжатия изображения. Сжатие изображения настоящего изобретения основано на способах дискретного косинусного преобразования (ДКП). Обычно изображение, подлежащее обработке в цифровой области, состоит из данных пикселей, разделенных на область неперекрывающихся блоков размером N×N. Двумерное ДКП может быть выполнено относительно каждого блока. Двумерное ДКП определяется с помощью следующей зависимости:
Figure 00000002
где
Figure 00000003
и
x(m, n) - местоположение пиксела (m,n) в блоке N×M, и
X(k, l) - соответствующий коэффициент ДКП.
Так как величины пикселей являются не отрицательными, составляющая Х(0,0) является всегда положительной и обычно имеет наибольшую энергию. В действительности для типичных изображений большая часть энергии преобразования концентрируется около составляющей Х(0,0). Это свойство компактности энергии соответственно делает способ ДКП таким привлекательным способом сжатия.
Способ сжатия изображения настоящего изобретения использует контрастное адаптивное кодирование для того, чтобы достичь дополнительного уменьшения скорости передачи бит. Замечено, что наиболее естественные изображения составляются из ровных относительно медленно изменяющихся областей и насыщенных областей, таких как границы объекта и текстура высокой контрастности. Схемы контрастного адаптивного кодирования пользуются этим фактором при назначении большего количества бит для насыщенных областей и меньшего количества бит для менее насыщенных областей.
Контрастное адаптивное кодирование также пригодно для уменьшения эффекта разделения на блоки. В реализации других способов кодирования ДКП эффект разделения на блоки, возможно, является наиболее важным вредным влиянием на качество изображения. Кроме того, эффект разделения на блоки имеет тенденцию быть более заметным в насыщенных областях изображения. Однако было установлено, что эффект разделения на блоки уменьшается, когда используется ДКП задания меньшего размера. Эффект разделения на блоки становится виртуально невидимым, когда используется ДКП 2×2, несмотря на то, что страдает эффективность в расчете бит на пиксел. Следовательно, контрастное адаптивное кодирование может уменьшить эффект разделения на блоки с помощью назначения меньших размеров блоков (и, таким образом, больше бит) насыщенным областям и больших размеров блоков относительно незаполненным областям.
Другим признаком настоящего изобретения является то, что оно использует внутрикадровое кодирование (пространственную обработку) вместо межкадрового кодирования (пространственно-временной обработки). Одной из причин для выбора внутрикадрового кодирования является высокая сложность приемника, требуемого для того, чтобы обрабатывать сигналы межкадрового кодирования. Межкадровое кодирование неотъемлемо требует множественных буферов кадров в дополнение к более сложным схемам обработки. Во многих приложениях уменьшенная сложность требуется для современной реализации.
Второй причиной для использования внутрикадрового кодирования является то, что может существовать ситуация или программный материал, которые заставляют схему пространственно-временного кодирования отказывать или неправильно выполняться. Например, фильмы 24 кадра в секунду могут попадать в эту категорию, так как время компоновки (интегрирования) из-за механического затвора является относительно коротким. Короткое время интегрирования допускает более высокую степень временного совмещения. Предположение покадровой корреляции нарушается для быстрого движения, так как оно становится отрывистым.
Дополнительной причиной для использования внутрикадрового кодирования является то, что схема пространственно-временного кодирования является более трудной для стандартизации, когда включены частоты 50 Гц и 60 Гц линии питания. Телевидение в настоящее время передает сигналы либо 50 Гц, либо 60 Гц. Использование внутрикадровой схемы, являющейся цифровым подходом, может адаптироваться к работе как на 50 Гц, так и на 60 Гц или даже к фильмам 24 кадра в секунду с помощью компромисса между частотой кадров относительно пространственного разрешения.
Для целей обработки изображения операция ДКП выполняется относительно данных пикселей, которые разделяются на массив непересекающихся блоков. Заметим, что, несмотря на то, что в настоящем описании обсуждаются размеры блоков, как равные N×N, представляется, что могут использоваться различные размеры блоков. Например, может использоваться размер блока N×M, где как N, так и М - целые, причем М либо больше, либо меньше, чем N. Другим важным аспектом является то, что блок делится, по меньшей мере, на один уровень подблоков, таких как N/i×N/i, N/i×N/j, N/i×M/j и т.д., где i и j - целые. Кроме того, примерный размер блока, как обсуждается в настоящем описании, является блоком 16×16 пикселей с соответствующим блоком и подблоками коэффициентов ДКП. Дополнительно представляется, что могут использоваться различные другие целые, такие как обе четные или нечетные целые величины, например, 9×9.
Теперь ссылаясь на фиг.1, изображена система 100 обработки изображения, которая содержит систему сжатия настоящего изобретения. Система 100 обработки изображения содержит кодировщик 102, который сжимает принятый видеосигнал. Сжатый сигнал передается через канал 104 передачи и принимается декодером 106. Декодер 106 декодирует принятый сигнал в выборки изображения, которые затем могут быть отображены.
Обычно изображение делится на блоки пикселей для обработки. Цветной сигнал может быть преобразован из пространства красный-зеленый-синий (RGB) в пространство YC1C2, где Y является составляющей яркости или освещенности, a C1 и C2 являются составляющими цветности или цвета. Из-за низкой пространственной чувствительности глаза к цвету многие системы дополнительно квантуют составляющие C1 и C2 на коэффициент четыре в горизонтальном и вертикальном направлениях. Однако дополнительное квантование необязательно. Изображение с полным разрешением, известное как формат 4:4:4, может быть либо очень полезно, либо необходимо в некоторых приложениях, таких как изображения, упоминаемые как охватывающие "цифровое кино". Двумя возможными представлениями YC1C2 являются: представление YIQ и представление YUV, оба из которых хорошо известны в данной области техники. Также возможно использовать вариант представления YUV, известный как YCbCr.
В предпочтительном варианте осуществления каждая из составляющих Y, Cb, и Cr обрабатывается без подквантования. Затем входной сигнал блока 16×16 пикселей подается в кодировщик 102. Кодировщик 102 содержит элемент 108 назначения размера блока, который выполняет назначение размера блока при подготовке к сжатию видеосигнала. Элемент 108 назначения размера блока определяет блочную декомпозицию блока 16×16 на основании воспринимаемых характеристик изображения в блоке. Назначение размера блока подразделяет каждый блок 16×16 на меньшие блоки способом дерева квадрантов в зависимости от активности в блоке 16×16. Элемент 108 назначения размера блока генерирует данные дерева квадрантов, называемые данными PQR, длина которых может быть между 1 и 21 бит. Следовательно, если при назначении размера блока определяют, что блок 16×16 должен быть подразделен, устанавливается бит R данных PQR, за которым следуют четыре дополнительных бита данных Р, соответствующие четырем разделенным блокам 8×8. Если при назначении размера блока определяют, что любой из блоков 8×8 должен быть подразделен, тогда добавляются четыре дополнительных бита данных Q для каждого подразделенного блока 8×8.
Теперь ссылаясь на фиг.2, предоставлена последовательность операций, изображающая подробности работы элемента 108 назначения размера блока. Алгоритм использует дисперсию блока в качестве показателя при решении о подразделении блока. Начиная на шаге 202, блок 16×16 пиксел считывается. На шаге 204 вычисляется дисперсия v16 блока 16×16. Дисперсия вычисляется следующим образом:
Figure 00000004
где N=16, a xi,j - пиксел в i-ой строке, j-ом столбце в блоке N×N. На шаге 206 сначала изменяется порог Т16 дисперсии для того, чтобы обеспечить новый порог Т′16, если средняя величина блока находится между двумя заранее определенными величинами, затем дисперсия блока сравнивается с новым порогом Т′16.
Если дисперсия v16 не больше, чем порог Т16, тогда на шаге 208 записывается начальный адрес блока 16×16 и бит R данных PQR устанавливается в 0 для того, чтобы указать, что блок 16×16 не подразделяется. Затем алгоритм считывает следующий блок 16×16 пикселей. Если дисперсия v16 больше, чем порог Т16, тогда на шаге 210 бит R данных PQR устанавливается в 1 для того, чтобы указать, что блок 16×16 должен быть подразделен на четыре блока 8×8.
Четыре блока 8×8, i=1:4, рассматриваются последовательно для дополнительного подразделения, как изображено на шаге 212. Для каждого блока 8×8 вычисляется дисперсия v8i на шаге 214. На шаге 216 сначала изменяется порог Т8 дисперсии для того, чтобы обеспечить новый порог Т′8, если средняя величина блока находится между двумя заранее определенными величинами, затем дисперсия блока сравнивается с этим новым порогом.
Если дисперсия v8i не больше, чем порог Т8, тогда на шаге 218 записывается начальный адрес блока 8×8, и соответствующий бит Q, Qi устанавливается в 0. Затем обрабатывается следующий блок 8×8. Если дисперсия v8i больше, чем порог Т8, тогда на шаге 220 соответствующий бит Q, Qi устанавливается в 1 для того, чтобы указать, что блок 8×8 должен быть подразделен на четыре блока 4×4.
Четыре блока 4×4, ji=1:4, рассматриваются последовательно для дополнительного подразделения, как изображено на шаге 222. Для каждого блока 4×4 вычисляется дисперсия v4ij на шаге 224. На шаге 226 сначала изменяется порог Т4 дисперсии для того, чтобы обеспечить новый порог Т′4, если средняя величина блока находится между двумя заранее определенными величинами, затем дисперсия блока сравнивается с этим новым порогом.
Если дисперсия v4ij не больше, чем порог Т4, тогда на шаге 228 записывается начальный адрес блока 4×4, и соответствующий бит Р, Pij устанавливается в 0. Затем обрабатывается следующий блок 4×4. Если дисперсия v4ij больше, чем порог Т4, тогда на шаге 230 соответствующий бит Р, Pij устанавливается в 1 для того, чтобы указать, что блок 4×4 должен быть подразделен на четыре блока 2×2. Кроме того, записываются адреса 4-х блоков 2×2.
Пороги Т16, Т8 и Т4 могут быть заранее определенными константами. Это известно как жесткое решение. Альтернативно может быть реализовано адаптивное или гибкое решение. Гибкое решение изменяет пороги для дисперсий в зависимости от средней величины пикселей блоков 2N×2N, где N может быть 8, 4 или 2. Следовательно, функции средних величин пикселей могут быть использованы в качестве порогов.
С целью иллюстрации рассмотрим следующий пример. Пусть заранее определенные пороги дисперсии для составляющей Y равны 50, 1100 и 880 для блоков 16×16, 8×8 и 4×4, соответственно. Иначе говоря, Т16=50, Т8=1100 и Т16=880. Пусть диапазон средних величин равен 80 и 100. Допустим, что вычисленная дисперсия для блока 16×16 равна 60. Так как 60 и его средняя величина 90 больше, чем Т16, блок 16×16 подразделяется на четыре подблока 8×8. Допустим, что вычисленные дисперсии для блоков 8×8 равны 1180, 935, 980 и 1210. Так как два из блоков 8×8 имеют дисперсии, которые превышают Т8, эти два блока дополнительно подразделяются для того, чтобы создать в итоге восемь подблоков 4×4. Наконец, допустим, что дисперсии восьми блоков 4×4 равны 620, 630, 670, 610, 590, 525, 930 и 690 с соответствующими средними величинами 90, 120, 110, 115. Так как средняя величина первого блока 4×4 попадает в диапазон (80, 100), его порог будет снижен до Т4=200, который меньше, чем 880. Таким образом, этот блок 4×4 будет также подразделен на семь блоков 4×4. Результирующее назначение размера блока изображено на фиг.3а. Соответствующая декомпозиция дерева квадрантов изображена на фиг.3b. Кроме того, данные PQR, сгенерированные с помощью этого назначения размера блока, изображены на фиг.3с.
Заметим, что аналогичная процедура используется для назначения размеров блоков для составляющих C1 и С2 цвета. Составляющие цвета могут быть прорежены горизонтально, вертикально или в обоих направлениях.
Кроме того, заметим, что несмотря на то, что назначение размера блока описано как подход сверху вниз, в котором сначала оценивается самый большой блок (16×16 в настоящем примере), вместо него может использоваться подход снизу вверх. Подход снизу вверх сначала будет оценивать наименьшие блоки (2×2 в настоящем примере).
Со ссылками на фиг.1 описана остальная часть системы 100 обработки изображения. Данные PQR вместе с адресами выбранных блоков подаются в элемент 110 ДКП. Элемент 110 ДКП использует данные PQR для выполнения дискретного косинусного преобразования соответствующих размеров относительно выбранных блоков. Только выбранные блоки нужно подвергать обработке ДКП.
Система 100 обработки изображения может выборочно содержать элемент ДПДК 112 для уменьшения избыточности среди постоянных коэффициентов ДКП. Постоянный коэффициент встречается в верхнем левом углу каждого блока ДКП. Постоянные коэффициенты обычно являются большими по сравнению с переменными коэффициентами. Различие в размерах делает трудным сконструировать эффективный кодировщик переменной длины. Таким образом, выгодно уменьшить избыточность среди постоянных коэффициентов.
Элемент 112 ДПДК выполняет двумерные ДКП относительно постоянных коэффициентов, беря по одному 2×2. Начиная с блоков 2×2 в блоках 4×4, двумерное ДКП выполняется относительно четырех постоянных коэффициентов. Это ДКП 2×2 называется дифференциальным преобразованием дерева квадрантов, или ДПДК, четырех постоянных коэффициентов. Затем постоянный коэффициент ДПДК вместе с тремя соседними постоянными коэффициентами с блоком 8×8 используются для вычисления ДПДК следующего уровня. Наконец, постоянные коэффициенты четырех блоков 8×8 с блоком 16×16 используются для вычисления ДПДК. Следовательно, в блоке 16×16 имеется один действительный постоянный коэффициент, а остальные являются переменными коэффициентами, соответствующими ДКП и ДПДК.
Коэффициенты преобразования (как ДКП, так и ДПДК) подаются в устройство 114 квантования для квантования. В предпочтительном варианте осуществления коэффициенты ДКП квантуются с использованием частотных взвешивающих масок (ЧВМ) и масштабного коэффициента квантования. ЧВМ является таблицей частотных весов тех же самых размерностей, как блок входных коэффициентов ДКП. Частотные веса применяют различные веса к различным коэффициентам ДКП. Веса предназначены для выделения входных выборок, имеющих частотное содержание, к которому зрительная система человека является более чувствительной, и для подавления выборок, имеющих частотное содержание, к которому зрительная система является менее чувствительной. Веса могут быть сконструированы также на основании факторов, таких как расстояния просмотра и т.д.
Веса выбираются на основании эмпирических данных. Способ для конструирования взвешивающих масок для коэффициентов 8х8 ДКП раскрыт в стандарте ISO/IEC JTC1 CD 109918 "Цифровое сжатие и кодирование полутоновых неподвижных изображений - часть 1: Требования и руководящие указания". Международная организация стандартов, 1994 г., который включен в настоящее описание в качестве ссылки. Обычно конструируются две ЧВМ, одна для составляющей яркости, а другая для составляющих цветности. Таблицы ЧВМ для размеров 2×2, 4×4 блоков получаются с помощью прореживания, а 16×16 - с помощью интерполяции таблицы для блока 8×8. Масштабный коэффициент управляет качеством и скоростью бит квантованных коэффициентов.
Следовательно, каждый коэффициент ДКП квантуется в соответствии с зависимостью:
Figure 00000005
где ДКП(i, j) - входной коэффициент ДКП, fwm(i, j) - частотная взвешивающая маска, q - масштабный коэффициент, а ДКПq(i, j) - квантованный коэффициент. Заметим, что в зависимости от знака коэффициента ДКП первый член внутри скобок округляется вверх или вниз. Коэффициенты ДПДК также квантуются с использованием соответствующих взвешивающих масок. Однако может использоваться множество таблиц масок и применяться к каждой из составляющих Y, Cb и Cr.
Квантованные коэффициенты подаются в преобразователь 116 в последовательную форму зигзагообразного сканирования. Преобразователь 116 в последовательную форму сканирует блоки квантованных коэффициентов зигзагообразным образом для того, чтобы создать преобразованный в последовательную форму поток квантованных коэффициентов. Число различных шаблонов сканирования, а также шаблонов, отличных от зигзагообразного, также может выбираться. Предпочтительный способ использует размеры 8×8 блока для зигзагообразного сканирования, несмотря на то, что могут использоваться другие размеры.
Заметим, что преобразователь 116 в последовательную форму может быть расположен либо перед, либо после устройства 114 квантования. Полученные результаты являются одинаковыми.
В любом случае поток квантованных коэффициентов подается в кодировщик 118 переменной длины. Кодировщик 118 переменной длины может использовать кодирование с переменной длиной нулей с последующим кодированием кодированием Хафмана. Этот способ обсужден подробно в вышеупомянутых патентах США №№5021891, 5107345 и 5452104 и резюмирован в настоящем описании. Кодировщик с переменной длиной выбирает квантованные коэффициенты и выделяет ноль из ненулевых коэффициентов. Нулевые величины называются как значения переменной длины и кодируются способом Хафмана. Ненулевые величины отдельно кодируются способом Хафмана.
Модифицированное кодирование Хафмана квантованных коэффициентов также возможно и используется в предпочтительном осуществлении. Здесь после зигзагообразного сканирования кодировщик переменной длины будет определять пары переменной длины/размера в каждом блоке 8×8. Эти пары переменной длины/размера затем кодируются способом Хафмана.
Коды Хафмана конструируются либо из измеренных или теоретических статистических данных изображения. Было замечено, что наиболее естественные изображения составляются из незаполненных или относительно медленно изменяющихся областей и насыщенных областей, таких как границы объекта и высококонтрастная текстура. Кодировщики Хафмана с частотно-пространственными преобразованиями, такими как ДКП, используют эти особенности при назначении большего количества бит насыщенным областям и меньшего количества бит незаполненным областям. Обычно кодировщики Хафмана используют просмотровые таблицы для кодирования переменной длины и ненулевых величин. Обычно используются множественные таблицы, причем в настоящем изобретении предпочтительны 3 таблицы, несмотря на то, что могут использоваться 1 или 2, когда необходимо.
Сжатый сигнал изображения, сгенерированный кодировщиком 102, передается в декодер 106 через канал 104 передачи. Данные PQR, которые содержат информацию назначения размера блока, также подаются в декодер 106. Декодер 106 содержит декодер 120 переменной длины, который декодирует с переменной длиной величины и ненулевые величины.
Выходной сигнал декодера 120 переменной длины подается в обратный преобразователь из последовательной формы зигзагообразного сканирования, который упорядочивает коэффициенты в соответствии с используемой схемой сканирования. Обратный преобразователь 122 из последовательной формы зигзагообразного сканирования принимает данные PQR для того, чтобы принимать участие в соответствующем упорядочении коэффициентов в составной блок коэффициентов.
Составной блок подается в устройство 124 обратного квантования для обратной обработки из-за использования частотных взвешивающих масок.
Блок коэффициентов затем подается в элемент 126 ОДПДК (обратного ДПДК), после которого следует элемент 128 ОДКП (обратного ДКП), если было применено дифференциальное преобразование дерева квадрантов. Иначе блок коэффициентов подается непосредственно в элемент 128 ОДКП. Элемент 126 ОДПДК и элемент 128 ОДКП выполняют обратное преобразование коэффициентов для того, чтобы создать блок данных пикселей. Данные пикселей могут быть затем быть интерполированы, преобразованы в форму красный-зеленый-синий, а затем запомнены для будущего отображения.
Таким образом, представлены система и способ для сжатия изображения, которые выполняют назначение размера блока на основании дисперсии пикселей. Назначение размера блока на основании дисперсии имеет несколько преимуществ. Так как дискретное косинусное преобразование выполняется после того, как определены размеры блоков, достигается эффективное вычисление. Интенсивное в вычислительном отношении преобразование необходимо выполнить только для выбранных блоков. Кроме того, процесс выбора блока является эффективным, так как дисперсия величин пикселей является математически легкой для вычисления. Еще одним преимуществом назначения размера блока на основании дисперсии является то, что оно основано на восприятии. Дисперсия пикселей является критерием активности в блоке и обеспечивает указание наличия контуров, текстур и т.д. Он стремится собрать подробности блока значительно лучше, чем критерии, такие как среднее величин пикселей. Следовательно, схема, основанная на дисперсии, настоящего изобретения назначает меньшие блоки областям с большими контурами, а большие блоки - более гладким областям. В результате лучшее качество может быть достигнуто в восстановленном изображении.
Еще одним важным преимуществом является то, что, так как назначение размера блока выполняется перед квантованием, большая гибкость предоставляется при управлении скоростью передачи битов и качеством. Поскольку порог дисперсии адаптируется к локальной средней величине, малые блоки назначаются даже в относительно темные области. Это сохраняет детали во всех областях, которые выше едва заметного порога видимости. Кроме того, сжатие изображения на основании дисперсии обеспечивает изящное ухудшение качества изображения, когда масштабный коэффициент квантования изменяется от малых до больших величин, в отличие от способов, таких как MPEG (алгоритм сжатия подвижных изображений, предложенный группой экспертов в области движущихся изображений). Это в частности критично для приложений, таких как в области цифрового кино.
При широком спросе на цифровое видео пиратство является серьезной угрозой. Вставка цифровых "водяных знаков" является важным требованием для того, чтобы предотвратить нарушение авторского права и потерю дохода. Так как вставка "водяных знаков" выполняется в областях изображения, которые важны для восприятия, назначение размера блока на основании дисперсии является естественным кандидатом для вставки "водяных знаков".
Предыдущее описание предпочтительных осуществлений предоставлено для того, чтобы дать возможность любому специалисту в данной области техники изготовить или использовать настоящее изобретение. Различные модификации этих осуществлений будут легко понятны специалистам в данной области техники, и основные принципы, определенные в настоящем описании, могут быть применены к другим вариантам осуществления без использования изобретательской способности. Следовательно, не предполагается, что настоящее изобретение ограничено вариантами осуществления, описанными в настоящем описании, а должны соответствовать самым широким рамкам, совместимым с принципами и новыми признаками, раскрытыми в настоящем описании.

Claims (34)

1. Способ определения назначения размера блока для входного блока данных пикселей, подлежащего использованию при сжатии упомянутого входного блока, заключающийся в том, что считывают блок данных пикселей, генерируют назначение размера блока на основании дисперсий величин пикселей упомянутого блока данных пикселей и подразделенных блоков упомянутого блока данных пикселей, причем упомянутый этап генерирования включает в себя этапы, на которых определяют дисперсию величин пикселей для упомянутого блока данных пикселей, сравнивают упомянутую дисперсию с заранее заданным порогом, причем упомянутый порог является функцией среднего значения величин пикселей оцениваемого блока, принимают решение о подразделении упомянутого блока, если упомянутая дисперсия больше упомянутого порога, если упомянутое решение заключается в подразделении упомянутого блока, то повторяют этапы определения, сравнения и принятия решения для каждого подразделенного блока до тех пор, пока не будет удовлетворен заранее определенный критерий, обозначают, в качестве упомянутого назначения размера блока, каждый блок, который в дальнейшем не должен быть подразделен, и формируют структуру данных, содержащую информацию об упомянутом назначении размера блока.
2. Способ по п.1, в котором упомянутый порог изменяется для каждого уровня подразделения.
3. Способ по п.1, в котором упомянутый заранее определенный критерий о том, чтобы больше не повторять этапы определения, сравнения и принятия решения, основан на заранее выбранном минимальном размере блока данных пикселей.
4. Способ по п. 1, в котором упомянутую дисперсию определяют в соответствии со следующим уравнением:
Figure 00000006
где N - размерность блока;
хi,j - пиксель в i-й строке, j-м столбце в блоке NxN.
5. Система сжатия изображения для сжатия блока данных пикселей, содержащая средство назначения размера блока для выбора упомянутого блока или подразделенных блоков упомянутого блока, подлежащего сжатию, на основании дисперсий величин пикселей упомянутого блока данных пикселей и подразделенных блоков упомянутого блока данных пикселей, причем упомянутое средство назначения размера блока выполнено с возможностью определения дисперсии величин пикселей для упомянутого блока данных пикселей, сравнения упомянутой дисперсии с заранее заданным порогом, причем упомянутый порог является функцией среднего значения величин пикселей оцениваемого блока, принятия решения о подразделении упомянутого блока, если упомянутая дисперсия больше упомянутого заранее заданного порога, при этом, если принятое решение заключается в подразделении упомянутого блока, то повторения этапов определения дисперсии, сравнения с заранее заданным порогом и принятия решения о подразделении для каждого подразделенного блока до тех пор, пока не будет удовлетворен заранее определенный критерий, и обозначения, в качестве упомянутого назначения размера блока, каждого блока, который в дальнейшем не должен быть подразделен, средство преобразования для преобразования данных пикселей упомянутого выбранного блока или подразделенных блоков в данные частотной области, средство квантования для квантования упомянутых данных частотной области, средство преобразования в последовательную форму для сканирования упомянутых квантованных данных в преобразованный в последовательную форму поток данных, и средство кодирования с переменной длиной для кодирования упомянутого преобразованного в последовательную форму потока данных при подготовке к передаче.
6.
Figure 00000007
Система по п.5, в которой упомянутый порог изменяется для каждого уровня подразделения.
7. Система по п.5, в которой упомянутый заранее определенный критерий для того, чтобы больше не подразделять, основан на заранее выбранном достигаемом минимальном размере блока данных пикселей.
8. Система по п.5, в которой упомянутое средство преобразования выполняет дискретное косинусное преобразование.
9. Система по п.5, в которой упомянутое средство преобразования выполняет дискретное косинусное преобразование с последующим дифференциальным преобразованием дерева квадрантов.
10. Система по п.5, в которой упомянутое средство преобразования в последовательную форму содержит устройство зигзагообразного сканирования.
11. Система по п.10, в которой упомянутое устройство зигзагообразного сканирования использует размер 8х8 блока для зигзагообразного сканирования.
12. Система по п.5, в которой упомянутое средство кодирования с переменной длиной содержит кодировщик Хаффмана.
13. Система по п. 12, в которой упомянутый кодировщик Хаффмана использует множество просмотровых таблиц для того, чтобы кодировать величины с переменной длиной и ненулевые величины.
14. Система по п. 13, в которой имеются три просмотровые таблицы.
15. Система по п.5, в которой упомянутую дисперсию определяют в соответствии со следующим уравнением:
Figure 00000008
где N - размерность блока;
хi,j - пиксель в i-й строке, j-м столбце в блоке NxN.
16. Способ сжатия блока данных пикселей изображения, заключающийся в том, что считывают блок данных пикселей, генерируют назначение размера блока на основании дисперсии величин пикселей упомянутого блока данных пикселей и подразделенных блоков упомянутого блока данных пикселей, причем упомянутый этап генерирования дополнительно содержит этапы, на которых определяют дисперсию величин пикселей для упомянутого блока данных пикселей, сравнивают упомянутую дисперсию с заранее заданным порогом, причем упомянутый порог является функцией среднего значения величин пикселей оцениваемого блока, принимают решение о подразделении упомянутого блока, если упомянутая дисперсия больше упомянутого порога, если упомянутым решением является решение о подразделении упомянутого блока, то повторяют этапы определения, сравнения и принятия решения для каждого подразделенного блока до тех пор, пока не будет удовлетворен заранее определенный критерий, и обозначают, в качестве назначения размера блока, каждый блок, который далее не подразделяется, формируют структуру данных, содержащую информацию относительно упомянутого назначения размера блока, преобразуют упомянутые данные пикселей выбранных блоков, как указано упомянутой структурой данных, в представление частотной области, квантуют упомянутые данные в частотной области на основе воспринимаемых человеком характеристик изображения, сканируют упомянутые квантованные данные в преобразованный в последовательную форму поток данных, и кодируют упомянутый преобразованный в последовательную форму поток данных при подготовке к передаче.
17. Способ по п.16, в котором упомянутый порог изменяется для каждого уровня подразделения.
18. Способ по п.16, в котором упомянутый заранее определенный критерий для того, чтобы больше не повторять этапы определения, сравнения и принятия решения, основан на заранее выбранном минимальном размере блока данных пикселей.
19. Способ по п.16, в котором упомянутое дискретное косинусное преобразование выполняют во время упомянутого этапа преобразования.
20. Способ по п.16, в котором дискретное косинусное преобразование выполняют с последующим дифференциальным преобразованием дерева квадрантов во время упомянутого этапа преобразования.
21. Способ по п.16, в котором зигзагообразное сканирование выполняют во время упомянутого этапа сканирования.
22. Способ по п.21, в котором упомянутое зигзагообразное сканирование выполняют с использованием размера блока 8×8.
23. Способ по п.16, в котором кодирование Хаффмана выполняют во время упомянутого этапа кодирования.
24. Способ по п.23, в котором упомянутое кодирование Хаффмана использует множество просмотровых таблиц для того, чтобы кодировать величины с переменной длиной и ненулевые величины.
25. Способ по п.24, в котором имеются три просмотровые таблицы.
26. Способ по п.16, в котором упомянутую дисперсию определяют в соответствии со следующим уравнением:
Figure 00000009
где N - размерность блока;
хi,j - пиксель в i-й строке, j-м столбце в блоке NxN.
27. Система сжатия блока данных пикселей изображения, содержащая средство считывания для считывания блока данных пикселей, средство генерирования для генерирования назначения размера блока на основании дисперсий величин пикселей упомянутого блока данных пикселей и подразделенных блоков упомянутого блока данных пикселей, причем упомянутое средство генерирования содержит средство определения для определения дисперсии величин пикселей для упомянутых блоков данных пикселей, средство сравнения для сравнения упомянутых дисперсий с заранее заданным порогом, причем упомянутый порог является функцией среднего значения величин пикселей оцениваемого блока, средство принятия решения для принятия решения о подразделении упомянутого блока, если упомянутая дисперсия больше упомянутого порога, если упомянутое средство принятия решения предназначено для принятия решения о подразделении упомянутого блока, то определяют, сравнивают и принимают решение для каждого подразделенного блока до тех пор, пока не будет удовлетворен заранее определенный критерий,и средство обозначения, в качестве упомянутого назначения размера блока, каждого блока, который в дальнейшем не подразделяется.
28. Система по п.27, в которой упомянутый порог изменяется для каждого уровня подразделения.
29. Система по п.27, в которой упомянутый заранее определенный критерий основан на заранее выбранном минимальном размере блока данных пикселей.
30. Система по п.27, в которой упомянутое средство преобразование использует дискретное косинусное преобразование.
31. Система по п.27, в которой упомянутое средство преобразование использует дискретное косинусное преобразование с последующим дифференциальным преобразованием дерева квадрантов.
32. Система по п.27, в которой упомянутое средство сканирования использует зигзагообразное сканирование.
33. Система по п.27, в которой упомянутое средство кодирования использует кодирование Хаффмана.
34. Система по п. 33, в которой упомянутое кодирование Хаффмана использует множество просмотровых таблиц для кодирования величин с переменной длиной и ненулевых величин.
RU2002115290/09A 1999-11-08 2000-11-08 Сжатие изображения с использованием дискретного косинусного преобразования адаптивно определенного размера блока на основании дисперсии RU2273112C2 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/436,085 1999-11-08
US09/436,085 US6529634B1 (en) 1999-11-08 1999-11-08 Contrast sensitive variance based adaptive block size DCT image compression

Publications (2)

Publication Number Publication Date
RU2002115290A RU2002115290A (ru) 2004-04-20
RU2273112C2 true RU2273112C2 (ru) 2006-03-27

Family

ID=23731055

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2002115290/09A RU2273112C2 (ru) 1999-11-08 2000-11-08 Сжатие изображения с использованием дискретного косинусного преобразования адаптивно определенного размера блока на основании дисперсии

Country Status (18)

Country Link
US (1) US6529634B1 (ru)
EP (1) EP1230804B1 (ru)
JP (2) JP5289659B2 (ru)
KR (1) KR100740818B1 (ru)
CN (1) CN1186942C (ru)
AR (1) AR033655A1 (ru)
AT (1) ATE538598T1 (ru)
AU (1) AU782176B2 (ru)
BR (1) BR0015341B1 (ru)
CA (1) CA2389410C (ru)
ES (1) ES2376540T3 (ru)
HK (1) HK1053565A1 (ru)
IL (2) IL149455A0 (ru)
MX (1) MXPA02004577A (ru)
RU (1) RU2273112C2 (ru)
TW (1) TW517500B (ru)
WO (1) WO2001035673A1 (ru)
ZA (1) ZA200203276B (ru)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8228998B2 (en) 2006-10-10 2012-07-24 Nippon Telegraph And Telephone Corporation Intra prediction encoding control method and apparatus, program therefor, and storage medium which stores the program
RU2496139C2 (ru) * 2006-06-26 2013-10-20 Квэлкомм Инкорпорейтед Эффективные аппроксимации с фиксированной запятой прямого и обратного дискретных косинусных преобразований
US8571340B2 (en) 2006-06-26 2013-10-29 Qualcomm Incorporated Efficient fixed-point approximations of forward and inverse discrete cosine transforms
US8595281B2 (en) 2006-01-11 2013-11-26 Qualcomm Incorporated Transforms with common factors
US8606023B2 (en) 2006-06-26 2013-12-10 Qualcomm Incorporated Reduction of errors during computation of inverse discrete cosine transform
US8849884B2 (en) 2006-03-29 2014-09-30 Qualcom Incorporate Transform design with scaled and non-scaled interfaces
RU2540842C2 (ru) * 2010-04-05 2015-02-10 Самсунг Электроникс Ко., Лтд. Способ и устройство для кодирования видео путем использования индекса преобразования, а также способ и устройство для декодирования видео путем использования индекса преобразования
US8982961B2 (en) 2010-04-05 2015-03-17 Samsung Electronics Co., Ltd. Method and apparatus for encoding video by using transformation index, and method and apparatus for decoding video by using transformation index
US9049450B2 (en) 2010-04-05 2015-06-02 Samsung Electronics Co., Ltd. Method and apparatus for encoding video based on internal bit depth increment, and method and apparatus for decoding video based on internal bit depth increment
US9369736B2 (en) 2010-04-05 2016-06-14 Samsung Electronics Co., Ltd. Low complexity entropy-encoding/decoding method and apparatus

Families Citing this family (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1033885B1 (en) * 1998-09-21 2009-06-24 Sony Corporation Encoding device and method, and decoding device and method
GB2364415B (en) * 2000-06-30 2004-10-20 Post Office Image processing
US6972868B1 (en) 2000-11-09 2005-12-06 Hewlett-Packard Development Company, L.P. Image data compression method
US7649947B2 (en) * 2001-06-05 2010-01-19 Qualcomm Incorporated Selective chrominance decimation for digital images
US6870963B2 (en) 2001-06-15 2005-03-22 Qualcomm, Inc. Configurable pattern optimizer
US6735254B2 (en) * 2001-06-29 2004-05-11 Qualcomm, Inc. DCT compression using Golomb-Rice coding
US7483581B2 (en) 2001-07-02 2009-01-27 Qualcomm Incorporated Apparatus and method for encoding digital image data in a lossless manner
US6650784B2 (en) * 2001-07-02 2003-11-18 Qualcomm, Incorporated Lossless intraframe encoding using Golomb-Rice
US7630563B2 (en) * 2001-07-19 2009-12-08 Qualcomm Incorporated System and method for decoding digital image and audio data in a lossless manner
KR100921063B1 (ko) * 2001-08-02 2009-10-08 소니 가부시끼 가이샤 화상 처리 장치 및 방법, 화상 처리 프로그램을 기록한 기록 매체, 양자화 제어 장치 및 방법, 및 양자화 제어 프로그램을 기록한 기록 매체
WO2003026350A2 (en) * 2001-09-14 2003-03-27 The Regents Of The University Of Michigan Audio distributor
WO2003045069A2 (en) * 2001-11-16 2003-05-30 Qualcomm Incorporated Block size assignment using local contrast ratio
US7742525B1 (en) * 2002-07-14 2010-06-22 Apple Inc. Adaptive motion estimation
US7856149B2 (en) * 2002-07-29 2010-12-21 Qualcomm Incorporated Digital image encoding
US6975773B1 (en) * 2002-07-30 2005-12-13 Qualcomm, Incorporated Parameter selection in data compression and decompression
JP3679083B2 (ja) * 2002-10-08 2005-08-03 株式会社エヌ・ティ・ティ・ドコモ 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、画像符号化プログラム、画像復号プログラム
US7564382B2 (en) * 2002-11-15 2009-07-21 Qualcomm Incorporated Apparatus and method for multiple description encoding
KR100828353B1 (ko) * 2003-02-05 2008-05-08 삼성전자주식회사 영상 블록 분할 방법 및 그 장치
TWI373734B (en) * 2003-03-17 2012-10-01 Qualcomm Inc Method and apparatus for improving video quality of low bit-rate video
US7995849B2 (en) * 2003-03-17 2011-08-09 Qualcomm, Incorporated Method and apparatus for improving video quality of low bit-rate video
KR100510137B1 (ko) * 2003-04-30 2005-08-26 삼성전자주식회사 고속 움직임 추정을 위한 참조 픽쳐 및 블록 모드 결정방법, 그 장치, 블록 모드 결정 방법 및 그 장치
HUP0301368A3 (en) * 2003-05-20 2005-09-28 Amt Advanced Multimedia Techno Method and equipment for compressing motion picture data
KR100723400B1 (ko) * 2004-05-12 2007-05-30 삼성전자주식회사 복수의 룩업테이블을 이용한 디지털 신호 부호화 방법 및장치
US7792188B2 (en) * 2004-06-27 2010-09-07 Apple Inc. Selecting encoding types and predictive modes for encoding video data
US20050286777A1 (en) * 2004-06-27 2005-12-29 Roger Kumar Encoding and decoding images
US8111752B2 (en) * 2004-06-27 2012-02-07 Apple Inc. Encoding mode pruning during video encoding
US7852916B2 (en) 2004-06-27 2010-12-14 Apple Inc. Efficient use of storage in encoding and decoding video data streams
CN1812579B (zh) * 2004-06-27 2010-04-21 苹果公司 在视频数据流的编码和解码中存储设备的有效使用
FI20050113A (fi) * 2005-02-01 2006-08-02 Paavo Eskelinen Menetelmä kuvainformaation käsittelemiseksi
US7609766B2 (en) * 2005-02-08 2009-10-27 Vixs Systems, Inc. System of intra-picture complexity preprocessing
US20070200738A1 (en) * 2005-10-12 2007-08-30 Yuriy Reznik Efficient multiplication-free computation for signal and data processing
WO2007148428A1 (ja) * 2006-06-20 2007-12-27 Nikon Corporation 画像処理方法、画像処理装置、及び画像処理プログラム
JP4906458B2 (ja) * 2006-09-29 2012-03-28 キヤノン株式会社 画像符号化装置、画像符号化方法
US8542726B2 (en) * 2006-10-17 2013-09-24 Microsoft Corporation Directional and motion-compensated discrete cosine transformation
CN100542298C (zh) * 2007-09-29 2009-09-16 中国科学院计算技术研究所 一种柱面全景视频编码的块尺寸计算方法和传输方法
US8325796B2 (en) 2008-09-11 2012-12-04 Google Inc. System and method for video coding using adaptive segmentation
KR101619972B1 (ko) 2008-10-02 2016-05-11 한국전자통신연구원 이산 여현 변환/이산 정현 변환을 선택적으로 이용하는 부호화/복호화 장치 및 방법
US8503527B2 (en) 2008-10-03 2013-08-06 Qualcomm Incorporated Video coding with large macroblocks
US8855203B2 (en) * 2009-04-08 2014-10-07 Sharp Kabushiki Kaisha Video encoding apparatus and video decoding apparatus
KR101456498B1 (ko) * 2009-08-14 2014-10-31 삼성전자주식회사 계층적 부호화 단위의 스캔 순서를 고려한 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
KR20110017719A (ko) * 2009-08-14 2011-02-22 삼성전자주식회사 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
KR101624649B1 (ko) * 2009-08-14 2016-05-26 삼성전자주식회사 계층적인 부호화 블록 패턴 정보를 이용한 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
CN106454370B (zh) * 2010-04-13 2019-11-01 Ge视频压缩有限责任公司 解码器、重建数组的方法、编码器、编码方法及数据流
JP5479225B2 (ja) * 2010-05-27 2014-04-23 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
JP5765893B2 (ja) * 2010-06-16 2015-08-19 キヤノン株式会社 画像処理装置、撮像装置および画像処理プログラム
JP5741729B2 (ja) * 2010-12-09 2015-07-01 ソニー株式会社 画像処理装置及び画像処理方法
JP5741076B2 (ja) * 2010-12-09 2015-07-01 ソニー株式会社 画像処理装置及び画像処理方法
US8761245B2 (en) * 2010-12-21 2014-06-24 Intel Corporation Content adaptive motion compensation filtering for high efficiency video coding
JP2012238927A (ja) * 2011-05-09 2012-12-06 Sony Corp 画像処理装置及び画像処理方法
SG11201402920TA (en) 2011-12-19 2014-11-27 Sony Corp Image processing device and method
CN103313046B (zh) * 2012-03-06 2019-06-14 中兴通讯股份有限公司 一种残差的表示方法和熵编码输入装置
CN103428485A (zh) * 2012-05-24 2013-12-04 富士通株式会社 图像编码方法及图像解码方法
US9258389B2 (en) 2012-08-13 2016-02-09 Gurulogic Microsystems Oy Encoder and method
US10333547B2 (en) 2012-08-13 2019-06-25 Gurologic Microsystems Oy Encoder and method for encoding input data using a plurality of different transformations or combinations of transformations
GB2503295B (en) * 2012-08-13 2014-08-06 Gurulogic Microsystems Oy Encoder and method
TW201419862A (zh) * 2012-11-13 2014-05-16 Hon Hai Prec Ind Co Ltd 影像切割系統及方法
TW201419865A (zh) * 2012-11-13 2014-05-16 Hon Hai Prec Ind Co Ltd 影像切割系統及方法
TW201419863A (zh) * 2012-11-13 2014-05-16 Hon Hai Prec Ind Co Ltd 影像切割系統及方法
US9177393B2 (en) * 2013-02-04 2015-11-03 Qualcomm Incorporated Mixed mode for frame buffer compression
JP5719410B2 (ja) 2013-07-25 2015-05-20 日本電信電話株式会社 画像符号化方法、画像符号化装置及び画像符号化プログラム
CN104331855A (zh) * 2014-05-22 2015-02-04 重庆大学 基于.net的鼠标拾取添加位置的数字图像自适应可见水印添加方法
US9392272B1 (en) 2014-06-02 2016-07-12 Google Inc. Video coding using adaptive source variance based partitioning
US9578324B1 (en) 2014-06-27 2017-02-21 Google Inc. Video coding using statistical-based spatially differentiated partitioning
US10554965B2 (en) 2014-08-18 2020-02-04 Google Llc Motion-compensated partitioning
US10291931B2 (en) 2016-10-13 2019-05-14 Ati Technologies Ulc Determining variance of a block of an image based on a motion vector for the block
EP3503548B1 (en) * 2017-12-19 2019-10-23 Axis AB Video encoding method and system
CN108335335B (zh) * 2018-02-11 2019-06-21 北京大学深圳研究生院 一种基于增强图变换的点云属性压缩方法
BR112021013117A2 (pt) * 2019-01-02 2021-09-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparelho para decodificar e codificar uma imagem usando codificação preditiva e codificação residual de transformada com base em bloco, métodos e fluxo de dados
CN113114934B (zh) * 2021-03-31 2022-08-05 太原理工大学 尿红细胞多焦距视频采集方法与系统

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5241395A (en) * 1989-08-07 1993-08-31 Bell Communications Research, Inc. Adaptive transform coding using variable block size
US5107345A (en) 1990-02-27 1992-04-21 Qualcomm Incorporated Adaptive block size image compression method and system
US5021891A (en) * 1990-02-27 1991-06-04 Qualcomm, Inc. Adaptive block size image compression method and system
DE69222766T2 (de) * 1991-06-04 1998-05-07 Qualcomm Inc System zur adaptiven kompression der blockgrössen eines bildes
US5471248A (en) 1992-11-13 1995-11-28 National Semiconductor Corporation System for tile coding of moving images
KR100276427B1 (ko) * 1993-01-30 2000-12-15 윤종용 화상데이타의 압축 및 복원장치
US5585944A (en) 1994-05-10 1996-12-17 Kaleida Labs, Inc. Method for compressing and decompressing images by subdividing pixel color distributions
JPH0811869A (ja) * 1994-06-27 1996-01-16 Dainippon Printing Co Ltd 紙カートン
KR960013055A (ko) 1994-09-27 1996-04-20 김광호 조건부 퀴드트리 분할방식의 화상압축방법 및 장치
JPH08205140A (ja) * 1995-01-31 1996-08-09 Canon Inc 画像圧縮装置
US6633611B2 (en) * 1997-04-24 2003-10-14 Mitsubishi Denki Kabushiki Kaisha Method and apparatus for region-based moving image encoding and decoding
JP3570863B2 (ja) * 1997-08-05 2004-09-29 三菱電機株式会社 動画像復号化装置および動画像復号化方法
JPH11164325A (ja) * 1997-11-26 1999-06-18 Oki Electric Ind Co Ltd パノラマ画像生成方法及びそのプログラムを記録した記録媒体

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8595281B2 (en) 2006-01-11 2013-11-26 Qualcomm Incorporated Transforms with common factors
US8849884B2 (en) 2006-03-29 2014-09-30 Qualcom Incorporate Transform design with scaled and non-scaled interfaces
RU2496139C2 (ru) * 2006-06-26 2013-10-20 Квэлкомм Инкорпорейтед Эффективные аппроксимации с фиксированной запятой прямого и обратного дискретных косинусных преобразований
US8571340B2 (en) 2006-06-26 2013-10-29 Qualcomm Incorporated Efficient fixed-point approximations of forward and inverse discrete cosine transforms
US8606023B2 (en) 2006-06-26 2013-12-10 Qualcomm Incorporated Reduction of errors during computation of inverse discrete cosine transform
US8699810B2 (en) 2006-06-26 2014-04-15 Qualcomm Incorporated Efficient fixed-point approximations of forward and inverse discrete cosine transforms
US8228998B2 (en) 2006-10-10 2012-07-24 Nippon Telegraph And Telephone Corporation Intra prediction encoding control method and apparatus, program therefor, and storage medium which stores the program
US8982961B2 (en) 2010-04-05 2015-03-17 Samsung Electronics Co., Ltd. Method and apparatus for encoding video by using transformation index, and method and apparatus for decoding video by using transformation index
RU2540842C2 (ru) * 2010-04-05 2015-02-10 Самсунг Электроникс Ко., Лтд. Способ и устройство для кодирования видео путем использования индекса преобразования, а также способ и устройство для декодирования видео путем использования индекса преобразования
US9042459B1 (en) 2010-04-05 2015-05-26 Samsung Electronics Co., Ltd. Method and apparatus for encoding video by using transformation index, and method and apparatus for decoding video by using transformation index
US9042460B1 (en) 2010-04-05 2015-05-26 Samsung Electronics Co., Ltd. Method and apparatus for encoding video by using transformation index, and method and apparatus for decoding video by using transformation index
US9049450B2 (en) 2010-04-05 2015-06-02 Samsung Electronics Co., Ltd. Method and apparatus for encoding video based on internal bit depth increment, and method and apparatus for decoding video based on internal bit depth increment
US9049460B1 (en) 2010-04-05 2015-06-02 Samsung Electronics Co., Ltd. Method and apparatus for encoding video by using transformation index, and method and apparatus for decoding video by using transformation index
US9294781B2 (en) 2010-04-05 2016-03-22 Samsung Electronics Co., Ltd. Method and apparatus for encoding video by using transformation index, and method and apparatus for decoding video by using transformation index
US9369736B2 (en) 2010-04-05 2016-06-14 Samsung Electronics Co., Ltd. Low complexity entropy-encoding/decoding method and apparatus
US9602845B2 (en) 2010-04-05 2017-03-21 Samsung Electronics Co., Ltd. Low complexity entropy-encoding/decoding method and apparatus
US9866875B2 (en) 2010-04-05 2018-01-09 Samsung Electronics Co., Ltd. Low complexity entropy-encoding/decoding method and apparatus
US10027991B2 (en) 2010-04-05 2018-07-17 Samsung Electronics Co., Ltd. Low complexity entropy-encoding/decoding method and apparatus
US10158890B2 (en) 2010-04-05 2018-12-18 Samsung Electronics Co., Ltd. Low complexity entropy-encoding/decoding method and apparatus

Also Published As

Publication number Publication date
ZA200203276B (en) 2003-07-24
WO2001035673A1 (en) 2001-05-17
TW517500B (en) 2003-01-11
JP5289659B2 (ja) 2013-09-11
KR100740818B1 (ko) 2007-07-19
MXPA02004577A (es) 2002-11-29
AR033655A1 (es) 2004-01-07
AU782176B2 (en) 2005-07-07
AU1481101A (en) 2001-06-06
JP5384696B2 (ja) 2014-01-08
BR0015341A (pt) 2003-07-15
IL149455A0 (en) 2002-11-10
US6529634B1 (en) 2003-03-04
CN1421102A (zh) 2003-05-28
ES2376540T3 (es) 2012-03-14
EP1230804B1 (en) 2011-12-21
IL149455A (en) 2007-07-04
ATE538598T1 (de) 2012-01-15
JP2003523652A (ja) 2003-08-05
HK1053565A1 (en) 2003-10-24
CA2389410C (en) 2011-06-28
JP2012199963A (ja) 2012-10-18
CN1186942C (zh) 2005-01-26
KR20030036129A (ko) 2003-05-09
EP1230804A1 (en) 2002-08-14
CA2389410A1 (en) 2001-05-17
BR0015341B1 (pt) 2015-01-06

Similar Documents

Publication Publication Date Title
RU2273112C2 (ru) Сжатие изображения с использованием дискретного косинусного преобразования адаптивно определенного размера блока на основании дисперсии
JP5107495B2 (ja) 品質ベースのイメージ圧縮
CA2450733C (en) A configurable image scanning pattern optimizer
AU2002315160A1 (en) Configurable pattern optimizer
JP2004533181A (ja) デジタルイメージに対する選択的なクロミナンスデシメーション
JP2004528791A (ja) インターフレーム符号化方法および装置