RU2477575C2 - Способ интерполяции значений под-пикселов - Google Patents

Способ интерполяции значений под-пикселов Download PDF

Info

Publication number
RU2477575C2
RU2477575C2 RU2007133925/07A RU2007133925A RU2477575C2 RU 2477575 C2 RU2477575 C2 RU 2477575C2 RU 2007133925/07 A RU2007133925/07 A RU 2007133925/07A RU 2007133925 A RU2007133925 A RU 2007133925A RU 2477575 C2 RU2477575 C2 RU 2477575C2
Authority
RU
Russia
Prior art keywords
sub
integer
pixel
pixels
values
Prior art date
Application number
RU2007133925/07A
Other languages
English (en)
Other versions
RU2007133925A (ru
Inventor
Марта КАРЧЕВИЧ
Антти ХАЛЛАПУРО
Original Assignee
Нокиа Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=25495681&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=RU2477575(C2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Нокиа Корпорейшн filed Critical Нокиа Корпорейшн
Publication of RU2007133925A publication Critical patent/RU2007133925A/ru
Application granted granted Critical
Publication of RU2477575C2 publication Critical patent/RU2477575C2/ru

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformation in the plane of the image
    • G06T3/40Scaling the whole image or part thereof
    • G06T3/4007Interpolation-based scaling, e.g. bilinear interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/523Motion estimation or motion compensation with sub-pixel accuracy
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation

Abstract

Изобретение относится к кодированию цифрового видео, а более конкретно к способу интерполяции значений под-пикселов. Техническим результатом является повышение эффективности кодирования цифрового видео. Предложен способ интерполяции при кодировании видеоданных, в котором пикселы в строках находятся в целых горизонтальных местоположениях, а пикселы в столбцах находятся в целых вертикальных местоположениях, интерполируют так, чтобы генерировать значения под-пикселов в дробных горизонтальных и вертикальных местоположениях, при этом способ содержит этапы: а) когда требуются значения для под-пикселов в полуцелых горизонтальных местоположениях и целых вертикальных местоположениях и в целых горизонтальных местоположениях и полуцелых вертикальных местоположениях, интерполируют такие значения напрямую с помощью взвешенных сумм пикселов, находящихся в целых горизонтальных и целых вертикальных местоположениях; b) когда требуются значения для под-пикселов в полуцелых горизонтальных местоположениях и полуцелых вертикальных местоположениях, интерполируют такие значения напрямую с помощью взвешенной суммы значений для под-пикселов, находящихся в полуцелых горизонтальных местоположениях и целых вертикальных местоположениях, вычисленной в соответствии с этапом а); и с) когда требуются значения для под-пиксела в горизонтальном местоположении четверть целого и вертикальном местоположении четверть целого, интерполируют такие значения усреднением по меньшей мере одной пары из первой пары значений под-пиксела, находящегося в полуцелом горизонтальном местоположении и полуцелом вертикальном местоположен�

Description

Настоящее изобретение относится к способу интерполяции значений под-пикселов при кодировании и декодировании данных. В частности, оно относится к кодированию и декодированию цифрового видео, но не только к нему.
Предшествующий уровень техники
Цифровые видеопоследовательности, такие как обычные кинофильмы, записанные на пленку, содержат последовательность неподвижных изображений, а иллюзия движения создается отображением изображений одного за другим при относительно быстрой частоте кадров, обычно от 15 до 30 кадров в секунду. Благодаря относительно быстрой частоте кадров изображения в последовательных кадрах кажутся практически одинаковыми и таким образом содержат значительное количество избыточной информации. Например, обычная сцена может содержать несколько неподвижных элементов, таких как декорации на заднем плане, и несколько подвижных областей, которые могут принимать множество различных форм, например лицо диктора новостей, движущийся транспорт и т.п. Альтернативно, камера, снимающая сцену, сама может перемещаться, и в этом случае все элементы изображения имеют одинаковый вид движения. Во многих случаях это означает, что общее изменение от одного видеокадра к другому достаточно невелико. Конечно, это зависит от природы движения. Например, чем быстрее движение, тем больше изменение от одного кадра к другому. Аналогично, если сцена содержит некоторое количество движущихся элементов, то изменение от одного кадра к другому больше, чем в сцене, где перемещается только один элемент.
Следует понимать, что каждый кадр необработанного, то есть несжатого цифрового видеоряда содержит очень большой объем информации об изображении. Каждый кадр в несжатой цифровой видеопоследовательности формируется из массива пикселов изображения. Например, в широко используемом формате цифрового видео, известном как вариант общего формата обмена сжатыми видеоданными с уменьшенным вчетверо разрешением (QCIF), кадр содержит массив из 176×144 пиксела, и в этом случае каждый кадр содержит 25344 пиксела. В свою очередь, каждый пиксел представлен определенным количеством битов, которые несут информацию о яркостном и/или цветовом содержимом области изображения, соответствующей пикселу. В общем случае для представления содержимого о яркости и цветности изображения используется так называемая цветовая модель YUV (совокупность сигнала яркости Y и двух цветоразностных сигналов U и V). Составляющая Y, или яркость, представляет интенсивность (яркость) изображения, тогда как цветовое содержимое изображения представлено двумя составляющими цветности, обозначенными U и V.
Цветовые модели, основанные на яркостном/цветностном представлении содержимого изображения, обеспечивают определенные преимущества по сравнению с цветовыми моделями, которые основаны на представлении, использующем основные цвета (красный, зеленый и синий, RGB). Зрительная система человека более восприимчива к изменениям интенсивности, чем к изменениям цвета; цветовые модели YUV эксплуатируют это свойство, используя более низкое пространственное разрешение для составляющих (U, V) цветности, чем для составляющей (Y) яркости. В этом случае объем информации, требующейся для кодирования цветовой информации в изображении, может быть уменьшен при приемлемом уменьшении качества изображения.
Более низкое пространственное разрешение составляющих цветности обычно достигается с помощью под-дискретизации. Обычно блок 16×16 пикселов изображения представляется одним блоком 16×16 пикселов, содержащим информацию о яркости, а каждая из соответствующих составляющих цветности представляется одним блоком 8×8 пикселов, представляющим область изображения, равнозначную блоку 16×16 пикселов яркостной составляющей. Составляющие цветности, таким образом, пространственно под-дискретизированы по множителю 2 в направлениях х и у. Полученный комплект из одного блока 16×16 пикселов яркости и двух блоков 8×8 цветности обычно называется макроблоком YUV, или, для краткости, макроблоком.
Изображение QCIF содержит макроблоки 11×9. Если яркостные блоки и блоки цветности представлены 8-битовым разрешением (то есть числами в диапазоне от 0 до 255), то общее число битов, требующихся на макроблок, составляет (16×16×8)+2×(8×8×8)=3072 бита. Число битов, необходимых для представления видеокадра в формате QCIF, таким образом составляет 99×3072=304128 бит. Это означает, что количество данных, требуемых, чтобы передать/записать/отобразить видеопоследовательность в формате QCIF, представленную с помощью цветовой модели YUV, на скорости 30 кадров в минуту, составляет более 9 Мбит/с. Это крайне высокая скорость передачи данных, и она непрактична в использовании в приложениях записи, передачи и отображения видео из-за того, что требуются очень большие емкость памяти, пропускная способность канала передачи и производительность аппаратного обеспечения.
Если видеоданные подлежат передаче в масштабе реального времени по фиксированной линейной сети, такой как цифровая сеть с комплексными услугами (ISDN), или обычной телефонной коммутируемой сети общего пользования (PSTN), то доступная пропускная способность передачи данных обычно составляет порядка 64 кбит/с. В мобильной видеотелефонии, когда передача имеет место по меньшей мере частично по линии радиосвязи, доступная пропускная способность может быть равна 20 кбит/с. Это означает, что для того, чтобы обеспечить передачу цифровых видеопоследовательностей через сети связи с низкой пропускной способностью, требуется достигнуть значительного снижения объема информации, используемой для представления видеоданных. По этой причине были разработаны методы сжатия видеоданных, которые уменьшают объем информации, передаваемой при поддержании приемлемого качества изображения.
Способы сжатия видеоданных основаны на снижении избыточных и бесполезных для восприятия частей видеопоследовательностей. Избыточность в видеопоследовательностях может быть разделена на пространственную, временную и спектральную избыточность. Термин “пространственная избыточность” используется для описания корреляции между соседними пикселами внутри кадра. Термин “временная избыточность” выражает факт того, что объекты, появляющиеся в одном кадре последовательности, вероятно появятся в последующих кадрах, тогда как “спектральная избыточность” относится к корреляции между различными цветовыми составляющими одного и того же изображения.
Достаточно эффективное сжатие не может быть достигнуто простым сокращением различных форм избыточности в данной последовательности изображений. Таким образом, большинство существующих кодеров видеоданных также уменьшают качество тех частей видеопоследовательности, которые субъективно наименее важны. Дополнительно, избыточность потока битов сжатых видеоданных снижается самостоятельно посредством эффективного кодирования без потерь. Обычно это достигается с помощью метода, известного как “кодирование с переменной длиной” (VLC).
Современные стандарты сжатия видеоданных, такие как рекомендации ITU-T Н.261, Н263(+)(++), H26L и рекомендации Экспертной группы по вопросам движущихся изображений MPEG-4, используют “временное предсказание с компенсацией движения”. Это является формой уменьшения временной избыточности, в которой содержимое нескольких (зачастую многих) кадров в видеопоследовательности “предсказывается” на основе других кадров в последовательности путем отслеживания движения объектов или областей изображения между кадрами.
Сжатые изображения, которые не используют уменьшение временной избыточности, обычно называются INTRA-кодированными, или I-кадрами, тогда как предсказанные по времени изображения называются INTER-кодированными, или Р-кадрами. В случае INTER-кадров предсказанное изображение (с компенсированным движением) крайне редко бывает достаточно точным, чтобы представлять содержимое изображения с достаточным качеством, и поэтому с каждым INTER-кадром связан пространственно сжатый кадр ошибки предсказания (ОП, РЕ). Многие схемы сжатия видеоданных также могут использовать двунаправленно предсказанные кадры, которые обычно называются В-изображениями или В-кадрами. В-изображения вводятся между парами опорных или так называемых “якорных” изображений (I- или Р-кадрами) и предсказываются на основе либо одного, либо обоих якорных изображений. В-изображения сами по себе не используются как якорные изображения, то есть ни один другой кадр не предсказывается на их основе, и, следовательно, они могут быть удалены из видеопоследовательности, не вызывая ухудшения качества будущих изображений.
Различные типы кадра, которые появляются в обычной сжатой видеопоследовательности, показаны на фиг. 3 приложенных чертежей. Как можно видеть из чертежа, последовательность начинается INTRA или I-кадром 30. На фиг. 3 стрелки 33 показывают процесс предсказания “вперед”, посредством которого формируются Р-кадры (обозначенные позицией 34). Процесс двунаправленного предсказания, посредством которого формируются В-кадры (36), показан стрелками 31а и 31b соответственно.
На фиг. 1 и 2 показана принципиальная схема примерной системы кодирования видеоданных, использующая предсказание компенсации движения. Фиг. 1 показывает кодер 10, использующий компенсацию движения, а фиг. 2 показывает соответствующий декодер 20. Кодер 10, показанный на фиг. 1, содержит блок 11 оценки поля движения, блок 12 кодирования поля движения, блок 13 предсказания с компенсацией движения, блок 14 кодирования ошибки предсказания, блок 15 декодирования ошибки предсказания, блок 16 мультиплексирования, кадровую память 17 и сумматор 19. Декодер 20 содержит блок 21 предсказания с компенсацией движения, блок 22 декодирования ошибки предсказания, блок 23 демультиплексирования и кадровую память 24.
Принцип функционирования кодеров видеоданных, использующих компенсацию движения, состоит в минимизации объема информации в кадре E n (x,y) ошибки предсказания, который является разностью между текущим кодируемым кадром I n (x,y) и кадром P n (x,y) предсказания. Кадр ошибки предсказания выглядит следующим образом.
E n (x,y) = I n (x,y) - P n (x,y). (1)
Кадр P n (x,y) предсказания построен с помощью значений пикселов опорного кадра R n (x,y), который в общем случае является одним из ранее закодированных и переданных кадров, например кадром, непосредственно предшествующим текущему кадру, и доступен из кадровой памяти 17 кодера 10. Более конкретно, кадр P n (x,y) предсказания строится путем нахождения так называемых “пикселов предсказания” в опорном кадре R n (x,y), который практически соответствует пикселам в текущем кадре. Выделяют информацию о движении, описывающую соотношение (например, относительное положение, вращение, масштаб и т.п.) между пикселами в текущем кадре и соответствующими им пикселами предсказания в опорном кадре, а кадр предсказания конструируют путем перемещения кадра предсказания в соответствии с информацией о движении. В этом случае кадр предсказания строится как приблизительное представление текущего кадра с помощью значений пикселов в опорном кадре. Кадр ошибки предсказания, на который сделана ссылка выше, представляет, следовательно, разность между приблизительным представлением текущего кадра, предоставленным кадром предсказания, и самим текущим кадром. Основное преимущество, предоставляемое видеокодерами, которые используют предсказание с компенсацией движения, возникает из того факта, что сравнительно компактное описание текущего кадра может быть получено представлением его в терминах информации о движении, требующейся для формирования предсказания, вместе со связанной с ней информацией об ошибке предсказания в кадре ошибки предсказания.
Однако из-за очень большого числа пикселов в кадре в общем случае неэффективно передавать на декодер отдельную информацию о движении для каждого пиксела. Вместо этого, в большинстве схем кодирования видеоданных текущий кадр разделяется на большие сегменты Sk изображения, и информация о движении, относящаяся к сегментам, передается на декодер. Например, информация о движении обычно предоставляется для каждого макроблока в кадре, и та же самая информация о движении затем используется для всех пикселов внутри макроблока. В некоторых стандартах кодирования видеоданных, таких как Н.26L, макроблок может быть разделен на меньшие блоки, и каждый меньший блок снабжен собственной информацией о движении.
Информация о движении обычно принимает форму векторов движения [Δx(x,y), Δy(x,y)]. Пара чисел Δx(x,y) и Δy(x,y) представляет горизонтальное и вертикальное смещения пиксела в местоположении (х,у) в текущем кадре I n (x,y) по отношению к пикселу в опорном кадре R n (x,y). Векторы [Δx(x,y), Δy(x,y)] движения вычисляются в блоке 11 оценки поля движения, и набор векторов движения текущего кадра [Δx(·), Δy(·)] называется полем вектора движения.
Обычно местоположение макроблока в текущем видеокадре определяется координатами (х,у) верхнего левого угла. Таким образом, в схеме кодирования видеоданных, в которой информация о движении связана с каждым макроблоком кадра, каждый вектор движения описывает горизонтальное и вертикальное смещение Δx(x,y) и Δy(x,y) пиксела, представляющего верхний левый угол макроблока в текущем кадре I n (x,y), по отношению к пикселу в левом верхнем углу практически соответствующего блока пикселов предсказания в опорном кадре R n (x,y) (как показано на фиг. 4b).
Оценка движения является задачей, требующей большого количества вычислений. Если задан опорный кадр R n (x,y) и, например, квадратный макроблок, содержащий N × N пикселов в текущем кадре (как показано на фиг. 4а), то целью оценки движения является нахождение блока N × N пикселов в опорном кадре, который совпадает с характеристиками макроблока в текущем изображении по некоторому критерию. Этим критерием может быть, например, сумма абсолютных разностей (САР, SAD) между пикселами макроблока в текущем кадре и блоком пикселов в опорном кадре, с которым он сравнивается. Этот процесс в общем случае известен как “согласование блоков”. Следует отметить, что в общем случае геометрия блока, подлежащего согласованию, и блока в опорном кадре не должны быть одинаковыми, поскольку реальные объекты могут подвергаться изменениям масштаба, равно как вращению и искривлению. Однако в существующих международных стандартах кодирования видеоданных используется только трансляционная модель движения (см. ниже), и таким образом достаточно фиксированной прямоугольной геометрии.
В идеале, для достижения наилучшей вероятности нахождения совпадения поиск должен вестись по всему опорному кадру. Однако это непрактично, поскольку накладывает слишком большую вычислительную нагрузку на устройство кодирования видеоданных. Вместо этого область поиска ограничена областью [-p,p] вокруг исходного местоположения макроблока в текущем кадре, как показано на фиг. 4с.
Для сокращения объема информации о движении, подлежащей передаче от кодера 10 на декодер 20, поле вектора движения кодируется в блоке 12 кодирования поля движения из состава кодера 10 посредством представления его с помощью модели движения. В этом процессе векторы движения сегментов изображения выражаются заново с помощью определенных заранее заданных функций или, иными словами, поле вектора движения представляется с помощью модели. Почти все используемые в настоящее время модели вектора движения являются аддитивными моделями движения, удовлетворяющими следующим общим формулам:
Figure 00000001
(2),
Figure 00000002
(3),
где коэффициенты a i и b i называются коэффициентами движения.
Эти коэффициенты движения передаются на декодер 20 (информационный поток 2 на фиг.1 и 2). Функции f i и g i называются базисными функциями поля движения и известны как кодеру, так и декодеру. Приблизительное поле
Figure 00000003
вектора движения может быть построено с помощью коэффициентов и базисных функций. Поскольку базисные функции известны как кодеру 10, так и декодеру 20 (то есть хранятся в них), на кодер необходимо передавать только коэффициенты движения, тем самым уменьшая объем информации, требующейся для представления информации о движении кадра.
Простейшей моделью движения является трансляционная модель движения, которая требует только двух коэффициентов для описания векторов движения каждого сегмента. Значения векторов движения заданы следующим выражением:
Δx(x,y) = a 0 (4)
Δy(x,y) = b 0
Эта модель широко используется в различных международных стандартах (ISO MPEG-1, MPEG-2, MPEG-4, Рекомендации ITU-T Н.261 и Н.263) для описания движения блоков 16×16 и 8×8 пикселов. Системы, которые используют трансляционную модель движения, выполняют оценку движения при разрешении в полный пиксел или при разрешении в некоторую целую часть полного пиксела, например при разрешении в половину или четверть пиксела.
Кадр P n (x,y) предсказания строится в блоке 13 предсказания компенсацией движения в кодере 10 и задается следующим выражением:
Figure 00000004
(5)
В блоке 14 кодирования ошибки предсказания кадр E n (x,y) ошибки предсказания обычно сжимается путем его представления в виде конечного ряда (преобразования) некоторых двумерных функций. Например, может использоваться двумерное дискретное косинусное преобразование (ДКТ, DCT). Коэффициенты преобразования квантуются и статистически кодируются (например, методом Хаффмана) перед тем, как они передаются на декодер (информационный поток 1 на фиг. 1 и 2). Из-за ошибки, вносимой квантованием, эта операция обычно вызывает некоторое ухудшение (потерю информации) в кадре E n (x,y) ошибки предсказания. Чтобы компенсировать это ухудшение, кодер 10 также содержит блок 15 декодирования ошибки предсказания, где декодированный кадр
Figure 00000005
ошибки предсказания строится с помощью коэффициентов преобразования. Этот локально декодированный кадр ошибки предсказания добавляется к кадру P n (x,y) предсказания в сумматоре 19, и полученный декодированный текущий кадр
Figure 00000006
сохраняется в кадровой памяти 17 для дальнейшего использования в качестве следующего опорного кадра R n+1 (x,y).
Информационный поток 2, несущий информацию о векторах движения, объединяется с информацией об ошибке предсказания в мультиплексоре 16, а информационный поток 3, обычно содержащий по меньшей мере два типа информации, отправляется на декодер 20.
Теперь будет описана работа соответствующего видеодекодера 20.
Кадровая память 24 декодера 20 хранит восстановленный ранее опорный кадр R n (x,y). Кадр P n (x,y) предсказания строится в блоке 21 предсказания с компенсацией движения из состава декодера 20 в соответствии с уравнением 5 с помощью принятой информации о коэффициентах движения и значений пикселов восстановленного ранее опорного кадра R n (x,y). Переданные коэффициенты преобразования кадра E n (x,y) предсказания ошибок используются в блоке 22 декодирования ошибки предсказания для построения декодированного кадра
Figure 00000005
ошибки предсказания. Пикселы декодированного текущего кадра
Figure 00000006
затем восстанавливаются путем добавления кадра P n (x,y) предсказания и декодированного кадра
Figure 00000005
ошибки предсказания:
Figure 00000007
(5)
Этот декодированный текущий кадр может сохраняться в кадровой памяти 24 в качестве следующего опорного кадра R n+1 (x,y).
В описании кодирования и декодирования цифровых видеоданных с компенсацией движения, представленном выше, вектор движения [Δx(x,y), Δy(x,y)], описывающий движение макроблока в текущем кадре по отношению к опорному кадру R n (x,y), может указывать на любой из пикселов в опорном кадре. Это означает, что движение между кадрами в цифровой видеопоследовательности может быть представлено только при разрешении, которое определено пикселами изображения в кадре (при так называемом разрешении в полный пиксел). Реальное движение, однако, имеет произвольную точность, и таким образом система, описанная выше, может лишь обеспечить приближенное моделирование движения между следующими друг за другом кадрами цифровой видеопоследовательности. Обычно моделирование движения между видеокадрами при разрешении в полный пиксел недостаточно точно, чтобы позволить эффективно минимизировать информацию ошибки предсказания (ОП), связанную с каждым макроблоком/кадром. Поэтому, чтобы обеспечить более точное моделирование реального движения и помочь уменьшить объем информации ОП, которая должна быть передана от кодера на декодер, многие стандарты кодирования видеоданных, такие как Н.263(+)(++) Н.26L, допускают, чтобы векторы движения указывали “между” пикселами изображения. Другими словами, векторы движения могут иметь “под-пиксельное” разрешение. Когда векторам движения позволяется иметь под-пиксельное разрешение, это добавляет сложности операциям кодирования и декодирования, которые должны быть выполнены, так что преимуществом по-прежнему является ограничение степени пространственного разрешения, которое может иметь вектор движения. Таким образом, стандарты кодирования видеоданных, такие как упомянутые выше, обычно позволяют векторам движения иметь только разрешение в полный пиксел, в половину пиксела (удвоенное разрешение) или в четверть пиксела (учетверенное разрешение).
Оценка движения с под-пиксельным разрешением обычно выполняется как двухэтапный процесс, как показано на фиг. 5, для схемы кодирования видеоданных, которая позволяет векторам движения иметь разрешение в полный пиксел или в половину пиксела. На первом этапе вектор движения, имеющий разрешение в полный пиксел, определяется с помощью любой подходящей схемы оценки движения, такой как процесс согласования блоков, описанный выше. Полученный вектор движения, имеющий разрешение в полный пиксел, показан на фиг. 5.
На втором этапе вектор движения, найденный на первом этапе, уточняется, чтобы получить желаемое разрешение в половину пиксела. В примере, показанном на фиг. 5, это выполняется путем формирования восьми новых блоков поиска по 16×16 пикселов, причем местоположение верхнего левого угла каждого блока маркируется знаком Х на фиг. 5. Эти местоположения обозначаются как [Δx+m/2, Δy+n/2], где числа m и n могут принимать значения -1, 0 и +1, но не могут быть равны нулю одновременно. Поскольку известны значения пикселов исходных пикселов изображения, значения (например значения яркости и/или цветности) под-пикселов, находящихся в местоположениях половины пиксела, должны оцениваться для каждого из восьми новых блоков поиска с помощью какой-либо формы интерполяционной схемы.
После интерполяции значений под-пикселов при разрешении в половину пиксела каждый из восьми блоков поиска сравнивается с макроблоком, для которого отыскивается вектор движения. Как и в процессе согласования блоков, выполняемом, чтобы определить вектор движения с разрешением в полный пиксел, макроблок сравнивается с каждым из восьми блоков поиска в соответствии с некоторым критерием, например с суммой абсолютных разностей (САР). В общем случае в результате сравнений будет получено минимальное значение САР. В зависимости от природы движения в видеопоследовательности это минимальное значение может соответствовать местоположению, определенному исходным вектором движения (имеющим разрешение в полный пиксел), либо оно может соответствовать местоположению, имеющему разрешение в половину пиксела. Таким образом, можно определить, должен ли вектор движения указывать на местоположение полного пиксела или подпиксела, и если под-пиксельное разрешение является пригодным, то можно определить верный вектор движения при подпиксельном разрешении. Следует понимать, что только что описанная схема может быть использована и для других под-пиксельных разрешений (например, разрешения в четверть пиксела) совершенно аналогичным образом.
На практике оценка значений под-пикселов в опорном кадре выполняется путем интерполяции значения под-пиксела из значений окружающих пикселов. В общем случае интерполяция значения F(x,y) под-пиксела, расположенного в нецелочисленном местоположении (x,y) = (n+Δx, my), может быть сформулирована как двумерная операция, математически представляемая следующим образом:
Figure 00000008
(7),
где f(k,l) являются коэффициентами фильтра, а m и n получаются путем усечения, соответственно, х и у до целых значений. Обычно коэффициенты фильтра зависят от значений х и у, а фильтрами интерполяции обычно являются так называемые “разделяемые фильтры”, в этом случае значение F(x,y) под-пиксела может быть вычислено следующим образом:
Figure 00000009
(8).
Векторы движения вычисляются в кодере. Когда соответствующие коэффициенты движения передаются на декодер, это является прямым поводом интерполировать требуемые под-пикселы с помощью способа интерполяции, идентичного тому, который используется в кодере. В этом случае кадр, следующий за опорным кадром в кадровой памяти 24, может быть восстановлен из опорного кадра и векторов движений.
Простейшим путем применения интерполяции значения под-пиксела в кодере видеоданных является интерполяция каждого значения под-пиксела каждый раз, когда это необходимо. Однако это неэффективное решение для кодера видеоданных, поскольку вероятно, что одно и то же значение под-пиксела будет требоваться несколько раз, и таким образом вычисления по интерполяции одного и того же значения под-пиксела будут выполняться множество раз. Это выражается в излишнем увеличении вычислительной сложности/нагрузки в кодере.
При альтернативном подходе, который ограничивает сложность кодера, проводится предварительное вычисление и сохранение всех значений под-пикселов в памяти, связанной с кодером. Это решение далее в документе называется “предварительной” интерполяцией. Ограничивая сложность, предварительная интерполяция имеет недостаток, состоящий в значительном увеличении использования памяти. Например, если точность вектора движения равна четверти пиксела как в горизонтальном местоположении, так и в вертикальном направлениях, то сохранение заранее вычисленных значений под-пикселов для полного изображения выразится в использовании памяти, в 16 раз большей, чем требуется для хранения исходного, не интерполированного изображения. Кроме того, это включает вычисление некоторых под-пикселов, которые в действительности могут не требоваться при вычислении векторов движения в кодере. Предварительная интерполяция также в высокой степени неэффективна в видеодекодере, поскольку большинство предварительно интерполированных значений под-пикселов декодеру никогда не потребуется. Таким образом, предпочтительно не использовать предварительное вычисление в декодере.
Для уменьшения требований к памяти в кодере может быть использована так называемая интерполяция “по запросу”. Например, если желаемой точностью пиксела является разрешение в четверть пиксела, то только под-пикселы при разрешении в половину пиксела интерполируются предварительно для всего кадра и сохраняются в памяти. Значения под-пикселов при разрешении в четверть пиксела вычисляются только в процессе оценки/компенсации движения, когда это потребуется. В этом случае используется память, всего в 4 раза большая, чем требуется для хранения исходного, не интерполированного изображения.
Следует отметить, что, когда используется предварительная интерполяция, процесс интерполяции составляет всего лишь небольшую часть всей вычислительной сложности/нагрузки в кодере, так как каждый пиксел интерполируется только один раз. Поэтому в кодере сложность процесса интерполяции сама по себе не очень критична, когда используется предварительная интерполяция значения под-пиксела. С другой стороны, интерполяция по запросу накладывает существенно большую вычислительную нагрузку на кодер, так как под-пикселы могут интерполироваться много раз. Следовательно, сложность процесса интерполяции, которую можно рассматривать в терминах количества вычислительных операций или рабочих циклов, которые должны быть выполнены для интерполяции значений под-пикселов, становится важным соображением.
В декодере одни и те же значения под-пикселов в большинстве случаев используются малое число раз, а в некоторых вообще нет необходимости. Поэтому в декодере предпочтительно вообще не использовать предварительную интерполяцию, то есть предпочтительно не выполнять предварительное вычисление каких-либо значений под-пикселов.
В качестве части работы, продолжающейся в Секторе ITU по стандартизации телекоммуникаций, в Группе 16 изучения, в Экспертной группе по кодированию видеоданных (VCEG), по Вопросам 6 и 15, были разработаны две схемы интерполяции. Эти подходы были предложены для включения в рекомендацию Н.26L ITU-T и были воплощены в опытных моделях (ОМ, TML) с целью оценки и дальнейшего развития. Опытная модель, соответствующая Вопросу 15, называется Опытной моделью 5 (ОМ5), тогда как полученная при изучении Вопроса 6 известна как Опытная модель 6 (ОМ6). Теперь будут описаны схемы интерполяции, предложенные как в ОМ5, так и в ОМ6.
По всему описанию схемы интерполяции значений под-пикселов, используемой в опытной модели ОМ5, ссылки будут делаться на фиг. 12а, которая определяет обозначения для описания местоположений пикселов и под-пикселов, специфичных для ОМ5. Отдельные обозначения, определяемые на фиг. 13а, будут использоваться для обсуждения схемы интерполяции значений под-пикселов, используемой в ОМ6. Еще одни отдельные обозначения, показанные на фиг. 14а, будут использоваться в тексте позднее в связи со способом интерполяции значений под-пикселов, соответствующих изобретению. Следует понимать, что три различных вида обозначений, использованных в тексте, предназначены для содействия пониманию каждого способа интерполяции и выявлению различий между ними. Однако на всех трех чертежах буква А используется для обозначения исходных пикселов изображения (при разрешении в полный пиксел). Конкретнее, буква А представляет местоположение пикселов в данных изображения, представляющих кадр видеопоследовательности, при этом значения пикселов А либо принимают в качестве текущего кадра I n (x,y) от источника видеоданных, либо восстанавливают и сохраняют в качестве опорного кадра R n (x,y) в кадровой памяти 17, 24 кодера 10 или декодера 20. Все остальные буквы представляют местоположения под-пикселов, при этом значения под-пикселов, расположенных в местоположениях под-пикселов, получают с помощью интерполяции.
Некоторые другие термины также будут использованы согласованным образом по всему тексту для идентификации конкретных местоположений пикселов и под-пикселов. Это такие термины, как:
Термин “целое горизонтальное местоположение” используется для описания местоположения любого под-пиксела, который построен в столбце исходных данных изображения. Под-пикселы с и е на фиг. 12а и 13а, равно как под-пикселы b и е на фиг. 14а, имеют целые горизонтальные местоположения.
Термин “целое вертикальное местоположение” используется для описания местоположения любого под-пиксела, который построен в строке исходных данных изображения. Под-пикселы b и d на фиг. 12а и 13а, равно как под-пикселы b и d на фиг. 14а, имеют целые вертикальные местоположения.
По определению пикселы А имеют целое горизонтальное и целое вертикальное местоположения.
Термин “полуцелое горизонтальное местоположение” используется для описания местоположения любого под-пиксела, который построен в столбце, находящемся в разрешении в половину пиксела. Под-пикселы b, с и е на фиг. 12а и 13а подпадают под эту категорию, равно как под-пикселы b, с и f на фиг. 14а. Аналогичным образом, термин “полуцелое вертикальное местоположение” используется для описания местоположения любого под-пиксела, который построен в строке, находящейся в разрешении в половину пиксела, например, под-пикселы с и d на фиг. 12а и 13а, равно как под-пикселы b, с и g на фиг. 14а.
Далее, термин “горизонтальное местоположение четверть целого” относится к любому под-пикселу, который построен в столбце, находящемся в разрешении в четверть пиксела, например, под-пикселы d и е на фиг. 12а, под-пикселы d и g на фиг. 13а и под-пикселы d, g и h на фиг. 14а. Аналогично, термин “вертикальное местоположение четверть целого” относится к любым под-пикселам, которые построены в строке, находящейся в разрешении в четверть пиксела. На фиг. 12а под эту категорию подпадают под-пикселы е и f, равно как под-пикселы е, f и g на фиг. 13а и под-пикселы e, f и h на фиг. 14а.
Определение каждого из описанных выше терминов показано “линиями”, нарисованными на соответствующих чертежах.
Следует далее отметить, что зачастую удобно обозначать конкретный пиксел двумерным обозначением. В этом случае подходящее двумерное обозначение можно получить путем проверки взаимного пересечения линий на фиг. 12а, 13а и 14а. Применяя этот принцип, пиксел d на фиг. 12а, например, имеет полуцелое горизонтальное и полуцелое вертикальное местоположения, а под-пиксел е имеет целое горизонтальное местоположение и вертикальное местоположение четверть целого. Кроме того, для простоты именования, под-пикселы, которые находятся на полуцелых горизонтальных и целых вертикальных на целых горизонтальных и полуцелых вертикальных положениях, а также на полуцелых горизонтальных и полуцелых вертикальных положениях, будут именоваться как под-пикселы разрешения. 1/2 под-пикселы, которые находятся на любом горизонтальном местоположении четверть целого и/или вертикальном местоположении четверть целого, будут именоваться как под-пикселы разрешения 1/4.
Также следует отметить, что как в описаниях двух опытных моделей, так и в самом подробном описании изобретения предполагается, что пикселы имеют минимальное значение, равное 0, и максимальное значение, равное 2 n -1, где n является числом битов, зарезервированных для значения пиксела. Число битов обычно равно 8. После того как под-пиксел проинтерполирован, в случае, если значение интерполированного под-пиксела превышает значение 2 n -1, то оно ограничивается диапазоном [0, 2 n -1], то есть значения меньше минимального разрешенного значения станут минимальным значением (0), а значения больше максимального станут максимальным значением (2 n -1). Эта операция называется ограничением.
Теперь будет подробно описана схема интерполяции значения под-пиксела в соответствии с ОМ5 со ссылками на фиг. 12а, 12b и 12с.
1. Значение для под-пиксела в полуцелом горизонтальном и целом вертикальном местоположении, который является под-пикселом b разрешения 1/2 на фиг. 12а, вычисляется с помощью 6-отводного фильтра. Фильтр интерполирует значение под-пиксела b разрешения 1/2 на основании значений 6 пикселов (А16), расположенных в строку в целых горизонтальных местоположениях и целых вертикальных местоположениях симметрично вокруг b, как показано на фиг. 12b, согласно следующей формуле: b = (A1-5A2+20A3+20A4-5A5+A6+16)/32. Оператор “/” обозначает деление с усечением. Результат ограничивают, чтобы попасть в диапазон [0, 2 n -1].
2. Значения для под-пикселов разрешения 1/2, помеченных с, вычисляются с помощью аналогичного шестиотводного фильтра, который используется в операции 1, и шести ближайших пикселов или под-пикселов (А или b) в вертикальном направлении. На фиг. 12с фильтр интерполирует значение под-пиксела с разрешения 1/2, расположенного в целом горизонтальном местоположении и полуцелом вертикальном местоположении, на основании значений 6 пикселов (А16), расположенных в столбец в целых горизонтальных местоположениях и целых вертикальных местоположениях симметрично вокруг с, согласно следующей формуле: с = (A1-5A2+20A3+20A4-5A5+A6+16)/32. Аналогично, значение под-пиксела с разрешения 1/2, расположенного в полуцелом горизонтальном местоположении и полуцелом вертикальном местоположении, вычисляется по следующей формуле: с = (b1-5b2+20b3+20b4-5b5+b6+16)/32. Опять же, оператор “/” обозначает деление с усечением. Значения, вычисленные для под-пикселов с, далее ограничивают, чтобы попасть в диапазон [0, 2 n -1].
В этом месте процесса интерполяции вычисляются значения всех под-пикселов разрешения 1/2, а процесс продолжается для вычисления значений под-пикселов разрешения 1/4.
3. Значения под-пикселов разрешения 1/4, помеченных d, вычисляются с помощью линейной интерполяции и значений ближайших пикселов и/или под-пикселов разрешения 1/2 в горизонтальном направлении. Конкретнее, значения под-пикселов d разрешения 1/4, расположенных в горизонтальном местоположении четверть целого и целом вертикальном местоположениях, вычисляются усреднением непосредственно ближайшего пиксела в целом горизонтальном местоположении и целом вертикальном местоположении (пиксел А), и непосредственно ближайшего под-пиксела разрешения 1/2 в полуцелом горизонтальном местоположении и целом вертикальном местоположении (под-пиксел b), то есть в соответствии со следующей формулой: d=(A+b)/2. Значения под-пикселов d разрешения 1/4, расположенных в горизонтальном местоположении четверть целого и полуцелом вертикальном местоположениях, вычисляются усреднением непосредственно ближайших под-пикселов с разрешения 1/2, которые находятся в целом горизонтальном и полуцелом вертикальном местоположениях, и полуцелом горизонтальном и полуцелом вертикальном местоположениях соответственно, то есть в соответствии со следующей формулой: d=(c1+c2)/2. Опять же, оператор “/” обозначает деление с усечением.
4. Значения под-пикселов разрешения 1/4, помеченных е, вычисляются с помощью линейной интерполяции и значений ближайших пикселов и/или под-пикселов разрешения 1/2 в вертикальном направлении. В частности, значения под-пикселов е разрешения 1/4, расположенных в целом горизонтальном местоположении и вертикальном местоположении четверть целого, вычисляются усреднением непосредственно ближайшего пиксела в целом горизонтальном местоположении и целом вертикальном местоположении (пиксел А), и непосредственно ближайшего под-пиксела в целом горизонтальном и полуцелом вертикальном местоположениях (под-пиксел с), то есть в соответствии со следующей формулой: е=(A+с)/2. Под-пикселы е3 разрешения 1/4, расположенные в полуцелом горизонтальном местоположении и вертикальном местоположении четверть целого, вычисляются усреднением непосредственно ближайшего под-пиксела, который находится в полуцелом горизонтальном и целом вертикальном местоположении (под-пиксел b), и непосредственно ближайшего под-пиксела в полуцелом горизонтальном и полуцелом вертикальном местоположениях (под-пиксел с), то есть в соответствии со следующей формулой: е = (b+c)/2. Более того, под-пикселы е разрешения 1/4 в горизонтальном местоположении четверть целого и вертикальном местоположении четверть целого вычисляются усреднением непосредственно ближайших под-пикселов в горизонтальном местоположении четверть целого и целом вертикальном местоположении и соответствующего под-пиксела в горизонтальном местоположении четверть целого и полуцелом вертикальном местоположении (под-пикселы d), то есть в соответствии со следующей формулой: е=(d1+d2)/2. Опять же, оператор “/” обозначает деление с усечением.
5. Значение под-пиксела f разрешения 1/4 интерполируется усреднением значений 4 наиболее близких значений пикселов в целом горизонтальном и вертикальном местоположениях в соответствии со следующей формулой: f=(A1+A2+A3+A4+2)/4, где пикселами A1, A2, A3 и A4 обозначены наиболее близкие пикселы.
Недостатком ОМ5 является то, что декодер вычислительно сложен. Это происходит от того, что ОМ5 использует подход, в котором интерполяция значений под-пикселов разрешения 1/4 зависит от интерполяции значений под-пикселов разрешения 1/2. Это означает, что для интерполяции значений под-пикселов разрешения 1/4 сначала должны быть вычислены значения под-пикселов разрешения 1/2, из которых те и должны вычисляться. Более того, поскольку значения некоторых под-пикселов разрешения 1/4 зависят от значений интерполяции, полученных для других под-пикселов разрешения 1/4, усечение значений под-пикселов разрешения 1/4 имеет вредоносное воздействие на точность некоторых значений под-пикселов разрешения 1/4. Конкретнее, значения под-пикселов разрешения 1/4 менее точны, чем они могли бы быть, если бы вычислялись из значений, которые не были округлены или усечены. Другим недостатком ОМ5 является то, что необходимо сохранять значения под-пикселов разрешения 1/2 для интерполяции значений под-пикселов разрешения 1/4. Следовательно, для хранения результата, который в конечном счете не потребуется, нужна избыточная память.
Теперь будет описана схема интерполяции значений под-пикселов в соответствии с ОМ6, которая здесь именуется прямой интерполяцией. В кодере способ интерполяции, соответствующий ОМ6, работает аналогично описанному ранее способу интерполяции ОМ5, за исключением того, что постоянно поддерживается максимальная точность. Это достигается путем использования промежуточных значений, которые не округляются и не усекаются. Пошаговое описание способа интерполяции, соответствующего ОМ6, как он применяется в кодере, приводится ниже со ссылками на фиг. 13а, 13b и 13с.
1. Значение под-пиксела в полуцелом горизонтальном и целом вертикальном местоположениях, который является под-пикселом b разрешения 1/2 на фиг. 13а, получают с помощью первого вычисления промежуточного значения b с помощью 6-отводного фильтра. Фильтр вычисляет b на основании значений 6 пикселов (А16), расположенных в строку в целых горизонтальных местоположениях и целых вертикальных местоположениях симметрично вокруг b, как показано на фиг. 13b, согласно следующей формуле: b=(A1-5A2+20A3+20A4-5A5+A6). Затем вычисляется конечное значение b, которое равно b=(b+16)/32, и результат ограничивают, чтобы попасть в диапазон [0, 2 n -1]. Как и ранее, оператор “/” обозначает деление с усечением.
2. Значения под-пикселов разрешения 1/2, помеченных с, получают первым вычислением промежуточных значений с. На фиг. 13с промежуточное значение с для под-пиксела с разрешения 1/2, расположенного в целом горизонтальном местоположении и полуцелом вертикальном местоположении, вычисляется на основании значений 6 пикселов (А16), расположенных в столбец в целых горизонтальных местоположениях и целых вертикальных местоположениях симметрично вокруг с, согласно следующей формуле: с=(A1-5A2+20A3+20A4-5A5+A6). Конечное значение для под-пиксела с разрешения 1/2, расположенного в целом горизонтальном местоположении и полуцелом вертикальном местоположении, вычисляется согласно следующей формуле с=(с+16)/32. Аналогично, промежуточное значение с для под-пиксела с разрешения 1/2, расположенного в полуцелом горизонтальном местоположении и полуцелом вертикальном местоположении, вычисляется по следующей формуле: с=(b1-5b2+20b3+20b4-5b5+b6). Конечное значение для этого под-пиксела разрешения 1/2 затем вычисляется согласно следующей формуле с=(с+512)/1024. Опять же, оператор “/” обозначает деление с усечением, а значения, вычисленные для под-пикселов с разрешения 1/2, далее ограничивают, чтобы попасть в диапазон [0, 2 n -1].
3. Значения под-пикселов разрешения 1/4, помеченных d, вычисляются следующим образом. Значения под-пикселов d разрешения 1/4, расположенных в горизонтальном местоположении четверть целого и целом вертикальном местоположениях, вычисляются из значения непосредственно ближайшего пиксела в целом горизонтальном местоположении и целом вертикальном местоположении (пиксел А), и из промежуточного значения b, вычисленного на этапе (1) для непосредственно ближайшего под-пиксела разрешения 1/2 в полуцелом горизонтальном местоположении и целом вертикальном местоположении (под-пиксел b разрешения 1/2), то есть в соответствии со следующей формулой: d=(32A+b+32)/64. Значения под-пикселов d разрешения 1/4, расположенных в горизонтальном местоположении четверть целого и полуцелом вертикальном местоположении, интерполируются с помощью промежуточных значений с, вычисленных для непосредственно ближайших под-пикселов с разрешения 1/2, которые находятся в целом горизонтальном и полуцелом вертикальном местоположении и полуцелом горизонтальном и полуцелом вертикальном местоположениях, соответственно, то есть в соответствии со следующей формулой: d=(32c 1+c2+1024)/2048. Опять же, оператор “/” обозначает деление с усечением, а полученные в конечном счете значения под-пикселов d разрешения 1/4 ограничивают, чтобы попасть в диапазон [0, 2 n -1].
4. Значения под-пикселов разрешения 1/4, помеченных е, вычисляются следующим образом. Значения под-пикселов е разрешения 1/4, расположенных в целом горизонтальном местоположении и вертикальном местоположении четверть целого, вычисляются из значения непосредственно ближайшего пиксела в целом горизонтальном местоположении и целом вертикальном местоположении (пиксел А), и из промежуточного значения с, вычисленного на этапе (2) для непосредственно ближайшего под-пиксела разрешения 1/2 в целом горизонтальном и полуцелом вертикальном местоположении, то есть в соответствии со следующей формулой: е=(32A+с+32)/64. Значения под-пикселов е разрешения 1/4, расположенных в полуцелом горизонтальном местоположении и вертикальном местоположении четверть целого, вычисляются на основе промежуточного значения b, вычисленного на этапе (1) для непосредственно ближайшего под-пиксела разрешения 1/2, который находится в полуцелом горизонтальном и целом вертикальном местоположении, и промежуточного значения с, вычисленного на этапе (2) для непосредственно ближайшего под-пиксела разрешения 1/2 в полуцелом горизонтальном и полуцелом вертикальном местоположениях, то есть в соответствии со следующей формулой: е=(32b+c+1024)/2048. Опять же, оператор “/” обозначает деление с усечением, а полученные в конечном счете значения под-пикселов е разрешения 1/4 ограничивают, чтобы попасть в диапазон [0, 2 n -1].
5. Значения под-пикселов разрешения 1/4, помеченных g, вычисляются с помощью значения ближайшего исходного пиксела А и промежуточных значений трех ближайших соседних под-пикселов разрешения 1/2 в соответствии со следующей формулой: g=(1024а+32b+32c 1+c 2+2048)/4096. Как и раньше, оператор “/” обозначает деление с усечением, а полученные в конечном счете значения под-пикселов g разрешения 1/4 ограничивают, чтобы попасть в диапазон [0, 2 n -1].
6. Значение под-пиксела f разрешения 1/4 интерполируется усреднением значений 4 наиболее близких пикселов в целом горизонтальном и вертикальном местоположениях в соответствии со следующей формулой: f=(A1+A2+A3+A4+2)/4, где пикселами A1, A2, A3 и A4 обозначены наиболее близкие исходные пикселы.
В декодере значения под-пикселов могут быть получены непосредственно применением 6-отводных фильтров в горизонтальном и вертикальном направлениях. В случае под-пиксела разрешения 1/4, со ссылкой на фиг. 13а, коэффициенты фильтров, применяемые к пикселам и под-пикселам в целом вертикальном местоположении, таковы: [0, 0, 64, 0, 0, 0] для набора из шести пикселов А, [1, -5, 52, 20, -5, 1] для набора из шести пикселов d, [2, -10, 40, 40, -10, 2] для набора из шести под-пикселов b, [1, -5, 52, 20, -5, 1] для набора из шести под-пикселов d. Эти коэффициенты фильтров применяются к соответствующим наборам пикселов или под-пикселов в той же строке, что и значения интерполируемых под-пикселов.
После применения фильтров в горизонтальном и вертикальном направлениях интерполированное значение с нормируется по формуле с=(с+2048)/4096 и ограничивается, чтобы попасть в диапазон [0, 2 n -1]. Когда вектор движения указывает на целое местоположение пиксела либо в горизонтальном, либо в вертикальном направлении, используется много нулевых коэффициентов. В практической реализации ОМ6, в программном обеспечении используются различные ветвления, которые оптимизированы для различных случаев под-пикселов так, что нет умножений на нулевые коэффициенты.
Следует отметить, что в ОМ6 значения под-пикселов разрешения 1/4 получают прямым использованием промежуточных значений, упомянутых выше, а не извлекают из округленных и ограниченных значений под-пикселов разрешения 1/2. Следовательно, для получения значений под-пикселов разрешения 1/4 нет необходимости вычислять конечные значения для любого из под-пикселов разрешения 1/2. Конкретнее, нет необходимости проводить операции усечения и ограничения, связанные с вычислением конечных значений, для под-пикселов разрешения 1/2. Также нет необходимости сохранять конечные значения для под-пикселов разрешения 1/2, чтобы использовать в вычислении значений под-пикселов разрешения 1/4. Следовательно, ОМ6 менее сложна для вычисления, чем ОМ5, поскольку требует меньше операций усечения и ограничения. Однако недостатком ОМ6 является то, что как в кодере, так и в декодере требуется использовать высокоточные расчеты. Высокоточная интерполяция требует больше кремниевого пространства на специализированных ИС (ASIC) и требует больше вычислений на некоторых центральных процессорах. Более того, реализация прямой интерполяции в режиме “по-запросу”, как определено в ОМ6, требует большого объема памяти. Это является важным фактором, особенно во встроенных устройствах.
Принимая во внимание приведенное выше обсуждение, следует понимать, что из-за различных требований видеокодера и декодера относительно интерполяции под-пикселов существует серьезная проблема разработки способа интерполяции значений под-пикселов, способного обеспечить удовлетворительную производительность как кодера, так и декодера. Более того, ни одна из существующих опытных моделей (ОМ5, ОМ6), описанных выше, не может обеспечить решение, которое было бы оптимальным для применения одновременно в кодере и декодере.
Сущность изобретения
В соответствии с первым аспектом изобретения обеспечен способ интерполяции при кодировании видеоданных, в котором изображение, содержащее пикселы, упорядоченные по строкам и столбцам и представленные значениями, имеющими заданный динамический диапазон, причем пикселы в строках находятся в целых горизонтальных местоположениях, а пикселы в столбцах находятся в целых вертикальных местоположениях, интерполируют так, чтобы генерировать значения под-пикселов в дробных горизонтальных и вертикальных местоположениях, причем эти дробные горизонтальные и вертикальные местоположения определяются по формуле 1/2х, где х является положительным целым числом, имеющим максимальное значение N, способ содержит следующие этапы:
а) когда требуются значения для под-пикселов в горизонтальных местоположениях 1/2N-1 целого и целых вертикальных местоположениях, а также в целых горизонтальных местоположениях и вертикальных местоположениях 1/2N-1 целого, интерполируют такие значения напрямую с помощью взвешенных сумм пикселов, находящихся в целых горизонтальных и целых вертикальных местоположениях;
b) когда требуются значения для под-пикселов в горизонтальных местоположениях 1/2N-1 целого и вертикальных местоположениях 1/2N-1 целого, интерполируют такие значения напрямую с помощью выбора первой взвешенной суммы значений для под-пикселов, находящихся в горизонтальных местоположениях 1/2N-1 целого и целых вертикальных местоположениях, и второй взвешенной суммы значений для под-пикселов, находящихся в целых горизонтальных местоположениях и вертикальных местоположениях 1/2N-1 целого, причем эти первая и вторая взвешенные суммы значений вычисляются в соответствии с этапом а); и
с) когда требуется значение для под-пиксела, расположенного в горизонтальном местоположении 1/2N целого и вертикальном местоположении 1/2N целого, интерполируют такое значение взвешенным усреднением значения первого под-пиксела или пиксела, расположенного в горизонтальном местоположении 1/2N-m целого и вертикальном местоположении 1/2N-n целого, и значения второго под-пиксела или пиксела, расположенного в горизонтальном местоположении 1/2N-р целого и вертикальном местоположении 1/2N-q целого, где переменные m, n, p, q являются целыми значениями в диапазоне от 1 до N, так что первый и второй под-пикселы или пикселы расположены по диагонали по отношению к под-пикселу в горизонтальном местоположении 1/2N целого и вертикальном местоположении 1/2N целого.
Предпочтительно первый и второй веса используют при вычислении взвешенного среднего по этапу (с), при этом относительные величины весов обратно пропорциональны близости (по прямолинейной диагонали) первого и второго под-пиксела или пиксела к под-пикселу в горизонтальном местоположении 1/2N целого и в вертикальном местоположении 1/2N целого.
В ситуации, когда первый и второй под-пикселы или пикселы расположены симметрично по отношению к под-пикселу в горизонтальном местоположении 1/2N целого и вертикальном местоположении 1/2N целого (на равном расстоянии от него), первый и второй веса могут иметь равные значения.
Первая взвешенная сумма значений для под-пикселов, находящихся в горизонтальных местоположениях 1/2N-1 и целых вертикальных местоположениях на этапе b), может быть использована, когда требуется под-пиксел в горизонтальном местоположении 1/2N-1 целого и вертикальном местоположении 1/2N целого.
Вторая взвешенная сумма значений для под-пикселов, находящихся в целых горизонтальных местоположениях и вертикальных местоположениях 1/2N-1 целого на этапе b), может быть использована, когда требуется под-пиксел в горизонтальном местоположении 1/2N целого и вертикальном местоположении 1/2N-1 целого.
В одном варианте осуществления, когда требуются значения для под-пикселов в горизонтальных местоположениях 1/2N целого и целых вертикальных местоположениях, в горизонтальных местоположениях 1/2N целого и вертикальных местоположениях 1/2N-1 целого, такие значения интерполируют усреднением значений первого пиксела или под-пиксела, расположенного в вертикальном местоположении, соответствующем вертикальному местоположению вычисляемого под-пиксела, и целом горизонтальном местоположении, и второго пиксела или под-пиксела, расположенного в горизонтальном местоположении, соответствующем горизонтальному местоположению вычисляемого под-пиксела, и горизонтальном местоположении 1/2N-1 целого.
Когда требуются значения для под-пикселов в целых горизонтальных местоположениях и вертикальных местоположениях 1/2N целого, а также в горизонтальных местоположениях 1/2N-1 целого и вертикальных местоположениях 1/2N целого, они могут быть интерполированы усреднением значений первого пиксела или под-пиксела, расположенного в горизонтальном местоположении, соответствующем горизонтальному местоположению вычисляемого под-пиксела, и целом вертикальном местоположении, и второго пиксела или под-пиксела, расположенного в вертикальном местоположении, соответствующем вертикальному местоположению вычисляемого под-пиксела, и вертикальном местоположении 1/2N-1 целого.
Значения для под-пикселов в горизонтальных местоположениях 1/2N целого и вертикальных местоположениях 1/2N целого могут быть интерполированы усреднением значений пиксела, расположенного в целом горизонтальном и целом вертикальном местоположении, и под-пиксела, расположенного в горизонтальном местоположении 1/2N-1 целого и вертикальном местоположении 1/2N-1 целого.
Значения для под-пикселов в горизонтальных местоположениях 1/2N целого и вертикальных местоположениях 1/2N целого могут быть интерполированы усреднением значений под-пиксела, расположенного в горизонтальном местоположении 1/2N-1 целого и целом вертикальном местоположении, и под-пиксела, расположенного в целом горизонтальном местоположении и вертикальном местоположении 1/2N-1 целого.
Значения для половины под-пикселов в горизонтальных местоположениях 1/2N целого и вертикальных местоположениях 1/2N целого могут быть интерполированы усреднением первой пары значений под-пиксела, расположенного в горизонтальном местоположении 1/2N-1 целого и целом вертикальном местоположении, и под-пиксела, расположенного в целом горизонтальном и вертикальном местоположении 1/2N-1 целого, и значения другой половины под-пикселов в горизонтальном местоположении 1/2N целого и вертикальном местоположении 1/2N целого могут быть интерполированы усреднением второй пары значений пиксела, расположенного в целом горизонтальном и целом вертикальном местоположении, и под-пиксела, расположенного в горизонтальном местоположении 1/2N-1 целого и вертикальном местоположении 1/2N-1 целого.
Значения для под-пикселов в горизонтальных местоположениях 1/2N целого и вертикальных местоположениях 1/2N целого попеременно интерполируют для одного такого под-пиксела усреднением первой пары значений под-пиксела, расположенного в горизонтальном местоположении 1/2N-1 целого и целом вертикальном местоположении, и под-пиксела, расположенного в целом горизонтальном местоположении и вертикальном местоположении 1/2N-1 целого, а значения для соседей такого под-пиксела - усреднением второй пары значений пиксела, расположенного в целом горизонтальном и целом вертикальном местоположении, и под-пиксела, расположенного в горизонтальном местоположении 1/2N-1 целого и вертикальном местоположении 1/2N-1 целого.
Под-пикселы в горизонтальных местоположениях 1/2N целого и вертикальных местоположениях 1/2N целого могут быть попеременно интерполированы в горизонтальном направлении.
Под-пикселы в горизонтальных местоположениях 1/2N целого и вертикальных местоположениях 1/2N целого могут быть попеременно интерполированы в горизонтальном направлении.
Когда требуются значения для некоторых под-пикселов в горизонтальных местоположениях 1/2N целого и вертикальных местоположениях 1/2N целого, такие значения могут быть попеременно интерполированы усреднением множества ближайших соседних пикселов.
По меньшей мере один из этапов а) и b), где значения под-пикселов интерполируют напрямую с помощью взвешенных сумм, может включать в себя вычисление промежуточного значения для значений под-пикселов, имеющих больший динамический диапазон, чем заданный динамический диапазон.
Промежуточное значение для под-пиксела, имеющего подпиксельное разрешение 1/2N-1, может быть использовано для вычисления значения под-пиксела, имеющего подпиксельное разрешение 1/2N.
В соответствии со вторым аспектом изобретения обеспечен способ интерполяции при кодировании видеоданных, в котором изображение, содержащее пикселы, упорядоченные по строкам и столбцам и представленные значениями, имеющими заданный динамический диапазон, причем пикселы в строках находятся в целых горизонтальных местоположениях, а пикселы в столбцах находятся в целых вертикальных местоположениях, интерполируют так, чтобы генерировать значения под-пикселов в дробных горизонтальных и вертикальных местоположениях, при этом способ содержит следующие этапы:
а) когда требуются значения для под-пикселов в полуцелых горизонтальных и целых вертикальных местоположениях, а также в целых горизонтальных и полуцелых вертикальных местоположениях, интерполируют такие значения напрямую с помощью взвешенных сумм пикселов, находящихся в целых горизонтальных и целых вертикальных местоположениях;
b) когда требуются значения для под-пикселов в полуцелых горизонтальных и полуцелых вертикальных местоположениях, интерполируют такие значения напрямую с помощью взвешенной суммы значений для под-пикселов, находящихся в полуцелых горизонтальных и целых вертикальных местоположениях, вычисленной в соответствии с этапом а); и
с) когда требуются значения для под-пикселов в горизонтальном местоположении четверть целого и вертикальном местоположении четверть целого, интерполируют такие значения усреднением по меньшей мере одной пары из первой пары значений под-пиксела, расположенного в полуцелом горизонтальном и целом вертикальном местоположении, и под-пиксела, расположенного в целом горизонтальном и полуцелом вертикальном местоположении, и второй пары значений пиксела, находящегося в целом горизонтальном и целом вертикальном местоположении, и под-пиксела, находящегося в полуцелом горизонтальном и полуцелом вертикальном местоположении.
В соответствии с третьим аспектом изобретения обеспечен способ интерполяции при кодировании видеоданных, в котором изображение, содержащее пикселы, упорядоченные по строкам и столбцам и представленные значениями, имеющими заданный динамический диапазон, причем пикселы в строках находятся в целых горизонтальных местоположениях, а пикселы в столбцах находятся в целых вертикальных местоположениях, интерполируют так, чтобы генерировать значения под-пикселов в дробных горизонтальных и вертикальных местоположениях, причем эти дробные горизонтальные и вертикальные местоположения определяются по формуле 1/2х, где х является положительным целым числом, имеющим максимальное значение N, при этом способ содержит следующие этапы:
а) когда требуются значения для под-пикселов в горизонтальных местоположениях 1/2N-1 целого и целых вертикальных местоположениях и в целых горизонтальных местоположениях и вертикальных местоположениях 1/2N-1 целого, интерполируют такие значения напрямую с помощью взвешенных сумм пикселов, находящихся в целых горизонтальных и целых вертикальных местоположениях;
b) когда требуется значение для под-пиксела в горизонтальном местоположении под-пиксела и вертикальном местоположении под-пиксела, интерполируют такое значение напрямую с помощью выбора первой взвешенной суммы значений для под-пикселов, расположенных в вертикальном местоположении, соответствующем вертикальному местоположению вычисляемого под-пиксела, и второй взвешенной суммы значений под-пикселов, расположенных в горизонтальном местоположении, соответствующем горизонтальному местоположению вычисляемого под-пиксела.
Под-пикселы, используемые в первой взвешенной сумме, могут быть под-пикселами, расположенными в горизонтальных местоположениях 1/2N-1 целого и целых вертикальных местоположениях, и первая взвешенная сумма может быть использована для интерполяции значения под-пиксела в горизонтальном местоположении 1/2N-1 целого и вертикальном местоположении 1/2N целого.
Под-пикселы, используемые во второй взвешенной сумме, могут быть под-пикселами, расположенными в целых горизонтальных и вертикальных местоположениях 1/2N-1 целого, и вторая взвешенная сумма может быть использована для интерполяции значения под-пиксела в горизонтальном местоположении 1/2N целого и вертикальном местоположении 1/2N-1 целого.
Когда требуются значения под-пикселов в горизонтальных местоположениях 1/2N целого и вертикальных местоположениях 1/2N целого, они могут быть интерполированы усреднением по меньшей мере одной пары из первой пары значений под-пиксела, расположенного в горизонтальном местоположении 1/2N-1 целого и целом вертикальном местоположении, и под-пиксела, расположенного в целом горизонтальном местоположении и вертикальном местоположении 1/2N-1 целого, и второй пары значений пиксела, расположенного в целом горизонтальном и целом вертикальном местоположении, и под-пиксела, расположенного в горизонтальном местоположении 1/2N-1 целого и вертикальном местоположении 1/2N-1 целого.
В приведенных аспектах N может быть равно целому числу, выбранному из списка, состоящего из значений 2, 3 и 4.
Под-пикселы в горизонтальном местоположении четверть целого должны интерпретироваться как под-пикселы, имеющие в качестве ближайшего соседа слева пиксел в целом горизонтальном местоположении, а в качестве ближайшего соседа справа под-пиксел в полуцелом горизонтальном местоположении, равно как под-пикселы, имеющие в качестве ближайшего соседа слева под-пиксел в полуцелом горизонтальном местоположении, а в качестве ближайшего соседа справа пиксел в целом горизонтальном местоположении. Соответственно, под-пикселы в вертикальном местоположении четверть целого должны интерпретироваться как под-пикселы, имеющие в качестве ближайшего соседа сверху пиксел в целом вертикальном местоположении, а в качестве ближайшего соседа снизу под-пиксел в полуцелом вертикальном местоположении, равно как под-пикселы, имеющие в качестве ближайшего соседа сверху под-пиксел в полуцелом вертикальном местоположении, а в качестве ближайшего соседа снизу пиксел в целом вертикальном местоположении.
Термин “динамический диапазон” относится к диапазону значений, которые могут принимать значения под-пикселов и взвешенных сумм.
Предпочтительно изменение динамического диапазона посредством его расширения или уменьшения означает изменение количества битов, которые используются для представления динамического диапазона.
В варианте осуществления изобретения способ применен к изображению, которое подразделено на некоторое количество блоков изображения. Предпочтительно каждый блок изображения содержит четыре угла, каждый из которых определяется пикселом, расположенным в целом горизонтальном и целом вертикальном местоположении. Предпочтительно способ применен к каждому блоку изображения, когда блок становится доступным для интерполяции значений под-пикселов. Альтернативно, интерполяция значений под-пикселов в соответствии со способом по изобретению выполняется тогда, когда все блоки изображения становятся доступными для интерполяции значений под-пикселов.
Предпочтительно способ используется при кодировании видеоданных. Предпочтительно способ используется при декодировании видеоданных.
В одном варианте осуществления изобретения при использовании для кодирования способ реализуется как предварительная интерполяция, в которой значения всех под-пикселов в полуцелых местоположениях и значения всех под-пикселов в местоположениях четверть целого вычисляются и сохраняются до момента последующего использования при определении кадра предсказания во время кодирования с предсказанием движения. В альтернативных вариантах осуществления способ реализуется как комбинация предварительной интерполяции и интерполяции “по запросу”. В этом случае определенная пропорция или категория значений под-пикселов вычисляется и хранится до начала использования при определении кадра предсказания, а некоторые другие значения под-пикселов - вычисляются только при необходимости во время кодирования с предсказанием движения.
Предпочтительно, если способ используется для декодирования, под-пикселы интерполируют только тогда, когда их необходимость обозначена вектором движения.
В соответствии с четвертым аспектом изобретения обеспечено устройство кодирования видеоданных для кодирования изображения, содержащего пикселы, упорядоченные по строкам и столбцам и представленные значениями, имеющими заданный динамический диапазон, причем пикселы в строках находятся в целых горизонтальных местоположениях, а пикселы в столбцах находятся в целых вертикальных местоположениях, устройство кодирования видеоданных содержит интерполятор, приспособленный генерировать значения для под-пикселов в дробных горизонтальных и вертикальных местоположениях, причем эти дробные горизонтальные и вертикальные местоположения определяются по формуле 1/2х, где х является положительным целым числом, имеющим максимальное значение N, а интерполятор приспособлен выполнять следующие операции:
а) интерполировать значения для под-пикселов в горизонтальных местоположениях 1/2N-1 целого и целых вертикальных местоположениях, а также в целых горизонтальных местоположениях и вертикальных местоположениях 1/2N-1 целого напрямую с помощью взвешенных сумм пикселов, находящихся в целых горизонтальных и целых вертикальных местоположениях;
b) интерполировать значения для под-пикселов в горизонтальных местоположениях 1/2N-1 целого и вертикальных местоположениях 1/2N-1 целого напрямую с помощью выбора первой взвешенной суммы значений для под-пикселов, находящихся в горизонтальных местоположениях 1/2N-1 целого и целых вертикальных местоположениях, и второй взвешенной суммы значений для под-пикселов, находящихся в целых горизонтальных и вертикальных местоположениях 1/2N-1 целого, причем эти первая и вторая взвешенные суммы вычисляются в соответствии с операцией а); и
с) интерполировать значение для под-пиксела в горизонтальном местоположении 1/2 целого и вертикальном местоположении 1/2 целого взвешенным усреднением значения первого под-пиксела или пиксела, находящегося в горизонтальном местоположении 1/2N-m целого и вертикальном местоположении
1/2N-n целого, и значения второго под-пиксела или пиксела, находящегося в горизонтальном местоположении 1/2N-p целого и вертикальном местоположении 1/2N-q целого, где переменные m, n, p, q являются целыми значениями в диапазоне от 1 до N, так что первый и второй под-пикселы или пикселы расположены по диагонали по отношению к под-пикселу в горизонтальном местоположении 1/2N и вертикальном местоположении 1/2N целого.
Устройство кодирования видеоданных может содержать видеокодер. Оно может содержать видеодекодер. Оно может представлять собой кодек, включающий в себя одновременно видеокодер и видеодекодер.
В соответствии с пятым аспектом изобретения обеспечен терминал связи, содержащий устройство кодирования видеоданных для кодирования изображения, содержащего пикселы, упорядоченные по строкам и столбцам и представленные значениями, имеющими заданный динамический диапазон, причем пикселы в строках находятся в целых горизонтальных местоположениях, а пикселы в столбцах находятся в целых вертикальных местоположениях, при этом устройство кодирования видеоданных содержит интерполятор, приспособленный генерировать значения для под-пикселов в дробных горизонтальных и вертикальных местоположениях, причем эти дробные горизонтальные и вертикальные местоположения определяются по формуле 1/2х, где х является положительным целым числом, имеющим максимальное значение N, а интерполятор приспособлен выполнять следующие операции:
а) интерполировать значения для под-пикселов в горизонтальных местоположениях 1/2N-1 целого и целых вертикальных местоположениях и в целых горизонтальных местоположениях и вертикальных местоположениях 1/2N-1 целого напрямую с помощью взвешенных сумм пикселов, находящихся в целых горизонтальных и целых вертикальных местоположениях;
b) интерполировать значения для под-пикселов в горизонтальных местоположениях 1/2N-1 целого и вертикальных местоположениях 1/2N-1 целого напрямую с помощью выбора первой взвешенной суммы значений для под-пикселов, находящихся в горизонтальных местоположениях 1/2N-1 целого и целых вертикальных местоположениях, и второй взвешенной суммы значений для под-пикселов, находящихся в целых горизонтальных местоположениях и вертикальных местоположениях 1/2N-1 целого, причем эти первая и вторая взвешенные суммы вычисляются в соответствии с операцией а); и
с) интерполировать значение для под-пиксела в горизонтальном местоположении 1/2N целого и вертикальном местоположении 1/2N целого взвешенным усреднением значения первого под-пиксела или пиксела, расположенного в горизонтальном местоположении 1/2N-m целого и вертикальном местоположении 1/2N-n целого, и значения второго под-пиксела или пиксела, расположенного в горизонтальном местоположении 1/2N-p целого и вертикальном местоположении 1/2N-q целого, где переменные m, n, p, q являются целыми значениями в диапазоне от 1 до N, так что первый и второй под-пикселы или пикселы расположены по диагонали по отношению к под-пикселу в горизонтальном местоположении 1/2N целого и вертикальном местоположении 1/2N целого.
Терминал связи может содержать видеокодер. Он может содержать видеодекодер. Предпочтительно он содержит видеокодек, включающий в себя одновременно видеокодер и видеодекодер.
Предпочтительно терминал связи содержит пользовательский интерфейс, процессор и по меньшей мере один блок из передающего блока и приемного блока и устройство кодирования видеоданных в соответствии с по меньшей мере одним из третьего или четвертого аспектов изобретения. Предпочтительно процессор управляет работой передающего блока и/или приемного блока и устройства кодирования видеоданных.
В соответствии с шестым аспектом изобретения обеспечена телекоммуникационная система, содержащая терминал связи и сеть, причем телекоммуникационная сеть и терминал связи соединены линией связи, по которой могут передаваться кодированные видеоданные, терминал связи содержит устройство кодирования видеоданных для кодирования изображения, содержащего пикселы, упорядоченные по строкам и столбцам и представленные значениями, имеющими заданный динамический диапазон, причем пикселы в строках находятся в целых горизонтальных местоположениях, а пикселы в столбцах находятся в целых вертикальных местоположениях, устройство кодирования видеоданных содержит интерполятор, приспособленный генерировать значения для под-пикселов в дробных горизонтальных и вертикальных местоположениях, причем эти дробные горизонтальные и вертикальные местоположения определяются по формуле 1/2х, где х является положительным целым числом, имеющим максимальное значение N, а интерполятор приспособлен выполнять следующие операции:
а) интерполировать значения для под-пикселов в горизонтальных местоположениях 1/2N-1 целого и целых вертикальных местоположениях и в целых горизонтальных местоположениях и вертикальных местоположениях 1/2N-1 целого напрямую с помощью взвешенных сумм пикселов, находящихся в целых горизонтальных и целых вертикальных местоположениях;
b) интерполировать значения для под-пикселов в горизонтальных местоположениях 1/2N-1 целого и вертикальных местоположениях 1/2N-1 целого напрямую с помощью выбора первой взвешенной суммы значений для под-пикселов, находящихся в горизонтальных местоположениях 1/2N-1 целого и целых вертикальных местоположениях, и второй взвешенной суммы значений для под-пикселов, находящихся в целых горизонтальных и вертикальных местоположениях 1/2N-1 целого, причем эти первая и вторая взвешенные суммы вычисляются в соответствии с операцией а); и
с) интерполировать значение для под-пиксела в горизонтальном местоположении 1/2N целого и вертикальном местоположении 1/2N целого взвешенным усреднением значения первого под-пиксела или пиксела, расположенного в горизонтальном местоположении 1/2N-m целого и вертикальном местоположении 1/2N-n целого, и значения второго под-пиксела или пиксела, расположенного в горизонтальном местоположении 1/2N-p целого и вертикальном местоположении 1/2N-q целого, где переменные m, n, p, q являются целыми значениями в диапазоне от 1 до N, так что первый и второй под-пикселы или пикселы расположены по диагонали по отношению к под-пикселу в горизонтальном местоположении 1/2N целого и вертикальном местоположении 1/2N целого.
Предпочтительно телекоммуникационная система является системой мобильной связи, содержащей мобильный терминал связи и беспроводную сеть, причем соединение между мобильным терминалом связи и беспроводной сетью формируется по радиолинии. Предпочтительно сеть дает возможность терминалу связи осуществлять связь с другими терминалами связи, подключенными к сети, по линиям связи между другими терминалами связи и сетью.
В соответствии с седьмым аспектом изобретения обеспечена телекоммуникационная система, содержащая терминал связи и сеть, причем телекоммуникационная сеть и терминал связи соединены линией связи, по которой могут передаваться кодированные видеоданные, телекоммуникационная сеть содержит устройство кодирования видеоданных для кодирования изображения, содержащего пикселы, упорядоченные по строкам и столбцам и представленные значениями, имеющими заданный динамический диапазон, причем пикселы в строках находятся в целых горизонтальных местоположениях, а пикселы в столбцах находятся в целых вертикальных местоположениях, устройство кодирования видеоданных содержит интерполятор, приспособленный генерировать значения для под-пикселов в дробных горизонтальных и вертикальных местоположениях, причем эти дробные горизонтальные и вертикальные местоположения определяются по формуле 1/2х, где х является положительным целым числом, имеющим максимальное значение N, а интерполятор приспособлен выполнять следующие операции:
а) интерполировать значения для под-пикселов в горизонтальных местоположениях 1/2N-1 целого и целых вертикальных местоположениях, а также в целых горизонтальных местоположениях и вертикальных местоположениях 1/2N-1 целого напрямую с помощью взвешенных сумм пикселов, находящихся в целых горизонтальных и целых вертикальных местоположениях;
b) интерполировать значения для под-пикселов в горизонтальных местоположениях 1/2N-1 целого и вертикальных местоположениях 1/2N-1 целого напрямую с помощью выбора первой взвешенной суммы значений для под-пикселов, находящихся в горизонтальных местоположениях 1/2N-1 целого и целых вертикальных местоположениях, и второй взвешенной суммы значений для под-пикселов, находящихся в целых горизонтальных местоположениях и вертикальных местоположениях 1/2N-1 целого, причем эти первая и вторая взвешенные суммы вычисляются в соответствии с операцией а); и
с) интерполировать значение для под-пиксела в горизонтальном местоположении 1/2N целого и вертикальном местоположении взвешенным 1/2N целого взвешенным усреднением значения первого под-пиксела или пиксела, расположенного в горизонтальном местоположении 1/2N-m целого и вертикальном местоположении 1/2N-n целого, и значения второго под-пиксела или пиксела, расположенного в горизонтальном местоположении 1/2N-p целого и вертикальном местоположении 1/2N-q целого, где переменные m, n, p, q являются целыми значениями в диапазоне от 1 до N, так что первый и второй под-пикселы или пикселы расположены по диагонали по отношению к под-пикселу в горизонтальном местоположении 1/2N целого и вертикальном местоположении 1/2N целого.
В соответствии с восьмым аспектом изобретения обеспечено устройство кодирования видеоданных для кодирования изображения, содержащего пикселы, упорядоченные по строкам и столбцам и представленные значениями, имеющими заданный динамический диапазон, при этом пикселы в строках находятся в целых горизонтальных местоположениях, а пикселы в столбцах находятся в целых вертикальных местоположениях, устройство кодирования содержит интерполятор, приспособленный генерировать значения для под-пикселов в дробных горизонтальных и вертикальных местоположениях, при этом разрешение под-пикселов определяется положительным целым числом N, а интерполятор приспособлен выполнять следующие операции:
а) интерполировать значения для под-пикселов в горизонтальных местоположениях 1/2N-1 целого и целых вертикальных местоположениях, а также в целых горизонтальных местоположениях и вертикальных местоположениях 1/2N-1 целого напрямую с помощью взвешенных сумм пикселов, находящихся в целых горизонтальных и целых вертикальных местоположениях;
b) интерполировать значение для под-пиксела в горизонтальном местоположении под-пиксела и вертикальном местоположении под-пиксела напрямую с помощью выбора первой взвешенной суммы значений для под-пикселов, расположенных в вертикальном местоположении, соответствующем вертикальному местоположению вычисляемого под-пиксела, и второй взвешенной суммы значений для под-пикселов, расположенных в горизонтальном местоположении, соответствующем горизонтальному местоположению вычисляемого под-пиксела.
Интерполятор может быть дополнительно приспособлен формировать первую взвешенную сумму с помощью значений под-пикселов, находящихся в горизонтальных местоположениях 1/2N-1 целого и целых вертикальных местоположениях, и использовать первую взвешенную сумму для интерполяции значения под-пиксела в горизонтальном местоположении 1/2N-1 целого и вертикальном местоположении 1/2N целого.
Интерполятор может быть дополнительно приспособлен формировать вторую взвешенную сумму с помощью значений под-пикселов, находящихся в целых горизонтальных местоположениях и вертикальных местоположениях 1/2N-1 целого, и использовать вторую взвешенную сумму для интерполяции значения под-пиксела в горизонтальном местоположении 1/2N целого и вертикальном местоположении 1/2N-1 целого.
Интерполятор может быть дополнительно приспособлен интерполировать значения для под-пикселов в горизонтальных местоположениях 1/2N целого и вертикальных местоположениях 1/2N целого усреднением по меньшей мере одной пары из первой пары значений под-пиксела, расположенного в горизонтальном местоположении 1/2N-1 целого и целом вертикальном местоположении, и под-пиксела, расположенного в целом горизонтальном и вертикальном местоположении 1/2N-1 целого, и второй пары значений пиксела, расположенного в целом горизонтальном и целом вертикальном местоположении, и под-пиксела, расположенного в горизонтальном местоположении 1/2N-1 целого и вертикальном местоположении 1/2N-1 целого.
В соответствии с девятым аспектом изобретения обеспечен терминал связи, содержащий устройство кодирования видеоданных для кодирования изображения, содержащего пикселы, упорядоченные по строкам и столбцам и представленные значениями, имеющими заданный динамический диапазон, причем пикселы в строках находятся в целых горизонтальных местоположениях, а пикселы в столбцах находятся в целых вертикальных местоположениях, устройство кодирования содержит интерполятор, приспособленный генерировать значения для под-пикселов в дробных горизонтальных и вертикальных местоположениях, при этом разрешение под-пикселов определяется положительным целым числом N, а интерполятор приспособлен выполнять следующие операции:
а) интерполировать значения для под-пикселов в горизонтальных местоположениях 1/2N-1 целого и целых вертикальных местоположениях и в целых горизонтальных местоположениях и вертикальных местоположениях 1/2N-1 целого напрямую с помощью взвешенных сумм пикселов, находящихся в целых горизонтальных и целых вертикальных местоположениях;
b) интерполировать значение для под-пиксела в горизонтальном местоположении под-пиксела и вертикальном местоположении под-пиксела напрямую с помощью выбора первой взвешенной суммы значений для под-пикселов, расположенных в вертикальном местоположении, соответствующем вертикальному местоположению вычисляемого под-пиксела, и второй взвешенной суммы значений для под-пикселов, расположенных в горизонтальном местоположении, соответствующем горизонтальному местоположению вычисляемого под-пиксела.
В соответствии с десятым аспектом изобретения обеспечена телекоммуникационная система, содержащая терминал связи и сеть, причем телекоммуникационная сеть и терминал связи соединены линией связи, по которой могут передаваться кодированные видеоданные, терминал связи содержит устройство кодирования видеоданных для кодирования изображения, содержащего пикселы, упорядоченные по строкам и столбцам и представленные значениями, имеющими заданный динамический диапазон, причем пикселы в строках находятся в целых горизонтальных местоположениях, а пикселы в столбцах находятся в целых вертикальных местоположениях, кодер содержит интерполятор, приспособленный генерировать значения для под-пикселов в дробных горизонтальных и вертикальных местоположениях, при этом разрешение под-пикселов определяется положительным целым числом N, а интерполятор приспособлен выполнять следующие операции:
а) интерполировать значения для под-пикселов в горизонтальных местоположениях 1/2N-1 целого и целых вертикальных местоположениях и в целых горизонтальных местоположениях и вертикальных местоположениях 1/2N-1 целого напрямую с помощью взвешенных сумм пикселов, находящихся в целых горизонтальных и целых вертикальных местоположениях;
b) интерполировать значение для под-пиксела в горизонтальном местоположении под-пиксела и вертикальном местоположении под-пиксела напрямую с помощью выбора первой взвешенной суммы значений для под-пикселов, расположенных в вертикальном местоположении, соответствующем вертикальному положению вычисляемого под-пиксела, и второй взвешенной суммы значений для под-пикселов, расположенных в горизонтальном местоположении, соответствующем горизонтальному местоположению вычисляемого под-пиксела.
В соответствии с одиннадцатым аспектом изобретения обеспечена телекоммуникационная система, содержащая терминал связи и сеть, причем телекоммуникационная сеть и терминал связи соединены линией связи, по которой могут передаваться кодированные видеоданные, сеть содержит устройство кодирования видеоданных для кодирования изображения, содержащего пикселы, упорядоченные по строкам и столбцам и представленные значениями, имеющими заданный динамический диапазон, причем пикселы в строках находятся в целых горизонтальных местоположениях, а пикселы в столбцах находятся в целых вертикальных местоположениях, устройство кодирования содержит интерполятор, приспособленный генерировать значения для под-пикселов в дробных горизонтальных и вертикальных местоположениях, при этом разрешение под-пикселов определяется положительным целым числом N, а интерполятор приспособлен выполнять следующие операции:
а) интерполировать значения для под-пикселов в горизонтальных местоположениях 1/2N-1 целого и целых вертикальных местоположениях, а также в целых горизонтальных местоположениях и вертикальных местоположениях 1/2N-1 целого напрямую с помощью взвешенных сумм пикселов, находящихся в целых горизонтальных и целых вертикальных местоположениях;
b) интерполировать значение для под-пиксела в горизонтальном местоположении под-пиксела и вертикальном местоположении под-пиксела напрямую с помощью выбора первой взвешенной суммы значений для под-пикселов, расположенных в вертикальном местоположении, соответствующем вертикальному местоположению вычисляемого под-пиксела, и второй взвешенной суммы значений для под-пикселов, расположенных в горизонтальном местоположении, соответствующем горизонтальному местоположению вычисляемого под-пиксела.
Перечень фигур чертежей
Вариант осуществления изобретения будет теперь описан только в качестве примера со ссылкой на приложенные чертежи, на которых:
Фиг. 1 показывает видеокодер в соответствии с предшествующим уровнем техники;
Фиг. 2 показывает видеодекодер в соответствии с предшествующим уровнем техники;
Фиг. 3 показывает типы кадров, используемых для кодирования видеоданных;
Фиг. 4а, 4b и 4с показывают согласования блоков;
Фиг. 5 показывает процесс оценки движения в под-пиксельном разрешении;
Фиг. 6 показывает оконечное устройство, содержащее оборудование кодирования и декодирования видеоданных, в котором может быть реализован способ по изобретению;
Фиг. 7 показывает видеокодер в соответствии с вариантом осуществления настоящего изобретения;
Фиг. 8 показывает видеодекодер в соответствии с вариантом осуществления настоящего изобретения;
Фиг. 9 и 10 не использованы, и любые такие чертежи не должны приниматься во внимание;
Фиг. 11 показывает условную схему сети мобильной связи в соответствии с вариантом осуществления настоящего изобретения;
Фиг. 12а показывает обозначения для описания местоположений пикселов и под-пикселов, характерных для ОМ5;
Фиг. 12b показывает интерполяцию под-пикселов разрешения 1/2;
Фиг. 12с показывает интерполяцию под-пикселов разрешения 1/2;
Фиг. 13а показывает обозначения для описания местоположений пикселов и под-пикселов, характерных для ОМ6;
Фиг. 13b показывает интерполяцию под-пикселов разрешения 1/2;
Фиг. 13с показывает интерполяцию под-пикселов разрешения 1/2;
Фиг. 14 показывает обозначения для описания местоположений пикселов и под-пикселов, характерных для изобретения;
Фиг. 14b показывает интерполяцию под-пикселов разрешения 1/2 в соответствии с изобретением;
Фиг. 14с показывает интерполяцию под-пикселов разрешения 1/2 в соответствии с изобретением;
Фиг. 15 показывает возможные варианты выбора диагональной интерполяции под-пикселов;
Фиг. 16 показывает значения под-пикселов разрешения 1/2, требуемых для вычисления других значений под-пикселов разрешения 1/2;
Фиг. 17а показывает значения под-пикселов разрешения 1/2, которые должны быть вычислены для интерполяции значений для под-пикселов разрешения 1/4 в блоке изображения с помощью способа интерполяции по ОМ5;
Фиг. 17b показывает значения под-пикселов разрешения 1/2, которые должны быть вычислены для интерполяции значений для под-пикселов разрешения 1/4 в блоке изображения с помощью способа интерполяции в соответствии с изобретением;
Фиг. 18а показывает количества под-пикселов разрешения 1/2, которые должны быть вычислены, чтобы получить значения для под-пикселов разрешения 1/4 в блоке изображения с помощью способа интерполяции значений под-пикселов в соответствии с ОМ5;
Фиг. 18b показывает количества под-пикселов разрешения 1/2, которые должны быть вычислены, чтобы получить значения для под-пикселов разрешения 1/4 в блоке изображения с помощью способа интерполяции значений под-пикселов в соответствии с изобретением;
Фиг. 19 показывает схему нумерации для каждого из 15 местоположений под-пиксела;
Фиг. 20 показывает номенклатуру, используемую для описания пикселов, под-пикселов разрешения 1/2, под-пикселов разрешения 1/4 и под-пикселов разрешения 1/8;
Фиг. 21а показывает диагональное направление, используемое для интерполяции каждого под-пиксела разрешения 1/8 в варианте осуществления изобретения;
Фиг. 21b показывает диагональное направление, используемое для интерполяции каждого под-пиксела разрешения 1/8 в другом варианте осуществления изобретения;
Фиг. 22 показывает номенклатуру, используемую для описания под-пикселов разрешения 1/8 внутри изображения.
Подробное описание изобретения
Выше были описаны фиг. 1-5, 12а, 12b, 12с, 13а, 13b, 13с.
Фиг. 6 представляет оконечное устройство, содержащее оборудование для кодирования и декодирования видеоданных, которое может быть приспособлено для работы в соответствии с настоящим изобретением. Точнее, чертеж показывает мультимедийный терминал 60, реализованный в соответствии с рекомендациями Н.324 ITU-T. Этот терминал может рассматриваться как мультимедийное приемопередающее устройство. Оно включает в себя элементы, которые захватывают, кодируют и мультиплексируют потоки мультимедийных данных для передачи по сети связи, равно как элементы, которые принимают, демультиплексируют, декодируют и отображают принятый мультимедийный контент. Рекомендации Н.324 ITU-T определяют общее функционирование терминала и ссылаются на другие рекомендации, которые регламентируют функционирование его различных составных частей. Этот тип мультимедийного терминала может быть использован в приложениях реального масштаба времени, таких как диалоговая видеотелефония, или в приложениях, работающих не в реальном масштабе времени, таких как получение/отправка видеоклипов, например, с сервера мультимедийного контента в Интернете.
В контексте настоящего изобретения следует понимать, что терминал Н.324, показанный на фиг. 6, является только одним из множества альтернативных реализаций мультимедийного терминала, пригодных для применения в способе по настоящему изобретению. Следует также отметить, что существует несколько альтернатив, относящихся к расположению и реализации оборудования терминала. Как показано на фиг. 6, мультимедийный терминал может быть расположен в оборудовании связи, соединенном с проводной телефонной сетью, такой как аналоговая телефонная коммутируемая сеть общего пользования (ТСОП, PSTN). В этом случае мультимедийный терминал оборудуется модемом 71, совместимым с рекомендациями V.8, V.34 и выборочно V.8bis ITU-T. Альтернативно, мультимедийный терминал может быть соединен с внешним модемом. Модем дает возможность преобразовывать мультиплексированные цифровые данные и сигналы управления, выработанные мультимедийным терминалом, в аналоговую форму, пригодную для передачи по ТСОП. Он далее дает возможность мультимедийному терминалу принимать данные и сигналы управления в аналоговой форме из ТСОП и преобразовывать их в поток цифровых данных, который может быть должным образом демультиплексирован и обработан в терминале.
Мультимедийный терминал Н.324 также может быть реализован таким образом, что его можно напрямую соединить с цифровой проводной сетью, такой как ISDN (цифровая сеть с комплексными услугами). В этом случае модем 71 заменяется сетевым пользовательским интерфейсом ISDN. На фиг. 6 этот сетевой пользовательский интерфейс ISDN представлен альтернативным блоком 72.
Мультимедийные терминалы Н.324 могут быть также приспособлены для использования в применениях мобильной связи. При использовании беспроводной линии связи модем 71 может быть заменен любым подходящим беспроводным интерфейсом, представленным альтернативным блоком 73 на фиг. 6. Например, мультимедийный терминал Н.324 может включать в себя радиоприемопередатчик, обеспечивающий соединение с существующей мобильной телефонной сетью GSM второго поколения, или с предлагаемой универсальной системой мобильной связи (UMTS) третьего поколения.
Следует отметить, что предпочтительно оснастить мультимедийные терминалы, спроектированные для двунаправленной связи, то есть для передачи и приема видеоданных, как видеокодером, так и видеодекодером, реализованными в соответствии с настоящим изобретением. Такая пара из кодера и декодера часто реализуется в качестве единого объединенного функционального блока, который именуется “кодек”.
Поскольку устройство кодирования видеоданных в соответствии с настоящим изобретением выполняет кодирование видеоданных с компенсацией движения с под-пиксельным разрешением с помощью специальной схемы интерполяции и конкретного сочетания предварительной интерполяции и интерполяции “по запросу” для значения под-пиксела, в общем случае необходимо, чтобы видеодекодер в принимающем терминале был реализован таким образом, чтобы быть совместимым с кодером передающего терминала, который формирует поток цифровых данных. Невозможность обеспечения такой совместимости может иметь неблагоприятное воздействие на качество компенсации движения и точность восстановленных видеокадров.
Обычный мультимедийный терминал Н.324 будет теперь описан более подробно со ссылкой на фиг. 6.
Мультимедийный терминал 60 включает в себя множество элементов, которые объединяются термином “оборудование терминала”. Он включает в себя видео-, аудио- и телематические устройства, в общем обозначенные ссылочными номерами 61, 62 и 63, соответственно. Видеооборудование 61 может включать в себя, например, видеокамеру для захвата видеоизображений, монитор для отображения принятого видеоконтента и выборочно оборудование обработки видеоданных. Аудиооборудование 62 обычно включает в себя микрофон, например для захвата речевых сообщений, и громкоговоритель для воспроизведения принятого аудиоконтента. Аудиооборудование также может включать в себя дополнительные блоки обработки аудиоданных. Телематическое оборудование 63 может включать в себя терминал данных, клавиатуру, электронную “белую доску” (для использования пера) или приемопередатчик неподвижных изображений, такой как факсимильный блок.
Видеооборудование 61 соединено с видеокодеком 65. Видеокодек 65 содержит видеокодер и соответствующий видеодекодер, реализованные в соответствии с изобретением. Такие кодер и декодер будут описаны ниже. Видеокодек 65 отвечает за кодирование захваченных видеоданных в соответствующую форму для последующей передачи по линии связи и за декодирование сжатого видеоконтента, принятого из сети связи. В примере, показанном на фиг. 6, видеокодек 65 реализован в соответствии с рекомендациями Н.263 ITU-T, с соответствующими изменениями, чтобы реализовать способ интерполяции значений под-пикселов в соответствии с изобретением как в кодере, так и в декодере видеокодека.
Аналогично, аудиооборудование терминала соединено с аудиокодеком, обозначенным на фиг. 6 ссылочным номером 66. Как и видеокодек, аудиокодек содержит пару кодер/декодер. Он преобразует аудиоданные, захваченные аудиооборудованием терминала, в форму, пригодную для передачи по линии связи, и преобразует закодированные аудиоданные, принятые из сети, обратно в форму, пригодную для воспроизведения, например через громкоговоритель терминала. Выходные данные аудиокодека проходят через блок 67 задержки. Это компенсирует задержки, привнесенные процессом кодирования видеоданных, и таким образом гарантирует синхронизацию аудио- и видеоконтента.
Блок 64 управления системой из состава мультимедийного терминала управляет передачей сигналов по тракту от оконечного оборудования в сеть с помощью подходящего протокола управления (блок 68 передачи сигналов), чтобы установить общий режим работы между передающим и принимающим терминалами. Блок 68 передачи сигналов обменивается информацией о функциональных возможностях кодирования и декодирования передающего и принимающего терминалов и может быть использован для обеспечения различных режимов кодирования видеокодера. Блок 64 управления системой также управляет использованием шифрования данных. Информация о типе шифрования, подлежащем использованию при передаче данных, передается из блока 69 шифрования на блок 70 мультиплексирования/демультиплексирования.
Во время передачи данных из мультимедийного терминала блок 70 мультиплексирования/демультиплексирования объединяет закодированные и синхронизированные видео- и аудиопотоки со входным сигналом данных от телематического оборудования 63 и возможными данными управления, чтобы сформировать единый поток битов. Информация относительно типа шифрования данных (если оно применено) для применения к потоку битов, выдаваемая блоком 69 шифрования, используется для выбора режима шифрования. Соответственно, когда принимается мультиплексированный и возможно зашифрованный мультимедийный поток битов, блок 70 мультиплексирования/демультиплексирования отвечает за расшифровку потока битов, разделяя его на составные мультимедийные составляющие и передавая эти составляющие в соответствующий(-ие) кодек(-и) и/или оборудование терминала для декодирования и воспроизведения.
Следует отметить, что функциональные элементы мультимедийного терминала - видеокодер, видеодекодер и видеокодек - в соответствии с изобретением могут быть реализованы как программное обеспечение или специальное аппаратное обеспечение, или как их сочетание. Способы кодирования и декодирования видеоданных в соответствии с изобретением особенно пригодны для реализации в виде компьютерной программы, содержащей машиночитаемые команды для выполнения функциональных этапов изобретения. Как таковые кодер и декодер в соответствии с изобретением могут быть реализованы в виде программного кода, хранящегося на носителе данных и выполняемого в компьютере, таком как персональный настольный компьютер, чтобы обеспечить этот компьютер функциональностью кодирования и/или декодирования видеоданных.
Если мультимедийным терминалом 60 является мобильный терминал, то есть если он оборудован радиоприемопередатчиком 73, специалисту в данной области техники следует понимать, что он также может содержать дополнительные элементы. В одном варианте осуществления он содержит пользовательский интерфейс с дисплеем и клавиатурой, что позволяет пользователю работать с мобильным терминалом 60 вместе с необходимыми функциональными блоками, включающими в себя центральный процессор, такой как микропроцессор, который управляет блоками, ответственными за различные функции мультимедийного терминала, оперативное запоминающее устройство (ОЗУ, RAM), постоянное запоминающее устройство (ПЗУ, ROM) и цифровую камеру. Команды работы микропроцессора, то есть программный код, соответствующий основным функциям мультимедийного терминала 60, хранятся в постоянном запоминающем устройстве (ПЗУ) и могут выполняться микропроцессором, когда требуется, например, под управлением пользователя. В соответствии с программным кодом микропроцессор использует радиоприемопередатчик 73 для формирования соединения с сетью мобильной связи, давая возможность мультимедийному терминалу 60 передавать информацию в сеть мобильной связи и принимать информацию из нее по радиотракту.
Микропроцессор отслеживает состояние пользовательского интерфейса и управляет цифровой камерой. В ответ на команду пользователя микропроцессор предписывает камере записать цифровые изображения в ОЗУ. Когда изображение захвачено, или, альтернативно, в процессе захвата, микропроцессор сегментирует изображение на сегменты изображения (например, макроблоки) и использует кодер для выполнения кодирования с компенсацией движения для этих сегментов, чтобы сгенерировать сжатую последовательность изображений, как объяснено в предшествующем описании. Пользователь может выдать команду мультимедийному терминалу 60 на отображение захваченных изображений на дисплее или отправить сжатую последовательность изображений с помощью радиоприемопередатчика 73 на другой мультимедийный терминал, видеотелефон, соединенный с проводной сетью (ТСОП), или некоторое иное устройство связи. В предпочтительном варианте осуществления передача данных изображения начинается сразу же после того, как закодирован первый сегмент, так что получатель может начинать соответствующий процесс декодирования с минимальной задержкой.
Фиг. 11 является условной схемой сети мобильной связи в соответствии с вариантом осуществления настоящего изобретения. Мультимедийные терминалы (МТ, MS) находятся в соединении с базовыми станциями (БС, BTS) посредством радиолинии. Базовые станции БС далее соединены через так называемый интерфейс Abis с контроллером базовых станций (КБС, BSC), который контролирует и управляет несколькими базовыми станциями.
Общность, образованная несколькими базовыми станциями БС (обычно, несколькими десятками базовых станций) и одним контроллером КБС базовых станций, управляющим базовыми станциями, называется подсистемой базовых станций (ПБС, BSS). В частности, контроллер КБС базовых станций управляет каналами радиосвязи и эстафетными передачами обслуживания. Контроллер КБС базовых станций также соединен через так называемый интерфейс А с центром коммутации мобильной связи (ЦКМС,MSC), который координирует формирование соединений с мобильными станциями и от мобильных станций. Дальнейшее соединение идет через центр ЦКМС коммутации мобильной связи вовне из сети мобильной связи. Вне сети мобильной связи может (могут) находиться другая сеть (другие сети), соединенные с сетью мобильной связи через шлюз(-ы), например Интернет или телефонная коммутируемая сеть общего пользования (ТСОП). В такой внешней сети или внутри сети связи могут быть расположены станции кодирования и декодирования видеоданных, такие как персональные компьютеры ПК. В варианте осуществления изобретения сеть мобильной связи содержит видеосервер для предоставления видеоданных на мобильные терминалы, подписавшиеся на такую услугу. Видеоданные сжаты с помощью способа сжатия видеоданных с компенсацией движения, как он описан выше. Видеосервер может функционировать как шлюз для интерактивного источника видеоданных, или может содержать записанные ранее видеоклипы. Обычные применения видеотелефонии могут включать в себя, например, две мобильные станции или одну мобильную станцию МС и видеотелефон, соединенный с ТСОП, ПК, соединенный с Интернетом, или Н.261-совместимый терминал, соединенный либо с Интернетом, либо с ТСОП.
Фиг. 7 показывает видеокодер 700 в соответствии с вариантом осуществления изобретения. Фиг. 8 показывает видеодекодер 800 в соответствии с вариантом осуществления изобретения.
Кодер 700 содержит вход 701 для приема видеоданных от камеры или другого источника видеоданных (не показан). Он далее содержит блок 705 дискретного косинусного преобразования (ДКП, DCT), квантователь 706, обратный квантователь 709, блок 710 обратного дискретного косинусного преобразования (ОДКП), объединители 712 и 716, блок 730 предварительной интерполяции под-пикселов, кадровую память 740 и блок 750 интерполяции под-пикселов по запросу, выполненный совместно с блоком 760 оценки движения. Кодер также содержит блок 770 кодирования поля движения и блок 780 предсказания с компенсацией движения. Переключатели 702 и 714 управляются совместно средством 720 управления для переключения кодера между INTRA-режимом кодирования видеоданных и INTER-режимом кодирования видеоданных. Кодер 700 также содержит блок 790 мультиплексирования/демультиплексирования для формирования единого потока битов из различных типов информации, выработанной кодером 700, для последующей передачи на удаленный принимающий терминал, или, например, для хранения на носителе данных, таком как жесткий диск компьютера (не показан).
Следует отметить, что наличие и реализация блока 730 предварительной интерполяции под-пикселов и блока 750 интерполяции под-пикселов по запросу в архитектуре кодера зависит от того, каким образом применяется способ интерполяции под-пикселов в соответствии с изобретением. В вариантах осуществления изобретения, в которых предварительная интерполяция значения под-пиксела не производится, кодер 700 не содержит блока 730 предварительной интерполяции под-пикселов. В других вариантах осуществления изобретения выполняется только предварительная интерполяция под-пикселов и, таким образом, кодер не включает в себя блок 750 интерполяции под-пикселов по запросу. В вариантах осуществления, в которых выполняются как предварительная интерполяция значений под-пикселов, так и интерполяция значений под-пикселов по запросу, в кодере 700 имеются и блок 730, и блок 750.
Теперь будет подробно описана работа кодера 700 в соответствии с изобретением. В описании предполагается, что каждый кадр несжатых видеоданных, принятых от источника видеоданных на входе 701, принимается и обрабатывается по принципу “макроблок за макроблоком”, предпочтительно в порядке растровой развертки. Далее предполагается, что когда начинается кодирование новой видеопоследовательности, первый кадр последовательности кодируется в INTRA-режиме. Затем кодер программируется, чтобы закодировать каждый кадр в INTER-формате, если не выполнено одно из следующих условий: 1) оценено, что текущий кодируемый кадр настолько отличается от опорного кадра, используемого в предсказании, что вырабатывается чрезмерная ошибка предсказания; 2) заранее заданный интервал повторения кадра INTRA истек; 3) принят сигнал обратной связи от принимающего терминала, показывающий запрос на кадр, подлежащий кодированию в INTRA-формате.
Возникновение условия 1) обнаруживается посредством мониторинга выходных данных объединителя 716. Объединитель 716 формирует разность между текущим макроблоком кодируемого кадра и его предсказанием, выработанным в блоке 780 предсказания с компенсацией движения. Если мера этой разности (например, сумма абсолютных разностей значений пиксела) превышает заранее заданный порог, то объединитель 716 информирует средство 720 управления по линии 717 управления, и средство 720 управления манипулирует переключателями 702 и 714 так, чтобы переключить кодер 700 в INTRA-режим кодирования. Возникновение условия 2) отслеживается посредством таймера или счетчика кадров, реализованного в средстве 720 управления таким образом, что если таймер истекает или счетчик кадров достигает заранее заданного количества кадров, средство 720 управления манипулирует переключателями 702 и 714 так, чтобы переключить кодер 700 в INTRA-режим кодирования. Условие 3) срабатывает, если средство 720 управления принимает сигнал обратной связи, например, от принимающего терминала по линии 718 управления, показывающий, что принимающему терминалу необходимо обновление INTRA кадра. Такое условие может возникнуть, к примеру, если ранее переданный кадр был сильно искажен помехами во время его передачи, что делает невозможным его декодирование в приемнике. В этой ситуации приемник выдаст запрос на кодирование следующего кадра в INTRA формате, тем самым повторно инициализируя кодирующую последовательность.
Далее предполагается, что кодер и декодер реализованы таким образом, чтобы позволить определить векторы движения с пространственным разрешением до разрешения в четверть пиксела. Как будет видно дальше, возможны и более точные уровни разрешения.
Теперь будет описана работа кодера 700 в INTRA-режиме кодирования. В INTRA-режиме средство 720 управления манипулирует переключателями 702, чтобы принять входной видеосигнал с входной линии 719. Входной видеосигнал принимается макроблок за макроблоком со входа 701 по входной линии 719, и каждый макроблок пикселов исходного изображения преобразуется в коэффициенты ДКП блоком 705 ДКП. Коэффициенты ДКП затем подаются в квантователь 706, где они квантуются с использованием параметра QP квантования. Выбор параметра QP квантования управляется средством 720 управления по линии 722 управления. Каждый ДКП-преобразованный и квантованный макроблок, который составляет информацию 723 INTRA-кодированного изображения кадра, проходит из квантователя 706 в блок 790 мультиплексирования/демультиплексирования. Блок 790 мультиплексирования/демультиплексирования объединяет информацию INTRA-кодированного изображения с возможной информацией управления (например, данными заголовка, информацией о параметре квантования, данными исправления ошибок и т.п.) для формирования единого потока битов информации 725 кодированного изображения. Как известно специалистам в данной области техники, кодирование с переменной длиной (КПД,VLC) используется для сокращения избыточности сжатого видеопотока битов.
Локально декодированное изображение формируется в кодере 700 путем пропускания выходных данных квантователя 706 через обратный квантователь 709 и применения обратного ДКП в блоке 710 обратного ДКП к обратно-квантованным данным. Полученные данные затем подаются на объединитель 712. В INTRA-режиме переключатель 714 установлен так, что входной сигнал на объединитель 712 через переключатель 714 устанавливается на нуль. Таким образом, работа, выполняемая объединителем 712, эквивалентна прохождению данных декодированного изображения, сформированных обратным квантователем 709 и блоком 710 обратного ДКП, в неизмененном виде.
В вариантах осуществления изобретения, в которых выполняется интерполяция значений под-пикселов по запросу, выходные данные из объединителя 712 подаются на блок 730 интерполяции под-пикселов по запросу. Входные данные блока 730 интерполяции под-пикселов по запросу принимают форму блоков декодированного изображения. В блоке 730 интерполяции под-пикселов по запросу каждый декодированный макроблок подвергается интерполяции под-пикселов таким образом, что заранее заданное подмножество значений под-пикселов в под-пиксельном разрешении вычисляется в соответствии со способом интерполяции, соответствующим изобретению, и хранится совместно со значениями декодированных пикселов в кадровой памяти 740.
В вариантах осуществления, где интерполяция под-пикселов по запросу не выполняется, в архитектуре кодера отсутствует блок интерполяции под-пикселов по запросу, и выходные данные из объединителя 712, содержащие блоки декодированного изображения, подаются прямо в кадровую память 740.
Когда последовательные макроблоки текущего кадра принимаются и подвергаются ранее описанным операциям кодирования и декодирования в блоках 705, 706, 709, 710, 712, в кадровой памяти 740 выстраивается декодированная версия INTRA-кадра. Когда последний макроблок текущего кадра INTRA-закодирован и затем декодирован, кадровая память 740 содержит полностью декодированный кадр, доступный для использования в качестве опорного кадра предсказания при кодировании следующего принятого видеокадра в INTER-формате. В вариантах осуществления изобретения, где выполняется интерполяция значений под-пикселов по запросу, опорный кадр, хранящийся в кадровой памяти 740, по меньшей мере частично интерполирован до под-пиксельного разрешения.
Теперь будет описана работа кодера 700 в INTER-режиме кодирования. В INTER-режиме кодирования средство 720 управления манипулирует переключателем 702, чтобы принять входные данные с линии 721, которые содержат выходные данные объединителя 716. Объединитель 716 формирует информацию об ошибке предсказания, представляющую разность между текущим макроблоком кодируемого кадра и его предсказанием, выработанным в блоке 780 предсказания с компенсацией движения. Информация об ошибке предсказания преобразуется в соответствии с ДКП в блоке 705 и квантуется в блоке 706 для формирования макроблока ДКП-преобразованной и квантованной информации об ошибке предсказания. Каждый макроблок ДКП-преобразованной и квантованной информации об ошибке предсказания проходит через квантователь 706 в блок 790 мультиплексирования/демультиплексирования. Блок 790 мультиплексирования/демультиплексирования объединяет информацию 723 об ошибке предсказания с коэффициентами 724 движения (описанными ниже) и информацией управления (например, данными заголовка, информацией о параметре квантования, данными исправления ошибок и т.п.) для формирования единого потока 725 битов информации закодированного изображения.
Локально декодированная информация об ошибке предсказания для каждого макроблока INTER-кодированного кадра затем формируется в кодере 700 пропусканием кодированной информации 723 об ошибке предсказания, выданной квантователем 706, через обратный квантователь 709 и применением обратного ДКП преобразования в блоке 710. Полученный локально декодированный макроблок информации об ошибке предсказания затем подается на объединитель 712. В INTER-режиме переключатель 714 установлен так, что объединитель 712 также принимает макроблоки с предсказанием движения для текущего INTER-кадра, выработанные в блоке 780 предсказания с компенсацией движения. Объединитель 712 объединяет эти два фрагмента информации для выработки блоков восстановленного изображения для текущего INTER-кадра.
Как описано выше при рассмотрении INTRA-кодированных кадров, в вариантах осуществления изобретения, в которых осуществляется предварительная интерполяция значений под-пикселов, выходные данные из объединителя 712 подаются в блок 730 предварительной интерполяции под-пикселов. Таким образом, выходные данные блока 730 предварительной интерполяции под-пикселов в режиме INTER-кодирования также принимают форму блоков декодированного изображения. В блоке 730 предварительной интерполяции под-пикселов каждый декодированный макроблок подвергается интерполяции под-пикселов таким образом, что заранее заданное подмножество значений под-пикселов вычисляется в соответствии со способом интерполяции, соответствующим изобретению, и хранится совместно со значениями декодированных пикселов в кадровой памяти 740. В вариантах осуществления, где предварительная интерполяция под-пикселов не выполняется, блок предварительной интерполяции под-пикселов отсутствует в архитектуре кодера, и выходные данные объединителя 712, содержащие блоки декодированного изображения, подаются прямо в кадровую память 740.
Когда последовательные макроблоки видеоданных принимаются от источника видеоданных и подвергаются описанным ранее операциям кодирования и декодирования в блоках 705, 706, 709, 710, 712, в кадровой памяти 740 выстраивается декодированная версия INTER-кадра. Когда последний макроблок кадра INTER-закодирован и затем декодирован, кадровая память 740 содержит полностью декодированный кадр, доступный для использования в качестве опорного кадра предсказания при кодировании следующего принятого видеокадра в INTER-формате. В вариантах осуществления изобретения, где выполняется интерполяция значений под-пикселов по запросу, опорный кадр, хранящийся в кадровой памяти 740, по меньшей мере частично интерполирован до под-пиксельного разрешения.
Теперь будет описано формирование предсказания для макроблока текущего кадра.
Любой кадр, закодированный в INTER-формате, требует опорного кадра для предсказания с компенсацией движения. Это означает, в частности, что при кодировании видеопоследовательности первый кадр, подлежащий кодированию, при этом неважно, является ли он первым кадром в последовательности или каким-либо другим кадром, должен быть закодирован в INTRA-формате. Это, в свою очередь, означает, что когда видеокодер 700 переключается средством 720 управления в режим INTER-кодирования, полный опорный кадр, сформированный локальным декодированием предыдущего закодированного кадра, уже доступен в кадровой памяти 740 кодера. В общем случае опорный кадр формируется локальным декодированием либо INTRA-закодированного кадра, либо INTER-закодированного кадра.
Первый этап при формировании предсказания для макроблока текущего кадра выполняется блоком 760 оценки движения. Блок 760 оценки движения принимает текущий макроблок кодируемого кадра по линии 727 и выполняет операцию согласования блоков, чтобы идентифицировать область в опорном кадре, которая практически соответствует текущему макроблоку. В соответствии с изобретением процесс согласования блоков выполняется до под-пиксельного разрешения способом, который зависит от реализации кодера 700 и степени выполненной предварительной интерполяции под-пикселов. Однако основной принцип, лежащий в основе процесса согласования блоков, одинаков во всех случаях. Конкретнее, блок 760 оценки движения выполняет согласование блоков путем вычисления значений разности (например, сумм абсолютных разностей), представляющих разность в значениях пикселов между рассматриваемым макроблоком текущего кадра и областями-кандидатами на лучшее согласование пикселов/под-пикселов в опорном кадре. Значение разности вырабатывается для всех возможных смещений (например, для смещений по х, у с точностью в четверть или в одну восьмую под-пиксела) между макроблоком текущего кадра и тестовой областью-кандидатом внутри заранее заданной области поиска опорного кадра, а блок 760 оценки движения определяет наименьшее вычисленное значение разности. Смещение между макроблоком в текущем кадре и тестовой областью-кандидатом значений пикселов/значений под-пикселов в опорном кадре, которое дает наименьшее значение разности, определяет вектор движения для рассматриваемого макроблока. В некоторых вариантах осуществления изобретения сначала определяется начальная оценка вектора движения, имеющая точность в целый пиксел, а затем уточняется до более высокого уровня под-пиксельного разрешения, как описано выше.
В вариантах осуществления кодера, в которых не осуществляется предварительная интерполяция значений под-пикселов, все значения под-пикселов, требуемые для процесса согласования блоков, вычисляются в блоке 750 интерполяции значений под-пикселов по запросу. Блок 760 оценки движения управляет блоком 750 интерполяции значений под-пикселов по запросу с целью вычисления каждого значения под-пиксела, необходимого в процессе согласования блоков в режиме “по-запросу”, если и когда это необходимо. В этом случае блок 760 оценки движения может быть реализован так, чтобы осуществлять согласование блоков как одноэтапный процесс, тогда вектор движения с желаемым под-пиксельным разрешением отыскивается напрямую, или он может быть реализован так, чтобы выполнять согласование блоков как двухэтапный процесс. Если применен двухэтапный процесс, то первый этап может содержать поиск, например, вектора движения разрешения в целый пиксел или в половину пиксела, а второй этап выполняется для уточнения вектора движения до желаемого под-пиксельного разрешения. Поскольку согласование блоков является исчерпывающим процессом, в котором блоки из n×m пикселов в текущем кадре сравниваются один за другим с блоками из n×m пикселов или под-пикселов в интерполированном опорном кадре, следует понимать, что под-пиксел, вычисленный в режиме “по-запросу” блоком 750 интерполяции под-пикселов по запросу, может оказаться нужным вычислять множество раз по мере того, как определяются последовательные значения разности. В видеокодере этот подход не является наиболее эффективным из возможных с точки зрения вычислительной сложности/нагрузки.
В вариантах осуществления кодера, которые используют только предварительную интерполяцию значений под-пикселов, согласование блоков может выполняться как одноэтапный процесс, так как все значения под-пикселов опорного кадра, требуемые для определения вектора движения с желаемым под-пиксельным разрешением, предварительно вычисляются в блоке 730 и хранятся в кадровой памяти 740. Таким образом, они напрямую доступны для использования в процессе согласования блоков и могут быть извлечены, когда требуется, из кадровой памяти 740 блоком 760 оценки движения. Однако даже в случае, когда все значения под-пикселов доступны из кадровой памяти 740, все равно еще более эффективно для вычисления будет проводить согласование блоков в виде двухэтапного процесса, так как это требует меньше вычислений разностей. Следует понимать, что хотя полная предварительная интерполяция значений под-пикселов сокращает вычислительную сложность кодера, она не является наиболее эффективным подходом с точки зрения потребления памяти.
В вариантах осуществления кодера, в которых используются как предварительная интерполяция значений под-пикселов, так и интерполяция значений под-пикселов по запросу, блок 760 оценки движения реализован таким образом, чтобы он мог извлекать значения под-пикселов, вычисленные ранее в блоке 730 предварительной интерполяции значений под-пикселов и хранящиеся в кадровой памяти 740, и далее управлять блоком 750 интерполяции значений под-пикселов по запросу для вычисления любых дополнительных значений под-пикселов, которые могут потребоваться. Процесс согласования блоков может выполняться как одноэтапный процесс или как двухэтапный процесс. Если используется двухэтапная реализация, то предварительно вычисленные значения под-пикселов, извлеченные из кадровой памяти 740, могут использоваться на первом этапе процесса, а второй этап может быть реализован так, чтобы использовать значения под-пикселов, вычисленные блоком 750 интерполяции значений под-пикселов по запросу. В этом случае может потребоваться множество раз вычислять определенные значения под-пикселов, используемые на втором этапе процесса согласования блоков, когда выполняются последовательные сравнения, но количество таких повторных вычислений значительно меньше, чем в случае, когда предварительная интерполяция значений под-пикселов не используется. Более того, потребление памяти сокращается по сравнению с вариантами осуществления, в которых используется только предварительная интерполяция значений под-пикселов.
Когда блок 760 оценки движения выработал вектор движения для рассматриваемого макроблока текущего кадра, он выдает вектор движения в блок 770 кодирования поля движения. Блок 770 кодирования поля движения затем аппроксимирует вектор движения, принятый от блока 760 оценки движения, с помощью модели движения. Модель движения в общем случае содержит набор основных функций. Конкретнее, блок 770 кодирования поля движения представляет вектор движения как набор значений коэффициентов (известных как коэффициенты движения), которые при умножении на базисные функции формируют аппроксимацию вектора движения. Коэффициенты 724 движения передаются от блока 770 кодирования поля движения в блок 780 предсказания с компенсацией движения. Блок 780 предсказания с компенсацией движения также принимает значения пикселов/под-пикселов наилучшим образом согласующейся тестовой области-кандидата опорного кадра, идентифицированной блоком 760 оценки движения. На фиг. 7 эти значения показаны как подлежащие передаче по линии 729 из блока 750 интерполяции под-пикселов по запросу. В альтернативных вариантах осуществления изобретения рассматриваемые значения пикселов подаются непосредственно из блока 760 оценки движения.
Используя аппроксимированное представление вектора движения, выработанного блоком 770 кодирования поля движения, и значения пикселов/под-пикселов наилучшим образом согласующейся тестовой области-кандидата, блок 780 предсказания с компенсацией движения вырабатывает макроблок предсказанных значений пикселов. Макроблок предсказанных значений пикселов представляет предсказание значений пикселов текущего макроблока, сгенерированное на основе интерполированного опорного кадра. Макроблок предсказанных значений пикселов подается на объединитель 716, где он вычитается из нового текущего кадра для выработки информации 723 об ошибке предсказания для макроблока, как описано выше.
Коэффициенты 724 движения, сформированные блоком кодирования поля движения, также подаютсят в блок 790 мультиплексирования/демультиплексирования, где они объединяются с информацией 723 об ошибке предсказания для рассматриваемого макроблока и возможной информацией управления от средства 720 управления, чтобы сформировать закодированный видеопоток 725 для передачи на принимающий терминал.
Теперь будет описана работа видеодекодера 800 в соответствии с изобретением. На фиг. 8 декодер 800 содержит блок 810 мультиплексирования/демультиплексирования, который принимает закодированный видеопоток 725 от кодера 700 и демультиплексирует его, обратный квантователь 820, блок 830 обратного ДКП, блок 840 предсказания с компенсацией движения, кадровую память 850, объединитель 860, средство 870 управления, выход 880, блок 845 предварительной интерполяции значений под-пикселов и блок 890 интерполяции значений под-пикселов по запросу, связанные с блоком 840 предсказания с компенсацией движения. На практике средством 870 управления декодера 800 и средством 720 управления кодера 700 может быть один и тот же процессор. Это может происходить, если кодер 700 и декодер 800 являются частью одного видеокодека.
Фиг. 8 показывает вариант осуществления, в котором в декодере используется сочетание предварительной интерполяции значений под-пикселов и интерполяции значений под-пикселов по запросу. В других вариантах осуществления используется только предварительная интерполяция значений под-пикселов, в каковом случае декодер 800 не включает в себя блок 890 интерполяции значений под-пикселов по запросу. В предпочтительном варианте осуществления изобретения в декодере не используется предварительная интерполяция значений под-пикселов, а следовательно, блок 845 предварительной интерполяции значений под-пикселов исключается из архитектуры декодера. Если выполняется как предварительная интерполяция значений под-пикселов, так и интерполяция значений под-пикселов по запросу, декодер содержит как блок 845, так и блок 890.
Средство 870 управления управляет работой декодера 800 в ответ на то, декодируется ли INTRA-кадр или INTER-кадр. Сигнал управления переключением INTRA/INTER, который предписывает декодеру переключаться между режимами декодирования, получают, например, на основе информации о типе изображения, обеспеченной в части заголовка каждого сжатого видеокадра, принятого от кодера. Сигнал управления переключением INTRA/INTER подается на средство 870 управления по линии 815 управления вместе с другими сигналами управления видеокодека, демультиплексированными из кодированного видеопотока 725 блоком 890 мультиплексирования/демультиплексирования.
Когда декодируется INTRA-кадр, кодированный видеопоток 725 демультиплексируется в INTRA-закодированные макроблоки и информацию управления. В кодированный видеопоток 725 для INTRA-закодированного кадра вектора движения не включаются. Процесс декодирования выполняется макроблок за макроблоком. Когда закодированная информация 723 для макроблока выделяется из видеопотока 725 блоком 810 мультиплексирования/демультиплексирования, она подается на обратный квантователь 820. Средство управления управляет обратным квантователем 820 для применения подходящего уровня обратного квантования для макроблока закодированной информации, соответствии с информацией управления, обеспеченной в видеопотоке 725. Обратно квантованный макроблок затем подвергается обратному преобразованию в блоке 830 обратного ДКП для формирования декодированного блока информации изображения. Средство 870 управления управляет объединителем 860 для предотвращения использования какой-либо опорной информации при декодировании INTRA-закодированного макроблока. Декодированный блок информации изображения подается на видеовыход 880 декодера.
В вариантах осуществления декодера, которые используют предварительную интерполяцию значений под-пикселов, декодированный блок информации изображения (то есть значений пикселов), получаемый в результате операций обратного квантования и обратного преобразования, выполняемых в блоках 820 и 830, подается в блок 845 предварительной интерполяции значений под-пикселов. Здесь интерполяция значений под-пикселов выполняется в соответствии со способом, соответствующим изобретению, причем степень примененной предварительной интерполяции значений под-пикселов определяется деталями реализации декодера. В вариантах осуществления изобретения, в которых не выполняется интерполяция значений под-пикселов по запросу, блок 845 предварительной интерполяции значений под-пикселов интерполирует все значения под-пикселов. В вариантах осуществления, которые используют сочетание предварительной интерполяции значений под-пикселов и интерполяции значений под-пикселов по запросу, блок 845 предварительной интерполяции значений под-пикселов интерполирует определенное подмножество значений под-пикселов. Оно может содержать, например, все под-пикселы в местоположениях половины пиксела, или сочетания под-пикселов в местоположениях половины пиксела или четверти пиксела. В любом случае, после предварительной интерполяции значений под-пикселов интерполированные значения под-пикселов сохраняются в кадровой памяти 850 вместе с исходными декодированными значениями пикселов. По мере того как последующие макроблоки декодируются, предварительно интерполируются и сохраняются, декодированный кадр, по меньшей мере частично интерполированный до под-пиксельного разрешения, постепенно упорядочивается в кадровой памяти 850 и становится доступным для использования в качестве опорного кадра для предсказания с компенсацией движения.
В вариантах осуществления декодера, которые не используют предварительную интерполяцию значений под-пикселов, декодированный блок информации изображения (то есть значения пикселов), получаемый в результате операций обратного квантования и обратного преобразования, выполняемых в блоках 820 и 830, подается напрямую в кадровую память 850. По мере того как последующие макроблоки декодируются и сохраняются, декодированный кадр, имеющий разрешение в целый пиксел, постепенно упорядочивается в кадровой памяти 850 и становится доступным для использования в качестве опорного кадра для предсказания с компенсацией движения.
Когда декодируется INTER-кадр, кодированный видеопоток 725 демультиплексируется в закодированную информацию 723 об ошибке предсказания для каждого макроблока в кадре, ассоциированные коэффициенты 724 движения и информацию управления. Опять-таки, процесс декодирования выполняется макроблок за макроблоком. Когда закодированная информация 723 об ошибке предсказания для макроблока выделяется из видеопотока 725 блоком 810 мультиплексирования/демультиплексирования, она подается на обратный квантователь 820. Средство 870 управления управляет обратным квантователем 820 для применения подходящего уровня обратного квантования для макроблока закодированной информации об ошибке предсказания в соответствии с информацией управления, принятой в видеопотоке 725. Макроблок информации об ошибке предсказания, прошедший обратное квантование, затем обратно преобразуется в блоке 830 обратного ДКП для получения декодированной информации об ошибке предсказания для макроблока.
Коэффициенты 724 движения, связанные с рассматриваемым макроблоком, выделяются из видеопотока 725 блоком 810 мультиплексирования/демультиплексирования и подаются в блок 840 предсказания с компенсацией движения, который восстанавливает вектор движения для макроблока с использованием той же модели движения, которая применяется для кодирования INTER-закодированного макроблока в кодере 700. Восстановленный вектор движения аппроксимирует вектор движения, исходно определенный блоком 760 оценки движения кодера. Блок 840 предсказания с компенсацией движения декодера использует восстановленный вектор движения для идентификации положения блока значений пикселов/под-пикселов в опорном кадре предсказания, хранящемся в кадровой памяти 850. Опорным кадром может быть, например, ранее декодированный INTRA-кадр, или ранее декодированный INTER-кадр. В любом случае блок значений пикселов/под-пикселов, показанный восстановленным вектором движения, представляет предсказание для рассматриваемого макроблока.
Восстановленный вектор движения может указывать на любой пиксел или под-пиксел. Если вектор движения показывает, что предсказание для текущего макроблока сформировано на основе значений пикселов (то есть значений пикселов в целых местоположениях пикселов), то они могут быть легко извлечены из кадровой памяти 850, т.к. рассматриваемые значения получают непосредственно во время декодирования каждого кадра. Если вектор движения показывает, что предсказание для текущего макроблока сформировано на основе значений под-пикселов, то они должны быть либо извлечены из кадровой памяти 850, либо вычислены в блоке 890 интерполяции под-пикселов по запросу. Должны ли значения под-пикселов вычисляться, или они могут быть просто извлечены из кадровой памяти, зависит от степени интерполяции значений под-пикселов по запросу, использованной в декодере.
В вариантах осуществления декодера, которые не используют предварительную интерполяцию значений под-пикселов, все требуемые значения под-пикселов вычисляются в блоке 890 интерполяции под-пикселов по запросу. С другой стороны, в вариантах осуществления, в которых все значения под-пикселов интерполированы предварительно, блок 840 предсказания с компенсацией движения может извлекать требуемые значения под-пикселов непосредственно из кадровой памяти 850. В вариантах осуществления, которые используют сочетание предварительной интерполяции значений под-пикселов и интерполяции значений под-пикселов по запросу, действие, требуемое для получения требуемых значений под-пикселов, зависит от того, какие значения под-пикселов были интерполированы предварительно. Рассматривая в качестве примера вариант осуществления, в котором все значения под-пикселов в местоположениях половины пиксела вычислены предварительно, очевидно, что если восстановленный вектор движения для макроблока указывает на пиксел в целом местоположении или на под-пиксел в местоположении половины пиксела, то все значения пикселов и под-пикселов, требуемые для формирования предсказания для макроблока, уже имеются в кадровой памяти 850 и могут быть извлечены оттуда блоком 840 предсказания с компенсацией движения. Однако, если вектор движения указывает на под-пиксел в местоположении четверти пиксела, то под-пикселы, требуемые для формирования предсказания для макроблока, отсутствуют в кадровой памяти 850 и, следовательно, вычисляются в блоке 890 интерполяции значений под-пикселов по запросу. В этом случае блок 890 интерполяции значений под-пикселов по запросу извлекает любой пиксел или под-пиксел, требуемый для выполнения интерполяции, из кадровой памяти 850 и применяет способ интерполяции, описанный ниже. Значения под-пикселов, вычисленные в блоке 890 интерполяции значений под-пикселов по запросу, подаются в блок 840 предсказания с компенсацией движения.
Когда предсказание для макроблока получено, это предсказание (то есть макроблок из предсказанных значений пикселов) подается из блока 840 предсказания с компенсацией движения в объединитель 860, где оно объединяется с декодированной информацией об ошибке предсказания для макроблока, чтобы сформировать восстановленный блок изображения, который, в свою очередь, подается на видеовыход 880 декодера.
Следует понимать, что в практических реализациях кодера 700 и декодера 800 предел, до которого кадры предварительно интерполируются до под-пикселов, и, таким образом, объем проводимой интерполяции значений под-пикселов по запросу может выбираться в соответствии с (либо диктоваться) аппаратной реализацией видеокодера 700 или окружением, в котором предполагается его использовать. Например, если память, доступная видеокодеру, ограничена, либо память должна резервироваться для других функций, целесообразно ограничить объем проводимой предварительной интерполяции значений под-пикселов. В других случаях, когда микропроцессор, выполняющий операцию кодирования видеоданных, имеет ограниченную производительность обработки, - например, количество операций в секунду, которое может быть выполнено, сравнительно невелико, - более целесообразным будет ограничить объем проводимой интерполяции значений под-пикселов по запросу. В контексте мобильной связи, например, когда функция кодирования и декодирования видеоданных встроена в мобильный телефон или аналогичный беспроводной терминал для связи с сетью мобильной связи, и память и вычислительная мощность процессора могут быть ограничены. В этом случае сочетание предварительной интерполяции значений под-пикселов и интерполяции значений под-пикселов по запросу может быть наилучшим выбором для получения эффективной реализации в видеокодере. В видеодекодере 800 использование предварительной интерполяции значений под-пикселов обычно не является предпочтительным, поскольку оно обычно приводит к вычислению множества значений под-пикселов, которые в действительности не используются в процессе декодирования. Однако следует понимать, что хотя в кодере и декодере для оптимизации работы каждого из них могут быть использованы различные объемы предварительной интерполяции значений под-пикселов и интерполяции значений под-пикселов по запросу, и кодер и декодер могут быть выполнены так, чтобы использовать одно и то же разделение между предварительной интерполяцией значений под-пикселов и интерполяцией значений под-пикселов по запросу.
Хотя приведенное выше описание не описывает построения двунаправленно предсказанных кадров (В-кадров) в кодере 700 и декодере 800, следует понимать, что такая возможность может быть обеспечена в вариантах осуществления изобретения. Считается, что обеспечение такой возможности относится к квалификации специалиста в данной области техники.
Кодер 700 или декодер 800, соответствующие изобретению, могут быть реализованы с использованием аппаратного или программного обеспечения, или с использованием их комбинации. Кодер или декодер, реализованные в программном обеспечении, могут быть, например, отдельной программой или программным составляющим блоком программы, который может использоваться различными программами. В вышеприведенном описании и на чертежах функциональные блоки представлены как отдельные модули, но функции этих блоков могут быть реализованы, например, в одном программном модуле.
Кроме того, кодер 700 и декодер 800 могут быть объединены для формирования видеокодека, имеющего функцию как кодирования, так и декодирования. В дополнение к тому, что такой кодек может быть реализован в мультимедийном терминале, он может также быть реализован в сети. Кодек в соответствии с изобретением может быть компьютерной программой или элементом компьютерной программы, или он может быть реализован по меньшей мере частично с использованием аппаратного обеспечения.
Теперь будет подробно описан способ интерполяции под-пикселов, используемый в кодере 700 и декодере 800 в соответствии с изобретением. Способ будет сначала введен на общем концептуальном уровне, а затем будут описаны два предпочтительных варианта осуществления. В первом предпочтительном варианте осуществления интерполяция значений под-пикселов проводится до разрешения в 1/4 пиксела, а во втором варианте осуществления способ расширен до разрешения в 1/8 пиксела.
Следует отметить, что интерполяция должна вырабатывать одинаковые значения в кодере и декодере, но ее реализация должна быть оптимизирована для обоих объектов по отдельности. Например, в кодере в соответствии с первым вариантом осуществления изобретения, в котором интерполяция значений под-пикселов выполняется до разрешения в 1/4 пиксела, наиболее эффективно предварительно вычислять пикселы разрешения 1/2 и вычислять значения под-пикселов разрешения 1/4 в режиме “по-запросу”, только когда они необходимы в процессе оценки движения. Это проявляется в виде ограничения использования памяти при сохранении вычислительной сложности/нагрузки на приемлемом уровне. В декодере, с другой стороны, предпочтительно не вычислять заранее никаких под-пикселов. Следовательно, нужно отметить, что предпочтительный вариант осуществления декодера не включает в себя блок 845 предварительной интерполяции значений под-пикселов, и вся интерполяция значений под-пиксела выполняется в блоке 880 интерполяции значений под-пикселов по запросу.
В описании способа интерполяции, приведенном ниже, ссылки делаются на положения пикселов, показанные на фиг. 14а. На этом чертеже пикселы, обозначенные позицией А, представляют исходные пикселы (то есть пикселы, находящиеся в целых горизонтальных и вертикальных местоположениях). Пикселы, обозначенные другими буквами, представляют под-пикселы, подлежащие интерполяции. Следующее ниже описание придерживается введенных ранее соглашений относительно описания местоположений пикселов и под-пикселов.
Далее описываются операции, требуемые для интерполяции всех значений под-пикселов.
Значения под-пикселов разрешения 1/2, обозначенных b, получают сначала путем вычисления промежуточного значения b с использованием фильтра K-го порядка в соответствии со следующим уравнением:
Figure 00000010
где xi является вектором коэффициентов фильтра, Ai является соответствующим вектором исходных значений А пикселов, расположенных в целых горизонтальных и целых вертикальных местоположениях, а K является целым числом, определяющим порядок фильтра. Таким образом, уравнение 9 может быть по-другому выражено следующим образом:
b=x1 A1 + x2 A2 + x3 A3 + … + xK-1 AK-1 + xK AK (10)
Значения коэффициентов xi фильтра и порядок K фильтра могут меняться от варианта осуществления к варианту осуществления. Аналогично, разные значения коэффициентов могут быть использованы при вычислении разных под-пикселов в пределах одного варианта осуществления. В других вариантах осуществления значения коэффициентов xi фильтра и порядок фильтра могут зависеть от того, какие из под-пикселов b разрешения 1/2 интерполируются. Пикселы Ai расположены симметрично по отношению к интерполируемому под-пикселу b разрешения 1/2 и являются ближайшими соседями этого под-пиксела. В случае, когда под-пиксел b разрешения 1/2 расположен в полуцелом горизонтальном и целом вертикальном местоположении, пикселы Ai расположены горизонтально по отношению к b (как показано на фиг. 14b). Если интерполируется под-пиксел b разрешения 1/2, расположенный в целом горизонтальном и полуцелом вертикальном местоположении, то пикселы Ai расположены вертикально по отношению к b (как показано на фиг. 14с).
Конечное значение под-пиксела b разрешения 1/2 вычисляется путем деления промежуточного значения b на константу scale1, усекая его с целью получения целого числа и ограничивая результат, чтобы он лежал в диапазоне [0, 2 n -1]. В альтернативных вариантах осуществления изобретения вместо усечения может выполняться округление. Предпочтительно константа scale1 выбирается так, чтобы быть равной сумме коэффициентов xi фильтра.
Значение под-пиксела разрешения 1/2, обозначенного с, также получают сначала путем вычисления промежуточного значения с с использованием фильтра М-го порядка в соответствии со следующим уравнением:
Figure 00000011
где yi является вектором коэффициентов фильтра, b i является соответствующим вектором промежуточных значений bi в горизонтальном и вертикальном направлениях, то есть:
с=y1 b 1 + y2 b 2 + y3 b 3 + … + yM-1 b M-1 + yM b M (12)
Значения коэффициентов yi фильтра и порядка M фильтра могут меняться от варианта осуществления к варианту осуществления. Аналогично, разные значения коэффициентов могут быть использованы при вычислении разных под-пикселов в пределах одного варианта осуществления. Предпочтительно значения b являются промежуточными значениями для под-пикселов b разрешения 1/2, которые расположены симметрично по отношению к под-пикселу с разрешения 1/2 и к ближайшим соседям под-пиксела с. В варианте осуществления изобретения под-пикселы b разрешения 1/2 расположены горизонтально по отношению к под-пикселу с, а в альтернативном варианте осуществления они расположены вертикально по отношению к под-пикселу с.
Конечное значение под-пиксела с разрешения 1/2 вычисляется путем деления промежуточного значения с на константу scale2, усекая его с целью получения целого числа и ограничивая результат, чтобы он лежал в диапазоне [0, 2 n -1]. В альтернативных вариантах осуществления изобретения вместо усечения может выполняться округление. Предпочтительно константа scale2 выбирается равной scale1 × scale1.
Следует отметить, что использование промежуточных значений b в горизонтальном направлении приводит к тому же результату, что и использование промежуточных значений b в вертикальном направлении.
Существуют две альтернативы для интерполяции значений под-пикселов разрешения 1/4, обозначенных h. Обе они включают в себя линейную интерполяцию по диагональной линии, связывающей под-пикселы разрешения 1/2, находящиеся по соседству с интерполируемым под-пикселом h разрешения 1/4. В первом варианте осуществления значение под-пиксела h вычисляется усреднением значения двух под-пикселов b разрешения 1/2, ближайших к под-пикселу h. Во втором варианте осуществления значение под-пиксела h вычисляется усреднением значений ближайшего пиксела А и ближайшего под-пиксела с разрешения 1/2. Следует понимать, что это обеспечивает возможность использования различных сочетаний диагональных интерполяций для определения значений под-пикселов h в пределах различных групп из четырех пикселов А изображения. Однако следует также осознавать, что аналогичное сочетание должно быть использовано как в кодере, так и в декодере для получения одинаковых значений интерполяции. Фиг. 15 показывает 4 возможных варианта выбора диагональной интерполяции для под-пикселов h в соседних группах из 4 пикселов внутри изображения. Моделирование в среде ОМ подтвердило, что оба варианта осуществления приводят к одинаковой эффективности сжатия. Второй вариант осуществления имеет более высокую сложность, поскольку вычисление под-пиксела с требует вычисления нескольких промежуточных значений. Следовательно, предпочтителен первый вариант осуществления.
Значения для под-пикселов разрешения 1/4, обозначенных d и g, вычисляются из значений их ближайших соседей по горизонтали с использованием линейной интерполяции. Другими словами, значение для под-пиксела d разрешения 1/4 получают усреднением значений его ближайших соседей по горизонтали - пиксела А исходного изображения и под-пиксела b разрешения 1/2. Аналогично, значение для под-пиксела g разрешения 1/4 получают усреднением значений его двух ближайших соседей по горизонтали - под-пикселов b и с разрешения 1/2.
Значения для под-пикселов разрешения 1/4, обозначенных e, f и i, вычисляются из значений их ближайших соседей по вертикали с использованием линейной интерполяции. Конкретнее, значение для под-пиксела е разрешения 1/4 получают усреднением значений его двух ближайших соседей по вертикали - пиксела А исходного изображения и под-пиксела b разрешения 1/2. Аналогично, значение для под-пиксела f разрешения 1/4 получают усреднением значений его двух ближайших соседей по вертикали - под-пикселов b и с разрешения 1/2. В варианте осуществления изобретения значение для под-пиксела i разрешения 1/4 получают тем же образом, который только что был описан по отношению к под-пикселу f разрешения 1/4. Однако в альтернативном варианте осуществления изобретения, и перекликаясь с ранее описанными Н.26 опытными моделями ОМ5 и ОМ6, под-пиксел i разрешения 1/4 определяется с использованием значений четырех ближайших пикселов исходного изображения в соответствии с формулой (А1234+2)/4.
Также следует отметить, что во всех случаях, где используется усреднение с использованием значений пикселов и/или под-пикселов, усредненное значение может быть сформировано любым подходящим образом. Например, значение для под-пиксела d разрешения 1/4 может быть определено как d=(A+b)/2 или как d=(A+b+1)/2. Результатом прибавления 1 к сумме значений для пиксела А и под-пиксела b разрешения 1/2 является то, что любая операция округления или усечения, применяется впоследствии, округляет или усекает значение для d до следующего наибольшего целого значения. Это верно для любой суммы целых значений и может быть применено к любой из усредняющих операций, выполняемых в соответствии со способом по изобретению для управления результатами округления или усечения.
Следует отметить, что способ интерполяции значений под-пикселов в соответствии с изобретением обеспечивает преимущества по сравнению с каждой из моделей ОМ5 и ОМ6.
По сравнению с ОМ5, в которой значения некоторых под-пикселов разрешения 1/4 зависят от ранее интерполированных значений, полученных для других под-пикселов разрешения 1/4, в способе в соответствии с изобретением все под-пикселы разрешения 1/4 вычисляются из местоположений пикселов исходного изображения или под-пикселов разрешения 1/2 с использованием линейной интерполяции. Таким образом, уменьшение точности значений под-пикселов разрешения 1/4, которое имеет место в ОМ5 из-за промежуточного усечения и ограничения других под-пикселов разрешения 1/4, из которых они вычисляются, отсутствует в способе, соответствующем настоящему изобретению. В частности, на фиг. 14а под-пикселы h разрешения 1/4 (и под-пикселы i в одном варианте осуществления изобретения) интерполируются диагонально, чтобы сократить зависимость от других под-пикселов разрешения 1/4. Более того, в соответствии со способом по изобретению количество вычислений (а следовательно, и количество циклов работы процессора), требуемых для получения значения для этих под-пикселов разрешения 1/4 в декодере, сокращается по сравнению с ОМ5. Кроме того, вычисление любого значения под-пиксела разрешения 1/4 требует такого количества вычислений, которое практически одинаково с количеством вычислений, требуемых для определения любого другого значения под-пиксела разрешения 1/4. Конкретнее, в ситуации, где требуемые значения под-пикселов разрешения 1/2 уже доступны, к примеру, вычислены предварительно, количество вычислений, требуемых для интерполяции значения под-пиксела разрешения 1/4 из ранее вычисленного значения под-пиксела разрешения 1/2 аналогично количеству вычислений, требуемых для вычисления любого другого значения под-пиксела разрешения 1/4 из доступных значений под-пикселов разрешения 1/2.
По сравнению с ОМ6 способ в соответствии с изобретением не требует использования высокоточных расчетов при вычислении всех под-пикселов. Конкретнее, поскольку все значения под-пикселов разрешения 1/4 вычисляются из пикселов исходного изображения или значений под-пикселов разрешения 1/2 с использованием линейной интерполяции, для такой интерполяции могут быть использованы менее точные расчеты. Следовательно, в аппаратных реализациях способа, соответствующего изобретению, например, в специализированной ИС (ASIC), использование менее точных расчетов сокращает количество компонентов (например, шлюзов), которые должны быть предназначены для вычисления значений под-пикселов разрешения 1/4. Это, в свою очередь, сокращает общую площадь кремния, который должен быть выделен для функции интерполяции. Поскольку большинство под-пикселов в действительности являются под-пикселами разрешения 1/4 (12 из 15 под-пикселов, показанных на фиг 14а), преимущество, обеспечиваемое изобретением в этом отношении, особенно важно. В программных реализациях, где интерполяция под-пикселов проводится с использованием стандартного набора команд центрального процессора (ЦП, CPU) общего назначения или с использованием цифрового процессора сигналов (ЦПС, DSP), уменьшение точности требуемых расчетов обычно ведет к увеличению скорости, с которой могут проводиться вычисления. Это является существенным преимуществом в реализациях с низкой стоимостью, в которых предпочтительно использовать ЦП общего назначения, а не какую-либо форму ASIC.
Способ в соответствии с изобретением обеспечивает дальнейшие преимущества по сравнению с ОМ5. Как упомянуто ранее, в декодере только 1 из 15 местоположений под-пикселов требуется в любое заданное время, а именно то, которое указывает принятая информация о векторе движения. Следовательно, предпочтительно, если значение под-пиксела в любом местоположении под-пиксела можно вычислить с минимальным количеством этапов, результатом чего является корректно интерполированное значение. Способ, соответствующий изобретению, обеспечивает эту возможность. Как упомянуто ранее в подробном описании, под-пиксел с разрешения 1/2 может интерполироваться путем фильтрации либо в вертикальном, либо в горизонтальном направлении, причем может использоваться одно и то же значение, полученное для с независимо от того, используется ли горизонтальная или вертикальная фильтрация. Таким образом, декодер может использовать преимущество такого свойства при вычислении значений для под-пикселов f и g разрешения 1/4 таким образом, чтобы минимизировать количество операций, требуемых для получения нужных значений. Например, если декодеру требуется значение под-пиксела f разрешения 1/4, то под-пиксел с разрешения 1/2 должен интерполироваться в вертикальном направлении. Если требуется значение для под-пиксела g разрешения 1/4, то предпочтительно интерполировать значение для с в горизонтальном направлении. Таким образом, в общем случае можно сказать, что способ в соответствии с изобретением обеспечивает гибкость в том, каким образом получают значения для определенных под-пикселов разрешения 1/4. В ОМ5 такая гибкость не обеспечена.
Теперь будут подробно описаны два конкретных варианта осуществления. Первый вариант осуществления представляет собой предпочтительный вариант осуществления для вычисления под-пикселов при разрешении до 1/4 пиксела, тогда как во втором варианте осуществления способа в соответствии с изобретением применение способа расширено для вычислений значений под-пикселов с разрешением до 1/8 пиксела. Для обоих вариантов осуществления предусмотрено сравнение между вычислительной сложностью/нагрузкой вследствие использования способа в соответствии с изобретением, и той сложностью, которая имела бы место при использовании способов интерполяции в соответствии с ОМ5 и ОМ6 при одних и тех же условиях.
Предпочтительный вариант осуществления для интерполяции под-пикселов при разрешении в 1/4 пиксела будет описан со ссылками на фиг 14а, 14b и 14с. Далее предполагается, что все пикселы изображения и конечные интерполированные пикселы представлены 8 битами.
Вычисление под-пикселов разрешения 1/2 в i) полуцелом горизонтальном и целом вертикальном местоположениях и ii) в целом горизонтальном и полуцелом вертикальном местоположениях.
1. Значение для под-пиксела в полуцелом горизонтальном и целом вертикальном местоположениях, то есть под-пиксела b разрешения 1/2 на фиг. 14а, получают сначала путем вычисления промежуточного значения b, которое вычисляется в соответствии со следующей формулой b=(A1-5A2+20A3+20A4-5A5+A6) с использованием значений 6 пикселов (А16), которые расположены в целых горизонтальных и целых вертикальных местоположениях либо в строке, либо в столбце пикселов, содержащих b, и которые расположены симметрично вокруг b, как показано на фиг. 14b и 14с. Конечное значение для под-пиксела b разрешения 1/2 вычисляется как (b+16)/32, где оператор “/” обозначает деление с усечением. Результат ограничивают, чтобы попасть в диапазон [0, 255].
Вычисление под-пикселов разрешения 1/2 в полуцелом горизонтальном и полуцелом вертикальном местоположениях.
2. Значение для под-пиксела в полуцелом горизонтальном и полуцелом вертикальном местоположениях, т.е. под-пиксела с разрешения 1/2 на фиг. 14а, вычисляется в соответствии со следующей формулой: с=(b 1-5b 2+20b 3+20b 4-5b 5+b 6+512)/1024 с использованием промежуточных значений b для шести ближайших под-пикселов разрешения 1/2, которые расположены либо в строке, либо в столбце под-пикселов, содержащих с, и которые расположены симметрично вокруг с, как показано на фиг. 14b и 14с. Опять-таки, оператор “/” обозначает деление с усечением. Результат ограничивают, чтобы попасть в диапазон [0, 255]. Как объяснено ранее, использование промежуточных значений b для под-пикселов b разрешения 1/2 в горизонтальном направлении приводит к тому же результату, что и использование промежуточных значений b для под-пикселов b разрешения 1/2 в вертикальном направлении. Таким образом, в кодере в соответствии с изобретением направление для интерполяции под-пикселов b разрешения 1/2 может выбираться в соответствии с предпочтительным режимом реализации. В декодере в соответствии с изобретением выбирается такое направление для интерполяции под-пикселов b разрешения 1/2, в соответствии с которым под-пикселы разрешения 1/4, если они имеются, будут интерполироваться с использованием результатов, полученных для под-пиксела с разрешения 1/2.
Вычисление под-пикселов разрешения 1/4 в i) горизонтальных местоположениях четверть целого и целых вертикальных местоположениях, ii) горизонтальных местоположениях четверть целого и полуцелых вертикальных местоположениях, iii) целых горизонтальных местоположениях и вертикальных местоположениях четверть целого, iv) полуцелых горизонтальных местоположениях и вертикальных местоположениях четверть целого.
3. Значения для под-пикселов d разрешения 1/4, расположенных в горизонтальных местоположениях четверть целого и целых вертикальных местоположениях, вычисляются в соответствии со следующей формулой: d = (A+b)/2 с использованием ближайшего пиксела А исходного изображения и ближайшего под-пиксела b разрешения 1/2 в горизонтальном направлении. Аналогично, значения для под-пикселов g разрешения 1/4, расположенных в горизонтальных местоположениях четверть целого и полуцелых вертикальных местоположениях, вычисляются в соответствии со следующей формулой: g=(b+c)/2 с использованием двух ближайших под-пикселов разрешения 1/2 в горизонтальном направлении. Аналогичным образом значения для под-пикселов е разрешения 1/4, расположенных в целых горизонтальных местоположениях и вертикальных местоположениях четверть целого, вычисляются в соответствии со следующей формулой: е=(A+b)/2 с использованием ближайшего пиксела А исходного изображения и ближайшего под-пиксела b разрешения 1/2 в вертикальном направлении. Значения для под-пикселов f разрешения 1/4, расположенных в полуцелых горизонтальных местоположениях и вертикальных местоположениях четверть целого, вычисляются в соответствии со следующей формулой: f=(b+c)/2 с использованием двух ближайших под-пикселов разрешения 1/2 в вертикальном направлении. Во всех случаях оператор “/” обозначает деление с усечением.
Вычисление под-пикселов разрешения 1/4 в горизонтальных местоположениях четверть целого и вертикальных местоположениях четверть целого.
4. Значения для под-пикселов h разрешения 1/4, расположенных в горизонтальных местоположениях четверть целого и вертикальных местоположениях четверть целого, вычисляются в соответствии со следующей формулой: h=(b1+b2)/2 с использованием двух ближайших под-пикселов b разрешения 1/2 в диагональном направлении. Опять же, оператор “/” обозначает деление с усечением.
5. Значение для под-пиксела разрешения 1/4, обозначенного i, вычисляется в соответствии со следующей формулой: i=(A1+A2+A3+A4+2)/4 с использованием 4 ближайших исходных пикселов А. Опять же, оператор “/” обозначает деление с усечением.
Теперь будет представлен анализ вычислительной сложности первого предпочтительного варианта осуществления изобретения.
В кодере, вероятно, одинаковые значения под-пикселов будут вычисляться множество раз. Следовательно, как объяснено выше, сложность кодера может быть уменьшена путем предварительного вычисления всех значений под-пикселов и хранения их в памяти. Однако это решение во много раз увеличивает использование памяти. В предпочтительном варианте осуществления изобретения, в котором точность вектора движения имеет разрешение в 1/4 пиксела как в горизонтальном, так и в вертикальном направлениях, хранение заранее вычисленных значений под-пикселов для всего изображения требует в 16 раз больше памяти, чем требуется для хранения исходного не интерполированного изображения. Чтобы уменьшить использование памяти, все под-пикселы разрешения 1/2 могут интерполироваться предварительно, а под-пикселы разрешения 1/4 могут вычисляться по запросу, то есть только тогда, когда в этом есть необходимость. В соответствии со способом, соответствующим изобретению, интерполяция по запросу значений под-пикселов разрешения 1/4 требует только линейной интерполяции на основе под-пикселов разрешения 1/2. Потребуется в 4 раза больше памяти по сравнению с объемом памяти для исходного изображения для хранения заранее вычисленных под-пикселов разрешения 1/2, поскольку для их представления требуется только 8 битов.
Однако, если та же самая стратегия предварительного вычисления всех под-пикселов разрешения 1/2 с использованием предварительной интерполяции используется совместно со схемой прямой интерполяции по ОМ6, то требования к памяти вырастают в 9 раз по сравнению с тем, сколько памяти требуется для хранения исходного не интерполированного изображения. Это происходит из-за того, что для хранения высокоточных промежуточных значений, связанных с каждым под-пикселом разрешения 1/2 в ОМ6, требуется большее количество битов. Кроме того, сложность интерполяции под-пикселов во время оценки движения в ОМ6 выше, так как масштабирование и ограничение должны проводиться для каждого местоположения под-пиксела разрешения 1/2 и 1/4.
Ниже сложность способа интерполяции значений под-пикселов в соответствии с изобретением, примененным в видеодекодере, сравнивается со сложностью схем интерполяции, использованных в ОМ5 и ОМ6. В этом анализе предполагается, что в каждом способе интерполяция каждого значения под-пиксела проводится только с использованием минимального количества этапов, требуемых для получения корректно интерполированного значения. Далее предполагается, что каждый способ реализован основанным на блоках образом, то есть промежуточные значения, общие для всех под-пикселов, подлежащих интерполяции в конкретном блоке N × M, вычисляются только один раз. Приведенный в качестве иллюстрации пример показан на фиг. 16. На фиг. 16 можно видеть, что для вычисления блока 4×4 под-пикселов с разрешения 1/2 сначала вычисляется блок 9×4 под-пикселов b разрешения 1/2.
По сравнению со способом интерполяции значений под-пикселов, используемым в ОМ5, способ в соответствии с изобретением имеет меньшую вычислительную сложность по следующим причинам:
1. В отличие от схемы интерполяции значений под-пикселов, используемой в ОМ5, в соответствии со способом по изобретению значение под-пиксела с разрешения 1/2 может быть получено путем фильтрации либо в вертикальном, либо в горизонтальном направлении. Таким образом, для уменьшения количества операций под-пиксел с разрешения 1/2 может интерполироваться в вертикальном направлении, если требуется значение для под-пиксела f разрешения 1/4, и в горизонтальном направлении, если требуется значение для под-пиксела g разрешения 1/4. Например, фиг. 17 показывает все значения под-пикселов разрешения 1/2, которые должны быть вычислены для интерполяции значений для под-пикселов g разрешения 1/4 в блоке изображения, определенном 4 × 4 пикселами исходного изображения, с использованием способа интерполяции по ОМ5 (фиг. 17а) и с использованием способа по изобретению (фиг. 17b). В этом примере способ интерполяции значений под-пикселов в соответствии с ОМ5 требует, чтобы все 88 под-пикселов разрешения 1/2 были интерполированы, тогда как способ в соответствии с изобретением требует вычисления 72 под-пикселов разрешения 1/2. Как можно видеть на фиг. 17b, в соответствии с изобретением под-пикселы разрешения 1/2 интерполируются в горизонтальном направлении для уменьшения количества требуемых вычислений.
2. В соответствии со способом по изобретению под-пиксел h разрешения 1/4 вычисляется путем линейной интерполяции из двух его ближайших соседних под-пикселов разрешения 1/2 в диагональном направлении. Соответствующие количества под-пикселов разрешения 1/2, которые должны вычисляться для получения значений для под-пикселов h разрешения 1/4 внутри блока 4×4 пикселов исходного изображения с использованием способа интерполяции значений под-пикселов по ОМ5 и способа в соответствии с изобретением, показаны соответственно на фиг. 18(а) и 18(b). При использовании способа в соответствии с ОМ5 необходимо интерполировать всего 56 под-пикселов разрешения 1/2, тогда как в соответствии со способом по изобретению необходимо интерполировать 40 под-пикселов разрешения 1/2.
Таблица 1 обобщает сложности декодера трех способов интерполяции значений под-пикселов: способ в соответствии с ОМ5, способ прямой интерполяции, используемый в ОМ6, и способ в соответствии с изобретением. Сложность измерялась в терминах количества выполняемых операций 6-отводного фильтра и линейной интерполяции. Предполагается, что интерполяция под-пиксела i разрешения 1/4 вычисляется в соответствии со следующей формулой: i=(A1+A2+A3+A4+2)/4, которая является билинейной интерполяцией и эффективно содержит две операции линейной интерполяции. Операции, необходимые для интерполяции значений под-пикселов в одном блоке 4×4 пикселов исходного изображения, перечислены для каждого из 15 местоположений под-пикселов, которые, для удобства ссылки, пронумерованы в соответствии со схемой, показанной на фиг. 19. На фиг. 19 местоположением 1 является местоположение пиксела А исходного изображения, а местоположениями 2-16 являются местоположения под-пикселов. Положением 16 является положение под-пиксела i разрешения 1/4. Для вычисления среднего числа операций предполагается, что вероятность указания вектором движения на каждое местоположение под-пиксела одинакова. Средняя сложность, следовательно, является усредненным значением 15 сумм, вычисленных для каждого положения под-пиксела и одного положения полного пиксела.
Таблица 1
Сложность интерполяции под-пиксела разрешения 1/4 в ОМ5, ОМ6 и способе в соответствии с изобретением
ОМ5 ОМ6 Способ по изобретению
Местоположение Линейная 6-отвод. Линейная 6-отвод. Линейная 6-отвод.
1 0 0 0 0 0 0
3, 9 0 16 0 16 0 16
2, 4, 5, 13 16 16 0 16 16 16
11 0 52 0 52 0 52
7, 15 16 52 0 52 16 52
10, 12 16 68 0 52 16 52
6, 8, 14 48 68 0 52 16 32
16 32 0 32 0 32 0
Среднее 19 37 2 32 13 28,25
Из Таблицы 1 можно видеть, что способ в соответствии с изобретением требует меньше операций 6-отводного фильтра, чем способ интерполяции значений под-пикселов по ОМ6, и лишь несколько дополнительных операций линейной интерполяции. Поскольку операции 6-отводного фильтра существенно сложнее, чем операции линейной интерполяции, сложность двух способов одинакова. Способ интерполяции значений под-пикселов по ОМ5 имеет существенно большую сложность.
Теперь со ссылками на фиг 20, 21 и 22 будет описан предпочтительный вариант осуществления интерполяции под-пикселов с разрешением до 1/8 пиксела.
Фиг. 20 представляет номенклатуру, используемую для описания пикселов, под-пикселов разрешения 1/2, под-пикселов разрешения 1/4 и под-пикселов разрешения 1/8 в этом расширенном применении способа в соответствии с изобретением.
1. Значения для под-пикселов разрешения 1/2 и разрешения 1/4, обозначенные b1, b2 и b3 на фиг. 20, получают сначала вычислением промежуточных значений в соответствии со следующими формулами: b1=(-3A1+12A2-37A3+229A4+71А5-21А6+6А78); b2=(-3A1+12A2-39A3+158A4+158А5-39А6+12А7-3А8); и b3=(-A1+6A2-21A3+71A4+229А5-37А6+13А7-3А8), с использованием значений восьми ближайших пикселов (А18) изображения, расположенных в целых горизонтальных и целых вертикальных местоположениях либо в строке, либо в столбце, содержащих b1, b2 и b3, и расположенных симметрично вокруг под-пиксела b2 разрешения 1/2. Асимметрия в коэффициентах фильтра, используемых для получения промежуточных значений b 1 и b 3, отражает тот факт, что пикселы А18 расположены несимметрично по отношению к под-пикселам b1 и b3 разрешения 1/4. Конечные значения для под-пикселов bi, i=1,2,3, вычисляются в соответствии со следующей формулой: bi=(b i+128)/256, где оператор “/” обозначает деление с усечением. Результат усекается, чтобы попасть в диапазон [0, 255].
2. Значения для под-пикселов разрешения 1/2 и разрешения 1/4, обозначенные позициями cij, i, j=1, 2, 3, вычисляются в соответствии со следующими формулами:
Figure 00000012
,
Figure 00000013
,
Figure 00000014
,
с использованием промежуточных значений b 1 , b 2 и b 3 , вычисленных для восьми ближайших под-пикселов (b1j-b8j) в вертикальном направлении, причем под-пикселы bj расположены в столбце, содержащем под-пикселы cij разрешения 1/2 и разрешения 1/4, интерполированные и расположенные симметрично вокруг под-пиксела c2j разрешения 1/2. Асимметрия в коэффициентах фильтра, используемых для получения значений для под-пикселов c1j и c3j, отражает тот факт, что под-пикселы b1j-b8j расположены несимметрично по отношению к под-пикселам c1j и c3j разрешения 1/4. Опять же, оператор “/” обозначает деление с усечением. Перед тем как интерполированные значения для под-пикселов cij сохраняются в кадровой памяти, они ограничиваются, чтобы попасть в диапазон [0, 255]. В альтернативном варианте осуществления изобретения под-пикселы cij разрешения 1/2 и разрешения 1/4 вычисляются с использованием аналогичного способа с помощью промежуточных значений b 1 , b 2 и b 3 в горизонтальном направлении.
3. Значения для под-пикселов разрешения 1/8, обозначенных d, вычисляются с использованием линейной интерполяции из значений их ближайшего соседнего пиксела изображения, под-пикселов разрешения 1/2 или под-пикселов разрешения 1/4 в горизонтальном или вертикальном направлении. Например, верхний самый левый под-пиксел e разрешения 1/8 вычисляется в соответствии со следующей формулой: d=(A+b1+1)/2. Как и раньше, оператор “/” обозначает деление с усечением.
4. Значения для под-пикселов разрешения 1/8, обозначенных e и f, вычисляются с использованием линейной интерполяции из значений пикселов изображения, под-пикселов разрешения 1/2 или под-пикселов разрешения 1/4 в диагональном направлении. Например, на фиг. 20 верхний самый левый под-пиксел e разрешения 1/8 вычисляется в соответствии со следующей формулой: e = (b1+b1+1)/2. Диагональное направление, подлежащее использованию в интерполяции каждого под-пиксела разрешения 1/8 в первом предпочтительном варианте осуществления изобретения, который далее именуется как “предпочтительный способ 1”, показано на фиг 21(а). Значения для под-пикселов g разрешения 1/8, обозначенных g, вычисляются в соответствии со следующей формулой: g = (A+ 3c22+3)/4. Как всегда, оператор “/” обозначает деление с усечением. В альтернативном варианте осуществления изобретения, который далее именуется как “предпочтительный способ 2”, вычислительная сложность еще более сокращается путем интерполяции под-пикселов f разрешения 1/8 с использованием линейной интерполяции из под-пикселов b2 разрешения 1/2, то есть в соответствии со следующей формулой: f = (3b2+b2+2)/4. Под-пиксел b2, который находится ближе всего к f, умножается на 3. Схема диагональной интерполяции, использованная в этом альтернативном варианте осуществления изобретения, показана на фиг 21(b). В дальнейших альтернативных вариантах осуществления могут быть предусмотрены и другие схемы диагональной интерполяции.
Следует отметить, что все случаи, когда для определения под-пикселов разрешения 1/8 используется усредненное значение, включающее в себя значения пикселов и/или под-пикселов, это усредненное значение может быть сформировано любым подходящим образом. Результатом прибавления 1 к сумме значений, используемой при вычислении такого усредненного значения, является то, что применяется впоследствии любая операция округления или усечения, округляет или усекает рассматриваемое усредненное значение до следующего наибольшего целого значения. В альтернативных вариантах осуществления изобретения прибавление 1 не используется.
Как и в описанном выше случае интерполяции значений под-пикселов до разрешения в 1/4 пиксела, требования к памяти в кодере могут быть снижены путем предварительного вычисления только части значений под-пикселов, подлежащих интерполяции. В случае интерполяции значения под-пиксела до разрешения в 1/8 пиксела предпочтительно предварительно вычислить все под-пикселы разрешения 1/2 и разрешения 1/4 и вычислять значения для под-пикселов разрешения 1/8 в режиме “по запросу”, только когда это будет необходимо. Когда применяется этот подход, то и способ интерполяции в соответствии с ОМ5, и способ интерполяции в соответствии с изобретением требует в 16 раз больше памяти, чем требуется для хранения исходного изображения, чтобы хранить значения под-пикселов разрешения 1/2 и разрешения 1/4. Однако, если способ прямой интерполяции в соответствии с ОМ6 используется так же, то должны сохраняться промежуточные значения для под-пикселов разрешения 1/2 и разрешения 1/4. Эти промежуточные значения представлены с 32-битовой точностью и это приводит к требованию в 64 раза большей памяти, чем для исходного не интерполированного изображения.
Ниже сложность способа интерполяции значений под-пикселов в соответствии с изобретением при применении в видеодекодере для вычисления значений под-пикселов до разрешения в 1/8 пиксела сравнивается со сложностью схем интерполяции, использованных в ОМ5 и ОМ6. Как и в аналогичном анализе для интерполяции значения под-пиксела при разрешении в ј пиксела, описанном выше, предполагается, что в каждом способе интерполяция любого значения под-пиксела проводится только с использованием минимального количества операций, требуемых для получения корректно интерполированного значения. Далее предполагается, что каждый способ реализован основанным на блоках образом, то есть промежуточные значения, общие для всех под-пикселов, подлежащих интерполяции в конкретном блоке N×M, вычисляются только один раз.
Таблица 2 обобщает сложности трех способов интерполяции. Сложность измерялась в терминах количества выполняемых операций 8-отводного фильтра и линейной интерполяции, выполняемых в каждом способе. Таблица представляет количество операций, требуемых для интерполяции каждого из 63 под-пикселов разрешения 1/8 внутри одного блока 4×4 пикселов исходного изображения, причем каждое местоположение под-пиксела идентифицируется соответствующим номером, как показано на фиг. 22. На фиг. 22 местоположением 1 является местоположение пиксела исходного изображения, а местоположениями 2-64 являются местоположения под-пикселов. При вычислении среднего числа операций предполагается, что вероятность указания вектором движения на каждое местоположение под-пиксела одинакова. Средняя сложность, следовательно, является усредненным значением 63 сумм, вычисленных для каждого местоположения под-пиксела и одного местоположения полного пиксела.
Таблица 2
Сложность интерполяции под-пиксела разрешения 1/8 в ОМ5, ОМ6 и способе в соответствии с изобретением (результаты показаны отдельно для Предпочтительного способа 1 и Предпочтительного способа 2).
ОМ5 ОМ6 Предпочтит. способ 1 Предпочтит. способ 2
Местоположение линейная 8-отводн. линейная 8-отводн. линейная 8-отводн. линейная 8-отводн.
1 0 0 0 0 0 0 0 0
3, 5, 7, 17,
33, 49
0 16 0 16 0 16 0 16
19, 21, 23,
35, 37, 39,
51, 53, 55
0 60 0 60 0 60 0 60
2, 8, 9, 57 16 16 0 16 16 16 16 16
4, 6, 25, 41 16 32 0 16 16 32 16 32
10, 16, 58,
64
32 76 0 60 16 32 16 32
11, 13, 15, 16 60 0 60 16 60 16 60
59, 61, 63
18, 24, 34,
40, 50, 56
16 76 0 60 16 60 16 60
12, 14, 60,
62
32 120 0 60 16 32 16 32
26, 32, 42,
48
32 108 0 60 16 32 16 32
20, 22, 36,
38, 52, 54
16 120 0 60 16 76 16 76
27, 29, 31,
43, 45, 47
16 76 0 60 16 76 16 76
28, 30, 44,
46
32 152 0 60 16 60 16 60
Среднее 64 290,25 0 197,5 48 214,75 48 192,75
Как видно из Таблицы 2, количество операций 8-отводного фильтра, выполняемых в соответствии с предпочтительными способами 1 и 2, соответственно, на 26% и 34% меньше, чем количество операций 8-отводного фильтра, выполняемых в способе интерполяции значений под-пикселов по ОМ5. Количество линейных операций на 25% меньше, как в предпочтительном способе 1, так и предпочтительном способе 2, по сравнению с ОМ5, но это улучшение не так важно по сравнению с уменьшением количества операций 8-отводного фильтра. Можно видеть дальше, что способ прямой интерполяции, используемый в ОМ6, имеет сложность, сравнимую как с предпочтительным способом 1, так и с предпочтительным способом 2, когда используется для интерполяции значений для под-пикселов разрешения 1/8.
Из приведенного описания специалисту будет очевидно, что в рамках объема изобретения могут быть сделаны различные модификации. Хотя подробно описано несколько предпочтительных вариантов осуществления изобретения, следует понимать, что возможно также множество модификаций и изменений, все из которых лежат в рамках сущности и объема изобретения.

Claims (57)

1. Способ интерполяции изображения, содержащего пикселы, упорядоченные по строкам и столбцам и представленные значениями, имеющими заданный динамический диапазон, причем пикселы в строках и столбцах находятся в соответствующих целых горизонтальных и целых вертикальных местоположениях, для генерации значений под-пикселов, расположенных по меньшей мере в одном из дробного горизонтального и дробного вертикального местоположений, причем эти дробные горизонтальные и дробные вертикальные местоположения представляются математической формулой 1/2x, где х является положительным целым числом от 1 до N, 1/2x представляет конкретный уровень интерполяции под-пикселов, и N представляет максимальный уровень интерполяции под-пикселов, при этом способ содержит следующие этапы:
a) интерполяцию значений для под-пикселов, расположенных в горизонтальных местоположениях 1/2N-1 целого и целых вертикальных местоположениях, а также для под-пикселов, расположенных в целых горизонтальных местоположениях и вертикальных местоположениях 1/2N-1 целого, с помощью взвешенных сумм пикселов, находящихся в соответствующих целых горизонтальных и целых вертикальных местоположениях;
b) интерполяцию значения для под-пиксела, расположенного в горизонтальном местоположении 1/2N-1 целого и вертикальном местоположении 1/2N-1 целого, с помощью либо первой взвешенной суммы интерполированных значений для под-пикселов, находящихся в горизонтальных местоположениях 1/2N-1 целого и целых вертикальных местоположениях, либо второй взвешенной суммы интерполированных значений для под-пикселов, находящихся в целых горизонтальных местоположениях и вертикальных местоположениях 1/2N-1 целого, полученных на этапе (а); и
с) интерполяцию значения для под-пиксела, расположенного в горизонтальном местоположении 1/2N целого и вертикальном местоположении 1/2N целого, с помощью:
- либо средневзвешенной величины от значения первого под-пиксела, расположенного в горизонтальном местоположении 1/2N-m целого и вертикальном местоположении 1/2N-m целого, и значения второго под-пиксела, расположенного в горизонтальном местоположении 1/2N-p целого и вертикальном местоположении 1/2N-q целого,
- либо средневзвешенной величины от значения пиксела, расположенного в целом горизонтальном и целом вертикальном местоположении, и значения под-пиксела, расположенного в горизонтальном местоположении 1/2N-m целого и вертикальном местоположении 1/2N-n целого,
где переменные m, n, p, q являются целыми значениями в диапазоне от 1 до N, так что соответствующие первый и второй под-пикселы или соответствующие пиксел и под-пиксел расположены по диагонали по отношению к интерполируемому под-пикселу в горизонтальном местоположении 1/2N целого и вертикальном местоположении 1/2N целого.
2. Способ по п.1, в котором в средневзвешенной величине на этапе (с) используют первый и второй веса, относительные величины которых пропорциональны близости, по прямой диагонали, под-пиксела, находящегося в горизонтальном местоположении 1/2N целого и вертикальном местоположении 1/2N целого, к соответствующему первому и второму под-пикселу или соответствующему пикселу и под-пикселу, используемым на этапе (с).
3. Способ по п.2, в котором первый и второй веса имеют равные значения, когда соответствующие первый и второй под-пикселы или соответствующие пиксел и под-пиксел, используемые на этапе (с), расположены симметрично по отношению к интерполируемому под-пикселу, находящемуся в горизонтальном местоположении 1/2N целого и вертикальном местоположении 1/2N целого.
4. Способ по п.1, в котором первую взвешенную сумму значений для под-пикселов, находящихся в горизонтальных местоположениях 1/2N-1 целого и целых вертикальных местоположениях, используют на этапе (b), когда интерполируется значение под-пиксела в горизонтальном местоположении 1/2N-1 целого и вертикальном местоположении 1/2N целого.
5. Способ по п.1, в котором вторую взвешенную сумму значений для под-пикселов, находящихся в целых горизонтальных местоположениях и вертикальных местоположениях 1/2N-1 целого, используют на этапе (b), когда интерполируется значение под-пиксела в горизонтальном местоположении 1/2N целого и вертикальном местоположении 1/2N-1 целого.
6. Способ по п.1, содержащий интерполяцию значений для под-пикселов в горизонтальных местоположениях 1/2N целого и вертикальных местоположениях 1/2N целого путем усреднения значения пиксела, расположенного в целом горизонтальном местоположении и целом вертикальном местоположении, и значения под-пиксела, расположенного в горизонтальном местоположении 1/2N-1 целого и вертикальном местоположении 1/2N-1 целого.
7. Способ по п.1, содержащий интерполяцию значений для под-пикселов в горизонтальных местоположениях 1/2N целого и вертикальных местоположениях 1/2N целого путем усреднения значения под-пиксела, расположенного в горизонтальном местоположении 1/2N-1 целого и целом вертикальном местоположении, и значения под-пиксела, расположенного в целом горизонтальном местоположении и вертикальном местоположении 1/2N-1 целого.
8. Способ по п.1, содержащий интерполяцию значения по меньшей мере для одного заранее заданного под-пиксела в горизонтальных местоположениях 1/2N целого и вертикальных местоположениях 1/2N целого, в качестве исключения из этапа (с), указанного в п.1, путем усреднения значений множества пикселов, которые являются ближайшими соседними пикселами интерполируемого под-пиксела.
9. Способ по п.1, в котором N является одним из целых значений 2, 3 и 4.
10. Способ по п.1, в котором по меньшей мере на одном из этапов (а) и (b) интерполяция значения под-пиксела с помощью взвешенной суммы включает в себя вычисление промежуточного значения для значения под-пиксела, причем это промежуточное значение имеет больший динамический диапазон, чем упомянутый заданный динамический диапазон.
11. Способ по п.10, в котором промежуточное значение для под-пиксела, имеющего под-пиксельное разрешение 1/2N-1, используют для интерполяции значения для под-пиксела, имеющего под-пиксельное разрешение 1/2N-1.
12. Способ по п.1, в котором упомянутый заданный динамический диапазон пиксела или под-пиксела соответствует диапазону значений упомянутого пиксела или под-пиксела.
13. Способ по п.12, содержащий представление значения под-пиксела, интерполируемого на этапе (а), с помощью первого промежуточного значения, которое имеет динамический диапазон, равный заданному динамическому диапазону соответствующих пикселов, используемых во взвешенной сумме на этапе (а), умноженному на значение, равное сумме соответствующих весов, используемых во взвешенной сумме на этапе (а).
14. Способ по п.13, в котором динамический диапазон первого промежуточного значения определен суммой числа битов, используемых для представления соответствующих пикселов, используемых во взвешенной сумме на этапе (а), и числа битов, требуемых для представления суммы соответствующих весов, используемых во взвешенной сумме на этапе (а).
15. Способ по п.13, содержащий усечение первого промежуточного значения путем математического деления первого промежуточного значения на первый масштабный коэффициент, равный сумме соответствующих весов, используемых во взвешенной сумме на этапе (а), для формирования таким образом значения под-пиксела с динамическим диапазоном, равным заданному динамическому диапазону упомянутых пикселов.
16. Способ по п.13, содержащий использование первых промежуточных значений под-пикселов, вычисляемых на этапе (а), как интерполированных значений в соответствующих взвешенных суммах на этапе (b), и представление значения под-пиксела, интерполируемого па этапе (b), с помощью второго промежуточного значения, которое имеет динамический диапазон, равный динамическому диапазону соответствующих под-пикселов, используемых во взвешенной сумме на этапе (b), умноженному на значение, равное сумме соответствующих весов, используемых во взвешенной сумме на этапе (b).
17. Способ по п.16, содержащий усечение второго промежуточного значения путем математического деления второго промежуточного значения на второй масштабный коэффициент, равный сумме соответствующих весов, используемых во взвешенной сумме на этапе (а), умноженной на сумму соответствующих весов, используемых во взвешенной сумме на этапе (b), для формирования таким образом значения под-пиксела с динамическим диапазоном, равным заданному динамическому диапазону упомянутых пикселов.
18. Способ по п.13, содержащий использование усеченных первых промежуточных значений под-пикселов при интерполяции значения для под-пиксела, имеющего под-пиксельное разрешение 1/2N на этапе (с).
19. Способ по п.17, содержащий использование усеченных вторых промежуточных значений под-пикселов при интерполяции значения для под-пиксела, имеющего под-пиксельное разрешение 1/2N, на этапе (с).
20. Способ интерполяции изображения, содержащего пикселы, упорядоченные по строкам и столбцам и представленные значениями, имеющими заданный динамический диапазон, причем пикселы в строках и столбцах находятся в соответствующих целых горизонтальных и целых вертикальных местоположениях, для генерации значений под-пикселов, расположенных по меньшей мере в одном из дробных горизонтальных и дробных вертикальных местоположений, при этом способ содержит следующие этапы:
a) интерполяцию значений для под-пикселов, расположенных в полуцелых горизонтальных местоположениях и целых вертикальных местоположениях, а также для под-пикселов, расположенных в целых горизонтальных местоположениях и полуцелых вертикальных местоположениях с помощью взвешенных сумм пикселов, находящихся в соответствующих целых горизонтальных и целых вертикальных местоположениях;
b) интерполяцию значений под-пикселов, расположенных в полуцелых горизонтальных местоположениях и полуцелых вертикальных местоположениях, с помощью либо первой взвешенной суммы интерполированных значений для под-пикселов, находящихся в полуцелых горизонтальных местоположениях и целых вертикальных местоположениях, либо второй взвешенной суммы интерполированных значений для под-пикселов, находящихся в целых горизонтальных местоположениях и полуцелых вертикальных местоположениях, полученных на этапе (а); и
c) интерполяцию значений для под-пикселов, расположенных в горизонтальных местоположениях четверть целого и вертикальных местоположениях четверть целого, с помощью средневзвешенной величины по меньшей мере одной пары значений, при этом первая пара содержит значение под-пиксела, расположенного в полуцелом горизонтальном местоположении и целом вертикальном местоположении, и значение противоположного по диагонали под-пиксела, находящегося в целом горизонтальном местоположении и полуцелом вертикальном местоположении, а вторая пара содержит значение пиксела, находящегося в целом горизонтальном местоположении и целом вертикальном местоположении, и значение противоположного по диагонали под-пиксела, находящегося в полуцелом горизонтальном местоположении и полуцелом вертикальном местоположении, при этом первая и вторая пары образуют альтернативные диагонали по отношению к интерполируемому под-пикселу.
21. Способ интерполяции изображения, содержащего пикселы, упорядоченные по строкам и столбцам и представленные значениями, имеющими заданный динамический диапазон, причем пикселы в строках и столбцах находятся в соответствующих целых горизонтальных и целых вертикальных местоположениях, для генерации значений под-пикселов, расположенных по меньшей мере в одном из дробного горизонтального и дробного вертикального местоположений, причем эти дробные горизонтальные и вертикальные местоположения представляются математической формулой 1/2x, где х является положительным целым числом от 1 до N, 1/2х представляет конкретный уровень интерполяции под-пикселов и N представляет максимальный уровень интерполяции под-пикселов, при этом способ содержит следующие этапы:
a) интерполяцию значений для под-пикселов, расположенных в горизонтальных местоположениях 1/2N-1 целого и целых вертикальных местоположениях, а также для под-пикселов, расположенных в целых горизонтальных местоположениях и вертикальных местоположениях 1/2N-1 целого, с помощью взвешенных сумм пикселов, находящихся в соответствующих целых горизонтальных и целых вертикальных местоположениях; и
b) интерполяцию значения для под-пиксела, имеющего горизонтальное местоположение под-пиксела и вертикальное местоположение под-пиксела, с помощью либо первой взвешенной суммы интерполированных значений под-пикселов, расположенных в вертикальном местоположении, соответствующем вертикальному местоположению интерполируемого под-пиксела, либо второй взвешенной суммы интерполированных значений под-пикселов, расположенных в горизонтальном местоположении, соответствующем горизонтальному местоположению интерполируемого под-пиксела.
22. Способ по п.21, в котором под-пикселы, используемые в первой взвешенной сумме на этапе (b), являются под-пикселами, расположенными в горизонтальных местоположениях 1/2N-1 целого и целых вертикальных местоположениях, а первую взвешенную сумму используют для интерполяции значения для под-пиксела в горизонтальном местоположении 1/2N-1 целого и вертикальном местоположении 1/2N целого.
23. Способ по п.21, в котором под-пикселы, используемые во второй взвешенной сумме на этапе (b), являются под-пикселами, находящимися в целых горизонтальных местоположениях и вертикальных местоположениях 1/2N-1 целого, а вторую взвешенную сумму используют для интерполяции значения для под-пиксела в горизонтальном местоположении 1/2N целого и вертикальном местоположении 1/2N-1 целого.
24. Способ по п.21, содержащий интерполяцию значений для под-пикселов в горизонтальных местоположениях 1/2N целого и вертикальных местоположениях 1/2N целого путем усреднения по меньшей мере одной пары значений, где первая пара содержит значение под-пиксела, расположенного в горизонтальном местоположении 1/2N-1 целого и целом вертикальном местоположении, и значение под-пиксела, расположенного в целом горизонтальном местоположении и вертикальном местоположении 1/2N-1 целого, а вторая пара содержит значение пиксела, расположенного в целом горизонтальном и целом вертикальном местоположении, и значение под-пиксела, расположенного в горизонтальном местоположении 1/2N-1 целого и вертикальном местоположении 1/2N-1 целого.
25. Интерполятор для интерполирования изображения, содержащего пикселы, упорядоченные по строкам и столбцам и представленные значениями, имеющими заданный динамический диапазон, где пикселы в строках и столбцах находятся в соответствующих целых горизонтальных и целых вертикальных местоположениях, при этом интерполятор сконфигурирован для генерации значений для под-пикселов, расположенных по меньшей мере в одном из дробного горизонтального и дробного вертикального местоположений, причем дробные горизонтальные и дробные вертикальные местоположения представляются математической формулой 1/2х, где х является положительным целым числом от 1 до N, 1/2x представляет конкретный уровень интерполяции под-пикселов и N представляет максимальный уровень интерполяции под-пикселов, при этом интерполятор сконфигурирован для выполнения:
a) интерполяции значений для под-пикселов, расположенных в горизонтальных местоположениях 1/2N-1 целого, и для под-пикселов, расположенных в целых вертикальных местоположениях, а также в целых горизонтальных местоположениях и вертикальных местоположениях 1/2N-1 целого, с помощью взвешенных сумм пикселов, находящихся в соответствующих целых горизонтальных и целых вертикальных местоположениях;
b) интерполяции значений для под-пикселов, расположенных в горизонтальных местоположениях 1/2N-1 целого и вертикальных местоположениях 1/2N-1 целого, с помощью либо первой взвешенной суммы интерполированных значений для под-пикселов, находящихся в горизонтальных местоположениях 1/2N-1 целого и целых вертикальных местоположениях, либо второй взвешенной суммы интерполированных значений для под-пикселов, находящихся в целых горизонтальных местоположениях и вертикальных местоположениях 1/2N-1 целого, полученных на этапе (а); и
c) интерполяции значения для под-пиксела, расположенного в горизонтальном местоположении 1/2N целого и вертикальном местоположении 1/2N целого, с помощью:
- либо средневзвешенной величины от значения первого под-пиксела, расположенного в горизонтальном местоположении 1/2N-m целого и вертикальном местоположении 1/2N-n целого, и значения второго под-пиксела, расположенного в горизонтальном местоположении 1/2N-p целого и вертикальном местоположении 1/2N-q целого,
- либо средневзвешенной величины от значения пиксела, расположенного в целом горизонтальном и целом вертикальном местоположении, и значения под-пиксела, расположенного в горизонтальном местоположении 1/2N-m целого и вертикальном местоположении 1/2N-n целого,
где переменные m, n, p, q являются целыми значениями в диапазоне от 1 до N, так что соответствующие первый и второй под-пикселы или соответствующие пиксел и под-пиксел расположены по диагонали по отношению к интерполируемому под-пикселу в горизонтальном местоположении 1/2N целого и вертикальном местоположении 1/2N целого.
26. Интерполятор по п.25, который сконфигурирован для использования в средневзвешенной величине на этапе (с) первого и второго веса, относительные величины которых пропорциональны близости, по прямой диагонали, под-пиксела, находящегося в горизонтальном местоположении 1/2N целого и вертикальном местоположении 1/2N целого, к соответствующему первому и второму под-пикселу или соответствующему пикселу и под-пикселу, используемым на этапе (с).
27. Интерполятор по п.26, который конфигурирован для использования первого и второго веса с равными значениями, когда соответствующие первый и второй под-пикселы или соответствующие пиксел и под-пиксел, используемые на этапе (с), расположены симметрично по отношению к интерполируемому под-пикселу, находящемуся в горизонтальном местоположении 1/2N целого и вертикальном местоположении 1/2N целого.
28. Интерполятор по п.25, который сконфигурирован для использования на этапе (b) первой взвешенной суммы значений для под-пикселов, находящихся в горизонтальных местоположениях 1/2N-1 целого и целых вертикальных местоположениях, когда интерполируются значения для под-пикселов в горизонтальных местоположениях 1/2N-1 целого и вертикальных местоположениях 1/2N целого.
29. Интерполятор по п.25, который сконфигурирован для использования на этапе (b) второй взвешенной суммы значений для под-пикселов, находящихся в целых горизонтальных местоположениях и в вертикальных местоположениях 1/2N-1 целого, когда интерполируются значения для под-пикселов в горизонтальных местоположениях 1/2N целого и вертикальных местоположениях 1/2N-1 целого.
30. Интерполятор по п.25, который конфигурирован для интерполяции значений для под-пикселов в горизонтальных местоположениях 1/2N целого и вертикальных местоположениях 1/2N целого путем усреднения значения пиксела, расположенного в целом горизонтальном местоположении и целом вертикальном местоположении, и значения под-пиксела, расположенного в горизонтальном местоположении 1/2N-1 целого и вертикальном местоположении 1/2N-1 целого.
31. Интерполятор по п.25, который конфигурирован для интерполяции значений для под-пикселов в горизонтальных местоположениях 1/2N целого и вертикальных местоположениях 1/2N целого путем усреднения значения под-пиксела, расположенного в горизонтальном местоположении 1/2N-1 целого и целом вертикальном местоположении, и значения под-пиксела, расположенного в целом горизонтальном местоположении и вертикальном местоположении 1/2N-1 целого.
32. Интерполятор по п.25, который сконфигурирован для интерполяции значения по меньшей мере для одного заранее заданного под-пиксела в горизонтальном местоположении 1/2N целого и вертикальном местоположении 1/2N целого, в качестве исключения из этапа (с), указанного в п.25, путем усреднения значений множества пикселов, которые являются ближайшими соседними пикселами интерполируемого под-пиксела.
33. Интерполятор по п.25, в котором N является одним из целых значений 2, 3 и 4.
34. Интерполятор по п.25, в котором по меньшей мере на одном из этапов (а) и (b) интерполятор сконфигурирован для интерполяции значения под-пиксела с помощью взвешенной суммы, при этом интерполяция включает в себя вычисление промежуточного значения для значения под-пиксела, причем это промежуточное значение имеет больший динамический диапазон, чем упомянутый заданный динамический диапазон.
35. Интерполятор по п.34, который конфигурирован для использования промежуточного значения для под-пиксела, имеющего под-пиксельное разрешение 1/2N-1, для интерполяции значения для под-пиксела, имеющего под-пиксельное разрешение 1/2N.
36. Интерполятор по п.25, в котором упомянутый заданный динамический диапазон пиксела или под-пиксела соответствует диапазону значений, которые упомянутый пиксел или под-пиксел может принимать.
37. Интерполятор по п.36, который сконфигурирован для представления значения под-пиксела, интерполируемого на этапе (а), с помощью первого промежуточного значения, которое имеет динамический диапазон, равный заданному динамическому диапазону соответствующих пикселов, используемых во взвешенной сумме на этапе (а), умноженному на значение, равное сумме соответствующих весов, используемых во взвешенной сумме на этапе (а).
38. Интерполятор по п.37, в котором динамический диапазон первого промежуточного значения определен суммой числа битов, используемых для представления соответствующих пикселов, используемых во взвешенной сумме на этапе (а), и числа битов, требуемых для представления суммы соответствующих весов, используемых во взвешенной сумме на этапе (а).
39. Интерполятор по п.37, который конфигурирован для усечения первого промежуточного значения путем математического деления первого промежуточного значения на первый масштабный коэффициент, равный сумме соответствующих весов, используемых во взвешенной сумме на этапе (а), для формирования таким образом значения под-пиксела с динамическим диапазоном, равным заданному динамическому диапазону упомянутых пикселов.
40. Интерполятор по п.37, который конфигурирован для использования первых промежуточных значений под-пикселов, вычисляемых на этапе (а), как интерполированных значений в соответствующих взвешенных суммах на этапе (b), и для представления значения под-пиксела, интерполируемого на этапе (b), с помощью второго промежуточного значения, которое имеет динамический диапазон, равный динамическому диапазону соответствующих под-пикселов, используемых во взвешенной сумме на этапе (b), умноженному на значение, равное сумме соответствующих весов, используемых во взвешенной сумме на этапе (b).
41. Интерполятор по п.40, который конфигурирован для усечения второго промежуточного значения путем математического деления второго промежуточного значения на второй масштабный коэффициент, равный сумме соответствующих весов, используемых во взвешенной сумме на этапе (а), умноженной на сумму соответствующих весов, используемых во взвешенной сумме на этапе (b), для формирования таким образом значения под-пиксела с динамическим диапазоном, равным заданному динамическому диапазону упомянутых пикселов.
42. Интерполятор по п.37, который конфигурирован для использования усеченных первых промежуточных значений под-пикселов при интерполяции значения для под-пиксела, имеющего под-пиксельное разрешение 1/2N, на этапе (с).
43. Интерполятор по п.41, который конфигурирован для использования усеченных вторых промежуточных значений под-пикселов при интерполяции значения для под-пиксела, имеющего под-пиксельное разрешение 1/2N на этапе (с).
44. Кодер изображения, содержащий интерполятор по любому из пп.25-43.
45. Кодер изображения по п.44, являющийся видеокодером.
46. Кодер изображения по п.44, являющийся кодером неподвижного изображения.
47. Декодер изображения, содержащий интерполятор по любому из пп.25-43.
48. Декодер изображения по п.47, являющийся видеодекодером.
49. Декодер изображения по п.47, являющийся декодером неподвижного изображения.
50. Интерполятор для интерполирования изображения, содержащего пикселы, упорядоченные по строкам и столбцам и представленные значениями, имеющими заданный динамический диапазон, где пикселы в строках и столбцах находятся в соответствующих целых горизонтальных и целых вертикальных местоположениях, при этом интерполятор сконфигурирован для генерации значений для под-пикселов, расположенных по меньшей мере в одном из дробного горизонтального и дробного вертикального местоположений, причем дробные горизонтальные и дробные вертикальные местоположения представляются математической формулой 1/2х, где х является положительным целым числом от 1 до N, 1/2х представляет конкретный уровень интерполяции под-пикселов и N представляет максимальный уровень интерполяции под-пикселов, при этом интерполятор сконфигурирован для:
a) интерполяции значений для под-пикселов, расположенных в горизонтальных местоположениях 1/2N-1 целого и в целых вертикальных местоположениях, а также в целых горизонтальных местоположениях и вертикальных местоположениях 1/2N-1 целого, с помощью взвешенных сумм пикселов, находящихся в соответствующих целых горизонтальных и целых вертикальных местоположениях; и
b) интерполяции значения для под-пиксела, расположенного в горизонтальном местоположении под-пиксела и вертикальном местоположении под-пиксела, с помощью либо первой взвешенной суммы интерполированных значений под-пикселов, расположенных в вертикальном местоположении, соответствующем вертикальному местоположению интерполируемого под-пиксела, либо второй взвешенной суммы интерполированных значений под-пикселов, расположенных в горизонтальном местоположении, соответствующем горизонтальному местоположению интерполируемого под-пиксела.
51. Интерполятор по п.50, который сконфигурирован для формирования первой взвешенной суммы на этапе (b) с использованием значений под-пикселов, расположенных в горизонтальных местоположениях 1/2N-1 целого и целых вертикальных местоположениях, и для использования первой взвешенной суммы для интерполяции значения для под-пиксела в горизонтальном местоположении 1/2N-1 целого и вертикальном местоположении 1/2N целого.
52. Интерполятор по п.50, который сконфигурирован для формирования второй взвешенной суммы на этапе (b) с использованием значений под-пикселов, находящихся в целых горизонтальных местоположениях и вертикальных местоположениях 1/2N-1 целого, и для использования второй взвешенной суммы для интерполяции значения для под-пиксела в горизонтальном местоположении 1/2N целого и вертикальном местоположении 1/2N-1 целого.
53. Интерполятор по п.50, который конфигурирован для интерполяции значений для под-пикселов в горизонтальных местоположениях 1/2N целого и вертикальных местоположениях 1/2N целого путем усреднения по меньшей мере одной пары значений, где первая пара содержит значение под-пиксела, расположенного в горизонтальном местоположении 1/2N целого и целом вертикальном местоположении, и значение под-пиксела, расположенного в целом горизонтальном местоположении и вертикальном местоположении 1/2N-1 целого, а вторая пара содержит значение пиксела, расположенного в целом горизонтальном и целом вертикальном местоположении, и значение под-пиксела, расположенного в горизонтальном местоположении 1/2N-1 целого и вертикальном местоположении 1/2N-1 целого.
54. Видеокодер, содержащий интерполятор по любому из пп.50-53.
55. Видеодекодер, содержащий интерполятор по любому из пп.50-53.
56. Терминал связи, содержащий интерполятор по любому из пп.25-43 или 50-53.
57. Машиночитаемый носитель, содержащий компьютерную программу, при выполнении которой процессор осуществляет способ по любому из пп.1-24.
RU2007133925/07A 2001-09-17 2007-09-11 Способ интерполяции значений под-пикселов RU2477575C2 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/954,608 2001-09-17
US09/954,608 US6950469B2 (en) 2001-09-17 2001-09-17 Method for sub-pixel value interpolation

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
RU2004101290/09A Division RU2317654C2 (ru) 2001-09-17 2002-09-11 Способ интерполяции значений подпикселов

Publications (2)

Publication Number Publication Date
RU2007133925A RU2007133925A (ru) 2009-03-20
RU2477575C2 true RU2477575C2 (ru) 2013-03-10

Family

ID=25495681

Family Applications (2)

Application Number Title Priority Date Filing Date
RU2004101290/09A RU2317654C2 (ru) 2001-09-17 2002-09-11 Способ интерполяции значений подпикселов
RU2007133925/07A RU2477575C2 (ru) 2001-09-17 2007-09-11 Способ интерполяции значений под-пикселов

Family Applications Before (1)

Application Number Title Priority Date Filing Date
RU2004101290/09A RU2317654C2 (ru) 2001-09-17 2002-09-11 Способ интерполяции значений подпикселов

Country Status (18)

Country Link
US (3) US6950469B2 (ru)
EP (1) EP1433316B9 (ru)
JP (3) JP4698947B2 (ru)
KR (3) KR101176903B1 (ru)
CN (2) CN1331353C (ru)
AU (1) AU2002324085C1 (ru)
BR (1) BR0211263A (ru)
CA (1) CA2452632C (ru)
EE (1) EE05594B1 (ru)
ES (1) ES2540583T7 (ru)
HK (1) HK1118411A1 (ru)
HU (1) HU228954B1 (ru)
MX (1) MXPA04000203A (ru)
PT (1) PT1433316E (ru)
RU (2) RU2317654C2 (ru)
SG (1) SG167662A1 (ru)
WO (1) WO2003026296A1 (ru)
ZA (1) ZA200308785B (ru)

Families Citing this family (218)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100311482B1 (ko) 1999-10-21 2001-10-18 구자홍 보간 영상의 화질 개선을 위한 필터링 제어방법
US7266150B2 (en) * 2001-07-11 2007-09-04 Dolby Laboratories, Inc. Interpolation of video compression frames
US7082450B2 (en) 2001-08-30 2006-07-25 Nokia Corporation Implementation of a transform and of a subsequent quantization
US6950469B2 (en) * 2001-09-17 2005-09-27 Nokia Corporation Method for sub-pixel value interpolation
KR100557911B1 (ko) * 2001-09-18 2006-03-10 마쯔시다덴기산교 가부시키가이샤 화상 부호화 방법 및 화상 복호화 방법
US20030059089A1 (en) * 2001-09-25 2003-03-27 Quinlan James E. Block matching at the fractional pixel level for motion estimation
US7630566B2 (en) * 2001-09-25 2009-12-08 Broadcom Corporation Method and apparatus for improved estimation and compensation in digital video compression and decompression
US7181070B2 (en) * 2001-10-30 2007-02-20 Altera Corporation Methods and apparatus for multiple stage video decoding
US20030099403A1 (en) * 2001-11-13 2003-05-29 Trusight Ltd. Image compression with dynamic programming
CN101448162B (zh) * 2001-12-17 2013-01-02 微软公司 处理视频图像的方法
WO2003063503A1 (en) * 2002-01-24 2003-07-31 Hitachi, Ltd. Moving picture signal coding method, decoding method, coding apparatus, and decoding apparatus
US8175159B2 (en) * 2002-01-24 2012-05-08 Hitachi, Ltd. Moving picture signal coding method, decoding method, coding apparatus, and decoding apparatus
US7003035B2 (en) 2002-01-25 2006-02-21 Microsoft Corporation Video coding methods and apparatuses
US8284844B2 (en) 2002-04-01 2012-10-09 Broadcom Corporation Video decoding system supporting multiple standards
US7620109B2 (en) * 2002-04-10 2009-11-17 Microsoft Corporation Sub-pixel interpolation in motion estimation and compensation
US7110459B2 (en) 2002-04-10 2006-09-19 Microsoft Corporation Approximate bicubic filter
US7305034B2 (en) * 2002-04-10 2007-12-04 Microsoft Corporation Rounding control for multi-stage interpolation
US7116831B2 (en) 2002-04-10 2006-10-03 Microsoft Corporation Chrominance motion vector rounding
US20040001546A1 (en) 2002-06-03 2004-01-01 Alexandros Tourapis Spatiotemporal prediction for bidirectionally predictive (B) pictures and motion vector prediction for multi-picture reference motion compensation
US7154952B2 (en) * 2002-07-19 2006-12-26 Microsoft Corporation Timestamp-independent motion vector prediction for predictive (P) and bidirectionally predictive (B) pictures
KR100472476B1 (ko) * 2002-08-31 2005-03-10 삼성전자주식회사 움직임 보상을 위한 보간 방법 및 그 장치
US7400774B2 (en) * 2002-09-06 2008-07-15 The Regents Of The University Of California Encoding and decoding of digital data using cues derivable at a decoder
US7231090B2 (en) * 2002-10-29 2007-06-12 Winbond Electronics Corp. Method for performing motion estimation with Walsh-Hadamard transform (WHT)
US7408988B2 (en) * 2002-12-20 2008-08-05 Lsi Corporation Motion estimation engine with parallel interpolation and search hardware
US7212676B2 (en) 2002-12-30 2007-05-01 Intel Corporation Match MSB digital image compression
JP3997171B2 (ja) * 2003-03-27 2007-10-24 株式会社エヌ・ティ・ティ・ドコモ 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、動画像復号装置、動画像復号方法、及び動画像復号プログラム
US9330060B1 (en) 2003-04-15 2016-05-03 Nvidia Corporation Method and device for encoding and decoding video image data
US8660182B2 (en) * 2003-06-09 2014-02-25 Nvidia Corporation MPEG motion estimation based on dual start points
US10554985B2 (en) 2003-07-18 2020-02-04 Microsoft Technology Licensing, Llc DC coefficient signaling at small quantization step sizes
US20050013498A1 (en) 2003-07-18 2005-01-20 Microsoft Corporation Coding of motion vector information
US7426308B2 (en) * 2003-07-18 2008-09-16 Microsoft Corporation Intraframe and interframe interlace coding and decoding
US7738554B2 (en) 2003-07-18 2010-06-15 Microsoft Corporation DC coefficient signaling at small quantization step sizes
US7317839B2 (en) * 2003-09-07 2008-01-08 Microsoft Corporation Chroma motion vector derivation for interlaced forward-predicted fields
US7567617B2 (en) 2003-09-07 2009-07-28 Microsoft Corporation Predicting motion vectors for fields of forward-predicted interlaced video frames
US8064520B2 (en) 2003-09-07 2011-11-22 Microsoft Corporation Advanced bi-directional predictive coding of interlaced video
US7724827B2 (en) 2003-09-07 2010-05-25 Microsoft Corporation Multi-layer run level encoding and decoding
US7253374B2 (en) * 2003-09-15 2007-08-07 General Motors Corporation Sheet-to-tube welded structure and method
NO319629B1 (no) * 2003-11-28 2005-09-05 Tandberg Telecom As Fremgangsmate for korrigering av interpolerte pikselverdier
NO320114B1 (no) * 2003-12-05 2005-10-24 Tandberg Telecom As Forbedret utregning av interpolerte pixelverdier
EP1578137A2 (en) * 2004-03-17 2005-09-21 Matsushita Electric Industrial Co., Ltd. Moving picture coding apparatus with multistep interpolation process
JP4419062B2 (ja) * 2004-03-29 2010-02-24 ソニー株式会社 画像処理装置および方法、記録媒体、並びにプログラム
EP1733562A1 (en) * 2004-03-31 2006-12-20 Koninklijke Philips Electronics N.V. Motion estimation and segmentation for video data
WO2005104564A1 (ja) * 2004-04-21 2005-11-03 Matsushita Electric Industrial Co., Ltd. 動き補償装置
KR100605105B1 (ko) * 2004-05-28 2006-07-26 삼성전자주식회사 영상 보간 장치
US7565020B2 (en) * 2004-07-03 2009-07-21 Microsoft Corp. System and method for image coding employing a hybrid directional prediction and wavelet lifting
CN100377599C (zh) * 2004-09-03 2008-03-26 北京航空航天大学 一种快速亚像素运动估计方法
US20060088104A1 (en) * 2004-10-27 2006-04-27 Stephen Molloy Non-integer pixel sharing for video encoding
US7792192B2 (en) * 2004-11-19 2010-09-07 Analog Devices, Inc. System and method for sub-pixel interpolation in motion vector estimation
JP4277793B2 (ja) * 2004-12-17 2009-06-10 ソニー株式会社 画像処理装置、符号化装置およびそれらの方法
US7668455B2 (en) * 2004-12-20 2010-02-23 Fujifilm Corporation Image capturing apparatus, image capturing method, reproducing apparatus, reproducing method and program
US7653132B2 (en) * 2004-12-21 2010-01-26 Stmicroelectronics, Inc. Method and system for fast implementation of subpixel interpolation
CN100411435C (zh) * 2005-01-24 2008-08-13 威盛电子股份有限公司 在视讯编码中降低占用存储器频宽的系统与方法
JP4736456B2 (ja) * 2005-02-15 2011-07-27 株式会社日立製作所 走査線補間装置、映像表示装置、映像信号処理装置
US8175168B2 (en) * 2005-03-18 2012-05-08 Sharp Laboratories Of America, Inc. Methods and systems for picture up-sampling
WO2006106039A1 (en) * 2005-04-06 2006-10-12 Thomson Licensing Method and apparatus for encoding enhancement layer video data
JP4081103B2 (ja) * 2005-05-11 2008-04-23 株式会社東芝 動画像符号化装置
US7526419B2 (en) * 2005-05-24 2009-04-28 International Business Machines Corporation Methods for reconstructing data from simulation models
WO2007014378A2 (en) * 2005-07-28 2007-02-01 Thomson Licensing Motion estimation and compensation using a hierarchical cache
US20070040837A1 (en) * 2005-08-19 2007-02-22 Seok Jin W Motion vector estimation method and continuous picture generation method based on convexity property of sub pixel
KR100623036B1 (ko) * 2005-09-22 2006-09-13 삼익전자공업 주식회사 다이나믹 보간 주사에 의해 해상도를 향상시킨 전광판시스템
CN1859576A (zh) * 2005-10-11 2006-11-08 华为技术有限公司 对空间分层编码视频图象的上采样方法及其系统
US8265151B1 (en) * 2005-12-14 2012-09-11 Ambarella Taiwan Ltd. Mode decision using approximate 1/2 pel interpolation
US8731071B1 (en) 2005-12-15 2014-05-20 Nvidia Corporation System for performing finite input response (FIR) filtering in motion estimation
US20070146242A1 (en) * 2005-12-22 2007-06-28 Eastman Kodak Company High resolution display for monochrome images with color highlighting
CN1794821A (zh) * 2006-01-11 2006-06-28 浙江大学 可分级视频压缩中插值的方法与装置
JP4677351B2 (ja) * 2006-02-17 2011-04-27 キヤノン株式会社 動き補償器、動き補償処理方法、コンピュータプログラム及び記憶媒体
US8724702B1 (en) * 2006-03-29 2014-05-13 Nvidia Corporation Methods and systems for motion estimation used in video coding
WO2007116551A1 (ja) * 2006-03-30 2007-10-18 Kabushiki Kaisha Toshiba 画像符号化装置及び画像符号化方法並びに画像復号化装置及び画像復号化方法
WO2007114368A1 (ja) * 2006-03-30 2007-10-11 Kabushiki Kaisha Toshiba 画像符号化装置及び方法並びに画像復号化装置及び方法
US8208553B2 (en) * 2006-05-04 2012-06-26 Altera Corporation Methods and apparatus for quarter-pel refinement in a SIMD array processor
JP4682384B2 (ja) * 2006-07-11 2011-05-11 株式会社メガチップス 1/4画素輝度用動き予測機構、組合せ輝度用動き予測機構、及び組合せ輝度・色差用動き予測機構
US8253752B2 (en) * 2006-07-20 2012-08-28 Qualcomm Incorporated Method and apparatus for encoder assisted pre-processing
US8155454B2 (en) * 2006-07-20 2012-04-10 Qualcomm Incorporated Method and apparatus for encoder assisted post-processing
US8660380B2 (en) 2006-08-25 2014-02-25 Nvidia Corporation Method and system for performing two-dimensional transform on data value array with reduced power consumption
KR100804451B1 (ko) * 2006-09-25 2008-02-20 광운대학교 산학협력단 영상처리의 1/4 픽셀 보간 방법 및 그의 프로세서
US9307122B2 (en) * 2006-09-27 2016-04-05 Core Wireless Licensing S.A.R.L. Method, apparatus, and computer program product for providing motion estimation for video encoding
KR100827093B1 (ko) * 2006-10-13 2008-05-02 삼성전자주식회사 영상 부호화 방법 및 장치
KR100800761B1 (ko) * 2006-10-19 2008-02-01 삼성전자주식회사 계산량을 최소화하는 색차 신호의 보간 방법 및 장치
KR101354659B1 (ko) * 2006-11-08 2014-01-28 삼성전자주식회사 멀티 코덱을 지원하는 움직임 보상 방법 및 장치
KR100874949B1 (ko) 2006-11-15 2008-12-19 삼성전자주식회사 단일 명령 다중 자료 프로세서 및 그것을 위한 메모리어레이 구조
JP4753204B2 (ja) * 2006-11-17 2011-08-24 株式会社ソニー・コンピュータエンタテインメント 符号化処理装置および符号化処理方法
US8411709B1 (en) 2006-11-27 2013-04-02 Marvell International Ltd. Use of previously buffered state information to decode in an hybrid automatic repeat request (H-ARQ) transmission mode
JP2008165381A (ja) * 2006-12-27 2008-07-17 Ricoh Co Ltd 画像処理装置及び画像処理方法
KR101411315B1 (ko) * 2007-01-22 2014-06-26 삼성전자주식회사 인트라/인터 예측 방법 및 장치
US8296662B2 (en) * 2007-02-05 2012-10-23 Brother Kogyo Kabushiki Kaisha Image display device
EP2132941B1 (en) 2007-04-09 2017-05-17 Nokia Technologies Oy High accuracy motion vectors for video coding with low encoder and decoder complexity
US8756482B2 (en) 2007-05-25 2014-06-17 Nvidia Corporation Efficient encoding/decoding of a sequence of data frames
US9118927B2 (en) 2007-06-13 2015-08-25 Nvidia Corporation Sub-pixel interpolation and its application in motion compensated encoding of a video signal
KR101380615B1 (ko) * 2007-06-28 2014-04-14 삼성전자주식회사 영상 동적 범위 향상 방법 및 장치
US8254455B2 (en) 2007-06-30 2012-08-28 Microsoft Corporation Computing collocated macroblock information for direct mode macroblocks
US8509567B2 (en) 2007-07-09 2013-08-13 Analog Devices, Inc. Half pixel interpolator for video motion estimation accelerator
US8873625B2 (en) 2007-07-18 2014-10-28 Nvidia Corporation Enhanced compression in representing non-frame-edge blocks of image frames
KR101396365B1 (ko) 2007-08-28 2014-05-30 삼성전자주식회사 영상의 시공간적 움직임 추정/보상 방법 및 장치
KR100909390B1 (ko) * 2007-09-18 2009-07-24 한국과학기술원 고속 움직임 보상 장치 및 방법
JP4461165B2 (ja) * 2007-09-26 2010-05-12 株式会社東芝 画像処理装置、方法およびプログラム
JP4900175B2 (ja) * 2007-10-04 2012-03-21 セイコーエプソン株式会社 画像処理装置及び方法並びにプログラム
MX2010003531A (es) * 2007-10-05 2010-04-14 Nokia Corp Codificacion de video con filtros direccionales de interpolacion adaptable alineados a pixeles.
US8416861B2 (en) 2007-10-14 2013-04-09 Nokia Corporation Fixed-point implementation of an adaptive image filter with high coding efficiency
US8897393B1 (en) 2007-10-16 2014-11-25 Marvell International Ltd. Protected codebook selection at receiver for transmit beamforming
US8542725B1 (en) 2007-11-14 2013-09-24 Marvell International Ltd. Decision feedback equalization for signals having unequally distributed patterns
TWI389573B (zh) * 2007-12-06 2013-03-11 Mstar Semiconductor Inc 僅依據水平方向之影像區塊執行影像處理運作的影像處理方法及其相關裝置
KR101456487B1 (ko) * 2008-03-04 2014-10-31 삼성전자주식회사 부화소 단위의 움직임 예측을 이용한 영상 부호화, 복호화방법 및 그 장치
US8565325B1 (en) 2008-03-18 2013-10-22 Marvell International Ltd. Wireless device communication in the 60GHz band
US8462842B2 (en) 2008-04-10 2013-06-11 Qualcomm, Incorporated Symmetry for interpolation filtering of sub-pixel positions in video coding
US20090257499A1 (en) * 2008-04-10 2009-10-15 Qualcomm Incorporated Advanced interpolation techniques for motion compensation in video coding
US8705622B2 (en) 2008-04-10 2014-04-22 Qualcomm Incorporated Interpolation filter support for sub-pixel resolution in video coding
US8971412B2 (en) * 2008-04-10 2015-03-03 Qualcomm Incorporated Advanced interpolation techniques for motion compensation in video coding
US8831086B2 (en) * 2008-04-10 2014-09-09 Qualcomm Incorporated Prediction techniques for interpolation in video coding
US8804831B2 (en) 2008-04-10 2014-08-12 Qualcomm Incorporated Offsets at sub-pixel resolution
US9967590B2 (en) 2008-04-10 2018-05-08 Qualcomm Incorporated Rate-distortion defined interpolation for video coding based on fixed filter or adaptive filter
RU2505938C2 (ru) * 2008-04-10 2014-01-27 Квэлкомм Инкорпорейтед Интерполяция на основе искажений в зависимости от скорости передачи для кодирования видео на основе неперестраиваемого фильтра или адаптивного фильтра
US9077971B2 (en) 2008-04-10 2015-07-07 Qualcomm Incorporated Interpolation-like filtering of integer-pixel positions in video coding
EP2304963B1 (fr) * 2008-07-01 2015-11-11 Orange Procede et dispositif de codage d'images mettant en oeuvre une prediction amelioree, procede et dispositif de decodage, signal et programmes d'ordinateur correspondants
US8811484B2 (en) * 2008-07-07 2014-08-19 Qualcomm Incorporated Video encoding by filter selection
ES2382311T3 (es) * 2008-07-08 2012-06-07 Nortech International (Pty) Limited Aparato y método de clasificación del movimiento de objetos en una zona de control
JP2010028220A (ja) * 2008-07-15 2010-02-04 Sony Corp 動きベクトル検出装置、動きベクトル検出方法、画像符号化装置及びプログラム
US8761261B1 (en) * 2008-07-29 2014-06-24 Marvell International Ltd. Encoding using motion vectors
CN102132342B (zh) * 2008-07-29 2014-05-28 法国电信 一种通过内插滤波器更新编码器的方法
US8498342B1 (en) 2008-07-29 2013-07-30 Marvell International Ltd. Deblocking filtering
US9445121B2 (en) 2008-08-04 2016-09-13 Dolby Laboratories Licensing Corporation Overlapped block disparity estimation and compensation architecture
US8345533B1 (en) 2008-08-18 2013-01-01 Marvell International Ltd. Frame synchronization techniques
US8750378B2 (en) * 2008-09-23 2014-06-10 Qualcomm Incorporated Offset calculation in switched interpolation filters
US8131056B2 (en) * 2008-09-30 2012-03-06 International Business Machines Corporation Constructing variability maps by correlating off-state leakage emission images to layout information
US8681893B1 (en) 2008-10-08 2014-03-25 Marvell International Ltd. Generating pulses using a look-up table
US8666181B2 (en) 2008-12-10 2014-03-04 Nvidia Corporation Adaptive multiple engine image motion detection system and method
US20100166076A1 (en) * 2008-12-30 2010-07-01 Tandberg Telecom As Method, apparatus, and computer readable medium for calculating run and level representations of quantized transform coefficients representing pixel values included in a block of a video picture
US20100165078A1 (en) * 2008-12-30 2010-07-01 Sensio Technologies Inc. Image compression using checkerboard mosaic for luminance and chrominance color space images
JP2010161747A (ja) * 2009-01-09 2010-07-22 Toshiba Corp サブピクセル生成装置及び方法並びに動き補償装置
US8189666B2 (en) 2009-02-02 2012-05-29 Microsoft Corporation Local picture identifier and computation of co-located information
JP5580541B2 (ja) * 2009-03-06 2014-08-27 パナソニック株式会社 画像復号化装置および画像復号化方法
US8520771B1 (en) 2009-04-29 2013-08-27 Marvell International Ltd. WCDMA modulation
US7991245B2 (en) * 2009-05-29 2011-08-02 Putman Matthew C Increasing image resolution method employing known background and specimen
JP2011030184A (ja) * 2009-07-01 2011-02-10 Sony Corp 画像処理装置、及び、画像処理方法
JP5325745B2 (ja) * 2009-11-02 2013-10-23 株式会社ソニー・コンピュータエンタテインメント 動画像処理プログラム、装置および方法、動画像処理装置を搭載した撮像装置
KR101601848B1 (ko) * 2009-12-01 2016-03-10 에스케이 텔레콤주식회사 인터 예측 프레임 생성장치 및 그 생성방법, 및 거기에 이용되는 참조 프레임 보간장치 및 그 방법
BR112012015001B1 (pt) 2009-12-17 2021-06-29 Telefonaktiebolaget Lm Ericsson [Publ] Método em um decodificador de vídeo para decodificar informação, disposição em um decodificador de vídeo, meio não transitório legível por computador para controlar um decodificador de vídeo, método em um codificador de vídeo para codificar informação, disposição em um codificador de vídeo, e, meio não transitório legível por computador para controlar um codificador de vídeo
US8406537B2 (en) * 2009-12-17 2013-03-26 General Electric Company Computed tomography system with data compression and transfer
US20110200108A1 (en) * 2010-02-18 2011-08-18 Qualcomm Incorporated Chrominance high precision motion filtering for motion interpolation
JP2011199396A (ja) * 2010-03-17 2011-10-06 Ntt Docomo Inc 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法、及び動画像予測復号プログラム
KR101847072B1 (ko) * 2010-04-05 2018-04-09 삼성전자주식회사 영상 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
KR101682147B1 (ko) * 2010-04-05 2016-12-05 삼성전자주식회사 변환 및 역변환에 기초한 보간 방법 및 장치
US9219921B2 (en) 2010-04-12 2015-12-22 Qualcomm Incorporated Mixed tap filters
KR101529842B1 (ko) 2010-04-13 2015-06-17 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 샘플 배열 멀티트리 세부분할에서 계승
CN106067983B (zh) 2010-04-13 2019-07-12 Ge视频压缩有限责任公司 解码数据流的方法、生成数据流的方法及解码器
TWI713356B (zh) 2010-04-13 2020-12-11 美商Ge影像壓縮有限公司 樣本區域合併技術
HUE025960T2 (en) 2010-04-13 2016-04-28 Ge Video Compression Llc Video coding using multi-tree subdivisions of images
US8963996B2 (en) * 2010-05-05 2015-02-24 Samsung Electronics Co., Ltd. Communication of stereoscopic three-dimensional (3D) video information including an uncompressed eye view video frames
CN102986212B (zh) 2010-05-07 2015-11-25 日本电信电话株式会社 活动图像编码控制方法、活动图像编码装置
TWI423164B (zh) 2010-05-07 2014-01-11 Silicon Motion Inc 用來產生一高品質放大影像之方法及相關裝置
US9179149B2 (en) * 2010-05-12 2015-11-03 Nippon Telegraph And Telephone Corporation Video encoding control method, video encoding apparatus, and video encoding program
US8447105B2 (en) * 2010-06-07 2013-05-21 Microsoft Corporation Data driven interpolation using geodesic affinity
CN103119935B (zh) * 2010-07-09 2016-05-04 三星电子株式会社 图像插值方法和设备
US8817771B1 (en) 2010-07-16 2014-08-26 Marvell International Ltd. Method and apparatus for detecting a boundary of a data frame in a communication network
US20120027081A1 (en) * 2010-07-30 2012-02-02 Cisco Technology Inc. Method, system, and computer readable medium for implementing run-level coding
US20120063515A1 (en) * 2010-09-09 2012-03-15 Qualcomm Incorporated Efficient Coding of Video Parameters for Weighted Motion Compensated Prediction in Video Coding
CN102402781B (zh) * 2010-09-13 2014-05-14 慧荣科技股份有限公司 用来产生一高品质放大图像的方法
US10045046B2 (en) * 2010-12-10 2018-08-07 Qualcomm Incorporated Adaptive support for interpolating values of sub-pixels for video coding
CA3029042C (en) * 2010-12-21 2021-06-15 Ntt Docomo, Inc. Enhanced intra-prediction coding using planar representations
US9445126B2 (en) 2011-01-05 2016-09-13 Qualcomm Incorporated Video filtering using a combination of one-dimensional switched filter and one-dimensional adaptive filter
CN103503458B (zh) 2011-01-07 2017-09-22 诺基亚技术有限公司 视频编码中的运动预测
US8797391B2 (en) * 2011-01-14 2014-08-05 Himax Media Solutions, Inc. Stereo image displaying method
CN102595118B (zh) * 2011-01-14 2015-04-08 华为技术有限公司 一种编解码中的预测方法和预测器
US9049454B2 (en) 2011-01-19 2015-06-02 Google Technology Holdings Llc. High efficiency low complexity interpolation filters
US20120224639A1 (en) * 2011-03-03 2012-09-06 General Instrument Corporation Method for interpolating half pixels and quarter pixels
US20120230407A1 (en) 2011-03-11 2012-09-13 General Instrument Corporation Interpolation Filter Selection Using Prediction Index
JP5768491B2 (ja) * 2011-05-17 2015-08-26 ソニー株式会社 画像処理装置および方法、プログラム、並びに記録媒体
EP3751856B1 (en) * 2011-06-24 2023-07-12 NTT DoCoMo, Inc. Methods for motion compensated prediction
EP2724534A2 (en) * 2011-06-24 2014-04-30 Motorola Mobility LLC Selection of phase offsets for interpolation filters for motion compensation
MX336303B (es) * 2011-06-28 2016-01-14 Samsung Electronics Co Ltd Metodo para interpolacion de imagen que utiliza filtro de interpolacion asimetrico y aparato para ello.
EP2727358A1 (en) 2011-07-01 2014-05-07 Motorola Mobility LLC Joint sub-pixel interpolation filter for temporal prediction
CN102857752B (zh) * 2011-07-01 2016-03-30 华为技术有限公司 一种像素预测方法和装置
US9129411B2 (en) * 2011-07-21 2015-09-08 Luca Rossato Upsampling in a tiered signal quality hierarchy
EP3454561B1 (en) * 2011-09-14 2020-02-05 Samsung Electronics Co., Ltd. Method and device for encoding a prediction unit (pu) based on its size and corresponding decoding device
US10924668B2 (en) 2011-09-19 2021-02-16 Epilog Imaging Systems Method and apparatus for obtaining enhanced resolution images
US9137433B2 (en) 2011-09-19 2015-09-15 Michael Mojaver Super resolution binary imaging and tracking system
US20130070091A1 (en) * 2011-09-19 2013-03-21 Michael Mojaver Super resolution imaging and tracking system
RU2473124C1 (ru) * 2011-09-23 2013-01-20 Общество С Ограниченной Ответственностью "Виси Рус" Способ обнаружения порнографии на цифровых изображениях (варианты)
US20130083845A1 (en) 2011-09-30 2013-04-04 Research In Motion Limited Methods and devices for data compression using a non-uniform reconstruction space
HUE056519T2 (hu) * 2011-10-24 2022-02-28 Innotive Ltd Eljárás és készülék intra predikciósmód dekódolására
EP2595382B1 (en) 2011-11-21 2019-01-09 BlackBerry Limited Methods and devices for encoding and decoding transform domain filters
JP5911166B2 (ja) * 2012-01-10 2016-04-27 シャープ株式会社 画像処理装置、画像処理方法、画像処理プログラム、撮像装置、及び画像表示装置
US9325991B2 (en) 2012-04-11 2016-04-26 Qualcomm Incorporated Motion vector rounding
US8819525B1 (en) 2012-06-14 2014-08-26 Google Inc. Error concealment guided robustness
US9041834B2 (en) * 2012-09-19 2015-05-26 Ziilabs Inc., Ltd. Systems and methods for reducing noise in video streams
JP5730274B2 (ja) * 2012-11-27 2015-06-03 京セラドキュメントソリューションズ株式会社 画像処理装置
JP5697649B2 (ja) * 2012-11-27 2015-04-08 京セラドキュメントソリューションズ株式会社 画像処理装置
US9432690B2 (en) * 2013-01-30 2016-08-30 Ati Technologies Ulc Apparatus and method for video processing
US9225979B1 (en) * 2013-01-30 2015-12-29 Google Inc. Remote access encoding
US20140269943A1 (en) * 2013-03-12 2014-09-18 Tandent Vision Science, Inc. Selective perceptual masking via downsampling in the spatial and temporal domains using intrinsic images for use in data compression
US20140267916A1 (en) * 2013-03-12 2014-09-18 Tandent Vision Science, Inc. Selective perceptual masking via scale separation in the spatial and temporal domains using intrinsic images for use in data compression
WO2014178587A1 (ko) * 2013-05-01 2014-11-06 엘지전자 주식회사 신호 송수신 장치 및 신호 송수신 방법
AU2013213660A1 (en) * 2013-08-06 2015-02-26 Canon Kabushiki Kaisha Method for printing an upscaled image
US9942560B2 (en) 2014-01-08 2018-04-10 Microsoft Technology Licensing, Llc Encoding screen capture data
US9774881B2 (en) 2014-01-08 2017-09-26 Microsoft Technology Licensing, Llc Representing motion vectors in an encoded bitstream
US9749642B2 (en) 2014-01-08 2017-08-29 Microsoft Technology Licensing, Llc Selection of motion vector precision
CN103793917B (zh) * 2014-02-24 2017-02-01 哈尔滨工程大学 一种结合两种插值算法的遥感图像亚像元定位方法
US10462480B2 (en) * 2014-12-31 2019-10-29 Microsoft Technology Licensing, Llc Computationally efficient motion estimation
US10291932B2 (en) * 2015-03-06 2019-05-14 Qualcomm Incorporated Method and apparatus for low complexity quarter pel generation in motion search
US10283031B2 (en) * 2015-04-02 2019-05-07 Apple Inc. Electronic device with image processor to reduce color motion blur
US9542732B2 (en) * 2015-04-03 2017-01-10 Cognex Corporation Efficient image transformation
US10275863B2 (en) 2015-04-03 2019-04-30 Cognex Corporation Homography rectification
US10009622B1 (en) 2015-12-15 2018-06-26 Google Llc Video coding with degradation of residuals
US10116957B2 (en) 2016-09-15 2018-10-30 Google Inc. Dual filter type for motion compensated prediction in video coding
CN106658024B (zh) * 2016-10-20 2019-07-16 杭州当虹科技股份有限公司 一种快速的视频编码方法
DE102016225140B3 (de) * 2016-12-15 2017-12-07 Audi Ag Verfahren zum Bestimmen einer relativen Position eines Kraftfahrzeugs, Positionsbestimmungssystem für ein Kraftfahrzeug und Kraftfahrzeug
EP3577900A4 (en) * 2017-01-31 2020-08-26 Sharp Kabushiki Kaisha SYSTEMS AND METHODS FOR IMPLEMENTING VIDEO CODING WITH PLANAR INTRA-IMAGE PREDICTION
US10499078B1 (en) 2017-02-07 2019-12-03 Google Llc Implicit motion compensation filter selection
CN106998437B (zh) * 2017-03-31 2020-07-31 武汉斗鱼网络科技有限公司 一种重建视频图像的方法及装置
US11252464B2 (en) 2017-06-14 2022-02-15 Mellanox Technologies, Ltd. Regrouping of video data in host memory
US20200014945A1 (en) * 2018-07-08 2020-01-09 Mellanox Technologies, Ltd. Application acceleration
CN109922329B (zh) * 2017-12-13 2021-02-26 北京传送科技有限公司 虚拟现实影像数据的压缩方法、解压缩方法及装置
US11044518B2 (en) * 2018-03-20 2021-06-22 At&T Mobility Ii Llc Video access master platform
US11051058B2 (en) * 2018-09-24 2021-06-29 Hewlett Packard Enterprise Development Lp Real-time wireless video delivery system using a multi-channel communications link
CN109348234B (zh) * 2018-11-12 2021-11-19 北京佳讯飞鸿电气股份有限公司 一种高效亚像素运动估计方法及系统
JP7190661B2 (ja) * 2019-02-06 2022-12-16 パナソニックIpマネジメント株式会社 画像処理装置、画像処理方法および画像処理システム
MX2022005534A (es) * 2019-11-08 2022-08-04 Op Solutions Llc Metodos y sistemas para recorte adaptativo..
KR20210077840A (ko) 2019-12-17 2021-06-28 삼성전자주식회사 다이나믹 비전 센서 시스템
TWI790600B (zh) * 2021-04-21 2023-01-21 宏芯科技股份有限公司 區域式視訊影像插補裝置及其方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2249906A (en) * 1990-11-15 1992-05-20 Sony Broadcast & Communication Motion compensated interpolation of images
US5461423A (en) * 1992-05-29 1995-10-24 Sony Corporation Apparatus for generating a motion vector with half-pixel precision for use in compressing a digital motion picture signal
US5521642A (en) * 1992-10-07 1996-05-28 Daewoo Electronics Co., Ltd. Decoding system for compact high definition television receivers
US5570436A (en) * 1991-12-25 1996-10-29 Matsushita Electric Industrial Co., Ltd. Method for interpolating missing pixels and an apparatus employing the method
RU2123769C1 (ru) * 1993-04-09 1998-12-20 Сони Корпорейшн Способы и устройства кодирования изображений и носители информации для записи изображений
RU2131172C1 (ru) * 1996-12-10 1999-05-27 Полыковский Андрей Маркович Интерполяционный способ сжатия телевизионного сигнала
US5936672A (en) * 1996-03-22 1999-08-10 Daewoo Electronics Co., Ltd. Half pixel motion estimator
EP1083752A1 (en) * 1999-09-08 2001-03-14 STMicroelectronics S.r.l. Video decoder with reduced memory
US6219464B1 (en) * 1995-11-08 2001-04-17 Genesis Microchip Inc. Source data interpolation method and apparatus
US6252576B1 (en) * 1998-08-06 2001-06-26 In-System Design, Inc. Hardware-efficient system for hybrid-bilinear image scaling

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8713454D0 (en) 1987-06-09 1987-07-15 Sony Corp Television standards converters
DE3854337T2 (de) * 1987-06-09 1996-02-01 Sony Corp Bewegungskompensierte Interpolation von digitalen Fernsehbildern.
US4816913A (en) * 1987-11-16 1989-03-28 Technology, Inc., 64 Pixel interpolation circuitry as for a video signal processor
US4937666A (en) 1989-12-04 1990-06-26 Bell Communications Research, Inc. Circuit implementation of block matching algorithm with fractional precision
JP2861462B2 (ja) 1991-04-12 1999-02-24 ソニー株式会社 動きベクトル検出装置
US5337088A (en) 1991-04-18 1994-08-09 Matsushita Electric Industrial Co. Ltd. Method of correcting an image signal decoded in block units
US5594813A (en) 1992-02-19 1997-01-14 Integrated Information Technology, Inc. Programmable architecture and methods for motion estimation
JP2636622B2 (ja) 1992-03-13 1997-07-30 松下電器産業株式会社 ビデオ信号の符号化方法及び復号化方法ならびにビデオ信号の符号化装置及び復号化装置
JP2723199B2 (ja) 1992-06-03 1998-03-09 シャープ株式会社 光ディスクプレーヤのトラッキングサーボ引き込み回路装置
KR100283343B1 (ko) * 1992-06-25 2001-03-02 이데이 노부유끼 화상신호 부호화방법 및 복호화방법과 화상신호 부호화장치 및 복호화장치
JPH06197334A (ja) * 1992-07-03 1994-07-15 Sony Corp 画像信号符号化方法、画像信号復号化方法、画像信号符号化装置、画像信号復号化装置及び画像信号記録媒体
JP2967014B2 (ja) 1993-05-24 1999-10-25 キヤノン株式会社 画像処理装置
WO1994028677A1 (en) 1993-06-01 1994-12-08 Thomson Multimedia S.A. Method and apparatus for motion compensated interpolation
US5684538A (en) 1994-08-18 1997-11-04 Hitachi, Ltd. System and method for performing video coding/decoding using motion compensation
JP3392564B2 (ja) * 1995-02-27 2003-03-31 三洋電機株式会社 単板式カラービデオカメラ
JPH09102954A (ja) * 1995-10-04 1997-04-15 Matsushita Electric Ind Co Ltd 1つまたは2つの予測ブロックからブロックの画素値を計算する方法
KR100192270B1 (ko) * 1996-02-03 1999-06-15 구자홍 에이치디티브이 비데오 디코더 회로
JP3224514B2 (ja) * 1996-08-21 2001-10-29 シャープ株式会社 動画像符号化装置および動画像復号装置
DE19730305A1 (de) 1997-07-15 1999-01-21 Bosch Gmbh Robert Verfahren zur Erzeugung eines verbesserten Bildsignals bei der Bewegungsschätzung von Bildsequenzen, insbesondere eines Prädiktionssignals für Bewegtbilder mit bewegungskompensierender Prädiktion
DE19746214A1 (de) * 1997-10-21 1999-04-22 Bosch Gmbh Robert Verfahren zur bewegungskompensierenden Prädiktion von Bewegtbildfolgen
US6122017A (en) * 1998-01-22 2000-09-19 Hewlett-Packard Company Method for providing motion-compensated multi-field enhancement of still images from video
WO1999056247A1 (en) 1998-04-29 1999-11-04 Koninklijke Philips Electronics N.V. Image interpolation
JP4599672B2 (ja) 1999-12-21 2010-12-15 株式会社ニコン 補間処理装置および補間処理プログラムを記録した記録媒体
US6950469B2 (en) * 2001-09-17 2005-09-27 Nokia Corporation Method for sub-pixel value interpolation

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2249906A (en) * 1990-11-15 1992-05-20 Sony Broadcast & Communication Motion compensated interpolation of images
US5570436A (en) * 1991-12-25 1996-10-29 Matsushita Electric Industrial Co., Ltd. Method for interpolating missing pixels and an apparatus employing the method
US5461423A (en) * 1992-05-29 1995-10-24 Sony Corporation Apparatus for generating a motion vector with half-pixel precision for use in compressing a digital motion picture signal
US5521642A (en) * 1992-10-07 1996-05-28 Daewoo Electronics Co., Ltd. Decoding system for compact high definition television receivers
RU2123769C1 (ru) * 1993-04-09 1998-12-20 Сони Корпорейшн Способы и устройства кодирования изображений и носители информации для записи изображений
US6219464B1 (en) * 1995-11-08 2001-04-17 Genesis Microchip Inc. Source data interpolation method and apparatus
US5936672A (en) * 1996-03-22 1999-08-10 Daewoo Electronics Co., Ltd. Half pixel motion estimator
RU2131172C1 (ru) * 1996-12-10 1999-05-27 Полыковский Андрей Маркович Интерполяционный способ сжатия телевизионного сигнала
US6252576B1 (en) * 1998-08-06 2001-06-26 In-System Design, Inc. Hardware-efficient system for hybrid-bilinear image scaling
EP1083752A1 (en) * 1999-09-08 2001-03-14 STMicroelectronics S.r.l. Video decoder with reduced memory

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
T. WEDI, Adaptive Interpolation Filter for Motion Compensated Hybrid Video Coding, Picture Coding Symposium (PCS 2001), Seoul, Korea, April 2001, найдено в Интернет на ftp://ftp.tnt.uni-hannover.de/pub/papers/2001/PCS2001-TW.pdf. *

Also Published As

Publication number Publication date
JP2011101411A (ja) 2011-05-19
RU2004101290A (ru) 2005-06-20
EP1433316B3 (en) 2017-01-18
SG167662A1 (en) 2011-01-28
ES2540583T9 (es) 2018-02-22
AU2002324085C1 (en) 2008-06-05
KR20110115181A (ko) 2011-10-20
US20080069203A1 (en) 2008-03-20
HUP0400295A2 (en) 2004-08-30
MXPA04000203A (es) 2004-03-18
KR20040036902A (ko) 2004-05-03
RU2007133925A (ru) 2009-03-20
AU2002324085B2 (en) 2007-09-06
US20050220353A1 (en) 2005-10-06
ES2540583T3 (es) 2015-07-10
CN1537384A (zh) 2004-10-13
US20030112864A1 (en) 2003-06-19
WO2003026296A1 (en) 2003-03-27
EP1433316B1 (en) 2015-04-29
JP4698947B2 (ja) 2011-06-08
EE200400046A (et) 2004-04-15
CN1331353C (zh) 2007-08-08
BR0211263A (pt) 2004-07-20
CA2452632C (en) 2013-04-23
RU2317654C2 (ru) 2008-02-20
JP2005503734A (ja) 2005-02-03
JP4700704B2 (ja) 2011-06-15
KR100972850B1 (ko) 2010-07-28
US6950469B2 (en) 2005-09-27
KR20080007276A (ko) 2008-01-17
EP1433316B9 (en) 2017-04-12
EE05594B1 (et) 2012-10-15
JP5502765B2 (ja) 2014-05-28
HK1118411A1 (en) 2009-02-06
CN101232622B (zh) 2011-04-13
PT1433316E (pt) 2015-07-31
EP1433316A1 (en) 2004-06-30
HU228954B1 (en) 2013-07-29
US7280599B2 (en) 2007-10-09
US8036273B2 (en) 2011-10-11
KR101176903B1 (ko) 2012-08-30
ZA200308785B (en) 2004-09-16
JP2008187727A (ja) 2008-08-14
CA2452632A1 (en) 2003-03-27
CN101232622A (zh) 2008-07-30
ES2540583T7 (es) 2017-07-10

Similar Documents

Publication Publication Date Title
RU2477575C2 (ru) Способ интерполяции значений под-пикселов
EP1466477B1 (en) Coding dynamic filters
AU2002324085A1 (en) Method for sub-pixel value interpolation
GB2379820A (en) Interpolating values for sub-pixels
AU2007237319B2 (en) Method for sub-pixel value interpolation

Legal Events

Date Code Title Description
TK4A Correction to the publication in the bulletin (patent)

Free format text: AMENDMENT TO CHAPTER -FG4A- IN JOURNAL: 7-2013 FOR TAG: (57)

PC41 Official registration of the transfer of exclusive right

Effective date: 20160602