RU2276470C2 - Способ уплотнения и распаковки видеоданных - Google Patents

Способ уплотнения и распаковки видеоданных Download PDF

Info

Publication number
RU2276470C2
RU2276470C2 RU2003130965/09A RU2003130965A RU2276470C2 RU 2276470 C2 RU2276470 C2 RU 2276470C2 RU 2003130965/09 A RU2003130965/09 A RU 2003130965/09A RU 2003130965 A RU2003130965 A RU 2003130965A RU 2276470 C2 RU2276470 C2 RU 2276470C2
Authority
RU
Russia
Prior art keywords
pixels
pixel
priority
image
groups
Prior art date
Application number
RU2003130965/09A
Other languages
English (en)
Other versions
RU2003130965A (ru
Inventor
Герд МОСАКОВСКИ (DE)
Герд МОСАКОВСКИ
Original Assignee
Т-Мобиле Дойчланд Гмбх
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Т-Мобиле Дойчланд Гмбх filed Critical Т-Мобиле Дойчланд Гмбх
Publication of RU2003130965A publication Critical patent/RU2003130965A/ru
Application granted granted Critical
Publication of RU2276470C2 publication Critical patent/RU2276470C2/ru

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/39Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability involving multiple description coding [MDC], i.e. with separate layers being structured as independently decodable descriptions of input picture data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements

Abstract

Изобретение относится к способу уплотнения и распаковки видеоданных. Технический результат заключается в обеспечении простого и гибкого согласования с различными скоростями передачи, шириной полосы передачи, разрешающей способностью и величиной дисплея соответственно. Технический результат достигается тем, что для каждого пикселя матрицы определяют величину приоритета, вычисляют величину различия пикселей, объединяют использованные для вычисления величины приоритета пикселей в одну группу пикселей, сортируют группы пикселей, сохраняют и/или передают группы пикселей в соответствии с их приоритетом в матрице приоритетов, причем упомянутые операции постоянно повторяют, при этом величины приоритета групп пикселей постоянно определяют вновь, матрица приоритетов в каждый момент времени содержит рассортированные по текущим приоритетам группы пикселей, а также предпочтительно сначала сохраняют и передают те группы пикселей, которые имеют наивысший приоритет и до сих пор еще не передавались. 2 н. и 9 з.п. ф-лы, 8 ил., 1 табл.

Description

Изобретение относится к способу уплотнения и распаковки видеоданных.
Видеоизображения создают большой объем данных. Для эффективной передачи и хранения этих объемов данных целесообразно их уплотнять.
Согласно уровню техники видеосигналы записываются и воспроизводятся в быстрой последовательности отдельных кадров. В телевидении (стандарт PAL) это 25 кадров, соответственно 50 полукадров в секунду. При цифровой записи изображений это примерно 30 кадров в секунду. Каждый кадр раскладывается на строки и затем передается последовательно.
Предшествующие способы уплотнения основываются в основном на уменьшении разрешающей способности, глубины цвета и сокращении количества кадров в секунду. При цифровой компрессии, например, в способах MPEG вместо полных кадров передают по существу разностные изображения, т.е. отличия отдельных точек изображения (пикселей) по сравнению с предыдущим изображением. Новейшим стандартом для кодирования видеоданных является MPEG4.
MPEG является сокращением для "Экспертная группа по кинематографии". Эта группа закрепила форматы файлов и способы для экономящего место уплотнения и хранения видеоданных, соответственно мультимедийных данных (видеоданных, данных изображения и звуковых данных) с высоким качеством. В настоящее время стандарт MPEG подразделяется на MPEG-1, MPEG-2, MPEG-3 и MPEG-4, при этом стандарт MPEG-3 уже интегрирован в MPEG-2.
Для того чтобы огромные объемы данных можно было обрабатывать и передавать "нормальными" компьютерами, сохраняют лишь изменения к предшествующему кадру. Согласно формату MPEG сохраняют с равномерными интервалами для обычно двенадцати кадров так называемые интракадры; они являются отдельными кадрами, уплотненными в соответствии со стандартом JPEG. Кадры между этими интракадрами сохраняются по возможности неполностью. Вместо этого записывают в соответствии со стандартом MPEG, как их можно получить за счет смещения частей из предыдущих или последующих кадров. Для этого применяют также прогнозирующие Р-кадры (кадры, сжатые с использованием ссылки на одно изображение) и В-кадры (двунаправленные кадры). Однако, поскольку это никогда не удается реализовать безупречно, то дополнительно для каждого кадра записывают остаточное отклонение с кодированием по стандарту JPEG. С помощью этого способа можно уменьшить объем данных для одного видеофильма примерно на 99%. Возможное уплотнение доходит до 200:1. MPEG-1 был разработан для плавного воспроизведения видеофильмов. Уплотнение, соответственно распаковка MPEG-1, была первоначально способом, зависящим от аппаратного обеспечения. Однако благодаря более быстрым процессорам в настоящее время возможно также уплотнение с помощью программного обеспечения. Существенное различие между MPEG-1 и MPEG-2 состоит в том, что MPEG-2 позволяет лучше обрабатывать используемый в телевидении способ пропуска строк (чресстрочную развертку). Смысл MPEG-2 заключается в уплотнении на высшем уровне качества, так что киноматериал можно обрабатывать и редактировать почти 1 к 1 со студийным качеством. Логическим образом MPEG-2 стал стандартом. При чисто внутрикадровом уплотнении можно применять MPEG-2 даже в режиме монтажа. Часть стандарта MPEG-3, которая была предусмотрена для телевидения с высоким разрешением, в последнее время вошла в стандарт MPEG-2.
MPEG-4 является дальнейшим развитием формата MPEG-2 и находится с 1996 г. в разработке. Хотя первоначально MPEG-4 был задуман в качестве стандарта для кодирования аудиовизуальных данных с очень низкой битовой скоростью, развитие служило более широким целям, чем только образованию потоков линейных данных носителей информации при применении для Интернета и беспроволочной передачи. MPEG-4 предоставляет, например, эффективные механизмы для уплотнения и распределения интерактивного содержимого носителей данных. Кроме того, MPEG-4 имеет возможности для трехмерного изображения для визуализации искусственного интеллекта или изображения видеообраза абонента, например, в рамках видеоконференции. Степень уплотнения при MPEG-4 выше, чем при MPEG-2, при этом можно лучше уплотнять спрайты, поскольку механизм кодирования предоставляет для этого значительно больше времени. При этом при необходимости можно даже переключаться на небольшие волны (wavelets). Язык описания сценариев позволяет значительно быстрее выполнять в течение нескольких байтов такие операции, как "сдвигание", чем обеспечивалось бы цифровой уплотненной формой тех же операций. С помощью этих спрайтов можно надвигать имеющие произвольный контур неподвижные изображения на подвижные изображения.
Задачей данного изобретения является создание способа уплотнения и распаковки видеоданных, который обеспечивает простое и гибкое согласование с различными скоростями передачи, соответственно шириной полосы передачи, разрешающей способностью и величиной дисплея.
Эта задача решена с помощью признаков пункта 1 формулы изобретения.
Предпочтительные варианты выполнения и модификации изобретения указаны в зависимых пунктах формулы изобретения.
Предпочтительно происходит параллельная обработка видеоинформации в микросхеме приема изображения. Параллельная обработка служит для определения сначала наиболее важных минимальных элементов изображения (пикселей) и занесения их в соответствии с приоритетом в матрицу приоритетов. Эта матрица в любой момент времени содержит сортированные по приоритету величины пикселей. В соответствии с приоритетом передают, соответственно записывают, эти пиксели и использованные для расчета приоритета величины пикселей. Пиксель получает высокий приоритет, если отличия от его смежных пикселей являются очень большими.
Для реконструкции на дисплее отображаются соответствующие текущие величины пикселей. Еще не переданные пиксели вычисляют из уже переданных пикселей.
В соответствии с вычислительной мощностью, шириной полосы передачи и величиной дисплея можно использовать различные способы для вычисления еще не переданных пикселей. Если в распоряжении имеется очень большая ширина полосы, то можно выполнять простую линейную интерполяцию. Если в распоряжении имеется лишь очень небольшая ширина полосы, то это можно учитывать при передаче приоритетных пикселей.
Из хода предыстории передаваемых пикселей можно идентифицировать объекты и тем самым выполнять оценку движения этих объектов.
Основная идея изобретения основана на приоритетном запоминании, соответственно передаче пикселей. При сохранении, соответственно при передаче, видеоданных необходимо дополнительно учитывать временные и позиционные (внутри матрицы изображения) зависимости отдельных пикселей или объединенных в группы пикселей.
Для достижения экстремально высокого уплотнения данных передают соответствующие группы пикселей, которые имеют наивысший приоритет и еще не были переданы. Поверхности, т.е. величины пикселей между ужу переданными группами пикселей, вычисляют из уже переданных групп пикселей, например, с помощью интерполяции. При более высоком разрешении (более крупных матрицах изображения) увеличивается достигаемый коэффициент уплотнения, поскольку при естественной съемке большие поверхности имеют хорошо предсказуемый (равномерный) ход окраски, например голубое небо.
Следует также отметить, что каждый раз передаются точные величины пикселей. При необходимости, способ обеспечивает передачу видеоинформации без потерь.
Восстановление, соответственно реконструкция, видеоданных основывается на оценках аналогично зрению человека. Человек воспринимает раздражения, а интерпретация того, что он различает в этом изображении, происходит лишь в его уме. Раздражения соответствуют передаваемым группам пикселей, интерпретация соответствует заполнению поверхностей между еще не переданными группами пикселей.
Для реализации этого можно создавать дополнительные матрицы. Среди прочего, эти матрицы являются матрицами, в которых имеется информация, из каких групп пикселей была определена величина пикселя в данном положении. Другая информация может состоять в том, когда были вычислены эти величины, из каких групп пикселей они были вычислены, соответственно переданы. В качестве дополнительной информации можно получить оценку точности величин (например, вычислить из непосредственно смежных пикселей небольшое изменение, принятое за основу для вычисления пикселей).
Указанный способ обеспечивает значительно более простое согласование потока видеоданных с различными размерами дисплея и разрешением изображения.
Другое преимущество состоит в том, что за счет указанного вида кодирования видеоизображения не автоматически задается, с помощью каких алгоритмов должно быть декодировано видеоизображение. Это достигается за счет передачи снабженных приоритетом величин пикселей, которые в противоположность другим способам не подвергаются образованию среднего значения. Таким образом, изготовители имеют возможность разрабатывать терминалы от низкой до высокой стоимости и отличаться от конкурентов различными алгоритмами.
Желаемая массивная параллельная обработка видеоданных в специально разработанной для этого микросхеме позволяет применять экстремально низкие тактовые скорости, что положительно сказывается на потреблении тока.
За счет придания приоритетов можно определенные зоны видеоизображения (например, губы диктора) передавать с более высоким приоритетом, а следовательно, с лучшим разрешением.
Способ позволяет отфильтровывать из потока видеоданных для различных терминалов оптимальные потоки частичных данных без необходимости учитывать это при видеосъемке.
Ниже приводится подробное описание примера выполнения изобретения со ссылками на чертежи. Из чертежей и их описания следуют дополнительные признаки, преимущества и возможности применения изобретения. На чертежах изображено
фиг.1 - матрица кадра из 20×21 пикселей;
фиг.2 - различные формы групп пикселей;
фиг.3 - матрица кадра с подвижным объектом в момент времени t1;
фиг.4 - матрица кадра с подвижным объектом в момент времени t2;
фиг.5 - матрица кадра с подвижным объектом в момент времени t3;
фиг.6 - вновь генерированная матрица кадра с введенными группами пикселей в углу кадра;
фиг.7 - заполнение поверхности между уже введенными группами пикселей;
фиг.8 - введение других групп пикселей и заполнение лежащих между ними поверхностей.
Ниже приводится описание уплотнения и распаковки видеосигнала на примере выполнения.
При этом делаются следующие предположения.
В качестве источника видеоизображения имеется обычный в настоящее время видеосигнал (например, PAL или NTSC). Видеоинформация может считываться с помощью предлагаемого в торговле электронного устройства (например, карта захвата кадра). Для иллюстрации способа в последующем применяется уменьшенная матрица кадра с шириной в 20 пикселей и высотой в 21 пиксель (смотри фиг.1). Каждый пиксель матрицы представлен величиной из 32 бит (величина пикселя), 32 бита разделены, например, на 4 величины (прозрачный, красный, зеленый, синий) по 8 бит в каждой. Позиция пикселя задана целым числом. Матрица кадра пронумерована, как показано на фиг.1, от 0 до 419. Число внутри каждой клетки соответствует положению соответствующего пикселя. Между источником и приемником существует соединение UDP (протокол дейтаграмм пользователя). Через них затем пересылаются уплотненные видеоданные.
Уплотнение видеосигнала происходит следующим образом.
Способ основывается на том, что постоянно осуществляется определение приоритетов отдельных пикселей видеосигнала, при этом пиксели в соответствии с их приоритетом заносятся в матрицу. Эта матрица содержит в каждый момент времени текущие, рассортированные по приоритетам величины пикселей. Пиксель получает высокий приоритет, если различия с его смежными пикселями являются очень большими. Пиксель вместе с его использованными для вычисления смежными пикселями объединяют в группу пикселей. Эти группы передают, соответственно сохраняют, в соответствии с приоритетами.
Считывание матрицы кадра
Устройство захвата кадра имеет в каждый момент времени соответствующий текущий кадр в своей матрице кадра, которая может быть в качестве примера, показанной на фиг.1, матрицей кадра размером 20×21 пикселей. Каждый пиксель задан своей позицией (от 0 до 419) и своей величиной пикселя (величиной цвета, соответственно яркости).
Определение групп пикселей
Сначала задают, какие смежные пиксели образуют группу пикселей. При этом р0 обозначает тот пиксель, который определяет позицию группы пикселей и для которого вычисляют приоритет. Относительное положение других пикселей, например p1-р4, группы пикселей, относящихся к опорному пикселю р0, следует из примененного вида (формы) группы пикселей. На фиг.2 показаны в качестве примера некоторые возможные формы групп пикселей. Могут быть образованы как симметричные, так и несимметричные относительно опорного пикселя р0 группы пикселей. Какой вид группы пикселей применяется, зависит среди прочего от вида изображаемого материала и желаемой степени уплотнения. Как правило, достижимый коэффициент уплотнения тем больше, чем больше пикселей содержит одна группа пикселей. Для кодирования и декодирования, т.е. для уплотнения и распаковки видеоизображения, необходимо применять одинаковую форму групп пикселей.
Определение величин приоритета
Затем для каждого пикселя р0 группы пикселей вычисляют приоритет относительно его группы пикселей. При этом каждый пиксель 0-419 кадра становится однажды опорным пикселем р0. При этом, согласно изобретению предусмотрено, что вычисление величин приоритета пикселей по возможности осуществляется в рамках параллельной обработки данных. Оптимальным является, когда вычисление приоритетов всех пикселей кадра выполняется одновременно. Поскольку речь идет о видеосигнале, то величины приоритета всех пикселей постоянно вычисляются вновь, так как содержание кадра постоянно изменяется. Однако множество групп пикселей, в частности, с низким приоритетом с высокой вероятностью не изменяются.
Для вычисления приоритета можно использовать различные методы вычислений. В качестве примера в данном случае применяется линейный метод.
Для этого отдельные величины Р0, Р1, Р2, Р3 и Р4 пикселей одной группы раскладывают на составляющие цвета красный, зеленый, голубой. Каждую из этих величин цвета представляют 8 битами. Для каждого цвета каждого пикселя Р1-Р4 определяют величину разницы цвета относительно Р0, например Р0_красный-Р1_красный, Р0_красный-Р2_красный,,,,. Р0_синий-Р4_синий. Абсолютные разностные величины цвета складывают и делят на число цветов и число рассматриваемых пикселей. Результат является величиной приоритета для рассматриваемой группы пикселей. Эта величина приоритета тем больше, чем больше различаются величины цвета отдельных пикселей группы.
Другие методы определения величин приоритета заключаются в использовании величин серого или максимальной величины цветоразности одного цвета. Поскольку сама величина приоритета позже не передается, соответственно не сохраняется, то способ определения величины приоритета не имеет непосредственного влияния на декодирование.
За счет определения приоритетов достигается то, что зоны кадра, которые имеют большое изменение цвета или контраста, например кромки, получают высокий приоритет, а относительно неизменное содержимое кадра, например голубое небо, имеет низкий приоритет.
Сортировка величин приоритета
На этой стадии сортируют величины приоритетов по мере убывания их величин. Сортировку выполняют после определения каждой новой величины приоритета. Таким образом, для каждого момента времени имеют упорядоченный по приоритетам список групп пикселей, которые рассортированы в убывающем порядке. Желательно разработать соответствующие устройства получения изображения (микросхемы с зарядовой связью - CCD-chips), которые выдают непосредственно такой упорядоченный по приоритету список. Если подлежащее уплотнению изображение получают непосредственно с помощью камеры или сканера на основе приборов с зарядовой связью, то существует принципиальная возможность получать из имеющейся в камере/сканере, обрабатывающей изображение микросхемы, непосредственно сортированную по приоритетам матрицу. Тем самым при уплотнении экономится существенная часть затрат на вычисления.
Обновление величин приоритета
В противоположность неподвижным изображениям (например, фотоснимкам) в видеоинформации существует постоянное изменение приоритетов групп пикселей, например, вследствие поворота камеры или движения объектов. Для демонстрации этого на фиг.3-5 показана матрица кадра в разные моменты времени t1-t3, при этом один объект смещается справа налево.
Согласно фиг.1 кадр в момент времени t1 содержит объект, который заполняет пиксели 156, 157, 176, 177, 191-197, 211-217. 231-237, 256, 257, 276, 277. Для вычисления приоритетов пикселей (0-419) кадра применяют обведенную толстой линией на фиг.2 форму группы пикселей (внизу слева). Получают распределение приоритетов пикселей, показанное, например, далее в описании способа в таблице 1 для момента времени t1. Таблица содержит, соответственно, лишь номер опорного пикселя (р0) одной группы пикселей. Те группы пикселей, которые находятся в краевой зоне объекта и в которых соответствующий опорный пиксель (р0) имеет наибольшее отличие от других пикселей группы, получают наивысший приоритет А. Группы пикселей, опорный пиксель которых имеет меньшее отличие от остальных пикселей группы, получают средний приоритет В, а те группы пикселей, опорный пиксель которых вообще не имеет отличия от остальных пикселей группы, получают самый низкий приоритет С.
Таблица 1
Приоритет А Приоритет В Приоритет С
Момент 175,255,231,191, 177,197,217,237,257, 0,1,2,3,4,5,6,7,8,9,
времени t1 156,157,277,276 176,256,211,192,... 10,11,12,13,14,15,...
Момент 189,173,154,155, 175,195,215,235,255, 0,1,2,3,4,5,6,7,8,9,
времени t2 274,275,253,229 190,191,192,193,... 10,11,12,13,14,15,...
Момент 187,171,227,251, 173,193,213,233,253, 0,1,2,3,4,5,6,7,8,9,
времени t3 152,153,272,273 188,189,190,191,... 10,11,12,13,14,15,...
... ... ... ...
В рамках уплотнения сначала передают, соответственно сохраняют, снабженные приоритетом А группы пикселей, затем группы пикселей с приоритетом В и наконец группы пикселей с приоритетом С. Поскольку объект в это время перемещается и принимает относительно показанного на фиг.3 другое положение, показанное на фиг.4 и 5, то изменяются приоритеты отдельных групп пикселей. Список приоритетов обновляется и тотчас продолжается передача текущих групп пикселей с наивысшим приоритетом.
Вновь вычисленные приоритеты групп пикселей для момента времени t2 (фиг.4) и t3 (фиг.5) показаны в таблице 1.
Таким образом, возможная уплотненная передача видеосигнала согласно таблице 1 может выглядеть следующим образом:
Момент времени t1: передают группы пикселей с наивысшим приоритетом А:
175,255,231,191,156,157,277,276,177,197,217.
В момент времени t2 выявляют новые приоритеты. Другие группы пикселей получают наивысший приоритет А. Передачу продолжают для нового приоритета А:
189,173,154,155,274,275,253,229.
Затем следует передача групп пикселей с приоритетом В:
175,195,215,235,255,190,191,192,193,...
В момент времени t3 выявляют новые приоритеты. Другие группы пикселей получают наивысший приоритет А. Передачу продолжают для нового приоритета А:
187,171,227,251,152,153,272,273.
В дополнительной матрице проверяют, какие группы пикселей уже были переданы. Если группа пикселей уже передана, то ее не надо передавать во второй раз, если за это время не изменился ее приоритет. Определенные зоны изображения, например лица, можно распознавать и передавать предпочтительно. Дополнительно к этому, приемник может также затребовать определенные группы пикселей (например, при распознавании ошибок передачи с помощью контроля с использованием избыточного циклического кода). Такие затребованные группы пикселей могут получать затем более высокий приоритет, так что они тотчас передаются.
Передача/сохранение групп пикселей
Понятия "сохранять" и "передавать" используются в последующем как синонимы. Сначала передают, соответственно сохраняют, некоторые характеристики видеоизображения. В качестве примера можно назвать
- ширину изображения (в пикселях),
- высоту изображения (в пикселях),
- примененная форма группы пикселей (нет необходимости, если стандартизована только одна форма).
Наконец, передают, соответственно сохраняют, отдельные группы пикселей в соответствии с их приоритетом, т.е. сначала сохраняют группы пикселей с высоким приоритетом (а позже также сначала считывают).
Для этого сначала сохраняют величину положения опорного пикселя р0 группы пикселей. Затем сохраняют величины пикселей Р0, Р1, Р2, Р3, Р4.
Пример
Величина Р0 положения, величины пикселей Р0, Р1, Р2, Р3, Р4; следующая величина Р0 положения (с тем же или более низким приоритетом), величины пикселей Р0, Р1, Р2, Р3, Р4, ..., следующая величина Р0 положения, величины пикселей Р0, Р1, Р2, Р3, Р4.
Сохранение можно оптимировать с помощью различных методов, которые приводятся здесь лишь в качестве примеров. Можно осуществлять кодирование длины прохождения групп пикселей. Например, если в одной зоне изображения нет составляющих красного, то это можно передавать вместо 8 бит (красный) лишь с помощью, например, 2 бит, или же можно использовать число направляющих нулей. Кроме того, можно применять широко применяемые методы уплотнения, например формат уплотнения. За счет установки предельного значения для позиционирования можно обеспечивать определенное качество. Например, можно задать предельное значение для величин различия пикселей, ниже которого соответствующая группа пикселей всегда получает самую низкую величину приоритета. Если сначала передавать 4 группы пикселей угловых точек, то обеспечивается возможность вычисления с помощью небольшого числа групп пикселей возможно большей поверхности.
Реконструкция (распаковка) видеоданных
Генерирование новой матрицы изображения
При реконструкции уплотненных видеоданных сначала создают матрицу изображения, аналогичную показанной на фиг.1. Для этого считывают и оценивают характеристики изображения. Например, это ширина изображения, высота изображения и форма применяемой для уплотнения группы пикселей. Если высота изображения и ширина изображения первоначального изображения не совпадают с желаемым изображением (например, ограниченный дисплей персонального цифрового секретаря или экран с большим разрешением), то необходимо применять соответствующее масштабирование. Для этого сначала определяют коэффициенты пересчета (ширина изображения_оригинал/ширина изображения_дисплей и высота изображения_оригинал/высота изображения_дисплей). Эти коэффициенты пересчета можно использовать для пересчета величины положения первоначального изображения в величину положения нового дисплея.
Ввод групп пикселей
Как показано на фиг.6, затем считывают последовательно группы пикселей в соответствии с их приоритетами. Например, в матрицу изображения вводят первые четыре группы пикселей с наивысшим приоритетом. На фиг.6 это группы пикселей в углах изображения. Положение опорного пикселя р0 соответствующей группы пикселей задается более темными полями 21, 38, 381, соответственно 398. Эта величина положения (р0) находится в виде целого числа в сохраненном файле. Затем можно вводить в новую матрицу относящиеся к соответствующей группе пикселей темно-серые величины пикселей (р1-р4). Расположенные между ними светло-серые величины пикселей можно затем вычислить из темно-серых и черных полей. Для вычисления сначала раскладывают известные величины пикселей на их составляющие части красный, зеленый и синий. Затем вычисляют среднее значение каждого цвета, например пиксель(22) = (пиксель(2) + пиксель(21) + пиксель (42)/3).
Заполнение поверхностей
Затем уже имеющиеся группы пикселей соединяют друг с другом линиями. Это показано на фиг.7. Получаются треугольники, углы которых заданы соответствующими группами пикселей. Ниже это поясняется на примере линии между позицией пикселя 2 и позицией пикселя 17. Изменение цвета на линии вычисляют на основании величин цвета пикселей 2 и 17. Сначала определяют число пикселей между этими двумя позициями, в данном примере их 14. Затем для каждого цвета (красного, зеленого, синего) определяют цветоразность, например величина цвета в позиции 2=2; величина цвета в позиции 17=30 дает цветоразность 28. Увеличение величины цвета на один пиксель - от пикселя 2 до пикселя 17 - вычисляют как цветоразность/число пикселей (в данном примере 28/14=2).
Оставшуюся поверхность заполняют проведением горизонтальных линий, например, из позиции 63 в позицию 74, из позиции 82 в позицию 93 и т.д. В этом случае также вычисляют предварительный ход изменения цвета между точками, как указывалось выше.
Как показано на фиг.8, каждая дополнительно введенная группа пикселей образует дополнительные треугольники, которые можно заполнять соответствующим образом. После того как сначала заполнят всю поверхность за счет использования 4 угловых точек (21, 38, 398, 381), можно затем с помощью каждой дополнительной группы пикселей делать разрешение все более тонким. Добавление группы пикселей 87 приводит к 4 треугольникам с опорными точками (21,38,87), (21,87,381), (381,87,398), (398,87,38). Если внутри одного такого треугольника, например 87,381,398, добавить другую группу пикселей (247), то возникают 3 новых треугольника (247,381,398), (247,87,381) и (247,87,398). Таким образом, каждая новая группа пикселей создает 3 новых треугольника, которые можно заполнять. Чем больше будет введено групп пикселей, т.е. чем больше будет образовано треугольников, тем ближе подходит вычисленный ход изменения цвета к действительному ходу изменения цвета изображения. Поскольку с этого момента возникают лишь новые треугольники, то можно применять для вычисления оптимированные способы. Кроме того, соответствующие 3 вновь возникших треугольника можно вычислять параллельно для увеличения скорости обработки. Дополнительные возможности параллельной обработки возникают, если новые группы пикселей добавлять в разных зонах изображения.
В описанных выше стадиях способа было заранее принято, что содержимое изображения не изменяется. Если содержимое изображения изменяется, то снова распределяют приоритеты отдельных групп пикселей и передают текущие группы пикселей с наивысшим приоритетом. Изменяется лишь последовательность передаваемых в данный момент и вводимых в кадр групп пикселей. Однако в указанном выше принципе реконструкции изображения ничего не изменяется.
Однако для учета изменений содержимого изображения во времени можно создавать дополнительные матрицы (с размером матрицы изображения). Они могут содержать данные о
- времени, т.е. когда в последний раз была вычислена, соответственно передана, величина пикселя;
- основе вычисления, т.е. какой переданный пиксель использовался для вычисления величины пикселя;
- вероятности/точности, т.е. была величина пикселя передана или вычислена; если она была вычислена, то каково различие групп пикселей, из которых была вычислена новая величина;
- отклонении уже вычисленных величин пикселей от переданных затем величин пикселей.
Из этих величин можно затем определить зоны изображения, в которых часто происходят изменения групп пикселей. Смежные группы пикселей, или даже полные зоны, как правило, претерпевают аналогичные изменения, например изменения яркости, изменения цвета. За счет оценки этих изменений можно, как правило, определять объекты и их динамическое поведение, например объект, который перемещается в видеоизображении. Равномерные изменения относительно всей матрицы изображения могут указывать, например, на поворот камеры. Если оценивать эту информацию, например, с помощью способных к обучению нейронных сетей, то можно очень легко выполнять оценку величин пикселей еще непереданных групп пикселей. Если такие оценки правильные, то можно идентифицировать группы пикселей, которые оказывают особое влияние на изменение объектов. Если эти группы снова запрашивают из источника, то можно точно определить и предсказать движения объекта с помощью лишь немногих групп пикселей. На практике это означает, что хотя в распоряжении имеется лишь небольшая ширина полосы, возникает время задержки, которое значительно меньше, чем в основанном на кадрах способе. Оценка дополнительно генерируемых в приемнике матриц обеспечивает также хорошее распознавание объектов.
В зависимости от имеющихся в распоряжении ресурсов можно наряду с определением приоритетов чисто на основе величин цвета смежных пикселей использовать также зависимости положения снабженных приоритетом групп пикселей. Для пояснения ниже приводится случай применения. Если рассматривать на море горизонт, то он представляется горизонтальной линией. Можно ожидать, что величины приоритета каждой группы пикселей вдоль этого горизонта примерно одинаковы. В этом случае наиболее удаленные друг от друга точки линии горизонта имеют наибольшую информативность. За счет передачи самой левой и самой правой групп пикселей горизонта уже можно снова реконструировать его.
Другая возможность распределения приоритетов заключается в более высокой оценке определенных зон изображения. Такой зоной изображения могут быть, например, лица. Хотя на сделанных во время отпуска фотоснимках лица иногда занимают лишь незначительную часть всего изображения, при рассмотрении они в большинстве случаев находятся в центре внимания. Такое свойство зрения человека можно учитывать с помощью соответствующего распределения приоритетов групп пикселей этой зоны изображения (зоны лиц). Также могут получать более высокий приоритет группы пикселей в центре видеоизображения.
Другая возможность оптимирования состоит в том, что смежные группы пикселей накладываются друг на друга. За счет правильного выбора групп пикселей можно избежать повторной передачи перекрывающихся величин пикселей смежных групп.
Объем вычислений, используемый для декодирования, можно свободно масштабировать. При небольших дисплеях (например, ручных) необходим, естественно, меньший объем вычислений, чем при воспроизведении на большом экране высокого разрешения, хотя оба используют одинаковый исходный поток данных, состоящий из снабженных приоритетом групп пикселей. Это свободное масштабирование позволяет изготовителям терминалов снабжать свои приборы специальным оптимированием, например числом объектов, предысторией изменений изображения. Для изготовителей появляется возможность отличиться от своих конкурентов, не нарушая совместимости передачи видеоизображения.

Claims (11)

1. Способ уплотнения видеоданных, которые состоят из матрицы отдельных точек изображения (пикселей), при этом каждый пиксель (0-419) имеет изменяющуюся во времени величину пикселя, которая описывает цветную или яркостную информацию пикселя, отличающийся тем, что содержит стадии
a) определения величин приоритета для каждого пикселя матрицы посредством заданного пикселя в качестве опорного пикселя (Р0) и вычисления величины различия пикселей на основе соответствующей моментальной величины пикселя опорного пикселя (Р0) относительно моментальных величин заранее заданной группы смежных пикселей (Р1-Р4);
b) объединения использованных для вычисления величины приоритета пикселей в одну группу пикселей (Р0-Р4);
c) сортировки групп пикселей на основе величины их приоритета соответствующего опорного пикселя (Р0) и занесения в матрицу приоритетов и
d) сохранения и/или передачи групп пикселей в соответствии с их приоритетом в матрице приоритетов,
при этом стадии а)-d) постоянно повторяют, причем величины приоритета групп пикселей постоянно определяют вновь и матрица приоритетов в каждый момент времени содержит рассортированные по текущим приоритетам группы пикселей и предпочтительно сначала сохраняются и передаются те группы пикселей, которые имеют наивысший приоритет и до сих пор еще не передавались.
2. Способ по п.1, отличающийся тем, что величину различия пикселей определяют из разности величины рассматриваемого пикселя и величины каждого из рассматриваемых смежных ему пикселей группы пикселей.
3. Способ по п.1 или 2, отличающийся тем, что сначала сохраняют и/или передают характеристики видеоизображения, такие как ширина изображения в пикселях, высота изображения в пикселях и форма применяемой группы пикселей.
4. Способ по любому из пп.1-3, отличающийся тем, что для каждой группы пикселей сохраняют или передают позицию опорного пикселя (Р0), его величину, а также величину остальных пикселей (Р1-Р4) группы пикселей.
5. Способ по любому из пп.1-4, отличающийся тем, что группам пикселей определенных зон изображения придают повышенный приоритет.
6. Способ по любому из пп.1-5, отличающийся тем, что выполняют постоянное определение и выдачу рассортированных по приоритетам групп пикселей уже с помощью применяемой системы съемки изображения, такой как, например, сканер, камера с зарядовой связью.
7. Способ по любому из пп.1-6, отличающийся тем, что можно применять карты захвата кадра (соответственно, решения программного обеспечения) для преобразования имеющегося видеоматериала самых различных форматов (например, AVI, MPEG-1, MPEG-2, MPEG-4, ...).
8. Способ реконструкции видеоданных, которые были получены с помощью способа по пп.1-7, отличающийся тем, что группы пикселей, сохраняемые и/или передаваемые согласно способу по пп.1-7, считываются и представляются в виде матрицы изображения, при этом еще не переданные пиксели вычисляют из уже переданных пикселей.
9. Способ по п.8, отличающийся тем, что содержит стадии
а) генерирования пустой матрицы изображения из считанных характеристик видеоизображения;
b) последовательного считывания сохраненных, соответственно, переданных групп пикселей и ввод в матрицу изображения;
c) образования треугольников за счет соединения соответствующих трех считанных и непосредственно смежных групп пикселей по меньшей мере одной линией;
d) заполнения образующих поверхность треугольников пикселей с помощью вычисленного из образующих треугольник групп пикселей значения изменения цвета и/или яркости и
e) повторения стадий b)-е).
10. Способ по п.9 или 10, отличающийся тем, что треугольники можно масштабировать по их величине и согласовывать с различными разрешениями изображения.
11. Способ по любому из пп.8-10, отличающийся тем, что создается по меньшей мере одна дополнительная матрица по величине изображения матрицы, которая содержит на выбор дополнительные данные о соответствующих значениях пикселей матрицы изображения:
о времени, к которому в последний раз была вычислена, соответственно передана соответствующая величина пикселя изображения матрицы;
основе вычисления, которая описывает, какой переданный пиксель использовался для вычисления соответствующей величины пикселя изображения матрицы;
вероятности или точности, была ли соответствующая величина пикселя изображения матрицы передана или вычислена или каково различие групп пикселей, из которых была вычислена новая величина пикселя;
отклонении соответствующих уже вычисленных величин пикселей изображения матрицы от переданных затем величин пикселей.
RU2003130965/09A 2001-03-21 2002-03-19 Способ уплотнения и распаковки видеоданных RU2276470C2 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE10113880.6 2001-03-21
DE10113880A DE10113880B4 (de) 2001-03-21 2001-03-21 Verfahren zur Komprimierung und Dekomprimierung von Videodaten

Publications (2)

Publication Number Publication Date
RU2003130965A RU2003130965A (ru) 2005-04-27
RU2276470C2 true RU2276470C2 (ru) 2006-05-10

Family

ID=7678464

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2003130965/09A RU2276470C2 (ru) 2001-03-21 2002-03-19 Способ уплотнения и распаковки видеоданных

Country Status (13)

Country Link
US (1) US7130347B2 (ru)
EP (1) EP1371229B1 (ru)
JP (1) JP4102197B2 (ru)
CN (1) CN1278563C (ru)
AT (1) ATE327638T1 (ru)
CA (1) CA2441473C (ru)
CZ (1) CZ20032875A3 (ru)
DE (2) DE10113880B4 (ru)
ES (1) ES2265504T3 (ru)
PL (1) PL206719B1 (ru)
PT (1) PT1371229E (ru)
RU (1) RU2276470C2 (ru)
WO (1) WO2002078352A1 (ru)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10034014B2 (en) 2011-07-02 2018-07-24 Samsung Electronics Co., Ltd. Method and apparatus for coding video, and method and apparatus for decoding video accompanied by inter prediction using collocated image

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10229706A1 (de) * 2002-07-02 2004-12-09 T-Mobile Deutschland Gmbh Verfahren zur Speicherplatzverwaltung in einem Speichrmedium eines digitalen Endgeräts bei einer Datenspeicherung nach dem Verfahren der priorisierten Pixelübertragung
DE10229976B4 (de) * 2002-07-03 2007-06-28 T-Mobile Deutschland Gmbh Verfahren zur Ver- und Entschlüsselung von nach dem Verfahren der priorisierten Pixelübertragung übertragenen oder gespeicherten digitalen Daten
DE10230812B4 (de) 2002-07-08 2004-11-25 T-Mobile Deutschland Gmbh Verfahren zur Übertragung von zusätzlichen Informationen bei Verwendung eines Verfahrens zur Komprimierung von Daten mittels einer priorisierenden Pixelübertragung
DE10230809B4 (de) * 2002-07-08 2008-09-11 T-Mobile Deutschland Gmbh Verfahren zur Übertragung von Audiosignalen nach dem Verfahren der priorisierenden Pixelübertragung
DE10231286B4 (de) 2002-07-10 2004-05-19 T-Mobile Deutschland Gmbh Verfahren zur Übertragung von zusätzlichen Daten innerhalb einer Videodatenübertragung
WO2004077838A1 (de) * 2003-02-27 2004-09-10 T-Mobile Deutschland Gmbh Verfahren zur komprimierten übertragung von bilddaten für eine 3-dimensionale darstellung von szenen und objekten
US7375347B2 (en) 2004-04-26 2008-05-20 Sensors For Medicine And Science, Inc. Systems and methods for extending the useful life of optical sensors
DE102007052622A1 (de) 2007-11-05 2009-05-07 T-Mobile International Ag Verfahren zur Bildanalyse, insbesondere für ein Mobilfunkgerät
DE102007059273A1 (de) * 2007-12-08 2009-06-18 T-Mobile Internationale Ag Virtuelle Tastatur eines mobilen Endgerätes
FI127117B (fi) * 2009-06-17 2017-11-30 Gurulogic Microsystems Oy Kuvaprosessoija ja tietokoneohjelma
DE102010047770B4 (de) * 2010-10-08 2015-05-13 Airbus Operations Gmbh Analysetool für Bussysteme
CN102186067B (zh) * 2011-03-31 2013-10-09 深圳超多维光电子有限公司 一种图像帧的传输方法和装置、显示方法和系统
JP2013005204A (ja) * 2011-06-16 2013-01-07 Sony Corp ビデオ送信装置、ビデオ受信装置、およびビデオ送信方法
US9696424B2 (en) 2014-05-19 2017-07-04 Rockwell Automation Technologies, Inc. Optical area monitoring with spot matrix illumination
US11243294B2 (en) 2014-05-19 2022-02-08 Rockwell Automation Technologies, Inc. Waveform reconstruction in a time-of-flight sensor
US9921300B2 (en) 2014-05-19 2018-03-20 Rockwell Automation Technologies, Inc. Waveform reconstruction in a time-of-flight sensor
US20150334371A1 (en) * 2014-05-19 2015-11-19 Rockwell Automation Technologies, Inc. Optical safety monitoring with selective pixel array analysis
CN105245888A (zh) * 2014-06-11 2016-01-13 富士通株式会社 图像压缩方法和图像压缩装置
US9625108B2 (en) 2014-10-08 2017-04-18 Rockwell Automation Technologies, Inc. Auxiliary light source associated with an industrial application
US11044466B2 (en) 2018-01-26 2021-06-22 Samsung Electronics Co., Ltd. Image processing device

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE6922682U (de) 1969-06-06 1970-02-12 Blaupunkt Werke Gmbh Drahtwiderstand
JP3276985B2 (ja) * 1991-06-27 2002-04-22 ゼロックス・コーポレーション イメージピクセル処理方法
JPH05244435A (ja) 1992-02-28 1993-09-21 Fujitsu Ltd 画像の階層符号化方法および画像符号化装置
GB2270811B (en) * 1992-09-17 1996-02-07 Sony Broadcast & Communication Video data compression
KR0155784B1 (ko) * 1993-12-16 1998-12-15 김광호 영상데이타의 적응형 가변장 부호화/복호화방법
JP2797959B2 (ja) * 1994-03-12 1998-09-17 日本ビクター株式会社 多次元画像圧縮伸張方法
EP0705027B1 (en) * 1994-09-30 2000-11-22 SANYO ELECTRIC Co., Ltd. Image communication system and method for data compression of colour images using colour tables and region-based processing
KR100249028B1 (ko) * 1995-03-20 2000-03-15 전주범 정지영상을 가진 영상신호를 부호화/복호화하기 위한 부호화/복호화시스템
AU6753096A (en) * 1995-08-14 1997-03-12 Barkfort Limited A method and apparatus for compressing digital image data
DE19541457C1 (de) * 1995-11-07 1997-07-03 Siemens Ag Verfahren zur Codierung eines Videodatenstroms einer aus Bildblöcken bestehenden Videosequenz

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10034014B2 (en) 2011-07-02 2018-07-24 Samsung Electronics Co., Ltd. Method and apparatus for coding video, and method and apparatus for decoding video accompanied by inter prediction using collocated image
RU2665230C1 (ru) * 2011-07-02 2018-08-28 Самсунг Электроникс Ко., Лтд. Способ и устройство для кодирования видео, а также способ и устройство для декодирования видео, сопровождаемого взаимным прогнозированием с использованием совместно размещенного изображения
US10397601B2 (en) 2011-07-02 2019-08-27 Samsung Electronics Co., Ltd. Method and apparatus for coding video, and method and apparatus for decoding video accompanied by inter prediction using collocated image

Also Published As

Publication number Publication date
RU2003130965A (ru) 2005-04-27
JP4102197B2 (ja) 2008-06-18
ATE327638T1 (de) 2006-06-15
CA2441473C (en) 2012-07-17
US7130347B2 (en) 2006-10-31
DE50206894D1 (de) 2006-06-29
US20040095996A1 (en) 2004-05-20
PL206719B1 (pl) 2010-09-30
CN1278563C (zh) 2006-10-04
CA2441473A1 (en) 2002-10-03
PL368828A1 (en) 2005-04-04
EP1371229A1 (de) 2003-12-17
WO2002078352A1 (de) 2002-10-03
ES2265504T3 (es) 2007-02-16
PT1371229E (pt) 2006-09-29
EP1371229B1 (de) 2006-05-24
DE10113880B4 (de) 2004-04-29
DE10113880A1 (de) 2002-10-17
CZ20032875A3 (cs) 2004-01-14
CN1498501A (zh) 2004-05-19
JP2004534434A (ja) 2004-11-11

Similar Documents

Publication Publication Date Title
RU2276470C2 (ru) Способ уплотнения и распаковки видеоданных
US9967580B2 (en) Encoding and decoding selectively retrievable representations of video content
EP1259081B1 (en) Encoding continuous image data
US8254702B2 (en) Image compression method and image processing apparatus
FI107495B (fi) Menetelmä ja järjestely koodatun digitaalisen kuvabittivirran volyymin tai tahdin pienentämiseksi
TWI505694B (zh) 編碼器及編碼方法
US9167199B2 (en) Image input apparatus with high-speed, high-quality still image successive capturing capability and still image successive capturing method using the same
WO2005083636A1 (es) Método y sistema de codificación digital de imágenes de video 3d estereoscópicas
CN101998051A (zh) 图像显示控制装置、图像处理装置及搭载其的摄像装置
EP1527613B1 (en) Method and apparatus for encoding a digital video signal
CN112511896A (zh) 一种视频渲染方法及装置
US20220217400A1 (en) Method, an apparatus and a computer program product for volumetric video encoding and decoding
CN102308582A (zh) 用于对图像进行分割编码的方法
EP0827347A2 (en) Recording and reproducing apparatus for digital image information
RU2279189C2 (ru) Способ уплотнения и распаковки данных изображения
CN111406404B (zh) 获得视频文件的压缩方法、解压缩方法、系统及存储介质
WO2023130896A1 (zh) 媒体数据的数据处理方法、装置、计算机设备及存储介质
KR950009460B1 (ko) 부호화된 칼라 비데오 데이타를 감압하는 방법 및 시스템
CN114424552A (zh) 一种低延迟信源信道联合编码方法及相关设备
US11778196B2 (en) Method and circuit system for compressing video signals based on adaptive compression rate
RU2628198C1 (ru) Способ межканального предсказания и межканальной реконструкции для многоканального видео, снятого устройствами с различными углами зрения
CN117979015A (zh) 视频编解码方法、视频编码器和视频解码器
JP4001943B2 (ja) 画像データ処理装置
JPH09135442A (ja) 画像データ処理装置および方法
JPH10243403A (ja) 動画像符号化装置及び動画像復号化装置

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20170320