RU2534751C1 - Способ и устройство для кодирования и декодирования видео - Google Patents
Способ и устройство для кодирования и декодирования видео Download PDFInfo
- Publication number
- RU2534751C1 RU2534751C1 RU2013128143/07A RU2013128143A RU2534751C1 RU 2534751 C1 RU2534751 C1 RU 2534751C1 RU 2013128143/07 A RU2013128143/07 A RU 2013128143/07A RU 2013128143 A RU2013128143 A RU 2013128143A RU 2534751 C1 RU2534751 C1 RU 2534751C1
- Authority
- RU
- Russia
- Prior art keywords
- resolution
- pixel
- pixels
- low
- phase
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/39—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability involving multiple description coding [MDC], i.e. with separate layers being structured as independently decodable descriptions of input picture data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/187—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/63—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Изобретение относится к передаче видео, и в частности, к передаче видео, предоставляющего масштабируемое разрешение изображения и улучшенную устойчивость к ошибкам. Техническим результатом является снижение сложности обработки изображения. Предложен способ и устройство кодирования/декодирования видео, которые выполняют преобразование по меньшей мере участка видеокадра высокого разрешения в изображение низкого разрешения и множество наборов данных улучшения. Далее кодируют изображение низкого разрешения, как первичное кодированное изображение в формате потока битов, и кодируют каждый из множества наборов данных улучшения, как различное избыточное кодированное изображение в формате потока битов. Для декодирования генерируется декодированное изображение низкого разрешения и множество декодированных наборов данных улучшения и выполняется обратное преобразование для создания декодированного изображения высокого разрешения. Первичное кодированное изображение и избыточное кодированное изображение могут форматироваться согласно спецификации ITU-T H.264 Advanced Coding, а преобразование может быть многофазным или субполосным преобразованием. 4 н. и 6 з.п. ф-лы, 10 ил.
Description
РОДСТВЕННЫЕ ЗАЯВКИ
Настоящая заявка связана со следующей заявкой на выдачу патента США, находящейся в общей собственности с этой заявкой у корпорации Моторола (Motorola, Inc.): Порядковый № 11/866771, подана 3 октября 2007 года, озаглавлена "METHOD AND APPARATUS FOR INTRA FRAME SPATIAL SCALABLE VIDEO CODING (СПОСОБ И УСТРОЙСТВО ДЛЯ ВНУТРИКАДРОВОГО ПРОСТРАНСТВЕННОГО МАСШТАБИРУЕМОГО КОДИРОВАНИЯ ВИДЕО)" (досье поверенного под номером CML04718EV).
ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ
Настоящее изобретение в целом относится к передаче видео, более конкретно к методикам передачи видео, предоставляющего масштабируемое разрешение изображения и улучшенную устойчивость к ошибкам.
УРОВЕНЬ ТЕХНИКИ
В стандарте кодирования видео H.264/AVC, датированном 3/2005, каждый блок доступа (стр. 4, часть 3.1, определение "блока доступа") содержит кодированное первичное изображение для предоставления требуемой информации для представления кодированного движущегося изображения. Блок доступа может дополнительно вмещать в себя одно или более избыточных кодированных изображений, которые "не имеют нормативного влияния на процесс декодирования". Часть 7.4.3 ("семантика заголовка последовательности макроблоков: redundant_pic_cnt") этих стандартов утверждает: “Процесс декодирования не требуется для кодированной последовательности макроблоков или разделения данных кодированной последовательности макроблоков избыточного кодированного изображения. Когда redundant_pic_cnt в заголовке последовательности макроблоков кодированной последовательности макроблоков больше чем 0, декодер может отбрасывать кодированную последовательность макроблоков. Примечание 6 - Когда некоторые из отсчетов в декодированном первичном изображении не могут быть корректно декодированы из-за ошибок и потерь в передаче последовательности, а кодированная избыточная последовательность макроблоков может быть декодирована корректно, декодер должен заменить отсчеты декодированного первичного изображения соответствующими отсчетами декодированной избыточной последовательности макроблоков. Когда более чем одна избыточная последовательность макроблоков покрывает релевантную область первичного изображения, должна быть использована избыточная последовательность макроблоков, имеющая наименьшее значение redundant_pic_cnt." Таким образом, наличие одного или более избыточных кодированных изображений в закодированном потоке битов является необязательным, и использование по назначению (но не требуемое использование) избыточного кодированного изображения - коррекция ошибок передачи в первичном кодированном изображении. Wikipedia.com представила (15 марта 2008) свойство избыточного кодированного изображения H.264 следующим образом: "Избыточные последовательности макроблоков (RS), свойство устойчивости к ошибкам/потерям, позволяющее кодеру отправлять дополнительное представление области изображения (типично с меньшей точностью), которое может быть использовано, если первичное представление повреждено или потеряно."
Ранее опубликованная новая версия стандарта MPEG-4 AVC/H.264 дополнительно предоставляет инструменты масштабируемого кодирования видео и позволяет декодеру восстанавливать либо первичное закодированное изображение, либо форму первичного кодированного изображения более высокого разрешения. Однако эти инструменты нового стандарта кодирования, влекущие повышенную сложность реализации, не были быстро освоены промышленностью.
КРАТКОЕ ОПИСАНИЕ ФИГУР
Сопроводительные фигуры, на которых схожие ссылочные номера указывают на идентичные или функционально похожие элементы на всем протяжении отдельных обзоров и которые вместе с подробным описанием ниже включены в и формируют часть описания изобретения, и служат для дополнительной иллюстрации вариантов осуществления идей, которые включают в себя заявленное изобретение, и объяснения различных принципов и преимуществ этих вариантов осуществления.
Фиг.1 - диаграмма, которая показывает участок цветного видео кадра, в соответствии с определенными вариантами осуществления.
Фиг.2 и фиг.3 - это, соответственно, функциональная блок-схема и блок-схема последовательности операций устройства и некоторых этапов способа для кодирования по меньшей мере участка видеокадра в соответствии с определенными вариантами осуществления.
Фиг.4 - блок-схема последовательности операций, которая показывает этап способа для выполнения преобразования в соответствии с определенными вариантами осуществления.
Фиг.5 - блок-схема функции преобразования в соответствии с определенными вариантами осуществления.
Фиг.6 - диаграмма, которая иллюстрирует структуру отсчетов для участка видео кадра, в соответствии с определенными вариантами осуществления.
Фиг.7 - блок-схема последовательности операций, которая показывает некоторые этапы способа выполнения преобразования, в соответствии с определенными вариантами осуществления.
Фиг.8 и фиг.9 - это, соответственно, блок-схема декодера и этапы способа для декодирования, представленные в соответствии с определенными вариантами осуществления.
Фиг.10 - блок-схема функции обратного преобразования для усредняющей функции, описанной со ссылкой на Фиг.6.
Специалисты в данной области техники должны понимать, что элементы на фигурах проиллюстрированы для простоты и ясности, и не обязательно были изображены в масштабе. Например, размеры некоторых элементов на фигурах могут быть преувеличены относительно других элементов, чтобы помочь улучшить понимание вариантов осуществления настоящего изобретения.
Устройство и компоненты способа были представлены, где это уместно, традиционными символами на чертежах, показывая только те специфические подробности, которые имеют отношение к пониманию вариантов осуществления настоящего изобретения, с тем чтобы не затруднять раскрытие подробностями, которые будут без труда очевидны специалистам в данной области, что принесет пользу описанию настоящей заявки.
ПОДРОБНОЕ ОПИСАНИЕ
В соответствии с определенными аспектами настоящих вариантов осуществления, описываются методики, которые предоставляют преобразование первоначального видеокадра высокого разрешения в изображение низкого разрешения и множество наборов данных улучшения, которые затем кодируются и могут быть переданы как кодированные потоки битов. Изображение низкого разрешения может быть декодировано и использовано для генерирования версии низкого разрешения восстановленного видеокадра высокого разрешения. Изображение низкого разрешения и множество наборов данных улучшения могут быть декодированы и обратно преобразованы, чтобы создать декодированный видеокадр высокого разрешения. В некоторых вариантах осуществления, образ действий, которым кодируется и декодируется видео, совместим со спецификацией, опубликованной Международным Телекоммуникационным Союзом, которая идентифицируется как спецификация ITU-T H.264 от 03/2005, озаглавленная как "SERIES H: AUDIOVISUAL AND MULTIMEDIA SYSTEMS Infrastructure of audiovisual services - Coding of moving video/Advanced video coding for generic audiovisual services (Серия H: аудиовизуальные и мультимедийные системы. Инфраструктура аудиовизуальных служб - Кодирование движущегося видео/Усовершенствованное видео кодирование для общих аудиовизуальных служб)", которая в дальнейшем в материалах настоящей заявки будет указываться ссылкой как "ITU-T H.264 Advanced Coding"; и эквивалентной спецификацией, опубликованной экспертной группой по движущимся изображениям, которая, как правило, указывается ссылкой как спецификация MPEG-4 Part 10 AVC. К тому же, образ действий, посредством которого видео кодируется и декодируется, может быть совместим с еще не выпущенными спецификациями. В частности, методики, описанные в материалах настоящей заявки, выявляют новое использование средства избыточного изображения, которое не имеет нормативного влияния на процесс декодирования, в сочетании с субполосным кодированием и кодированием с многократным описанием (MDC). Эти методики могут также быть совместимы с методиками кодирования видео, отличными от специфицированных в ITU-T H.264 Advanced Coding.
Субполосное/вейвлетное преобразование разлагает входное изображение в сигнальное представление множественного разрешения. В литературе было продемонстрировано, что этот способ является одним из наиболее эффективных способов для сжатия; и он используется в международном стандарте JPEG 2000 для приложений, кодирующих изображение и видео (в формате Motion JPEG 2000) в промышленности. Благодаря высокоэнергетическому сжатию субполосного/вейвлетного преобразования, субполосные/вейвлетные кодеры способны достигать отличной эффективности сжатия, без традиционных блочных артефактов, ассоциированных с блочным преобразованием. Что более важно, они легко могут приспосабливать желательные пространственно масштабируемые кодирующие функциональные средства почти без ухудшения в эффективности сжатия, так как вейвлетное субполосное преобразование является преобразованием масштабируемого разрешения по своему характеру.
Определенные формы многофазной понижающей дискретизации использовались в кодировании по множественным наборам признаков. Кодирование видео с многократным описанием (MD) является одним из подходов для одновременного (simulcast) и многоадресного (multicast) вещания видео по подверженным ошибкам сетям. Кодирование видео с многократным описанием концептуально отличается от традиционного многослойного масштабируемого кодирования видео, доступного в гибридных кодеках, таких как MPEG-2, MPEG-4 и семействе спецификаций H.26x. В MD кодировании видео генерируется некоторое количество в равной степени важных дескрипторов видео, и, возможно, передается через различные каналы передачи или пути. Каждый дескриптор видео является индивидуально декодируемым и способным к воспроизведению первоначального разрешения видео, хотя, возможно, в более низком качестве. Поэтому кодированное видео может быть восстановлено и потреблено удаленным пользователем, как только один, по меньшей мере один, набор признаков был успешно принят. Понятие иерархических видеослоев не применяется, следовательно, чем больше дескрипторов видео доступны приемнику, тем выше качество декодируемого видео, независимо от порядка принятых дескрипторов. Другими словами, кодирование видео с многократным описанием устраняет зависимости между слоями, и, по этой причине, назначение приоритета видеослоя, введенное традиционным многослойным кодированием, больше не является необходимым.
Фиг.1 - диаграмма, которая показывает структуру отсчета для участка 100 цветного видео кадра, в соответствии с определенными вариантами осуществления. Она схожа с Фиг.6-1 спецификации ITU-T H.264 Advanced Coding, которая озаглавлена "Nominal vertical and horizontal locations of 4:2:0 luma and chroma samples in a frame (Номинальные вертикальные и горизонтальные расположения 4:2:0 отсчетов яркости и цветности в кадре)". На фиг.1 отсчеты 105 яркости видеокадра показаны знаками X и один из двух ассоциированных наборов отсчетов 110 цветности показаны знаками O. Отсчеты цветности в другом наборе цветности находились бы в тех же позициях, показанных для отсчетов 110 цветности. Число отсчетов 105 яркости связано с разрешением и размером видео изображения в кадре. Число отсчетов цветности связно с числом отсчетов яркости. Фиг.1 иллюстрирует заданный видеокадр в формате 4:2:0, в котором число отсчетов цветности составляет ¼ от числа отсчетов яркости. Стандарт ITU-T H.264 Advanced Coding предусматривает другие соотношения, такие как 1 к 1 и ½ к 1. Конечно, одноцветное изображение не имеет отсчетов цветности. Когда видео кадр или участок видео кадра, такой как сегмент, макроблок или область, представляющая интерес, кодируется, например, в соответствии со стандартом ITU-T H.264 Advanced Coding, операции, производимые на отсчетах яркости, также производятся на отсчетах цветности, отмасштабированных по количеству отсчетов цветности. То же самое верно для уникальных операций, заданных в материалах настоящей заявки. Чтобы упростить описание операций, они описываются в терминах пикселей, при этом пиксель можно считать отсчетом яркости или отсчетом цветности. Чтобы дополнительно упростить термины, используемые в материалах настоящей заявки, когда используется термин "участок", он означает "по меньшей мере, участок", что может включать часть, части или целое. Когда видеокадр является цветным кадром, описанные операции выполняются на наборах отсчетов яркости и цветности для участка видеокадра, отмасштабированного по размерам наборов отсчетов.
Фиг.2 и фиг.3 - это соответственно функциональная блок-схема 200 и блок-схема 300 последовательности операций устройства, и некоторые этапы способа для кодирования по меньшей мере участка видеокадра в соответствии с определенными вариантами осуществления. Со ссылкой на Фиг.2, информация из последовательности 205 видеокадров присоединяется к входу 210 функции 215 преобразования. Типично информация обрабатывается по одному видеокадру одновременно, или, по меньшей мере, участку (такому как последовательность макроблоков) видеокадра. В этом примере, видеокадр 206 из последовательности 205 видеокадров обрабатывается функцией 215 преобразования. Видеокадр 206 является видеокадром высокого разрешения. Функция 215 преобразования преобразует (305, фиг.3) по меньшей мере участок видеокадра 206 (фиг.2) в изображение 220 низкого разрешения и множество наборов 225, 230, 235 данных улучшения. В примере, показанном на фиг.2, имеется три набора 225, 230, 235 данных улучшения. Множество наборов данных улучшения по количеству может отличаться от трех в некоторых вариантах осуществления. Преобразование, использованное функцией 215 преобразования, имеет несколько вариантов осуществления, как описано более подробно ниже. Типы преобразований, которые используются функцией 215 преобразования в определенных вариантах осуществления таковы, что выполнение обратного преобразования изображения низкого разрешения и множества наборов данных улучшения воссоздает видеокадр (или его участок) высокого разрешения.
Изображение низкого разрешения 220 присоединяется к кодеру 240 первичного изображения (кодер PP), который кодирует изображение низкого разрешения, используя методики кодирования для кодировки первичного изображения, генерируя первичное кодированное изображение 250. Каждый из множества наборов данных улучшения присоединяется к кодеру 245 избыточного изображения (кодеру RP), который кодирует соответствующий набор данных улучшения, используя методики кодирования избыточного изображения, генерируя избыточное кодированное изображение 255, 260, 265. В соответствии с определенными вариантами осуществления, кодер 240 первичного изображения кодирует (310, фиг.3) изображение низкого разрешения как первичное изображение в формате, специфицированном ITU-T H.264 Advanced Coding, и каждый кодер 245 избыточного изображения кодирует (315, фиг.3) один из наборов данных улучшения как другое избыточное кодированное изображение в формате, специфицированном стандартом ITU-T H.264 Advanced Coding. Когда используются методики кодирования, отличные от определенных стандартом ITU-T H.264 Advanced Coding, кодирование, описанное выше, как кодирование первичного изображения, может быть выполнено любым способом кодирования методикой, которая совместима с кодированием изображения низкого разрешения, которое, как правило, декодируется декодером для этой методики, и кодирование, описанное выше, как кодирование избыточного изображения, может быть выполнено любым способом кодирования методикой, которая совместима с кодированием улучшения или дополнительного набора данных - то есть того, который идентифицируется декодером для этой методики, как ассоциированный с видеокадром высокого разрешения, и для которого декодирование может быть необязательным. Форматы изображения и кодирования, использованные для других методик, могут быть идентифицированы по именам, отличным от "первичное кодированное изображение" и "избыточное кодированное изображение". Когда кодирование изображения низкого разрешения в наборе данных улучшения завершено, первичное кодированное изображение 250 и множество избыточных кодированных изображений 255, 260, 265 присоединяется к потоку битов, формируя функцию 270, которая формирует их в поток битов 275, который затем может быть передан (320, фиг.3).
Со ссылкой на фиг.4, блок-схема показывает этап способа для выполнения преобразования в соответствии с определенными вариантами осуществления. В этих вариантах осуществления функция 215 преобразования выполняет 405 субполосное преобразование участка видеокадра высокого разрешения, чтобы генерировать представление низкого разрешения и наборы данных улучшения, как правило, указывающиеся ссылкой как субполосы LL, HL, LH и HH видеокадра (или его участка).
Со ссылкой на фиг.5, показана блок-схема функции 215 субполосного преобразования в соответствии с определенными вариантами осуществления. Функция 215 преобразования содержит гребенки 505, 515 фильтров субполосного анализа, которые являются традиционными субполосными гребенками фильтров, и, в некоторых вариантах осуществления, вейвлетные гребенки фильтров, которые хорошо известны в данной области техники. Входной видеокадр (или его участок) 206 сначала, соответственно, обрабатывается низкочастотным фильтром 506 и высокочастотным фильтром 507, после чего следует операция понижающей дискретизации вдоль вертикального направления изображения, генерирующая промежуточные сигналы 510. Промежуточные сигналы 510 затем, соответственно, обрабатываются низкочастотным фильтром и высокочастотным фильтром, которые имеют одинаковые функции передачи, после чего следует операция понижающей дискретизации вдоль горизонтального направления, генерирующая четыре субполосы LL 220, HL 225, LH 230, и HH 235, которые подвергаются кодированию кодером 240 PP и кодерами 245 RP на фиг.2, соответственно. Этот процесс, как правило, указывается ссылкой как субполосное разложение. Соответствующие гребенки фильтров субполосного синтеза, которые используются в декодере 800 обратной функции 875 (фиг.8) преобразования, могут создавать из четырех декодированных субполос декодированную версию изначального видеокадра 206 высокого разрешения, который был подвергнут разложению гребенками фильтров 505, 515 (фиг.5) субполосного анализа. Фильтры, использованные в гребенках 505, 515 фильтров субполосного анализа/синтеза, могут принадлежать семейству вейвлетных фильтров или семейству квадратурных зеркальных фильтров (QMF), которые являются известными в данной области техники, а структура гребенок субполосных фильтров может иметь структуру, отличную от показанной, которая является известной в данной области техники.
Со ссылкой на фиг.6, диаграмма иллюстрирует участок видеокадра 600 в соответствии с определенными вариантами осуществления. Пиксели участка видеокадра, показанные на фиг.6, были подвергнуты понижающей дискретизации до фаз участка видеокадра. В этом примере понижающая дискретизация выполнялась с множителем два в каждом пространственном измерении. Таким образом, были сформированы четыре уникально разных набора пикселей, каждый из которых содержит приблизительно одну четвертую числа пикселей в участке видеокадра. Одна четвертая указывается как приблизительная величина из-за краевых эффектов. Пиксели четырех различных фаз изображены в виде треугольников, знаков X, квадратов и кругов. Может быть задана окрестность пикселя, что справедливо для любого пикселя в видеокадре. В этом примере окрестность пикселя задана включающей в себя выбранный пиксель, такой как пиксель 615, и другие пиксели заключенные внутри границы 610 окрестности. В общем случае окрестность пикселя может иметь любую форму и размер. Группа фаз пикселя может быть задана для любого пикселя в видеокадре. Группа фаз пикселя включает в себя один пиксель из каждой фазы, расположенной в той же позиции на соответствующей решетке изображения, подвергнутой понижающей дискретизации. В примере фиг.6 был выбран пиксель 615, и он идентифицирует группу фаз пикселя внутри границы 605. Размер группы фаз пикселя определяется коэффициентом понижающей дискретизации. Для целей настоящего документа выбранный пиксель 615 обозначается как пиксель(0, 0). Пиксель, идентифицированный знаком x внутри группы фаз пикселя, обозначается как пиксель (1, 0). Пиксель, идентифицированный квадратом внутри группы фаз пикселя, обозначается как пиксель (0, 1). Пиксель, идентифицированный кругом внутри группы фаз пикселя, обозначается как пиксель (1, 1). Хотя группа фаз пикселя должна иметь согласованную топографическую взаимосвязь с выбранным пикселем конкретной фазы для конкретного варианта осуществления, топографическая взаимосвязь может быть различной в иных вариантах осуществления. Например, группа фаз пикселя, показанная на фиг.6, использует пиксели, которые являются ближайшими соседями выбранного пикселя, и которые находятся справа и ниже от отобранного пикселя, но мог бы быть использован другой набор из четырех уникальных ближайших соседей для группы фаз.
Со ссылкой на фиг.7, блок-схема 700 показывает некоторые этапы способа 700 для выполнения преобразования в соответствии с определенными вариантами осуществления. На этапе 705 функция 215 преобразования формирует множество фаз участка видеокадра 206 высокого разрешения. В примере, показанном на фиг.6, множество равно четырем. На этапе 710 функция 215 преобразования формирует изображение низкого разрешения так, чтобы оно содержало пиксели низкого разрешения, в которых значение каждого пикселя низкого разрешения определяется путем использования усредняющей функции значений пикселей внутри окрестности пикселя каждого пикселя, который находится в первой фазе из множества фаз. На этапе 715 функция 215 преобразования определяет каждый набор данных улучшения из множества наборов данных улучшения как уникальный набор, который содержит все пиксели фазы, отличной от первой фазы. Например, наборы данных улучшения для преобразованного участка видеокадра 600, показанного на фиг.6, будут содержать набор всех пикселей в участке видеокадра 600, обозначенных квадратами, набор всех пикселей в участке видеокадра 600, обозначенных знаками x, и набор всех пикселей в участке видеокадра 600, обозначенных кругами. Стоит отметить, что первая фаза может являться любой конкретной фазой из множества фаз, которые являются пригодными для способа.
В соответствии с определенными вариантами осуществления, усредняющая функция является импульсной функцией, которая определяет значение каждого пикселя низкого разрешения, как равное значению соответствующего пикселя первой фазы. Другими словами, усреднение есть среднее одного числа. В примере, показанном на фиг.6, изображение низкого разрешения просто содержит все пиксели, обозначенные треугольниками.
В соответствии с определенными вариантами осуществления, усредняющая функция определяет значение каждого пикселя низкого разрешения, как равное среднему значений пикселей внутри окрестности пикселя первой фазы. В примере, показанном на фиг.6, значение пикселя изображения низкого разрешения, который связан с пикселем 615 конкретной фазы, определяется усреднением значений девяти пикселей внутри границы 610. В соответствии с определенными вариантами осуществления, усредняющая функция определяет значение каждого пикселя низкого разрешения, как равное среднему значений пикселя внутри группы фаз пикселя первой фазы. В примере, показанном на фиг.6 значение пикселя изображения низкого разрешения, который связан с пикселем 615 первой фазы, может быть определен усреднением значений четырех пикселей внутри границы 605.
В соответствии с определенными вариантами осуществления число фаз равно четырем. Четыре пикселя, идентифицированные со ссылкой на фиг.6 треугольником, знаком x, квадратом и кругом в каждой группе фаз пикселя, альтернативно идентифицируются, соответственно, как пиксели (0, 0), (0, 1), (1, 0), и (1, 1). Пиксели (0, 0) и (1, 1) расположены по диагонали. Усредняющая функция определяет значение каждого пикселя низкого разрешения, как равное среднему значения пикселя первой фазы (пиксель 615 на фиг.6) и предиктора, y. Предиктор y определяется из пикселей в той же группе фаз пикселя, что и пиксель первой фазы, как изложено ниже:
Со ссылкой на фиг.8 и фиг.9, блок-схема декодера 800 и этапы способа 900 для декодирования, соответственно, показаны согласно определенным вариантам осуществления. Поток 805 (фиг.8) битов, который был закодирован в соответствии с вариантом осуществления, описанным со ссылкой на фиг.1-7, присоединяется к разделителю 810 потоков битов (фиг.8). Первичное кодированнное изображение 815 и множество избыточных кодированных изображений 820, 825, 830 принимаются (905, фиг.9) в поток битов и разделяются разделителем 810 потоков битов. Декодер 835 (фиг.2) первичного изображения генерирует (910, фиг.9) изображение 855 низкого разрешения путем декодирования первичного кодированного изображения 815. На этапе 915 (фиг.9), если был произведен выбор использовать изображение низкого разрешения, на этапе 930 (фиг.9), функция 875 (фиг.8) обратного преобразования может просто масштабировать информацию в изображении низкого разрешения и генерировать декодированное изображение 885 низкого разрешения на выходе 880, и никакие дальнейшие этапы способа 900 не могут выполняться. На этапе 915 (фиг.9), если был произведен выбор использовать изображение высокого разрешения, множество декодеров 840 (фиг.8) избыточного изображения генерирует (920, фиг.9) множество наборов 860, 865, 870 данных улучшения путем декодирования соответствующего множества избыточных кодированных изображений 820, 825, 830. Функция 875 (фиг.8) обратного преобразования выполняет (925, фиг.9) обратное преобразование изображения 855 (фиг.2) низкого разрешения и каждого из множества наборов данных улучшения 860, 865, 870 (фиг.2), создавая декодированную версию участка видеокадра 885 высокого разрешения, из которого были сгенерированы первичное кодированное изображение и множество наборов данных улучшения, на выходе 880, как часть последовательности 890 видеокадров. Этап 925 может быть сформулирован немного иначе - как по меньшей мере значительное воссоздание участка видеокадра 206 высокого разрешения.
Во время воссоздания участка видеокадра 885 высокого разрешения функция 875 обратного преобразования использует преобразование, обратное преобразованию, которое было использовано для кодирования видеокадра 206 высокого разрешения. Для кодированной версии видеокадра высокого разрешения, который был сгенерирован с использованием субполосного преобразования, как описано на фиг.4, функция 875 обратного преобразования является операцией субполосного синтеза, которая синтезирует декодированный видеокадр высокого разрешения, используя гребенки фильтров двойного синтеза, как известно специалистам в данной области техники. Для кодированного видеокадра высокого разрешения, который был сгенерирован с использованием многофазного преобразования, как описано на фиг.7, функция 875 обратного преобразования содержит обратную усредняющую функцию. Со ссылкой на фиг.10, блок-схема функции 1000 обратного преобразования для усредняющей функции, описанной выше со ссылкой на фиг.6, показана в соответствии с определенными вариантами осуществления. Функция 1000 обратного преобразования содержит запоминающее устройство 1005, обратную усредняющую функцию 1010 и функцию 1035 воссоздания. Множество наборов 860, 865, 870 данных улучшения присоединяется к запоминающему устройству 1005, которое хранит наборы данных улучшения, как фазы 2, 3 и 4 изображения высокого разрешения. Изображение 855 низкого разрешения присоединяется к обратной усредняющей функции 1010. Когда в способе 900 (фиг.9) совершается выбор изображения низкого разрешения, обратная усредняющая функция 1010 генерирует изображение 855 низкого разрешения на выходе 880. Изображение 855 низкого разрешения принимается функцией 1035 воссоздания и передается на выход 880. Обратная усредняющая функция 1010 или функция 1035 воссоздания, или обе эти функции могут применять масштабирование к значениям изображения 855 низкого разрешения. Когда в способе 900 (фиг.9) совершается выбор изображения высокого разрешения, обратная усредняющая функция 1010 определяет первую фазу участка видеокадра высокого разрешения из изображения 855 низкого разрешения и другие фазы 1020, 1025, 1030 участка видеокадра высокого разрешения, используя способы хорошо известные специалистам в данной области техники. Первая фаза участка видеокадра высокого разрешения присоединяется из выхода 1015 к функции 1035 воссоздания наряду с другими фазами 1020, 1025, 1030 участка видеокадра высокого разрешения, где они объединяются, чтобы воссоздать участок видеокадра 885 высокого разрешения на выходе 880.
Следует принять во внимание, что определенные этапы способов, описанных в материалах настоящей заявки, могут необязательно выполняться в описанном порядке. В качестве лишь одного примера, этап 920 способа 900 на фиг.9 мог быть выполнен перед этапом 915; в таком случае результаты этапа 920 могут не использоваться, если выбрано изображение низкого разрешения.
Варианты осуществления, описанные в материалах настоящей заявки, предоставляют новые подходы к масштабируемому кодированию изображения/видео и кодированию с многократным описанием, не требуя значительных изменений в существующих немасштабируемых кодерах и декодерах. В частности, методики могут дополнительно использовать средство избыточного изображения и быть легко применимыми в традиционных системах кодирования видео, которые спроектированы совместимыми только с немасштабируемыми профилями ITU-T H.264.
Следует принять во внимание, что некоторые варианты осуществления могут содержать один или более общих или специализированных процессоров (или "устройств обработки"), таких как микропроцессоры, процессоры цифровых сигналов, модифицированные процессоры и программируемые пользователем вентильные матрицы (FPGA), и уникальные сохраненные команды программ (включая как программное обеспечение, так и встроенные программы), которые управляют одним или более процессорами для выполнения, в сочетании с определенными схемами без процессоров, некоторых, большинства или всех функции способов и/или устройств, описанных в материалах настоящей заявки. В качестве альтернативы, некоторые, большинство, или все эти функции могли быть выполнены конечным автоматом, который не имеет сохраненных запрограммированных команд, или в одной или более специализированных интегральных схем (ASICs), в которых каждая функция или некоторые комбинации определенных функций выполняются, как заказные логические схемы. Конечно, может использоваться комбинация двух подходов.
Более того, вариант осуществления может быть выполнен как компьютерно-читаемый носитель данных, имеющий компьютерно-читаемый код, хранящийся на нем для программирования вычислительного устройства (например, содержащего процессор), чтобы выполнить способ, как описано и заявлено в материалах настоящей заявки. Примеры таких компьютерно-читаемых носителей данных включают в себя, но не в качестве ограничения, жесткий диск, CD-ROM, оптическое устройство хранения данных, магнитное устройство хранения данных, ROM (постоянное запоминающее устройство), PROM (программируемое постоянное запоминающее устройство), EPROM (стираемое программируемое постоянное запоминающее устройство), EEPROM (электрически стираемое программируемое постоянное запоминающее устройство) и флеш-память. Дополнительно, ожидается, что специалист в данной области, несмотря на возможно значительные усилия и большой выбор конструкции, мотивированный, например, имеющимся в распоряжении временем, современной технологией и экономическими соображениями, руководствуясь концепциями и принципами, раскрытыми в материалах настоящей заявки, будет без труда способен к генерированию таких команд программного обеспечения и программно реализованных программ, а также IC (интегральных схем) с минимальным экспериментированием.
В вышеизложенной спецификации изобретения были описаны характерные варианты осуществления. Тем не менее, специалист в данной области понимает, что могут быть сделаны различные модификации и изменения без отклонения от объема настоящего изобретения, как изложено ниже в формуле изобретения. Соответственно, спецификация и фигуры должны быть рассмотрены скорее в иллюстративном, а не ограничительном смысле, и все такие модификации предназначены для включения в объем настоящих идей изобретения. Выгоды, преимущества, решения проблем, и любой элемент(ы), который может привести к возникновению выгоды, преимущества или решения или сделать их более явными, не должны быть истолкованы как критические, требуемые или существенные признаки или элементы некоторого или всех пунктов формулы изобретения. Изобретение задано исключительно прилагаемой формулой изобретения, в том числе любыми изменениями, произведенными во время нахождения этой заявки в процессе рассмотрения, и всеми эквивалентами этой формулы изобретения по выдаче.
Более того, в настоящем документе, относительные термины, такие как первый и второй, верхний и нижний, и подобные, могут использоваться исключительно для разграничения одной сущности или действия от другой сущности или действия, без необходимого требования или применения в реальности такого соотношения или порядка между такими сущностями или действиями. Термины "содержит", "содержащий", "имеет", "имеющий", "включает в себя", "включающий в себя", "вмещает в себя", "вмещающий в себя" или любые другие их вариации предназначены для покрытия неисключающего включения, таким образом, чтобы последовательность операций, способ, изделие или устройство, которое содержит, имеет, включает в себя, вмещает в себя список элементов, включает в себя не только эти элементы, но может включать в себя другие элементы, не перечисленные в прямой форме и не присущие такой последовательности операций, способу, изделию или устройству. Элемент, следующий за "содержит…", "имеет…", "включает в себя...", "вмещает в себя...", без дополнительных ограничений, не исключает существование дополнительных идентичных элементов в последовательности операций, способе, изделии или устройстве, которое содержит, имеет, включает в себя, вмещает в себя элемент. Неопределенный артикль "a" и "an" задан как "один или более", если обратное не указано в явном виде материалах настоящей заявки. Термины "значительно", "существенно", "приблизительно", "около" или любые другие их варианты, заданы как являющиеся приблизительными, в смысле, понимаемом специалистами в данной области техники, и в одном неограничительном варианте осуществления, термин задан находящимся в пределах 10%, в другом варианте осуществления в пределах 5%, в другом варианте осуществления в пределах 1%, и в другом варианте осуществления в пределах 0.5%. Термин "присоединен", использованный в материалах настоящей заявки, задан как "соединен", хотя необязательно прямо и необязательно механически. Устройство или структура, которая "сконфигурирована" определенным путем, сконфигурирована по меньшей мере этим путем, но также может быть сконфигурирована путями, которые не перечислены.
Реферат раскрытия предоставлен, чтобы позволить читателю быстро определить характер технического раскрытия. Он представлен с пониманием того, что он не будет использован для интерпретации или ограничения области или значения формулы изобретения. Кроме того, в вышеприведенном подробном описании можно видеть, что различные свойства сгруппированы вместе в различных вариантах осуществления с целью упрощения раскрытия. Способ раскрытия не должен быть интерпретирован как отражающий намерение, что заявленные варианты осуществления требуют больше свойств, чем в прямой форме изложено в каждом пункте формулы изобретения. Скорее, как отражают нижеследующая формула изобретения, предмет изобретения заключается лишь в части всех свойств единственного раскрытого варианта осуществления. Таким образом, нижеследующая формула изобретения заключается настоящим в подробное описание, причем каждый пункт формулы изобретения обладает самостоятельным статусом, как отдельно заявленный предмет изобретения.
Claims (10)
1. Способ кодирования видео, содержащий этапы, на которых:
преобразуют по меньшей мере участок видеокадра высокого разрешения в изображение низкого разрешения и множество наборов данных улучшения;
кодируют изображение низкого разрешения, как первичное кодированное изображение; и
кодируют, используя методику избыточного кодирования, каждый из множества наборов данных улучшения, как другие кодированные изображения,
причем преобразование содержит этапы, на которых:
выполняют многофазное преобразование для разложения видеокадра высокого разрешения на субкадры множества различных фаз;
формируют изображение низкого разрешения так, чтобы оно содержало пиксели низкого разрешения, при этом значение каждого пикселя низкого разрешения определяют, используя усредняющую функцию значений заданных пикселей внутри окрестности пикселя каждого пикселя, который находится в конкретной фазе из множества фаз; и
определяют каждый набор данных улучшения из множества наборов данных улучшения, как уникальный набор, содержащий все пиксели фазы, отличной от первой фазы,
причем число фаз равно четырем, причем четыре пикселя в каждой группе фаз пикселей идентифицируют как пиксели (0,0), (0,1), (1,0) и (1,1), при этом пиксели (0,0) и (1,1) расположены по диагонали, и причем усредняющая функция определяет значение каждого пикселя низкого разрешения, как равное среднему значению пикселя фазы (0,0) (конкретной фазы) и предиктора y, причем предиктор y определяют из пикселей в той же группе фаз пикселей, что и пиксель конкретной фазы, как изложено ниже:
у = max((0,1), (1,0)), когда (1,1) >= max((0,1), (1,0))
у = min((0,1), (1,0)), когда (1,1) <= min((0,1), (1,0)),
у = (0,1)+(1,0)-(1,1) в иных случаях.
преобразуют по меньшей мере участок видеокадра высокого разрешения в изображение низкого разрешения и множество наборов данных улучшения;
кодируют изображение низкого разрешения, как первичное кодированное изображение; и
кодируют, используя методику избыточного кодирования, каждый из множества наборов данных улучшения, как другие кодированные изображения,
причем преобразование содержит этапы, на которых:
выполняют многофазное преобразование для разложения видеокадра высокого разрешения на субкадры множества различных фаз;
формируют изображение низкого разрешения так, чтобы оно содержало пиксели низкого разрешения, при этом значение каждого пикселя низкого разрешения определяют, используя усредняющую функцию значений заданных пикселей внутри окрестности пикселя каждого пикселя, который находится в конкретной фазе из множества фаз; и
определяют каждый набор данных улучшения из множества наборов данных улучшения, как уникальный набор, содержащий все пиксели фазы, отличной от первой фазы,
причем число фаз равно четырем, причем четыре пикселя в каждой группе фаз пикселей идентифицируют как пиксели (0,0), (0,1), (1,0) и (1,1), при этом пиксели (0,0) и (1,1) расположены по диагонали, и причем усредняющая функция определяет значение каждого пикселя низкого разрешения, как равное среднему значению пикселя фазы (0,0) (конкретной фазы) и предиктора y, причем предиктор y определяют из пикселей в той же группе фаз пикселей, что и пиксель конкретной фазы, как изложено ниже:
у = max((0,1), (1,0)), когда (1,1) >= max((0,1), (1,0))
у = min((0,1), (1,0)), когда (1,1) <= min((0,1), (1,0)),
у = (0,1)+(1,0)-(1,1) в иных случаях.
2. Способ кодирования видео по п.1, в котором преобразование имеет обратное преобразование, и выполнение обратного преобразования изображения низкого разрешения и множества наборов данных улучшения сконфигурировано воссоздавать видеокадр высокого разрешения.
3. Способ по п.1, в котором усредняющая функция является импульсной функцией, которая определяет значение каждого пикселя низкого разрешения, как равное значению соответствующего пикселя конкретной фазы.
4. Способ по п.1, в котором усредняющая функция определяет значение каждого пикселя низкого разрешения, как равное среднему значений пикселей внутри окрестности пикселя конкретной фазы.
5. Способ по п.1, в котором окрестность пикселя является одной группой фаз пикселей.
6. Способ пространственного масштабируемого кодирования видео, содержащий этапы, на которых:
преобразуют по меньшей мере участок видеокадра высокого разрешения в изображение низкого разрешения и множество наборов данных улучшения,
причем преобразование содержит этапы, на которых
формируют множество фаз участка видеокадра высокого разрешения, причем каждая фаза является различным изображением участка, подвергнутым понижающей дискретизации,
формируют изображение низкого разрешения, как содержащее пиксели низкого разрешения, причем значение каждого пикселя низкого разрешения определяют, используя усредняющую функцию значений заданных пикселей внутри окрестности пикселя каждого пикселя в конкретной фазе из множества фаз,
определяют каждый набор данных улучшения из множества наборов данных улучшения, как уникальный набор, содержащий все пиксели фазы, отличной от конкретной фазы;
кодируют изображение низкого разрешения, используя кодирование первичного изображения; и
кодируют каждый из множества наборов данных улучшения, используя кодирование избыточного изображения,
причем число фаз равно четырем, причем четыре пикселя в каждой группе фаз пикселей идентифицируют как пиксели (0,0), (0,1), (1,0) и (1,1), причем пиксели (0,0) и (1,1) расположены по диагонали, и причем усредняющая функция определяет значение каждого пикселя низкого разрешения, как равное среднему значению пикселя конкретной фазы и предиктора y, причем предиктор y определяют из пикселей в той же группе фаз пикселей, что и пиксель конкретной фазы, как изложено ниже:
у = max((0,1), (1,0)), когда (1,1) >= max((0,1), (1,0))
у = min((0,1), (1,0)), когда (1,1) <= min((0,1), (1,0)),
у = (0,1)+(1,0)-(1,1) в иных случаях.
преобразуют по меньшей мере участок видеокадра высокого разрешения в изображение низкого разрешения и множество наборов данных улучшения,
причем преобразование содержит этапы, на которых
формируют множество фаз участка видеокадра высокого разрешения, причем каждая фаза является различным изображением участка, подвергнутым понижающей дискретизации,
формируют изображение низкого разрешения, как содержащее пиксели низкого разрешения, причем значение каждого пикселя низкого разрешения определяют, используя усредняющую функцию значений заданных пикселей внутри окрестности пикселя каждого пикселя в конкретной фазе из множества фаз,
определяют каждый набор данных улучшения из множества наборов данных улучшения, как уникальный набор, содержащий все пиксели фазы, отличной от конкретной фазы;
кодируют изображение низкого разрешения, используя кодирование первичного изображения; и
кодируют каждый из множества наборов данных улучшения, используя кодирование избыточного изображения,
причем число фаз равно четырем, причем четыре пикселя в каждой группе фаз пикселей идентифицируют как пиксели (0,0), (0,1), (1,0) и (1,1), причем пиксели (0,0) и (1,1) расположены по диагонали, и причем усредняющая функция определяет значение каждого пикселя низкого разрешения, как равное среднему значению пикселя конкретной фазы и предиктора y, причем предиктор y определяют из пикселей в той же группе фаз пикселей, что и пиксель конкретной фазы, как изложено ниже:
у = max((0,1), (1,0)), когда (1,1) >= max((0,1), (1,0))
у = min((0,1), (1,0)), когда (1,1) <= min((0,1), (1,0)),
у = (0,1)+(1,0)-(1,1) в иных случаях.
7. Способ по п.6, в котором усредняющая функция определяет значение каждого пикселя низкого разрешения, как равное среднему значений пикселей внутри окрестности пикселя конкретной фазы.
8. Способ декодирования видео, содержащий этапы, на которых:
генерируют декодированное изображение низкого разрешения посредством декодирования первичного кодированного изображения;
генерируют множество декодированных наборов данных улучшения посредством декодирования соответствующего множества избыточных кодированных изображений; и
выполняют обратное преобразование декодированного изображения низкого разрешения и множества декодированных наборов данных улучшения для создания декодированной версии участка видеокадра высокого разрешения, из которого были сгенерированы первичное кодированное изображение и множество избыточных кодированных изображений,
причем изображение низкого разрешения содержит пиксели низкого разрешения, причем значение каждого пикселя низкого разрешения определяют, используя усредняющую функцию значений заданных пикселей внутри окрестности пикселя каждого пикселя в конкретной фазе из множества фаз участка видеокадра высокого разрешения, и каждый из множества наборов данных улучшения является уникальным набором, содержащим все пиксели фазы участка видеокадра высокого разрешения, отличной от конкретной фазы,
причем обратное преобразование содержит этапы, на которых:
устанавливают каждую фазу видеокадра высокого разрешения, отличную от конкретной фазы, в соответствующий один из множества наборов данных улучшения;
определяют конкретную фазу участка видеокадра высокого разрешения из изображения низкого разрешения и других фаз участка видео высокого разрешения, и
объединяют конкретную фазу и другие фазы для создания декодированной версии видеокадра высокого разрешения,
причем число фаз равно четырем, причем четыре пикселя в каждой группе фаз пикселей идентифицируют как пиксели (0,0), (0,1), (1,0) и (1,1), причем пиксели (0,0) и (1,1) расположены по диагонали, и причем усредняющая функция определяет значение каждого пикселя низкого разрешения, как равное среднему значению пикселя конкретной фазы и предиктора y, причем предиктор y определяют из пикселей в той же группе фаз пикселей, что и пиксель конкретной фазы, как изложено ниже:
у = max((0,1), (1,0)), когда (1,1) >= max((0,1), (1,0))
у = min((0,1), (1,0)), когда (1,1) <= min((0,1), (1,0)),
у = (0,1)+(1,0)-(1,1) в иных случаях.
генерируют декодированное изображение низкого разрешения посредством декодирования первичного кодированного изображения;
генерируют множество декодированных наборов данных улучшения посредством декодирования соответствующего множества избыточных кодированных изображений; и
выполняют обратное преобразование декодированного изображения низкого разрешения и множества декодированных наборов данных улучшения для создания декодированной версии участка видеокадра высокого разрешения, из которого были сгенерированы первичное кодированное изображение и множество избыточных кодированных изображений,
причем изображение низкого разрешения содержит пиксели низкого разрешения, причем значение каждого пикселя низкого разрешения определяют, используя усредняющую функцию значений заданных пикселей внутри окрестности пикселя каждого пикселя в конкретной фазе из множества фаз участка видеокадра высокого разрешения, и каждый из множества наборов данных улучшения является уникальным набором, содержащим все пиксели фазы участка видеокадра высокого разрешения, отличной от конкретной фазы,
причем обратное преобразование содержит этапы, на которых:
устанавливают каждую фазу видеокадра высокого разрешения, отличную от конкретной фазы, в соответствующий один из множества наборов данных улучшения;
определяют конкретную фазу участка видеокадра высокого разрешения из изображения низкого разрешения и других фаз участка видео высокого разрешения, и
объединяют конкретную фазу и другие фазы для создания декодированной версии видеокадра высокого разрешения,
причем число фаз равно четырем, причем четыре пикселя в каждой группе фаз пикселей идентифицируют как пиксели (0,0), (0,1), (1,0) и (1,1), причем пиксели (0,0) и (1,1) расположены по диагонали, и причем усредняющая функция определяет значение каждого пикселя низкого разрешения, как равное среднему значению пикселя конкретной фазы и предиктора y, причем предиктор y определяют из пикселей в той же группе фаз пикселей, что и пиксель конкретной фазы, как изложено ниже:
у = max((0,1), (1,0)), когда (1,1) >= max((0,1), (1,0))
у = min((0,1), (1,0)), когда (1,1) <= min((0,1), (1,0)),
у = (0,1)+(1,0)-(1,1) в иных случаях.
9. Устройство декодирования, содержащее:
декодер, который восстанавливает изображение низкого разрешения из первичного кодированного изображения в потоке битов, и восстанавливает множество наборов данных улучшения из соответствующего множества избыточных кодированных изображений в потоке битов; и
постпроцессор, который выполняет обратное преобразование на изображении низкого разрешения и множестве наборов данных улучшения, создавая декодированную версию участка видеокадра высокого разрешения, из которого были сгенерированы первичное кодированное изображение и множество избыточных кодированных изображений,
причем изображение низкого разрешения содержит пиксели низкого разрешения, причем значение каждого пикселя низкого разрешения определяется с использованием усредняющей функции значений заданных пикселей внутри окрестности пикселя каждого пикселя в конкретной фазе из множества фаз участка видеокадра высокого разрешения, и каждый из множества наборов данных улучшения является уникальным набором, содержащим все пиксели фазы участка видеокадра высокого разрешения, отличной от конкретной фазы,
причем обратное преобразование содержит:
установку каждой фазы видеокадра высокого разрешения, отличной от конкретной фазы, в соответствующий один из множества наборов данных улучшения;
определение конкретной фазы участка видеокадра высокого разрешения из изображения низкого разрешения и других фаз участка видео высокого разрешения, и
объединение конкретной фазы и других фаз для создания декодированной версии видеокадра высокого разрешения,
причем число фаз равно четырем, причем четыре пикселя в каждой группе фаз пикселей идентифицируются как пиксели (0,0), (0,1), (1,0) и (1,1), причем пиксели (0,0) и (1,1) расположены по диагонали, и причем усредняющая функция определяет значение каждого пикселя низкого разрешения, как равное среднему значению пикселя конкретной фазы и предиктора y, причем предиктор y определяется из пикселей в той же группе фаз пикселей, что и пиксель конкретной фазы, как изложено ниже:
у = max((0,1), (1,0)), когда (1,1) >= max((0,1), (1,0))
у = min((0,1), (1,0)), когда (1,1) <= min((0,1), (1,0)),
у = (0,1)+(1,0)-(1,1) в иных случаях.
декодер, который восстанавливает изображение низкого разрешения из первичного кодированного изображения в потоке битов, и восстанавливает множество наборов данных улучшения из соответствующего множества избыточных кодированных изображений в потоке битов; и
постпроцессор, который выполняет обратное преобразование на изображении низкого разрешения и множестве наборов данных улучшения, создавая декодированную версию участка видеокадра высокого разрешения, из которого были сгенерированы первичное кодированное изображение и множество избыточных кодированных изображений,
причем изображение низкого разрешения содержит пиксели низкого разрешения, причем значение каждого пикселя низкого разрешения определяется с использованием усредняющей функции значений заданных пикселей внутри окрестности пикселя каждого пикселя в конкретной фазе из множества фаз участка видеокадра высокого разрешения, и каждый из множества наборов данных улучшения является уникальным набором, содержащим все пиксели фазы участка видеокадра высокого разрешения, отличной от конкретной фазы,
причем обратное преобразование содержит:
установку каждой фазы видеокадра высокого разрешения, отличной от конкретной фазы, в соответствующий один из множества наборов данных улучшения;
определение конкретной фазы участка видеокадра высокого разрешения из изображения низкого разрешения и других фаз участка видео высокого разрешения, и
объединение конкретной фазы и других фаз для создания декодированной версии видеокадра высокого разрешения,
причем число фаз равно четырем, причем четыре пикселя в каждой группе фаз пикселей идентифицируются как пиксели (0,0), (0,1), (1,0) и (1,1), причем пиксели (0,0) и (1,1) расположены по диагонали, и причем усредняющая функция определяет значение каждого пикселя низкого разрешения, как равное среднему значению пикселя конкретной фазы и предиктора y, причем предиктор y определяется из пикселей в той же группе фаз пикселей, что и пиксель конкретной фазы, как изложено ниже:
у = max((0,1), (1,0)), когда (1,1) >= max((0,1), (1,0))
у = min((0,1), (1,0)), когда (1,1) <= min((0,1), (1,0)),
у = (0,1)+(1,0)-(1,1) в иных случаях.
10. Устройство декодирования по п.9, дополнительно содержащее:
память для установления каждой фазы видеокадра высокого разрешения, отличной от конкретной фазы, в соответствующий один из множества наборов данных улучшения;
обратную усредняющую функцию, которая определяет конкретную фазу участка видеокадра высокого разрешения из изображения низкого разрешения и другие фазы участка видеокадра высокого разрешения, и
модуль воссоздания, который объединяет конкретную фазу и другие фазы в декодированную версию видеокадра высокого разрешения.
память для установления каждой фазы видеокадра высокого разрешения, отличной от конкретной фазы, в соответствующий один из множества наборов данных улучшения;
обратную усредняющую функцию, которая определяет конкретную фазу участка видеокадра высокого разрешения из изображения низкого разрешения и другие фазы участка видеокадра высокого разрешения, и
модуль воссоздания, который объединяет конкретную фазу и другие фазы в декодированную версию видеокадра высокого разрешения.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/108.680 | 2008-04-24 | ||
US12/108,680 US8249142B2 (en) | 2008-04-24 | 2008-04-24 | Method and apparatus for encoding and decoding video using redundant encoding and decoding techniques |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2010147830/07A Division RU2010147830A (ru) | 2008-04-24 | 2009-04-07 | Способ и устройство для кодирования и декодирования видео |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2534751C1 true RU2534751C1 (ru) | 2014-12-10 |
RU2013128143A RU2013128143A (ru) | 2014-12-27 |
Family
ID=41077660
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2010147830/07A RU2010147830A (ru) | 2008-04-24 | 2009-04-07 | Способ и устройство для кодирования и декодирования видео |
RU2013128143/07A RU2534751C1 (ru) | 2008-04-24 | 2013-06-19 | Способ и устройство для кодирования и декодирования видео |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2010147830/07A RU2010147830A (ru) | 2008-04-24 | 2009-04-07 | Способ и устройство для кодирования и декодирования видео |
Country Status (8)
Country | Link |
---|---|
US (1) | US8249142B2 (ru) |
EP (1) | EP2279619B1 (ru) |
KR (1) | KR101249652B1 (ru) |
CN (1) | CN102067599B (ru) |
BR (1) | BRPI0910340B1 (ru) |
MX (1) | MX2010011541A (ru) |
RU (2) | RU2010147830A (ru) |
WO (1) | WO2009131830A1 (ru) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112655213A (zh) * | 2018-09-12 | 2021-04-13 | 松下知识产权经营株式会社 | 变换装置、解码装置、变换方法以及解码方法 |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090279601A1 (en) * | 2008-05-08 | 2009-11-12 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and Apparatus of Displaying Video |
US8599932B2 (en) | 2009-12-18 | 2013-12-03 | General Instrument Corporation | Carriage systems encoding or decoding JPEG 2000 video |
US9532059B2 (en) | 2010-10-05 | 2016-12-27 | Google Technology Holdings LLC | Method and apparatus for spatial scalability for video coding |
KR20130054413A (ko) * | 2010-10-05 | 2013-05-24 | 제너럴 인스트루먼트 코포레이션 | 특징 기반 비디오 코딩 방법 및 장치 |
JP2012235383A (ja) * | 2011-05-06 | 2012-11-29 | Sony Corp | エンコーダ、デコーダ、エンコーダシステム、デコーダシステム、伝送アダプタ、エンコード方法、デコード方法、および撮像装置 |
US9049464B2 (en) * | 2011-06-07 | 2015-06-02 | Qualcomm Incorporated | Multiple description coding with plural combined diversity |
CN102523448A (zh) * | 2011-12-27 | 2012-06-27 | 北京交通大学 | 一种基于旋转的多描述视频编解码方法、装置及系统 |
US11089343B2 (en) * | 2012-01-11 | 2021-08-10 | Microsoft Technology Licensing, Llc | Capability advertisement, configuration and control for video coding and decoding |
EP2904807A4 (en) * | 2012-10-07 | 2016-06-01 | Numeri Ltd | VIDEO COMPRESSION METHOD |
CN103916649B (zh) * | 2012-12-31 | 2017-03-15 | 展讯通信(上海)有限公司 | 一种图像处理方法和装置、系统 |
KR20230080500A (ko) | 2013-01-04 | 2023-06-07 | 지이 비디오 컴프레션, 엘엘씨 | 효율적인 확장가능한 코딩 개념 |
CN117956141A (zh) | 2013-04-08 | 2024-04-30 | Ge视频压缩有限责任公司 | 多视图解码器 |
CN103501441B (zh) * | 2013-09-11 | 2016-08-17 | 北京交通大学长三角研究院 | 一种基于人类视觉系统的多描述视频编码方法 |
CN104333762B (zh) * | 2014-11-24 | 2017-10-10 | 成都瑞博慧窗信息技术有限公司 | 一种视频解码方法 |
US9749646B2 (en) * | 2015-01-16 | 2017-08-29 | Microsoft Technology Licensing, Llc | Encoding/decoding of high chroma resolution details |
CN106162316A (zh) * | 2015-04-15 | 2016-11-23 | 腾讯科技(深圳)有限公司 | 一种视频流的数据处理方法、装置和系统 |
CN116634177B (zh) * | 2023-06-16 | 2024-02-20 | 北京行者无疆科技有限公司 | 一种基于hdmi通信设备的视频通信解码处理方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1615441A1 (en) * | 2004-07-06 | 2006-01-11 | STMicroelectronics S.r.l. | Multiple description coding combined with channel encoding |
RU2294058C2 (ru) * | 1999-11-23 | 2007-02-20 | Конинклейке Филипс Электроникс Н.В. | Гибридное мелкозернистое масштабируемое видеокодирование с зависящим от времени отношением сигнал/шум |
WO2007042365A1 (en) * | 2005-10-14 | 2007-04-19 | Thomson Licensing | Method and apparatus for reconstructing the texture of a spatial enhancement-layer video picture |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3417790A1 (de) * | 1984-05-14 | 1985-11-14 | Basf Ag, 6700 Ludwigshafen | Verfahren zur herstellung von ameisensaeure |
US6233283B1 (en) * | 1998-06-23 | 2001-05-15 | Lucent Technologies Inc. | Layered video coding using perceptual coding criteria for error resilience in packet networks |
US6816194B2 (en) * | 2000-07-11 | 2004-11-09 | Microsoft Corporation | Systems and methods with error resilience in enhancement layer bitstream of scalable video coding |
KR100783396B1 (ko) | 2001-04-19 | 2007-12-10 | 엘지전자 주식회사 | 부호기의 서브밴드 분할을 이용한 시공간 스케일러빌러티방법 |
US7299174B2 (en) * | 2003-04-30 | 2007-11-20 | Matsushita Electric Industrial Co., Ltd. | Speech coding apparatus including enhancement layer performing long term prediction |
US7586924B2 (en) * | 2004-02-27 | 2009-09-08 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for coding an information signal into a data stream, converting the data stream and decoding the data stream |
EP1578134A1 (en) * | 2004-03-18 | 2005-09-21 | STMicroelectronics S.r.l. | Methods and systems for encoding/decoding signals, and computer program product therefor |
DE102004059978B4 (de) * | 2004-10-15 | 2006-09-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen einer codierten Videosequenz und zum Decodieren einer codierten Videosequenz unter Verwendung einer Zwischen-Schicht-Restwerte-Prädiktion sowie ein Computerprogramm und ein computerlesbares Medium |
US7848566B2 (en) * | 2004-10-22 | 2010-12-07 | Carnegie Mellon University | Object recognizer and detector for two-dimensional images using bayesian network based classifier |
US7961963B2 (en) | 2005-03-18 | 2011-06-14 | Sharp Laboratories Of America, Inc. | Methods and systems for extended spatial scalability with picture-level adaptation |
US9113147B2 (en) * | 2005-09-27 | 2015-08-18 | Qualcomm Incorporated | Scalability techniques based on content information |
CN101427582B (zh) * | 2006-04-20 | 2013-10-23 | 汤姆森许可贸易公司 | 用于进行冗余视频编码的方法和装置 |
EP1885134A1 (en) | 2006-07-31 | 2008-02-06 | Fondazione Torino Wireless | A communication system for video data and a method for distributing video data over a network |
WO2008039201A1 (en) | 2006-09-28 | 2008-04-03 | Thomson Licensing | Flexible redundancy coding |
US20080095235A1 (en) * | 2006-10-20 | 2008-04-24 | Motorola, Inc. | Method and apparatus for intra-frame spatial scalable video coding |
US8630355B2 (en) * | 2006-12-22 | 2014-01-14 | Qualcomm Incorporated | Multimedia data reorganization between base layer and enhancement layer |
EP2137972A2 (en) * | 2007-04-24 | 2009-12-30 | Nokia Corporation | System and method for implementing fast tune-in with intra-coded redundant pictures |
US8126054B2 (en) * | 2008-01-09 | 2012-02-28 | Motorola Mobility, Inc. | Method and apparatus for highly scalable intraframe video coding |
-
2008
- 2008-04-24 US US12/108,680 patent/US8249142B2/en active Active
-
2009
- 2009-04-07 KR KR1020107026234A patent/KR101249652B1/ko active IP Right Grant
- 2009-04-07 EP EP09735618.2A patent/EP2279619B1/en active Active
- 2009-04-07 RU RU2010147830/07A patent/RU2010147830A/ru unknown
- 2009-04-07 MX MX2010011541A patent/MX2010011541A/es active IP Right Grant
- 2009-04-07 BR BRPI0910340-6A patent/BRPI0910340B1/pt active IP Right Grant
- 2009-04-07 CN CN200980114439.4A patent/CN102067599B/zh active Active
- 2009-04-07 WO PCT/US2009/039739 patent/WO2009131830A1/en active Application Filing
-
2013
- 2013-06-19 RU RU2013128143/07A patent/RU2534751C1/ru active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2294058C2 (ru) * | 1999-11-23 | 2007-02-20 | Конинклейке Филипс Электроникс Н.В. | Гибридное мелкозернистое масштабируемое видеокодирование с зависящим от времени отношением сигнал/шум |
EP1615441A1 (en) * | 2004-07-06 | 2006-01-11 | STMicroelectronics S.r.l. | Multiple description coding combined with channel encoding |
WO2007042365A1 (en) * | 2005-10-14 | 2007-04-19 | Thomson Licensing | Method and apparatus for reconstructing the texture of a spatial enhancement-layer video picture |
Non-Patent Citations (1)
Title |
---|
FRANCHI N. et al, Multiple Description Video Coding for Scalable and Robust Transmission Over IP, IEEE Transactions on Circuits and Systems for Video Technology, Piscataway, vol.15, N3, 1 March 2005, abstract . SHIH-TA HSIANG, CE1: SVC Intra-frame AVC/H.264 Sub-Band Coding (SBC), Joint Video Team (JVT) of ISO/IEC MPEG & ITU-T VCEG, JVT-X059, 24th Meeting: Geneva, 29 June - 5 July 2007 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112655213A (zh) * | 2018-09-12 | 2021-04-13 | 松下知识产权经营株式会社 | 变换装置、解码装置、变换方法以及解码方法 |
Also Published As
Publication number | Publication date |
---|---|
MX2010011541A (es) | 2011-06-21 |
US20090268805A1 (en) | 2009-10-29 |
RU2010147830A (ru) | 2012-05-27 |
US8249142B2 (en) | 2012-08-21 |
BRPI0910340B1 (pt) | 2020-10-20 |
RU2013128143A (ru) | 2014-12-27 |
CN102067599A (zh) | 2011-05-18 |
KR20100137010A (ko) | 2010-12-29 |
BRPI0910340A2 (pt) | 2016-04-19 |
EP2279619B1 (en) | 2017-11-01 |
EP2279619A1 (en) | 2011-02-02 |
CN102067599B (zh) | 2014-06-11 |
WO2009131830A1 (en) | 2009-10-29 |
KR101249652B1 (ko) | 2013-04-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2534751C1 (ru) | Способ и устройство для кодирования и декодирования видео | |
US11743476B2 (en) | Hierarchical inter-layer prediction in multi-loop scalable video coding | |
CN108781291B (zh) | 空间可缩放视频编码 | |
US8953673B2 (en) | Scalable video coding and decoding with sample bit depth and chroma high-pass residual layers | |
KR20080114388A (ko) | 스케일러블 영상 부호화장치 및 방법과 그 영상 복호화장치및 방법 | |
TW201347542A (zh) | 規定視覺動態範圍編碼操作及參數 | |
TR201901751T4 (tr) | Bir hdr videonun bir ldr video ile birlikte kodlanmasına yönelik yöntem ve cihaz, birlikte kodlanan bir hdr video ve bir ldr videodan birinin yeniden yapılandırılmasına yönelik yöntem ve cihaz ve geçici olmayan depolama ortamı. | |
CN111491168A (zh) | 视频编解码方法、解码器、编码器和相关设备 | |
JP2022521757A (ja) | 線形モデルを使用したイントラ予測のための方法および装置 | |
Segall | Scalable coding of high dynamic range video | |
JP6055098B2 (ja) | 映像復号方法及びそれを利用する装置 | |
TW201918068A (zh) | 用於非4:4:4之格式視訊內容的彩色重映射 | |
WO2023001042A1 (en) | Signaling of down-sampling information for video bitstreams |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PC43 | Official registration of the transfer of the exclusive right without contract for inventions |
Effective date: 20170302 |
|
PC41 | Official registration of the transfer of exclusive right |
Effective date: 20170810 |