RU2808005C2 - Кодер, декодер, способ кодирования и способ декодирования - Google Patents

Кодер, декодер, способ кодирования и способ декодирования Download PDF

Info

Publication number
RU2808005C2
RU2808005C2 RU2023110445A RU2023110445A RU2808005C2 RU 2808005 C2 RU2808005 C2 RU 2808005C2 RU 2023110445 A RU2023110445 A RU 2023110445A RU 2023110445 A RU2023110445 A RU 2023110445A RU 2808005 C2 RU2808005 C2 RU 2808005C2
Authority
RU
Russia
Prior art keywords
prediction
block
motion vector
inter
frame
Prior art date
Application number
RU2023110445A
Other languages
English (en)
Other versions
RU2023110445A (ru
Inventor
Цзин Я ЛИ
Чонг Соон Лим
Сугхош Паван ШАШИДХАР
Жу Лин ЛЯО
Хай Вэй Сунь
Хан Боон ТЕО
Киёфуми АБЕ
Тадамаса ТОМА
Такахиро Ниси
Original Assignee
Панасоник Интеллекчуал Проперти Корпорэйшн оф Америка
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Панасоник Интеллекчуал Проперти Корпорэйшн оф Америка filed Critical Панасоник Интеллекчуал Проперти Корпорэйшн оф Америка
Publication of RU2023110445A publication Critical patent/RU2023110445A/ru
Application granted granted Critical
Publication of RU2808005C2 publication Critical patent/RU2808005C2/ru

Links

Abstract

Изобретение относится к средствам для видеокодирования. Технический результат заключается в повышении эффективности кодирования видео. Выбирают первую таблицу из множества таблиц, каждая из таблиц ассоциирует индексы с соответствующими значениями коррекции, каждая из таблиц используется для изменения вектора движения текущего блока, включенного в кадр. Записывают параметр в поток битов, причем параметр указывает первый индекс из числа индексов в первой таблице. Идентифицируют значение коррекции, ассоциированное с первым индексом. Изменяют вектор движения на значение коррекции в предварительно определенном направлении. Кодируют текущий блок, основываясь на измененном векторе движения. При этом разность между двумя значениями коррекции среди значений коррекции варьируется от таблицы к таблице, причем два значения коррекции в каждой из таблиц ассоциируются с одними и теми же двумя индексами. 2 н.п. ф-лы, 72 ил.

Description

Область техники, к которой относится изобретение
[0001] Настоящее раскрытие сущности относится к кодеру, декодеру, способу кодирования и способу декодирования.
Уровень техники
[0002] Традиционно, предусмотрен H.265 в качестве стандарта для кодирования видео (см. непатентный документ (NPL) 1). H.265 также называется "стандартом высокоэффективного кодирования видео (HEVC)".
Список библиографических ссылок
Непатентные документы
[0003] NPL 1. H.265 (ISO/IEC 23008-2 HEVC)/HEVC(High Efficiency Video Coding)
Сущность изобретения
Технические задачи
[0004] Возникает потребность в таком способе кодирования и способе декодирования, которые предусматривают новые этапы для повышения эффективности обработки, повышения качества кадров, уменьшения размера схем и т.д.
[0005] Каждая из конфигураций или способов, раскрытых в вариантах осуществления или части вариантов осуществления в настоящем раскрытии сущности, может способствовать, по меньшей мере, одному, например, из повышения эффективности кодирования, уменьшения объема кодирования/декодирования, уменьшения размера схем, ускорения кодирования/декодирования, соответствующего выбора составляющих элементов/операций, таких как фильтры, блоки, размер, векторы движения, опорные кадры и опорные блоки, при кодировании и декодировании.
[0006] Следует отметить, что настоящее раскрытие сущности включает в себя конфигурации или способы, которые могут обеспечивать преимущества, отличные от вышеуказанных Примеры этих включают в себя конфигурацию или способ, который повышает эффективность кодирования при подавлении увеличения объема обработки.
Решение задач
[0007] Кодер согласно одному аспекту настоящего раскрытия сущности представляет собой кодер, который включает в себя схему и запоминающее устройство, соединенное со схемой. При работе, схема: выбирает первую таблицу, которая должна использоваться для текущего сегмента, который должен кодироваться в изображении видео, из числа таблиц, которые используются для того, чтобы корректировать базовый вектор движения в предварительно определенном направлении с использованием значения коррекции, указываемого посредством индекса, причем таблицы включают в себя значения коррекции, имеющие варьирующиеся разности между индексами; записывает параметр, указывающий первый индекс, который должен выбираться из числа индексов, включенных в первую таблицу; и кодирует текущий сегмент с использованием базового вектора движения, скорректированного с использованием значения коррекции, указываемого посредством первого индекса.
[0008] Декодер согласно одному аспекту настоящего раскрытия сущности представляет собой декодер, который включает в себя схему и запоминающее устройство, соединенное со схемой. При работе, схема: выбирает первую таблицу, которая должна использоваться для текущего сегмента, который должен декодироваться в изображении видео, из числа таблиц, которые используются для того, чтобы корректировать базовый вектор движения в предварительно определенном направлении с использованием значения коррекции, указываемого посредством индекса, причем таблицы включают в себя значения коррекции, имеющие варьирующиеся разности между индексами; синтаксически анализирует параметр, указывающий первый индекс, который должен выбираться из числа индексов, включенных в первую таблицу; и декодирует текущий сегмент с использованием базового вектора движения, скорректированного с использованием значения коррекции, указываемого посредством первого индекса.
[0009] Следует отметить, что эти общие и конкретные аспекты могут реализовываться посредством системы, устройства, способа, интегральной схемы, компьютерной программы, энергонезависимого машиночитаемого носителя записи, такого как постоянное запоминающее устройство на компакт-дисках (CD-ROM), либо посредством любой комбинации систем, устройств, способов, интегральных схем, компьютерных программ или носителей записи.
[0010] Дополнительные выгоды и преимущества раскрытых вариантов осуществления должны становиться очевидными из подробного описания и чертежей. Выгоды и/или преимущества могут отдельно получаться посредством различных вариантов осуществления и признаков подробного описания и чертежей, не все из которых должны обязательно предоставляться для того, чтобы получать одну или более таких выгод и/или преимуществ.
Преимущества изобретения
[0011] Настоящее раскрытие сущности предоставляет устройство кодирования, устройство декодирования, способ кодирования и способ декодирования, которые допускают повышение эффективности кодирования.
Краткое описание чертежей
[0012] Фиг. 1 является блок-схемой, иллюстрирующей функциональную конфигурацию кодера согласно варианту осуществления.
Фиг. 2 является блок-схемой последовательности операций способа, указывающей один пример полного процесса декодирования, выполняемого посредством кодера.
Фиг. 3 является концептуальной схемой, иллюстрирующей один пример разбиения на блоки.
Фиг. 4A является концептуальной схемой, иллюстрирующей один пример конфигурации срезов.
Фиг. 4B является концептуальной схемой, иллюстрирующей один пример конфигурации плиток.
Фиг. 5A является диаграммой, указывающей базисные функции преобразования для различных типов преобразования.
Фиг. 5B является концептуальной схемой, иллюстрирующей примерные пространственно варьирующиеся преобразования (SVT).
Фиг. 6A является концептуальной схемой, иллюстрирующей один пример формы фильтра, используемой в адаптивном контурном фильтре (ALF).
Фиг. 6B является концептуальной схемой, иллюстрирующей другой пример формы фильтра, используемой в ALF.
Фиг. 6C является концептуальной схемой, иллюстрирующей другой пример формы фильтра, используемой в ALF.
Фиг. 7 является блок-схемой, указывающей один пример конкретной конфигурации контурного фильтра, который функционирует в качестве фильтра удаления блочности (DBF).
Фиг. 8 является концептуальной схемой, указывающей пример фильтра удаления блочности, имеющего симметричную характеристику фильтрации относительно границы блока.
Фиг. 9 является концептуальной схемой для иллюстрации границы блока, для которой выполняется процесс фильтрации для удаления блочности.
Фиг. 10 является концептуальной схемой, указывающей примеры Bs-значений.
Фиг. 11 является блок-схемой последовательности операций способа, иллюстрирующей один пример процесса, выполняемого посредством процессора прогнозирования кодера.
Фиг. 12 является блок-схемой последовательности операций способа, иллюстрирующей другой пример процесса, выполняемого посредством процессора прогнозирования кодера.
Фиг. 13 является блок-схемой последовательности операций способа, иллюстрирующей другой пример процесса, выполняемого посредством процессора прогнозирования кодера.
Фиг. 14 является концептуальной схемой, иллюстрирующей шестьдесят семь режимов внутреннего прогнозирования, используемых при внутреннем прогнозировании в варианте осуществления.
Фиг. 15 является блок-схемой последовательности операций способа, иллюстрирующей примерную базовую последовательность операций обработки взаимного прогнозирования.
Фиг. 16 является блок-схемой последовательности операций способа, иллюстрирующей один пример извлечения векторов движения.
Фиг. 17 является блок-схемой последовательности операций способа, иллюстрирующей другой пример извлечения векторов движения.
Фиг. 18 является блок-схемой последовательности операций способа, иллюстрирующей другой пример извлечения векторов движения.
Фиг. 19 является блок-схемой последовательности операций способа, иллюстрирующей пример взаимного прогнозирования в нормальном взаимном режиме.
Фиг. 20 является блок-схемой последовательности операций способа, иллюстрирующей пример взаимного прогнозирования в режиме объединения.
Фиг. 21 является концептуальной схемой для иллюстрации одного примера процесса извлечения векторов движения в режиме объединения.
Фиг. 22 является блок-схемой последовательности операций способа, иллюстрирующей один пример процесса преобразования с повышением частоты кинокадров (FRUC).
Фиг. 23 является концептуальной схемой для иллюстрации одного примера сопоставления с шаблоном (билатерального сопоставления) между двумя блоками вдоль траектории движения.
Фиг. 24 является концептуальной схемой для иллюстрации одного примера сопоставления с шаблоном (сопоставления с эталоном) между эталоном в текущем кадре и блоком в опорном кадре.
Фиг. 25A является концептуальной схемой для иллюстрации одного примера извлечения вектора движения каждого субблока на основе векторов движения множества соседних блоков.
Фиг. 25B является концептуальной схемой для иллюстрации одного примера извлечения вектора движения каждого субблока в аффинном режиме, в котором используются три управляющих точки.
Фиг. 26A является концептуальной схемой для иллюстрации аффинного режима объединения.
Фиг. 26B является концептуальной схемой для иллюстрации аффинного режима объединения, в котором используются две управляющих точки.
Фиг. 26C является концептуальной схемой для иллюстрации аффинного режима объединения, в котором используются три управляющих точки.
Фиг. 27 является блок-схемой последовательности операций способа, иллюстрирующей один пример процесса в аффинном режиме объединения.
Фиг. 28A является концептуальной схемой для иллюстрации аффинного взаимного режима, в котором используются две управляющих точки.
Фиг. 28B является концептуальной схемой для иллюстрации аффинного взаимного режима, в котором используются три управляющих точки.
Фиг. 29 является блок-схемой последовательности операций способа, иллюстрирующей один пример процесса в аффинном взаимном режиме.
Фиг. 30A является концептуальной схемой для иллюстрации аффинного взаимного режима, в котором текущий блок имеет три управляющих точки, и соседний блок имеет две управляющих точки.
Фиг. 30B является концептуальной схемой для иллюстрации аффинного взаимного режима, в котором текущий блок имеет две управляющих точки, и соседний блок имеет три управляющих точки.
Фиг. 31A является блок-схемой последовательности операций способа, иллюстрирующей процесс в режиме объединения, включающий в себя детализацию векторов движения в декодере (DMVR).
Фиг. 31B является концептуальной схемой для иллюстрации одного примера DMVR-процесса.
Фиг. 32 является блок-схемой последовательности операций способа, иллюстрирующей один пример формирования прогнозного изображения.
Фиг. 33 является блок-схемой последовательности операций способа, иллюстрирующей другой пример формирования прогнозного изображения.
Фиг. 34 является блок-схемой последовательности операций способа, иллюстрирующей другой пример формирования прогнозного изображения.
Фиг. 35 является блок-схемой последовательности операций способа, иллюстрирующей один пример процесса коррекции прогнозных изображений, выполняемого посредством процесса перекрывающейся блочной компенсации движения (OBMC).
Фиг. 36 является концептуальной схемой для иллюстрации одного примера процесса коррекции прогнозных изображений, выполняемого посредством OBMC-процесса.
Фиг. 37 является концептуальной схемой для иллюстрации формирования двух треугольных прогнозных изображений.
Фиг. 38 является концептуальной схемой для иллюстрации модели при условии равномерного прямолинейного движения.
Фиг. 39 является концептуальной схемой для иллюстрации одного примера способа формирования прогнозных изображений с использованием процесса коррекции яркости, выполняемого посредством процесса компенсации локальной освещенности (LIC).
Фиг. 40 является блок-схемой, иллюстрирующей пример монтажа кодера.
Фиг. 41 является блок-схемой, иллюстрирующей функциональную конфигурацию декодера согласно варианту осуществления.
Фиг. 42 является блок-схемой последовательности операций способа, иллюстрирующей один пример полного процесса декодирования, выполняемого посредством декодера.
Фиг. 43 является блок-схемой последовательности операций способа, иллюстрирующей один пример процесса, выполняемого посредством процессора прогнозирования декодера.
Фиг. 44 является блок-схемой последовательности операций способа, иллюстрирующей другой пример процесса, выполняемого посредством процессора прогнозирования декодера.
Фиг. 45 является блок-схемой последовательности операций способа, иллюстрирующей пример взаимного прогнозирования в нормальном взаимном режиме в декодере.
Фиг. 46 является блок-схемой, иллюстрирующей пример монтажа видеодекодера.
Фиг. 47 является схемой, иллюстрирующей дельта-вектор движения для использования в процессе взаимного прогнозирования согласно варианту 1 осуществления.
Фиг. 48 является блок-схемой последовательности операций способа, иллюстрирующей процесс выбора вектора движения в процессе взаимного прогнозирования, выполняемом посредством модуля взаимного прогнозирования декодера согласно первому аспекту варианта 1 осуществления.
Фиг. 49 иллюстрирует пример списка 1, включающего в себя таблицы для использования в процессе выбора вектора движения согласно первому аспекту варианта 1 осуществления.
Фиг. 50 иллюстрирует пример списка 2, включающего в себя таблицы для использования в процессе выбора вектора движения согласно первому аспекту варианта 1 осуществления.
Фиг. 51 является блок-схемой последовательности операций способа, иллюстрирующей процесс выбора вектора движения в процессе взаимного прогнозирования, выполняемом посредством модуля взаимного прогнозирования декодера согласно второму аспекту варианта 1 осуществления.
Фиг. 52 является блок-схемой, иллюстрирующей пример реализации кодера согласно варианту 1 осуществления.
Фиг. 53 является блок-схемой последовательности операций способа, иллюстрирующей пример операций, выполняемых посредством кодера, проиллюстрированного на фиг. 52.
Фиг. 54 является блок-схемой, иллюстрирующей пример реализации декодера согласно варианту 1 осуществления.
Фиг. 55 является блок-схемой последовательности операций способа, иллюстрирующей пример операций, выполняемых посредством декодера, проиллюстрированного на фиг. 54.
Фиг. 56 является блок-схемой, иллюстрирующей общую конфигурацию системы предоставления контента для реализации услуги распространения контента.
Фиг. 57 является концептуальной схемой, иллюстрирующей один пример структуры кодирования при масштабируемом кодировании.
Фиг. 58 является концептуальной схемой, иллюстрирующей один пример структуры кодирования при масштабируемом кодировании.
Фиг. 59 является концептуальной схемой, иллюстрирующей пример экрана отображения веб-страницы.
Фиг. 60 является концептуальной схемой, иллюстрирующей пример экрана отображения веб-страницы.
Фиг. 61 является блок-схемой, иллюстрирующей один пример смартфона.
Фиг. 62 является блок-схемой, иллюстрирующей пример конфигурации смартфона.
Подробное описание вариантов осуществления
[0013] Например, кодер согласно одному аспекту настоящего раскрытия сущности представляет собой кодер, который включает в себя схему и запоминающее устройство, соединенное со схемой. При работе, схема: выбирает первую таблицу, которая должна использоваться для текущего сегмента, который должен кодироваться в изображении видео, из числа таблиц, которые используются для того, чтобы корректировать базовый вектор движения в предварительно определенном направлении с использованием значения коррекции, указываемого посредством индекса, причем таблицы включают в себя значения коррекции, имеющие варьирующиеся разности между индексами; записывает параметр, указывающий первый индекс, который должен выбираться из числа индексов, включенных в первую таблицу; и кодирует текущий сегмент с использованием базового вектора движения, скорректированного с использованием значения коррекции, указываемого посредством первого индекса.
[0014] Вследствие этого, когда используется вектор движения, более точный, чем базовый вектор движения, можно указывать более точный вектор движения с использованием индекса, имеющего меньшее значение (меньший объем информации) в первой таблице, выбранной из множества таблиц. Соответственно, кодер имеет возможность повышения производительности кодирования процесса взаимного прогнозирования.
[0015] Здесь, например, схема выбирает первую таблицу посредством синтаксического анализа первого параметра, который указывает первую таблицу из множества таблиц.
[0016] Кроме того, например, схема получает заголовок среза для текущего среза, включающего в себя текущий сегмент, и первый параметр записывается в заголовок среза.
[0017] Кроме того, например, схема выбирает первую таблицу из множества таблиц с использованием вектора движения в кодированном кинокадре.
[0018] Кроме того, например, схема выбирает первую таблицу из множества таблиц с использованием разности векторов движения в кодированном кинокадре.
[0019] Кроме того, например, схема выбирает первую таблицу из множества таблиц с использованием разрешения кадра, включающего в себя текущий сегмент.
[0020] Кроме того, например, схема выбирает первую таблицу из множества таблиц с использованием временного идентификатора кадра, включающего в себя текущий сегмент.
[0021] Кроме того, например, схема выбирает первую таблицу из множества таблиц с использованием расстояния между текущим кадром, включающим в себя текущий сегмент, и опорным кадром.
[0022] Кроме того, например, схема выбирает первую таблицу из множества таблиц с использованием значения предиктора вектора движения в текущем сегменте.
[0023] Например, декодер согласно одному аспекту настоящего раскрытия сущности представляет собой декодер, который включает в себя схему и запоминающее устройство, соединенное со схемой. При работе, схема: выбирает первую таблицу, которая должна использоваться для текущего сегмента, который должен декодироваться в изображении видео, из числа таблиц, которые используются для того, чтобы корректировать базовый вектор движения в предварительно определенном направлении с использованием значения коррекции, указываемого посредством индекса, причем таблицы включают в себя значения коррекции, имеющие варьирующиеся разности между индексами; синтаксически анализирует параметр, указывающий первый индекс, который должен выбираться из числа индексов, включенных в первую таблицу; и декодирует текущий сегмент с использованием базового вектора движения, скорректированного с использованием значения коррекции, указываемого посредством первого индекса.
[0024] Вследствие этого, когда используется вектор движения, более точный, чем базовый вектор движения, можно указывать более точный вектор движения с использованием индекса, имеющего меньшее значение (меньший объем информации) в первой таблице, выбранной из множества таблиц. Соответственно, декодер имеет возможность повышения производительности кодирования процесса взаимного прогнозирования.
[0025] Здесь, например, схема выбирает первую таблицу посредством синтаксического анализа первого параметра, который указывает первую таблицу из множества таблиц.
[0026] Кроме того, например, схема получает заголовок среза для текущего среза, включающего в себя текущий сегмент, и первый параметр записывается в заголовок среза.
[0027] Кроме того, например, схема выбирает первую таблицу из множества таблиц с использованием вектора движения в декодированном кинокадре.
[0028] Кроме того, например, схема выбирает первую таблицу из множества таблиц с использованием разности векторов движения в декодированном кинокадре.
[0029] Кроме того, например, схема выбирает первую таблицу из множества таблиц с использованием разрешения кадра, включающего в себя текущий сегмент.
[0030] Кроме того, например, схема выбирает первую таблицу из множества таблиц с использованием временного идентификатора кадра, включающего в себя текущий сегмент.
[0031] Кроме того, например, схема выбирает первую таблицу из множества таблиц с использованием расстояния между текущим кадром, включающим в себя текущий сегмент, и опорным кадром.
[0032] Кроме того, например, схема выбирает первую таблицу из множества таблиц с использованием значения предиктора вектора движения в текущем сегменте.
[0033] Например, способ кодирования согласно одному аспекту настоящего раскрытия сущности представляет собой способ кодирования для кодирования видео. Способ кодирования включает в себя: выбор первой таблицы, которая должна использоваться для текущего сегмента, который должен кодироваться в изображении видео, из числа таблиц, которые используются для того, чтобы корректировать базовый вектор движения в предварительно определенном направлении с использованием значения коррекции, указываемого посредством индекса, причем таблицы включают в себя значения коррекции, имеющие варьирующиеся разности между индексами; запись параметра, указывающего первый индекс, который должен выбираться из числа индексов, включенных в первую таблицу; и кодирование текущего сегмента с использованием базового вектора движения, скорректированного с использованием значения коррекции, указываемого посредством первого индекса.
[0034] Вследствие этого, когда используется вектор движения, более точный, чем базовый вектор движения, можно указывать более точный вектор движения с использованием индекса, имеющего меньшее значение (меньший объем информации) в первой таблице, выбранной из множества таблиц. Соответственно, способ кодирования имеет возможность повышения производительности кодирования процесса взаимного прогнозирования.
[0035] Например, способ декодирования согласно одному аспекту настоящего раскрытия сущности представляет собой способ декодирования для декодирования видео. Способ декодирования включает в себя: выбор первой таблицы, которая должна использоваться для текущего сегмента, который должен декодироваться в изображении видео, из числа таблиц, которые используются для того, чтобы корректировать базовый вектор движения в предварительно определенном направлении с использованием значения коррекции, указываемого посредством индекса, причем таблицы включают в себя значения коррекции, имеющие варьирующиеся разности между индексами; синтаксический анализ параметра, указывающего первый индекс, который должен выбираться из числа индексов, включенных в первую таблицу; и декодирование текущего сегмента с использованием базового вектора движения, скорректированного с использованием значения коррекции, указываемого посредством первого индекса.
[0036] Вследствие этого, когда используется вектор движения, более точный, чем базовый вектор движения, можно указывать более точный вектор движения с использованием индекса, имеющего меньшее значение (меньший объем информации) в первой таблице, выбранной из множества таблиц. Соответственно, способ декодирования имеет возможность повышения производительности кодирования процесса взаимного прогнозирования.
[0037] Например, декодер согласно одному аспекту настоящего раскрытия сущности представляет собой декодер, который декодирует видео, и включает в себя схему и запоминающее устройство, соединенное со схемой. При работе, схема: корректирует базовый вектор движения с использованием значения коррекции для коррекции базового вектора движения в предварительно определенном направлении; и декодирует текущий сегмент, который должен обрабатываться в изображении видео, с использованием скорректированного базового вектора движения. Значение коррекции указывается посредством первого параметра, указывающего одно из значений, включенных в таблицу, и таблица выбирается из множества таблиц.
[0038] Вследствие этого, когда используется вектор движения, более точный, чем базовый вектор движения, можно указывать более точный вектор движения с использованием индекса, имеющего меньшее значение (меньший объем информации) в первой таблице, выбранной из множества таблиц. Соответственно, способ декодирования имеет возможность повышения производительности кодирования процесса взаимного прогнозирования.
[0039] Кроме того, эти общие или конкретные аспекты могут реализовываться посредством системы, устройства, способа, интегральной схемы, компьютерной программы или энергонезависимого машиночитаемого носителя записи, такого как постоянное запоминающее устройство на компакт-дисках (CD-ROM), либо посредством любой комбинации систем, устройств, способов, интегральных схем, компьютерных программ или носителей записи.
[0040] В дальнейшем в этом документе описываются варианты осуществления со ссылкой на чертежи.
[0041] Следует отметить, что варианты осуществления, описанные ниже, показывают общий или конкретный пример. Числовые значения, формы, материалы, компоненты, компоновка и соединение компонентов, этапов, взаимосвязь и порядок этапов и т.д., указываемых в нижеприведенных вариантах осуществления, представляют собой просто примеры и в силу этого не имеют намерение ограничивать объем формулы изобретения.
[0042] Ниже описываются варианты осуществления кодера и декодера. Варианты осуществления представляют собой примеры кодера и декодера, к которым являются применимыми процессы и/или конфигурации, представленные в описании аспектов настоящего раскрытия сущности. Процессы и/или конфигурации также могут реализовываться в кодере и декодере, отличающихся от кодера и декодера согласно вариантам осуществления. Например, относительно процессов и/или конфигураций, применяемых к вариантам осуществления, может реализовываться любое из следующего:
[0043] (1) Любой из компонентов кодера или декодера согласно вариантам осуществления, представленным в описании аспектов настоящего раскрытия сущности, может заменяться или комбинироваться с другим компонентом, представленным в любом месте в описании аспектов настоящего раскрытия сущности.
[0044] (2) В кодере или декодере согласно вариантам осуществления, дискреционные изменения могут вноситься в функции или процессы, выполняемые посредством одного или более компонентов кодера или декодера, такие как добавление, замена, удаление и т.д. функций или процессов. Например, любая функция или процесс может заменяться или комбинироваться с другой функцией или процессом, представленным в любом месте в описании аспектов настоящего раскрытия сущности.
[0045] (3) В способах, реализованных посредством кодера или декодера согласно вариантам осуществления, могут вноситься дискреционные изменения, такие как добавление, замена и удаление одного или более процессов, включенных в способ. Например, любой процесс в способе может заменяться или комбинироваться с другим процессом, представленным в любом месте в описании аспектов настоящего раскрытия сущности.
[0046] (4) Один или более компонентов, включенных в кодер или декодер согласно вариантам осуществления, могут комбинироваться с компонентом, представленным в любом месте в описании аспектов настоящего раскрытия сущности, могут комбинироваться с компонентом, включающим в себя одну или более функций, представленных в любом месте в описании аспектов настоящего раскрытия сущности, и могут комбинироваться с компонентом, который реализует один или более процессов, реализованных посредством компонента, представленного в описании аспектов настоящего раскрытия сущности.
[0047] (5) Компонент, включающий в себя одну или более функций кодера или декодера согласно вариантам осуществления, либо компонент, который реализует один или более процессов кодера или декодера согласно вариантам осуществления, может комбинироваться или заменяться компонентом, представленным в любом месте в описании аспектов настоящего раскрытия сущности, компонентом, включающим в себя одну или более функций, представленных в любом месте в описании аспектов настоящего раскрытия сущности, либо компонентом, который реализует один или более процессов, представленных в любом месте в описании аспектов настоящего раскрытия сущности.
[0048] (6) В способах, реализованных посредством кодера или декодера согласно вариантам осуществления, любой из процессов, включенных в способ, может заменяться или комбинироваться с процессом, представленным в любом месте в описании аспектов настоящего раскрытия сущности, либо с любым соответствующим или эквивалентным процессом.
[0049] (7) Один или более процессов, включенных в способы, реализованные посредством кодера или декодера согласно вариантам осуществления, могут комбинироваться с процессом, представленным в любом месте в описании аспектов настоящего раскрытия сущности.
[0050] (8) Реализация процессов и/или конфигураций, представленных в описании аспектов настоящего раскрытия сущности, не ограничена кодером или декодером согласно вариантам осуществления. Например, процессы и/или конфигурации могут реализовываться в устройстве, используемом для цели, отличающейся от кодера движущихся кадров или декодера движущихся кадров, раскрытого в вариантах осуществления.
[0051] Вариант 1 осуществления
Кодер
Во-первых, описывается кодер согласно варианту осуществления. Фиг. 1 является блок-схемой, иллюстрирующей функциональную конфигурацию кодера 100 согласно варианту осуществления. Кодер 100 представляет собой видеокодер, который кодирует видео в единицах блоков.
[0052] Как проиллюстрировано на фиг. 1, кодер 100 представляет собой оборудование, которое кодирует изображение в единицах блоков, и включает в себя модуль 102 разбиения, вычитатель 104, преобразователь 106, квантователь 108, энтропийный кодер 110, обратный квантователь 112, обратный преобразователь 114, сумматор 116, запоминающее устройство 118 блоков, контурный фильтр 120, запоминающее устройство 122 кинокадров, модуль 124 внутреннего прогнозирования, модуль 126 взаимного прогнозирования и контроллер 128 прогнозирования.
[0053] Кодер 100 реализуется, например, в качестве общего процессора и запоминающего устройства. В этом случае, когда программно-реализованная программа, сохраненная в запоминающем устройстве, выполняется посредством процессора, процессор функционирует в качестве модуля 102 разбиения, вычитателя 104, преобразователя 106, квантователя 108, энтропийного кодера 110, обратного квантователя 112, обратного преобразователя 114, сумматора 116, контурного фильтра 120, модуля 124 внутреннего прогнозирования, модуля 126 взаимного прогнозирования и контроллера 128 прогнозирования. Альтернативно, кодер 100 может реализовываться в качестве одной или более специализированных электронных схем, соответствующих модулю 102 разбиения, вычитателю 104, преобразователю 106, квантователю 108, энтропийному кодеру 110, обратному квантователю 112, обратному преобразователю 114, сумматору 116, контурному фильтру 120, модулю 124 внутреннего прогнозирования, модулю 126 взаимного прогнозирования и контроллеру 128 прогнозирования.
[0054] В дальнейшем в этом документе описывается полная последовательность операций процессов, выполняемых посредством кодера 100, и после этого описывается каждый из составляющих элементов, включенных в кодер 100.
[0055] Общая последовательность операций процесса кодирования
Фиг. 2 является блок-схемой последовательности операций способа, указывающей один пример полного процесса декодирования, выполняемого посредством кодера 100.
[0056] Во-первых, модуль 102 разбиения кодера 100 разбивает каждый из кадров, включенных во входное изображение, которое представляет собой видео, на множество блоков, имеющих фиксированный размер (например, 128*128 пикселов) (этап Sa_1). Модуль 102 разбиения затем выбирает шаблон разбиения для блока фиксированного размера (также называется "формой блока") (этап Sa_2). Другими словами, модуль 102 разбиения дополнительно разбивает блок фиксированного размера на множество блоков, которые формируют выбранный шаблон разбиения. Кодер 100 выполняет, для каждого из множества блоков, этапы Sa_3-Sa_9 для блока (который представляет собой текущий блок, который должен кодироваться).
[0057] Другими словами, процессор прогнозирования, который включает в себя все или часть модуля 124 внутреннего прогнозирования, модуля 126 взаимного прогнозирования и контроллера 128 прогнозирования, формирует прогнозный сигнал (также называется "блоком прогнозирования") текущего блока, который должен кодироваться (также называется "текущим блоком") (этап Sa_3).
[0058] Затем, вычитатель 104 формирует разность между текущим блоком и блоком прогнозирования в качестве остатка прогнозирования (также называется "разностным блоком") (этап Sa_4).
[0059] Затем, преобразователь 106 преобразует разностный блок, и квантователь 108 квантует результат для того, чтобы формировать множество квантованных коэффициентов (этап Sa_5). Следует отметить, что блок, имеющий множество квантованных коэффициентов, также называется "блоком коэффициентов".
[0060] Затем, энтропийный кодер 110 кодирует (в частности, энтропийно кодирует) блок коэффициентов и параметр прогнозирования, связанный с формированием прогнозного сигнала, чтобы формировать кодированный сигнал (этап Sa_6). Следует отметить, что кодированный сигнал также называется "кодированным потоком битов", "сжатым потоком битов" или "потоком".
[0061] Затем, обратный квантователь 112 выполняет обратное квантование блока коэффициентов, и обратный преобразователь 114 выполняет обратное преобразование результата для того, чтобы восстанавливать множество остатков прогнозирования (т.е. разностный блок) (этап Sa_7).
[0062] Затем, сумматор 116 суммирует блок прогнозирования с восстановленным разностным блоком для того, чтобы восстанавливать текущий блок в качестве восстановленного изображения (также называется "восстановленным блоком" или "декодированным блоком изображений") (этап Sa_8). Таким образом, восстановленное изображение формируется.
[0063] Когда восстановленное изображение формируется, контурный фильтр 120 выполняет фильтрацию восстановленного изображения при необходимости (этап Sa_9).
[0064] Кодер 100 затем определяет то, закончено или нет кодирование всего кадра (этап Sa_10). При определении того, что кодирование еще не закончено ("Нет" на этапе Sa_10), процессы с этапа Sa_2 многократно выполняются.
[0065] Хотя кодер 100 выбирает один шаблон разбиения для блока фиксированного размера и кодирует каждый блок согласно шаблону разбиения в вышеописанном примере, следует отметить что, каждый блок может кодироваться согласно соответствующему одному из множества шаблонов разбиения. В этом случае, кодер 100 может оценивать затраты для каждого из множества шаблонов разбиения и, например, может выбирать кодированный сигнал, получаемый посредством кодирования согласно шаблону разбиения, который дает в результате наименьшие затраты, в качестве кодированного сигнала, который выводится.
[0066] Как проиллюстрировано, процессы на этапах Sa_1-Sa_10 выполняются последовательно посредством кодера 100. Альтернативно, два или более из процессов могут выполняться параллельно, процессы могут переупорядочиваться и т.д.
[0067] Модуль разбиения
Модуль 102 разбиения разбивает каждый из кадров, включенных во входное видео, на множество блоков и выводит каждый блок в вычитатель 104. Например, модуль 102 разбиения сначала разбивает кадр на блоки фиксированного размера (например, 128*128). Могут использоваться другие фиксированные размеры блоков. Блок фиксированного размера также называется "единицей дерева кодирования (CTU)". Модуль 102 разбиения затем разбивает каждый блок фиксированного размера на блоки переменных размеров (например, 64*64 или меньше), на основе рекурсивного разбиения на блоки дерева квадрантов и/или двоичного дерева. Другими словами, модуль 102 разбиения выбирает шаблон разбиения. Блок переменного размера также называется "единицей кодирования (CU)", "единицей прогнозирования (PU)" или "единицей преобразования (TU)". Следует отметить, что, в различных видах примеров обработки, нет необходимости различать между CU, PU и TU; все или некоторые блоки в кадре могут обрабатываться в единицах CU, PU или TU.
[0068] Фиг. 3 является концептуальной схемой, иллюстрирующей один пример разбиения на блоки согласно варианту осуществления. На фиг. 3, сплошные линии представляют границы блоков для блоков, разбитых посредством разбиения на блоки дерева квадрантов, и пунктирные линии представляют границы блоков для блоков, разбитых посредством разбиения на блоки двоичного дерева.
[0069] Здесь, блок 10 представляет собой квадратный блок, имеющий 128*128 пикселов (блок 128*128). Этот блок 10 128*128 сначала разбивается на четыре квадратных блока 64*64 (разбиение на блоки дерева квадрантов).
[0070] Верхний левый блок 64*64 дополнительно вертикально разбивается на два прямоугольных блока 32*64, и левый блок 32*64 дополнительно вертикально разбивается на два прямоугольных блока 16*64 (разбиение на блоки двоичного дерева). Как результат, верхний левый блок 64*64 разбивается на два блока 11 и 12 16*64 и один блок 13 32*64.
[0071] Верхний правый блок 64*64 горизонтально разбивается на два прямоугольных блока 14 и 15 64*32 (разбиение на блоки двоичного дерева).
[0072] Нижний левый блок 64*64 сначала разбивается на четыре квадратных блока 32*32 (разбиение на блоки дерева квадрантов). Верхний левый блок и нижний правый блок из четырех блоков 32*32 дополнительно разбиваются. Верхний левый блок 32*32 вертикально разбивается на два прямоугольных блока 16*32, и правый блок 16*32 дополнительно горизонтально разбивается на два блока 16*16 (разбиение на блоки двоичного дерева). Нижний правый блок 32*32 горизонтально разбивается на два блока 32*16 (разбиение на блоки двоичного дерева). Как результат, нижний левый блок 64*64 разбивается на блок 16 16*32, два блока 17 и 18 16*16, два блока 19 и 20 32*32 и два блока 21 и 22 32*16.
[0073] Нижний правый блок 23 64*64 не разбивается.
[0074] Как описано выше, на фиг. 3, блок 10 разбивается на тринадцать блоков 11-23 переменного размера на основе рекурсивного разбиения на блоки дерева квадрантов и двоичного дерева. Этот тип разбиения также называется "разбиением на дерево квадрантов плюс двоичное дерево (QTBT)".
[0075] Следует отметить, что, на фиг. 3, один блок разбивается на четыре или два блока (разбиение на блоки дерева квадрантов или двоичного дерева), но разбиение не ограничено этими примерами. Например, один блок может разбиваться на три блока (разбиение на троичные блоки). Разбиение, включающее в себя такое разбиение на троичные блоки, также называется "разбиением на многотипное дерево (MBT)".
[0076] Структура кадра: срез/плитка
Кадр может быть сконфигурирован в единицах одного или более срезов или плиток, чтобы декодировать кадр параллельно. Кадр, сконфигурированный в единицах одного или более срезов или плиток, может быть сконфигурирован посредством модуля 102 разбиения.
[0077] Срезы представляют собой базовые единицы кодирования, включенные в кадр. Кадр может включать в себя, например, один или более срезов. Помимо этого, срез включает в себя одну или боле последовательных единиц дерева кодирования (CTU).
[0078] Фиг. 4A является концептуальной схемой, иллюстрирующей один пример конфигурации срезов. Например, кадр включает в себя CTU 11*8 и разбивается на четыре среза (срезы 1-4). Срез 1 включает в себя шестнадцать CTU, срез 2 включает в себя двадцать одну CTU, срез 3 включает в себя двадцать девять CTU, и срез 4 включает в себя двадцать две CTU. Здесь, каждая CTU в кадре принадлежит одному из срезов. Форма каждого среза представляет собой форму, получаемую посредством разбиения кадра горизонтально. Граница каждого среза не должна обязательно совпадать с концом изображения и может совпадать с любой из границ между CTU в изображении. Порядок обработки CTU в срезе (порядок кодирования или порядок декодирования), например, представляет собой порядок растрового сканирования. Срез включает в себя информацию заголовка и кодированные данные. Признаки среза могут описываться в информации заголовка. Признаки включают в себя CTU-адрес верхней CTU в срезе, тип среза и т.д.
[0079] Плитка представляет собой единицу прямоугольной области, включенной в кадр. Каждой из плиток может назначаться номер, называемый "TileId" в порядке растрового сканирования.
[0080] Фиг. 4B является концептуальной схемой, указывающей пример конфигурации плиток. Например, кадр включает в себя CTU 11*8 и разбивается на четыре плитки прямоугольных областей (плитки 1-4). Когда плитки используются, порядок обработки CTU изменяется относительно порядка обработки в случае, если плитки не используются. Когда плитки не используются, CTU в кадре обрабатываются в порядке растрового сканирования. Когда плитки используются, по меньшей мере, одна CTU в каждой из плиток обрабатывается в порядке растрового сканирования. Например, как проиллюстрировано на фиг. 4B, порядок обработки CTU, включенных в плитку 1, представляет собой порядок, который начинается с левого конца первой строки плитки 1 к правому концу первой строки плитки 1 и затем начинается с левого конца второй строки плитки 1 к правому концу второй строки плитки 1.
[0081] Следует отметить, что одна плитка может включать в себя один или более срезов, и один срез может включать в себя одну или более плиток.
[0082] Вычитатель
Вычитатель 104 вычитает прогнозный сигнал (прогнозную выборку, которая вводится из контроллера 128 прогнозирования, указываемого ниже) из исходного сигнала (исходной выборки), в единицах блока, вводимого из модуля 102 разбиения и разбитого посредством модуля 102 разбиения. Другими словами, вычитатель 104 вычисляет ошибки прогнозирования (также называются "остатками") блока, который должен кодироваться (в дальнейшем также называется "текущим блоком"). Вычитатель 104 затем выводит вычисленные ошибки прогнозирования (остатки) в преобразователь 106.
[0083] Исходный сигнал представляет собой сигнал, который введен в кодер 100, и представляет изображение каждого кадра, включенного в видео (например, сигнал яркости и два сигнала цветности). В дальнейшем в этом документе, сигнал, представляющий изображение, также называется "выборкой".
[0084] Преобразователь
Преобразователь 106 преобразует ошибки прогнозирования в пространственной области в коэффициенты преобразования в частотной области и выводит коэффициенты преобразования в квантователь 108. Более конкретно, преобразователь 106 применяет, например, заданное дискретное косинусное преобразование (DCT) или дискретное синусное преобразование (DST) к ошибкам прогнозирования в пространственной области. Заданное DCT или DST может быть предварительно задано.
[0085] Следует отметить, что преобразователь 106 может адаптивно выбирать тип преобразования из множества типов преобразования и преобразовывать ошибки прогнозирования в коэффициенты преобразования посредством использования базисной функции преобразования, соответствующей выбранному типу преобразования. Этот вид преобразования также называется "явным множественным базовым преобразованием (EMT)" или "адаптивным множественным преобразованием (AMT)".
[0086] Типы преобразования включают в себя, например, DCT-II, DCT-V, DCT-VIII, DST-I и DST-VII. Фиг. 5Ф является диаграммой, указывающей базисные функции преобразования для примерных типов преобразования. На фиг. 5A, N указывает число входных пикселов. Например, выбор типа преобразования из множества типов преобразования может зависеть от типа прогнозирования (одно из внутреннего прогнозирования и взаимного прогнозирования) и может зависеть от режима внутреннего прогнозирования.
[0087] Информация, указывающая то, следует или нет применять такое EMT или AMT (называется, например, "EMT-флагом" или "AMT-флагом"), и информация, указывающая выбранный тип преобразования, нормально передается в служебных сигналах на уровне CU. Следует отметить, что передача в служебных сигналах этой информации не обязательно должна выполняться на уровне CU и может выполняться на другом уровне (например, на уровне битовой последовательности, уровне кадра, уровне среза, уровне плитки или уровне CTU).
[0088] Помимо этого, преобразователь 106 может повторно преобразовывать коэффициенты преобразования (результат преобразования). Такое повторное преобразование также называется "адаптивным вторичным преобразованием (AST)" или "неразделимым вторичным преобразованием (NSST)". Например, преобразователь 106 выполняет повторное преобразование в единицах субблока (например, субблока 4*4), включенного в блок коэффициентов преобразования, соответствующий ошибке внутреннего прогнозирования. Информация, указывающая то, следует или нет применять NSST, и информация, связанная с матрицей преобразования для использования в NSST, нормально передается в служебных сигналах на уровне CU. Следует отметить, что передача в служебных сигналах этой информации не должна обязательно выполняться на уровне CU и может выполняться на другом уровне (например, на уровне последовательности, уровне кадра, уровне среза, уровне плитки или уровне CTU).
[0089] Преобразователь 106 может использовать разделимое преобразование и неразделимое преобразование. Разделимое преобразование представляет собой способ, в котором преобразование выполняется многократно посредством отдельного выполнения преобразования для каждого из определенного числа направлений согласно числу размерностей вводов. Неразделимое преобразование представляет собой способ выполнения коллективного преобразования, в котором две или более размерностей в многомерных вводах совместно рассматриваются в качестве одной размерности.
[0090] В одном примере неразделимого преобразования, когда ввод представляет собой блок 4*4, блок 4*4 считается простым массивом, включающим в себя шестнадцать элементов, и преобразование применяет матрицу преобразования 16*16 к массиву.
[0091] В другом примере неразделимого преобразования, входной блок 4*4 рассматривается в качестве простого массива, включающего в себя шестнадцать элементов, и после этого может выполняться преобразование (гиперкубическое преобразование Гивенса), в котором вращение Гивенса выполняется для массива многократно.
[0092] При преобразовании в преобразователе 106, могут переключаться типы базисов, которые должны преобразовываться в частотную область согласно областям в CU. Примеры включают в себя пространственно варьирующиеся преобразования (SVT). В SVT, как проиллюстрировано на фиг. 5B, CU разбиваются на две равных области горизонтально или вертикально, и только одна из областей преобразуется в частотную область. Базисный тип преобразования может задаваться для каждой области. Например, используются DST7 и DST8. В этом примере, только одна из двух областей в CU преобразуется, а другая не преобразуется. Тем не менее, обе из этих двух областей могут преобразовываться. Помимо этого, способ разбиения не ограничен разбиением на две равных области и может быть более гибким. Например, CU может разбиваться на четыре равных области, или информация, указывающая разбиение, может кодироваться отдельно и передаваться в служебных сигналах идентично CU-разбиению. Следует отметить, что SVT также называется "субблочным преобразованием (SBT)".
[0093] Квантователь
Квантователь 108 квантует коэффициенты преобразования, выводимые из преобразователя 106. Более конкретно, квантователь 108 сканирует, в определенном порядке сканирования, коэффициенты преобразования текущего блока и квантует сканированные коэффициенты преобразования на основе параметров квантования (QP), соответствующих коэффициентам преобразования. Квантователь 108 затем выводит квантованные коэффициенты преобразования (в дальнейшем также называются "квантованными коэффициентами") текущего блока в энтропийный кодер 110 и обратный квантователь 112. Определенный порядок сканирования может быть предварительно определен.
[0094] Определенный порядок сканирования представляет собой порядок для квантования/обратного квантования коэффициентов преобразования. Например, определенный порядок сканирования может задаваться как порядок по возрастанию частоты (от низкой к высокой частоте) или порядок по убыванию частоты (от высокой к низкой частоте).
[0095] Параметр квантования (QP) представляет собой параметр, задающий шаг квантования (ширину квантования). Например, когда значение параметра квантования увеличивается, размер шага квантования также увеличивается. Другими словами, когда значение параметра квантования увеличивается, ошибка квантования увеличивается.
[0096] Помимо этого, матрица квантования может использоваться для квантования. Например, несколько видов матриц квантования могут использоваться, соответственно, чтобы выполнять преобразование частоты для размеров, таких как 4*4 и 8*8, режимов прогнозирования, таких как внутреннее прогнозирование и взаимное прогнозирование, и пиксельных компонентов, таких как пиксельные компоненты сигнала яркости и сигнала цветности. Следует отметить, что квантование означает оцифровку значений, дискретизированных с определенными интервалами, соответственно, в определенные уровни. В этой области техники, квантование может упоминаться с использованием других выражений, таких как округление и масштабирование, и может использовать округление и масштабирование. Определенные интервалы и уровни могут быть предварительно определены.
[0097] Способы с использованием матриц квантования включают в себя способ с использованием матрицы квантования, которая задана непосредственно на стороне кодера, и способ с использованием матрицы квантования, которая задана в качестве значения по умолчанию (матрицы по умолчанию). На стороне кодера, матрица квантования, подходящая для признаков изображения, может задаваться посредством прямого задания матрицы квантования. Тем не менее, этот случай имеет недостаток увеличения объема кодирования для кодирования матрицы квантования.
[0098] Предусмотрен способ для квантования высокочастотного коэффициента и низкочастотного коэффициента без использования матрицы квантования. Следует отметить, что этот способ является эквивалентным способу с использованием матрицы квантования (плоской матрицы), коэффициенты которой имеют идентичное значение.
[0099] Матрица квантования может указываться с использованием, например, набора параметров последовательности (SPS) или набора параметров кадра (PPS). SPS включает в себя параметр, который используется для последовательности, и PPS включает в себя параметр, который используется для кадра. Каждый из SPS и PPS может называться просто "набором параметров".
[0100] Энтропийный кодер
Энтропийный кодер 110 формирует кодированный сигнал (кодированный поток битов) на основе квантованных коэффициентов, которые введены из квантователя 108. Более конкретно, энтропийный кодер 110, например, преобразует в двоичную форму квантованные коэффициенты и арифметически кодирует двоичный сигнал и выводит сжатый поток битов или последовательность.
[0101] Обратный квантователь
Обратный квантователь 112 обратно квантует квантованные коэффициенты, которые введены из квантователя 108. Более конкретно, обратный квантователь 112 обратно квантует, в определенном порядке сканирования, квантованные коэффициенты текущего блока. Обратный квантователь 112 затем выводит обратно квантованные коэффициенты преобразования текущего блока в обратный преобразователь 114. Определенный порядок сканирования может быть предварительно определен.
[0102] Обратный преобразователь
Обратный преобразователь 114 восстанавливает ошибки прогнозирования (остатки) посредством обратного преобразования коэффициентов преобразования, которые введены из обратного квантователя 112. Более конкретно, обратный преобразователь 114 восстанавливает ошибки прогнозирования текущего блока посредством применения обратного преобразования, соответствующего преобразованию, применяемому посредством преобразователя 106, к коэффициентам преобразования. Обратный преобразователь 114 затем выводит восстановленные ошибки прогнозирования в сумматор 116.
[0103] Следует отметить, что поскольку информация потеряна в квантовании, восстановленные ошибки прогнозирования не совпадают с ошибками прогнозирования, вычисленными посредством вычитателя 104. Другими словами, восстановленные ошибки прогнозирования нормально включают в себя ошибки квантования.
[0104] Сумматор
Сумматор 116 восстанавливает текущий блок посредством суммирования ошибок прогнозирования, которые введены из обратного преобразователя 114, и прогнозных выборок, которые введены из контроллера 128 прогнозирования. Сумматор 116 затем выводит восстановленный блок в запоминающее устройство 118 блоков и контурный фильтр 120. Восстановленный блок также называется "локальным декодированным блоком".
[0105] Запоминающее устройство блоков
Запоминающее устройство 118 блоков, например, представляет собой устройство хранения данных для сохранения блоков в кадре, который должен кодироваться (далее называется "текущим кадром"), на который ссылаются при внутреннем прогнозировании. Более конкретно, запоминающее устройство 118 блоков сохраняет восстановленные блоки, выводимые из сумматора 116.
[0106] Запоминающее устройство кинокадров
Запоминающее устройство 122 кинокадров, например, представляет собой устройство хранения данных для сохранения опорных кадров для использования при взаимном прогнозировании, и также называется "буфером кинокадров". Более конкретно, запоминающее устройство 122 кинокадров сохраняет восстановленные блоки, фильтрованные посредством контурного фильтра 120.
[0107] Контурный фильтр
Контурный фильтр 120 применяет контурный фильтр к блокам, восстановленным посредством сумматора 116, и выводит фильтрованные восстановленные блоки в запоминающее устройство 122 кинокадров. Контурный фильтр представляет собой фильтр, используемый в контуре кодирования (внутриконтурный фильтр), и включает в себя, например, фильтр удаления блочности (DF или DBF), дискретизированное адаптивное смещение (SAO) и адаптивный контурный фильтр (ALF).
[0108] В ALF, применяется фильтр ошибок по методу наименьших квадратов для удаления артефактов сжатия. Например, один фильтр, выбранный из множества фильтров на основе направления и активности локальных градиентов, применяется для каждого из субблоков 2*2 в текущем блоке.
[0109] Более конкретно, сначала каждый субблок (например, каждый субблок 2*2) классифицируются на один из множества классов (например, пятнадцать или двадцать пять классов). Классификация субблока основана на направленности и активности градиентов. Например, классификационный индекс C (например, C=5D+A) извлекается на основе направленности D градиентов (например, 0-2 или 0-4) и активность A градиентов (например, 0-4). Затем на основе классификационного индекса C каждый субблок классифицируется на один из множества классов.
[0110] Например, направленность D градиентов вычисляется посредством сравнения градиентов множества направлений (например, горизонтального, вертикального и двух диагональных направлений). Кроме того, например, активность A градиентов вычисляется посредством суммирования градиентов множества направлений и квантования результата суммирования.
[0111] Фильтр, который должен использоваться для каждого субблока, определяется из множества фильтров на основе результата такой классификации.
[0112] Форма фильтра, которая должна использоваться в ALF, например, представляет собой круглую симметричную форму фильтра. Фиг. 6A-6C иллюстрируют примеры форм фильтра, используемых в ALF. Фиг. 6A иллюстрирует фильтр ромбовидной формы 5*5, фиг. 6B иллюстрирует фильтр ромбовидной формы 7*7, и фиг. 4C иллюстрирует фильтр ромбовидной формы 9*9. Информация, указывающая форму фильтра, нормально передается в служебных сигналах на уровне кадра. Следует отметить, что передача в служебных сигналах этой информации, указывающей форму фильтра, не обязательно должна выполняться на уровне кадра и может выполняться на другом уровне (например, на уровне последовательности, уровне среза, уровне плитки, уровне CTU или уровне CU).
[0113] Включение или выключение ALF определяется, например, на уровне кадра или на уровне CU. Например, решение касательно того, следует или нет применять ALF к сигналу яркости, может приниматься на уровне CU, и решение касательно того, следует или нет применять ALF к сигналу цветности, может приниматься на уровне кадра. Информация, указывающая включение или выключение ALF, нормально передается в служебных сигналах на уровне кадра или на уровне CU. Следует отметить, что передача в служебных сигналах информации, указывающей включение или выключение ALF, не обязательно должна выполняться на уровне кадра или на уровне CU и может выполняться на другом уровне (например, на уровне последовательности, уровне среза, уровне плитки или уровне CTU).
[0114] Набор коэффициентов для множества выбираемых фильтров (например, для пятнадцати или вплоть до двадцати пяти фильтров) нормально передается в служебных сигналах на уровне кадра. Следует отметить, что передача в служебных сигналах набора коэффициентов не должна обязательно выполняться на уровне кадра и может выполняться на другом уровне (например, на уровне последовательности, уровне среза, уровне плитки, уровне CTU, уровне CU или уровне субблока).
[0115] Контурный фильтр > фильтр удаления блочности
В фильтре удаления блочности, контурный фильтр 120 выполняет процесс фильтрации для границы блока в восстановленном изображении таким образом, чтобы уменьшать искажение, которое возникает на границе блока.
[0116] Фиг. 7 является блок-схемой, иллюстрирующей один пример конкретной конфигурации контурного фильтра 120, который функционирует в качестве фильтра удаления блочности.
[0117] Контурный фильтр 120 включает в себя: модуль 1201 определения границ; модуль 1203 определения фильтрации; модуль 1205 выполнения фильтрации; модуль 1208 определения обработки; модуль 1207 определения характеристик фильтра; и переключатели 1202, 1204 and 1206.
[0118] Модуль 1201 определения границ определяет то, присутствует или нет пиксел, который должен фильтроваться для удаления блочности (т.е. текущий пиксел), около границы блока. Модуль 1201 определения границ затем выводит результат определения в переключатель 1202 и модуль 1208 определения обработки.
[0119] В случае если модуль 1201 определения границ определяет то, что текущий пиксел присутствует около границы блока, переключатель 1202 выводит нефильтрованное изображение в переключатель 1204. В противоположном случае, в котором модуль 1201 определения границ определяет то, что текущий пиксел не присутствует около границы блока, переключатель 1202 выводит нефильтрованное изображение в переключатель 1206.
[0120] Модуль 1203 определения фильтрации определяет то, следует или нет выполнять фильтрацию для удаления блочности текущего пиксела, на основе пиксельного значения, по меньшей мере, одного окружающего пиксела, расположенного около текущего пиксела. Модуль 1203 определения фильтрации затем выводит результат определения в переключатель 1204 и модуль 1208 определения обработки.
[0121] В случае если определено то, что модуль 1203 определения фильтрации выполняет фильтрацию для удаления блочности текущего пиксела, переключатель 1204 выводит нефильтрованное изображение, полученное через переключатель 1202, в модуль 1205 выполнения фильтрации. В противоположном случае, в котором определено то, что модуль 1203 определения фильтрации не выполняет фильтрацию для удаления блочности текущего пиксела, переключатель 1204 выводит нефильтрованное изображение, полученное через переключатель 1202, в переключатель 1206.
[0122] При получении нефильтрованного изображения через переключатели 1202 и 1204, модуль 1205 выполнения фильтрации выполняет, для текущего пиксела, фильтрацию для удаления блочности с характеристикой фильтра, определенной посредством модуля 1207 определения характеристик фильтра. Модуль 1205 выполнения фильтрации затем выводит фильтрованный пиксел в переключатель 1206.
[0123] Под управлением модуля 1208 определения обработки, переключатель 1206 избирательно выводит пиксел, который не фильтруется для удаления блочности, и пиксел, который фильтруется для удаления блочности посредством модуля 1205 выполнения фильтрации.
[0124] Модуль 1208 определения обработки управляет переключателем 1206 на основе результатов определений, выполненных посредством модуля 1201 определения границ и модуля 1203 определения фильтрации. Другими словами, модуль 1208 определения обработки инструктирует переключателю 1206 выводить пиксел, который фильтруется для удаления блочности, когда модуль 1201 определения границ определяет то, что текущий пиксел присутствует около границы блока, и определено то, что модуль 1203 определения фильтрации выполняет фильтрацию для удаления блочности текущего пиксела. Помимо этого, помимо вышеописанного случая, модуль 1208 определения обработки инструктирует переключателю 1206 выводить пиксел, который не фильтруется для удаления блочности. Фильтрованное изображение выводится из переключателя 1206 посредством повторения вывода пиксела таким образом.
[0125] Фиг. 8 является концептуальной схемой, указывающей пример фильтра удаления блочности, имеющего симметричную характеристику фильтрации относительно границы блока.
[0126] В процессе фильтрации для удаления блочности, один из двух фильтров удаления блочности, имеющих различные характеристики, т.е. сильного фильтра и слабого фильтра, выбирается с использованием пиксельных значений и параметров квантования. В случае сильного фильтра, пикселы p0-p2 и пикселы q0-q2 присутствуют на границе блока, как проиллюстрировано на фиг. 8, пиксельные значения соответствующего пиксела q0-q2 изменяются на пиксельные значения q'0-q'2 посредством выполнения, например, вычисления согласно нижеприведенным выражениям.
[0127] q'0=(p1+2*p0+2*q0+2*q1+q2+4)/8
q'1=(p0+q0+q1+q2+2)/4
q'2=(p0+q0+q1+3*q2+2*q3+4)/8
[0128] Следует отметить, что, в вышеприведенных выражениях, p0-p2 и q0-q2 представляют собой пиксельные значения соответствующих пикселов p0-p2 и пикселов q0-q2. Помимо этого, q3 представляет собой пиксельное значение соседнего пиксела q3, расположенного в противоположной стороне пиксела q2 относительно границы блока. Помимо этого, в правой стороне каждого из выражений, коэффициенты, которые умножаются на соответствующие пиксельные значения пикселов, которые должны использоваться для фильтрации для удаления блочности, представляют собой коэффициенты фильтрации.
[0129] Кроме того, при фильтрации для удаления блочности, отсечение может выполняться таким образом, что вычисленные пиксельные значения не задаются выше порогового значения. В процессе отсечения, пиксельные значения, вычисленные согласно вышеприведенным выражениям, отсекаются до значения, полученного согласно "вычисленное пиксельное значение±2*пороговое значение" с использованием порогового значения, определенного на основе параметра квантования. Таким образом, можно предотвращать чрезмерное сглаживание.
[0130] Фиг. 9 является концептуальной схемой для иллюстрации границы блока, для которой выполняется процесс фильтрации для удаления блочности. Фиг. 10 является концептуальной схемой, указывающей примеры Bs-значений.
[0131] Граница блока, для которой выполняется процесс фильтрации для удаления блочности, например, представляет собой границу между единицами прогнозирования (PU), имеющими пиксельные блоки 8*8, как проиллюстрировано на фиг. 9, или границу между единицами преобразования (TU). Процесс фильтрации для удаления блочности может выполняться в единицах из четырех строк или четырех столбцов. Во-первых, значения граничной интенсивности (Bs) определяются, как указано на фиг. 10 для блока P и блока Q, проиллюстрированных на фиг. 9.
[0132] Согласно Bs-значениям на фиг. 10, определяется то, следует или нет выполнять процессы фильтрации для удаления блочности границ блоков, принадлежащих идентичному изображению, с использованием различных интенсивностей. Процесс фильтрации для удаления блочности для сигнала цветности выполняется, когда Bs-значение равно 2. Процесс фильтрации для удаления блочности для сигнала яркости выполняется, когда Bs-значение равно 1 или более, и определенное условие удовлетворяется. Определенное условие может быть предварительно определено. Следует отметить, что условия для определения Bs-значений не ограничены условиями, указываемыми на фиг. 10, и Bs-значение может определяться на основе другого параметра.
[0133] Процессор прогнозирования (модуль внутреннего прогнозирования, модуль взаимного прогнозирования, контроллер прогнозирования)
Фиг. 11 является блок-схемой последовательности операций способа, иллюстрирующей один пример процесса, выполняемого посредством процессора прогнозирования кодера 100. Следует отметить, что процессор прогнозирования включает в себя все или часть следующих составляющих элементов: модуль 124 внутреннего прогнозирования; модуль 126 взаимного прогнозирования; и контроллер 128 прогнозирования.
[0134] Процессор прогнозирования формирует прогнозное изображение текущего блока (этап Sb_1). Это прогнозное изображение также называется "прогнозным сигналом" или "блоком прогнозирования". Следует отметить, что прогнозный сигнал, например, представляет собой внутренний прогнозный сигнал или взаимный прогнозный сигнал. В частности, процессор прогнозирования формирует прогнозное изображение текущего блока с использованием восстановленного изображения, которое уже получено через формирование блока прогнозирования, формирование разностного блока, формирование блока коэффициентов, восстановление разностного блока и формирование декодированного блока изображений.
[0135] Восстановленное изображение, например, может представлять собой изображение в опорном кадре или изображение кодированного блока в текущем кадре, который представляет собой кадр, включающий в себя текущий блок. Кодированный блок в текущем кадре, например, представляет собой соседний блок относительно текущего блока.
[0136] Фиг. 12 является блок-схемой последовательности операций способа, иллюстрирующей другой пример процесса, выполняемого посредством процессора прогнозирования кодера 100.
[0137] Процессор прогнозирования формирует прогнозное изображение с использованием первого способа (этап Sc_1a), формирует прогнозное изображение с использованием второго способа (этап Sc_1b) и формирует прогнозное изображение с использованием третьего способа (этап Sc_1c). Первый способ, второй способ и третий способ могут представлять собой взаимно различные способы для формирования прогнозного изображения. Каждый из первого-третьего способов может представлять собой способ взаимного прогнозирования, способ внутреннего прогнозирования или другой способ прогнозирования. Вышеописанное восстановленное изображение может использоваться в этих способах прогнозирования.
[0138] Затем, процессор прогнозирования выбирает любой из множества способов прогнозирования, сформированных на этапах Sc_1a, Sc_1b и Sc_1c (этап Sc_2). Выбор прогнозного изображения, который представляет собой выбор способа или режима для получения конечного прогнозного изображения, может осуществляться посредством вычисления затрат для каждого из сформированных прогнозных изображений и на основе затрат. Альтернативно, выбор прогнозного изображения может осуществляться на основе параметра, который используется в процессе кодирования. Кодер 100 может преобразовывать информацию для идентификации выбранного прогнозного изображения, способа или режима в кодированный сигнал (также называется "кодированным потоком битов"). Информация, например, может представлять собой флаг и т.п. Таким образом, декодер допускает формирование прогнозного изображения согласно способу или режиму, выбранному на основе информации в кодере 100. Следует отметить, что, в примере, проиллюстрированном на фиг. 12, процессор прогнозирования выбирает любое из прогнозных изображений после того, как прогнозные изображения формируются с использованием соответствующих способов. Тем не менее, процессор прогнозирования может выбирать способ или режим на основе параметра для использования в вышеописанном процессе кодирования до формирования прогнозных изображений и может формировать прогнозное изображение согласно выбранному способу или режиму.
[0139] Например, первый способ и второй способ могут представлять собой внутренне прогнозирование и взаимное прогнозирование, соответственно, и процессор прогнозирования может выбирать конечное прогнозное изображение для текущего блока из прогнозных изображений, сформированных согласно способам прогнозирования.
[0140] Фиг. 13 является блок-схемой последовательности операций способа, иллюстрирующей другой пример процесса, выполняемого посредством процессора прогнозирования кодера 100.
[0141] Во-первых, процессор прогнозирования формирует прогнозное изображение с использованием внутреннего прогнозирования (этап Sd_1a) и формирует прогнозное изображение с использованием взаимного прогнозирования (этап Sd_1b). Следует отметить, что прогнозное изображение, сформированное посредством внутреннего прогнозирования, также называется "внутренним прогнозным изображением", и прогнозное изображение, сформированное посредством взаимного прогнозирования, также называется "взаимным прогнозным изображением".
[0142] Затем, процессор прогнозирования оценивает каждое из внутреннего прогнозного изображения и взаимного прогнозного изображения (этап Sd_2). Затраты могут использоваться при оценке. Другими словами, процессор прогнозирования вычисляет затраты C для каждого из внутреннего прогнозного изображения и взаимного прогнозного изображения. Затраты C могут вычисляться согласно выражению модели R-D-оптимизации, например, C=D+λ*R. В этом выражении, D указывает искажение при кодировании прогнозного изображения и представляется, например, как сумма абсолютных разностей между пиксельным значением текущего блока и пиксельным значением прогнозного изображения. Помимо этого, R указывает прогнозированный объем кодирования прогнозного изображения, а именно, объем кодирования, требуемый для того, чтобы кодировать информацию движения для формирования прогнозного изображения, и т.д. Помимо этого, λ указывает, например, множитель согласно способу множителя Лагранжа.
[0143] Процессор прогнозирования затем выбирает прогнозное изображение, для которого наименьшие затраты C вычислены из внутреннего прогнозного изображения и взаимного прогнозного изображения, в качестве конечного прогнозного изображения для текущего блока (этап Sd_3). Другими словами, выбирается способ или режим прогнозирования для формирования прогнозного изображения для текущего блока.
[0144] Модуль внутреннего прогнозирования
Модуль 124 внутреннего прогнозирования формирует прогнозный сигнал (внутренний прогнозный сигнал) посредством выполнения внутреннего прогнозирования (также называется "внутрикадровым прогнозированием") текущего блока посредством ссылки на блок или блоки в текущем кадре, сохраненном в запоминающем устройстве 118 блоков. Более конкретно, модуль 124 внутреннего прогнозирования формирует внутренний прогнозный сигнал посредством выполнения внутреннего прогнозирования посредством ссылки на выборки (например, значения сигнала яркости и/или сигнала цветности) блока или блоков, соседних с текущим блоком, и затем выводит внутренний прогнозный сигнал в контроллер 128 прогнозирования.
[0145] Например, модуль 124 внутреннего прогнозирования выполняет внутреннее прогнозирование посредством использования одного режима из множества режимов внутреннего прогнозирования, которые задаются. Режимы внутреннего прогнозирования включают в себя один или более режимов ненаправленного прогнозирования и множество режимов направленного прогнозирования. Заданные режимы могут быть предварительно заданы.
[0146] Один или более режимов ненаправленного прогнозирования включают в себя, например, режим планарного прогнозирования и режим DC-прогнозирования, заданные в стандарте H.265/высокоэффективного кодирования видео (HEVC).
[0147] Множество режимов направленного прогнозирования включают в себя, например, тридцать три режима направленного прогнозирования, заданные в H.265/HEVC-стандарте. Следует отметить, что множество режимов направленного прогнозирования дополнительно могут включать в себя тридцать два режима направленного прогнозирования в дополнение к тридцати трем режимам направленного прогнозирования (в сумме шестьдесят пять режимов направленного прогнозирования). Фиг. 14 является концептуальной схемой, иллюстрирующей шестьдесят семь режимов внутреннего прогнозирования в сумме, которые могут использоваться при внутреннем прогнозировании (два режима ненаправленного прогнозирования и шестьдесят пять режимов направленного прогнозирования). Сплошные стрелки представляют тридцать три направления, заданные в H.265/HEVC-стандарте, и пунктирные стрелки представляют дополнительные тридцать два направления (два режима ненаправленного прогнозирования не проиллюстрированы на фиг. 14).
[0148] В различных видах примеров обработки, на блок сигналов яркости можно ссылаться при внутреннем прогнозировании блока сигналов цветности. Другими словами, компонент сигнала цветности текущего блока может прогнозироваться на основе компонента сигнала яркости текущего блока. Такое внутреннее прогнозирование также называется "прогнозированием на основе кросскомпонентной линейной модели (CCLM)". Режим внутреннего прогнозирования для блока сигналов цветности, в котором на такой блок сигналов яркости ссылаются (также называется, например, "CCLM-режимом"), может добавляться в качестве одного из режимов внутреннего прогнозирования для блоков сигналов цветности.
[0149] Модуль 124 внутреннего прогнозирования может корректировать внутренне прогнозированные пиксельные значения на основе горизонтальных/вертикальных опорных пиксельных градиентов. Внутреннее прогнозирование, сопровождаемое посредством этого вида коррекции, также называется "позиционно-зависимой комбинацией с внутренним прогнозированием (PDPC)". Информация, указывающая то, следует или нет применять PDPC (называется, например, "PDPC-флагом"), нормально передается в служебных сигналах на уровне CU. Следует отметить, что передача в служебных сигналах этой информации не должна обязательно выполняться на уровне CU и может выполняться на другом уровне (например, на уровне последовательности, уровне кадра, уровне среза, уровне плитки или уровне CTU).
[0150] Модуль взаимного прогнозирования
Модуль 126 взаимного прогнозирования формирует прогнозный сигнал (взаимный прогнозный сигнал) посредством выполнения взаимного прогнозирования (также называется "межкадровым прогнозированием") текущего блока посредством ссылки на блок или блоки в опорном кадре, который отличается от текущего кадра и сохраняется в запоминающем устройстве 122 кинокадров. Взаимное прогнозирование выполняется в единицах текущего блока или текущего субблока (например, блок 4*4) в текущем блоке. Например, модуль 126 взаимного прогнозирования выполняет оценку движения в опорном кадре для текущего блока или текущего субблока и узнает опорный блок или субблок, который имеет наилучшее совпадение с текущим блоком или текущим субблоком. Модуль 126 взаимного прогнозирования затем получает информацию движения (например, вектор движения), которая компенсирует движение или изменение с опорного блока или субблока на текущий блок или субблок. Модуль 126 взаимного прогнозирования формирует взаимный прогнозный сигнал текущего блока или субблока посредством выполнения компенсации движения (или прогнозирования движения) на основе информации движения. Модуль 126 взаимного прогнозирования выводит сформированный взаимный прогнозный сигнал в контроллер 128 прогнозирования.
[0151] Информация движения, используемая при компенсации движения, может передаваться в служебных сигналах в качестве взаимных прогнозных сигналов в различных формах. Например, вектор движения может передаваться в служебных сигналах. Другими словами, разность между вектором движения и предиктором вектора движения может передаваться в служебных сигналах.
[0152] Базовая последовательность операций взаимного прогнозирования
Фиг. 15 является блок-схемой последовательности операций способа, иллюстрирующей примерную базовую последовательность операций обработки взаимного прогнозирования.
[0153] Во-первых, модуль 126 взаимного прогнозирования формирует прогнозный сигнал (этапы Se_1-Se_3). Затем, вычитатель 104 формирует разность между текущим блоком и прогнозным изображением в качестве остатка прогнозирования (этап Se_4).
[0154] Здесь, при формировании прогнозного изображения, модуль 126 взаимного прогнозирования формирует прогнозное изображение посредством определения вектора движения (MV) текущего блока (этапы Se_1 и Se_2) и компенсации движения (этап Se_3). Кроме того, при определении MV, модуль 126 взаимного прогнозирования определяет MV посредством выбора возможного варианта вектора движения (возможного MV-варианта) (этап Se_1) и извлечения MV (этап Se_2). Выбор возможного MV-варианта осуществляется, например, посредством выбора, по меньшей мере, одного возможного MV-варианта из списка возможных MV-вариантов. Альтернативно, при извлечении MV, модуль 126 взаимного прогнозирования дополнительно может выбирать, по меньшей мере, один возможный MV-вариант, по меньшей мере, из одного возможного MV-варианта и определять выбранный, по меньшей мере, один возможный MV-вариант в качестве MV для текущего блока. Альтернативно, модуль 126 взаимного прогнозирования может определять MV для текущего блока посредством выполнения оценки в области опорного кадра, указываемой посредством каждого из выбранного, по меньшей мере, одного возможного MV-варианта. Следует отметить, что оценка в области опорного кадра может называться "оценкой движения".
[0155] Помимо этого, хотя этапы Se_1-Se_3 выполняются посредством модуля 126 взаимного прогнозирования в вышеописанном примере, процесс, который, например, представляет собой этап Se_1, этап Se_2 и т.п., может выполняться посредством другого составляющего элемента, включенного в кодер 100.
[0156] Последовательность операций извлечения векторов движения
Фиг. 16 является блок-схемой последовательности операций способа, иллюстрирующей один пример извлечения векторов движения.
[0157] Модуль 126 взаимного прогнозирования извлекает MV текущего блока в режиме для кодирования информации движения (например, MV). В этом случае, например, информация движения кодируется как параметр прогнозирования и передается в служебных сигналах. Другими словами, кодированная информация движения включается в кодированный сигнал (также называется "кодированным потоком битов").
[0158] Альтернативно, модуль 126 взаимного прогнозирования извлекает MV в режиме, в котором информация движения не кодируется. В этом случае, информация движения не включается в кодированный сигнал.
[0159] Здесь, режимы MV-извлечения могут включать в себя нормальный взаимный режим, режим объединения, FRUC-режим, аффинный режим и т.д., которые описываются ниже. Режимы, в которых кодируется информация движения, из числа режимов включают в себя нормальный взаимный режим, режим объединения, аффинный режим (в частности, аффинный взаимный режим и аффинный режим объединения) и т.д. Следует отметить, что информация движения может включать в себя не только MV, но также и информацию выбора предиктора вектора движения, которая описывается ниже. Режимы, в которых информация движения не кодируется, включают в себя FRUC-режим и т.д. Модуль 126 взаимного прогнозирования выбирает режим для извлечения MV текущего блока из режимов и извлекает MV текущего блока с использованием выбранного режима.
[0160] Фиг. 17 является блок-схемой последовательности операций способа, иллюстрирующей другой пример извлечения векторов движения.
[0161] Модуль 126 взаимного прогнозирования извлекает MV текущего блока в режиме, в котором MV-разность кодируется. В этом случае, например, MV-разность кодируется как параметр прогнозирования и передается в служебных сигналах. Другими словами, кодированная MV-разность включается в кодированный сигнал. MV-разность представляет собой разность между MV текущего блока и MV-предиктором.
[0162] Альтернативно, модуль 126 взаимного прогнозирования извлекает MV в режиме, в котором MV-разность не кодируется. В этом случае, кодированная MV-разность не включается в кодированный сигнал.
[0163] Здесь, как описано выше, режимы MV-извлечения включают в себя нормальный взаимный режим, режим объединения, FRUC-режим, аффинный режим и т.д., которые описываются ниже. Режимы, в которых MV-разность кодируется, из числа режимов включают в себя нормальный взаимный режим, аффинный режим (в частности, аффинный взаимный режим) и т.д. Режимы, в которых MV-разность не кодируется, включают в себя FRUC-режим, режим объединения, аффинный режим (в частности, аффинный режим объединения) и т.д. Модуль 126 взаимного прогнозирования выбирает режим для извлечения MV текущего блока из множества режимов и извлекает MV текущего блока с использованием выбранного режима.
[0164] Последовательность операций извлечения векторов движения
Фиг. 18 является блок-схемой последовательности операций способа, иллюстрирующей другой пример извлечения векторов движения. Режимы MV-извлечения, которые представляют собой режимы взаимного прогнозирования, включают в себя множество режимов и приблизительно разделяются на режимы, в которых MV-разность кодируется, и режимы, в которых разность векторов движения не кодируется. Режимы, в которых MV-разность не кодируется, включают в себя режим объединения, FRUC-режим, аффинный режим (в частности, аффинный режим объединения) и т.д. Эти режимы подробно описываются далее. Просто, режим объединения представляет собой режим для извлечения MV текущего блока посредством выбора вектора движения из кодированного окружающего блока, и FRUC-режим представляет собой режим для извлечения MV текущего блока посредством выполнения оценки между кодированными областями. Аффинный режим представляет собой режим для извлечения, в качестве MV текущего блока, вектора движения каждого из множества субблоков, включенных в текущий блок, при условии аффинного преобразования.
[0165] Более конкретно, как проиллюстрировано, когда информация режима взаимного прогнозирования указывает 0 (0 на Sf_1), модуль 126 взаимного прогнозирования извлекает вектор движения с использованием режима объединения (Sf_2). Когда информация режима взаимного прогнозирования указывает 1 (1 на Sf_1), модуль 126 взаимного прогнозирования извлекает вектор движения с использованием FRUC-режима (Sf_3). Когда информация режима взаимного прогнозирования указывает 2 (2 на Sf_1), модуль 126 взаимного прогнозирования извлекает вектор движения с использованием аффинного режима (в частности, аффинного режима объединения) (Sf_4). Когда информация режима взаимного прогнозирования указывает 3 (3 на Sf_1), модуль 126 взаимного прогнозирования извлекает вектор движения с использованием режима, в котором MV-разность кодируется (например, нормального взаимного режима (Sf_5)).
[0166] MV-извлечение > нормальный взаимный режим
Нормальный взаимный режим представляет собой режим взаимного прогнозирования для извлечения MV текущего блока на основе блока, аналогичного изображению текущего блока, из области опорного кадра, указываемой посредством возможного MV-варианта. В этом нормальном взаимном режиме, MV-разность кодируется.
[0167] Фиг. 19 является блок-схемой последовательности операций способа, иллюстрирующей пример взаимного прогнозирования в нормальном взаимном режиме.
[0168] Во-первых, модуль 126 взаимного прогнозирования получает множество возможных MV-вариантов для текущего блока на основе такой информации, как MV множества кодированных блоков, временно или пространственно окружающих текущий блок (этап Sg_1). Другими словами, модуль 126 взаимного прогнозирования формирует список возможных MV-вариантов.
[0169] Затем, модуль 126 взаимного прогнозирования извлекает N (целое число в 2 или более) возможных MV-вариантов из множества возможных MV-вариантов, полученных на этапе Sg_1, в качестве возможных вариантов предикторов векторов движения (также называются "возможными вариантами MV-предикторов") согласно определенному порядку приоритетов (этап Sg_2). Следует отметить, что порядок приоритетов может определяться заранее для каждого из N возможных MV-вариантов.
[0170] Затем, модуль 126 взаимного прогнозирования выбирает один возможный вариант предиктора вектора движения из возможных вариантов предикторов векторов движения N, в качестве предиктора вектора движения (также называется "MV-предиктором") текущего блока (этап Sg_3). В это время, модуль 126 взаимного прогнозирования кодирует, в потоке, информацию выбора предиктора вектора движения для идентификации выбранного предиктора вектора движения. Следует отметить, что поток представляет собой кодированный сигнал или кодированный поток битов, как описано выше.
[0171] Затем, модуль 126 взаимного прогнозирования извлекает MV текущего блока посредством ссылки на кодированный опорный кадр (этап Sg_4). В это время, модуль 126 взаимного прогнозирования дополнительно кодирует, в потоке, значение разности между извлеченным MV и предиктором вектора движения в качестве MV-разности. Следует отметить, что кодированный опорный кадр представляет собой кадр, включающий в себя множество блоков, которые восстановлены после кодирования.
[0172] В завершение, модуль 126 взаимного прогнозирования формирует прогнозное изображение для текущего блока посредством выполнения компенсации движения текущего блока с использованием извлеченного MV и кодированного опорного кадра (этап Sg_5). Следует отметить, что прогнозное изображение представляет собой взаимный прогнозный сигнал, как описано выше.
[0173] Помимо этого, информация, указывающая режим взаимного прогнозирования (нормальный взаимный режим в вышеприведенном примере), используемый для того чтобы, формировать прогнозное изображение, например, кодируется в качестве параметра прогнозирования.
[0174] Следует отметить, что список возможных MV-вариантов также может использоваться в качестве списка для использования в другом режиме. Помимо этого, процессы, связанные со списком возможных MV-вариантов, могут применяться к процессам, связанным со списком для использования в другом режиме. Процессы, связанные со списком возможных MV-вариантов, включают в себя, например, извлечение или выбор возможного MV-варианта из списка возможных MV-вариантов, переупорядочение возможных MV-вариантов или удаление возможного MV-варианта.
[0175] MV-извлечение > режим объединения
Режим объединения представляет собой режим взаимного прогнозирования для выбора возможного MV-варианта из списка возможных MV-вариантов в качестве MV текущего блока, за счет этого извлекая MV.
[0176] Фиг. 20 является блок-схемой последовательности операций способа, иллюстрирующей пример взаимного прогнозирования в режиме объединения.
[0177] Во-первых, модуль 126 взаимного прогнозирования получает множество возможных MV-вариантов для текущего блока на основе такой информации, как MV множества кодированных блоков, временно или пространственно окружающих текущий блок (этап Sh_1). Другими словами, модуль 126 взаимного прогнозирования формирует список возможных MV-вариантов.
[0178] Затем, модуль 126 взаимного прогнозирования выбирает один возможный MV-вариант из множества возможных MV-вариантов, полученных на этапе Sh_1, за счет этого извлекая MV текущего блока (этап Sh_2). В это время, модуль 126 взаимного прогнозирования кодирует, в потоке, информацию MV-выбора для идентификации выбранного возможного MV-варианта.
[0179] В завершение, модуль 126 взаимного прогнозирования формирует прогнозное изображение для текущего блока посредством выполнения компенсации движения текущего блока с использованием извлеченного MV и кодированного опорного кадра (этап Sh_3).
[0180] Помимо этого, информация, указывающая режим взаимного прогнозирования (режим объединения в вышеприведенном примере), используемый для того, чтобы формировать прогнозное изображение, и включенная в кодированный сигнал, например, кодируется в качестве параметра прогнозирования.
[0181] Фиг. 21 является концептуальной схемой для иллюстрации одного примера процесса извлечения векторов движения текущего кадра в режиме объединения.
[0182] Во-первых, список возможных MV-вариантов, в котором регистрируются возможные варианты MV-предикторов, формируется. Примеры возможных вариантов MV-предикторов включают в себя: пространственно соседние MV-предикторы, которые представляют собой MV множества кодированных блоков, расположенных пространственно окружающими текущий блок; временно соседние MV-предикторы, которые представляют собой MV окружающих блоков, на которые проецируется позиция текущего блока в кодированном опорном кадре; комбинированные MV-предикторы, которые представляют собой MV, сформированные посредством комбинирования MV-значения пространственно соседнего MV-предиктора и MV временно соседнего MV-предиктора; и нулевой MV-предиктор, который представляет собой MV, имеющий нулевое значение.
[0183] Затем, один MV-предиктор выбирается из множества MV-предикторов, зарегистрированных в списке MV-предикторов, и выбранный MV-предиктор определяется в качестве MV текущего блока.
[0184] Кроме того, кодер переменной длины описывает и кодирует, в потоке, merge_idx, который представляет собой сигнал, указывающий то, какой MV-предиктор выбран.
[0185] Следует отметить, что MV-предикторы, зарегистрированные в списке MV-предикторов, описанном на фиг. 21, представляют собой примеры. Число MV-предикторов может отличаться от числа MV-предикторов на схеме, список MV-предикторов может быть сконфигурирован таким образом, что некоторые виды MV-предикторов на схеме могут не включаться, либо таким образом, что один или более MV-предикторов, отличных от видов MV-предикторов на схеме, включаются.
[0186] Конечный MV может определяться посредством выполнения процесса детализации векторов движения в декодере (DMVR), который описывается ниже, с использованием MV текущего блока, извлекаемого в режиме объединения.
[0187] Следует отметить, что возможные варианты MV-предикторов представляют собой возможные MV-варианты, описанные выше, и список MV-предикторов представляет собой список возможных MV-вариантов, описанный выше. Следует отметить, что список возможных MV-вариантов может называться "списком возможных вариантов". Помимо этого, merge_idx представляет собой информацию MV-выбора.
[0188] MV-извлечение > FRUC-режим
Информация движения может извлекаться на стороне декодера без передачи в служебных сигналах из стороны кодера. Следует отметить, что, как описано выше, может использоваться режим объединения, заданный в H.265/HEVC-стандарте. Помимо этого, например, информация движения может извлекаться посредством выполнения оценки движения на стороне декодера. В варианте осуществления, на стороне декодера оценка движения выполняется без использования пиксельных значений в текущем блоке.
[0189] Здесь описывается режим для выполнения оценки движения на стороне декодера. Режим для выполнения оценки движения на стороне декодера может называться "режимом извлечения векторов движения на основе сопоставления с шаблоном (PMMVD)" или "режимом преобразования с повышением частоты кинокадров (FRUC)".
[0190] Один пример FRUC-процесса в форме блок-схемы последовательности операций способа проиллюстрирован на фиг. 22. Во-первых, список множества возможных вариантов, имеющих предиктор вектора движения (MV) (т.е. список возможных MV-вариантов, который также может использоваться в качестве списка объединения), формируется посредством ссылки на вектор движения в кодированном блоке, который является пространственно или временно соседним с текущим блоком (этап Si_1). Затем, наилучший возможный MV-вариант выбирается из множества возможных MV-вариантов, зарегистрированных в списке возможных MV-вариантов (этап Si_2). Например, значения оценки соответствующих возможных MV-вариантов, включенных в список возможных MV-вариантов, вычисляются, и один возможный MV-вариант выбирается на основе значений оценки. На основе выбранных возможных вариантов векторов движения, вектор движения для текущего блока затем извлекается (этап Si_4). Более конкретно, например, выбранный возможный вариант вектора движения (наилучший возможный MV-вариант) извлекается непосредственно в качестве вектора движения для текущего блока. Помимо этого, например, вектор движения для текущего блока может извлекаться с использованием сопоставления с шаблоном в окружающей области позиции в опорном кадре, при этом позиция в опорном кадре соответствует выбранному возможному варианту вектора движения. Другими словами, оценка с использованием сопоставления с шаблоном и значений оценки может выполняться в окружающей области наилучшего возможного MV-варианта, и когда имеется MV, который дает в результате лучшее значение оценки, наилучший возможный MV-вариант может обновляться на MV, который дает в результате лучшее значение оценки, и обновленный MV может определяться в качестве конечного MV для текущего блока. Также возможна конфигурация, в которой не выполняется такой процесс для обновления наилучшего возможного MV-варианта на MV, имеющий лучшее значение оценки.
[0191] В завершение, модуль 126 взаимного прогнозирования формирует прогнозное изображение для текущего блока посредством выполнения компенсации движения текущего блока с использованием извлеченного MV и кодированного опорного кадра (этап Si_5).
[0192] Аналогичный процесс может выполняться в единицах субблоков.
[0193] Значения оценки могут вычисляться согласно различным видам способов. Например, сравнение проводится между восстановленным изображением в области в опорном кадре, соответствующей вектору движения, и восстановленным изображением в определенной области (область, например, может представлять собой область в другом опорном кадре или область в соседнем блоке текущего кадра, как указано ниже). Определенная область может быть предварительно определена. Разность между пиксельными значениями двух восстановленных изображений может использоваться для значения оценки векторов движения. Следует отметить, что значение оценки может вычисляться с использованием информации, отличной от значения разности.
[0194] Далее подробно описывается пример сопоставления с шаблоном. Во-первых, один возможный MV-вариант, включенный в список возможных MV-вариантов (например, список объединения), выбирается в качестве начальной точки оценки посредством сопоставления с шаблоном. Например, в качестве сопоставления с шаблоном, может использоваться первое сопоставление с шаблоном или второе сопоставление с шаблоном. Первое сопоставление с шаблоном и второе сопоставление с шаблоном также называются "билатеральным сопоставлением" и "сопоставлением с эталоном", соответственно.
[0195] MV-извлечение > FRUC > билатеральное сопоставление
При первом сопоставлении с шаблоном, сопоставление с шаблоном выполняется между двумя блоками вдоль траектории движения текущего блока, которые представляют собой два блока в различных двух опорных кадрах. Соответственно, при первом сопоставлении с шаблоном, область в другом опорном кадре вдоль траектории движения текущего блока используется в качестве определенной области для вычисления значения оценки вышеописанного возможного варианта. Определенная область может быть предварительно определена.
[0196] Фиг. 23 является концептуальной схемой для иллюстрации одного примера первого сопоставления с шаблоном (билатерального сопоставления) между двумя блоками в двух опорных кадрах вдоль траектории движения. Как проиллюстрировано на фиг. 23, при первом сопоставлении с шаблоном, два вектора (MV0, MV1) движения извлекаются посредством оценки пары, которая имеет наилучшее совпадение, из числа пар в двух блоках в двух различных опорных кадрах (Ref0, Ref1), которые представляют собой два блока вдоль траектории движения текущего блока (Cur block). Более конкретно, разность между восстановленным изображением в указанном местоположении в первом кодированном опорном кадре (Ref0), указываемом посредством возможного MV-варианта, и восстановленным изображением в указанном местоположении во втором кодированном опорном кадре (Ref1), указываемом посредством симметричного MV, полученная посредством масштабирования возможного MV-варианта во временном интервале отображения, извлекается для текущего блока, и значение оценки вычисляется с использованием значения полученной разности. Можно выбирать, в качестве конечного MV, возможный MV-вариант, который дает в результате наилучшее значение оценки из множества возможных MV-вариантов и который с большой вероятностью должен приводить к хорошим результатам.
[0197] При допущении относительно траектории непрерывного движения, векторы (MV0, MV1) движения, указывающие два опорных блока, являются пропорциональными временным расстояниям (TD0, TD1) между текущим кадром (Cur Pic) и двумя опорными кадрами (Ref0, Ref1). Например, когда текущий кадр временно находится между двумя опорными кадрами, и временные расстояния от текущего кадра до соответствующих двух опорных кадров равны друг другу, зеркально-симметричные двунаправленные векторы движения извлекаются при первом сопоставлении с шаблоном.
[0198] MV-извлечение > FRUC > сопоставление с эталоном
При втором сопоставлении с шаблоном (сопоставлении с эталоном), сопоставление с шаблоном выполняется между блоком в опорном кадре и эталоном в текущем кадре (эталон представляет собой блок, соседний с текущим блоком в текущем кадре (соседний блок, например, представляет собой верхний и/или левый соседний блок(и))). Следовательно, при втором сопоставлении с шаблоном, блок, соседний с текущим блоком в текущем кадре, используется в качестве предварительно определенной области для вышеописанного вычисления значения оценки возможного варианта.
[0199] Фиг. 24 является концептуальной схемой для иллюстрации одного примера сопоставления с шаблоном (сопоставления с эталоном) между эталоном в текущем кадре и блоком в опорном кадре. Как проиллюстрировано на фиг. 24, при втором сопоставлении с шаблоном, вектор движения текущего блока (Cur block) извлекается посредством оценки, в опорном кадре (Ref0), блока, который имеет наилучшее совпадение с блоком, соседним с текущим блоком в текущем кадре (Cur Pic). Более конкретно, возможно то, что извлекается разность между восстановленным изображением в кодированной области, который является соседним как слева, так и выше либо слева или выше, и восстановленным изображением, которое находится в соответствующей области в кодированном опорном кадре (Ref0) и указывается посредством возможного MV-варианта, значение оценки вычисляется с использованием значения полученной разности, и возможный MV-вариант, который дает в результате наилучшее значение оценки из множества возможных MV-вариантов, выбирается в качестве наилучшего возможного MV-варианта.
[0200] Эта информация, указывающая то, следует или нет применять FRUC-режим (называется, например, "FRUC-флагом"), может передаваться в служебных сигналах на уровне CU. Помимо этого, когда FRUC-режим применяется (например, когда FRUC-флаг является истинным), информация, указывающая применимый способ сопоставления с шаблоном (первое сопоставление с шаблоном или второе сопоставление с шаблоном), может передаваться в служебных сигналах на уровне CU. Следует отметить, что передача в служебных сигналах этой информации не должна обязательно выполняться на уровне CU и может выполняться на другом уровне (например, на уровне последовательности, уровне кадра, уровне среза, уровне плитки, уровне CTU или уровне субблока).
[0201] MV-извлечение > аффинный режим
Далее описывается аффинный режим для извлечения вектора движения в единицах субблоков на основе векторов движения множества соседних блоков. Этот режим также называется "аффинным режимом прогнозирования с компенсацией движения".
[0202] Фиг. 25A является концептуальной схемой для иллюстрации одного примера извлечения вектора движения каждого субблока на основе векторов движения множества соседних блоков. На фиг. 25A, текущий блок включает в себя шестнадцать субблоков 4*4. Здесь, вектор v0 движения в верхней левой угловой управляющей точке в текущем блоке извлекается на основе вектора движения соседнего блока, и аналогично, вектор v1 движения в верхней правой угловой управляющей точке в текущем блоке извлекается на основе вектора движения соседнего субблока. Два вектора v0 и v1 движения могут проецироваться согласно выражению (1A), указываемому ниже, и векторы (vx, vy) движения для соответствующих субблоков в текущем блоке могут извлекаться.
[0203] Математическое выражение 1
[0204] Здесь, x и y указывают горизонтальную позицию и вертикальную позицию субблока, соответственно, и w указывает определенный весовой коэффициент. Определенный весовой коэффициент может быть предварительно определен.
[0205] Эта информация, указывающая аффинный режим (например, называется "аффинным флагом"), может передаваться в служебных сигналах на уровне CU. Следует отметить, что передача в служебных сигналах информации, указывающей аффинный режим, не обязательно должна выполняться на уровне CU и может выполняться на другом уровне (например, на уровне последовательности, уровне кадра, уровне среза, уровне плитки, уровне CTU или уровне субблока).
[0206] Помимо этого, аффинный режим может включать в себя несколько режимов для различных способов для извлечения векторов движения в верхней левой и верхней правой угловых управляющих точках. Например, аффинный режим включает в себя два режима, которые представляют собой аффинный взаимный режим (также называется "аффинным нормальным взаимным режимом") и аффинный режим объединения.
[0207] MV-извлечение > аффинный режим
Фиг. 25B является концептуальной схемой для иллюстрации одного примера извлечения вектора движения каждого субблока в аффинном режиме, в котором используются три управляющих точки. На фиг. 25B, текущий блок включает в себя шестнадцать блоков 4*4. Здесь, вектор v0 движения в верхней левой угловой управляющей точке для текущего блока извлекается на основе вектора движения соседнего блока, и аналогично, вектор v1 движения в верхней правой угловой управляющей точке для текущего блока извлекается на основе вектора движения соседнего блока, и вектор v2 движения в нижней левой угловой управляющей точке для текущего блока извлекается на основе вектора движения соседнего блока. Три вектора v0, v1 и v2 движения могут проецироваться согласно выражению (1B), указываемому ниже, и векторы (vx, vy) движения для соответствующих субблоков в текущем блоке могут извлекаться.
[0208] Математическое выражение 2
[0209] Здесь, x и y указывают горизонтальную позицию и вертикальную позицию центра субблока, соответственно, w указывает ширину текущего блока, и h указывает высоту текущего блока.
[0210] Аффинные режимы, в которых используются различные числа управляющих точек (например, две и три управляющих точки), могут переключаться и передаваться в служебных сигналах на уровне CU. Следует отметить, что информация, указывающая число управляющих точек в аффинном режиме, используемом на уровне CU, может передаваться в служебных сигналах на другом уровне (например, на уровне последовательности, уровне кадра, уровне среза, уровне плитки, уровне CTU или уровне субблока).
[0211] Помимо этого, такой аффинный режим, в котором используются три управляющих точки, может включать в себя различные способы для извлечения векторов движения в верхней левой, верхней правой и нижней левой угловых управляющих точках. Например, аффинные режимы включают в себя два режима, которые представляют собой аффинный взаимный режим (также называется "аффинным нормальным взаимным режимом") и аффинный режим объединения.
[0212] MV-извлечение > аффинный режим объединения
Фиг. 26A, фиг. 26B и фиг. 26C являются концептуальными схемами для иллюстрации аффинного режима объединения.
[0213] Как проиллюстрировано на фиг. 26A, в аффинном режиме объединения, например, предикторы векторов движения в соответствующих управляющих точках текущего блока вычисляются на основе множества векторов движения, соответствующих блокам, кодированным согласно аффинному режиму, из кодированного блока A (левого), блока B (верхнего), блока C (верхнего правого), блока D (нижнего левого) и блока E (верхнего левого), которые являются соседними с текущим блоком. Более конкретно, кодированный блок A (левый), блок B (верхний), блок C (верхний правый), блок D (нижний левый) и блок E (верхний левый) проверяются в перечисленном порядке, и первый эффективный блок, кодированный согласно аффинному режиму, идентифицируется. Предикторы векторов движения в управляющих точках текущего блока вычисляются на основе множества векторов движения, соответствующих идентифицированному блоку.
[0214] Например, как проиллюстрировано на фиг. 26B, когда блок A, который является соседним слева от текущего блока, кодирован согласно аффинному режиму, в котором используются две управляющих точки, векторы v3 и v4 движения, проецируемые в верхней левой угловой позиции и верхней правой угловой позиции кодированного блока, включающего в себя блок A, извлекаются. Предиктор v0 вектора движения в верхней левой угловой управляющей точке текущего блока и предиктор v1 вектора движения в верхней правой угловой управляющей точке текущего блока затем вычисляются из извлеченных векторов v3 и v4 движения.
[0215] Например, как проиллюстрировано на фиг. 26C, когда блок A, который является соседним слева от текущего блока, кодирован согласно аффинному режиму, в котором используются три управляющих точки, векторы v3, v4 и v5 движения, проецируемые в верхней левой угловой позиции, верхней правой угловой позиции и нижней левой угловой позиции кодированного блока, включающего в себя блок A, извлекаются. Предиктор v0 вектора движения в верхней левой угловой управляющей точке текущего блока, предиктор v1 вектора движения в верхней правой угловой управляющей точке текущего блока и предиктор v2 вектора движения в нижней левой угловой управляющей точке текущего блока затем вычисляются из извлеченных векторов v3, v4 и v5 движения.
[0216] Следует отметить, что этот способ для извлечения предикторов векторов движения может использоваться для того, чтобы извлекать предикторы векторов движения соответствующих управляющих точек текущего блока на этапе Sj_1 на фиг. 29, описанном далее.
[0217] Фиг. 27 является блок-схемой последовательности операций способа, иллюстрирующей один пример аффинного режима объединения.
[0218] В аффинном режиме объединения, как проиллюстрировано, сначала, модуль 126 взаимного прогнозирования извлекает MV-предикторы соответствующих управляющих точек текущего блока (этап Sk_1). Управляющие точки представляют собой верхнюю левую угловую точку текущего блока и верхнюю правую угловую точку текущего блока, как проиллюстрировано на фиг. 25A, либо верхнюю левую угловую точку текущего блока, верхнюю правую угловую точку текущего блока и нижнюю левую угловую точку текущего блока, как проиллюстрировано на фиг. 25B.
[0219] Другими словами, как проиллюстрировано на фиг. 26A, модуль 126 взаимного прогнозирования проверяет кодированный блок A (левый), блок B (верхний), блок C (верхний правый), блок D (нижний левый) и блок E (верхний левый) в перечисленном порядке и идентифицирует первый эффективный блок, кодированный согласно аффинному режиму.
[0220] Когда блок A идентифицируется, и блок A имеет две управляющих точки, как проиллюстрировано на фиг. 26B, модуль 126 взаимного прогнозирования вычисляет вектор v0 движения в верхней левой угловой управляющей точке текущего блока и вектор v1 движения в верхней правой угловой управляющей точке текущего блока из векторов v3 и v4 движения в верхнем левом углу и верхнем правом углу кодированного блока, включающего в себя блок A. Например, модуль 126 взаимного прогнозирования вычисляет вектор v0 движения в верхней левой угловой управляющей точке текущего блока и вектор v1 движения в верхней правой угловой управляющей точке текущего блока посредством проецирования векторов v3 и v4 движения в верхнем левом углу и верхнем правом углу кодированного блока на текущий блок.
[0221] Альтернативно, когда блок A идентифицируется, и блок A имеет три управляющих точки, как проиллюстрировано на фиг. 26C, модуль 126 взаимного прогнозирования вычисляет вектор v0 движения в верхней левой угловой управляющей точке текущего блока, вектор v1 движения в верхней правой угловой управляющей точке текущего блока и вектор v2 движения в нижней левой угловой управляющей точке текущего блока из векторов v3, v4 и v5 движения в верхнем левом углу, верхнем правом углу и нижнем левом углу кодированного блока, включающего в себя блок A. Например, модуль 126 взаимного прогнозирования вычисляет вектор v0 движения в верхней левой угловой управляющей точке текущего блока, вектор v1 движения в верхней правой угловой управляющей точке текущего блока и вектор v2 движения в нижней левой угловой управляющей точке текущего блока посредством проецирования векторов v3, v4 и v5 движения в верхнем левом углу, верхнем правом углу и нижнем левом углу кодированного блока на текущий блок.
[0222] Затем, модуль 126 взаимного прогнозирования выполняет компенсацию движения каждого из множества субблоков, включенных в текущий блок. Другими словами, модуль 126 взаимного прогнозирования вычисляет, для каждого из множества субблоков, вектор движения субблока в качестве аффинного MV, посредством использования либо (i) двух предикторов v0 и v1 векторов движения и выражения (1A), описанного выше, либо (ii) трех предикторов v0, v1 и v2 векторов движения и выражения (1B), описанного выше (этап Sk_2). Модуль 126 взаимного прогнозирования затем выполняет компенсацию движения субблоков с использованием этих аффинных MV и кодированных опорных кадров (этап Sk_3). Как результат, компенсация движения текущего блока выполняется для того, чтобы формировать прогнозное изображение текущего блока.
[0223] MV-извлечение > аффинный взаимный режим
Фиг. 28A является концептуальной схемой для иллюстрации аффинного взаимного режима, в котором используются две управляющих точки.
[0224] В аффинном взаимном режиме, как проиллюстрировано на фиг. 28A, вектор движения, выбранный из векторов движения кодированного блока A, блока B и блока C, которые являются соседними с текущим блоком, используется в качестве предиктора v0 вектора движения в верхней левой угловой управляющей точке текущего блока. Аналогично, вектор движения, выбранный из векторов движения кодированного блока D и блока E, которые являются соседними с текущим блоком, используется в качестве предиктора v1 вектора движения в верхней правой угловой управляющей точке текущего блока.
[0225] Фиг. 28B является концептуальной схемой для иллюстрации аффинного взаимного режима, в котором используются три управляющих точки.
[0226] В аффинном взаимном режиме, как проиллюстрировано на фиг. 28B, вектор движения, выбранный из векторов движения кодированного блока A, блока B и блока C, которые являются соседними с текущим блоком, используется в качестве предиктора v0 вектора движения в верхней левой угловой управляющей точке текущего блока. Аналогично, вектор движения, выбранный из векторов движения кодированного блока D и блока E, которые являются соседними с текущим блоком, используется в качестве предиктора v1 вектора движения в верхней правой угловой управляющей точке текущего блока. Кроме того, вектор движения, выбранный из векторов движения кодированного блока F и блока G, которые являются соседними с текущим блоком, используется в качестве предиктора v2 вектора движения в нижней левой угловой управляющей точке текущего блока.
[0227] Фиг. 29 является блок-схемой последовательности операций способа, иллюстрирующей один пример аффинного взаимного режима.
[0228] В аффинном взаимном режиме, как проиллюстрировано, сначала, модуль 126 взаимного прогнозирования извлекает MV-предикторы (v0, v1) или (v0, v1, v2) соответствующих двух или трех управляющих точек текущего блока (этап Sj_1). Управляющие точки представляют собой верхнюю левую угловую точку текущего блока и верхнюю правую угловую точку текущего блока, как проиллюстрировано на фиг. 25A, либо верхнюю левую угловую точку текущего блока, верхнюю правую угловую точку текущего блока и нижнюю левую угловую точку текущего блока, как проиллюстрировано на фиг. 25B.
[0229] Другими словами, модуль 126 взаимного прогнозирования извлекает предикторы (v0, v1) или (v0, v1, v2) векторов движения соответствующих двух или трех управляющих точек текущего блока посредством выбора векторов движения любого из блоков из числа кодированных блоков около соответствующих управляющих точек текущего блока, проиллюстрированного на любом из фиг. 28A или фиг. 28B. В это время, модуль 126 взаимного прогнозирования кодирует, в потоке, информацию выбора предиктора вектора движения для идентификации выбранных двух векторов движения.
[0230] Например, модуль 126 взаимного прогнозирования может определять, с использованием оценки затрат и т.п., блок, из которого выбирается вектор движения в качестве предиктора вектора движения в управляющей точке, из числа кодированных блоков, соседних с текущим блоком, и может описывать, в потоке битов, флаг, указывающий то, какой предиктор вектора движения выбран.
[0231] Затем, модуль 126 взаимного прогнозирования выполняет оценку движения (этап Sj_3 и Sj_4) при обновлении предиктора вектора движения, выбранного или извлеченного на этапе Sj_1 (этап Sj_2). Другими словами, модуль 126 взаимного прогнозирования вычисляет, в качестве аффинного MV, вектор движения каждого из субблоков, который соответствует обновленному предиктору вектора движения, с использованием либо выражения (1A), либо выражения (1B), описанных выше (этап Sj_3). Модуль 126 взаимного прогнозирования затем выполняет компенсацию движения субблоков с использованием этих аффинных MV и кодированных опорных кадров (этап Sj_4). Как результат, например, модуль 126 взаимного прогнозирования определяет предиктор вектора движения, который дает в результате наименьшие затраты, в качестве вектора движения в управляющей точке в контуре оценки движения (этап Sj_5). В это время, модуль 126 взаимного прогнозирования дополнительно кодирует, в потоке, значение разности между определенным MV и предиктором вектора движения в качестве MV-разности.
[0232] В завершение, модуль 126 взаимного прогнозирования формирует прогнозное изображение для текущего блока посредством выполнения компенсации движения текущего блока с использованием определенного MV и кодированного опорного кадра (этап Sj_6).
[0233] MV-извлечение > аффинный взаимный режим
Когда аффинные режимы, в которых используются различные числа управляющих точек (например, две и три управляющих точки), могут переключаться и передаваться в служебных сигналах на уровне CU, число управляющих точек в кодированном блоке и число управляющих точек в текущем блоке могут отличаться друг от друга. Фиг. 30A и фиг. 30B являются концептуальными схемами для иллюстрации способов для извлечения предикторов векторов движения в управляющих точках, когда число управляющих точек в кодированном блоке и число управляющих точек в текущем блоке отличаются друг от друга.
[0234] Например, как проиллюстрировано на фиг. 30A, когда текущий блок имеет три управляющих точки в верхнем левом углу, верхнем правом углу и нижнем левом углу, и блок A, который является соседним слева от текущего блока, кодирован согласно аффинному режиму, в котором используются две управляющих точки, векторы v3 и v4 движения, проецируемые в верхней левой угловой позиции и верхней правой угловой позиции в кодированном блоке, включающем в себя блок A, извлекаются. Предиктор v0 вектора движения в верхней левой угловой управляющей точке текущего блока и предиктор v1 вектора движения в верхней правой угловой управляющей точке текущего блока затем вычисляются из извлеченных векторов v3 и v4 движения. Кроме того, предиктор v2 вектора движения в нижней левой угловой управляющей точке вычисляется из извлеченных векторов v0 и v1 движения.
[0235] Например, как проиллюстрировано на фиг. 30B, когда текущий блок имеет две управляющих точки в верхнем левом углу и верхнем правом углу, и блок A, который является соседним слева от текущего блока, кодирован согласно аффинному режиму, в котором используются три управляющих точки, векторы v3, v4 и v5 движения, проецируемые в верхней левой угловой позиции, верхней правой угловой позиции и нижней левой угловой позиции в кодированном блоке, включающем в себя блок A, извлекаются. Предиктор v0 вектора движения в верхней левой угловой управляющей точке текущего блока и предиктор v1 вектора движения в верхней правой угловой управляющей точке текущего блока затем вычисляются из извлеченных векторов v3, v4 и v5 движения.
[0236] Следует отметить, что этот способ для извлечения предикторов векторов движения может использоваться для того, чтобы извлекать предикторы векторов движения соответствующих управляющих точек текущего блока на этапе Sj_1 на фиг. 29.
[0237] MV-извлечение > DMVR
Фиг. 31A является блок-схемой последовательности операций способа, иллюстрирующей взаимосвязь между режимом объединения и DMVR.
[0238] Модуль 126 взаимного прогнозирования извлекает вектор движения текущего блока согласно режиму объединения (этап Sl_1). Затем, модуль 126 взаимного прогнозирования определяет то, следует или нет выполнять оценку вектора движения, т.е. оценку движения (этап Sl_2). Здесь, при определении не выполнять оценку движения ("Нет" на этапе Sl_2), модуль 126 взаимного прогнозирования определяет вектор движения, извлекаемый на этапе Sl_1, в качестве конечного вектора движения для текущего блока (этап Sl_4). Другими словами, в этом случае, вектор движения текущего блока определяется согласно режиму объединения.
[0239] При определении выполнять оценку движения на этапе Sl_1 ("Да" на этапе Sl_2), модуль 126 взаимного прогнозирования извлекает конечный вектор движения для текущего блока посредством оценки окружающей области опорного кадра, указываемого посредством вектора движения, извлекаемого на этапе Sl_1 (этап Sl_3). Другими словами, в этом случае, вектор движения текущего блока определяется согласно DMVR.
[0240] Фиг. 31B является концептуальной схемой для иллюстрации одного примера DMVR-процесса для определения MV.
[0241] Во-первых (например, в режиме объединения), наилучший MVP, который задан в качестве текущего блоку, определяется в качестве возможного MV-варианта. Опорный пиксел идентифицируется из первого опорного кадра (L0), который представляет собой кодированный кадр в направлении L0 согласно возможному MV-варианту (L0). Аналогично, опорный пиксел идентифицируется из второго опорного кадра (L1), который представляет собой кодированный кадр в направлении L1 согласно возможному MV-варианту (L1). Эталон формируется посредством вычисления среднего этих опорных пикселов.
[0242] Затем, каждая из окружающих областей возможных MV-вариантов первого опорного кадра (L0) и второго опорного кадра (L1) оценивается, и MV, который дает в результате наименьшие затраты, определяется в качестве конечного MV. Следует отметить, что значение затрат может вычисляться, например, с использованием значения разности между каждым из пиксельных значений в эталоне и соответствующим одним из пиксельных значений в области оценки, значений возможных MV-вариантов и т.д.
[0243] Следует отметить, что процессы, конфигурации и операции, описанные здесь, типично являются, по существу, общими между кодером и декодером, которые описываются ниже.
[0244] Совершенно идентичные примерные процессы, описанные здесь, не всегда должны обязательно выполняться. Любой процесс для обеспечения возможности извлечения конечного MV посредством оценки в окружающих областях возможных MV-вариантов может использоваться.
[0245] Компенсация движения > BIO/OBMC
Компенсация движения заключает в себе режим для формирования прогнозного изображения и коррекции прогнозного изображения. Режим, например, представляет собой BIO и OBMC, которые описываются ниже.
[0246] Фиг. 32 является блок-схемой последовательности операций способа, иллюстрирующей один пример формирования прогнозного изображения.
[0247] Модуль 126 взаимного прогнозирования формирует прогнозное изображение (этап Sm_1) и корректирует прогнозное изображение, например, согласно любому из режимов, описанных выше (этап Sm_2).
[0248] Фиг. 33 является блок-схемой последовательности операций способа, иллюстрирующей другой пример формирования прогнозного изображения.
[0249] Модуль 126 взаимного прогнозирования определяет вектор движения текущего блока (этап Sn_1). Затем, модуль 126 взаимного прогнозирования формирует прогнозное изображение (этап Sn_2) и определяет то, следует или нет выполнять процесс коррекции (этап Sn_3). Здесь, при определении выполнять процесс коррекции ("Да" на этапе Sn_3), модуль 126 взаимного прогнозирования формирует конечное прогнозное изображение посредством коррекции прогнозного изображения (этап Sn_4). При определении не выполнять процесс коррекции ("Нет" на этапе Sn_3), модуль 126 взаимного прогнозирования выводит прогнозное изображение в качестве конечного прогнозного изображения без коррекции прогнозного изображения (этап Sn_5).
[0250] Помимо этого, компенсация движения заключает в себе режим для коррекции яркости прогнозного изображения при формировании прогнозного изображения. Режимом, например, представляет собой LIC, который описывается ниже.
[0251] Фиг. 34 является блок-схемой последовательности операций способа, иллюстрирующей другой пример формирования прогнозного изображения.
[0252] Модуль 126 взаимного прогнозирования извлекает вектор движения текущего блока (этап So_1). Затем, модуль 126 взаимного прогнозирования определяет то, следует или нет выполнять процесс коррекции яркости (этап So_2). Здесь, при определении выполнять процесс коррекции яркости ("Да" на этапе So_2), модуль 126 взаимного прогнозирования формирует прогнозное изображение при выполнении процесса коррекции яркости (этап So_3). Другими словами, прогнозное изображение формируется с использованием LIC. При определении не выполнять процесс коррекции яркости ("Нет" на этапе So_2), модуль 126 взаимного прогнозирования формирует прогнозное изображение посредством выполнения нормальной компенсации движения без выполнения процесса коррекции яркости (этап So_4).
[0253] Компенсация движения > OBMC
Следует отметить, что взаимный прогнозный сигнал может формироваться с использованием информации движения для соседнего блока в дополнение к информации движения для текущего блока, полученной из оценки движения. Более конкретно, взаимный прогнозный сигнал может формироваться в единицах субблоков в текущем блоке посредством выполнения суммирования со взвешиванием прогнозного сигнала на основе информации движения, полученной из оценки движения (в опорном кадре), и прогнозного сигнала на основе информации движения для соседнего блока (в текущем кадре). Такое взаимное прогнозирование (компенсация движения) также называется "перекрывающейся блочной компенсацией движения (OBMC)".
[0254] В OBMC-режиме, информация, указывающая размер субблока для OBMC (называется, например, "размером OBMC-блока"), может передаваться в служебных сигналах на уровне последовательности. Кроме того, информация, указывающая то, следует или нет применять OBMC-режим (называется, например, "OBMC-флагом"), передается в служебных сигналах на уровне CU. Следует отметить, что передача в служебных сигналах этой информации не должна обязательно выполняться на уровне последовательности и уровне CU и может выполняться на другом уровне (например, на уровне кадра, уровне среза, уровне плитки, уровне CTU или уровне субблока).
[0255] В дальнейшем подробнее описываются примеры OBMC-режима. Фиг. 35 и 36 являются блок-схемой последовательности операций способа и концептуальной схемой для иллюстрации краткого представления процесса коррекции прогнозных изображений, выполняемого посредством OBMC-процесса.
[0256] Во-первых, как проиллюстрировано на фиг. 36, прогнозное изображение (Pred) получается через нормальную компенсацию движения с использованием вектора движения (MV), назначенного целевому (текущему) блоку обработки. На фиг. 36, стрелка "MV" указывает на опорный кадр и указывает то, на что ссылается текущий блок текущего кадра, чтобы получать прогнозное изображение.
[0257] Затем, прогнозное изображение (Pred_L) получается посредством применения вектора (MV_L) движения, который уже извлечен для кодированного блока, соседнего слева от текущего блока, к текущему блоку (многократного использования вектора движения для текущего блока). Вектор (MV_L) движения указывается посредством стрелки "MV_L", указывающей опорный кадр из текущего блока. Первая коррекция прогнозного изображения выполняется посредством перекрытия двух прогнозных изображений Pred и Pred_L. Это предоставляет преимущество смешивания границы между соседними блоками.
[0258] Аналогично, прогнозное изображение (Pred_U) получается посредством применения вектора (MV_U) движения, который уже извлечен для кодированного блока, соседнего выше текущего блока, к текущему блоку (многократного использования вектора движения для текущего блока). Вектор (MV_U) движения указывается посредством стрелки "MV_U", указывающей опорный кадр из текущего блока. Вторая коррекция прогнозного изображения выполняется посредством перекрытия прогнозного изображения Pred_U с прогнозными изображениями (например, Pred и Pred_L), для которых выполнена первая коррекция. Это предоставляет преимущество смешивания границы между соседними блоками. Прогнозное изображение, полученное посредством второй коррекции, представляет собой прогнозное изображение, в котором граница между соседними блоками смешивается (сглаживается), и в силу этого представляет собой конечное прогнозное изображение текущего блока.
[0259] Хотя вышеприведенный пример представляет собой способ коррекции с двумя трактами с использованием левого и верхнего соседних блоков, следует отметить, что способ коррекции может представлять собой способ коррекции с тремя или более трактов с использованием также правого соседнего блока и/или нижнего соседнего блока.
[0260] Следует отметить, что область, в которой выполняется такое перекрытие, может составлять только часть области около границы блока вместо пиксельной области всего блока.
[0261] Следует отметить, что выше описывается процесс коррекции прогнозных изображений согласно OBMC для получения одного прогнозного изображения Pred из одного опорного кадра посредством перекрытия дополнительного прогнозного изображения Pred_L и Pred_U. Тем не менее, когда прогнозное изображение корректируется на основе множества опорных изображений, аналогичный процесс может применяться к каждому из множества опорных кадров. В таком случае, после того, как скорректированные прогнозные изображения получаются из соответствующих опорных кадров посредством выполнения OBMC-коррекции изображений на основе множества опорных кадров, полученные скорректированные прогнозные изображения дополнительно перекрываются, чтобы получать конечное прогнозное изображение.
[0262] Следует отметить, что, в OBMC, единица текущего блока может представлять собой единицу блока прогнозирования или единицу субблока, полученного посредством дополнительного разбиения блока прогнозирования.
[0263] Один пример способа для определения того, следует или нет применять OBMC-процесс, представляет собой способ для использования obmc_flag, который представляет собой сигнал, указывающий то, следует или нет применять OBMC-процесс. В качестве одного конкретного примера, кодер определяет то, принадлежит или нет текущий блок области, имеющей усложненное движение. Кодер задает obmc_flag равным значению "1", когда блок принадлежит области, имеющей усложненное движение, и применяет OBMC-процесс при кодировании и задает obmc_flag равным значению "0", когда блок не принадлежит области, имеющей усложненное движение, и кодирует блок без применения OBMC-процесса. Декодер переключается между применением и неприменением OBMC-процесса посредством декодирования obmc_flag, записываемого в потоке (например, сжатой последовательности), и декодирования блока посредством переключения между применением и неприменением OBMC-процесса в соответствии со значением флага.
[0264] Модуль 126 взаимного прогнозирования формирует одно прямоугольное прогнозное изображение для прямоугольного текущего блока в вышеприведенном примере. Тем не менее, модуль 126 взаимного прогнозирования может формировать множество прогнозных изображений, имеющих форму, отличающуюся от прямоугольника, для прямоугольного текущего блока, и может комбинировать множество прогнозных изображений для того, чтобы формировать конечное прямоугольное прогнозное изображение. Форма, отличающаяся от прямоугольника, например, может представлять собой треугольник.
[0265] Фиг. 37 является концептуальной схемой для иллюстрации формирования двух треугольных прогнозных изображений.
[0266] Модуль 126 взаимного прогнозирования формирует треугольное прогнозное изображение посредством выполнения компенсации движения первого сегмента, имеющего треугольную форму в текущем блоке, посредством использования первого MV первого сегмента для того, чтобы формировать треугольное прогнозное изображение. Аналогично, модуль 126 взаимного прогнозирования формирует треугольное прогнозное изображение посредством выполнения компенсации движения второго сегмента, имеющего треугольную форму в текущем блоке, посредством использования второго MV второго сегмента для того, чтобы формировать треугольное прогнозное изображение. Модуль 126 взаимного прогнозирования затем формирует прогнозное изображение, имеющее прямоугольную форму, идентичную прямоугольной форме текущего блока, посредством комбинирования этих прогнозных изображений.
[0267] Следует отметить, что хотя первый сегмент и второй сегмент представляют собой треугольники в примере, проиллюстрированном на фиг. 37, первый сегмент и второй сегмент могут представлять собой быть трапеции или другие формы, отличающиеся друг от друга. Кроме того, хотя текущий блок включает в себя два сегмента в примере, проиллюстрированном на фиг. 37, текущий блок может включать в себя три или более сегментов.
[0268] Помимо этого, первый сегмент и второй сегмент могут перекрываться между собой. Другими словами, первый сегмент и второй сегмент могут включать в себя идентичную пиксельную область. В этом случае, прогнозное изображение для текущего блока может формироваться с использованием прогнозного изображения в первом сегменте и прогнозного изображения во втором сегменте.
[0269] Помимо этого, хотя пример, в котором прогнозное изображение формируется для каждого из двух сегментов с использованием взаимного прогнозирования, прогнозное изображение может формироваться, по меньшей мере, для одного сегмента с использованием внутреннего прогнозирования.
[0270] Компенсация движения > BIO
Далее описывается способ для извлечения вектора движения. Сначала, в дальнейшем описывается режим для извлечения вектора движения на основе модели при условии равномерного прямолинейного движения. Этот режим также называется "режимом двунаправленного оптического потока (BIO)".
[0271] Фиг. 38 является концептуальной схемой для иллюстрации модели при условии равномерного прямолинейного движения. На фиг. 38, (vx, vy) указывает вектор скорости, и τ0 и τ1 указывают временные расстояния между текущим кадром (Cur Pic) и двумя опорными кадрами (Ref0, Ref1). (MVx0, MVy0), указывают векторы движения, соответствующие опорному кадру Ref0 и (MVx1, MVy1) указывают векторы движения, соответствующие опорному кадру Ref0.
[0272] Здесь, согласно допущению относительно равномерного прямолинейного движения, демонстрируемого посредством векторов (vx, vy) скорости, (MVx0, MVy0) и (MVx1, MVy1), представляются как (vxτ0, vyτ0) и (-vxτ1,- vyτ1), соответственно, и может использоваться следующее уравнение оптического потока:
[0273] Математическое выражение 3
[0274] Здесь, I(k) указывает значение сигнала яркости с компенсацией движения опорного кадра k (k=0, 1). Это уравнение оптического потока показывает то, что сумма (i) производной по времени значения сигнала яркости, (ii) произведения горизонтальной скорости и горизонтального компонента пространственного градиента опорного изображения и (iii) произведения вертикальной скорости и вертикального компонента пространственного градиента опорного изображения равна нулю. Вектор движения каждого блока, полученный, например, из списка объединения, может корректироваться в единицах пиксела, на основе комбинации уравнения оптического потока и эрмитовой интерполяции.
[0275] Следует отметить, что вектор движения может извлекаться на стороне декодера с использованием способа, отличного от извлечения вектора движения, на основе модели при условии равномерного прямолинейного движения. Например, вектор движения может извлекаться в единицах субблока на основе векторов движения соседних блоков.
[0276] Компенсация движения > LIC
Далее описывается пример режима, в котором прогнозное изображение (прогнозирование) формируется посредством использования процесса компенсации локальной освещенности (LIC).
[0277] Фиг. 39 является концептуальной схемой для иллюстрации одного примера способа формирования прогнозных изображений с использованием процесса коррекции яркости, выполняемого посредством LIC-процесса.
[0278] Во-первых, MV извлекается из кодированного опорного кадра, и опорное изображение, соответствующее текущему блоку, получается.
[0279] Затем, информация, указывающая то, как значение сигнала яркости, измененное между опорным кадром и текущим кадром, извлекается для текущего блока. Это извлечение выполняется на основе пиксельных значений сигнала яркости для кодированной левой соседней опорной области (окружающей опорной области) и кодированной верхней соседней опорной области (окружающей опорной области) и пиксельного значения сигнала яркости в соответствующей позиции в опорном кадре, указываемом посредством извлеченного MV. Параметр коррекции яркости вычисляется посредством использования информации, указывающей то, как изменено значение сигнала яркости.
[0280] Прогнозное изображение для текущего блока формируется посредством выполнения процесса коррекции яркости, в котором параметр коррекции яркости применяется к опорному изображению в опорном кадре, указываемом посредством MV.
[0281] Следует отметить, что форма окружающей опорной области, проиллюстрированной на фиг. 39, представляет собой всего один пример; окружающая опорная область может иметь другую форму.
[0282] Кроме того, хотя здесь описывается процесс, в котором прогнозное изображение формируется из одного опорного кадра, идентично могут описываться случаи, в которых прогнозное изображение формируется из множества опорных кадров. Прогнозное изображение может формироваться после выполнения процесса коррекции яркости опорных изображений, полученных из опорных кадров, идентично вышеописанному.
[0283] Один пример способа для определения того, следует или нет применять LIC-процесс, представляет собой способ для использования lic_flag, который представляет собой сигнал, указывающий то, следует или нет применять LIC-процесс. В качестве одного конкретного примера, кодер определяет то, принадлежит или нет текущий блок области, имеющей изменение яркости. Кодер задает lic_flag равным значению "1", когда блок принадлежит области, имеющей изменение яркости, и применяет LIC-процесс при кодировании и задает lic_flag равным значению "0", когда блок не принадлежит области, имеющей изменение яркости, и кодирует текущий блок без применения LIC-процесса. Декодер может декодировать lic_flag, записываемый в потоке, и декодировать текущий блок посредством переключения между применением и неприменением LIC-процесса в соответствии со значением флага.
[0284] Один пример другого способа определения того, следует или нет применять LIC-процесс, представляет собой способ определения в соответствии с тем, применен или нет LIC-процесс к окружающему блоку. В одном конкретном примере, когда режим объединения используется в текущем блоке, определяется то, применен или нет LIC-процесс при кодировании окружающего кодированного блока, выбранного после извлечения MV в процессе в режиме объединения. Согласно результату, кодирование выполняется посредством переключения между применением и неприменением LIC-процесса. Следует отметить, что также в этом примере, идентичные процессы применяются в процессах на стороне декодера.
[0285] Ниже подробно описывается вариант осуществления процесса коррекции яркости (LIC), описанного со ссылкой на фиг. 39.
[0286] Во-первых, модуль 126 взаимного прогнозирования извлекает вектор движения для получения опорного изображения, соответствующего текущему блоку, который должен кодироваться, из опорного кадра, который представляет собой кодированный кадр.
[0287] Затем, модуль 126 взаимного прогнозирования извлекает информацию, указывающую то, как значение сигнала яркости опорного кадра изменено на значение сигнала яркости текущего кадра, с использованием пиксельного значения сигнала яркости кодированной окружающей опорной области, которая является соседней слева от или выше текущего блока, и значения сигнала яркости в соответствующей позиции в опорном кадре, указываемом посредством вектора движения, и вычисляет параметр коррекции яркости. Например, предполагается, что пиксельное значение сигнала яркости данного пиксела в окружающей опорной области в текущем кадре составляет p0, и что пиксельное значение сигнала яркости пиксела, соответствующего данному пикселу в окружающей опорной области в опорном кадре, составляет p1. Модуль 126 взаимного прогнозирования вычисляет коэффициенты A и B для оптимизации A*p1+B=p0 в качестве параметра коррекции яркости для множества пикселов в окружающей опорной области.
[0288] Затем, модуль 126 взаимного прогнозирования выполняет процесс коррекции яркости с использованием параметра коррекции яркости для опорного изображения в опорном кадре, указываемом посредством вектора движения, чтобы формировать прогнозное изображение для текущего блока. Например, предполагается, что пиксельное значение сигнала яркости в опорном изображении составляет p2, и что скорректированное по яркости пиксельное значение сигнала яркости прогнозного изображения составляет p3. Модуль 126 взаимного прогнозирования формирует прогнозное изображение после подвергания процессу коррекции яркости посредством вычисления A*p2+B=p3 для каждого из пикселов в опорном изображении.
[0289] Следует отметить, что форма окружающей опорной области, проиллюстрированной на фиг. 39, представляет собой один пример; может использоваться другая форма, отличная от формы окружающей опорной области. Помимо этого, может использоваться часть окружающей опорной области, проиллюстрированной на фиг. 39. Например, область, имеющая определенное число пикселов, извлеченных из каждого из верхнего соседнего пиксела и левого соседнего пиксела, может использоваться в качестве окружающей опорной области. Определенное число пикселов может быть предварительно определено. Например, область, имеющая определенное число пикселов, извлеченных из каждого из верхнего соседнего пиксела и левого соседнего пиксела, может использоваться в качестве окружающей опорной области. Определенное число пикселов может быть предварительно определено. Помимо этого, окружающая опорная область не ограничена областью, которая является соседней с текущим блоком, и может представлять собой область, которая не является соседней с текущим блоком. В примере, проиллюстрированном на фиг. 39, окружающая опорная область в опорном кадре представляет собой область, указываемую посредством вектора движения в текущем кадре, из окружающей опорной области в текущем кадре. Тем не менее, также возможна область, указываемая посредством другого вектора движения. Например, другой вектор движения может представлять собой вектор движения в окружающей опорной области в текущем кадре.
[0290] Хотя здесь описываются операции, выполняемые посредством кодера 100, следует отметить, что декодер 200 типично выполняет аналогичные операции.
[0291] Следует отметить, что LIC-процесс может применяться не только к сигналу яркости, но также и к сигналу цветности. В это время, параметр коррекции может извлекаться отдельно для каждого из Y, Cb и Cr, или общий параметр коррекции может использоваться для любого из Y, Cb и Cr.
[0292] Помимо этого, LIC-процесс может применяться в единицах субблоков. Например, параметр коррекции может извлекаться с использованием окружающей опорной области в текущем субблоке и окружающей опорной области в опорном субблоке в опорном кадре, указываемом посредством MV текущего субблока.
[0293] Контроллер прогнозирования
Модуль 128 взаимного прогнозирования выбирает один из внутреннего прогнозного сигнала (сигнала, выводимого из модуля 124 внутреннего прогнозирования) и взаимного прогнозного сигнала (сигнала, выводимого из модуля 126 взаимного прогнозирования) и выводит выбранный сигнал в вычитатель 104 и сумматор 116 в качестве прогнозного сигнала.
[0294] Как проиллюстрировано на фиг. 1, в различных видах примеров кодера, контроллер 128 прогнозирования может выводить параметр прогнозирования, который вводится в энтропийный кодер 110. Энтропийный кодер 110 может формировать кодированный поток битов (или последовательность), на основе параметра прогнозирования, который вводится из контроллера 128 прогнозирования, и квантованных коэффициентов, которые вводятся из квантователя 108. Параметр прогнозирования может использоваться в декодере. Декодер может принимать и декодировать кодированный поток битов и выполнять процессы, идентичные процессам прогнозирования, выполняемым посредством модуля 124 внутреннего прогнозирования, модуля 126 взаимного прогнозирования и контроллера 128 прогнозирования. Параметр прогнозирования может включать в себя (i) прогнозный сигнал выбора (например, вектор движения, тип прогнозирования или режим прогнозирования, используемый посредством модуля 124 внутреннего прогнозирования или модуля 126 взаимного прогнозирования) или (ii) необязательный индекс, флаг или значение, которое основано на процессе прогнозирования, выполняемом в каждом из модуля 124 внутреннего прогнозирования, модуля 126 взаимного прогнозирования и контроллера 128 прогнозирования, или которое указывает процесс прогнозирования.
[0295] Пример монтажа кодера
Фиг. 40 является блок-схемой, иллюстрирующей пример монтажа кодера 100. Кодер 100 включает в себя процессор a1 и запоминающее устройство a2. Например, множество составляющих элементов кодера 100, проиллюстрированного на фиг. 1, смонтированы в процессоре a1 и запоминающем устройстве a2, проиллюстрированных на фиг. 40.
[0296] Процессор a1 представляет собой схему, которая выполняет обработку информации, и является доступным для запоминающего устройства a2. Например, процессор a1 представляет собой специализированную или общую электронную схему, которая кодирует видео. Процессор a1 может представлять собой процессор, такой как CPU. Помимо этого, процессор a1 может представлять собой совокупность множества электронных схем. Помимо этого, например, процессор a1 может выполнять роли двух или более составляющих элементов из множества составляющих элементов кодера 100, проиллюстрированного на фиг. 1 и т.д.
[0297] Запоминающее устройство a2 представляет собой специализированное или общее запоминающее устройство для сохранения информации, которая используется посредством процессора a1 для того, чтобы кодировать видео. Запоминающее устройство a2 может представлять собой электронную схему и может соединяться с процессором a1. Помимо этого, запоминающее устройство a2, может включаться в процессор a1. Помимо этого, запоминающее устройство a2 может представлять собой совокупность множества электронных схем. Помимо этого, запоминающее устройство a2 может представлять собой магнитный диск, оптический диск и т.п. либо может представляться как устройство хранения данных, носитель записи и т.п. Помимо этого, запоминающее устройство a2 может представлять собой энергонезависимое запоминающее устройство или энергозависимое запоминающее устройство.
[0298] Например, запоминающее устройство a2 может сохранять видео, которое должно кодироваться, или поток битов, соответствующий кодированному видео. Помимо этого, запоминающее устройство a2 может сохранять программу для инструктирования процессору a1 кодировать видео.
[0299] Помимо этого, например, запоминающее устройство a2 может выполнять роли двух или более составляющих элементов для сохранения информации из множества составляющих элементов кодера 100, проиллюстрированного на фиг. 1 и т.д. Например, запоминающее устройство a2 может выполнять роли запоминающего устройства 118 блоков и запоминающего устройства 122 кинокадров, проиллюстрированных на фиг. 1. Более конкретно, запоминающее устройство a2 может сохранять восстановленный блок, восстановленный кадр и т.д.
[0300] Следует отметить, что, в кодере 100, все из множества составляющих элементов, указываемых на фиг. 1 и т.д., могут не реализовываться, и все процессы, описанные выше, могут не выполняться. Часть составляющих элементов, указываемых на фиг. 1 и т.д., может включаться в другое устройство, или часть процессов, описанных выше, может выполняться посредством другого устройства.
[0301] Декодер
Далее описывается декодер, допускающий декодирование кодированного сигнала (кодированного потока битов), например, выводимого из кодера 100, описанного выше. Фиг. 41 является блок-схемой, иллюстрирующей функциональную конфигурацию декодера 200 согласно варианту осуществления. Декодер 200 представляет собой видеодекодер, который декодирует видео в единицах блоков.
[0302] Как проиллюстрировано на фиг. 41, декодер 200 включает в себя энтропийный декодер 202, обратный квантователь 204, обратный преобразователь 206, сумматор 208, запоминающее устройство 210 блоков, контурный фильтр 212, запоминающее устройство 214 кинокадров, модуль 216 внутреннего прогнозирования, модуль 218 взаимного прогнозирования и контроллер 220 прогнозирования.
[0303] Декодер 200 реализуется, например, в качестве общего процессора и запоминающего устройства. В этом случае, когда программно-реализованная программа, сохраненная в запоминающем устройстве, выполняется посредством процессора, процессор функционирует в качестве энтропийного декодера 202, обратного квантователя 204, обратного преобразователя 206, сумматора 208, контурного фильтра 212, модуля 216 внутреннего прогнозирования, модуля 218 взаимного прогнозирования и контроллера 220 прогнозирования. Альтернативно, декодер 200 может реализовываться в качестве одной или более специализированных электронных схем, соответствующих энтропийному декодеру 202, обратному квантователю 204, обратному преобразователю 206, сумматору 208, контурному фильтру 212, модулю 216 внутреннего прогнозирования, модулю 218 взаимного прогнозирования и контроллеру 220 прогнозирования.
[0304] В дальнейшем в этом документе описывается полная последовательность операций процессов, выполняемых посредством декодера 200, и после этого описывается каждый из составляющих элементов, включенных в декодер 200.
[0305] Общая последовательность операций процесса декодирования
Фиг. 42 является блок-схемой последовательности операций способа, иллюстрирующей один пример полного процесса декодирования, выполняемого посредством декодера 200.
[0306] Во-первых, энтропийный декодер 202 декодера 200 идентифицирует шаблон разбиения блока, имеющего фиксированный размер (например, 128*128 пикселов) (этап Sp_1). Этот шаблон разбиения представляет собой шаблон разбиения, выбранный посредством кодера 100. Декодер 200 затем выполняет процессы этапа Sp_2-Sp_6 для каждого из множества блоков шаблона разбиения.
[0307] Другими словами, энтропийный декодер 202 декодирует (в частности, энтропийно декодирует) кодированные квантованные коэффициенты и параметр прогнозирования текущего блока, который должен декодироваться (также называется "текущим блоком") (этап Sp_2).
[0308] Затем, обратный квантователь 204 выполняет обратное квантование множества квантованных коэффициентов, и обратный преобразователь 206 выполняет обратное преобразование результата для того, чтобы восстанавливать множество остатков прогнозирования (т.е. разностный блок) (этап Sp_3).
[0309] Затем, процессор прогнозирования, включающий в себя все или часть модуля 216 внутреннего прогнозирования, модуля 218 взаимного прогнозирования и контроллера 220 прогнозирования, формирует прогнозный сигнал (также называется "блоком прогнозирования") текущего блока (этап Sp_4).
[0310] Затем, сумматор 208 суммирует блок прогнозирования с разностным блоком для того, чтобы формировать восстановленное изображение (также называется "декодированным блоком изображений") текущего блока (этап Sp_5).
[0311] Когда восстановленное изображение формируется, контурный фильтр 212 выполняет фильтрацию восстановленного изображения (этап Sp_6).
[0312] Декодер 200 затем определяет то, закончено или нет декодирование всего кадра (этап Sp_7). При определении того, что декодирование еще не закончено ("Нет" на этапе Sp_7), декодер 200 многократно выполняет процессы, начиная с этапа Sp_1.
[0313] Как проиллюстрировано, процессы этапов Sp_1-Sp_7 выполняются последовательно посредством декодера 200. Альтернативно, два или более из процессов могут выполняться параллельно, порядок обработки двух или более из процессов может модифицироваться, и т.д.
[0314] Энтропийный декодер
Энтропийный декодер 202 энтропийно декодирует кодированный поток битов. Более конкретно, например, энтропийный декодер 202 арифметически декодирует кодированный поток битов в двоичный сигнал. Энтропийный декодер 202 затем отменяет преобразование в двоичную форму двоичного сигнала. Вследствие этого, энтропийный декодер 202 выводит квантованные коэффициенты каждого блока в обратный квантователь 204. Энтропийный декодер 202 может выводить параметр прогнозирования, включенный в кодированный поток битов (см. фиг. 1), в модуль 216 внутреннего прогнозирования, модуль 218 взаимного прогнозирования и контроллер 220 прогнозирования. Модуль 216 внутреннего прогнозирования, модуль 218 взаимного прогнозирования и контроллер 220 прогнозирования в варианте осуществления допускают выполнение процессов прогнозирования, идентичных процессам прогнозирования, выполняемым посредством модуля 124 внутреннего прогнозирования, модуля 126 взаимного прогнозирования и контроллера 128 прогнозирования на стороне кодера.
[0315] Обратный квантователь
Обратный квантователь 204 обратно квантует квантованные коэффициенты блока, который должен декодироваться (в дальнейшем называется "текущим блоком"), которые представляют собой вводы из энтропийного декодера 202. Более конкретно, обратный квантователь 204 обратно квантует квантованные коэффициенты текущего блока на основе параметров квантования, соответствующих квантованным коэффициентам. Обратный квантователь 204 затем выводит обратно квантованные коэффициенты преобразования текущего блока в обратный преобразователь 206.
[0316] Обратный преобразователь
Обратный преобразователь 206 восстанавливает ошибки прогнозирования посредством обратного преобразования коэффициентов преобразования, которые представляют собой вводы из обратного квантователя 204.
[0317] Например, когда информация, синтаксически проанализированная из кодированного потока битов, указывает то, что EMT или AMT должно применяться (например, когда AMT-флаг является истинным), обратный преобразователь 206 обратно преобразует коэффициенты преобразования текущего блока на основе информации, указывающей синтаксически проанализированный тип преобразования.
[0318] Кроме того, например, когда информация, синтаксически проанализированная из кодированного потока битов, указывает то, что NSST должно применяться, обратный преобразователь 206 применяет вторичное обратное преобразование к коэффициентам преобразования.
[0319] Сумматор
Сумматор 208 восстанавливает текущий блок посредством суммирования ошибок прогнозирования, которые представляют собой вводы из обратного преобразователя 206, и прогнозных выборок, которые представляют собой вводы из контроллера 220 прогнозирования. Сумматор 208 затем выводит восстановленный блок в запоминающее устройство 210 блоков и контурный фильтр 212.
[0320] Запоминающее устройство блоков
Запоминающее устройство 210 блоков представляет собой устройство хранения данных для сохранения блоков в кадре, который должен декодироваться (в дальнейшем называется "текущим кадром"), и на который следует ссылаться при внутреннем прогнозировании. Более конкретно, запоминающее устройство 210 блоков сохраняет восстановленные блоки, выводимые из сумматора 208.
[0321] Контурный фильтр
Контурный фильтр 212 применяет контурный фильтр к блокам, восстановленным посредством сумматора 208, и выводит фильтрованные восстановленные блоки в запоминающее устройство 214 кинокадров, устройство отображения и т.д.
[0322] Когда информация, указывающая включение или выключение ALF, синтаксически проанализированная из кодированного потока битов, указывает то, что ALF включен, один фильтр из множества фильтров выбирается на основе направления и активности локальных градиентов, и выбранный фильтр применяется к восстановленному блоку.
[0323] Запоминающее устройство кинокадров
Запоминающее устройство 214 кинокадров, например, представляет собой устройство хранения данных для сохранения опорных кадров для использования при взаимном прогнозировании, и также называется "буфером кинокадров". Более конкретно, запоминающее устройство 214 кинокадров сохраняет восстановленный блок, фильтрованный посредством контурного фильтра 212.
[0324] Процессор прогнозирования (модуль внутреннего прогнозирования, модуль взаимного прогнозирования, контроллер прогнозирования)
Фиг. 43 является блок-схемой последовательности операций способа, иллюстрирующей один пример процесса, выполняемого посредством процессора прогнозирования декодера 200. Следует отметить, что процессор прогнозирования включает в себя все или часть следующих составляющих элементов: модуль 216 внутреннего прогнозирования; модуль 218 взаимного прогнозирования; и контроллер 220 прогнозирования.
[0325] Процессор прогнозирования формирует прогнозное изображение текущего блока (этап Sq_1). Это прогнозное изображение также называется "прогнозным сигналом" или "блоком прогнозирования". Следует отметить, что прогнозный сигнал, например, представляет собой внутренний прогнозный сигнал или взаимный прогнозный сигнал. В частности, процессор прогнозирования формирует прогнозное изображение текущего блока с использованием восстановленного изображения, которое уже получено через формирование блока прогнозирования, формирование разностного блока, формирование блока коэффициентов, восстановление разностного блока и формирование декодированного блока изображений.
[0326] Восстановленное изображение, например, может представлять собой изображение в опорном кадре или изображение декодированного блока в текущем кадре, который представляет собой кадр, включающий в себя текущий блок. Декодированный блок в текущем кадре, например, представляет собой соседний блок относительно текущего блока.
[0327] Фиг. 44 является блок-схемой последовательности операций способа, иллюстрирующей другой пример процесса, выполняемого посредством процессора прогнозирования декодера 200.
[0328] Процессор прогнозирования определяет способ или режим для формирования прогнозного изображения (этап Sr_1). Например, способ или режим может определяться, например, на основе параметра прогнозирования и т.д.
[0329] При определении первого способа в качестве режима для формирования прогнозного изображения, процессор прогнозирования формирует прогнозное изображение согласно первому способу (этап Sr_2a). При определении второго способа в качестве режима для формирования прогнозного изображения, процессор прогнозирования формирует прогнозное изображение согласно второму способу (этап Sr_2b). При определении третьего способа в качестве режима для формирования прогнозного изображения, процессор прогнозирования формирует прогнозное изображение согласно третьему способу (этап Sr_2c).
[0330] Первый способ, второй способ и третий способ могут представлять собой взаимно различные способы для формирования прогнозного изображения. Каждый из первого-третьего способов может представлять собой способ взаимного прогнозирования, способ внутреннего прогнозирования или другой способ прогнозирования. Вышеописанное восстановленное изображение может использоваться в этих способах прогнозирования.
[0331] Модуль внутреннего прогнозирования
Модуль 216 внутреннего прогнозирования формирует прогнозный сигнал (внутренний прогнозный сигнал) посредством выполнения внутреннего прогнозирования посредством ссылки на блок или блоки в текущем кадре, сохраненном в запоминающем устройстве 210 блоков, на основе режима внутреннего прогнозирования, синтаксически проанализированного из кодированного потока битов. Более конкретно, модуль 216 внутреннего прогнозирования формирует внутренний прогнозный сигнал посредством выполнения внутреннего прогнозирования посредством ссылки на выборки (например, значения сигнала яркости и/или сигнала цветности) блока или блоков, соседних с текущим блоком, и затем выводит внутренний прогнозный сигнал в контроллер 220 прогнозирования.
[0332] Следует отметить, что, когда выбирается режим внутреннего прогнозирования, в котором ссылаются на блок сигналов яркости при внутреннем прогнозировании блока сигналов цветности, модуль 216 внутреннего прогнозирования может прогнозировать компонент сигнала цветности текущего блока на основе компонента сигнала яркости текущего блока.
[0333] Кроме того, когда информация, синтаксически проанализированная из кодированного потока битов, указывает то, что PDPC должна применяться, модуль 216 внутреннего прогнозирования корректирует внутренне прогнозированные пиксельные значения на основе горизонтальных/вертикальных опорных пиксельных градиентов.
[0334] Модуль взаимного прогнозирования
Модуль 218 взаимного прогнозирования прогнозирует текущий блок посредством ссылки на опорный кадр, сохраненный в запоминающем устройстве 214 кинокадров. Взаимное прогнозирование выполняется в единицах текущего блока или субблока (например, блок 4*4) в текущем блоке. Например, модуль 218 взаимного прогнозирования формирует взаимный прогнозный сигнал текущего блока или субблока посредством выполнения компенсации движения посредством использования информации движения (например, вектора движения), синтаксически проанализированной из кодированного потока битов (например, параметра прогнозирования, выводимого из энтропийного декодера 202), и выводит взаимный прогнозный сигнал в контроллер 220 прогнозирования.
[0335] Следует отметить, что, когда информация, синтаксически проанализированная из кодированного потока битов, указывает то, что OBMC-режим должен применяться, модуль 218 взаимного прогнозирования формирует взаимный прогнозный сигнал с использованием информации движения соседнего блока в дополнение к информации движения текущего блока, полученной из оценки движения.
[0336] Кроме того, когда информация, синтаксически проанализированная из кодированного потока битов, указывает применение FRUC-режима, модуль 218 взаимного прогнозирования извлекает информацию движения посредством выполнения оценки движения в соответствии со способом сопоставления с шаблоном (билатеральное сопоставление или сопоставление с эталоном), синтаксически проанализированным из кодированного потока битов. Модуль 218 взаимного прогнозирования затем выполняет компенсацию движения (прогнозирование) с использованием извлеченной информации движения.
[0337] Кроме того, когда BIO-режим должен применяться, модуль 218 взаимного прогнозирования извлекает вектор движения на основе модели при условии равномерного прямолинейного движения. Кроме того, когда информация, синтаксически проанализированная из кодированного потока битов, указывает то, что аффинный режим прогнозирования с компенсацией движения должен применяться, модуль 218 взаимного прогнозирования извлекает вектор движения каждого субблока на основе векторов движения соседних блоков.
[0338] MV-извлечение > нормальный взаимный режим
Когда информация, синтаксически проанализированная из кодированного потока битов, указывает то, что нормальный взаимный режим должен применяться, модуль 218 взаимного прогнозирования извлекает MV на основе информации, синтаксически проанализированной из кодированного потока битов, и выполняет компенсацию движения (прогнозирование) с использованием MV.
[0339] Фиг. 45 является блок-схемой последовательности операций способа, иллюстрирующей пример взаимного прогнозирования в нормальном взаимном режиме в декодере 200.
[0340] Модуль 218 взаимного прогнозирования декодера 200 выполняет компенсацию движения для каждого блока. Модуль 218 взаимного прогнозирования получает множество возможных MV-вариантов для текущего блока на основе такой информации, как MV множества декодированных блоков, временно или пространственно окружающих текущий блок (этап Ss_1). Другими словами, модуль 218 взаимного прогнозирования формирует список возможных MV-вариантов.
[0341] Затем, модуль 218 взаимного прогнозирования извлекает N (целое число в 2 или более) возможных MV-вариантов из множества возможных MV-вариантов, полученных на этапе Ss_1, в качестве возможных вариантов предикторов векторов движения (также называются "возможными вариантами MV-предикторов") согласно определенному порядку приоритетов (этап Ss_2). Следует отметить, что порядок приоритетов может определяться заранее для каждого из N возможных вариантов MV-предикторов.
[0342] Затем, модуль 218 взаимного прогнозирования декодирует информацию выбора предиктора вектора движения из входного потока (т.е. кодированного потока битов) и выбирает один возможный вариант MV-предиктора из N возможных вариантов MV-предикторов с использованием декодированной информации выбора предиктора вектора движения, в качестве вектора движения (также называется "MV-предиктором") текущего блока (этап Ss_3).
[0343] Затем, модуль 218 взаимного прогнозирования декодирует MV-разность из входного потока и извлекает MV для текущего блока посредством суммирования значения разности, которое представляет собой декодированную MV-разность, и выбранного предиктора вектора движения (этап Ss_4).
[0344] В завершение, модуль 218 взаимного прогнозирования формирует прогнозное изображение для текущего блока посредством выполнения компенсации движения текущего блока с использованием извлеченного MV и декодированного опорного кадра (этап Ss_5).
[0345] Контроллер прогнозирования
Контроллер 220 прогнозирования выбирает внутренний прогнозный сигнал или взаимный прогнозный сигнал и выводит выбранный прогнозный сигнал в сумматор 208. В целом, конфигурации, функции и процессы контроллера 220 прогнозирования, модуля 216 внутреннего прогнозирования и модуля 218 взаимного прогнозирования на стороне декодера могут соответствовать конфигурациям, функциям и процессам контроллера 128 прогнозирования, модуля 124 внутреннего прогнозирования и модуля 126 взаимного прогнозирования на стороне кодера.
[0346] Пример монтажа декодера
Фиг. 46 является блок-схемой, иллюстрирующей пример монтажа декодера 200. Декодер 200 включает в себя процессор b1 и запоминающее устройство b2. Например, множество составляющих элементов декодера 200, проиллюстрированного на фиг. 41, смонтированы в процессоре b1 и запоминающем устройстве b2, проиллюстрированных на фиг. 46.
[0347] Процессор b1 представляет собой схему, которая выполняет обработку информации, и является доступным для запоминающего устройства b2. Например, процессор b1 представляет собой специализированную или общую электронную схему, которая декодирует видео (т.е. кодированный поток битов). Процессор b1 может представлять собой процессор, такой как CPU. Помимо этого, процессор b1 может представлять собой совокупность множества электронных схем. Помимо этого, например, процессор b1 может выполнять роли двух или более составляющих элементов из множества составляющих элементов декодера 200, проиллюстрированного на фиг. 41 и т.д.
[0348] Запоминающее устройство b2 представляет собой специализированное или общее запоминающее устройство для сохранения информации, которая используется посредством процессора b1 для того, чтобы декодировать кодированный поток битов. Запоминающее устройство b2 может представлять собой электронную схему и может соединяться с процессором b1. Помимо этого, запоминающее устройство b2, может включаться в процессор b1. Помимо этого, запоминающее устройство b2 может представлять собой совокупность множества электронных схем. Помимо этого, запоминающее устройство b2 может представлять собой магнитный диск, оптический диск и т.п. либо может представляться как устройство хранения данных, носитель записи и т.п. Помимо этого, запоминающее устройство b2 может представлять собой энергонезависимое запоминающее устройство или энергозависимое запоминающее устройство.
[0349] Например, запоминающее устройство b2 может сохранять видео или поток битов. Помимо этого, запоминающее устройство b2 может сохранять программу для инструктирования процессору b1 декодировать кодированный поток битов.
[0350] Помимо этого, например, запоминающее устройство b2 может выполнять роли двух или более составляющих элементов для сохранения информации из множества составляющих элементов декодера 200, проиллюстрированного на фиг. 41 и т.д. В частности, запоминающее устройство b2 может выполнять роли запоминающего устройства 210 блоков и запоминающего устройства 214 кинокадров, проиллюстрированных на фиг. 41. Более конкретно, запоминающее устройство b2 может сохранять восстановленный блок, восстановленный кадр и т.д.
[0351] Следует отметить, что, в декодере 200, все из множества составляющих элементов, проиллюстрированных на фиг. 41 и т.д., могут не реализовываться, и все процессы, описанные выше, могут не выполняться. Часть составляющих элементов, указываемых на фиг. 41 и т.д., может включаться в другое устройство, или часть процессов, описанных выше, может выполняться посредством другого устройства.
[0352] Определения терминов
Соответствующие термины могут задаваться так, как указано ниже в качестве примеров.
[0353] Кадр представляет собой массив выборок сигнала яркости в монохромном формате либо массив выборок сигнала яркости и два соответствующих массива выборок сигнала цветности в цветовом формате 4:2:0, 4:2:2 и 4:4:4. Кадр может представлять собой либо кинокадр, либо поле.
[0354] Кадр представляет собой композицию верхнего поля и нижнего поля, при этом строки 0, 2, 4,..., выборок инициируются из верхнего поля, и строки 1, 3, 5,..., выборок инициируются из нижнего поля.
[0355] Срез представляет собой целое число единиц дерева кодирования, содержащихся в одном независимом сегменте срезов и всех последующих зависимых сегментах срезов (если таковые имеются), которые предшествуют следующему независимому сегменту срезов (если таковые имеются) в идентичной единице доступа.
[0356] Плитка представляет собой прямоугольную область блоков дерева кодирования в конкретном столбце плиток и конкретной строке плиток в кадре. Плитка может представлять собой прямоугольную область кинокадра, которая должна иметь возможность декодироваться и кодироваться независимо, хотя по-прежнему может применяться контурная фильтрация по краям плиток.
[0357] Блок представляет собой массив M*N (M столбцов на N строк) выборок или массив M*N коэффициентов преобразования. Блок может представлять собой квадратную или прямоугольную область пикселов, включающую в себя одну матрицу сигналов яркости и две матрицы сигналов цветности.
[0358] Единица дерева кодирования (CTU) может представлять собой блок дерева кодирования выборок сигнала яркости кадра, который имеет три массива выборок, или два соответствующих блока дерева кодирования выборок сигнала цветности. Альтернативно, CTU может представлять собой блок дерева кодирования выборок одного из монохромного кадра и кадра, который кодируется с использованием трех отдельных цветовых плоскостей и синтаксических структур, используемых для того, чтобы кодировать выборки.
[0359] Суперблок может представлять собой квадратный блок в 64*64 пикселов, который состоит из или 1 или 2 блоков информации режима или рекурсивно сегментируется на четыре блока 32*32, которые сами могут дополнительно сегментироваться.
[0360] Первый аспект процесса взаимного прогнозирования
В дальнейшем в этом документе, кодер 100 и декодер 200 выполняют процесс взаимного прогнозирования с использованием процесса извлечения векторов движения, который извлекает вектор движения, полученный посредством расширения базового вектора движения. Следует отметить, что эта технология называется "окончательным выражением векторов движения (UMVE)", но также может иногда называться "разностью векторов движения в режиме объединения (MMVD)".
[0361] Кроме того, в дальнейшем, процесс извлечения векторов движения выполняется с использованием процесса выбора, который выбирает то, следует или нет использовать один из индексов одной из таблиц. Хотя операции, выполняемые посредством декодера 200, описываются ниже как характерные, кодер 100 выполняет идентичные операции.
[0362] В первом аспекте настоящего варианта осуществления, процесс выбора выполняется с использованием не флага, а информации декодированного блока.
[0363] Фиг. 47 является схемой, иллюстрирующей дельта-вектор движения для использования в процессе взаимного прогнозирования согласно варианту 1 осуществления.
[0364] В примере, проиллюстрированном на фиг. 47, базовый вектор движения предположительно находится в точке начала координат оси X и оси Y. Кроме того, в примере, проиллюстрированном на фиг. 47, первое направление или второе направление представляет собой направление (наклонное направление), полученное посредством наклона направления по оси XY под углом в 45 градусов. Здесь, первое направление и второе направление являются ортогональными.
[0365] Дельта-вектор движения расположен вдоль одного из положительного и отрицательного направлений первого направления или второго направления и представляется как вектор, который расположен в позиции, указываемой посредством окружности относительно начала координат, и имеет размер (расстояние). Следует отметить, что базовый вектор движения, например, представляет собой один MV-предиктор, выбранный из списка MV-предикторов в режиме объединения.
[0366] В настоящем аспекте, модуль 218 взаимного прогнозирования предполагает то, первое направление представляет собой положительное направление по оси X, и получает размер (расстояние) дельта-вектора движения из одной таблицы, из числа таблиц. Здесь, таблицы включают в себя таблицы, включающие в себя индексы, и каждая из таблиц включает в себя значения, имеющие варьирующиеся разности между индексами. Модуль 218 взаимного прогнозирования может получать дельта-вектор движения посредством выбора одного индекса в одной таблице, из числа таблиц. Затем модуль 218 взаимного прогнозирования выполняет процесс взаимного прогнозирования с использованием полученного дельта-вектора движения и базового вектора движения. Следует отметить, что поскольку дельта-вектор движения может получаться посредством выполнения процесса выбора, который, например, выбирает одну таблицу и один индекс в выбранной таблице, в дальнейшем в этом документе этот процесс выбора может называться "процессом выбора вектора движения".
[0367] Фиг. 48 является блок-схемой последовательности операций способа, иллюстрирующей процесс выбора вектора движения в процессе взаимного прогнозирования, выполняемом посредством модуля 218 взаимного прогнозирования декодера 200 согласно первому аспекту варианта 1 осуществления. Фиг. 49 иллюстрирует пример списка 1, включающего в себя таблицы для использования в процессе выбора вектора движения согласно первому аспекту варианта 1 осуществления.
[0368] Во-первых, как проиллюстрировано на фиг. 48, модуль 218 взаимного прогнозирования декодера 200 выбирает первую таблицу, которая должна использоваться для текущего сегмента, который должен декодироваться, из числа таблиц (S1001). Здесь, текущий сегмент, который должен декодироваться, также называется "текущим сегментом". Текущий сегмент может интерпретироваться в качестве текущего блока. Таблицы используются для того, чтобы корректировать базовый вектор движения на дельта-вектор движения в предварительно определенном направлении с использованием значения коррекции, указываемого посредством индекса. Помимо этого, таблицы включают в себя значения коррекции, имеющие варьирующиеся разности между индексами. Фиг. 49 иллюстрирует пример списка 1, включающего в себя четыре таблицы, различаемые посредством табличных индексов 0-3. Четыре таблицы, включенные в список 1, варьируются в разностях (абсолютных величинах) между значениями столбцов, т.е. значениями абсолютной величины. В примере, проиллюстрированном на фиг. 49, строка, указываемая посредством одного из табличных индексов 0-3, является эквивалентной первой таблице, и одно из значений столбцов в первой таблице является эквивалентным значению коррекции. Поскольку это значение коррекции используется для того, чтобы извлекать дельта-вектор движения из базового вектора движения, значение коррекции также может называться "информацией вектора движения".
[0369] Затем, модуль 218 взаимного прогнозирования синтаксически анализирует параметр, указывающий первый индекс, который указывает информацию вектора движения, которая должна выбираться из числа фрагментов информации вектора движения, включенных в первую таблицу, выбранную на этапе S1001 (S1002). В примере, проиллюстрированном на фиг. 49, хотя не показано, первый индекс представляет собой индекс, указывающий местоположение значения столбца (значения абсолютной величины) в первой таблице, и этот индекс указывается посредством такого параметра, как параметр абсолютной величины, проиллюстрированный на фиг. 47.
[0370] Затем, посредством синтаксического анализа параметра на этапе S1002, модуль 218 взаимного прогнозирования декодирует текущий сегмент, который должен декодироваться, т.е. формирует прогнозный сигнал текущего сегмента, который должен декодироваться, с использованием, по меньшей мере, выбранной информации вектора движения (S1003). Более конкретно, посредством синтаксического анализа параметра на этапе S1002, модуль 218 взаимного прогнозирования декодирует текущий сегмент, который должен декодироваться, с использованием дельта-вектора движения, полученного из выбранной информации вектора движения, и базового вектора движения. Следует отметить, что, как упомянуто выше, информация вектора движения, выбранная на этапе S1001, может представлять собой значение, указывающее, например, размер дельта-вектора движения. Дополнительно, параметр, синтаксически проанализированный на этапе S1002, может включать в себя параметр размера и параметр направления, указывающий дельта-вектор движения, исходящий из базового вектора движения, как проиллюстрировано на фиг. 47.
[0371] В дальнейшем в этом документе описываются конкретные примеры этапа S1001, т.е. процесса выбора первой таблицы из числа таблиц. Предусмотрены варьирования этого процесса.
[0372] В дальнейшем описываются конкретные примеры процесса, выполняемого в процессе взаимного прогнозирования в режиме объединения. Следует отметить, что конкретные примеры, описанные ниже, могут выполняться в процессе взаимного прогнозирования в режиме, отличном от режима объединения.
[0373] Первый пример
Первый пример описывает процесс выбора первой таблицы из числа таблиц на основе предиктора вектора движения, выбранного из окружающего блока относительно текущего блока, который должен декодироваться. Предиктор вектора движения представляет собой пример базового вектора движения. Когда значение предиктора вектора движения является большим, модуль 218 взаимного прогнозирования выбирает, в качестве первой таблицы, таблицу, которая может указывать местоположение большого значения столбца (значения абсолютной величины) с небольшим индексом, из числа таблиц. В первом примере, модуль 218 взаимного прогнозирования выбирает первую таблицу для каждого сегмента (блока).
[0374] Более конкретно, на этапе S1001, во-первых, модуль 218 взаимного прогнозирования выполняет первый этап определения диапазонов для выбора одной из таблиц, на основе списка предварительно определенных пороговых значений. В примере, проиллюстрированном на фиг. 49, модуль 218 взаимного прогнозирования определяет четыре диапазона для выбора одной из четырех таблиц (табличные индексы 0-3).
[0375] Затем, модуль 218 взаимного прогнозирования выполняет второй этап выбора первой таблицы из числа таблиц на основе значения предиктора вектора движения, т.е. суммы значений компонентов предиктора вектора движения и диапазонов, определенных на первом этапе. В примере, проиллюстрированном на фиг. 48, поскольку компоненты предиктора вектора движения, который представляет собой базовый вектор движения, включают в себя горизонтальное значение mv_x и вертикальное значение mv_y, сумма значений компонентов предиктора вектора движения может выражаться как |mv_x|+|mv_y|.
[0376] Здесь, предварительно определенные пороговые значения для использования на первом этапе представляют собой три пороговых значения (T1-T3) для различения четырех таблиц, проиллюстрированных на фиг. 49, например, T1=32, T2=64 и T3=128. В этом случае, на первом этапе, модуль 218 взаимного прогнозирования может определять (0, T1], (T1, T2], (T2, T3] и (T3, +∞) в качестве четырех диапазонов для выбора одной из четырех таблиц. Кроме того, когда предиктор вектора движения для использования на втором этапе, например, представляет собой [-14, 41], модуль 218 взаимного прогнозирования может вычислять значение предиктора вектора движения, т.е. сумму значений компонентов предиктора вектора движения в качестве |-14|+|41|=55. В этом случае, на втором этапе, поскольку сумма значений компонентов предиктора вектора движения включается в диапазон (T1, T2], модуль 218 взаимного прогнозирования может выбирать, в качестве первой таблицы, табличный индекс 1, указывающий таблицу, соответствующую диапазону, указываемому посредством (T1, T2].
[0377] Второй пример
Второй пример описывает процесс выбора первой таблицы из числа таблиц на основе значений разностей векторов движения, назначенных окружающим блокам относительно текущего блока, который должен декодироваться. В дальнейшем в этом документе, разность векторов движения, назначенная окружающему блоку, называется "разностью окружающих векторов движения". Когда значения разностей окружающих векторов движения являются большими, модуль 218 взаимного прогнозирования выбирает, в качестве первой таблицы, таблицу, которая может указывать местоположение большого значения столбца (значения абсолютной величины) с небольшим индексом, из числа таблиц. Во втором примере, модуль 218 взаимного прогнозирования также выбирает первую таблицу для каждого сегмента (блока).
[0378] Более конкретно, на этапе S1001, во-первых, модуль 218 взаимного прогнозирования выполняет первый этап определения диапазонов для выбора одной из таблиц, на основе списка предварительно определенных пороговых значений.
[0379] Затем, модуль 218 взаимного прогнозирования выполняет второй этап выбора первой таблицы из числа таблиц на основе среднего значения значений разностей окружающих векторов движения и диапазонов, определенных на первом этапе.
[0380] Здесь, предварительно определенные пороговые значения для использования на первом этапе представляют собой три пороговых значения (T1-T3) для различения четырех таблиц, проиллюстрированных на фиг. 49, например, T1=32, T2=64 и T3=128. Также в этом случае, на первом этапе, модуль 218 взаимного прогнозирования может определять (0, T1], (T1, T2], (T2, T3] и (T3, +∞) в качестве четырех диапазонов для выбора одной из четырех таблиц.
[0381] Кроме того, когда значения разности окружающих векторов движения для использования на втором этапе, например, представляют собой [-21, 14], [-3, 0], [102, 40], [120, 5] и [100, 18], модуль 218 взаимного прогнозирования может вычислять среднее значение значений разностей окружающих векторов движения в качестве |-21|+|14|+|-3|+|0|+|102|+|40|+|120|+|5|+|100|+|18|=42.
[0382] Соответственно, на втором этапе, поскольку среднее значение значений разностей окружающих векторов движения включается в диапазон (T1, T2], модуль 218 взаимного прогнозирования может выбирать, в качестве первой таблицы, табличный индекс 1, указывающий таблицу, соответствующую диапазону, указываемому посредством (T1, T2].
[0383] Следует отметить, что хотя модуль 218 взаимного прогнозирования выбирает первую таблицу из числа таблиц на основе среднего значения значений разностей окружающих векторов движения во втором примере, настоящий вариант осуществления не ограничен этим. Модуль 218 взаимного прогнозирования может выбирать первую таблицу из числа таблиц на основе значения дисперсии значений разностей окружающих векторов движения.
[0384] Кроме того, во втором примере, когда окружающие блоки относительно текущего блока, который должен декодироваться, представляют собой блоки, подвергнутые процессу прогнозирования с использованием режима объединения, второй этап может выполняться с использованием 0 в качестве значений разностей окружающих векторов движения.
[0385] Третий пример
Третий пример описывает процесс выбора первой таблицы из числа таблиц на основе значений векторов движения, назначенных окружающим блокам относительно текущего блока, который должен декодироваться.
[0386] В дальнейшем в этом документе, вектор движения, назначенный окружающему блоку, называется "окружающим вектором движения". Когда значения окружающих векторов движения являются большими, модуль 218 взаимного прогнозирования выбирает, в качестве первой таблицы, таблицу, которая может указывать местоположение большого значения столбца (значения абсолютной величины) с небольшим индексом, из числа таблиц. В третьем примере, модуль 218 взаимного прогнозирования также выбирает первую таблицу для каждого сегмента (блока).
[0387] Более конкретно, на этапе S1001, во-первых, модуль 218 взаимного прогнозирования выполняет первый этап определения диапазонов для выбора одной из таблиц, на основе списка предварительно определенных пороговых значений.
[0388] Затем, модуль 218 взаимного прогнозирования выполняет второй этап выбора первой таблицы из числа таблиц на основе среднего значения значений окружающих векторов движения и определенных диапазонов.
[0389] Здесь, предварительно определенные пороговые значения для использования на первом этапе представляют собой три пороговых значения (T1-T3) для различения четырех таблиц, проиллюстрированных на фиг. 49, например, T1=32, T2=64 и T3=128. Также в этом случае, на первом этапе, модуль 218 взаимного прогнозирования может определять (0, T1], (T1, T2], (T2, T3] и (T3, +∞] в качестве четырех диапазонов для выбора одной из четырех таблиц.
[0390] Кроме того, когда значения окружающих векторов движения для использования на втором этапе, например, представляют собой [-21, 14], [-3, 0], [102, 40], [120, 5] и [100, 18], модуль 218 взаимного прогнозирования может вычислять среднее значение значений окружающих векторов движения в качестве |-21|+|14|+|-3|+|0|+|102|+|40|+|120|+|5|+|100|+|18|=42.
[0391] Соответственно, на втором этапе, поскольку среднее значение значений окружающих векторов движения включается в диапазон (T1, T2], модуль 218 взаимного прогнозирования может выбирать, в качестве первой таблицы, табличный индекс 1, указывающий таблицу, соответствующую диапазону, указываемому посредством (T1, T2].
[0392] Следует отметить, что хотя модуль 218 взаимного прогнозирования выбирает первую таблицу из числа таблиц на основе среднего значения значений окружающих векторов движения во втором примере, настоящий вариант осуществления не ограничен этим. Модуль 218 взаимного прогнозирования может выбирать первую таблицу из числа таблиц на основе значения дисперсии значений окружающих векторов движения.
[0393] Четвертый пример
Четвертый пример описывает процесс выбора первой таблицы из числа таблиц на основе значений в списке возможных вариантов предикторов векторов движения, извлекаемых из вектора движения декодированного блока, соседнего с текущим блоком, который должен декодироваться. В дальнейшем в этом документе, список возможных вариантов предикторов векторов движения называется "списком возможных вариантов предикторов векторов движения".
[0394] Когда значения в списке возможных вариантов предикторов векторов движения являются большими, модуль 218 взаимного прогнозирования выбирает, в качестве первой таблицы, таблицу, которая может указывать местоположение большого значения столбца (значения абсолютной величины) с небольшим индексом, из числа таблиц. В четвертом примере, модуль 218 взаимного прогнозирования также выбирает первую таблицу для каждого сегмента (блока).
[0395] Более конкретно, на этапе S1001, во-первых, модуль 218 взаимного прогнозирования выполняет первый этап определения диапазонов для выбора одной из таблиц, на основе списка предварительно определенных пороговых значений.
[0396] Затем, модуль 218 взаимного прогнозирования выполняет второй этап выбора первой таблицы из числа таблиц на основе среднего значения значений в списке возможных вариантов предикторов векторов движения и диапазонов, определенных на первом этапе.
[0397] Здесь, предварительно определенные пороговые значения для использования на первом этапе представляют собой три пороговых значения (T1-T3) для различения четырех таблиц, проиллюстрированных на фиг. 49, например, T1=32, T2=64 и T3=128. Также в этом случае, на первом этапе, модуль 218 взаимного прогнозирования может определять (0, T1], (T1, T2], (T2, T3] и (T3, +∞) в качестве четырех диапазонов для выбора одной из четырех таблиц.
[0398] Кроме того, когда значения в списке возможных вариантов предикторов векторов движения для использования на втором этапе, например, представляют собой [-21, 14], [-3, 0], [102, 40], [120, 5] и [100, 18], модуль 218 взаимного прогнозирования может вычислять среднее значение значений в списке возможных вариантов предикторов векторов движения в качестве |-21|+|14|+|-3|+|0|+|102|+|40|+|120|+|5|+|100|+|18|=42.
[0399] Соответственно, на втором этапе, поскольку среднее значение значений в списке возможных вариантов предикторов векторов движения включается в диапазон (T1, T2], модуль 218 взаимного прогнозирования может выбирать, в качестве первой таблицы, табличный индекс 1, указывающий таблицу, соответствующую диапазону, указываемому посредством (T1, T2].
[0400] Следует отметить, что хотя модуль 218 взаимного прогнозирования выбирает первую таблицу из числа таблиц на основе среднего значения значений в списке возможных вариантов предикторов векторов движения в четвертом примере, настоящий вариант осуществления не ограничен этим. Модуль 218 взаимного прогнозирования может выбирать первую таблицу из числа таблиц на основе значения дисперсии значений в списке возможных вариантов предикторов векторов движения.
[0401] Пятый пример
Пятый пример описывает процесс выбора первой таблицы из числа таблиц на основе размера текущего сегмента (блока), который должен декодироваться. В дальнейшем в этом документе, текущий сегмент (блок), который должен декодироваться, называется "текущим сегментом". Когда размер текущего сегмента является большим, модуль 218 взаимного прогнозирования выбирает, в качестве первой таблицы, таблицу, которая может указывать местоположение большого значения столбца (значения абсолютной величины) с небольшим индексом, из числа таблиц. Также в пятом примере, модуль 218 взаимного прогнозирования выбирает первую таблицу для каждого сегмента (блока).
[0402] Более конкретно, на этапе S1001, во-первых, модуль 218 взаимного прогнозирования выполняет первый этап определения диапазонов для выбора одной из таблиц, на основе списка предварительно определенных пороговых значений.
[0403] Затем, модуль 218 взаимного прогнозирования выполняет второй этап выбора первой таблицы из числа таблиц на основе размера (абсолютной величины) текущего сегмента и диапазонов, определенных на первом этапе.
[0404] Здесь, предварительно определенные пороговые значения для использования на первом этапе представляют собой три пороговых значения (T1-T3) для различения четырех таблиц, проиллюстрированных на фиг. 49, например, T1=3*3, T2=16*16 и T3=32*32. Также в этом случае, на первом этапе, модуль 218 взаимного прогнозирования может определять (0, T1], (T1, T2], (T2, T3] и (T3, +∞] в качестве четырех диапазонов для выбора одной из четырех таблиц.
[0405] Размер (абсолютная величина) текущего сегмента для использования на втором этапе предположительно составляет, например, 16*8. В этом случае, на втором этапе, поскольку размер (абсолютная величина) текущего сегмента включается в диапазон (T1, T2), модуль 218 взаимного прогнозирования может выбирать, в качестве первой таблицы, табличный индекс 1, указывающий таблицу, соответствующую диапазону, указываемому посредством (T1, T2).
[0406] Шестой пример
Шестой пример описывает процесс выбора первой таблицы из числа таблиц на основе разрешения кадра, включающего в себя текущий сегмент (блок), который должен декодироваться. Разрешение кадра также может выражаться как число пикселов, включенное в кадр. В дальнейшем в этом документе, кадр, включающий в себя текущий сегмент (блок), который должен декодироваться, называется "кадром, включающим в себя текущий блок". Когда разрешение кадра, включающего в себя текущий блок, является высоким, модуль 218 взаимного прогнозирования выбирает, в качестве первой таблицы, таблицу, которая может указывать местоположение большого значения столбца (значения абсолютной величины) с небольшим индексом, из числа таблиц. В шестом примере, модуль 218 взаимного прогнозирования выбирает первую таблицу для каждого кадра.
[0407] Более конкретно, на этапе S1001, во-первых, модуль 218 взаимного прогнозирования выполняет первый этап определения диапазонов для выбора одной из таблиц, на основе списка предварительно определенных пороговых значений.
[0408] Затем, модуль 218 взаимного прогнозирования выполняет второй этап выбора первой таблицы из числа таблиц на основе разрешения кадра, включающего в себя текущий блок, и диапазонов, определенных на первом этапе.
[0409] Здесь, предварительно определенные пороговые значения для использования на первом этапе представляют собой три пороговых значения (T1-T3) для различения четырех таблиц, проиллюстрированных на фиг. 49, например, T1=832*580, T2=1920*1080 и T3=3840*2160. Также в этом случае, на первом этапе, модуль 218 взаимного прогнозирования может определять (0, T1], (T1, T2], (T2, T3] и (T3, +∞) в качестве четырех диапазонов для выбора одной из четырех таблиц.
[0410] Разрешение кадра, включающего в себя текущий блок, для использования на втором этапе предположительно составляет, например, 416*240. В этом случае, на втором этапе, поскольку разрешение кадра, включающего в себя текущий блок, включается в диапазон (0, T1], модуль 218 взаимного прогнозирования может выбирать, в качестве первой таблицы, табличный индекс 0, указывающий таблицу, соответствующую диапазону, указываемому посредством (0, T1].
[0411] Следует отметить, что разрешение кадра, включающего в себя текущий блок, может получаться из синтаксиса (правил представления строк данных), включенного в кодированный поток битов, полученный посредством декодера 200.
[0412] Седьмой пример
Седьмой пример описывает процесс выбора первой таблицы из числа таблиц на основе временного идентификатора среза или кадра, включающего в себя текущий сегмент (блок), который должен декодироваться. Здесь, временной идентификатор представляет собой число, указывающее уровень временного слоя для пространственного масштабируемого кодирования. Пространственное масштабируемое кодирование представляет собой технологию для кодирования информации иерархически (для каждого слоя) из приблизительной информации в точную информацию. Пространственное масштабируемое кодирование достигается посредством разделения информации на иерархические слои в качестве временных слоев и кодирования иерархических слоев. В примере, проиллюстрированном на фиг. 57 или фиг. 58, кадр кодируется для каждого слоя, и масштабируемость достигается в улучшающем слое выше базового слоя. В этом случае, временной идентификатор может принимать значение в 0-2. Следует отметить, что срез может кодироваться для каждого слоя, и масштабируемость может достигаться в улучшающем слое выше базового слоя. В дальнейшем в этом документе, срез или кадр, включающий в себя текущий сегмент (блок), который должен декодироваться, называется "текущим срезом" или "текущим кадром".
[0413] Когда значение временного идентификатора текущего среза или текущего кадра является большим, модуль 218 взаимного прогнозирования выбирает, в качестве первой таблицы, таблицу, которая может указывать местоположение большого значения столбца (значения абсолютной величины) с небольшим индексом, из числа таблиц. В седьмом примере, модуль 218 взаимного прогнозирования выбирает первую таблицу для каждого среза или кадра.
[0414] Более конкретно, на этапе S1001, во-первых, модуль 218 взаимного прогнозирования выполняет первый этап определения диапазонов для выбора одной из таблиц, на основе списка предварительно определенных пороговых значений.
[0415] Затем, модуль 218 взаимного прогнозирования выполняет второй этап выбора первой таблицы из числа таблиц на основе значения временного идентификатора текущего среза или текущего кадра и диапазонов, определенных на первом этапе.
[0416] Здесь, предварительно определенные пороговые значения для использования на первом этапе представляют собой три пороговых значения (T1-T3) для различения четырех таблиц, проиллюстрированных на фиг. 49, например, T1=1, T2=2 и T3=3. Также в этом случае, на первом этапе, модуль 218 взаимного прогнозирования может определять (0, T1], (T1, T2], (T2, T3] и (T3, +∞) в качестве четырех диапазонов для выбора одной из четырех таблиц.
[0417] Значение временного идентификатора текущего среза или текущего кадра для использования на втором этапе предположительно составляет, например, два. В этом случае, на втором этапе, поскольку значение временного идентификатора текущего среза или текущего кадра включается в диапазон (T1, T2], модуль 218 взаимного прогнозирования может выбирать, в качестве первой таблицы, табличный индекс 1, указывающий таблицу, соответствующую диапазону, указываемому посредством (T1, T2].
[0418] Восьмой пример
Восьмой пример описывает процесс выбора первой таблицы из числа таблиц на основе расстояния между кадром, включающим в себя текущий сегмент (блок), который должен декодироваться, и опорным кадром текущего сегмента (блока), который должен декодироваться. В дальнейшем в этом документе, кадр, включающий в себя текущий сегмент (блок), который должен декодироваться, называется "текущим кадром", и текущий сегмент (блок), который должен декодироваться, называется "текущим сегментом". Когда расстояние между текущим кадром и опорным кадром текущего сегмента является большим, модуль 218 взаимного прогнозирования выбирает, в качестве первой таблицы, таблицу, которая может указывать местоположение большого значения столбца (значения абсолютной величины) с небольшим индексом, из числа таблиц. В восьмом примере, модуль 218 взаимного прогнозирования выбирает первую таблицу для каждого сегмента (блока).
[0419] Более конкретно, на этапе S1001, во-первых, модуль 218 взаимного прогнозирования выполняет первый этап определения диапазонов для выбора одной из таблиц, на основе списка предварительно определенных пороговых значений.
[0420] Затем, модуль 218 взаимного прогнозирования выполняет второй этап выбора первой таблицы из числа таблиц на основе расстояния между текущим кадром и опорным кадром текущего сегмента и диапазонов, определенных на первом этапе.
[0421] Здесь, предварительно определенные пороговые значения для использования на первом этапе представляют собой три пороговых значения (T1-T3) для различения четырех таблиц, проиллюстрированных на фиг. 49, например, T1=1, T2=2 и T3=3. Также в этом случае, на первом этапе, модуль 218 взаимного прогнозирования может определять (0, T1], (T1, T2], (T2, T3] и (T3, +∞) в качестве четырех диапазонов для выбора одной из четырех таблиц.
[0422] POC (порядок отображения) текущего кадра для использования на втором этапе предположительно составляет 16, и POC опорного кадра предположительно составляет 0. В этом случае, на втором этапе, поскольку расстояние между текущим кадром и опорным кадром текущего сегмента составляет 16 и включается в диапазон (T3, +∞), модуль 218 взаимного прогнозирования может выбирать, в качестве первой таблицы, табличный индекс 3, указывающий таблицу, соответствующую диапазону, указываемому посредством (T3, +∞).
[0423] Девятый пример
Следует отметить, что процесс выбора первой таблицы из числа таблиц может выполняться на основе комбинации способов, описанных в первом-восьмом примерах.
[0424] Фиг. 50 иллюстрирует пример списка 2, включающего в себя таблицы для использования в процессе выбора вектора движения согласно первому аспекту варианта 1 осуществления. В частности, фиг. 50 иллюстрирует пример списка 2, включающего в себя семь таблиц, различаемых посредством табличных индексов 0-7. Семь таблиц, включенных в список 2, варьируются в разностях (абсолютных величинах) между значениями столбцов, т.е. значениями абсолютной величины. В примере, проиллюстрированном на фиг. 50, строка, указываемая посредством одного из табличных индексов 0-7, является эквивалентной первой таблице, и одно из значений столбцов в первой таблице является эквивалентным значению коррекции.
[0425] Далее описывается, в качестве примера, процесс выбора первой таблицы из числа таблиц, проиллюстрированных на фиг. 50, на основе комбинации первого примера и пятого примера. Другими словами, девятый пример описывает процесс выбора первой таблицы из числа таблиц на основе как предиктора вектора движения, выбранного из соседнего блока относительно текущего блока, так и размера текущего сегмента.
[0426] Когда размер текущего сегмента является большим, и значение предиктора вектора движения является большим, модуль 218 взаимного прогнозирования выбирает, в качестве первой таблицы, таблицу, которая может указывать местоположение большого значения столбца (значения абсолютной величины) с небольшим индексом, из числа таблиц.
[0427] Более конкретно, на этапе S1001, во-первых, модуль 218 взаимного прогнозирования выполняет первый этап разделения таблиц, включенных в список 2, на два набора, включающих в себя таблицы, т.е. определения набора, включающего в себя часть таблиц, включенных в список 2, в качестве первого набора, и набора, включающего в себя остальную часть таблиц, в качестве второго набора. Например, модуль 218 взаимного прогнозирования определяет, из табличных индексов 0-7, включенных в список 2, проиллюстрированный на фиг. 50, табличные индексы 0-3 в качестве первого набора и табличные индексы 4-7 в качестве второго набора.
[0428] Затем, модуль 218 взаимного прогнозирования выполняет второй этап определения диапазонов для выбора первого набора или второго набора, на основе первого списка предварительно определенных пороговых значений.
[0429] Затем модуль 218 взаимного прогнозирования выполняет третий этап выбора первого набора или второго набора на основе значения предиктора вектора движения и диапазонов, определенных на втором этапе.
[0430] После этого, модуль 218 взаимного прогнозирования выполняет четвертый этап определения диапазонов для выбора одной из таблиц, включенных в первый набор или второй набор, выбранный на третьем этапе, на основе второго списка предварительно определенных пороговых значений.
[0431] В завершение, модуль 218 взаимного прогнозирования выполняет пятый этап выбора первой таблицы из числа таблиц, включенных в первый набор или второй набор, выбранный на третьем этапе, на основе размера текущего сегмента и диапазонов, определенных на четвертом этапе.
[0432] Здесь, предварительно определенное пороговое значение, включенное в первый список для использования на втором этапе, представляет собой пороговое значение (T21) для различения первого набора, включающего в себя табличные индексы 0-3, и второго набора, включающего в себя табличные индексы 4-7, проиллюстрированные на фиг. 50, например, T21=32. В этом случае, на втором этапе, модуль 218 взаимного прогнозирования может определять [0, T21] и [T21, +∞] в качестве двух диапазонов для выбора первого набора или второго набора.
[0433] Кроме того, когда предиктор вектора движения для использования на третьем этапе, например, представляет собой [-14, 41], модуль 218 взаимного прогнозирования может вычислять значение предиктора вектора движения, т.е. сумму значений компонентов предиктора вектора движения в качестве |-14|+|41|=55. В этом случае, на третьем этапе, поскольку сумма значений компонентов предиктора вектора движения включается в диапазон [T21, +∞], модуль 218 взаимного прогнозирования может выбирать второй набор, соответствующий диапазону, указываемому посредством [T21, +∞].
[0434] Кроме того, предварительно определенные пороговые значения, включенные во второй список для использования на четвертом этапе, представляют собой три пороговых значения (T41-T43) для различения четырех таблиц, включенных во второй набор, указываемый посредством табличных индексов 4-7, проиллюстрированных на фиг. 50, например, T41=8*8, T42=16*16 и T43=32*32. Также в этом случае, на четвертом этапе, модуль 218 взаимного прогнозирования может определять (0, T41], (T41, T42], (T42, T43] и (T43, +∞) в качестве четырех диапазонов для выбора одной из четырех таблиц.
[0435] Кроме того, когда размер текущего сегмента для использования на пятом этапе предположительно составляет, например, 16*8, размер текущего сегмента включается в диапазон (T41, T42]. В этом случае, на пятом этапе, модуль 218 взаимного прогнозирования может выбирать, в качестве первой таблицы, вторую таблицу во втором наборе, указывающем таблицу, соответствующую диапазону, указываемому посредством (T41, T42], т.е. табличный индекс 5.
[0436] Десятый пример
Десятый пример описывает процесс выбора первой таблицы из числа таблиц на основе среднего значения разностей векторов движения декодированного кадра. Когда среднее значение разностей векторов движения декодированного кадра является большим, модуль 218 взаимного прогнозирования выбирает, в качестве первой таблицы, таблицу, которая может указывать местоположение большого значения столбца (значения абсолютной величины) с небольшим индексом, из числа таблиц. В десятом примере, модуль 218 взаимного прогнозирования выбирает первую таблицу для каждого кадра.
[0437] Более конкретно, на этапе S1001, во-первых, модуль 218 взаимного прогнозирования выполняет первый этап определения диапазонов для выбора одной из таблиц, на основе списка предварительно определенных пороговых значений.
[0438] Затем, модуль 218 взаимного прогнозирования выполняет второй этап выбора первой таблицы из числа таблиц на основе среднего значения разностей векторов движения декодированного кадра и диапазонов, определенных на первом этапе.
[0439] Здесь, предварительно определенные пороговые значения для использования на первом этапе представляют собой три пороговых значения (T1-T3) для различения четырех таблиц, проиллюстрированных на фиг. 49, например, T1=32, T2=64 и T3=128. В этом случае, на первом этапе, модуль 218 взаимного прогнозирования может определять (0, T1], (T1, T2], (T2, T3] и (T3, +∞) в качестве четырех диапазонов для выбора одной из четырех таблиц.
[0440] Кроме того, когда разности векторов движения декодированного кадра для использования на втором этапе предположительно составляют, например, [100, 18], модуль 218 взаимного прогнозирования может вычислять среднее значение разностей векторов движения декодированного кадра в качестве |100|+|18|=118.
[0441] Соответственно, на втором этапе, поскольку среднее значение разностей векторов движения декодированного кадра включается в диапазон (T2, T3], модуль 218 взаимного прогнозирования может выбирать, в качестве первой таблицы, табличный индекс 2, указывающий таблицу, соответствующую диапазону, указываемому посредством (T2, T3].
[0442] Следует отметить, что хотя модуль 218 взаимного прогнозирования выбирает первую таблицу из числа таблиц на основе среднего значения разностей векторов движения декодированного кадра в десятом примере, настоящий вариант осуществления не ограничен этим. Модуль 218 взаимного прогнозирования может выбирать первую таблицу из числа таблиц на основе значения вектора движения декодированного кадра.
[0443] Кроме того, хотя модуль 218 взаимного прогнозирования выбирает первую таблицу из числа таблиц на основе среднего значения разностей векторов движения декодированного кадра в десятом примере, настоящий вариант осуществления не ограничен этим. Модуль 218 взаимного прогнозирования может выбирать первую таблицу из числа таблиц на основе значения дисперсии разностей векторов движения декодированного кадра.
[0444] Кроме того, декодированный кадр может представлять собой кадр слоя, указывающего временной идентификатор, идентичный временному идентификатору текущего кадра, или может представлять собой кадр, непосредственно предшествующий текущему кадру в порядке декодирования.
[0445] Одиннадцатый пример
Одиннадцатый пример описывает процесс выбора первой таблицы из числа таблиц на основе среднего значения размеров блоков декодированного кадра. Когда среднее значение размеров блоков декодированного кадра является большим, модуль 218 взаимного прогнозирования выбирает, в качестве первой таблицы, таблицу, которая может указывать местоположение большого значения столбца (значения абсолютной величины) с небольшим индексом, из числа таблиц. В одиннадцатом примере, модуль 218 взаимного прогнозирования выбирает первую таблицу для каждого кадра.
[0446] Более конкретно, на этапе S1001, во-первых, модуль 218 взаимного прогнозирования выполняет первый этап определения диапазонов для выбора одной из таблиц, на основе списка предварительно определенных пороговых значений.
[0447] Затем, модуль 218 взаимного прогнозирования выполняет второй этап выбора первой таблицы из числа таблиц на основе среднего значения размеров блоков декодированного кадра и диапазонов, определенных на первом этапе.
[0448] Здесь, предварительно определенные пороговые значения для использования на первом этапе представляют собой три пороговых значения (T1-T3) для различения четырех таблиц, проиллюстрированных на фиг. 49, например, T1=8*8, T2=16*16 и T3=32*32. Также в этом случае, на первом этапе, модуль 218 взаимного прогнозирования может определять (0, T1], (T1, T2], (T2, T3] и (T3, +∞] в качестве четырех диапазонов для выбора одной из четырех таблиц.
[0449] Кроме того, когда среднее значение результатов, полученных посредством умножения горизонтальных размеров блоков и вертикальных размеров блоков декодированного кадра для использования на втором этапе, предположительно составляет, например, 128, среднее значение размеров блоков декодированного кадра включается в диапазон (T1, T2). В этом случае, на втором этапе, модуль 218 взаимного прогнозирования может выбирать, в качестве первой таблицы, табличный индекс 1, указывающий таблицу, соответствующую диапазону, указываемому посредством (T1, T2).
[0450] Следует отметить, что декодированный кадр может представлять собой кадр слоя, указывающего временной идентификатор, идентичный временному идентификатору текущего кадра, или может представлять собой кадр, непосредственно предшествующий текущему кадру в порядке декодирования.
[0451] Двенадцатый пример
Двенадцатый пример описывает процесс выбора первой таблицы из числа таблиц на основе среднего значения параметров квантования (QP) декодированного кадра. Когда среднее значение QP декодированного кадра является большим, модуль 218 взаимного прогнозирования выбирает, в качестве первой таблицы, таблицу, которая может указывать местоположение большого значения столбца (значения абсолютной величины) с небольшим индексом, из числа таблиц. В двенадцатом примере, модуль 218 взаимного прогнозирования выбирает первую таблицу для каждого кадра.
[0452] Более конкретно, на этапе S1001, во-первых, модуль 218 взаимного прогнозирования выполняет первый этап определения диапазонов для выбора одной из таблиц, на основе списка предварительно определенных пороговых значений.
[0453] Затем, модуль 218 взаимного прогнозирования выполняет второй этап выбора первой таблицы из числа таблиц на основе среднего значения QP декодированного кадра и диапазонов, определенных на первом этапе.
[0454] Здесь, предварительно определенные пороговые значения для использования на первом этапе представляют собой три пороговых значения (T1-T3) для различения четырех таблиц, проиллюстрированных на фиг. 49, например, T1=22, T2=27 и T3=32. В этом случае, на первом этапе, модуль 218 взаимного прогнозирования может определять (0, T1], (T1, T2], (T2, T3] и (T3, +∞) в качестве четырех диапазонов для выбора одной из четырех таблиц.
[0455] Кроме того, среднее значение QP декодированного кадра для использования на втором этапе предположительно составляет, например, 40. В этом случае, на втором этапе, поскольку среднее значение QP декодированного кадра включается в диапазон (T3, +∞), модуль 218 взаимного прогнозирования может выбирать, в качестве первой таблицы, табличный индекс 3, указывающий таблицу, соответствующую диапазону, указываемому посредством (T3, +∞).
[0456] Следует отметить, что декодированный кадр может представлять собой кадр слоя, указывающего временной идентификатор, идентичный временному идентификатору текущего кадра, или может представлять собой кадр, непосредственно предшествующий текущему кадру в порядке декодирования.
[0457] Тринадцатый пример
Тринадцатый пример описывает процесс выбора первой таблицы из числа таблиц на основе QP среза декодированного кадра. Когда QP среза декодированного кадра является большим, модуль 218 взаимного прогнозирования выбирает, в качестве первой таблицы, таблицу, которая может указывать местоположение большого значения столбца (значения абсолютной величины) с небольшим индексом, из числа таблиц. В тринадцатом примере, модуль 218 взаимного прогнозирования выбирает первую таблицу для каждого кадра или среза.
[0458] Более конкретно, на этапе S1001, во-первых, модуль 218 взаимного прогнозирования выполняет первый этап определения диапазонов для выбора одной из таблиц, на основе списка предварительно определенных пороговых значений.
[0459] Затем, модуль 218 взаимного прогнозирования выполняет второй этап выбора первой таблицы из числа таблиц на основе QP-среза декодированного кадра и диапазонов, определенных на первом этапе.
[0460] Здесь, предварительно определенные пороговые значения для использования на первом этапе представляют собой три пороговых значения (T1-T3) для различения четырех таблиц, проиллюстрированных на фиг. 49, например, T1=22, T2=27 и T3=32. В этом случае, на первом этапе, модуль 218 взаимного прогнозирования может определять (0, T1], (T1, T2], (T2, T3] и (T3, +∞) в качестве четырех диапазонов для выбора одной из четырех таблиц.
[0461] Кроме того, QP среза декодированного кадра для использования на втором этапе предположительно составляет, например, 40. В этом случае, на втором этапе, поскольку QP среза декодированного кадра включается в диапазон (T3, +∞), модуль 218 взаимного прогнозирования может выбирать, в качестве первой таблицы, табличный индекс 3, указывающий таблицу, соответствующую диапазону, указываемому посредством (T3, +∞).
[0462] Следует отметить, что декодированный кадр может представлять собой кадр слоя, указывающего временной идентификатор, идентичный временному идентификатору текущего кадра, или может представлять собой кадр, непосредственно предшествующий текущему кадру в порядке декодирования.
[0463] Четырнадцатый пример
Четырнадцатый пример описывает процесс выбора первой таблицы из числа таблиц на основе QP среза кадра, включающего в себя текущий сегмент (блок), который должен декодироваться. В дальнейшем в этом документе, кадр, включающий в себя текущий сегмент (блок), который должен декодироваться, называется "текущим кадром". Когда QP среза текущего кадра является большим, модуль 218 взаимного прогнозирования выбирает, в качестве первой таблицы, таблицу, которая может указывать местоположение большого значения столбца (значения абсолютной величины) с небольшим индексом, из числа таблиц. Также в четырнадцатом примере, модуль 218 взаимного прогнозирования выбирает первую таблицу для каждого кадра или среза.
[0464] Более конкретно, на этапе S1001, во-первых, модуль 218 взаимного прогнозирования выполняет первый этап определения диапазонов для выбора одной из таблиц, на основе списка предварительно определенных пороговых значений.
[0465] Затем, модуль 218 взаимного прогнозирования выполняет второй этап выбора первой таблицы из числа таблиц на основе QP-среза среза текущего кадра и диапазонов, определенных на первом этапе.
[0466] Здесь, предварительно определенные пороговые значения для использования на первом этапе представляют собой три пороговых значения (T1-T3) для различения четырех таблиц, проиллюстрированных на фиг. 49, например, T1=22, T2=27 и T3=32. В этом случае, на первом этапе, модуль 218 взаимного прогнозирования может определять (0, T1], (T1, T2], (T2, T3] и (T3, +∞) в качестве четырех диапазонов для выбора одной из четырех таблиц.
[0467] Кроме того, QP среза текущего кадра для использования на втором этапе предположительно составляет, например, 40. В этом случае, на втором этапе, поскольку QP среза текущего кадра включается в диапазон (T3, +∞), модуль 218 взаимного прогнозирования может выбирать, в качестве первой таблицы, табличный индекс 3, указывающий таблицу, соответствующую диапазону, указываемому посредством (T3, +∞).
[0468] Пятнадцатый пример
Следует отметить, что процесс выбора первой таблицы из числа таблиц может выполняться на основе комбинации способов, описанных в десятом-четырнадцатом примерах.
[0469] Далее описывается, в качестве примера, процесс выбора первой таблицы из числа таблиц, проиллюстрированных на фиг. 50, на основе комбинации десятого примера и четырнадцатого примера. Другими словами, пятнадцатый пример описывает процесс выбора первой таблицы из числа таблиц на основе как среднего значения разностей векторов движения декодированного кадра, так и QP среза текущего кадра.
[0470] Когда QP среза текущего кадра является большим, и среднее значение разностей векторов движения декодированного кадра является большим, модуль 218 взаимного прогнозирования выбирает, в качестве первой таблицы, таблицу, которая может указывать местоположение большого значения столбца (значения абсолютной величины) с небольшим индексом, из числа таблиц.
[0471] Более конкретно, на этапе S1001, во-первых, модуль 218 взаимного прогнозирования выполняет первый этап разделения таблиц, включенных в список 2, на два набора, включающих в себя таблицы, т.е. определения набора, включающего в себя часть таблиц, включенных в список 2, в качестве первого набора, и набора, включающего в себя остальную часть таблиц, в качестве второго набора. Например, модуль 218 взаимного прогнозирования определяет, из табличных индексов 0-7, включенных в список 2, проиллюстрированный на фиг. 50, табличные индексы 0-3 в качестве первого набора и табличные индексы 4-7 в качестве второго набора.
[0472] Затем, модуль 218 взаимного прогнозирования выполняет второй этап определения диапазонов для выбора первого набора или второго набора, на основе первого списка предварительно определенных пороговых значений.
[0473] Затем модуль 218 взаимного прогнозирования выполняет третий этап выбора первого набора или второго набора на основе QP среза текущего кадра и диапазонов, определенных на втором этапе.
[0474] После этого, модуль 218 взаимного прогнозирования выполняет четвертый этап определения диапазонов для выбора одной из таблиц, включенных в первый набор или второй набор, выбранный на третьем этапе, на основе второго списка предварительно определенных пороговых значений.
[0475] В завершение, модуль 218 взаимного прогнозирования выполняет пятый этап выбора первой таблицы из числа таблиц, включенных в первый набор или второй набор, выбранный на третьем этапе, на основе среднего значения разностей векторов движения декодированного кадра и диапазонов, определенных на четвертом этапе.
[0476] Здесь, предварительно определенное пороговое значение, включенное в первый список для использования на втором этапе, представляет собой пороговое значение (T21) для различения первого набора, включающего в себя табличные индексы 0-3, и второго набора, включающего в себя табличные индексы 4-7, проиллюстрированные на фиг. 50, например, T21=30. В этом случае, на втором этапе, модуль 218 взаимного прогнозирования может определять (0, T21] и (T21, +∞) в качестве двух диапазонов для выбора первого набора или второго набора. Кроме того, QP среза текущего кадра для использования на третьем этапе предположительно составляет, например, 40. В этом случае, на третьем этапе, поскольку сумма значений компонентов предиктора вектора движения включается в диапазон (T21, +∞), модуль 218 взаимного прогнозирования может выбирать второй набор, соответствующий диапазону, указываемому посредством (T21, +∞).
[0477] Кроме того, предварительно определенные пороговые значения, включенные во второй список для использования на четвертом этапе, представляют собой три пороговых значения (T41-T43) для различения четырех таблиц, включенных во второй набор, указываемый посредством табличных индексов 4-7, проиллюстрированных на фиг. 50, например, T41=32, T42=64 и T43=128. В этом случае, на четвертом этапе, модуль 218 взаимного прогнозирования может определять (0, T41], (T41, T42], (T42, T43] и (T43, +∞) в качестве четырех диапазонов для выбора одной из четырех таблиц.
[0478] Кроме того, когда среднее значение разностей векторов движения декодированного кадра для использования на пятом этапе предположительно составляет, например, [100, 18], модуль 218 взаимного прогнозирования может вычислять среднее значение разностей векторов движения декодированного кадра в качестве |100|+|18|=118. Соответственно, среднее значение разностей векторов движения декодированного кадра включается в диапазон (T42, T43]. В этом случае, на пятом этапе, модуль 218 взаимного прогнозирования может выбирать, в качестве первой таблицы, третью таблицу во втором наборе, указывающем таблицу, соответствующую диапазону, указываемому посредством (T42, T43], т.е. табличный индекс 6.
[0479] Следует отметить, что декодированный кадр может представлять собой кадр слоя, указывающего временной идентификатор, идентичный временному идентификатору текущего кадра, или может представлять собой кадр, непосредственно предшествующий текущему кадру в порядке декодирования.
[0480] Следует отметить, что хотя первый аспект описывает пример, в котором используются четыре таблицы, проиллюстрированные на фиг. 49, настоящий вариант осуществления не ограничен этим. Приспосабливается конфигурация, имеющая две или более таблиц. Например, может использоваться конфигурация, имеющая две таблицы, указываемые посредством табличного индекса 1 и табличного индекса 2, проиллюстрированных на фиг. 49. В этом случае, вместо определения четырех диапазонов с использованием трех пороговых значений в первом-пятнадцатом примерах, два диапазона с использованием одного порогового значения могут определяться.
[0481] Преимущества первого аспекта
Согласно первому аспекту, использование процесса извлечения векторов движения в процессе взаимного прогнозирования настоящего раскрытия сущности позволяет выполнять компенсацию движения с использованием вектора движения, более точного, чем базовый вектор движения, в процессе взаимного прогнозирования. Соответственно, можно повышать эффективность кодирования в процессе взаимного прогнозирования.
[0482] Кроме того, согласно первому аспекту, процесс выбора вектора движения, как указано в первом-пятнадцатом примере, описанных выше, используется в процессе извлечения векторов движения. Вследствие этого, когда используется вектор движения, более точный, чем базовый вектор движения, можно указывать более точный вектор движения с использованием индекса, имеющего меньшее значение (меньший объем информации) в первой таблице, выбранной из числа таблиц. Другими словами, согласно первому аспекту, имеется вероятность того, что использование процесса выбора вектора движения в процессе извлечения векторов движения повышает производительность кодирования процесса взаимного прогнозирования.
[0483] Следует отметить, что, по меньшей мере, часть раскрытия сущности в первом аспекте может комбинироваться, по меньшей мере, с частью раскрытия сущности одного или более других аспектов.
[0484] Кроме того, часть процесса, часть устройства, синтаксиса и/или другие функции, раскрытые в описании блок-схемы последовательности операций способа, проиллюстрированной на фиг. 48, могут комбинироваться с другими аспектами.
[0485] Кроме того, все процессы/элементы, раскрытые в первом аспекте, не являются существенно важными. Устройство/способ может включать в себя часть процессов/элементов. Помимо этого, вышеописанные процессы могут выполняться посредством декодера идентично кодеру.
[0486] Второй аспект процесса взаимного прогнозирования
Также во втором аспекте настоящего варианта осуществления, кодер 100 и декодер 200 выполняют процесс извлечения векторов движения, который должен использоваться, когда процесс взаимного прогнозирования выполняется, с использованием процесса выбора, который выбирает то, следует или нет использовать один из индексов одной из таблиц. Хотя операции, выполняемые посредством декодера 200, описываются ниже как характерные, кодер 100 выполняет идентичные операции.
[0487] Второй аспект настоящего варианта осуществления предоставляет описание выполнения процесса выбора с использованием флага (параметра). Далее описываются, главным образом, отличия от первого аспекта.
[0488] Фиг. 51 является блок-схемой последовательности операций способа, иллюстрирующей процесс выбора вектора движения в процессе взаимного прогнозирования, выполняемом посредством модуля 218 взаимного прогнозирования декодера 200 согласно второму аспекту варианта 1 осуществления.
[0489] Во-первых, как проиллюстрировано на фиг. 51, модуль 218 взаимного прогнозирования декодера 200 синтаксически анализирует первый параметр, указывающий первый индекс, который указывает, из числа таблиц, таблицу для декодирования текущего сегмента, который должен декодироваться (S2001). Другими словами, модуль 218 взаимного прогнозирования выбирает первую таблицу, которая должна использоваться для текущего сегмента, посредством синтаксического анализа первого параметра. Первый параметр указывает первый индекс, который может указывать первую таблицу. Следует отметить, что первый индекс не является существенно важным, и первый параметр может непосредственно указывать первую таблицу, которая должна использоваться для текущего сегмента.
[0490] Например, модуль 218 взаимного прогнозирования выбирает первую таблицу, которая должна использоваться для текущего сегмента, из числа четырех таблиц, включенных в список 1, проиллюстрированный на фиг. 49, посредством синтаксического анализа первого параметра.
[0491] Затем, модуль 218 взаимного прогнозирования синтаксически анализирует второй параметр, указывающий второй индекс, который указывает информацию вектора движения, которая должна выбираться из числа фрагментов информации вектора движения (S2002). Другими словами, модуль 218 взаимного прогнозирования может получать, из первой таблицы, второй индекс, указывающий информацию вектора движения, которая должна выбираться, посредством синтаксического анализа второго параметра.
[0492] Например, модуль 218 взаимного прогнозирования получает второй индекс, указывающий (задающий) местоположение значения столбца (значения абсолютной величины) в первой таблице, включенной в список 1, проиллюстрированный на фиг. 49, посредством синтаксического анализа второго параметра.
[0493] Затем, модуль 218 взаимного прогнозирования декодирует текущий сегмент, который должен декодироваться, т.е. формирует прогнозный сигнал текущего сегмента, который должен декодироваться, с использованием, по меньшей мере, информации вектора движения, указываемой посредством второго индекса (S2003).
[0494] Следует отметить, что вышеописанная информация вектора движения может представлять собой информацию относительно дельта-вектора движения, и информация вектора движения, указываемая посредством второго индекса, может представлять собой значение (значение абсолютной величины), указывающее например, размер дельта-вектора движения.
[0495] Здесь, аналогично шестому примеру первого аспекта, например, первый параметр, синтаксически проанализированный на этапе S2001, определяется как указывающий первую таблицу, которая должна выбираться из числа таблиц, на основе разрешения кадра, включающего в себя текущий блок. Другими словами, контент, такой как первый индекс, который указывает первую таблицу, которая должна выбираться из числа таблиц, записывается в первый параметр, синтаксически проанализированный на этапе S2001, на основе разрешения кадра, включающего в себя текущий блок. Аналогично десятому примеру первого аспекта, например, первый параметр, синтаксически проанализированный на этапе S2001, может определяться как указывающий первую таблицу, которая должна выбираться из числа таблиц, на основе среднего значения разностей векторов движения декодированного кадра. Следует отметить, что способ определения первого параметра, синтаксически проанализированного на этапе S2001, не ограничен первым примером и десятым примером. Другими словами, первый параметр, синтаксически проанализированный на этапе S2001, может определяться как указывающий первую таблицу, которая должна выбираться из числа таблиц, на основе критериев, указываемых в первом-пятнадцатом примерах первого аспекта.
[0496] Первый параметр, синтаксически проанализированный на этапе S2001, и второй параметр, синтаксически проанализированный на этапе S2002, могут записываться в заголовок в единицах срезов. Первый параметр и второй параметр не ограничены записью в заголовок в единицах срезов и могут записываться в заголовок в единицах кадров, единицах последовательностей или единицах блоков. Помимо этого, из первого параметра и второго параметра, по меньшей мере, первый параметр может представлять собой параметр на уровне CTU либо может представлять собой параметр на уровне сегмента.
[0497] Следует отметить, что в примере, проиллюстрированном на фиг. 49, первый параметр представляет собой вертикальное значение, указываемое посредством табличного индекса, и постепенно увеличивается на 1 от 0 в порядке возрастания значений вдоль вертикального направления чертежа. Аналогично первому параметру, второй параметр, хотя не показано, постепенно увеличивается на 1 от 0 в порядке возрастания значений вдоль горизонтального направления чертежа.
[0498] Следует отметить, что хотя второй аспект описывает пример, в котором используются четыре таблицы, проиллюстрированные на фиг. 49, настоящий вариант осуществления не ограничен этим. Приспосабливается конфигурация, имеющая две или более таблиц. Например, может использоваться конфигурация, которая имеет две таблицы, указываемые посредством табличного индекса 0 и табличного индекса 2, проиллюстрированных на фиг. 49. В этом случае, первый параметр, имеющий двоичное значение, указывающее одну таблицу из двух таблиц, может использоваться вместо первого параметра, имеющего четверичное значение, указывающее одну таблицу из числа четырех таблиц.
[0499] Преимущества второго аспекта
Согласно второму аспекту, использование процесса извлечения векторов движения в процессе взаимного прогнозирования настоящего раскрытия сущности позволяет выполнять компенсацию движения с использованием вектора движения, более точного, чем базовый вектор движения, в процессе взаимного прогнозирования. Соответственно, можно повышать эффективность кодирования в процессе взаимного прогнозирования.
[0500] Кроме того, согласно второму аспекту, процесс выбора вектора движения, выполняемый с использованием параметра, определенного на основе критериев, указываемых в первом-пятнадцатом примерах, описанных выше, используется в процессе извлечения векторов движения. Вследствие этого, когда используется вектор движения, более точный, чем базовый вектор движения, можно указывать более точный вектор движения с использованием индекса, имеющего меньшее значение (меньший объем информации) в первой таблице, выбранной из числа таблиц. Другими словами, согласно второму аспекту, имеется вероятность того, что использование процесса выбора вектора движения в процессе извлечения векторов движения повышает производительность кодирования процесса взаимного прогнозирования.
[0501] Следует отметить, что, по меньшей мере, часть раскрытия сущности во втором аспекте может комбинироваться, по меньшей мере, с частью раскрытия сущности одного или более других аспектов.
[0502] Кроме того, часть процесса, часть устройства, синтаксиса и/или другие функции, раскрытые в описании блок-схемы последовательности операций способа, проиллюстрированной на фиг. 51, могут комбинироваться с другими аспектами.
[0503] Кроме того, все процессы/элементы, раскрытые во втором аспекте, не являются существенно важными. Устройство/способ может включать в себя часть процессов/элементов. Помимо этого, вышеописанные процессы могут выполняться посредством декодера идентично кодеру.
[0504] Пример реализации кодера
Фиг. 52 является блок-схемой, иллюстрирующей пример реализации кодера 100 согласно варианту 1 осуществления. Кодер 100 включает в себя схему 160 и запоминающее устройство 162. Например, множество составляющих элементов кодера 100, проиллюстрированного на фиг. 1, реализуются посредством схемы 160 и запоминающего устройства 162, проиллюстрированных на фиг. 52.
[0505] Схема 160 представляет собой схему, которая выполняет обработку информации, и является доступной для запоминающего устройства 162. Например, схема 160 представляет собой специализированную или общую электронную схему, которая кодирует видео. Схема 160 может представлять собой процессор, такой как CPU. Альтернативно, схема 160 может представлять собой агрегирование множества электронных схем. Кроме того, например, схема 160 может выполнять функции составляющих элементов кодера 100, проиллюстрированного на фиг. 1 и т.д., за исключением составляющих элементов, которые сохраняют информацию.
[0506] Запоминающее устройство 162 представляет собой специализированное или общее запоминающее устройство, которое сохраняет информацию, используемую посредством схемы 160 для того, чтобы кодировать видео. Запоминающее устройство 162 может представлять собой электронную схему, может соединяться со схемой 160 либо может включаться в схему 160. Альтернативно, запоминающее устройство 162 может представлять собой агрегирование множества электронных схем. Запоминающее устройство 162 может представлять собой магнитный диск или оптический диск и т.д. либо может выражаться как устройство хранения данных или носитель записи и т.д. Дополнительно, запоминающее устройство 162 может представлять собой энергонезависимое запоминающее устройство или энергозависимое запоминающее устройство.
[0507] Например, запоминающее устройство 162 может сохранять видео, которое должно кодироваться, или может сохранять поток битов, соответствующий кодированному видео. Помимо этого, запоминающее устройство 162 может сохранять программу для инструктирования схеме 160 кодировать видео.
[0508] Кроме того, например, запоминающее устройство 162 может выполнять функции, из множества составляющих элементов кодера 100, проиллюстрированного на фиг. 1 и т.д., составляющих элементов, которые сохраняют информацию. В частности, запоминающее устройство 162 может выполнять функции запоминающего устройства 118 блоков и запоминающего устройства 122 кинокадров, проиллюстрированных на фиг. 1. Более конкретно, запоминающее устройство 162 может сохранять, например, восстановленный блок и восстановленный кадр.
[0509] Следует отметить, что не все из множества составляющих элементов, проиллюстрированных на фиг. 1 и т.д., должны обязательно реализовываться посредством кодера 100, и не все процессы, описанные выше, должны выполняться посредством кодера 100. Некоторые из множества составляющих элементов, проиллюстрированных на фиг. 1 и т.д., могут включаться в другое устройство, и некоторые процессы, описанные выше, могут выполняться посредством другого устройства. Процесс прогнозирования в режиме взаимного прогнозирования эффективно выполняется посредством кодера 100, реализующего некоторые из множества составляющих элементов, проиллюстрированных на фиг. 1 и т.д., и выполняющего некоторые процессы, описанные выше.
[0510] Далее описывается пример операций, выполняемых посредством кодера 100, проиллюстрированного на фиг. 52. Фиг. 53 является блок-схемой последовательности операций способа, иллюстрирующей пример операций, выполняемых посредством кодера 100, проиллюстрированного на фиг. 52. Например, кодер 100, проиллюстрированный на фиг. 52, выполняет операции, проиллюстрированные на фиг. 53, при кодировании видео.
[0511] В частности, схема 160 кодера 100, при работе, выполняет следующие процессы. Во-первых, схема 160 выбирает первую таблицу, которая должна использоваться для текущего сегмента, который должен кодироваться в изображении видео, из множества таблиц, которые используются для того, чтобы корректировать базовый вектор движения в предварительно определенном направлении с использованием значения коррекции, указываемого посредством индекса, причем множество таблиц включают в себя значения коррекции, имеющие варьирующиеся разности между индексами (S311). Затем, схема 260 записывает параметр, указывающий первый индекс, который должен выбираться из числа индексов, включенных в первую таблицу (S312). Затем схема 160 кодирует текущий сегмент с использованием базового вектора движения, скорректированного с использованием значения коррекции, указываемого посредством первого индекса (S313).
[0512] Вследствие этого, кодер 100 может повышать производительность кодирования процесса взаимного прогнозирования посредством использования процесса выбора вектора движения в процессе извлечения векторов движения, когда процесс извлечения векторов движения используется в процессе взаимного прогнозирования. Соответственно, кодер 100 может повышать эффективность кодирования.
[0513] Пример реализации декодера
Фиг. 54 является блок-схемой, иллюстрирующей пример реализации декодера 200 согласно варианту 1 осуществления. Декодер 200 включает в себя схему 260 и запоминающее устройство 262. Например, множество составляющих элементов декодера 200, проиллюстрированного на фиг. 41, реализуются посредством схемы 260 и запоминающего устройства 262, проиллюстрированных на фиг. 54.
[0514] Схема 260 представляет собой схему, которая выполняет обработку информации, и является доступной для запоминающего устройства 262. Например, схема 260 представляет собой специализированную или общую электронную схему, которая декодирует видео. Схема 260 может представлять собой процессор, такой как CPU. Альтернативно, схема 260 может представлять собой агрегирование множества электронных схем. Кроме того, например, схема 260 может выполнять функции составляющих элементов декодера 200, проиллюстрированного на фиг. 41 и т.д., за исключением составляющих элементов, которые сохраняют информацию.
[0515] Запоминающее устройство 262 представляет собой специализированное или общее запоминающее устройство, которое сохраняет информацию, используемую посредством схемы 260 для того, чтобы декодировать видео. Запоминающее устройство 262 может представлять собой электронную схему, может соединяться со схемой 260 либо может включаться в схему 260. Альтернативно, запоминающее устройство 262 может представлять собой агрегирование множества электронных схем. Запоминающее устройство 262 может представлять собой магнитный диск или оптический диск и т.д. либо может выражаться как устройство хранения данных или носитель записи и т.д. Дополнительно, запоминающее устройство 262 может представлять собой энергонезависимое запоминающее устройство или энергозависимое запоминающее устройство.
[0516] Например, запоминающее устройство 262 может сохранять поток битов, соответствующий кодированному видео, или может сохранять видео, соответствующее декодированному потоку битов. Помимо этого, запоминающее устройство 262 может сохранять программу для инструктирования схеме 260 декодировать видео.
[0517] Кроме того, например, запоминающее устройство 262 может выполнять функции, из множества составляющих элементов декодера 200, проиллюстрированного на фиг. 41 и т.д., составляющих элементов, которые сохраняют информацию. В частности, запоминающее устройство 262 может выполнять функции запоминающего устройства 210 блоков и запоминающего устройства 214 кинокадров, проиллюстрированных на фиг. 41. Более конкретно, запоминающее устройство 262 может сохранять, например, восстановленный блок и восстановленный кадр.
[0518] Следует отметить, что не все из множества составляющих элементов, проиллюстрированных на фиг. 41 и т.д., должны обязательно реализовываться посредством декодера 200, и не все процессы, описанные выше, должны выполняться посредством декодера 200. Некоторые из множества составляющих элементов, проиллюстрированных на фиг. 41 и т.д., могут включаться в другое устройство, и некоторые процессы, описанные выше, могут выполняться посредством другого устройства. Компенсация движения эффективно выполняется посредством декодера 200, реализующего некоторые из множества составляющих элементов, проиллюстрированных на фиг. 41 и т.д., и выполняющего некоторые процессы, описанные выше.
[0519] Далее описывается пример операций, выполняемых посредством декодера 200, проиллюстрированного на фиг. 54. Фиг. 55 является блок-схемой последовательности операций способа, иллюстрирующей пример операций, выполняемых посредством декодера 200, проиллюстрированного на фиг. 54. Например, декодер 200, проиллюстрированный на фиг. 54, выполняет операции, проиллюстрированные на фиг. 55, при декодировании видео.
[0520] В частности, схема 260 декодера 200, при работе, выполняет следующие процессы. Во-первых, схема 260 выбирает первую таблицу, которая должна использоваться для текущего сегмента, который должен декодироваться в изображении видео, из множества таблиц, которые используются для того, чтобы корректировать базовый вектор движения в предварительно определенном направлении с использованием значения коррекции, указываемого посредством индекса, причем множество таблиц включают в себя значения коррекции, имеющие варьирующиеся разности между индексами (S411). Затем, схема 260 синтаксически анализирует параметр, указывающий первый индекс, который должен выбираться из числа индексов, включенных в первую таблицу (S412). Затем схема 260 декодирует текущий сегмент с использованием базового вектора движения, скорректированного с использованием значения коррекции, указываемого посредством первого индекса (S413).
[0521] Вследствие этого, декодер 200 может повышать производительность кодирования процесса взаимного прогнозирования посредством использования процесса выбора вектора движения в процессе извлечения векторов движения, когда процесс извлечения векторов движения используется в процессе взаимного прогнозирования. Соответственно, декодер 200 может повышать эффективность кодирования.
[0522] Дополнительная информация
Кодер 100 и декодер 200 согласно настоящему варианту осуществления могут использоваться в качестве кодера изображений и декодера изображений либо могут использоваться в качестве видеокодера и видеодекодера. Альтернативно, кодер 100 и декодер 200 могут использоваться в качестве устройства взаимного прогнозирования (устройства межкадрового прогнозирования).
[0523] Другими словами, кодер 100 и декодер 200 могут соответствовать только модулю 126 взаимного прогнозирования (модулю межкадрового прогнозирования) и модулю 218 взаимного прогнозирования (модулю межкадрового прогнозирования), соответственно. Другие составляющие элементы, такие как преобразователь 106 и обратный преобразователь 206 могут включаться в другое устройство.
[0524] В настоящем варианте осуществления, каждый из составляющих элементов может быть сконфигурирован в форме специализированного аппаратного продукта либо может реализовываться посредством выполнения программно-реализованной программы, подходящей для составляющего элемента. Каждый из составляющих элементов может реализовываться посредством модуля выполнения программ, такого как CPU и процессор, считывающий и выполняющий программно-реализованную программу, записанную на носителе записи, таком как жесткий диск или полупроводниковое запоминающее устройство.
[0525] В частности, кодер 100 и декодер 200 могут включать в себя схему обработки и устройство хранения данных, электрически соединенное со схемой обработки и доступное из схемы обработки. Например, схема обработки является эквивалентной схеме 160 или 260, и устройство хранения данных является эквивалентным запоминающему устройству 162 или 262.
[0526] Схема обработки включает в себя, по меньшей мере, одно из специализированного аппаратного продукта или модуля выполнения программ и выполняет обработку с использованием устройства хранения данных. Когда схема обработки включает в себя модуль выполнения программ, устройство хранения данных сохраняет программно-реализованную программу, выполняемую посредством модуля выполнения программ.
[0527] Здесь, программное обеспечение для реализации, например, кодера 100 или декодера 200 согласно настоящему варианту осуществления включает в себя программу, как указано ниже.
[0528] В частности, программа может инструктировать компьютеру осуществлять способ кодирования для кодирования видео, причем способ кодирования включает в себя: выбор первой таблицы, которая должна использоваться для текущего сегмента, который должен кодироваться в изображении видео, из числа таблиц, которые используются для того, чтобы корректировать базовый вектор движения в предварительно определенном направлении с использованием значения коррекции, указываемого посредством индекса, причем таблицы включают в себя значения коррекции, имеющие варьирующиеся разности между индексами; запись параметра, указывающего первый индекс, который должен выбираться из числа индексов, включенных в первую таблицу; и кодирование текущего сегмента с использованием базового вектора движения, скорректированного с использованием значения коррекции, указываемого посредством первого индекса.
[0529] Альтернативно, программа может инструктировать компьютеру осуществлять способ декодирования для декодирования видео, причем способ декодирования включает в себя: выбор первой таблицы, которая должна использоваться для текущего сегмента, который должен декодироваться в изображении видео, из числа таблиц, которые используются для того, чтобы корректировать базовый вектор движения в предварительно определенном направлении с использованием значения коррекции, указываемого посредством индекса, причем таблицы включают в себя значения коррекции, имеющие варьирующиеся разности между индексами; синтаксический анализ параметра, указывающего первый индекс, который должен выбираться из числа индексов, включенных в первую таблицу; и декодирование текущего сегмента с использованием базового вектора движения, скорректированного с использованием значения коррекции, указываемого посредством первого индекса.
[0530] Составляющие элементы могут представлять собой схемы, как описано выше. Схемы могут составлять схему в целом или могут представлять собой отдельные схемы. Каждый составляющий элемент может реализовываться посредством общего процессора либо может реализовываться посредством специализированного процессора.
[0531] Кроме того, обработка, выполняемая посредством конкретного составляющего элемента, может выполняться посредством другого составляющего элемента. Порядок выполнения обработки может модифицироваться, или множество процессов могут выполняться параллельно. Кроме того, устройство кодирования и декодирования может включать в себя кодер 100 и декодер 200.
[0532] Порядковые числа, такие как "первый" и "второй", используемые в описании, могут изменяться надлежащим образом. Новое порядковое число может предоставляться составляющим элементам и т.д., или порядковые числа составляющих элементов могут удаляться.
[0533] Хотя некоторые аспекты кодера 100 и декодера 200 описываются выше на основе варианта осуществления, аспекты кодера 100 и декодера 200 не ограничены этим вариантом осуществления. Различные модификации настоящего варианта осуществления, которые являются возможными для специалистов в данной области техники, а также варианты осуществления, получающиеся в результате комбинаций составляющих элементов в различных вариантах осуществления, могут быть включены в пределы объема аспектов кодера 100 и декодера 200 до тех пор, пока они не отступают от сущности настоящего раскрытия сущности.
[0534] Один или более аспектов, раскрытых в данном документе, могут выполняться посредством комбинирования, по меньшей мере, части других аспектов в настоящем раскрытии сущности. Помимо этого, один или более аспектов, раскрытых в данном документе, могут выполняться посредством комбинирования, с другими аспектами, части процессов, указываемых на любой из блок-схем последовательности операций способа согласно аспектам, части конфигурации любого из устройств, части синтаксисов и т.д.
[0535] Вариант 2 осуществления
Реализации и варианты применения
Как описано в каждом из вышеописанных вариантов осуществления, каждый функциональный или рабочий блок типично может реализовываться, например, в качестве MPU (микропроцессора) и запоминающего устройства. Кроме того, процессы, выполняемые посредством каждого из функциональных блоков, могут реализовываться в качестве модуля выполнения программ, такого как процессор, который считывает и выполняет программное обеспечение (программу), записанное на носителе записи, таком как ROM. Программное обеспечение может быть распределенным. Программное обеспечение может записываться на множестве носителей записи, таких как полупроводниковое запоминающее устройство. Следует отметить, что каждый функциональный блок также может реализовываться в качестве аппаратных средств (специализированной схемы). Могут использоваться различные комбинации аппаратных средств и программного обеспечения.
[0536] Кроме того, обработка, описанная в каждом из вариантов осуществления, может реализовываться через интегрированную обработку с использованием одного оборудования (системы) и, альтернативно, может реализовываться через децентрализованную обработку с использованием множества элементов оборудования. Кроме того, процессор, который выполняет вышеописанную программу, может представлять собой один процессор или множество процессоров. Другими словами, может выполняться интегрированная обработка, и, альтернативно, может выполняться децентрализованная обработка.
[0537] Варианты осуществления настоящего раскрытия сущности не ограничены вышеуказанными примерными вариантами осуществления; различные модификации могут вноситься в примерные варианты осуществления, результаты которых также включаются в пределы объема вариантов осуществления настоящего раскрытия сущности.
[0538] Далее описываются примеры вариантов применения способа кодирования движущихся кадров (способа кодирования изображений) и способа декодирования движущихся кадров (способа декодирования изображений), описанных в каждом из вышеуказанных вариантов осуществления, а также различных систем, которые реализуют примеры вариантов применения. Такая система может характеризоваться как включающая в себя кодер изображений, который использует способ кодирования изображений, декодер изображений, который использует способ декодирования изображений, и кодер-декодер изображений, который включает в себя как кодер изображений, так и декодер изображений. Другие конфигурации такой системы могут модифицироваться для каждого отдельного случая.
[0539] Примеры использования
Фиг. 56 иллюстрирует общую конфигурацию системы ex100 предоставления контента, подходящей для реализации услуги распространения контента. Зона, в которой предоставляется услуга связи, разделяется на соты требуемых размеров, и базовые станции ex106, ex107, ex108, ex109 и ex110, которые представляют собой стационарные беспроводные станции в проиллюстрированном примере, расположены в соответствующих сотах.
[0540] В системе ex100 предоставления контента, устройства, включающие в себя компьютер ex111, игровое устройство ex112, камеру ex113, бытовой прибор ex114 и смартфон ex115, соединяются с Интернетом ex101 через поставщика ex102 Интернет-услуг или сеть ex104 связи и базовые станции ex106-ex110. Система ex100 предоставления контента может комбинировать и соединять любую комбинацию вышеуказанных устройств. В различных реализациях, устройства могут прямо или косвенно соединяться между собой через телефонную сеть или связь ближнего радиуса действия, а не через базовые станции ex106-ex110. Дополнительно, потоковый сервер ex103 может соединяться с устройствами, включающими в себя компьютер ex111, игровое устройство ex112, камеру ex113, бытовой прибор ex114 и смартфон ex115, например, через Интернет ex101. Потоковый сервер ex103 также может соединяться, например, с терминалом в публичной точке доступа в самолете ex117 через спутник ex116.
[0541] Следует отметить, что вместо базовых станций ex106-ex110, могут использоваться точки беспроводного доступа или публичные точки доступа. Потоковый сервер ex103 может соединяться с сетью ex104 связи непосредственно, а не через Интернет ex101 или поставщика ex102 Интернет-услуг, и может соединяться с самолетом ex117 непосредственно, а не через спутник ex116.
[0542] Камера ex113 представляет собой устройство, допускающее захват неподвижных изображений и видео, к примеру, цифровую камеру. Смартфон ex115 представляет собой смартфон, сотовый телефон или телефон по стандарту системы персональных мобильных телефонов (PHS), который может работать согласно стандартам системы мобильной связи для 2G-, 3G-, 3,9G- и 4G-систем, а также 5G-системы следующего поколения.
[0543] Бытовой прибор ex114, например, представляет собой холодильник или устройство, включенное в домашнюю систему совместной выработки тепла и электроэнергии на топливных элементах.
[0544] В системе ex100 предоставления контента, терминал, включающий в себя функцию захвата изображений и/или видео, допускает, например, потоковую передачу вживую посредством соединения с потоковым сервером ex103, например, через базовую станцию ex106. При потоковой передаче вживую, терминал (например, компьютер ex111, игровое устройство ex112, камера ex113, бытовой прибор ex114, смартфон ex115 или терминал в самолете ex117) может выполнять обработку кодирования, описанную в вышеприведенных вариантах осуществления, для контента неподвижных изображений или видеоконтента, захваченного пользователем через терминал, может мультиплексировать видеоданные, полученные через кодирование, и аудиоданные, полученные посредством кодирования аудио, соответствующего видео, и может передавать полученные данные на потоковый сервер ex103. Другими словами, терминал функционирует в качестве кодера изображений согласно одному аспекту настоящего раскрытия сущности.
[0545] Потоковый сервер ex103 передает в потоковом режиме передаваемые данные контента в клиенты, которые запрашивают поток. Примеры клиента включают в себя компьютер ex111, игровое устройство ex112, камеру ex113, бытовой прибор ex114, смартфон ex115 и терминалы в самолете ex117, которые допускают декодирование вышеописанных кодированных данных. Устройства, которые принимают передаваемые в потоковом режиме данные, могут декодировать и воспроизводить принимаемые данные. Другими словами, устройства могут функционировать в качестве декодера изображений согласно одному аспекту настоящего раскрытия сущности.
[0546] Децентрализованная обработка
Потоковый сервер ex103 может реализовываться в качестве множества серверов или компьютеров, между которыми разделяются такие задачи, как обработка, запись и потоковая передача данных. Например, потоковый сервер ex103 может реализовываться в качестве сети доставки контента (CDN), которая передает в потоковом режиме контент через сеть, соединяющую несколько краевых серверов, расположенных по всему миру. В CDN, краевой сервер физически около клиента может динамически назначаться клиенту. Контент кэшируется и передается в потоковом режиме на краевой сервер, чтобы уменьшать время загрузки. В случае, например, определенного типа ошибки или изменения подключения, например, вследствие пика в трафике, можно передавать в потоковом режиме данные стабильно на высоких скоростях, поскольку можно избегать затрагиваемых частей сети, например, посредством разделения обработки между множеством краевых серверов или переключения нагрузок потоковой передачи на другой краевой сервер и продолжения потоковой передачи.
[0547] Децентрализация не ограничена просто разделением обработки для потоковой передачи; кодирование захваченных данных может разделяться между и выполняться посредством терминалов, на серверной стороне либо обоими способами. В одном примере, при типичном кодировании, обработка выполняется в двух контурах. Первый контур служит для обнаружения того, насколько усложненным является изображение, на покадровой или посценовой основе либо для обнаружения нагрузки при кодировании. Второй контур служит для обработки, которая поддерживает качество изображений и повышает эффективность кодирования. Например, можно снижать нагрузку по обработке терминалов и повышать качество и эффективность кодирования контента за счет инструктирования терминалам выполнять первый контур кодирования и инструктирования серверной стороне, которая принимает контент, выполнять второй контур кодирования. В таком случае, при приеме запроса на декодирование, кодированные данные, получающиеся в результате первого контура, выполняемого посредством одного терминала, могут приниматься и воспроизводиться на другом терминале приблизительно в реальном времени. Это позволяет реализовывать плавную потоковую передачу в режиме реального времени.
[0548] В другом примере, камера ex113 и т.п. извлекает количество признаков (количество признаков или характеристик) из изображения, сжимает данные, связанные с количеством признаков, в качестве метаданных, и передает сжатые метаданные на сервер. Например, сервер определяет значимость объекта на основе количества признаков и изменяет точность квантования, соответственно, чтобы выполнять сжатие, подходящее для смыслового значения (или значимости контента) изображения. Данные количества признаков являются особенно эффективными при повышении точности и эффективности прогнозирования векторов движения во время второго прохода сжатия, выполняемого посредством сервера. Кроме того, кодирование, которое имеет относительно низкую нагрузку по обработке, такое как кодирование переменной длины (VLC), может обрабатываться посредством терминала, и кодирование, которое имеет относительно высокую нагрузку по обработке, такое как контекстно-адаптивное двоичное арифметическое кодирование (CABAC), может обрабатываться посредством сервера.
[0549] В еще одном другом примере, возникают случаи, в которых множество видео приблизительно идентичной сцены захватываются посредством множества терминалов, например, на стадионе, в торговом центре или на фабрике. В таком случае, например, кодирование может быть децентрализовано посредством разделения задач обработки между множеством терминалов, которые захватывают видео, и, при необходимости, другими терминалами, которые не захватывают видео, и сервером в расчете на единицу. Единицы, например, могут представлять собой группы кадров (GOP), кадры или плитки, получающиеся в результате разделения кадра. Это позволяет уменьшать время загрузки и достигать потоковой передачи, которая находится ближе к реальному времени.
[0550] Поскольку видео имеют приблизительно идентичную сцену, управление и/или инструкции могут выполняться посредством сервера таким образом, что на видео, захваченные посредством терминалов, можно перекрестно ссылаться. Кроме того, сервер может принимать кодированные данные из терминалов, изменять опорную взаимосвязь между элементами данных либо корректировать или заменять непосредственно кадры и затем выполнять кодирование. Это позволяет формировать поток с увеличенным качеством и эффективностью для отдельных элементов данных.
[0551] Кроме того, сервер может передавать в потоковом режиме видеоданные после выполнения транскодирования, чтобы преобразовывать формат кодирования видеоданных. Например, сервер может преобразовывать формат кодирования из MPEG в VP (например, VP9), может преобразовывать H.264 в H.265 и т.д.
[0552] Таким образом, кодирование может выполняться посредством терминала или одного или более серверов. Соответственно, хотя устройство, которое выполняет кодирование, называется "сервером" или "терминалом" в нижеприведенном описании, некоторые или все процессы, выполняемые посредством сервера, могут выполняться посредством терминала, и аналогично некоторые или все процессы, выполняемые посредством терминала, могут выполняться посредством сервера. Это также применяется к процессам декодирования.
[0553] Трехмерный многоракурсный режим
Происходит увеличение использования изображений или видео, комбинированных из изображений или видео различных сцен, параллельно захваченных, либо идентичной сцены, захваченной из различных углов посредством множества терминалов, таких как камера ex113 и/или смартфон ex115. Видео, захваченное посредством терминалов, может комбинироваться, например, на основе отдельно полученной относительной позиционной взаимосвязи между терминалами или областями в видео, имеющими совпадающие характерные точки.
[0554] В дополнение к кодированию двумерных движущихся кадров, сервер может кодировать неподвижное изображение на основе анализа сцен движущегося кадра, автоматически либо в момент времени, указываемый пользователем, и передавать кодированное неподвижное изображение в приемный терминал. Кроме того, когда сервер может получать относительную позиционную взаимосвязь между терминалами захвата видео, в дополнение к двумерным движущимся кадрам, сервер может формировать трехмерную геометрию сцены на основе видео идентичной сцены, захваченной из различных углов. Сервер может отдельно кодировать трехмерные данные, сформированные, например, из облака точек, и, на основе результата распознавания или отслеживания человека или объекта с использованием трехмерных данных, может выбирать или восстанавливать и формировать видео, которые должно передаваться в приемный терминал, из видео, захваченных посредством множества терминалов.
[0555] Это обеспечивает возможность пользователю пользоваться сценой посредством свободного выбора видео, соответствующих терминалам захвата видео, и обеспечивает возможность пользователю пользоваться контентом, полученным посредством извлечения видео в выбранной точке обзора из трехмерных данных, восстановленных из множества изображений или видео, видео. Кроме того, аналогично видео, звук может записываться из относительно различных углов, и сервер может мультиплексировать аудио из конкретного угла или пространства с соответствующим видео и передавать мультиплексированное видео и аудио.
[0556] В последние годы, также становится популярным контент, который представляет собой составной объект из реального мира и виртуального мира, к примеру, контент в стиле виртуальной реальности (VR) и дополненной реальности (AR). В случае VR-изображений, сервер может создавать изображения из точек обзора левого и правого глаза и выполнять кодирование, которое допускает ссылку между двумя изображениями точек обзора, такое как многовидовое кодирование (MVC), и альтернативно, может кодировать изображения в качестве отдельных потоков без ссылки. Когда изображения декодируются в качестве отдельных потоков, потоки могут синхронизироваться при воспроизведении таким образом, чтобы воссоздавать виртуальное трехмерное пространство в соответствии с точкой обзора пользователя.
[0557] В случае AR-изображений, сервер может накладывать информацию виртуальных объектов, существующую в виртуальном пространстве, на информацию камеры, представляющую пространство реального мира, на основе трехмерной позиции или перемещения с точки зрения пользователя. Декодер может получать или сохранять информацию виртуальных объектов и трехмерные данные, формировать двумерные изображения на основе перемещения с точки зрения пользователя и затем формировать наложенные данные посредством прозрачного соединения изображений. Альтернативно, декодер может передавать, в сервер, движение с точки зрения пользователя в дополнение к запросу на информацию виртуальных объектов. Сервер может формировать наложенные данные на основе трехмерных данных, сохраненных на сервере в соответствии с принимаемым движением, и кодировать и передавать в потоковом режиме сформированные наложенные данные в декодер. Следует отметить, что наложенные данные типично включают в себя, в дополнение к RGB-значениям, значение α, указывающее прозрачность, и сервер задает значение α для секций, отличных от объекта, сформированного из трехмерных данных, например, равным 0, и может выполнять кодирование в то время, когда эти секции являются прозрачными. Альтернативно, сервер может задавать фон как определенное RGB-значение, такое как цветовая рирпроекция, и формировать данные, в которых зоны, отличные от объекта, задаются в качестве фона. Определенное RGB-значение может быть предварительно определено.
[0558] Декодирование аналогично передаваемых в потоковом режиме данных может выполняться посредством клиента (к примеру, терминалов), на серверной стороне либо разделяться между ними. В одном примере, один терминал может передавать запрос на прием на сервер, запрошенный контент может приниматься и декодироваться посредством другого терминала, и декодированный сигнал может передаваться в устройство, имеющее дисплей. Можно воспроизводить данные с высоким качеством изображений посредством децентрализации обработки и надлежащего выбора контента независимо от характеристик обработки непосредственно терминала связи. В еще одном другом примере, в то время как телевизор, например, принимает данные изображений, которые имеют большой размер, область кадра, такая как плитка, полученная посредством разделения кадра, может декодироваться и отображаться на персональном терминале или терминалах зрителя или зрителей телевизора. Это позволяет зрителям совместно использовать вид с большими кадрами, а также каждому зрителю проверять свою назначенную зону или обследовать область более подробно крупным планом.
[0559] В ситуациях, в которых множество беспроводных соединений являются возможными на небольшие, средние и большие расстояния, в помещениях или вне помещений, может быть возможным прозрачно принимать контент с использованием стандарта системы потоковой передачи, такого как MPEG DASH. Пользователь может переключаться между данными в реальном времени при свободном выборе декодера или оборудования отображения, включающего в себя терминал пользователя, дисплеи, размещаемые в помещениях или вне помещений, и т.д. Кроме того, например, с использованием информация относительно позиции пользователя, декодирование может выполняться при переключении того, какой терминал обрабатывает декодирование, а какой терминал обрабатывает отображение контента. Это позволяет преобразовывать и отображать информацию в то время, когда пользователь находится в движении на маршруте в пункт назначения, на стене близлежащего здания, в которое встраивается устройство, допускающее отображение контента, или на части земли. Кроме того, также можно переключать скорость передачи битов принимаемых данных на основе достижимости для кодированных данных по сети, к примеру, когда кодированные данные кэшируются на сервере, быстро доступном из приемного терминала, либо когда кодированные данные копируются на краевой сервер в службе доставки контента.
[0560] Масштабируемое кодирование
В дальнейшем описывается переключение контента со ссылкой на масштабируемый поток, проиллюстрированный на фиг. 57, который кодируется со сжатием через реализацию способа кодирования движущихся кадров, описанного в вышеприведенных вариантах осуществления. Сервер может иметь конфигурацию, в которой контент переключается при использовании временной и/или пространственной масштабируемости потока, которая достигается посредством разделения на и кодирования слоев, как проиллюстрировано на фиг. 57. Следует отметить, что может быть предусмотрено множество отдельных потоков, которые имеют идентичный контент, но различное качество. Другими словами, посредством определения того, какой слой следует декодировать, на основе внутренних факторов, таких как характеристики обработки на стороне декодера, и внешних факторов, таких как полоса пропускания линий связи, сторона декодера может свободно переключаться между контентом низкого разрешения и контентом высокого разрешения при декодировании. Например, в случае, в котором пользователь хочет продолжать просмотр, например, дома на устройстве, таком как телевизор, соединенный с Интернетом, видео, которое пользователь ранее смотрел на смартфоне ex115 в движении, устройство может просто декодировать идентичный поток вплоть до другого слоя, что уменьшает нагрузку на серверной стороне.
[0561] Кроме того, в дополнение к конфигурации, описанной выше, в которой масштабируемость достигается в результате кодирования кадров в расчете на слой, при этом улучшающий слой находится выше базового слоя, улучшающий слой может включать в себя метаданные, например, на основе статистической информации относительно изображения. Сторона декодера может формировать контент с высоким качеством изображений посредством выполнения формирования изображений со сверхразрешением для кадра в базовом слое на основе метаданных. Формирование изображений со сверхразрешением может улучшать SN-отношение при поддержании разрешения и/или увеличении разрешения. Метаданные включают в себя информацию для идентификации коэффициента линейной или нелинейной фильтрации, используемого при обработке на основе сверхразрешения, либо информацию, идентифицирующую значение параметра при обработке с помощью фильтра, машинном обучении или методе наименьших квадратов, используемом при обработке на основе сверхразрешения.
[0562] Альтернативно, может предоставляться конфигурация, в которой кадр разделяется, например, на плитки, например, в соответствии со смысловым значением объекта в изображении. На стороне декодера, только частичная область декодируется посредством выбора плитки для декодирования. Дополнительно, посредством сохранения атрибута объекта (человека, автомобиля, мяча и т.д.) и позиции объекта в видео (координат в идентичных изображениях) в качестве метаданных, сторона декодера может идентифицировать позицию требуемого объекта на основе метаданных и определять то, какая плитка или плитки включают в себя этот объект. Например, как проиллюстрировано на фиг. 58, метаданные могут сохраняться с использованием структуры хранения данных, отличающейся от пиксельных данных, такой как сообщение с SEI (дополнительной улучшающей информацией) в HEVC. Эти метаданные указывают, например, позицию, размер или цвет основного объекта.
[0563] Метаданные могут сохраняться в единицах множества кадров, таких как поток, последовательность или единицы произвольного доступа. Сторона декодера может получать, например, время, в которое конкретный человек появляется в видео, и посредством подгонки информации времени к информации единицы кадров, может идентифицировать кадр, в котором присутствует объект, и может определять позицию объекта в кадре.
[0564] Оптимизация веб-страниц
Фиг. 59, например, иллюстрирует пример экрана отображения веб-страницы на компьютере ex111. Фиг. 60, например, иллюстрирует пример экрана отображения веб-страницы на смартфоне ex115. Как проиллюстрировано на фиг. 59 и фиг. 60, веб-страница может включать в себя множество ссылок на изображения, которые представляют собой ссылки на контент изображений, и внешний вид веб-страницы может отличаться в зависимости от устройства, используемого для того, чтобы просматривать веб-страницу. Когда множество ссылок на изображения являются просматриваемыми на экране до тех пор, пока пользователь явно не выбирает ссылку на изображение, либо до тех пор, пока ссылка на изображение не находится в аппроксимированном центре экрана, или полная ссылка на изображение не вписывается в экран, оборудование отображения (декодер) может отображать, в качестве ссылок на изображения, неподвижные изображения, включенные в контент, или I-кадры, может отображать видео, такое как анимированный GIF-файл с использованием множества неподвижных изображений или I-кадров, например, либо может принимать только базовый слой и декодировать и отображать видео.
[0565] Когда ссылка на изображение выбирается пользователем, оборудование отображения выполняет декодирование, например, при предоставлении наивысшего приоритета для базового слоя. Следует отметить, что если имеется информация в HTML-коде веб-страницы, указывающая то, что контент является масштабируемым, оборудование отображения может декодировать вплоть до улучшающего слоя. Дополнительно, чтобы гарантировать воспроизведение в реальном времени, до того, как осуществляется выбор, либо когда полоса пропускания сильно ограничивается, оборудование отображения может уменьшать задержку между моментом времени, в который декодируется опережающий кадр, и моментом времени, в который отображается декодированный кадр (т.е. задержку от начала декодирования контента до отображения контента) посредством декодирования и отображения только прямых опорных кадров (I-кадра, P-кадра, прямого опорного B-кадра). Еще дополнительно, оборудование отображения может намеренно игнорировать опорную взаимосвязь между кадрами и приблизительно декодировать все B- и P- кадры в качестве прямых опорных кадров и затем выполнять нормальное декодирование по мере того, как число кадров, принимаемых во времени, увеличивается.
[0566] Автономное вождение
При передаче и приеме в данных неподвижных изображений или видеоданных, таких как двух- или трехмерная картографическая информация для автономного вождения или вождения с использованием помощи автомобиля, приемный терминал может принимать, в дополнение к данным изображений, принадлежащим одному или более слоев, информацию, например, относительно погоды или дорожных работ в качестве метаданных, и ассоциировать метаданные с данными изображений при декодировании. Следует отметить, что метаданные могут назначаться в расчете на слой и, альтернативно, могут просто мультиплексироваться с данными изображений.
[0567] В таком случае, поскольку автомобиль, беспилотный аппарат, самолет и т.д., содержащий приемный терминал, является мобильным, приемный терминал может прозрачно принимать и выполнять декодирование при переключении между базовыми станциями из числа базовых станций ex106-ex110 посредством передачи информации, указывающей позицию приемного терминала. Кроме того, в соответствии с выбором, осуществленным пользователем, ситуацией пользователя и/или полосой пропускания соединения, приемный терминал может динамически выбирать то, до какой степени принимаются метаданные, либо то, до какой степени, например, обновляется картографическая информация.
[0568] В системе ex100 предоставления контента, клиент может принимать, декодировать и воспроизводить, в реальном времени, кодированную информацию, передаваемую пользователем.
[0569] Потоковая передача контента от людей
В системе ex100 предоставления контента, в дополнение к длительному контенту с высоким качеством изображений, распространяемому посредством объекта распространения видео, одноадресная или многоадресная потоковая передача короткого контента с низким качеством изображений от человека также является возможной. Популярность такого контента от людей с большой вероятностью должна еще более возрастать. Сервер может сначала выполнять обработку редактирования для контента перед обработкой кодирования, чтобы уточнять контент от людей. Это может достигаться, например, с использованием следующей конфигурации.
[0570] В реальном времени, при захвате видеоконтента или контента изображений либо после того, как контент захвачен и накоплен, сервер выполняет обработку распознавания на основе необработанных данных или кодированных данных, такую как обработка ошибок при захвате, обработка поиска сцен, анализ смысловых значений и/или обработка обнаружения объектов. После этого, на основе результата обработки распознавания сервер (при указании или автоматически) редактирует контент, примеры чего включают в себя: коррекцию, такую как коррекция фокуса и/или размытости при движении; удаление сцен с низким приоритетом, таких как сцены, которые имеют низкую яркость по сравнению с другими кадрами или находятся не в фокусе; регулирование краев объектов; и регулирование цветовых тонов. Сервер кодирует отредактированные данные на основе результата редактирования. Известно, что чрезмерно длительные видео имеют тенденцию принимать меньшее число видов. Соответственно, чтобы поддерживать контент в пределах конкретной продолжительности, которая масштабируется с продолжительностью исходного видео, сервер может, в дополнение к сценам с низким приоритетом, описанным выше, автоматически вырезать сцены с незначительным перемещением на основе результата обработки изображений. Альтернативно, сервер может формировать и кодировать видеодайджест на основе результата анализа смыслового значения сцены.
[0571] Могут возникать случаи, в которых контент от людей может включать в себя контент, который нарушает авторское право, моральное право, книжные права и т.д. Такой случай может приводить к нежелательной ситуации для создателя, к примеру, когда контент совместно используется за пределами объема, намеченного создателем. Соответственно, перед кодированием, сервер, например, может редактировать изображения таким образом, чтобы, например, размывать лица людей на периферии экрана или размывать внутреннюю часть дома. Дополнительно, сервер может быть выполнен с возможностью распознавать лица людей, отличных от зарегистрированного человека, в изображениях, которые должны кодироваться, и когда такие лица появляются в изображении, может применять мозаичный фильтр, например, к лицу человека. Альтернативно, в качестве предварительной обработки или постобработки для кодирования, пользователь может указывать, по причинам авторского права, область изображения, включающую в себя человека, или область фона, которая должна обрабатываться. Сервер может обрабатывать указанную область, например, посредством замены области другим изображением или размытия области. Если область включает в себя человека, человек может отслеживаться в движущемся кадре, и область головы пользователя может заменяться другим изображением по мере того, как человек перемещается.
[0572] Поскольку имеется спрос на просмотр в реальном времени контента, сформированного людьми, который зачастую имеет небольшой размер данных, декодер сначала может принимать базовый слой в качестве наивысшего приоритета и выполнять декодирование и воспроизведение, хотя это может отличаться в зависимости от полосы пропускания. Когда контент воспроизводится два или более раз, к примеру, когда декодер принимает улучшающий слой во время декодирования и воспроизведения базового слоя и циклично выполняет воспроизведение, декодер может воспроизводить видео с высоким качеством изображений, включающее в себя улучшающий слой. Если поток кодируется с использованием такого масштабируемого кодирования, видео может быть низкокачественным в невыбранном состоянии или в начале видео, но оно может предлагать восприятие, в котором качество изображений потока постепенно увеличивается интеллектуальным способом. Это не ограничено просто масштабируемым кодированием; идентичное восприятие может предлагаться посредством конфигурирования одного потока из низкокачественного потока, воспроизведенного в первый раз, и второго потока, кодированного с использованием первого потока в качестве опорного.
[0573] Другие примеры реализации и вариантов применения
Кодирование и декодирование может выполняться посредством LSI ex500 (большой интегральной схемы) (см. фиг. 56), которая типично включается в каждый терминал. LSI ex500 может быть сконфигурирована из одной микросхемы или множества микросхем. Программное обеспечение для кодирования и декодирования движущихся кадров может интегрироваться в некоторый тип носителя записи (такой как CD-ROM, гибкий диск или жесткий диск), который является считываемым, например, посредством компьютера ex111, и кодирование и декодирование могут выполняться с использованием программного обеспечения. Кроме того, когда смартфон ex114 оснащен камерой, могут передаваться видеоданные, полученные посредством камеры. В этом случае, видеоданные могут кодироваться посредством LSI ex500, включенной в смартфон ex115.
[0574] Следует отметить, что LSI ex500 может быть выполнена с возможностью загружать и активировать приложение. В таком случае, терминал сначала определяет то, является он или нет совместимым со схемой, используемой для того, чтобы кодировать контент, либо то, допускает он или нет выполнение конкретной услуги. Когда терминал не является совместимым со схемой кодирования контента, либо когда терминал не допускает выполнение конкретной услуги, терминал сначала может загружать кодек или прикладное программное обеспечение, а затем получать и воспроизводить контент.
[0575] Помимо примера системы ex100 предоставления контента, которая использует Интернет ex101, по меньшей мере, кодер движущихся кадров (кодер изображений) или декодер движущихся кадров (декодер изображений), описанные в вышеприведенных вариантах осуществления, могут реализовываться в цифровой широковещательной системе. Идентичная обработка кодирования и обработка декодирования могут применяться для того, чтобы передавать и принимать широковещательные радиоволны, накладываемые с мультиплексированными аудио- и видеоданными, с использованием, например, спутника, даже если она приспосабливается к многоадресной передаче, тогда как одноадресная передача осуществляется проще с системой ex100 предоставления контента.
[0576] Аппаратная конфигурация
Фиг. 61 иллюстрирует дополнительные сведения относительно смартфона ex115, показанного на фиг. 56. Фиг. 62 иллюстрирует пример конфигурации смартфона ex115. Смартфон ex115 включает в себя антенну ex450 для передачи и приема радиоволн в/из базовой станции ex110, камеру ex465, допускающую захват видео и неподвижных изображений, и дисплей ex458, который отображает декодированные данные, такие как видео, захваченное посредством камеры ex465, и видео, принимаемое посредством антенны ex450. Смартфон ex115 дополнительно включает в себя пользовательский интерфейс ex466, такой как сенсорная панель, модуль ex457 аудиовывода, такой как динамик для вывода речи или другого аудио, модуль ex456 аудиоввода, такой как микрофон для аудиоввода, запоминающее устройство ex467, допускающее сохранение декодированных данных, таких как захваченные видео или неподвижные изображения, записанное аудио, принимаемые видео или неподвижные изображения и почтовые сообщения, а также декодированные данные, и гнездо ex464, которое представляет собой интерфейс для SIM-карты ex468 для авторизации доступа к сети и различным данным. Следует отметить, что внешнее запоминающее устройство может использоваться вместо запоминающего устройства ex467.
[0577] Главный контроллер ex460, который может всесторонне управлять дисплеем ex458 и пользовательским интерфейсом ex466, схема ex461 подачи мощности, контроллер ex462 ввода из пользовательского интерфейса, процессор ex455 видеосигналов, интерфейс ex463 камеры, контроллер ex459 отображения, модулятор/демодулятор ex452, мультиплексор/демультиплексор ex453, процессор ex454 аудиосигналов, гнездо ex464 и запоминающее устройство ex467 соединяются через шину ex470.
[0578] Когда пользователь включает кнопку питания схемы ex461 подачи мощности, смартфон ex115 включается в работоспособное состояние, и каждый компонент снабжается мощностью из аккумуляторного блока.
[0579] Смартфон ex115 выполняет обработку, например, для вызовов и передачи данных, на основе управления, выполняемого посредством главного контроллера ex460, который включает в себя CPU, ROM и RAM. При выполнении вызовов, аудиосигнал, записанный посредством модуля ex456 аудиоввода, преобразуется в цифровой аудиосигнал посредством процессора ex454 аудиосигналов, к которому применяется обработка с расширенным спектром посредством модулятора/демодулятора ex452 и применяется обработка цифро-аналогового преобразования и преобразования частоты посредством приемо-передающего устройства ex451, и результирующий сигнал передается через антенну ex450. Принимаемые данные усиливаются, преобразуются по частоте и подвергаются аналого-цифровому преобразованию, подвергаются обратной обработке с расширенным спектром посредством модулятора/демодулятора ex452, преобразуются в аналоговый аудиосигнал посредством процессора ex454 аудиосигналов и затем выводятся из модуля ex457 аудиовывода. В режиме передачи данных, текст, данные неподвижных изображений или видеоданные могут передаваться, например, под управлением главного контроллера ex460 через контроллер ex462 ввода из пользовательского интерфейса на основе операции пользовательского интерфейса ex466 основного корпуса. Аналогичная обработка передачи и приема выполняется. В режиме передачи данных, при отправке видео, неподвижного изображения или видео и аудио, процессор ex455 видеосигналов кодирует со сжатием, через способ кодирования движущихся кадров, описанный в вышеприведенных вариантах осуществления, видеосигнал, сохраненный в запоминающем устройстве ex467, или видеосигнал, вводимый из камеры ex465, и передает кодированные видеоданные в мультиплексор/демультиплексор ex453. Процессор ex454 аудиосигналов кодирует аудиосигнал, записанный посредством модуля ex456 аудиоввода, в то время как камера ex465 захватывает видео или неподвижное изображение, и передает кодированные аудиоданные в мультиплексор/демультиплексор ex453. Мультиплексор/демультиплексор ex453 мультиплексирует кодированные видеоданные и кодированные аудиоданные с использованием определенной схемы, модулирует и преобразует данные с использованием модулятора/демодулятора ex452 (схемы модулятора/демодулятора) и приемо-передающего устройства ex451 и передает результат через антенну ex450. Определенная схема может быть предварительно определена.
[0580] Когда видео, вложенное в почтовом сообщении или в чате, или видео, содержащее ссылку из веб-страницы, принимается, например, для того чтобы декодировать мультиплексированные данные, принимаемые через антенну ex450, мультиплексор/демультиплексор ex453 демультиплексирует мультиплексированные данные, чтобы разделять мультиплексированные данные на поток битов видеоданных и поток битов аудиоданных, предоставляет кодированные видеоданные в процессор ex455 видеосигналов через синхронную шину ex470 и предоставляет кодированные аудиоданные в процессор ex454 аудиосигналов через синхронную шину ex470. Процессор ex455 видеосигналов декодирует видеосигнал с использованием способа декодирования движущихся кадров, соответствующего способу кодирования движущихся кадров, описанному в вышеприведенных вариантах осуществления, и видео или неподвижное изображение, включенное в связанный файл движущихся кадров, отображается на дисплее ex458 через контроллер ex459 отображения. Процессор ex454 аудиосигналов декодирует аудиосигнал и выводит аудио из модуля ex457 аудиовывода. Поскольку потоковая передача в режиме реального времени становится все более популярной, могут возникать случаи, в которых воспроизведение аудио может быть социально нецелесообразным, в зависимости от окружения пользователя. Соответственно, в качестве начального значения, может быть предпочтительной конфигурация, в которой только видеоданные воспроизводятся, т.е. аудиосигнал не воспроизводится; аудио может синхронизироваться и воспроизводиться только тогда, когда принимается ввод, к примеру, когда пользователь щелкает видеоданные.
[0581] Хотя смартфон ex115 использован в вышеприведенном примере, другие реализации возможны: приемо-передающий терминал, включающий в себя как кодер, так и декодер; передающий терминал, включающий в себя только кодер; и приемный терминал, включающий в себя в себя только декодер. В описании цифровой широковещательной системы, приводится пример, в котором мультиплексированные данные, полученные в результате мультиплексирования видеоданных с аудиоданными, принимаются или передаются. Тем не менее, мультиплексированные данные могут представлять собой видеоданные, мультиплексированные с данными, отличными от аудиоданных, такими как текстовые данные, связанные с видео. Дополнительно, непосредственно видеоданные, а не мультиплексированные данные могут приниматься или передаваться.
[0582] Хотя главный контроллер ex460, включающий в себя CPU, описывается как управляющий процессами кодирования или декодирования, различные терминалы зачастую включают в себя GPU. Соответственно, является приемлемой конфигурация, в которой большая зона обрабатывается сразу посредством использования характеристик с точки зрения производительности GPU через запоминающее устройство, совместно используемое посредством CPU и GPU, либо через запоминающее устройство, включающее в себя адрес, которое управляется таким образом, чтобы обеспечивать возможность широкого использования посредством CPU и GPU. Это позволяет сокращать время кодирования, поддерживать характер реального времени потока и уменьшать задержку. В частности, обработка, связанная с оценкой движения, фильтрацией для удаления блочности, дискретизированным адаптивным смещением (SAO) и преобразованием/квантованием, может эффективно выполняться посредством GPU вместо CPU, например, в единицах кадров, одновременно.
Промышленная применимость
[0583] Настоящее раскрытие сущности является применимым, например, к телевизионным приемникам, цифровым записывающим видеоустройствам, автомобильным навигационным системам, мобильным телефонам, цифровым камерам, цифровым видеокамерам, системам телеконференц-связи, электронным зеркалам и т.д.
Ссылки с номерами на чертежах
[0584] 100 - кодер
102 - модуль разбиения
104 - вычитатель
106 - преобразователь
108 - квантователь
110 - энтропийный кодер
112, 204 - обратный квантователь
114, 206 - обратный преобразователь
116, 208 - сумматор
118, 210 - запоминающее устройство блоков
120, 212 - контурный фильтр
122, 214 - запоминающее устройство кинокадров
124, 216 - модуль внутреннего прогнозирования
126, 218 - модуль взаимного прогнозирования
128, 220 - контроллер прогнозирования
160, 260 - схема
162, 262 - запоминающее устройство
200 - декодер
202 - энтропийный декодер.

Claims (18)

1. Кодер, содержащий
запоминающее устройство и
схему, соединенную с запоминающим устройством и выполненную с возможностью:
выбирать первую таблицу из множества таблиц, каждая из таблиц ассоциирует индексы с соответствующими значениями коррекции, каждая из таблиц используется для изменения вектора движения текущего блока, включенного в кадр;
записывать параметр в поток битов, причем параметр указывает первый индекс, из числа индексов в первой таблице;
идентифицировать значение коррекции, ассоциированное с первым индексом;
изменять вектор движения на значение коррекции в предварительно определенном направлении; и
кодировать текущий блок, основываясь на измененном векторе движения,
при этом разность между двумя значениями коррекции среди значений коррекции варьируется от таблицы к таблице, причем два значения коррекции в каждой из таблиц ассоциируются с одними и теми же двумя индексами.
2. Декодер, содержащий
запоминающее устройство и
схему, соединенную с запоминающим устройством и выполненную с возможностью:
выбирать первую таблицу из множества таблиц, каждая из таблиц ассоциирует индексы с соответствующими значениями коррекции, каждая из таблиц используется для изменения вектора движения текущего блока, включенного в кадр;
синтаксически анализировать параметр, указывающий первый индекс, выбранный из числа индексов, включенных в первую таблицу;
идентифицировать значение коррекции, ассоциированное с первым индексом;
изменять вектор движения на значение коррекции в предварительно определенном направлении; и
декодировать текущий блок, основываясь на измененном векторе движения,
при этом разность между двумя значениями коррекции среди значений коррекции варьируется от таблицы к таблице, причем два значения коррекции в каждой из таблиц ассоциируются с одними и теми же двумя индексами.
RU2023110445A 2018-07-18 2019-07-05 Кодер, декодер, способ кодирования и способ декодирования RU2808005C2 (ru)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US62/699,930 2018-07-18

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
RU2021100589A Division RU2795260C2 (ru) 2018-07-18 2019-07-05 Декодер, способ кодирования и способ декодирования

Publications (2)

Publication Number Publication Date
RU2023110445A RU2023110445A (ru) 2023-04-28
RU2808005C2 true RU2808005C2 (ru) 2023-11-21

Family

ID=

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2918546B2 (ja) * 1997-07-09 1999-07-12 日本電信電話株式会社 動きベクトル符号化方法および復号方法、動きベクトル符号化装置および復号装置、並びに、動きベクトル符号化プログラムおよび復号プログラムを記録した記録媒体
US20090279799A1 (en) * 2008-05-09 2009-11-12 Kabushiki Kaisha Toshiba Image processing apparatus and image processing method
RU2519525C2 (ru) * 2010-02-09 2014-06-10 Ниппон Телеграф Энд Телефон Корпорейшн Способ кодирования с предсказанием вектора движения, способ декодирования с предсказанием вектора движения, устройство кодирования фильма, устройство декодирования фильма и их программы
WO2016068685A1 (ko) * 2014-10-31 2016-05-06 삼성전자 주식회사 고정밀 스킵 부호화를 이용한 비디오 부호화 장치 및 비디오 복호화 장치 및 그 방법
RU2636692C2 (ru) * 2012-03-16 2017-11-27 Квэлкомм Инкорпорейтед Синтаксические расширения высокого уровня для высокоэффективного видеокодирования
US20180084260A1 (en) * 2016-09-16 2018-03-22 Qualcomm Incorporated Offset vector identification of temporal motion vector predictor
RU2652500C1 (ru) * 2011-11-07 2018-04-26 Нтт Докомо, Инк. Устройство кодирования видео с предсказанием, способ кодирования видео с предсказанием, программа кодирования видео с предсказанием, устройство декодирования видео с предсказанием, способ декодирования видео с предсказанием и программа декодирования видео с предсказанием

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2918546B2 (ja) * 1997-07-09 1999-07-12 日本電信電話株式会社 動きベクトル符号化方法および復号方法、動きベクトル符号化装置および復号装置、並びに、動きベクトル符号化プログラムおよび復号プログラムを記録した記録媒体
US20090279799A1 (en) * 2008-05-09 2009-11-12 Kabushiki Kaisha Toshiba Image processing apparatus and image processing method
RU2519525C2 (ru) * 2010-02-09 2014-06-10 Ниппон Телеграф Энд Телефон Корпорейшн Способ кодирования с предсказанием вектора движения, способ декодирования с предсказанием вектора движения, устройство кодирования фильма, устройство декодирования фильма и их программы
RU2652500C1 (ru) * 2011-11-07 2018-04-26 Нтт Докомо, Инк. Устройство кодирования видео с предсказанием, способ кодирования видео с предсказанием, программа кодирования видео с предсказанием, устройство декодирования видео с предсказанием, способ декодирования видео с предсказанием и программа декодирования видео с предсказанием
RU2636692C2 (ru) * 2012-03-16 2017-11-27 Квэлкомм Инкорпорейтед Синтаксические расширения высокого уровня для высокоэффективного видеокодирования
WO2016068685A1 (ko) * 2014-10-31 2016-05-06 삼성전자 주식회사 고정밀 스킵 부호화를 이용한 비디오 부호화 장치 및 비디오 복호화 장치 및 그 방법
US20180084260A1 (en) * 2016-09-16 2018-03-22 Qualcomm Incorporated Offset vector identification of temporal motion vector predictor

Similar Documents

Publication Publication Date Title
JP7187640B2 (ja) 符号化方法及び復号方法
EP3820148A1 (en) Encoding device, decoding device, encoding method, and decoding method
JP7214846B2 (ja) 符号化装置、復号装置、符号化方法及び復号方法
US20200404272A1 (en) Encoder, decoder, encoding method, and decoding method
WO2020171046A1 (en) Image encoder and image decoder
US20210037243A1 (en) Encoder, decoder, encoding method, and decoding method
JP2023068203A (ja) 復号装置及び復号方法
JP7337222B2 (ja) 符号化装置及び復号装置
TW202025774A (zh) 編碼裝置、解碼裝置、編碼方法及解碼方法
JP7432022B2 (ja) 符号化装置及び復号装置
JP7373040B2 (ja) 復号装置及び符号化装置
JP2023017026A (ja) 非一時的記憶媒体
JP2024107258A (ja) 符号化装置及び復号装置
JP2024123262A (ja) 符号化装置、復号装置及びビットストリーム生成装置
JP2023001298A (ja) 復号装置及び復号方法
RU2808005C2 (ru) Кодер, декодер, способ кодирования и способ декодирования
RU2795260C2 (ru) Декодер, способ кодирования и способ декодирования
RU2810304C2 (ru) Кодер, декодер, способ кодирования и способ декодирования
RU2821010C2 (ru) Кодер, декодер, способ кодирования и способ декодирования
RU2808454C1 (ru) Кодер, декодер, способ кодирования и способ декодирования
RU2808103C2 (ru) Способ декодирования видео и изображений с использованием сегментации на блоки
RU2819086C2 (ru) Система и способ для кодирования видео
RU2817290C2 (ru) Система и способ для кодирования видео
RU2825824C2 (ru) Кодер, декодер, способ кодирования и способ декодирования
TWI853624B (zh) 用於視訊寫碼之系統及方法