RU2779825C1 - Способ и устройство для взаимодействия между режимом внутреннего предсказания и режимом блочной дифференциальной импульсно-кодовой модуляции - Google Patents

Способ и устройство для взаимодействия между режимом внутреннего предсказания и режимом блочной дифференциальной импульсно-кодовой модуляции Download PDF

Info

Publication number
RU2779825C1
RU2779825C1 RU2021128747A RU2021128747A RU2779825C1 RU 2779825 C1 RU2779825 C1 RU 2779825C1 RU 2021128747 A RU2021128747 A RU 2021128747A RU 2021128747 A RU2021128747 A RU 2021128747A RU 2779825 C1 RU2779825 C1 RU 2779825C1
Authority
RU
Russia
Prior art keywords
block
intra prediction
mode
video
prediction mode
Prior art date
Application number
RU2021128747A
Other languages
English (en)
Inventor
Синь ЧЖАО
Сян Ли
Лян ЧЖАО
Шань ЛЮ
Original Assignee
Тенсент Америка Ллс
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Тенсент Америка Ллс filed Critical Тенсент Америка Ллс
Application granted granted Critical
Publication of RU2779825C1 publication Critical patent/RU2779825C1/ru

Links

Images

Abstract

Группа изобретений относится к технологиям видеокодирования. Техническим результатом является повышение эффективности декодирования видео. Предложен способ видеодекодирования. Способ содержит этап, на котором осуществляют определение, предсказан ли первый блок, связанный со вторым блоком, в соответствии с режимом блочной дифференциальной импульсно-кодовой модуляции (BDPCM). Далее, согласно способу, в ответ на определение того, что первый блок предсказан в соответствии с режимом BDPCM, осуществляют связывание первого блока со значением режима внутреннего предсказания на основе флага направления BDPCM для первого блока, при этом значение режима внутреннего предсказания выбирают из множества режимов внутреннего предсказания, которые включают угловые режимы внутреннего предсказания. А также определяют значение режима внутреннего предсказания для второго блока с использованием значения режима внутреннего предсказания, связанного с первым блоком. 3 н. и 8 з.п. ф-лы, 12 ил., 2 табл.

Description

ВКЛЮЧЕНИЕ ПОСРЕДСТВОМ ССЫЛКИ
[0001] Настоящее изобретение испрашивает приоритет патентной заявки США №16/862 221, "METHOD AND APPARATUS FOR INTERACTION BETWEEN INTRA PREDICTION MODE AND BLOCK DIFFERENTIAL PULSE-CODE MODULATION MODE", поданной 29 апреля, 2020 года, которая испрашивает приоритет предварительной заявки США №62/841,003, "INTERACTION BETWEEN INTRA PREDICTION MODE AND BLOCK DIFFERENTIAL PULSE-CODE MODULATION MODE", поданной 30 апреля 2019 года. Содержание предыдущих заявок, таким образом, включено посредством ссылки в полном объеме.
ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ
[0002] В настоящей заявке описаны варианты осуществления, в целом относящиеся к видеокодированию.
УРОВЕНЬ ТЕХНИКИ
[0003] Описание предпосылок создания изобретения приведено здесь с целью представления в целом контекста изобретения. Работа авторов изобретения, в той мере, в какой она описана в этом разделе, а также аспекты описания, которые не могут квалифицироваться как уровень техники на момент подачи заявки, ни прямо, ни косвенно не признаются уровнем техники для настоящего изобретения.
[0004] Кодирование и декодирование видеосигнала может осуществляться с использованием предсказания между изображениями с компенсацией движения. Цифровое видео без сжатия может включать в себя последовательность изображений, каждое из которых имеет пространственный размер, например, 1920×1080 отсчетов яркости и связанных с ними отсчетов цветности. Последовательность изображений может иметь фиксированную или переменную частоту смены изображений (неформально также называемую частотой кадров), например, 60 изображений в секунду, или 60 Гц. Видео без сжатия предъявляет значительные требования к битовой скорости. Например, видео 1080р60 4:2:0 с 8 битами на отсчет (разрешение отсчетов яркости 1920×1080 при частоте кадров 60 Гц) требует полосы около 1,5 Гбит/с. Час такого видео требует объема памяти более 600 ГБ.
[0005] Одной из целей кодирования и декодирования видеосигнала может являться снижение избыточности во входном видеосигнале путем сжатия. Сжатие может способствовать смягчению вышеупомянутых требований к полосе или объему памяти, в ряде случаев на два порядка величины или более. Можно использовать как сжатие без потерь, так и сжатие с потерями, а также их комбинацию. Сжатие без потерь относится к методам реконструкции точной копии исходного сигнала из сжатого исходного сигнала. При использовании сжатия с потерями реконструированный сигнал может быть не идентичен исходному сигналу, но расхождение между исходным и реконструированным сигналами достаточно мало, так чтобы реконструированный сигнал можно было использовать для намеченного применения. Сжатие с потерями широко применяется для видео. Допустимая степень искажения зависит от применения; например, пользователи некоторых заказных потоковых приложений могут мириться с более высокими искажениями, чем пользователи телевещательных приложений. При достижимой степени сжатия более высокое разрешенное/допустимое искажение может давать более высокую степень сжатия.
[0006] Кодер и декодер видеосигнала могут использовать методы из нескольких широких категорий, включающих в себя, например, компенсацию движения, преобразование, квантование и энтропийное кодирование.
[0007] Технологии видеокодека могут включать методы, известные как внутреннее кодирование. При внутреннем (интра-) кодировании, значения отсчетов представляются без ссылки на отсчеты или другие данные из ранее реконструированных опорных изображений. В некоторых видеокодеках изображение пространственно разделяется на блоки отсчетов. Когда все блоки отсчетов кодируются в интра-режиме, изображение называется интра-изображением. Интра-изображения и их производные, например, изображения, полученные в режиме независимого обновления декодера, могут использоваться для сброса состояния декодера, что позволяет использовать их как первое изображение в битовом потоке кодированного видео и видеосеансе, или как неподвижное изображение. Отсчеты интра-блока могут подвергаться преобразованию, и коэффициенты преобразования могут квантоваться до энтропийного кодирования. Внутреннее предсказание может быть методом минимизации значений отсчетов в области предварительного преобразования. В ряде случаев, чем меньше значение DC (постоянной составляющей) после преобразования, и чем меньше коэффициенты АС (переменных составляющих), тем меньше битов требуется при данном размере шага квантования для представления блока после энтропийного кодирования.
[0008] Традиционное внутреннее кодирование, известное, например, из технологий кодирования поколения MPEG-2, не использует внутреннего предсказания. Однако некоторые более современные технологии сжатия видео включают в себя методы, которые пытаются сделать это, например, из данных отсчетов и/или метаданных, полученных в ходе кодирования/декодирования пространственных соседних и предшествующих, в порядке декодирования, блоков данных. Такие методы далее именуются методами "внутреннего предсказания". Заметим, что по меньшей мере в некоторых случаях внутреннее предсказание осуществляется только с использованием опорных данных из текущего изображения, подлежащего реконструкции, но не из опорных изображений.
[0009] Известно много разных форм внутреннего предсказания. Когда в данной технологии видеокодирования может использоваться более одного из таких методов, используемый метод может кодироваться в режиме внутреннего предсказания. В некоторых случаях режимы могут иметь подрежимы и/или параметры, которые могут кодироваться по отдельности или включаться в кодовое слово режима. Использование того или иного кодового слова для данной комбинации режимов/подрежимов/параметров может оказывать влияние на повышение эффективности кодирования посредством внутреннего предсказания и, следовательно, на технологию энтропийного кодирования, используемую для перевода кодовых слов в битовый поток.
[0010] Определенный режим внутреннего предсказания впервые был задан в H.264, уточнен в H.265, и дополнительно уточнен в более современных технологиях кодирования, например, модели совместного исследования (JEM, joint exploration model), универсального видеокодирования (VVC, versatile video coding) и наборе эталонов (BMS, benchmark set). Блок предсказателя может формироваться с использованием значений соседних отсчетов, принадлежащих уже доступным отсчетам. Значения соседних отсчетов копируются в блок предсказателя согласно направлению. Ссылка на используемое направление может кодироваться в битовом потоке или может сама предсказываться.
[0011] В нижнем правом углу фиг. 1А изображено подмножество из девяти направлений предсказателя множества, известного из 33 возможных направлений предсказателя Н.265 (соответствующих 33 угловым режимам из 35 интра-режимов). Точка (101), где сходятся стрелки, представляет предсказываемый отсчет. Стрелки представляют направление, из которого предсказывается отсчет. Например, стрелка (102) указывает, что отсчет (101) предсказывается из отсчета или отсчетов, расположенного(ых) вверху справа, под углом 45 градусов к горизонтали. Аналогично, стрелка (103) указывает, что отсчет (101) предсказывается из отсчета или отсчетов расположенного(ых) внизу слева от отсчета (101), под углом 22,5 градусов к горизонтали.
[0012] В верхнем левом углу фиг. 1А изображен квадратный блок (104) 4×4 отсчетов (указанный жирной пунктирной линией). Квадратный блок (104) включает в себя 16 отсчетов, каждый из которых обозначен буквой "S", позицией по оси Y (например, индексом строки) и позицией по оси X (например, индексом столбца). Например, отсчет S21 является вторым отсчетом по оси Y (сверху) и первым (слева) отсчетом по оси X. Аналогично, отсчет S44 является четвертым отсчетом в блоке (104) по обеим осям Y и X. Поскольку блок имеет размер 4×4 отсчета, S44 располагается внизу справа. Дополнительно показаны опорные отсчеты, которые следуют аналогичной схеме нумерации. Опорный отсчет обозначается буквой R, своей Y-позицией (например, индексом строки) и Х-позицией (индексом столбца) относительно блока (104). В обоих Н.264 и Н.265 предсказанные отсчеты соседствуют с блоком, подлежащим реконструкции; поэтому нет необходимости использовать отрицательные значения.
[0013] Предсказание внутри изображения может работать путем копирования опорных значений отсчетов из соседних отсчетов, указанных сигнализируемым направлением предсказания. Например, предположим, что битовый поток кодированного видео включает в себя сигнализацию, которая, для этого блока, указывает направление предсказания, обозначенное стрелкой (102) - то есть отсчеты предсказываются из предсказанного(ых) отсчета или отсчетов, расположенного(ых) вверху справа, под углом 45 градусов к горизонтали. В этом случае отсчеты S41, S32, S23 и S14 предсказываются из одного и того же опорного отсчета R05. Затем отсчет S44 предсказывается из опорного отсчета R08.
[0014] В некоторых случаях значения множества опорных отсчетов можно комбинировать, например, посредством интерполяции для вычисления опорного отсчета; в особенности, когда направления не кратны 45 градусам.
[0015] Количество возможных направлений увеличивается по мере развития технологий видеокодирования. В Н.264 (2003 год) можно было представлять девять разных направлений. В Н.265 это количество увеличилось до 33 (2013 год), и JEM/VVC/BMS во время составления данного описания может поддерживать до 65 направлений. Были проведены эксперименты для выявления наиболее вероятных направлений, и некоторые методы энтропийного кодирования используются для представления этих вероятных направлений малым количеством битов, ценой утраты некоторых менее вероятных направлений. Дополнительно, сами направления иногда можно предсказывать из соседних направлений, используемых в соседних, уже декодированных, блоках.
[0016] Режимы внутреннего предсказания, используемые в HEVC, показаны на фиг. 1В. В HEVC существует в общей сложности 35 режимов внутреннего предсказания, из которых режим 10 горизонтальный режим, режим 26 вертикальный режим, а режим 2, режим 18 и режим 34 диагональные режимы. Режимы внутреннего предсказания передаются тремя наиболее вероятными режимами (МРМ) и 32 оставшимися режимами.
[0017] На фиг. 1С показаны режимы внутреннего предсказания, используемые в VVC. В VVC существует в общей сложности 95 режимов внутреннего предсказания, как показано на фиг. 1С, где режим 18 горизонтальный режим, режим 50 вертикальный режим, а режим 2, режим 34 и режим 66 - диагональные режимы. Режимы -1~-14 и режимы 67~80 называются режимами широкоугольного внутреннего предсказания (WAIP).
[0018] Отображение битов направлений внутреннего предсказания в кодированном битовом потоке видео, которые представляют направление, может отличаться от одной технологии видео кодирования к другой технологии видеокодирования; и может варьироваться, например, от простых прямых отображений направления предсказания на режим внутреннего предсказания, на кодовые слова, до сложных адаптивных схем, включающих наиболее вероятные режимы, и подобных методов. Однако во всех случаях могут существовать определенные направления, которые статистически менее вероятны в видеоконтенте, чем некоторые другие направления. Поскольку целью сжатия видео является уменьшение избыточности, эти менее вероятные направления в хорошо работающей технологии кодирования видео будут представлены большим количеством битов, чем более вероятные направления.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
[0019] Согласно примеру осуществления, способ декодирования видео, выполняемый в видеодекодере, включает в себя определение того, кодирован ли первый блок, связанный со вторым блоком, в режиме блочной дифференциальной импульсно-кодовой модуляции (BDPCM). Способ дополнительно включает в себя связывание первого блока со значением режима внутреннего предсказания на основе флага направления BDPCM, в ответ на определение того, что первый блок кодирован в режиме BDPCM. Способ дополнительно включает в себя определение значения режима внутреннего предсказания для второго блока с использованием значения режима внутреннего предсказания, связанного с первым блоком. Способ дополнительно включает в себя реконструкцию второго блока с использованием определенного значения режима внутреннего предсказания.
[0020] Согласно примеру осуществления, видеодекодер для декодирования видео включает схему обработки, выполненную с возможностью определения того, кодируется ли первый блок, связанный со вторым блоком, в режиме блочной дифференциальной импульсно-кодовой модуляции (BDPCM). В ответ на определение того, что первый блок кодируется в режиме BDPCM, схема обработки дополнительно выполнена с возможностью связывания первого блока со значением режима внутреннего предсказания на основе флага направления BDPCM. Схема обработки дополнительно выполнена с возможностью определения значения режима внутреннего предсказания для второго блока с использованием значения режима внутреннего предсказания, связанного с первым блоком. Схема обработки дополнительно выполнена с возможностью реконструкции второго блока с использованием определенного значения режима внутреннего предсказания.
[0021] Согласно примеру осуществления, предложен компьютерно-считываемый носитель, на котором хранятся инструкции, которые, при выполнении процессором в видеодекодере, предписывают видеодекодеру осуществлять способ, содержащий определение, кодирован ли первый блок, связанный со вторым блоком, в режиме блочной дифференциальной импульсно-кодовой модуляции (BDPCM). Способ дополнительно включает в себя связывание первого блока со значением режима внутреннего предсказания на основе флага направления BDPCM в ответ на определение того, что первый блок кодирован в режиме BDPCM. Способ дополнительно включает в себя определение значения режима внутреннего предсказания для второго блока с использованием значения режима внутреннего предсказания, связанного с первым блоком. Способ дополнительно включает в себя реконструкцию второго блока с использованием определенного значения режима внутреннего предсказания.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
[0022] Дополнительные особенности, характер и различные преимущества раскрытого изобретения будут понятны из нижеследующего подробного описания и прилагаемых чертежей, на которых:
[0023] Фиг. 1А представляет собой схематическую иллюстрацию примера подмножества режимов внутреннего предсказания.
[0024] Фиг. 1В представляет собой схему направлений внутреннего предсказания
[0025] Фиг. 1С представляет собой схему направлений внутреннего предсказания.
[0026] Фиг. 2 представляет собой схематическую иллюстрацию упрощенной блок-схемы системы связи (200) в соответствии с вариантом осуществления.
[0027] Фиг. 3 представляет собой схематическую иллюстрацию упрощенной блок-схемы системы связи (300) в соответствии с вариантом осуществления.
[0028] Фиг. 4 представляет собой схематическую иллюстрацию упрощенной блок-схемы декодера в соответствии с вариантом осуществления.
[0029] Фиг. 5 представляет собой схематическую иллюстрацию упрощенной блок-схемы кодера в соответствии с вариантом осуществления.
[0030] На фиг. 6 показана блок-схема кодера в соответствии с другим вариантом осуществления.
[0031] На фиг. 7 показана блок-схема декодера в соответствии с другим вариантом осуществления.
[0032] На фиг. 8 представлена схематическая иллюстрация текущего блока и окружающих его соседей.
[0033] На фиг. 9 представлена иллюстрация варианта осуществления процесса, выполняемого декодером.
[0034] На фиг. 10 представлена схематическая иллюстрация компьютерной системы в соответствии с вариантом осуществления настоящего изобретения.
ПОДРОБНОЕ ОПИСАНИЕ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ
[0035] На фиг. 2 показана упрощенная блок-схема системы связи (200) согласно варианту осуществления настоящего изобретения. Система связи (200) включает в себя множество оконечных устройств, которые могут осуществлять связь друг с другом, например, через сеть (250). Например, система связи (200) включает в себя первую пару оконечных устройств (210) и (220), соединенных между собой через сеть (250). В примере, приведенном на фиг. 2, первая пара оконечных устройств (210) и (220) осуществляет однонаправленную передачу данных. Например, оконечное устройство (210) может кодировать видеоданные (например, поток видеоизображений, захваченных оконечным устройством (210)) для передачи на другое оконечное устройство (220) через сеть (250). Кодированные видеоданные могут передаваться в форме одного или более битовых потоков кодированного видео. Оконечное устройство (220) может принимать кодированные видеоданные из сети (250), декодировать кодированные видеоданные для восстановления видеоизображений и отображения видеоизображений согласно восстановленным видеоданным. Однонаправленная передача данных может быть свойственна приложениям служб массовой информации и т.п.
[0036] В другом примере система связи (200) включает в себя вторую пару оконечных устройств (230) и (240), осуществляющих двунаправленную передачу кодированных видеоданных, которые могут возникать, например, в ходе видеоконференцсвязи. Для двунаправленной передачи данных, в порядке примера, каждое оконечное устройство из оконечных устройств (230) и (240) может кодировать видеоданные (например, поток видеоизображений, захваченных оконечным устройством) для передачи в другое оконечное устройство из оконечных устройств (230) и (240) через сеть (250). Каждое оконечное устройство из оконечных устройств (230) и (240) также может принимать также может принимать кодированные видеоданные, передаваемые другим оконечным устройством из оконечных устройств (230) и (230), и может декодировать кодированные видеоданные для восстановления видеоизображений и отображать видеоизображения на доступном устройстве отображения согласно восстановленным видеоданным.
[0037] В примере, приведенном на фиг. 2, оконечные устройства (210), (220), (230) и (240) могут быть проиллюстрированы как серверы, персональные компьютеры и смартфоны, но это не ограничивает принципы настоящего изобретения. Варианты осуществления настоящего изобретения находят применение для портативных компьютеров, планшетных компьютеров, медиаплееров и/или специального оборудования для видеоконференцсвязи. Сеть (250) представляет любое количество сетей, которые переносят кодированные видеоданные между оконечными устройствами (210), (220), (230) и (240), включая, например, проводные и/или беспроводные сети связи. Сеть связи (250) позволяет обмениваться данными в режиме канальной коммутации и/или пакетной коммутации. Репрезентативные сети включают в себя телекоммуникационные сети, локальные сети, глобальные сети и/или интернет. В целях настоящего рассмотрения, архитектура и топология сети (250) могут не иметь отношения к настоящему изобретению, если конкретно не указаны ниже.
[0038] На фиг. 3 показано, в порядке примера применения раскрытого изобретения, размещение видеокодера и видеодекодера в окружении потоковой передачи. Раскрытое изобретение может быть в равной степени применимо к другим применениям обработки видео, включая, например, видеоконференцсвязь, цифровое телевидение, хранение сжатого видео на цифровых носителях, в том числе CD, DVD, карте памяти и т.п., и т.д.
[0039] Система потоковой передачи может включать в себя подсистему (313) захвата, которая может включать в себя источник (301) видеосигнала, например, цифровую камеру, создающую, например, поток (302) видеоизображений, не подвергнутых сжатию. Например, поток (302) видеоизображений включает в себя отсчеты, снятые цифровой камерой. Поток (302) видеоизображений, изображенный жирной линией, чтобы подчеркнуть большой объем данных по сравнению с кодированными видеоданными (304) (или битовыми потоками кодированного видео), может обрабатываться электронным устройством (320), которое включает в себя видеокодер (303), подключенный к источнику (301) видеосигнала. Видеокодер (303) может включать в себя оборудование, программное обеспечение или их комбинацию для обеспечения или реализации аспектов раскрытого изобретения, как более подробно описано ниже. Кодированные видеоданные (304) (или битовый поток (304) кодированного видео), изображенные тонкой линией, чтобы подчеркнуть меньший объем данных по сравнению с потоком (302) видеоизображений, могут храниться на потоковом сервере (305) для использования в будущем. Одна или более клиентских подсистем потоковой передачи, например, клиентские подсистемы (306) и (308) на фиг. 3, могут осуществлять доступ к потоковому серверу (305) для извлечения копий (307) и (309) кодированных видеоданных (304). Клиентская подсистема (306) может включать в себя видеодекодер (310), например, в электронном устройстве (330). Видеодекодер (310) декодирует входящую копию (307) кодированных видеоданных и создает исходящий поток (311) видеоизображений, который может визуализироваться на дисплее (312) (например, отображающем экране) или другом устройстве визуализации (не показано). В некоторых системах потоковой передачи, кодированные видеоданные (304), (307) и (309) (например, битовые потоки видео) могут кодироваться согласно тем или иным стандартам кодирования/сжатия видео. Примеры этих стандартов включают в себя ITU-T Recommendation Н.265. Например, разрабатывается стандарт видеокодирования под официальным названием "универсальное видеокодирование" (VVC, Versatile Video Coding). Раскрытое изобретение может использоваться в контексте VVC.
[0040] Заметим, что электронные устройства (320) и (330) могут включать в себя другие компоненты (не показаны). Например, электронное устройство (320) может включать в себя видеодекодер (не показан), и электронное устройство (330) также может включать в себя видеокодер (не показан).
[0041] На фиг. 4 показана блок-схема видеодекодера (410) согласно варианту осуществления настоящего изобретения. Видеодекодер (410) может входить в состав электронного устройства (430). Электронное устройство (430) может включать в себя приемник (431) (например, приемные схемы). Видеодекодер (410) может использоваться вместо видеодекодера (310) в примере, приведенном на фиг. 3.
[0042] Приемник (431) может принимать одну или более кодированных видеопоследовательностей для декодирования видеодекодером (410); в том же или другом варианте осуществления, по одной кодированной видеопоследовательности за раз, где декодирование каждой кодированной видеопоследовательности не зависит от других кодированных видеопоследовательностей. Кодированная видеопоследовательность может приниматься из канала (401), который может быть аппаратной/программной линией связи с запоминающим устройством, где хранятся кодированные видеоданные. Приемник (431) может принимать кодированные видеоданные с другими данными, например, кодированными аудиоданными и/или вспомогательными потоками данных, которые могут ретранслироваться на соответствующие использующие и объекты (не показаны). Приемник (431) может отделять кодированную видеопоследовательность от других данных. Для борьбы с джиггером сети буферная память (415) может быть подключена между приемником (431) и энтропийным декодером / анализатором (420) (далее "анализатором (420)"). В некоторых вариантах применения буферная память (415) входит в состав видеодекодера (410). В других она может не входить в состав видеодекодера (410) (не показан). В прочих вариантах может существовать буферная память (не показана) вне видеодекодера (410), например, для борьбы с джиттером сети, помимо другой буферной памяти (415) в составе видеодекодера (410), например, для управления хронированием доигрывания. Когда приемник (431) принимает данные от устройства хранения/ретрансляции с достаточной полосой и управляемостью или из изосинхронной сети, буферная память (415) может быть не нужна или может быть мала. Для использования в пакетных сетях наилучшей попытки, например, Интернете, буферная память (415) может требоваться, может быть сравнительно большой и может иметь преимущественно адаптивный размер, и по меньшей мере частично может быть реализована в операционной системе или аналогичных элементах (не показаны) вне видеодекодера (410).
[0043] Видеодекодер (410) может включать в себя анализатор (420) для реконструкции символов (421) из кодированной видеопоследовательности. Категории этих символов включают в себя информацию, используемую для управления работой видеодекодера (410), и возможно информацию для управления устройством визуализации, например, устройством (412) визуализации (например, отображающим экраном), которое не является неотъемлемой частью электронного устройства (430), но может быть подключено к электронному устройству (430), как показано на фиг. 4. Информация управления для устройств(а) визуализации может представлять собой сообщения информации дополнительного улучшения (SEI, Supplemental Enhancement Information) или фрагменты набора параметров информации пригодности видео (VUI, Video Usability Information) (не показаны). Анализатор (420) может анализировать / энтропийно декодировать принятую кодированную видеопоследовательность. Кодирование кодированной видеопоследовательности может осуществляться в соответствии с технологией или стандартом видеокодирования и может следовать различным принципам, в том числе кодированию с переменной длиной серии, кодированию по Хаффману, арифметическому кодированию с контекстной чувствительностью или без нее и т.д. Анализатор (420) может извлекать из кодированной видеопоследовательности набор параметров подгруппы для по меньшей мере одной из подгрупп пикселей в видеодекодере на основании по меньшей мере одного параметра, соответствующего группе. Подгруппы могут включать в себя группы изображений (GOP, Groups of Pictures), изображения, тайлы, слайсы, макроблоки, единицы кодирования (CU, Coding Units), блоки, единицы преобразования (TU, Transform Units), единицы предсказания (PU, Prediction Units) и т.д. Анализатор (420) также может извлекать из кодированной видеопоследовательности информацию, например, коэффициенты преобразования, значения параметров квантователя, векторы движения и т.д.
[0044] Анализатор (420) может осуществлять операцию энтропийного декодирования / анализа видеопоследовательности, принятой из буферной памяти (415), для создания символов (421).
[0045] Для реконструкции символов (521) могут использоваться несколько разных модулей в зависимости от типа кодированного видеоизображения или его частей (например: интер- и интра-изображения, интер- и интра-блока) и других факторов. Какие модули используются, и как, может определяться информацией управления подгруппами, выделенной из кодированной видеопоследовательности анализатором (420). Поток такой информации управления подгруппами между анализатором (420) и множественными модулями для простоты в дальнейшем не показан.
[0046] Помимо ранее упомянутых функциональных блоков видеодекодер (410) может принципиально подразделяться на несколько функциональных модулей, как описано ниже. В практической реализации, работающей в условиях коммерческих ограничений, многие из этих модулей тесно взаимодействуют друг с другом и могут, по меньшей мере частично, встраиваться один в другой. Однако в целях описания раскрытого изобретения уместно принципиальное подразделение на нижеперечисленные функциональные модули.
[0047] Первым модулем является модуль (451) масштабирования / обратного преобразования. Модуль (451) масштабирования / обратного преобразования принимает квантованный коэффициент преобразования, а также информацию управления, включающую в себя используемое преобразование, размер блока, коэффициент квантования, матрицы масштабирования квантования и т.д. в качестве символа(ов) (421) от анализатора (420). Модуль (451) масштабирования / обратного преобразования может выводить блоки, содержащие значения отсчетов, которые можно вводить в агрегатор (455).
[0048] В ряде случаев выходные отсчеты модуля (451) масштабирования / обратного преобразования могут относиться к внутренне-кодированному блоку; то есть блоку, который не использует предсказанную информацию из ранее реконструированных изображений, но может использовать предсказанную информацию из ранее реконструированных частей текущего изображения. Такая предсказанная информация может обеспечиваться модулем (452) предсказания внутри изображения. В ряде случаев модуль (452) предсказания внутри изображения генерирует блок такого же размера и формы, как блок, подлежащий реконструкции, с использованием информации ранее реконструированного окружения, извлеченной из буфера (458) текущего изображения. Буфер (458) текущего изображения буферизует, например, частично реконструированное текущее изображение и/или полностью реконструированное текущее изображение. Агрегатор (455) в ряде случаев добавляет, для каждого отсчета, информацию предсказания, сгенерированную модулем (552) внутреннего предсказания, в информацию выходных отсчетов, обеспеченную модулем (451) масштабирования / обратного преобразования.
[0049] В других случаях выходные отсчеты модуля (451) масштабирования / обратного преобразования могут относиться к внутренне кодированному блоку, возможно, с компенсацией движения. В таком случае модуль (453) предсказания с компенсацией движения может осуществлять доступ к памяти (457) опорных изображений для извлечения отсчетов, используемых для предсказания. После применения компенсации движения к извлеченным отсчетам в соответствии с символами (421), относящимися к блоку, эти отсчеты могут добавляться агрегатором (455) к выходному сигналу модуля (451) масштабирования / обратного преобразования (в этом случае именуемому остаточными отсчетами или остаточным сигналом) для генерации информации выходных отсчетов. Адреса в памяти (457) опорных изображений, откуда модуль (453) предсказания с компенсацией движения извлекает предсказанные отсчеты, могут регулироваться векторами движения, доступными модулю (453) предсказания с компенсацией движения, в форме символов (421), которые могут иметь, например, компоненты X, Y и опорного изображения. Компенсация движения также может включать в себя интерполяцию значений отсчетов, извлеченных из памяти (457) опорных изображений, когда используются точные векторы движения под-отсчетов, механизмы предсказания векторов движения и т.д.
[0050] К выходным отсчетам агрегатора (455) можно применять различные методы контурной фильтрации в модуле (456) контурного фильтра. Технологии сжатия видео могут включать в себя технологии деблокирующего фильтра под управлением параметров, включенных в кодированную видеопоследовательность (также именуемую битовым потоком кодированного видео) и становиться доступными модулю (456) контурного фильтра в качестве символов (421) от анализатора (420), но также могут реагировать на метаинформацию, полученную в ходе декодирования предыдущих (в порядке декодирования) частей кодированного изображения или кодированной видеопоследовательности, а также реагировать на ранее реконструированные и подвергнутые контурной фильтрации значения отсчетов.
[0051] Модуль (456) контурного фильтра может выдавать поток отсчетов, который может поступать на устройство (412) визуализации, а также сохраняться в памяти (457) опорных изображений для использования в будущем предсказании между изображениями.
[0052] Некоторые кодированные изображения, будучи полностью реконструированы, могут использоваться в качестве опорных изображений для будущего предсказания. Например, когда кодированное изображение, соответствующее текущему изображению, полностью реконструировано, и кодированное изображение идентифицировано как опорное изображение (например, анализатором (420)), буфер (458) текущего изображения может становиться частью памяти (457) опорных изображений, и свежий буфер текущего изображения может повторно выделяться до начала реконструкции следующего кодированного изображения.
[0053] Видеодекодер (410) может осуществлять операции декодирования согласно заранее заданной технологии сжатия видео, например, по стандарту ITU-T Rec. Н.265. Кодированная видеопоследовательность может согласовываться с синтаксисом, заданным используемой/ым технологией или стандартом сжатия видео, в том смысле, что кодированная видеопоследовательность может придерживаться как синтаксиса технологии или стандарта сжатия видео, так и профилей, задокументированных в технологии или стандарте сжатия видео. В частности, профиль может выбирать некоторые инструменты как инструменты, доступные для использования только под этим профилем, из всех инструментов, доступных в технологии или стандарте сжатия видео. Также для согласованности может быть необходимо, чтобы сложность кодированной видеопоследовательности оставалась в границах, заданных уровнем технологии или стандарта сжатия видео. В ряде случаев уровни ограничивают максимальный размер изображения, максимальную частоту кадров, максимальную частоту отсчетов для реконструкции (измеряемую, например, в мегаотсчетах в секунду), максимальный размер опорного изображения и т.д. Пределы, установленные уровнями, в ряде случаев могут дополнительно ограничиваться спецификациями гипотетического эталонного декодера (HRD, Hypothetical Reference Decoder) и метаданными для управления буфером HRD, сигнализируемого в кодированной видеопоследовательности.
[0054] Согласно варианту осуществления, приемник (431) может принимать дополнительные (избыточные) данные с кодированным видео. Дополнительные данные могут быть включены как часть кодированной видеопоследовательности(ей). Дополнительные данные могут использоваться видеодекодером (410) для правильного декодирования данных и/или более точной реконструкции исходных видеоданных. Дополнительные данные могут представлять собой, например, слои улучшения во времени, пространстве или отношения сигнал/шум (SNR, signal noise ratio), избыточные слайсы, избыточные изображения, коды прямой коррекции ошибок и т.д.
[0055] На фиг. 5 показана блок-схема видеокодера (503) согласно варианту осуществления настоящего изобретения. Видеокодер (503) входит в состав электронного устройства (520). Электронное устройство (520) включает в себя передатчик (540) (например, передающую схему). Видеокодер (503) может использоваться вместо видеокодера (303) в примере, приведенном на фиг. 3.
[0056] Видеокодер (503) может принимать отсчеты видео от источника (501) видеосигнала (который не входит в состав электронного устройства (520) в примере, показанном на фиг. 5), который может захватывать видеоизображение(я), подлежащее(ие) кодированию видеокодером (503). В другом примере источник (501) видеосигнала входит в состав электронного устройства (520).
[0057] Источник (501) видеосигнала может обеспечивать исходную видеопоследовательность, подлежащую кодированию видеокодером (503) в форме потока отсчетов цифрового видео любой подходящей битовой глубины (например: 8 бит, 10 бит, 12 бит, …), любого цветового пространства (например, ВТ.601 Y CrCb, RGB, …), и любой подходящей структуры дискретизации (например, Y CrCb 4:2:0, Y CrCb 4:4:4). В системе службы массовой информации источником (501) видеосигнала может быть запоминающее устройство, где хранится ранее подготовленное видео. В системе видеоконференцсвязи источником (501) видеосигнала может быть камера, которая захватывает информацию локального изображения как видеопоследовательность. Видеоданные могут обеспечиваться как множество отдельных изображений, которые создают ощущение движения при наблюдении в последовательности. Сами изображения могут быть организованы как пространственный массив пикселей, где каждый пиксель может содержать один или более отсчетов в зависимости от используемых структуры дискретизации, цветового пространства и т.д. Специалисту в данной области техники нетрудно понять соотношение между пикселями и отсчетами. Нижеследующее описание касается отсчетов.
[0058] Согласно варианту осуществления, видеокодер (503) может кодировать и сжимать изображения исходной видеопоследовательности в кодированную видеопоследовательность (543) в реальном времени или с учетом любых других временных ограничений, налагаемых применением. Установление надлежащей скорости кодирования является одной из функций контроллера (550). В некоторых вариантах осуществления контроллер (550) управляет другими функциональными модулями, как описано ниже, и функционально подключен к другим функциональным модулям. Подключение для простоты не показано. Параметры, установленные контроллером (550), могут включать в себя параметры, связанные регулировкой частоты (пропуск изображения, квантователь, значение лямбда, применяемое при оптимизации скорости-искажения, …), размер изображения, схему групп изображений (GOP, group of pictures), максимальную зону поиска вектора движения и т.д. Контроллер (550) может быть выполнен с возможностью иметь другие подходящие функции, относящиеся к видеокодеру (503), оптимизированному для той или иной конструкции системы.
[0059] В некоторых вариантах осуществления видеокодер (503) выполнен с возможностью работать в петле кодирования. В качестве очень упрощенного описания, в порядке примера, петля кодирования может включать в себя кодер (530) источника (например, отвечающий за создание символов, например, потока символов, на основе входного изображения, подлежащего кодированию, и опорного(ых) изображения(ий)) и (локальный) декодер (533), встроенный в видеокодер (503). Декодер (533) реконструирует символы для создания данных отсчетов, аналогично тому, как это делал бы (удаленный) декодер (поскольку любое сжатие между символами и битовым потоком кодированного видео происходит без потерь в технологиях сжатия видео, рассматриваемых в раскрытом изобретении). Реконструированный поток отсчетов (данные отсчетов) поступает в память (534) опорных изображений. Поскольку декодирование потока символов приводит к результатам, с точностью до бита, не зависящим от положения декодера (локального или удаленного), содержимое памяти (534) опорных изображений также будет одинаковым с точностью до бита для локального кодера и удаленного кодера. Другими словами, предсказанная часть кодера "видит" в качестве отсчетов опорного изображения точно такие же значения отсчетов, как "видел" бы декодер при использовании предсказания в ходе декодирования. Этот фундаментальный принцип синхронизма опорного изображения (и, в итоге, дрейф, если синхронизм не удается поддерживать, например, вследствие канальных ошибок) используется также в некоторых связанных областях техники.
[0060] "Локальный" декодер (533) может действовать таким же образом, как "удаленный" декодер, например, видеодекодер (410), подробно вышеописанный со ссылкой на фиг. 4. Однако, опять же, согласно фиг. 4, поскольку символы доступны, и кодирование/декодирование символов в кодированную видеопоследовательность энтропийным кодером (545) и анализатором (420) может осуществляться без потерь, части энтропийного декодирования видеодекодера (410), включающие в себя буферную память (415) и анализатор (420), могут быть не полностью реализованы в локальном декодере (533).
[0061] При этом можно сделать вывод, что любая технология декодирования, присутствующая в декодере, за исключением анализа/энтропийного декодирования, также обязательно должна присутствовать, по существу, в идентичной функциональной форме в соответствующем кодере. По этой причине раскрытое изобретение сконцентрировано на работе декодера. Описание технологий кодирования может быть сокращено, поскольку они являются обратными подробно описанным технологиям декодированная. Только в некоторых областях требуется более детальное описание, которое приведено ниже.
[0062] Согласно некоторым примерам, в ходе работы кодер (530) источника может осуществлять кодирование с предсказанием и компенсацией движения, при котором входное изображение кодируется с предсказанием на основании одного или более ранее кодированных изображений из видеопоследовательности, указанных как "опорные изображения". Таким образом, машина (532) кодирования кодирует различия между пиксельными блоками входного изображения и пиксельными блоками опорного изображения(й), которое(ые) может(ут) выбираться в качестве предсказанной(ых) ссылки(ок) на входное изображение.
[0063] Локальный видеодекодер (533) может декодировать кодированные видеоданные изображений, которые могут быть указаны как опорные изображения, на основе символов, созданных кодером (530) источника. Операции машины (532) кодирования могут быть преимущественно процессами с потерями. Когда кодированные видеоданные могут декодироваться в видеодекодере (не показан на фиг. 5), реконструированная видеопоследовательность обычно может представлять собой копию исходной видеопоследовательности с некоторыми ошибками. Локальный видеодекодер (533) дублирует процессы декодирования, которые могут осуществляться видеодекодером на опорных изображениях, и может предписывать сохранение реконструированных опорных изображений в кэш-памяти (534) опорных изображений. Таким образом, видеокодер (503) может локально сохранять копии реконструированных опорных изображений, имеющие такое же содержимое, как реконструированные опорные изображения, которые будут получены видеодекодером на стороне приемника (в отсутствие ошибок передачи).
[0064] Предсказатель (535) может осуществлять поиски предсказания для машины (532) кодирования. Таким образом, для нового изображения, подлежащего кодированию, предсказатель (535) может искать в памяти (534) опорных изображений данные отсчетов (в качестве кандидатов на роль опорных пиксельных блоков) или те или иные метаданные, например, векторы движения опорного изображения, формы блоков и т.д., которые могут служить надлежащей ссылкой для предсказания новых изображений. Предсказатель (535) может работать на основе "блоки отсчетов х пиксельные блоки" для нахождения надлежащих ссылок для предсказания. В ряде случаев, согласно результатам поиска, полученным предсказателем (535), входное изображение может иметь ссылки для предсказания, извлеченные из множества опорных изображений, хранящихся в памяти (534) опорных изображений.
[0065] Контроллер (550) может управлять операциями кодирования кодера (530) источника, включая, например, установление параметров и параметров подгруппы, используемых для кодирования видеоданных.
[0066] Выходной сигнал всех вышеупомянутых функциональных модулей может подвергаться энтропийному кодированию в энтропийном кодере (545). Энтропийный кодер (545) переводит символы, сгенерированные различными функциональными модулями, в кодированную видеопоследовательность путем сжатия символов без потерь согласно технологиям, например, кодирования по Хаффману, кодирования с переменной длиной серии, арифметического кодирования и т.д.
[0067] Передатчик (540) может буферизовать кодированную(ые) видеопоследовательность(и), созданную энтропийным кодером (545), для подготовки к передаче через канал (560) связи, который может быть аппаратной/программной линией связи с запоминающим устройством, где хранятся кодированные видеоданные. Передатчик (540) может объединять кодированные видеоданные от видеокодера (503) с другими данными, подлежащими передаче, например, кодированными аудиоданными и/или вспомогательными потоками данных (источники не показаны).
[0068] Контроллер (550) может управлять работой видеокодера (503). В ходе кодирования контроллер (550) может назначать каждому кодированному изображению тот или иной тип кодированного изображения, который может определять методы кодирования, применимые к соответствующему изображению. Например, изображениям часто могут назначаться следующие типы изображения:
[0069] Интра-изображение (I-изображение), которое можно кодировать и декодировать без использования какого-либо другого изображения в последовательности в качестве источника предсказания. Некоторые видеокодеки допускают разные типы интра-изображений, включая, например, изображения в формате независимого обновления декодера ("IDR", Independent Decoder Refresh). Специалисту в данной области техники известны разновидности I-изображений и их соответствующие варианты применения и особенности.
[0070] Предсказанное изображение (Р-изображение), которое можно кодировать и декодировать с использованием внутреннего предсказания или внешнего предсказания с использованием не более одного вектора движения и опорного индекса для предсказания значений отсчетов каждого блока.
[0071] Двунаправленно-предсказанное изображение (В-изображение), которое можно кодировать и декодировать с использованием внутреннего предсказания или внешнего предсказания с использованием не более двух векторов движения и опорных индексов для предсказания значений отсчетов каждого блока. Аналогично, мультипредсказанные изображения могут использовать более двух опорных изображений и связанные метаданные для реконструкции единого блока.
[0072] Исходные изображения обычно допускают пространственное разделение на множество блоков отсчетов (например, блоки 4×4, 8×8, 4×8 или 16×16 отсчетов каждый) и кодирование на поблочной основе (блок за блоком). Блоки могут кодироваться предиктивно со ссылкой на другие (ранее кодированные) блоки, определенные назначением кодирования, применяемым к соответствующим изображениям этих блоков. Например, блоки I-изображений могут кодироваться без предсказания или с предсказанием со ссылкой на ранее кодированные блоки того же изображения (пространственным или внутренним предсказанием). Пиксельные блоки Р-изображений могут кодироваться с предсказанием, посредством пространственного предсказания или временного предсказания со ссылкой на одно ранее кодированное опорное изображение. Блоки В-изображений могут кодироваться с предсказанием, посредством пространственного предсказания или временного предсказания со ссылкой на одно или два ранее кодированных опорных изображения.
[0073] Видеокодер (503) может осуществлять операции кодирования согласно заранее заданной технологии или стандарту видеокодирования, например, ITU-T Rec. Н.265. В своей работе видеокодер (503) может осуществлять различные операции сжатия, в том числе операции предиктивного кодирования, которые используют временные и пространственные избыточности во входной видеопоследовательности. Поэтому кодированные видеоданные могут согласовываться с синтаксисом, заданным используемой технологией или стандартом видеокодирования.
[0074] Согласно варианту осуществления, передатчик (540) может передавать дополнительные данные с кодированным видео. Кодер (530) источника может включать такие данные как часть кодированной видеопоследовательности. Дополнительные данные могут содержать временные/пространственные/SNR слои улучшения, другие формы избыточных данных, например, избыточные изображения и слайсы, сообщения SEI, фрагменты набора параметров VUI и т.д.
[0075] Видео может захватываться как множество исходных изображений (видеоизображений) во временной последовательности. Предсказание внутри изображения (часто сокращенно именуемое внутренним предсказанием) использует пространственную корреляцию в данном изображении, а предсказание между изображениями использует (временную или иную) корреляцию между изображениями. Например, конкретное изображение, подлежащее кодированию/декодированию, которое именуется текущим изображением, разбивается на блоки. Когда блок в текущем изображении аналогичен опорному блоку в ранее кодированном и все еще буферизованном опорном изображении в видео, блок в текущем изображении может кодироваться вектором, который именуется вектором движения. Вектор движения указывает на опорный блок в опорном изображении и может иметь третье измерение, идентифицирующее опорное изображение, в случае использования множественных опорных изображений.
[0076] В некоторых вариантах осуществления в предсказании между изображениями может использоваться метод двойного предсказания. Согласно методу двойного предсказания, используются два опорных изображения, например, первое опорное изображение и второе опорное изображение, которые оба предшествуют в порядке декодирования текущему изображению в видео (но могут быть в прошлом и будущем, соответственно, в порядке отображения). Блок в текущем изображении может кодироваться первым вектором движения, который указывает на первый опорный блок в первом опорном изображении, и вторым вектором движения, который указывает на второй опорный блок во втором опорном изображении. Блок может предсказываться комбинацией первого опорного блока и второго опорного блока.
[0077] Дополнительно, метод режима слияния может использоваться в предсказании между изображениями для повышения эффективности кодирования.
[0078] Согласно некоторым вариантам осуществления изобретения, предсказания, например, предсказания между изображениями и предсказания внутри изображения, осуществляются поблочно. Например, согласно стандарту HEVC, изображение в последовательности видеоизображений разбивается на единицы дерева кодирования (CTU, coding tree units) для сжатия, при этом CTU в изображении имеют одинаковый размер, например 64×64 пикселя, 32×32 пикселя или 16×16 пикселей. В общем случае CTU включает в себя три блока дерева кодирования (СТВ, coding tree blocks), а именно, один СТВ яркости и два СТВ цветности. Каждый CTU может рекурсивно делиться квадрадеревом на одну или несколько единиц кодирования (CU). Например, CTU размером 64×64 пикселя может делиться на одну CU размером 64×64 пикселя или 4 CU размером 32×32 пикселя или 16 CU размером 16×16 пикселей. Например, каждая CU анализируется для определения типа предсказания для CU, например, типа внешнего предсказания или типа внутреннего предсказания. CU делится на одну или более единиц предсказания (PU) в зависимости от временной и/или пространственной предсказуемости. В целом, каждая PU включает в себя блок предсказания (РВ) яркости и два РВ цветности. Согласно варианту осуществления, операция предсказания при кодировании (кодировании/декодировании) осуществляется в единице блока предсказания. Используя блок предсказания яркости в качестве примера блока предсказания, блок предсказания включает в себя матрицу значений (например, значений яркости) для пикселей, например, 8×8 пикселей, 16×16 пикселей, 8×16 пикселей, 16×8 пикселей и т.п.
[0079] На фиг. 6 показана схема видеокодера (603) согласно другому варианту осуществления изобретения. Видеокодер (603) выполнен с возможностью приема блока обработки (например, блока предсказания) значений отсчетов в текущем видеоизображении в последовательности видеоизображений и кодирования блока обработки в кодированное изображение, которое составляет часть кодированной видеопоследовательности. Например, видеокодер (603) используется вместо видеокодера (303) в примере, приведенном на фиг. 3.
[0080] В примере HEVC видеокодер (603) принимает матрицу значений отсчетов для блока обработки, например, блока предсказания 8×8 отсчетов и т.п. Видеокодер (603) определяет, наилучшим ли образом кодируется блок обработки в интра-режиме, интер-режиме или режиме двойного предсказания с использованием, например, оптимизации зависимости искажений от скорости передачи. Когда блок обработки подлежит кодированию в интра-режиме, видеокодер (603) может использовать метод внутреннего предсказания для кодирования блока обработки в кодированное изображение; и когда блок обработки подлежит кодированию в интеррежиме или режиме двойного предсказания, видеокодер (603) может использовать метод внешнего предсказания или двойного предсказания, соответственно, для кодирования блока обработки в кодированное изображение. В некоторых технологиях видеокодирования режим слияния может быть подрежимом предсказания между изображениями, где вектор движения выводится из одного или более предсказателей вектора движения без привлечения кодированного компонента вектора движения вне предсказателей. В некоторых других технологиях видеокодирования может присутствовать компонент вектора движения, применимый к данному блоку. В порядке примера, видеокодер (603) включает в себя другие компоненты, например, модуль определения режима (не показан) для определения режима блоков обработки.
[0081] В примере, приведенном на фиг. 6, видеокодер (603) включает в себя интер-кодер (630), интра-кодер (622), вычислитель (623) остатка, переключатель (626), кодер (624) остатка, общий контроллер (621) и энтропийный кодер (625), соединенные друг с другом как показано на фиг. 6.
[0082] Интер-кодер (630) выполнен с возможностью приема отсчетов текущего блока (например, блока обработки), сравнения блока с одним или более опорными блоками в опорных изображениях (например, блоками в предыдущих изображениях и более поздних изображениях), генерации информации внешнего предсказания (например, описания избыточной информации согласно методу внутреннего кодирования, векторов движения, информации режима слияния), и вычисления результатов внешнего предсказания (например, блока предсказания) на основании информации внешнего предсказания с использованием любого подходящего метода. В некоторых примерах опорными изображениями являются декодированные опорные изображения, которые декодируются на основе информации кодированного видео.
[0083] Интра-кодер (622) выполнен с возможностью приема отсчетов текущего блока (например, блока обработки), в ряде случаев сравнения блока с блоками, ранее кодированными в том же изображении, генерирования квантованных коэффициентов после преобразования, и в ряде случаев также информации внутреннего предсказания (например, информации направления внутреннего предсказания согласно одному или более методам внутреннего кодирования). В порядке примера, интра-кодер (622) также вычисляет результаты внутреннего предсказания (например, блок предсказания) на основании информации внутреннего предсказания и опорных блоков в том же изображении.
[0084] Общий контроллер (621) выполнен с возможностью определения общих данных управления и управления другими компонентами видеокодера (603) на основе общих данных управления. Например, общий контроллер (621) определяет режим блока и выдает сигнал управления на переключатель (626) на основе режима. Например, когда режим является интра-режимом, общий контроллер (621) управляет переключателем (626) для выбора результата интра-режима для использования вычислителем (623) остатка, и управляет энтропийным кодером (625) для выбора информации внутреннего предсказания и включения информации внутреннего предсказания в битовый поток; и когда режим является интер-режимом, общий контроллер (621) управляет переключателем (626) для выбора результата внешнего предсказания для использования вычислителем (623) остатка, и управляет энтропийным кодером (625) для выбора информации внешнего предсказания и включения информации внешнего предсказания в битовый поток.
[0085] Вычислитель (623) остатка выполнен с возможностью вычисления разности (данных остатка) между принятым блоком и результатами предсказания, выбранными из интра-кодера (622) или интер-кодера (630). Кодер (624) остатка выполнен с возможностью действовать на основе данных остатка для кодирования данных остатка для генерации коэффициентов преобразования. В примере кодировщик остатков (624) сконфигурирован для преобразования данных остатков из пространственной области в частотную область и генерации коэффициентов преобразования. Затем коэффициенты преобразования подвергаются обработке квантованием для получения квантованных коэффициентов преобразования. В различных вариантах осуществления видеокодер (603) также включает в себя декодер (628) остатка. Декодер (628) остатка выполнен с возможностью осуществления обратного преобразования и генерирования декодированных данных остатка. Декодированные данные остатка могут надлежащим образом использоваться интра-кодером (622) и интер-кодером (630). Например, интер-кодер (630) может генерировать декодированные блоки на основе декодированных данных остатка и информации внешнего предсказания, и интра-кодер (622) может генерировать декодированные блоки на основе декодированных данных остатка и информации внутреннего предсказания. Декодированные блоки надлежащим образом обрабатываются для генерации декодированных изображений, и декодированные изображения могут буферизоваться в схеме памяти (не показана) и в некоторых примерах использоваться в качестве опорных изображений.
[0086] Энтропийный кодер (625) выполнен с возможностью форматирования битового потока так, чтобы он включал в себя кодированный блок. Энтропийный кодер (625) выполнен с возможностью включать различную информацию согласно подходящему стандарту, например, стандарту HEVC. Например, энтропийный кодер (625) выполнен с возможностью включать общие данные управления, выбранную информацию предсказания (например, информацию внутреннего предсказания или информацию внешнего предсказания), информацию остатка и другую подходящую информацию в битовый поток. Заметим, что, согласно раскрытому изобретению, при кодировании блока в подрежиме слияния любого из интер-режима и режима двойного предсказания, информация остатка отсутствует.
[0087] На фиг. 7 показана схема видеодекодера (710) согласно другому варианту осуществления изобретения. Видеодекодер (710) выполнен с возможностью приема кодированных изображений, составляющих часть кодированной видеопоследовательности, и декодирования кодированных изображений для генерации реконструированных изображений. Например, видеодекодер (710) используется вместо видеодекодера (310) в примере, приведенном на фиг. 3.
[0088] В примере, приведенном на фиг. 7, видеодекодер (710) включает в себя энтропийный декодер (771), интер-декодер (780), декодер (773) остатка, модуль (774) реконструкции и интра-декодер (772), соединенные друг с другом как показано на фиг. 7.
[0089] Энтропийный декодер (771) может быть выполнен с возможностью реконструкции, из кодированного изображения, некоторых символов, которые представляют синтаксические элементы, образующие кодированное изображение. Такие символы могут включать в себя, например, режим кодирования блока (например, интра-режим, интер-режим, режим двойного предсказания, причем последние два в подрежиме слияния или другом подрежиме), информацию предсказания (например, информацию внутреннего предсказания или информацию внешнего предсказания), которая может идентифицировать определенный отсчет или метаданные, используемые для предсказания интра-декодером (772) или интер-декодером (780), соответственно, информацию остатка в форме, например, квантованных коэффициентов преобразования и т.п. Например, когда режим предсказания является режимом внутреннего или двойного предсказания, информация внешнего предсказания поступает в интер-декодер (780); а когда тип предсказания является типом внутреннего предсказания, информация внутреннего предсказания поступает на интра-декодер (772). Информация остатка может подвергаться обратному квантованию и поступать в декодер (773) остатка.
[0090] Интер-декодер (780) выполнен с возможностью приема информации внешнего предсказания и генерирования результатов внешнего предсказания на основании информации внешнего предсказания.
[0091] Интра-декодер (772) выполнен с возможностью приема информации внутреннего предсказания и генерирования результатов предсказания на основании информации внутреннего предсказания.
[0092] Декодер (773) остатка выполнен с возможностью осуществления обратного квантования для извлечения деквантованных коэффициентов преобразования и обработки деквантованных коэффициентов преобразования для преобразования остатка из частотной области в пространственную область. Декодер (773) остатка также может требовать некоторой информации управления (включать параметр квантователя (QP, Quantizer Parameter)), и эта информация может обеспечиваться энтропийным декодером (771) (путь данных не показан, поскольку это может быть только информация управления малого объема).
[0093] Модуль (774) реконструкции выполнен с возможностью слияния, в пространственной области, остатка на выходе декодера (773) остатка и результатов предсказания (на выходе модулей внешнего или внутреннего предсказания, в зависимости от ситуации) для формирования реконструированного блока, который может входить в состав реконструированного изображения, которое, в свою очередь, может входить в состав реконструированного видео. Заметим, что другие подходящие операции, например, операция деблокирования и т.п., может осуществляться для повышения визуального качества.
[0094] Следует отметить, что видеокодеры (303), (503) и (603) и видеодекодеры (310), (410) и (710) могут быть реализованы с использованием любого подходящего метода. Согласно варианту осуществления, видеокодеры (303), (503) и (603) и видеодекодеры (310), (410) и (710) могут быть реализованы с использованием одной или более интегральных схем. В другом варианте осуществления видеокодеры (303), (503) и (503) и видеодекодеры (310), (410) и (710) могут быть реализованы с использованием одного или более процессоров, которые выполняют программные инструкции.
[0095] В соответствии с некоторыми вариантами осуществления размер списка наиболее вероятных режимов (МРМ, Most Probable Mode) устанавливается равным 6 как для смежной опорной линии (например, нулевой опорной линии), так и для несмежных опорных линий (например, ненулевых опорных линий). Положения соседних режимов, используемых для получения 6 кандидатов МРМ, также могут быть одинаковыми для смежных и несмежных опорных линий, что показано на фиг. 8. На фиг. 8 блок А и блок В обозначают верхний и левый соседние блоки кодирования текущего блока 800, а переменные candlntraPredModeA и candlntraPredModeB обозначают режимы внутреннего предсказания блока А и В, соответственно. Переменные candlntraPredModeA и candlntraPredModeB могут быть изначально заданы равными INTRA PLANAR. Если блок А (или В) помечен как доступный, переменная candlntraPredModeA (или candlntraPredModeB) может быть задана равной фактическому режиму внутреннего предсказания блока А (или В).
[0096] Процесс получения кандидата МРМ может отличаться для смежных и несмежных опорных линий. Например, для нулевой опорной линии, если режимы для двух соседних блоков являются планарными или режимами DC, режимы по умолчанию используются для построения списка МРМ, где первые два кандидата являются планарными и режимами DC, а остальные четыре режима являются угловыми режимами (например, угловыми режимами по умолчанию). Для ненулевых опорных линий, если режимы двух соседних блоков являются планарными или режимами DC, для построения списка МРМ могут использоваться 6 угловых режимов по умолчанию. Вариант процесса получения списка МРМ показан в Приложении 1, где candModeList[х] с х=0…5 обозначает 6 кандидатов МРМ, IntraLumaRefLineIdx[ХСВ][YCB] обозначает индекс опорной линии предсказываемого блока, a IntraLumaRefLineIdxf[xcb][YCB] может иметь значение 0,1 или 3. В некоторых примерах реализован унифицированный подход внутреннего кодирования, при котором планарный режим ставится в качестве первого МРМ.
[0097] Блочная дифференциальная импульсно-кодовая модуляция (BPDCM) это инструмент внутреннего кодирования, который использует подход дифференциальной импульсно-кодовой модуляции (DPCM) на уровне блоков. В некоторых вариантах осуществления bdpcm_flag передается на уровне CU всякий раз, когда это внутренне кодированная CU яркости, имеющая каждый размер меньше или равный 32. Этот флаг указывает, используется обычное внутреннее кодирование или DPCM. Этот флаг может быть кодирован с использованием единого контекста САВАС.
[0098] В некоторых вариантах осуществления BDPCM использует медианный детектор края LOCO-I (используется в JPEG-LS). Для текущего пикселя X, имеющего пиксель А в качестве левого соседа, пиксель В в качестве верхнего соседа и С в качестве верхнего левого соседа, предсказание Р(Х) может быть определено так:
Figure 00000001
А+В-С иначе
[0099] Предсказатель может использовать нефильтрованные опорные пиксели при предсказании из верхней строки и левого столбца CU. Затем предсказатель может использовать реконструированные пиксели для остальной части CU. Пиксели могут обрабатываться в порядке растрового сканирования внутри CU. Ошибка предсказания может быть квантована в пространственной области после масштабирования способом, идентичным квантователю пропуска преобразования. Каждый пиксель может быть реконструирован путем добавления к предсказанию деквантованной ошибки предсказания. Таким образом, реконструированные пиксели могут быть использованы для предсказания следующих пикселей в порядке растрового сканирования. Амплитуда и знаки ошибки квантованного предсказания могут быть кодированы отдельно.
[0100] В некоторых вариантах осуществления кодируется cbf_bdpcm_flag. Если этот флаг равен 0, все амплитуды блока могут быть декодированы как ноль. Если этот флаг равен 1, все амплитуды блока могут быть кодированы индивидуально в порядке растрового сканирования. Чтобы снизить сложность, в некоторых примерах амплитуда может быть ограничена не более чем 31 (включительно). Амплитуда может быть кодирована с использованием унарной бинаризации с тремя контекстами для первой позиции, затем по одному контексту для каждой дополнительной позиции до 12-й позиции и по одному контексту для всех остальных позиций. Знак может быть кодирован в режиме обхода для каждого нулевого остатка.
[0101] В некоторых вариантах осуществления для поддержания согласованности регулярного режима внутреннего предсказания первый режим в списке МРМ связан с CU "блочный-DPCM" (без передачи) и доступен для генерации МРМ для последующих блоков. Фильтр деблокирования может быть деактивирован на границе между двумя блоками BDPCM, поскольку ни один из блоков не использует этап преобразования, обычно отвечающий за блокировку артефактов. В некоторых вариантах осуществления BDPCM не использует никаких других этапов, кроме описанных здесь. Например, BPDCM не использует никаких преобразований.
[0102] Согласно некоторым вариантам осуществления, метод BDPCM использует реконструированные отсчеты для предсказания строк или столбцов CU построчно. Передаваемое направление BDPCM может указывать, используется ли вертикальное или горизонтальное предсказание. Используемые опорные пиксели могут быть нефильтрованными отсчетами. Ошибка предсказания может быть квантована в пространственной области. Каждый пиксель может быть восстановлен путем добавления к предсказанию деквантизированной ошибки предсказания.
[0103] В некоторых вариантах осуществления, в качестве альтернативной схемы BDPCM может выполняться BDPCM с квантованной остаточной областью. Направления передачи сигнала и предсказания, используемые в квантованном остаточном BDPCM, могут быть идентичны схеме ВРСМ. Внутреннее предсказание может быть выполнено для всего блока путем копирования отсчетов в направлении предсказания (горизонтальное или вертикальное предсказание), аналогичном внутреннему предсказанию. Остаток может быть квантован, и разность между квантованным остатком и квантованным значением предсказателя квантованного остатка (горизонтальным или вертикальным) может быть кодирована, что описано в следующих раскрытых вариантах осуществления.
[0104] Для блока размером М (строк) × N (столбцов) пусть ri,j, 0≤i≤М-1, 0≤j≤N-1 - остаток предсказания после выполнения внутреннего предсказания по горизонтали (копирование значения пикселя левого соседа по предсказанному блоку строкой за строкой) или по вертикали (копирование строки верхнего соседа в каждую строку в предсказанном блоке) с использованием нефильтрованных отсчетов сверху или граничных отсчетов левого блока. Пусть Q(ri,j), 0≤i≤М-1, 0≤j≤N-1 обозначает квантованную версию остатка Гц, где остаток это разница между исходным блоком и предсказанными значениями блока. Затем BDPCM применяется к квантованным отсчетам остатка, в результате чего получается модифицированный массив
Figure 00000002
с элементами
Figure 00000003
. В некоторых примерах, при передаче вертикального BDPCM:
Figure 00000004
[0105] В некоторых примерах для горизонтального предсказания применяются аналогичные правила, и квантованные отсчеты остатка могут быть получены с помощью:
Figure 00000005
[0106] Квантованные отсчеты остатка
Figure 00000003
могут быть отправлены в декодер. На стороне декодера в некоторых примерах приведенные выше вычисления меняются местами для получения Q(ri,j), 0≤i≤М-1, 0≤j≤N-1.. В некоторых вариантах осуществления для случая вертикального предсказания: Уравнение (4):
Figure 00000006
[0107] В некоторых вариантах осуществления для случая горизонтального предсказания:
Figure 00000007
[0108] Обратные квантованные остатки, Q-1 (ri,j)), могут быть добавлены к значениям внутриблочного предсказания для получения реконструированных значений отсчетов. Одним из преимуществ этой схемы является то, что обратный DPCM может выполняться "на лету" во время анализа коэффициентов путем добавления предсказателя по мере анализа коэффициентов, или его можно выполнить после анализа. Таким образом, разделение блоков 4×N и N×4 на 2 параллельно обрабатываемых блока может быть устранено.
[0109] В некоторых вариантах осуществления кодированный блок BDPCM связан с режимом внутреннего предсказания, который является первым МРМ (т.е. МРМО). В результате при получении списка МРМ, если соседний блок кодирован в режиме BDPCM, используется связанный с ним режим внутреннего предсказания (т.е. МРМО). Кроме того, когда блок цветности кодируется с использованием режима DM, а совместно расположенный блок яркости кодируется с использованием режима BDPCM, режим внутреннего предсказания, связанный с совместно расположенным блоком яркости (т.е. МРМО), используется в качестве режима внутреннего предсказания текущего блока цветности.
[0110] Таблица 1 (ниже) иллюстрирует вариант синтаксиса и семантики метода BDPCM.
Figure 00000008
Figure 00000009
[0111] В некоторых вариантах осуществления переменная bdpcm_flag[х0][у0], равная 1, указывает, что bdpcm_dir_flag присутствует в единице кодирования, включая блок кодирования яркости в местоположении (х0, у0). В некоторых вариантах осуществления bdpcm_dir_flag[х0][у0], равный 0, указывает, что направление предсказания, используемое в блоке bdpcm, является горизонтальным, в противном случае направление предсказания является вертикальным.
[0112] Как понимают специалисты в этой области, BDPCM вносит значительный вклад в кодирование видеоконтента на экране, который обычно характеризуется выраженными краями. Однако, когда BDPCM используется совместно с режимами МРМ или DM, кодированный блок BDPCM всегда связан с планарным режимом, что может негативно влиять на коэффициент кодирования видеоконтента на экране. Варианты осуществления настоящего изобретения устраняют эти недостатки.
[0113] Варианты осуществления настоящего изобретения могут использоваться отдельно или комбинироваться в любом порядке. Кроме того, каждый из способов, кодер и декодер в соответствии с вариантами осуществления настоящего изобретения могут быть реализованы с помощью схем обработки (например, одного или нескольких процессоров или одной или нескольких интегральных схем). В одном из примеров один или несколько процессоров выполняют программу, которая хранится на компьютерно-считываемом носителе. В соответствии с вариантами осуществления настоящего изобретения термин "блок" может интерпретироваться как блок предсказания, блок кодирования или единица кодирования (т.е. CU).
[0114] Согласно некоторым вариантам осуществления, когда bdpcm_dir_flag равен 0, горизонтальное предсказание используется для предсказания остатка BDPCM, а когда bdpcm_dir_flag равен 1, вертикальное предсказание используется для предсказания остатка BDPCM. Однако в других вариантах осуществления также применяется противоположный подход, когда меняются местами направления предсказания bdpcm_dir_flag, равные 0 и 1.
[0115] В некоторых вариантах осуществления горизонтальный режим внутреннего предсказания представлен с использованием HOR_IDX, где в VVC HOR_IDX соответствует режиму внутреннего предсказания INTRA_ANGULAR18, а в HEVC HOR_IDX соответствует режиму внутреннего предсказания INTRA_ANGULAR10. В некоторых вариантах осуществления вертикальный режим внутреннего предсказания представлен с использованием VER_IDX, где в VVC VER_IDX соответствует режиму внутреннего предсказания INTRA_ANGULAR50, а в HEVC VER_IDX соответствует режиму внутреннего предсказания INTRA_ANGULAR26.
[0116] Согласно некоторым вариантам осуществления, при получении наиболее вероятных режимов внутреннего предсказания, если соседний блок кодируется режимом BDPCM, соседний блок ассоциируется с режимом внутреннего предсказания ipm, который определяется с использованием значения bdpcm_dir_flag, применяемого для этого соседнего блока, кодированного BDPCM, следующим образом:
Figure 00000010
где HOR_IDX и VER_IDX представляют режим горизонтального и вертикального внутреннего предсказания, соответственно, и bdpcm_dir_flag, равный 0, указывает, что горизонтальное предсказание используется для предсказания остатков BDPCM, а bdpcm_dir_flag, равный 1, указывает, что вертикальное предсказание используется для предсказания остатков BDPCM. После присвоения значения ipm режиму внутреннего предсказания это значение режима внутреннего предсказания рассматривается как режим внутреннего предсказания соседнего блока и используется для получения наиболее вероятного режима внутреннего предсказания текущего блока.
[0117] Приложение 2 иллюстрирует вариант осуществления процесса получения списка МРМ, в котором выделенная жирным шрифтом часть иллюстрирует, как режим внутреннего предсказания для кодированного блока BDPCM определяется на основе bdpcm_dir_flag. Пример ввода в этот процесс может включать: (i) местоположение яркости (ХСВ, yCb), указывающее верхний левый отсчет текущего блока кодирования яркости относительно верхнего левого отсчета яркости текущего изображения, (ii) переменная cbWidth, указывающая ширину текущего блока кодирования в отсчетах яркости, (iii) переменная cbHeight, указывающая высоту текущего блока кодирования в отсчетах яркости. В этом процессе Приложения 2 определяется режим внутреннего предсказания яркости IntraPredModeY[xCb][yCb].
[0118] В таблице 2 указано значение для режима внутреннего предсказания IlntraPredModeY[xCb][yCb] и связанных с ним имен. В таблице 2 в некоторых примерах режимы внутреннего предсказания INTRA_LT_CCLM, INTRA_L_CCLM и INTRA_T_CCLM применимы только к компонентам цветности.
Figure 00000011
[0119] Согласно некоторым вариантам осуществления, при определении режима внутреннего предсказания блока цветности, в то время как расположенный совместно с блоком цветности блок яркости кодируется с использованием режима BDPCM, если блок цветности предсказывается с использованием режима DM, режим внутреннего предсказания, используемый для выполнения режима внутреннего предсказания этого блока цветности, определяется следующим образом,
Figure 00000012
где HOR_IDX и VER_IDX представляют режим горизонтального и вертикального внутреннего предсказания, соответственно, и bdpcm_dir_flag, равный 0, указывает, что горизонтальное предсказание используется для предсказания остатков BDPCM, а bdpcm_dir_flag, равный 1, указывает, что вертикальное предсказание используется для предсказания остатков BDPCM. Соответственно, после присвоения значения dm это значение используется в качестве режима внутреннего предсказания блока цветности.
[0120] В соответствии с некоторыми вариантами осуществления, контекст, используемый для энтропийного кодирования bdpcm_dir_flag, зависит от значения bdpcm_dir_flag соседних блоков и/или от того, кодируется ли соседний блок режимом горизонтального внутреннего предсказания или режимом вертикального внутреннего предсказания.
[0121] В одном из вариантов осуществления только значения bdpcm_dir_flag и bdpcm_flag соседнего блока используются для получения контекста, применяемого для энтропийного кодирования bdpcm_dir_flag текущего блока. В одном из примеров используются два соседних блока (т.е. слева находится блок А на фиг. 8, а вверху - блок В на фиг. 8), и значение контекста (ctx) определяется следующим образом:
Figure 00000013
где dpcm_flagleft и dpcm_flagtop означают dpcm_flag левого и верхнего соседних блоков, соответственно, a bdpcm_dir_flagleft и bdpcm_dir_flagtop означают bdpcm_dir_flag левого и верхнего соседних блоков, соответственно. После присвоения ctx это значение может использоваться в качестве индекса для выбора одной из множества контекстных моделей.
[0122] В дополнение к предыдущему примеру, 9 контекстов могут быть сгруппированы заранее заданным образом, что приведет к меньшему количеству применяемых контекстов. Например, ctx=8 и ctx=7 в предыдущем примере могут быть объединены, и для обоих этих значений ctx может использоваться только один контекст.
[0123] В некоторых вариантах осуществления используются два соседних блока (т.е. левый и верхний), и значение контекста (ctx) определяется следующим образом, где dpcm_flagleft и dpcm_flagtop относятся к dpcm_flag левого и верхнего соседних блоков соответственно, a bdpcm_dir_flagleft и bdpcm_dir_flagtop относятся к bdpcm_dir_flag левого и верхнего соседних блоков, соответственно.
Figure 00000014
[0124] Фиг. 9 иллюстрирует вариант осуществления процесса, выполняемого декодером, таким как видеодекодер (710). Процесс может начинаться с шага (S900), чтобы определить, кодирован ли первый блок, связанный со вторым блоком, в режиме BDPCM. В некоторых примерах первый блок может быть блоком, который является пространственным соседом второго блока, расположенного в том же изображении, что и первый блок. В других примерах первый блок может быть блоком яркости, а второй блок блок цветности, где блок яркости расположен совместно с блоком цветности.
[0125] Если первый блок кодируется в режиме BDPCM, процесс переходит от этапа (S900) к этапу (S902), где первый блок связывают со значением режима внутреннего предсказания на основе флага направления BDPCM. Например, bdpcm_flag может указывать, что блок кодирован в режиме BDPCM, и bdpcm_dir_flag может использоваться для определения того, следует ли использовать горизонтальное направление или вертикальное направление. Процесс переходит к этапу (S904), чтобы определить значение режима внутреннего предсказания для второго блока, используя значение режима внутреннего предсказания, связанное с первым блоком. Например, на основе флага направления BDPCM значение режима внутреннего предсказания может быть одним из значений режима горизонтального внутреннего предсказания и вертикального режима внутреннего предсказания. Кроме того, если первый блок является пространственным соседом второго блока, значение режима внутреннего предсказания первого блока может использоваться для создания списка МРМ, где список МРМ используется для получения значения режима внутреннего предсказания второго блока. Кроме того, если второй блок является блоком цветности, который предсказывается с использованием режима DM, а первый блок является совместно расположенным блоком яркости, значение режима внутреннего предсказания второго блока может быть определено на основе значения режима внутреннего предсказания первого блока.
[0126] Процесс переходит к этапу (S906), на котором второй блок реконструируется с использованием определенного значения режима внутреннего предсказания второго блока. Процесс, проиллюстрированный на фиг. 9 может завершиться после завершения этапа (S906). Кроме того, возвращаясь к шагу (S900), если первый блок не кодирован в режиме BDPCM, процесс, проиллюстрированный на фиг. 9, может прекратиться.
[0127] Вышеописанные методы могут быть реализованы в виде компьютерного программного обеспечения, использующего компьютерно-считываемые инструкции и физически хранящегося на одном или более компьютерно-считываемых носителях. Например, на фиг. 10 показана компьютерная система (1000), пригодная для реализации некоторых вариантов осуществления раскрытого изобретения.
[0128] Компьютерное программное обеспечение может кодироваться с использованием любого подходящего машинного кода или компьютерного языка, который может подвергаться ассемблированию, компиляции, редактированию связей или аналогичной обработке для создания кода, содержащего инструкции, которые могут выполняться напрямую, или посредством интерпретации, выполнения микрокода и т.п., одним или более компьютерными центральными процессорами (CPU, central processing units), графическими процессорами (GPU, Graphics Processing Units) и т.п.
[0129] Инструкции могут выполняться на компьютерах различных типов или их компонентах, включая, например, персональные компьютеры, планшетные компьютеры, серверы, смартфоны, игровые устройства, устройства интернета вещей и т.п.
[0130] Компоненты компьютерной системы (1000), показанные на фиг. 10, носят иллюстративный характер и не призваны налагать какое-либо ограничение на объем применения или функциональные возможности компьютерного программного обеспечения, реализующего варианты осуществления настоящего изобретения. Конфигурацию компонентов также не следует интерпретировать как имеющую какую-либо зависимость или требование в связи с любым одним или комбинацией компонентов, показанных в иллюстративном варианте осуществления компьютерной системы (1000).
[0131] Компьютерная система (1000) может включать в себя некоторые устройства ввода интерфейса с человеком. Такое устройство ввода может отвечать за ввод одним или более пользователями посредством, например, тактильного ввода (например, нажатий на клавиши, махов, движений информационной перчатки), аудио-ввода (например, голосового, хлопков), визуального ввода (например, жестов), обонятельного ввода (не показан). Устройства интерфейса также могут использоваться для захвата некоторых информационных носителей, не обязательно напрямую связанных с осознанным вводом человеком, например звука (например, речи, музыки, внешнего звука), изображений (например, отсканированных изображений, фотографических изображений, полученных от камеры неподвижных изображений), видео (например, двухмерного видео, трехмерного видео, включающего в себя стереоскопическое видео).
[0132] Устройства ввода человеческого интерфейса могут включать в себя одно или несколько из следующего (только одно из каждого изображенного): клавиатуру (1001), мышь (1002), трекпад (1003), сенсорный экран (1010), перчатку для передачи данных (не показана), джойстик (1005), микрофон (1006), сканер (1007), камеру (1008).
[0133] Компьютерная система (1000) также может включать в себя некоторые устройства вывода интерфейса с человеком. Такие устройства вывода могут стимулировать органы чувств одного или более пользователей посредством, например, тактильного вывода, звука, света и запаха/вкуса. Такие устройства вывода могут включать в себя устройства тактильного вывода (например, тактильной обратной связи посредством сенсорного экрана (1010), информационной перчатки (не показана) или джойстика (1005), но также могут быть устройствами тактильной обратной связи, которые не служат устройствами ввода), устройства вывода аудио (например: громкоговорители (1009), наушники (не показаны)), устройства визуального вывода (например, экраны (1010), в том числе CRT-экраны, LCD-экраны, плазменные экраны, OLED-экраны, каждый с возможностями сенсорного экранного ввода или без них, каждый с возможностями тактильной обратной связи или без них, некоторые из которых способны к двухмерному визуальному выводу или более чем трехмерному выводу посредством, например, стереографического вывода; очков виртуальной реальности (не показаны), голографических дисплеев и дымовых баков (не показаны)) и принтеров (не показаны).
[0134] Компьютерная система (1000) также может включать в себя доступные человеку запоминающие устройства и связанные с ними носители, например, оптические носители, включающие в себя CD/DVD ROM/RW (1020) с носителями (1021) CD/DVD и т.п., карты (1022) флэш-памяти, сменный жесткий диск или твердотельный диск (1023), традиционные магнитные носители, например, ленту и флоппи-диск (не показан), специализированные устройства на основе ROM/ASIC/PLD, например, защитные аппаратные ключи (не показаны) и т.п.
[0135] Специалисты в данной области техники также должны понимать, что термин "компьютерно-считываемые носители", используемый в связи с раскрытым здесь изобретением, не охватывает среды передачи, несущие волны или другие кратковременные сигналы.
[0136] Компьютерная система (1000) также может включать в себя интерфейс к одной или более сетям связи. Сети могут, например, быть беспроводными, проводными, оптическими. Сети могут быть, дополнительно, локальными, глобальными, городскими, транспортными и промышленными, реального времени, допускающими задержку и т.д. Примеры сетей включают в себя локальные сети, например, Ethernet, беспроводные LAN, сотовые сети, в том числе GSM, 3G, 4G, 5G, LTE и т.п., глобальные цифровые сети проводного или беспроводного телевидения, в том числе кабельное телевидение, спутниковое телевидение и наземное телевещание, транспортные и промышленные включают в себя CANBus и т.д. Некоторые сети обычно требуют внешних адаптеров сетевого интерфейса, которые подключены к некоторым портам данных общего назначения или периферийным шинам (1049) (например, USB-порты компьютерной системы (1000)); другие обычно встраиваются в ядро компьютерной системы (1000) путем подключения к системной шине, как описано ниже (например, интерфейс Ethernet в компьютерную систему PC или интерфейс сотовой сети в компьютерную систему смартфона). Используя любую из этих сетей, компьютерная система (1000) может взаимодействовать с другими объектами. Такая связь может быть однонаправленной с возможностью только приема (например, телевещания), однонаправленной с возможностью только передачи (например, CANbus к некоторым устройствам CANbus) или двунаправленной, например, к другим компьютерным системам с использованием локальной или глобальной цифровой сети. Некоторые протоколы и стеки протоколов могут использоваться в каждой из этих сетей и вышеописанных сетевых интерфейсов.
[0137] Вышеупомянутые устройства человеческого интерфейса, доступные человеку запоминающие устройства и сетевые интерфейсы могут подключаться к ядру (1040) компьютерной системы (1000).
[0138] Ядро (1040) может включать один или несколько центральных процессоров (CPU) (1041), графические процессоры (GPU) (1042), специализированные программируемые модули обработки в форме вентильных матриц, программируемых пользователем (FPGA, Field Programmable Gate Arrays) (1043), аппаратные ускорители (1044) для некоторых задач и т.д. Эти устройства, совместно с постоянной памятью (ROM) (1045), оперативной памятью (1046), внутренним хранилищем данных большой емкости, например, внутренними жесткими дисками, недоступными пользователю, SSD и т.п. (1047), могут соединяться посредством системной шины (1048). В некоторых компьютерных системах системная шина (1048) может быть доступна в форме одного или более физических разъемов для обеспечения расширений за счет дополнительных CPU, GPU и т.п. Периферийные устройства могут подключаться либо напрямую к системной шине (1048) ядра, либо через периферийную шину (1049). Архитектуры периферийной шины включают в себя PCI, USB и т.п.
[0139] CPU (1041), GPU (1042), FPGA (1043) и ускорители (1044) могут выполнять некоторые инструкции, которые совместно могут составлять вышеупомянутый компьютерный код. Этот компьютерный код может храниться в ROM (1045) или RAM (1046). Переходные данные также могут храниться в оперативной памяти (1046), тогда как постоянные данные могут храниться, например, во внутреннем накопителе (1047). Быстрое сохранение и извлечение из любого запоминающего устройства может обеспечиваться за счет использования кэш-памяти, которая может быть тесно связана с один или более CPU (1041), GPU (1042), хранилищем (1047) данных большой емкости, ROM (1045), RAM (1046) и т.п.
[0140] На компьютерно-считываемых носителях может храниться компьютерный код для осуществления различных компьютерно-реализуемых операций. Носители и компьютерный код могут быть специально созданы в целях настоящего изобретения или могут относиться к хорошо известным и доступным специалистам в области компьютерного программного обеспечения.
[0141] В порядке примера, но не ограничения, компьютерная система, имеющая архитектуру (1000), и, в частности, ядро (1040) может обеспечивать функциональные возможности благодаря выполнению процессором(ами) (включающим(и) в себя CPU, GPU, FPGA, ускорители и т.п.) программного обеспечения, воплощенного в одном или более материальных компьютерно-считываемых носителей. Такие компьютерно-считываемые носители могут быть носителями, связанными с доступным пользователю хранилищем данных большой емкости, представленным выше, а также некоторым хранилищем ядра (1040), носящим долговременный характер, например, внутренним хранилищем (1047) данных большой емкости или ROM (1045). Программное обеспечение, реализующее различные варианты осуществления настоящего изобретения, может храниться в таких устройствах и выполняться ядром (1040). Компьютерно-считываемый носитель может включать в себя одно или более запоминающих устройств или микросхем, в соответствии с конкретными нуждами. Программное обеспечение может предписывать ядру (1040) и, в частности, его процессорам (включая CPU, GPU, FPGA и т.п.) выполнять конкретные процессы или конкретные части описанных здесь конкретных процессов, включая задание структур данных, хранящихся в RAM (1046), и модификацию таких структур данных согласно процессам, заданным программным обеспечением. Дополнительно или альтернативно, компьютерная система может обеспечивать функциональные возможности благодаря логике, зашитой или иным образом воплощенной в схеме (например, ускоритель (1044)), который может действовать вместо или совместно с программным обеспечением для выполнения конкретных процессов или конкретных частей описанных здесь конкретных процессов. Ссылка на программное обеспечение может охватывать логику, и наоборот, где это уместно. Ссылка на компьютерно-считываемые носители может охватывать схему (например, интегральную схему (1С, integrated circuit)), где хранится программное обеспечение для выполнения, схему, воплощающую логику для выполнения, или обе из них, когда это уместно. Настоящее изобретение охватывает любую подходящую комбинацию оборудования и программного обеспечения.
[0142] Хотя здесь описано несколько иллюстративных вариантов осуществления, возможны изменения, перестановки и различные эквиваленты для замены, которые находятся в объеме изобретения. Таким образом, специалисты в данной области техники могут предложить многочисленные системы и способы, которые, хотя в явном виде здесь не показаны и не описаны, воплощают принципы изобретения и, таким образом, соответствуют его сущности и объему.
[0143] (1) Способ декодирования видео, выполняемый в видеодекодере, включающий определение, кодирован ли первый блок, связанный со вторым блоком, в режиме блочной дифференциальной импульсно-кодовой модуляции (BDPCM), в ответ на определение того, что первый блок кодирован в режиме BDPCM, связывание первого блока со значением режима внутреннего предсказания на основе флага направления BDPCM; определение значения режима внутреннего предсказания для второго блока с использованием значения режима внутреннего предсказания, связанного с первым блоком; и реконструкцию второго блока с использованием определенного значения режима внутреннего предсказания.
[0144] (2) Способ по п. (1), в котором флаг направления BDPCM представляет собой либо (i) первое значение, связанное с горизонтальным направленным режимом внутреннего предсказания, либо (ii) второе значение, связанное с вертикальным направленным режимом внутреннего предсказания.
[0145] (3) Способ по п. (2), в котором общее количество режимов внутреннего предсказания составляет 67, где горизонтальный направленный режим внутреннего предсказания связан с угловым режимом 18, а вертикальный направленный режим внутреннего предсказания направления связан с угловым режимом 50.
[0146] (4) Способ по любому из п.п. (1)-(3), в котором определение, кодирован ли первый блок в режиме BDPCM, основано на значении флага BDPCM, указывающего на наличие флага направления BDPCM.
[0147] (5) Способ по любому из п.п. (1) (4), в котором первый блок и второй блок включены в одно и то же изображение, и первый блок пространственно соседствует со вторым блоком.
[0148] (6) Способ по п.(5), дополнительно включающий: получение списка кандидатов для второго блока с использованием процесса определения наиболее вероятного режима (МРМ), причем получение включает определение, кодирован ли первый блок в режиме BDPCM, при этом определение значения режима внутреннего предсказания для второго блока дополнительно включает использование полученного списка кандидатов.
[0149] (7) Способ по п. (6), в котором список кандидатов включает первое возможное значение режима внутреннего предсказания (Режим1), которое соответствует режиму внутреннего предсказания первого блока, и второе возможное значение режима внутреннего предсказания (Режим2), а также третье возможное значение режима внутреннего предсказания (Режим3), которые определены в соответствии с заранее заданным смещением от первого возможного значения режима внутреннего предсказания и операцией по модулю М, где М является степенью числа 2.
[0150] (8) Способ по любому из п.п. (1)-(7), в котором второй блок представляет собой блок цветности, а первый блок представляет собой блок яркости, расположенный совместно с блоком цветности.
[0151] (9) Способ по п.(8), дополнительно включающий определение, кодирован ли второй блок в режиме прямого копирования (DM); и определение, кодирован ли первый блок в режиме BDPCM, в ответ на определение того, что второй блок кодирован в режиме прямого копирования.
[0152] (10) Видеодекодер для декодирования видео, включающий схему обработки, выполненную с возможностью: определения, кодирован ли первый блок, связанный со вторым блоком, в режиме блочной дифференциальной импульсно-кодовой модуляции (BDPCM), в ответ на определение того, что первый блок кодирован в режиме BDPCM, связывание первого блока со значением режима внутреннего предсказания на основе флага направления BDPCM; определения значения режима внутреннего предсказания для второго блока с использованием значения режима внутреннего предсказания, связанного с первым блоком; и реконструкции второго блока с использованием определенного значения режима внутреннего предсказания.
[0153] (11) Видеодекодер по п. (10), в котором флаг направления BDPCM представляет собой или (i) первое значение, связанное с режимом направления горизонтального внутреннего предсказания, или (ii) второе значение, связанное с режимом направления вертикального внутреннего предсказания.
[0154] (12) Видеодекодер по п. (11), в котором общее количество режимов внутреннего предсказания составляет 67, где горизонтальный направленный режим внутреннего предсказания связан с угловым режимом 18, а вертикальный направленный режим внутреннего предсказания направления связан с угловым режимом 50.
[0155] (13) Видеодекодер по любому из п.п. (10)-(12), в котором определение, кодирован ли первый блок в режиме BDPCM, основано на значении флага BDPCM, который указывает на наличие флага направления BDPCM.
[0156] (14) Видеодекодер по любому из п.п. (10)-(13), в котором первый блок и второй блок включены в одно и то же изображение, и первый блок пространственно соседствует со вторым блоком.
[0157] (15) Видеодекодер по п. (14), в котором схема обработки дополнительно выполнена с возможностью: определения списка кандидатов для второго блока с использованием процесса определения наиболее вероятного режима (МРМ), причем определение списка включает определение, кодирован ли первый блок в режиме BDPCM, при этом определение значения режима внутреннего предсказания для второго блока дополнительно включает использование полученного списка кандидатов.
[0158] (16) Видеодекодер по п. (15), в котором список кандидатов включает первое возможное значение режима внутреннего предсказания (Режим1), которое соответствует режиму внутреннего предсказания первого блока, второе возможное значение режима внутреннего предсказания (Режим2) и третье возможное значение режима внутреннего предсказания (Режим3), которые определяются в соответствии с заранее заданным смещением от первого значения режима внутреннего предсказания кандидата и операцией по модулю М, где М является степенью 2.
[0159] (17) Видеодекодер по п. (10), в котором второй блок является блоком цветности, а первый блок является блоком яркости, расположенным совместно с блоком цветности.
[0160] (18) Видеодекодер по п. (17), в котором схема обработки дополнительно выполнена с возможностью определения, кодирован ли второй блок в режиме прямого копирования (DM), и в ответ на определение, что второй блок кодирован в режиме прямого копирования, определения, кодирован ли первый блок в режиме BDPCM.
[0161] (19) Компьютерно-считываемый носитель, на котором хранятся инструкции, которые, при выполнении процессором в видеодекодере, предписывают видеодекодеру осуществлять способ, включающий определение, кодирован ли первый блок, связанный со вторым блоком, в режиме блочной дифференциальной импульсно-кодовой модуляции (BDPCM), в ответ на определение того, что первый блок кодирован в режиме BDPCM, связывание первого блока со значением режима внутреннего предсказания на основе флага направления BDPCM; определение значения режима внутреннего предсказания для второго блока с использованием значения режима внутреннего предсказания, связанного с первым блоком; и реконструкция второго блока с использованием определенного значения режима внутреннего предсказания.
[0162] (11) Компьютерно-считываемый носитель по п. 19, в котором флаг направления BDPCM представляет собой либо (i) первое значение, связанное с горизонтальным направленным режимом внутреннего предсказания, либо (ii) второе значение, связанное с вертикальным направленным режимом внутреннего предсказания.
ПРИЛОЖЕНИЕ 1
- Если candIntraPredModeB равно candIntraPredModeA и candIntraPredModeA больше, чем INTRA_DC, candModeList[x] при x=0…5 определяется следующим образом:
- Если значение IntraLumaRefLineldx[xCb][yCb] равно 0, применяется следующее:
Figure 00000015
- Иначе (IntraLumaRefLineIdx[xCb][yCb] не равно 0) применяется следующее:
Figure 00000016
- Иначе, если candIntraPredModeB не равно candIntraPredModeA и candIntraPredModeA или candIntraPredModeB больше, чем INTRA_DC, применяется следующее:
- Переменные minAB и maxAB определяются следующим образом:
Figure 00000017
- Если candIntraPredModeA и candIntraPredModeB больше, чем INTRA_DC, candModeList[x] при x=0…5 определяется следующим образом:
Figure 00000018
- Если значение IntraLumaRefLineIdx[xCb][yCb] равно 0, применяется следующее:
Figure 00000019
- Если maxAB - minAB находится в диапазоне от 2 до 62 включительно, применяется следующее:
Figure 00000020
- Иначе применяется следующее:
Figure 00000021
- Иначе (IntraLumaRefLineIdx[xCb][yCb] не равно 0) применяется следующее:
- Если maxAB - minAB равно 1, применяется следующее:
Figure 00000022
Иначе, если maxAB - minAB равно 2, применяется следующее:
Figure 00000023
- Иначе, если maxAB - minAB больше 61, применяется следующее:
Figure 00000024
- Иначе применяется следующее:
Figure 00000025
Figure 00000026
- Иначе (candintrapredmodea или candIntraPredModeB больше, чем INTRA_DC) candModeList[x] при x=0…5 определяется следующим образом:
- Если значение IntraLumaRefLineIdx[xCb][yCb] равно 0, применяется следующее:
Figure 00000027
- Иначе (IntraLumaRefLineIdx[xCb][yCb] не равно 0) применяется следующее:
Figure 00000028
- Иначе применяется следующее:
- Если значение IntraLumaRefLineIdx[xCb][yCb] равно 0, применяется следующее:
Figure 00000029
- Иначе (IntraLumaRefLineIdx[xCb][yCb] не равно 0) применяется следующее:
Figure 00000030
ПРИЛОЖЕНИЕ 2
IntraPredModeY[xCb][yCb] определяется посредством следующих упорядоченных шагов:
1. Соседние местоположения (xNbA, yNbA) and (xNbB, yNbB) задаются равными (xCb - 1, yCb+cbHeight 1) и (xCb+cbWidth - 1, yCb - 1), соответственно.
2. Для замены X на А или В переменные candIntraPredModeX определяются следующим образом:
- Процесс определения доступности для блока вызывается с местоположением (xCurr, yCurr), равным (xCb, yCb), и соседним местоположением (xNbY, yNbY), равным (xNbX, yNbX) в качестве входных данных, а выходные данные назначаются availableX.
- Режим внутреннего предсказания кандидата candIntraPredModeX определяется следующим образом:
- Если выполняется одно или несколько из следующих условий, candIntraPredModeX задается равным INTRA_PLANAR.
- Переменная availableX равна FALSE.
- Значение CuPredMode[xNbX][yNbX] не равно MODE INTRA, и флаг ciip_flag[xNbX][yNbX] не равен 1.
Флаг pcm_flag[xNbX][yNbX] равен 1.
- X равно В, a yCb 1 меньше ((yCb>>CtbLog2SizeY)<<CtbLog2SizeY).
- Иначе candIntraPredModeX задается равным IntraPredModeY[xNbX][yNbX].
3. Переменные ispDefaultMode1 и ispDefaultMode2 определяются следующим образом:
- Если IntraSubPartitionsSplitType равно ISP_HOR_SPLIT, ispDefaultMode 1 задается равным INTRA_ANGULAR18, a ispDefaultMode2 задается равным INTRA_ANGULAR5.
- Иначе ispDefaultModel задается равным INTRA_ANGULAR50, а ispDefaultMode2 задается равным INTRA_ANGULAR63.
4. candModeList[х] при х=0…5 определяется следующим образом:
- Если candIntraPredModeB равно candIntraPredModeA и candIntraPredModeA больше, чем INTRA_DC, candModeList[х] при х=0…5 определяется следующим образом:
- Если значение IntraLumaRefLineIdx[xCb][yCb] равно 0, а значение IntraSubPartitionsSplitType равно ISP_NO_SPLIT, применяется следующее:
Figure 00000031
- Иначе (значение IntraLumaRefLineIdx[xCb][yCb] не равно 0 или значение IntraSubPartitionsSplitType не равно ISP_NO_SPLIT) применяется следующее:
Figure 00000032
- Если выполняется одно из следующих условий,
- значение IntraSubPartitionsSplitType равно ISP_HOR_SPLIT, а значение CANDINTRAPREDMODEA меньше, чем значение INTRA_ANGULAR34,
- значение IntraSubPartitionsSplitType равно ISP_VER_SPLIT, а
значение candIntraPredModeA больше или равно INTRA_ANGULAR34,
- IntraLumaRefLineIdx[xCb][yCb] не равно 0,
применяется следующее:
Figure 00000033
Иначе применяется следующее:
Figure 00000034
- Иначе, если candIntraPredModeB не равно candIntraPredModeA и candIntraPredModeA или candIntraPredModeB больше, чем INTRA_DC, применяется следующее:
- Переменные minAB и maxAB определяются следующим образом:
Figure 00000035
- Если candIntraPredModeA и candIntraPredModeB больше, чем INTRA_DC, candModeList[x] при x=0…5 определяется следующим образом:
Figure 00000036
- Если значение IntraLumaRefLineIdx[xCb][yCb] равно 0, а значение IntraSubPartitionsSplitType равно ISP_NO_SPLIT, применяется следующее:
Figure 00000037
- Если maxAB minAB находится в диапазоне от 2 до 62 включительно, применяется следующее:
Figure 00000038
Figure 00000039
- Иначе применяется следующее:
Figure 00000040
- Иначе (значение IntraLumaRefLineIdx[xCb][yCb] не равно 0 или значение IntraSubPartitionsSplitType не равно ISP_NO_SPLIT) применяется следующее:
- Если IntraSubPartitionsSplitType не равно ISP_NO_SPLIT и abs(candIntraPredModeB - ispDefaultMode 1) меньше, чем abs(candIntraPredModeA ispDefaultMode 1), применяется следующее:
Figure 00000041
- Если maxAB minAB равно 1, применяется следующее:
Figure 00000042
Иначе, если maxAB - minAB равно 2, применяется следующее:
Figure 00000043
- Иначе, если maxAB minAB больше 61, применяется следующее:
Figure 00000044
- Иначе применяется следующее:
Figure 00000045
Figure 00000046
- Иначе (candintrapredmodea или candIntraPredModeB больше, чем INTRA_DC) candModeList[x] при x=0…5 определяется следующим образом:
- Если значение IntraLumaRefLineIdx[xCb][yCb] равно 0, а значение IntraSubPartitionsSplitType равно ISP_NO_SPLIT, применяется следующее:
Figure 00000047
- Иначе, если IntraLumaRefLineIdx[xCb][yCb] не равно 0, применяется следующее:
Figure 00000048
Иначе (IntraSubPartitionsSplitType не равно ISP_NO_SPLIT) применяется следующее:
Figure 00000049
- Иначе применяется следующее:
- Если значение IntraLumaRefLineIdx[xCb][yCb] равно 0, а значение IntraSubPartitionsSplitType равно ISP_NO_SPLIT, применяется следующее:
Figure 00000050
- Иначе, если IntraLumaRefLineIdx[xCb][yCb] не равно 0, применяется следующее:
Figure 00000051
- Иначе, если IntraSubPartitionsSplitType равно ISP_HOR_SPLIT, применяется следующее:
Figure 00000052
- Иначе, если IntraSubPartitionsSplitType равно ISP_VER_SPLIT, применяется следующее:
Figure 00000053
Figure 00000054
5. IntraPredModeY[xCb][yCb] определяется посредством следующей процедуры:
- Если bdpcm_flag[xCb][yCb] равно 1, IntraPredModeY[xCb][yCb] задается равным bdpcm_dir_flag[xCb][yCb]==0?INTRA_ANGULAR18: INTRA_ANGULAR50.
- Иначе, если intra luma mpm flagf xCb][yCb] равно 1, для IntraPredModeY[xCb][yCb] задается candModeListf intra luma mpm idx[xCb][yCb]].
- Иначе IntraPredModeY[xCb][yCb] определяется посредством следующих упорядоченных шагов:
1. Если candModeList[i] больше, чем candModeListf j] для i=0…4 и для каждого i, j=(i+1)…5, оба значения меняются местами следующим образом:
(candModeList[i], candModeListf j])=Swap(candModeList[i], candModeListf j]) (A2 94)
2. IntraPredModeY[xCb][yCb] определяется посредством следующих упорядоченных шагов:
i. IntraPredModeY[xCb][yCb] задается равным intra_luma_mpm_remainder[xCb][yCb].
ii. Для i, равного от 0 до 5 включительно, когда значение IntraPredModeY[xCb][yCb] больше или равно candModeListf i], значение IntraPredModeY[xCb][yCb] увеличивается на единицу.
Переменная IntraPredModeYf х][у] при х=xCb…xCb+cbWidth - 1 и у=yCb…yCb+cbHeight 1 задается равной IntraPredModeY[xCb][yCb].

Claims (21)

1. Способ видеодекодирования, включающий:
определение, предсказан ли первый блок, связанный со вторым блоком, в соответствии с режимом блочной дифференциальной импульсно-кодовой модуляции (BDPCM),
в ответ на определение того, что первый блок предсказан в соответствии с режимом BDPCM, связывание первого блока со значением режима внутреннего предсказания на основе флага направления BDPCM для первого блока, при этом значение режима внутреннего предсказания выбирают из множества режимов внутреннего предсказания, которые включают угловые режимы внутреннего предсказания;
определение значения режима внутреннего предсказания для второго блока с использованием значения режима внутреннего предсказания, связанного с первым блоком; и
реконструкцию второго блока с использованием упомянутого определенного значения режима внутреннего предсказания для второго блока.
2. Способ по п. 1, в котором флаг направления BDPCM представляет собой либо (i) первое значение, связанное с горизонтальным направленным режимом внутреннего предсказания, либо (ii) второе значение, связанное с вертикальным направленным режимом внутреннего предсказания.
3. Способ по п. 2, в котором общее количество упомянутого множества режимов внутреннего предсказания составляет 67, где горизонтальный направленный режим внутреннего предсказания связан с угловым режимом 18 внутреннего предсказания, а вертикальный направленный режим внутреннего предсказания связан с угловым режимом 50 внутреннего предсказания.
4. Способ по п. 1, в котором определение, предсказан ли первый блок в соответствии с режимом BDPCM, основано на значении флага BDPCM для первого блока, указывающего на наличие флага направления BDPCM для первого блока.
5. Способ по п. 1, в котором первый блок и второй блок включены в одно и то же изображение, и первый блок пространственно соседствует со вторым блоком.
6. Способ по п. 5, дополнительно включающий:
получение списка кандидатов для второго блока с использованием процесса определения наиболее вероятного режима (МРМ), причем получение списка кандидатов включает определение, предсказан ли первый блок в соответствии с режимом BDPCM,
при этом определение значения режима внутреннего предсказания для второго блока дополнительно включает использование полученного списка кандидатов.
7. Способ по п. 6, в котором список кандидатов включает
первое возможное значение режима внутреннего предсказания (Режим1), которое соответствует значению режима внутреннего предсказания первого блока,
второе возможное значение режима внутреннего предсказания (Режим2) и третье возможное значение режима внутреннего предсказания (Режим3), которые определены в соответствии с заранее заданным смещением от первого возможного значения режима внутреннего предсказания и операцией по модулю М, где М является степенью числа 2.
8. Способ по п. 1, в котором второй блок представляет собой блок цветности, а первый блок представляет собой блок яркости, расположенный совместно с блоком цветности.
9. Способ по п. 8, дополнительно включающий:
определение, кодирован ли второй блок в режиме прямого копирования (DM); и определение, предсказан ли первый блок в соответствии с режимом BDPCM, в ответ на определение того, что второй блок кодирован в режиме прямого копирования.
10. Видеодекодер для видеодекодирования, содержащий:
схему обработки, выполненную с возможностью осуществлять способ по любому из пп. 1-9.
11. Компьютерно-считываемый носитель, на котором хранятся инструкции, которые, при выполнении процессором, заставляют процессор осуществлять способ по любому из пп. 1-9.
RU2021128747A 2019-04-30 2020-04-30 Способ и устройство для взаимодействия между режимом внутреннего предсказания и режимом блочной дифференциальной импульсно-кодовой модуляции RU2779825C1 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US62/841,003 2019-04-30
US16/862,221 2020-04-29

Publications (1)

Publication Number Publication Date
RU2779825C1 true RU2779825C1 (ru) 2022-09-13

Family

ID=

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150016515A1 (en) * 2013-07-12 2015-01-15 British Broadcasting Corporation Video encoding and decoding with prediction at higher precision
RU2583040C2 (ru) * 2011-08-30 2016-05-10 Нокиа Текнолоджиз Ой Устройство, способ и компьютерная программа для кодирования и декодирования видеосигналов
US20160227221A1 (en) * 2013-10-14 2016-08-04 Wang Lin Lai Method of Residue Differential Pulse-Code Modulation for HEVC Range Extension
US20180205946A1 (en) * 2017-01-13 2018-07-19 Qualcomm Incorporated Coding video data using derived chroma mode
US20180324420A1 (en) * 2015-11-10 2018-11-08 Vid Scale, Inc. Systems and methods for coding in super-block based video coding framework

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2583040C2 (ru) * 2011-08-30 2016-05-10 Нокиа Текнолоджиз Ой Устройство, способ и компьютерная программа для кодирования и декодирования видеосигналов
US20150016515A1 (en) * 2013-07-12 2015-01-15 British Broadcasting Corporation Video encoding and decoding with prediction at higher precision
US20160227221A1 (en) * 2013-10-14 2016-08-04 Wang Lin Lai Method of Residue Differential Pulse-Code Modulation for HEVC Range Extension
US20180324420A1 (en) * 2015-11-10 2018-11-08 Vid Scale, Inc. Systems and methods for coding in super-block based video coding framework
US20180205946A1 (en) * 2017-01-13 2018-07-19 Qualcomm Incorporated Coding video data using derived chroma mode

Similar Documents

Publication Publication Date Title
KR102697554B1 (ko) 비디오 코딩을 위한 방법 및 장치
KR20200128138A (ko) 비디오 코딩을 위한 방법 및 장치
WO2020027988A1 (en) Constraints on coding unit partition
KR102679144B1 (ko) 인트라 예측 모드와 블록 차분 펄스-코드 변조 모드 사이의 상호작용을 위한 방법 및 장치
KR20200140373A (ko) 비디오 코딩을 위한 방법 및 장치
JP2022517114A (ja) ビデオ復号用の方法、装置およびプログラム
JP2023111920A (ja) ビデオ符号化における隣接ブロックの利用可能性のための方法および装置
KR20220159464A (ko) 디코더 측 인트라 모드 도출
KR20200121366A (ko) 비디오 코딩을 위한 방법 및 장치
KR20200124749A (ko) 비디오 코딩을 위한 방법 및 장치
KR20230085184A (ko) 인트라 예측의 융합에 대한 수정
KR20230058166A (ko) 개선된 인트라 예측을 위한 방법 및 장치
JP2023522354A (ja) デカップリング変換パーティション分割
JP2023546962A (ja) 成分間のブロック終了フラグの符号化
JP2023524406A (ja) 複数基準線イントラ予測と変換分割との間の調和した設計
RU2779825C1 (ru) Способ и устройство для взаимодействия между режимом внутреннего предсказания и режимом блочной дифференциальной импульсно-кодовой модуляции
RU2777394C1 (ru) Способ и устройство для видеокодирования
RU2787810C1 (ru) Способ и устройство для преобразования цвета при универсальном видеокодировании (VVC)
RU2780422C1 (ru) Способ и устройство для видеокодирования
RU2777377C1 (ru) Унифицированное предсказание вектора блока для компенсации блоков внутри изображения
RU2784813C1 (ru) Способ и устройство для кодирования видео
RU2801586C1 (ru) Способ и устройство сигнализации флагов режима пропускания
RU2779931C1 (ru) Способ и устройство для передачи информации о размере списка кандидатов предсказателя
KR20230065344A (ko) 서브블록 교차 성분 선형 모델 예측
JP2023525668A (ja) 多重変換選択を用いた適応スキャン