RU2595917C2 - Способ и устройство для измерения качества видео - Google Patents

Способ и устройство для измерения качества видео Download PDF

Info

Publication number
RU2595917C2
RU2595917C2 RU2014128824/08A RU2014128824A RU2595917C2 RU 2595917 C2 RU2595917 C2 RU 2595917C2 RU 2014128824/08 A RU2014128824/08 A RU 2014128824/08A RU 2014128824 A RU2014128824 A RU 2014128824A RU 2595917 C2 RU2595917 C2 RU 2595917C2
Authority
RU
Russia
Prior art keywords
video
quality
quantization
average
stream
Prior art date
Application number
RU2014128824/08A
Other languages
English (en)
Other versions
RU2014128824A (ru
Inventor
Фань Чжан
Нин ЛЯО
Кай СЕ
Чжибо Чэнь
Original Assignee
Томсон Лайсенсинг
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Томсон Лайсенсинг filed Critical Томсон Лайсенсинг
Publication of RU2014128824A publication Critical patent/RU2014128824A/ru
Application granted granted Critical
Publication of RU2595917C2 publication Critical patent/RU2595917C2/ru

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N17/00Diagnosis, testing or measuring for television systems or their details
    • H04N17/004Diagnosis, testing or measuring for television systems or their details for digital television systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Изобретение относится к технологиям оценки качества сжатого видео. Техническим результатом является повышение точности и/или эффективности измерения качества видео за счет того, что используется рациональная функция (QP) и корректирующая функция, зависящая от непредсказуемости контента (CU), а также за счет того, что QP и CU вычисляются из элементарного потока видео без полного декодирования видео. Предложен способ оценки качества видео закодированного видеопотока. Закодированный видеопоток содержит остаточные значения предсказания макроблока. Способ работает на уровне транспортного потока и содержит этап, на котором осуществляют синтаксический анализ и восстановление данных из пакетов транспортного потока, при этом получают элементарный поток. Осуществляют декодирование, по меньшей мере, части элементарного потока, посредством выборочного энтропийного декодера для получения параметров квантования и величин пикселов. 2 н. и 7 з.п. ф-лы, 7 ил.

Description

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ
Настоящее изобретение относится к измерению качества видео, в частности к оценке сжатого видео без обращения к копии исходного несжатого видео.
УРОВЕНЬ ТЕХНИКИ
В IPTV (телевидение по интернет-протоколу) видеопрограммы проходят различные стадии форматов во время своего жизненного цикла. Видеокодер сжимает видеопрограмму в поток двоичных данных, также называемый элементарным потоком (ES). ES дополнительно пакетируется в транспортный поток (TS) и, наконец, передается по каналу IP. Качество видео может быть измерено с использованием данных, которые получены при доступе к транспортному потоку, элементарному потоку или декодированному видео. Среди трех типов измерения применение транспортного потока, в общем, является самым быстрым, но наименее точным, так как в нем доступно наименьшее количество видеоданных; применение декодированного видео часто является точным, но самым медленным, так как декодирование видео затратно в вычислительном отношении; применение элементарного потока может позволить достичь компромисса между точностью и сложностью вычислений. В настоящее время изучается конкретное измерение качества видео, основанное на элементарном потоке.
Сжатие видео, в общем, использует способы квантования. Квантование является способом сжатия с потерями, так как ограничивает точность величин сигнала. Хорошо известно, что квантование является значительным фактором видимости искажений и параметр (QP) квантования является эффективным предиктором качества видео. В литературе обеспечены различные функции качества видео по отношению к QP, как, например, линейная функция [1, 2] и экспоненциальная функция [3]. Однако они недостаточно точны для относительно большого и/или относительно малого уровня QP, и, таким образом, их результаты не приемлемы для приложений с низкой пропускной способностью или высокой точностью.
Сложность контента является другим критическим фактором измерения (VQM) качества видео. Визуальные искажения в сложных видео, скорее всего, спокойно воспримутся человеческим глазом, и, следовательно, качество будет лучше. Таким образом, сложность контента в комбинации с QP может улучшить точность измерения качества по сравнению с использованием только QP.
Как правило, как и в [4], сложность контента может быть подсчитана как дисперсия, градиент или отклик краевого фильтра величин пикселов либо их комбинации. Традиционные способы имеют, по меньшей мере, следующие недостатки.
Во-первых, такие характеристики не сильно связаны с визуальным восприятием человека. Видео с большой сложностью контента может иметь не только богатую текстуру и непостоянное движение, но также и много краев и/или постоянное движение. Для человеческого глаза, скорее всего, будут допустимы визуальные искажения в плане текстуры и непостоянно (то есть стохастически) движущихся участков, но обычно более заметны и видимы на краях или постоянно (то есть непрерывно) движущихся участках. Во-вторых, такие характеристики едва ли могут быть вычислены до тех пор, пока пикселы не будут восстановлены после полного декодирования. Таким образом, обычное измерение сложности является затратным в вычислительном отношении, так как требует полного декодирования видео.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
Настоящее изобретение решает, по меньшей мере, проблему повышения точности и/или эффективности измерения качества видео. В соответствии с настоящим изобретением способ точного предсказания качества видео использует рациональную функцию QP, которая корректируется корректирующей функцией, зависящей от непредсказуемости (CU) контента. В различных вариантах осуществления корректирующая функция является степенной функцией CU. Оба QP и CU могут быть вычислены из элементарного потока видео без полного декодирования видео. Преимущественно, это обеспечивает высокую эффективность.
Первое преимущество настоящего изобретения заключается в высокой точности предсказания качества видео, что подтверждается субъективными экспериментами, соответствующими ITU-T SG 12 [5], а также статистическими проверками. Точность обеспечивается, по меньшей мере, двумя характеристиками. Первая - вычисление среднего QP и использование рациональной функции среднего QP для предсказания базового искажения вследствие квантования. Эта функция может улавливать эффект насыщения качества как на относительно большом, так и на относительно малом уровнях QP, и, таким образом, обеспечивает достаточно точный результат. Другая характеристика - использование степенной функции CU для корректировки предсказания на основании QP, что дополнительно улучшает точность предсказания.
Более конкретно, CU, в качестве характеристики видео, может отличать непостоянные изменения от постоянных изменений и от «отсутствия изменений» в видеосигнале. Следовательно, CU имеет больше мощности для улавливания влияния характеристик контента на воспринимаемое качество. Настоящее изобретение также обеспечивает быстрый алгоритм для оценки CU из элементарного потока видео, что приводит ко второму преимуществу.
Второе преимущество заключается в том, что способу требуется только элементарный поток видео, а не полностью декодированное видео, и, таким образом, он менее затратен в вычислительном отношении, чем известные способы.
С точностью и низкими вычислительными издержками, VQM может быть использован, например, в пользовательских терминалах, телевизионных приставках, домашних шлюзах, маршрутизаторах или серверах потокового видео, чтобы отслеживать качество видео и обеспечивать обратную связь для планирования сервиса.
Настоящее изобретение, в одном аспекте, касается способа оценки качества видео закодированного видеопотока, который содержит остаточные значения предсказания макроблока, причем способ содержит этап вычисления для видеопоследовательности, содержащей множество кадров, общей оценки Q качества из оценки Qb базового качества, умноженной на корректирующий фактор Qc, причем оценка Qb базового качества получена из среднего параметра Q P ¯
Figure 00000001
квантования кадров видеопоследовательности и причем корректирующий фактор Qc получен из средней дисперсии пикселов внутри остаточных значений предсказания макроблоков в видеопоследовательности.
В одном аспекте, настоящее изобретение относится к устройству оценки качества видео закодированного видеопотока, который содержит остаточные значения предсказания макроблока, причем устройство содержит элемент обработки для вычисления для видеопоследовательности, содержащей множество кадров, общей оценки Q качества из оценки Qb базового качества, умноженной на корректирующий фактор Qc, причем оценка Qb базового качества получена из величины среднего параметра квантования кадров видеопоследовательности и причем корректирующий фактор Qc получен из средней дисперсии пикселов внутри остаточных значений предсказания макроблоков в видеопоследовательности.
В различных вариантах осуществления устройство также содержит одно или несколько из следующего:
синтаксический анализатор параметра квантования для обнаружения и усреднения параметров квантования макроблоков (MB), причем синтаксический анализатор параметра квантования обеспечивает параметр квантования МВ и упомянутую величину среднего параметра квантования;
синтаксический анализатор коэффициентов DCT для обнаружения и извлечения коэффициентов DCT МВ;
блок вычисления непредсказуемости контента для вычисления в соответствии с коэффициентами DCT МВ и параметром квантования МВ первой величины CUl, которая представляет собой локальную непредсказуемость контента, и второй величины CUg, которая представляет собой глобальную непредсказуемость контента, причем вторая величина вычисляется путем усреднения первых величин;
блок депакетирования для восстановления данных из пакетов (или распаковки) транспортного потока, причем элементарный поток (ES) получен,
и выборочный энтропийный декодер для декодирования, по меньшей мере, частей ES.
В одном аспекте, настоящее изобретение относится к компьютерно-читаемому носителю, имеющему исполнимые команды, хранящиеся на нем, которые побуждают компьютер выполнять способ, содержащий этап вычисления для видеопоследовательности, содержащей множество кадров, общей оценки Q качества из оценки Qb базового качества, умноженной на корректирующий фактор Qc, причем оценка Qb базового качества получена из среднего параметра Q P ¯
Figure 00000001
квантования кадров видеопоследовательности и причем корректирующий фактор Qc получен из средней дисперсии пикселов внутри остаточных значений предсказания макроблоков в видеопоследовательности.
Предпочтительные варианты осуществления настоящего изобретения раскрыты в зависимых пунктах формулы изобретения, последующем описании и чертежах.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
Примерные варианты осуществления настоящего изобретения описаны со ссылкой на сопровождающие чертежи, которые изображают:
на Фиг. 1 - структуру инструмента измерения качества видео;
на Фиг. 2-4 - различные виды соотнесения субъективного качества с функцией измерения;
на Фиг. 5 - соотнесение базового искажения с различными функциями QP;
на Фиг. 6 - улучшенное предсказание качества в соответствии с настоящим изобретением, особенно, на большом уровне QP; и
на Фиг. 7 - блок-схему измерения качества видео.
ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
В одном варианте осуществления настоящего изобретения Фиг. 1 изображает структуру инструмента 106 измерения (VQM) качества видео внутри системы 100 передачи видео. Обычные стадии 101, 102, 103 формата видеопрограммы следующие: видеокодер 104 сжимает видеопрограммы 101 до двоичного потока данных, также называемого элементарным потоком (ES) (на Фиг. 1 для примера только внутри видеокодера 104, следовательно, не изображено). ES дополнительно пакетируется в транспортный поток (TS) 103 и затем передается по каналу передачи, например, IP каналу. Инструмент 106 VQM, в основном, восстанавливает данные из пакетов TS 103 видео, таким образом, получая ES видео, затем синтаксически анализирует и усредняет QP и получает величину непредсказуемости контента CU из полученного ES видео, и, наконец, предсказывает качество Q видео из QP и величины CU. Более подробные детали указаны ниже. Преимущественно, этот процесс быстрый и не требует полного декодирования видео.
Качество видео предсказывается функцией, которая является умножением двух подфункций. Величина первой подфункции определяет базовое искажение вследствие квантования, то есть оценку базового качества. В одном варианте осуществления первая подфункция является рациональной функцией QP. Более конкретно, ее знаменатель - полином от среднего QP видео, а ее числитель - это знаменатель, уменьшенный на константу (например, 1). Вторая подфункция является корректирующим фактором и ее величина измеряет влияние непредсказуемости (CU) контента на воспринимаемое качество. Предпочтительно, вторая подфункция является степенной функцией CU видео, как дополнительно указано ниже.
CU является величиной, связанной с видео, и преимущественно может быть вычислена из ES видео, как описано ниже, более конкретно, с использованием квантованных коэффициентов DCT видео. CU видео отражает внутренне присущие характеристики контента, то есть обеспечивает величину, которая характеризует контент. Таким образом, она может быть использована для определения влияния контента на воспринимаемое качество видео.
В одном варианте осуществления QP и квантованные коэффициенты DCT восстанавливают после выборочного энтропийного декодирования в модуле 108 выборочного энтропийного декодирования. Полное декодирование видео, которое включает в себя полное декодирование длин серий, деквантование, обратное дискретное косинусное преобразование (IDCT) и остаточную компенсацию, как правило, не требуется.
Предсказание качества видео настоящего изобретения относится к типу «без ссылки» NR (или неинтрузивному). То есть ему не требуется осуществлять доступ к копии исходного несжатого видео. Дополнительно, для предсказания качества настоящего изобретения нет необходимости полностью декодировать видео. В одном варианте осуществления предсказание использует данные, которые напрямую могут быть извлечены из элементарного потока видео.
Далее, подробно описана последовательность действий инструмента измерения (VQM) качества видео, изображенного на Фиг. 1.
Вводом инструмента 106 VQM может быть транспортный поток 103, который может быть сформирован видеокодером и формирователем 104 пакетов из видеопрограмм 101. Видеокодер и формирователь 104 пакетов могут, но не обязательно, быть частью настоящего изобретения. В другом варианте осуществления ES 102 видео, содержащий закодированные видеопрограммы 101, напрямую вводится в инструмент 106 VQM. Выводом 115 инструмента 106 VQM является оценка Q предсказываемого качества, связанная с вводом видео.
Внутри инструмента 106 в варианте осуществления, способном обрабатывать транспортные потоки, во-первых, блок 107 депакетирования проводит синтаксический анализ принятого транспортного потока 103 для получения элементарного потока 102 видео. Во-вторых, характеристики видео, включающие в себя средний QP 112 и глобальную CU 113, получают путем выборочного энтропийного декодирования в выборочном энтропийном декодере 108, проведения синтаксического анализа выборочно энтропийно декодированных данных в синтаксическом анализаторе 109 QP и синтаксическом анализаторе 110 коэффициентов DCT, причем синтаксический анализатор 109 QP обеспечивает средний QP 112, и вычисления глобальной CU в блоке 111 вычисления CU. Наконец, модуль 114 предсказания качества определяет оценку Q качества в соответствии с характеристиками видео по заранее определенной функции измерения.
Более конкретно, характеристики видео получают из вывода выборочного энтропийного декодера 108 путем двух одновременно выполняющихся блоков, или потоков, функций. В одном потоке синтаксический анализатор 109 QP выбирает (то есть извлекает) QP каждого МВ и обеспечивает QP блоку 111 вычисления CU. Дополнительно, синтаксический анализатор 109 QP усредняет QP множества МВ и выводит получившуюся среднюю величину 112. В другом потоке сперва синтаксический анализатор 110 коэффициентов DCT выбирает (то есть извлекает) коэффициенты DCT каждого МВ и затем блок 111 вычисления CU вычисляет локальную CU в соответствии с коэффициентами DCT от синтаксического анализатора 110 коэффициентов DCT и соответствующими QP от синтаксического анализатора 109 QP. Наконец, блок 111 вычисления CU усредняет локальные CU и выводит глобальную CU 113, полученную путем усреднения всех локальных CU.
Далее описан целостный подход к функции измерения.
Функция измерения работает в модуле 114 оценки качества в соответствии с математической моделью, которая изображает качество видео, по меньшей мере, по двум характеристикам видео, включая среднее QP 112 и глобальную CU 113. В одном варианте осуществления функция измерения определяется как:
Q = Qb×Qc (1)
где Qb является уровнем базового качества вследствие квантования, Qc является числовым значением для корректировки Qb, в соответствии с непредсказуемостью контента видео и Q является конечным предсказываемым качеством.
В вариантах осуществления уровень Qb базового качества вследствие квантования и корректирующий фактор Qc для корректировки уровня Qb базового качества в соответствии с CU вычисляются в соответствии с:
Qb = (a2 × ( Q P ¯
Figure 00000001
-a3)a1)/(1+a2 × ( Q P ¯
Figure 00000001
-a3)a1 (2)
Qc = b2 × CUgb1+b3 (3)
где Q P ¯
Figure 00000001
- средняя величина QP, CUg - величина глобальной CU и а1, а2, а3, b1, b2 и b3 - заранее заданные параметры.
Предпочтительно, заранее заданные параметры являются положительными, рациональными и выбранными из следующих диапазонов:
2 ≤ а1 ≤ 6; более конкретно, преимущественная величина - а1=4
10-5 ≤ а2 ≤ 10-4; более конкретно, преимущественная величина - а2=0,00005 (5·10-5)
30 ≤ а3 ≤ 75; более конкретно, преимущественная величина - а3=49
0,1 ≤ b1 ≤ 0,3; более конкретно, преимущественная величина - b1=0,2
0,1 ≤ b2 ≤ 0,3; более конкретно, преимущественная величина - b1=0,18 и
1 ≤ b3 ≤ 2; более конкретно, преимущественная величина - b3=1,65.
Высокая точность функции измерения подтверждена результатами экспериментов, как изображено на Фиг. 2-4, которые показывают примеры видеопоследовательностей с различных видов соотнесения субъективного качества с функцией измерения. Фиг. 2 показывает целостный вид. Более конкретно, Фиг. 2-4 изображают соотнесение оценок субъективного качества со средним QP и глобальной CU. Каждая точка соответствует одному из 64 видео из субъективной базы данных. 64 (=8×8) видео сформированы сжатием восьми различных исходных видео с восемью различными коэффициентами сжатия. Сжатые видео из различных исходных видео отмечены различными метками, как изображено в легенде на Фиг. 3. Субъективное качество оценено 24 надежными субъектами во время субъективного эксперимента, соответствующего ITU-T SG 12 [5]. Оценены среднее QP и глобальная CU соответствующего видео.
Фиг. 2 изображает, как оценки предсказываемого качества совпадают с оценками субъективного качества по функции измерения в соответствии с Уравнениями (1-3), которые в этом виде формируют поверхность. Фиг. 3 изображает левосторонний вид, а Фиг. 4 изображает правосторонний вид поверхности (чертежи в разрезе). Результат эксперимента корреляции между оценками предсказываемого качества и субъективными оценками подтверждает, что функция измерения может точно предсказывать качество видео.
Среднее QP
Для Н.264, а также и других стандартов сжатия каждый макроблок (МВ) имеет QP. QP индексирует заранее заданную таблицу этапа QSTEP квантования, которая является линейным квантизатором, используемым для квантования коэффициентов DCT внутри текущего МВ. Среднее QP 112 является средней величиной или средней QP всех МВ.
Базовое искажение вследствие квантования
Разница между функцией на основании QP настоящего изобретения и существующими решениями изображена на Фиг. 5, которая показывает соотнесение (то есть отображение) базового искажения (то есть левосторонний вид, как на Фиг. 3) с различными функциями среднего QP. Заметьте, что Фиг. 5 показывает субъективное качество по сравнению только со средним QP. На Фиг. 5а) изображено соотнесение базового искажения с линейной функцией. На Фиг. 5b) изображено соотнесение базового искажения с экспоненциальной функцией. На Фиг. 5с) изображено соотнесение базового искажения с рациональной функцией. Каждое сжатое видео изображено в виде точки. Фиг. 5 показывает соотнесение точек (качество с QP) на Фиг. 5а) с помощью линейной функции, как в [1,2], на Фиг. 5b) с помощью экспоненциальной функции, как в [3], и на Фиг. 5с) с помощью рациональной функции, как в Уравнении (2), в соответствии с настоящим изобретением. Регрессионный анализ показывает, что рациональная функция является самой близкой к положению точек. Другими словами, отображение качества в рациональной функции, в соответствии с настоящим изобретением, является лучшим решением, чем экспоненциальная или линейная функция, так как это позволяет, во-первых, соотнести тренды насыщения качества на малых уровнях QP и на больших уровнях QP, и, во-вторых, улавливает медленное насыщение (большой поворот) на малых уровнях QP, а также резкое насыщение (крутой поворот) на больших уровнях QP.
Непредсказуемость контента
В отличие от существующих решений, основанных на сложности контента, настоящее изобретение использует непредсказуемость (CU) контента для отличия непостоянных изменений от постоянных изменений либо отсутствия изменений в видеосигнале. Традиционная сложность контента вычисляется с помощью информации пикселов видео, в то время как CU вычисляется с помощью остаточной информации видео. Для настоящего изобретения локальная CU определяется как дисперсия пикселов остаточных значений (интра- или интер-)предсказания макроблоков, а глобальная CU определяется как среднее локальных CU нескольких или всех макроблоков видео. Интер-предсказание (в Н.264, Н.263, Н.261, MPEG-4, MPEG-2 и так далее) и интра-предсказание (в Н.264, MPEG-4 и так далее) являются способами сжатия, которые применяют в предсказуемости видео, что приводит к недостаточности. Остаточные значения предсказания обычно сохраняют непостоянную информацию, которую сложно предсказывать из пространственно-временного соседства. Следовательно, в настоящем изобретении дисперсия остаточных значений является подходящим индикатором непредсказуемости контента.
Известные решения, даже если они осведомлены о важности CU, как, например, [2], все равно оценивают CU в соответствии со скоростью передачи видео. Однако скорость передачи подвержена влиянию многих факторов (например, распределение коэффициентов DCT, вектор движения и так далее). Таким образом, оценка CU по скорости передачи подвергается вмешательству многих факторов, которые не относятся к CU. Следовательно, преимуществом настоящего изобретения является то, что CU предсказывается как описано выше, а не только в соответствии со скоростью передачи. Дополнительно, в отличие от сложности контента, вычисляемой после полного декодирования, CU можно быстро вычислить из данных внутри ES, без полного декодирования видео.
В одном варианте осуществления дисперсия остаточного значения МВ приближенно вычисляется с помощью дисперсии и среднего значения (средней) блоков МВ. Дисперсия блока теоретически равна евклидовой норме всех деквантованных коэффициентов АС. Локальная CU пропорциональна евклидовой норме квантованных коэффициентов АС плюс взвешенной дисперсии коэффициентов DC, где весовые коэффициенты нужны для уравновешивания различного фактора масштабирования в IDCT (интегральное дискретное косинусное преобразование) 4х4 и 8х8. Для дополнительного приближенного вычисления локальной CU квантование компенсируется в соответствии с QP в настоящем изобретении.
Для остаточного макроблока с блоками 4×4 преобразования локальная CU определяется как
Figure 00000002
Для остаточного макроблока с блоками 8×8 преобразования локальная CU определяется как
Figure 00000003
где QP - величина QP текущего макроблока, ACij - величина i-ого коэффициента АС j-ого блока внутри текущего макроблока, DCj - величина коэффициента DC j-ого блока внутри текущего макроблока, константа с1 связана с масштабированием QSTEP и 2QP/c1 для компенсации квантования. Константы с2 и с3 нужны для уравновешивания фактора масштабирования в преобразовании 4×4 и 8×8 соответственно. Наконец, глобальная CU является средней локальных CU всех МВ. Примеры параметров для вычисления CUl - с1=3, с2=15, с3=3.
Воспринимаемое качество, скорректированное с помощью CU
Преимущество использования CU в VQM заключается в том, что качество, предсказываемое только QP, корректируется и, следовательно, улучшается, что ведет к более высокой точности VQM. Это подтверждено результатами экспериментов, изображенными на Фиг. 3 и Фиг. 5с). Соотнесение каждого из восьми сжатых видео, соответствующих одному и тому же исходному видео, с различными кривыми рациональных функций на Фиг. 3 является более точным по сравнению с соотнесением суммы 64 сжатых видео с уникальной кривой рациональной функции на Фиг. 5с). Более того, восемь кривых рациональных функций похожи друг на друга и отличаются только по амплитуде. Амплитуда может быть предсказана степенной функцией глобальной CU, как изображено на Фиг. 3 (то есть правостороннем виде на Фиг. 2). Степенная функция определена Уравнением (3).
Хотя инструмент 106 VQM и точная функция измерения Уравнений (1-3) могут обеспечить максимальную точность, настоящее изобретение, в одном варианте осуществления, может содержать предсказание на основании только QP и обеспечивать достаточно хорошую точность и более низкие вычислительные издержки, чем известные решения.
Вариант осуществления может содержать, по меньшей мере, синтаксический анализатор 109 QP и модуль 114 предсказания качества, то есть без синтаксического анализатора 110 коэффициентов DCT и блока 111 вычисления CU. Как указано выше, инструмент VQM, в одном варианте осуществления, может также содержать блок 107 депакетирования и выборочный энтропийный декодер 108. Выборочный энтропийный декодер 108 может обрабатывать QP только в I-кадрах видео, но игнорировать QP в Р и В кадрах. Модуль 114 предсказания качества выполняет только Уравнение (2) для определения конечного качества видео.
Фиг. 6 показывает диаграмму, которая изображает улучшенное предсказание качества в соответствии с настоящим изобретением, более конкретно, на больших уровнях QP. Хотя способ в соответствии с настоящим изобретением может предсказывать качество видео точно для нормальных видео, он может выводить уникальные результаты для конкретного специального ввода. Например, если дано сжатое видео с константным QP 45 и если QP настроено на 51 или больше, то достигнута лучшая оценка качества. Этот эффект преимущественен, так как более высокий QP означает более высокое сжатие, и это достигается вследствие следующих двух причин.
Во-первых, традиционные способы на основании QP часто используют монотонную функцию по отношению к QP, и более высокий QP приводит к худшей оценке качества, то есть QP 51 должен быть обычно хуже, чем QP 45.
Во-вторых, рациональная функция Уравнения (2) монотонно уменьшается с QP, когда QP меньше чем 46, но увеличивается с QP, когда QP больше чем 46. Это изображено на Фиг. 6. То есть QP, например, 51 лучше, чем QP, например, 45.
Дополнительно, достигается следующий эффект. Если дано сжатое видео, то когда самый большой коэффициент АС в каждом блоке преобразования увеличивается на 1, то достигается лучшее качество. Это происходит вследствие, во-первых, того, что такая модификация действует как водяной знак видео, то есть она почти не изменяет часто используемые характеристики (например, QP, скорость передачи) в элементарном потоке и декодированном видео, за исключением увеличения евклидовой нормы коэффициентов АС и, следовательно, CUg. Во-вторых, способ настоящего изобретения может обнаруживать изменение качества, так как он использует моменты высокого порядка (включая дисперсию) коэффициентов АС. В-третьих, способ настоящего изобретения предсказывает лучшее качество, так как CUg (и, следовательно, Qc) увеличивается.
Фиг. 7 показывает блок-схему способа 706 измерения качества видео. Это способ оценки качества видео закодированного видеопотока, в котором закодированный видеопоток содержит остаточные значения предсказания МВ, он содержит, по меньшей мере, этап вычисления 714 для видеопоследовательности VS, содержащей один или несколько кадров, общей оценки Q качества из оценки Qb базового качества, умноженной на корректирующий фактор Qc,
причем оценка Qb базового качества получена из среднего параметра Q P ¯
Figure 00000004
квантования кадров видеопоследовательности и причем корректирующий фактор Qc получен из средней дисперсии CUl пикселов внутри остаточных значений предсказания макроблоков в видеопоследовательности. В одном варианте осуществления способ содержит один или несколько из этапа 707 восстановления данных из пакетов, этапа 708 выборочного энтропийного декодирования, этапа 709 синтаксического анализа QP, этапа 710 синтаксического анализа коэффициентов DCT, этапа 711 вычисления локальной CU и глобальной CU и этапа 714 предсказания качества видео.
В одном варианте осуществления способ дополнительно содержит на этапе 709 синтаксического анализа QP также этап усреднения QP внутри МВ для определения среднего QP, обозначаемого как Q P ¯
Figure 00000005
.
В одном варианте осуществления способ дополнительно содержит этапы вычисления, в соответствии с коэффициентами DCT и параметром квантования каждого МВ, первой величины CUl, которая представляет собой локальную непредсказуемость контента, и второй величины CUg, которая представляет собой глобальную непредсказуемость контента, причем вторая величина вычисляется путем усреднения Avg первых величин. Первая величина является дисперсией пикселов остаточных значений предсказания.
Настоящее изобретение может быть использовано для оценки качества видео, кодирования восприятия видео, планирования видеопотока, и так далее. По существу, предсказание качества видео применимо к видео, которые были сжаты с помощью DCT плюс квантование. Один вариант осуществления предназначен для видео, сжатого в соответствии со стандартом Н.264. В других вариантах осуществления настоящее изобретение относится к другим кодекам, как, например, Н.261, Н.263, MPEG-2, MPEG-4 и так далее.
В одном варианте осуществления настоящее изобретение относится к инструменту измерения качества видео без ссылок, на основании ES. Инструмент либо соответствующий способ, может функционировать в пользовательских терминалах, телевизионных приставках, домашних шлюзах, маршрутизаторах или серверах потокового видео, с использованием QP и квантованных коэффициентов DCT (дискретное косинусное преобразование). CU вычисляется в соответствии с коэффициентами DCT и QP. Качество видео затем вычисляется из функции QP и CU. В одном варианте осуществления параметры функции заранее заданы множественным регрессионным анализом субъективной базы данных, которая специально создана для соответствия ITU-T SG 12.
В то время, как показаны, описаны и указаны фундаментальные инновационные признаки настоящего изобретения в их применении в предпочтительных вариантах осуществления, необходимо понимать, что различные опущения, замещения и изменения описанных устройства и способа в форме и деталях раскрытых устройств и их функционировании могут быть сделаны специалистами в данной области техники, не удаляясь от сущности настоящего изобретения. Явным образом предполагается, что все комбинации тех элементов, которые выполняют по существу ту же функцию по существу тем же образом для достижения тех же результатов, находятся внутри объема настоящего изобретения. Замещения элементов из одного описанного воплощения в другом также полностью предполагаются и предусматриваются. Понятно, что настоящее изобретение описано только для примера и модификации деталей могут быть сделаны без удаления от объема настоящего изобретения.
Каждый раскрытый признак в описании, и (где применимо) формуле изобретения, и чертежах может быть обеспечен независимо или в любой подходящей комбинации. Признаки могут, если применимо, быть осуществлены в технических средствах, программном обеспечении или их комбинации. Ссылочные позиции, появляющиеся в формуле изобретения, приведены только для иллюстрации и не ограничивают объем формулы изобретения.
СПИСОК БИБЛИОГРАФИЧЕСКИХ ССЫЛОК
[1] А.Г. Дэвис «Video quality measurement» («Измерение качества видео»), заявка на патент США, № US 2008/0317111 А1, опубликованная 25 декабря 2008.
[2] Ф. Янг, С. Ван, К. Ксие и др. «No-reference quality assessment for networked video via primary analysis of bit stream» («Оценка качества без ссылок для сетевого видео по первичному анализу двоичного потока данных»), IEEE Trans. Circuits Syst. Video Techol., изд. 20, № 11, стр. 1544-1554, ноябрь 2010.
[3] М.Н. Гарсия, Р. Шлейчер, А. Рааке «Towards a content-based parametric video quality model for IPTV» («В направлении к параметрической модели качества видео на основании контента для IPTV»), в VPQM, 2010.
[4] К. Ямагиши, К. Кавано и Т. Хаяши «Hybrid video-quality-estimation model for IPTV services» («Гибридная модель оценки качества видео для сервисов IPTV»), в GLOBECOM, 2009.
[5] ITU TD 469-GEN, «P.NAMS Test Plan» («P.NAMS План теста»), http://www.itu.int/md/T09-SG12-1101118-TD-GEN-0469/en, январь 2011.

Claims (9)

1. Способ оценки качества видео закодированного видеопотока, причем закодированный видеопоток содержит остаточные значения предсказания макроблока, причем способ работает на уровне транспортного потока и содержит этапы, на которых:
осуществляют синтаксический анализ и восстановление данных из пакетов (107) транспортного потока (103), при этом получают элементарный поток (102);
декодируют, по меньшей мере, части элементарного потока (102) посредством выборочного энтропийного декодера (108) для получения параметров квантования и величин пикселов;
вычисляют в соответствии с коэффициентами DCT и параметрами квантования макроблоков первую величину CU1, которая представляет собой локальную непредсказуемость контента, причем первая величина является дисперсией пикселов остаточных значений предсказания, и вторую величину CUg, которая представляет собой глобальную непредсказуемость контента, причем вторая величина вычисляется путем усреднения первых величин; и
вычисляют (714) для видеопоследовательности (VS), содержащей множество кадров, общую оценку Q качества из оценки Qb базового качества, умноженной на корректирующий фактор Qc,
причем оценка Qb базового качества получена из среднего параметра Q P ¯
Figure 00000006
квантования кадров видеопоследовательности и причем корректирующий фактор Qc получен из средней дисперсии пикселов внутри остаточных значений предсказания макроблоков в видеопоследовательности.
2. Способ по п. 1, дополнительно содержащий этапы выполнения синтаксического анализа (709) параметра квантования и усреднения параметров квантования множества макроблоков для определения среднего параметра квантования.
3. Способ по п. 1, дополнительно содержащий этапы:
определения упомянутой оценки Qb базового качества в соответствии с линейной функцией формы xb/(1+xb), где xb зависит от упомянутого среднего параметра Q P ¯
Figure 00000007
квантования; и
определения упомянутого корректирующего фактора Qc в соответствии с рациональной функцией формы b2*xc+b3, где b2, b3 являются константами, а xc является степенной функцией упомянутой средней дисперсии пикселов внутри остаточных значений предсказания.
4. Способ по п. 3, в котором xb=a2*(QP-a3)a1 для упомянутой оценки Qb базового качества, причем a1, а2, а3 являются положительными рациональными параметрами.
5. Способ по п. 4, в котором положительные параметры находятся внутри следующих диапазонов:
2≤а1≤6
10-5≤а2≤10-4
30≤а3≤75.
6. Способ по п. 3, в котором xc=(CUg)b1 для упомянутого корректирующего фактора Qc, причем b1, b2, b3 - положительные параметры.
7. Способ по п. 3, в котором параметры находятся внутри следующих диапазонов:
0,1≤b1≤0,3
0,1≤b2≤0,3 и
1≤b3≤2.
8. Устройство (106) для оценки качества видео закодированного видеопотока, причем закодированный видеопоток содержит остаточные значения предсказания макроблока, причем устройство работает на уровне транспортного потока и содержит:
синтаксический анализатор (110) коэффициентов DCT для обнаружения и извлечения коэффициентов DCT макроблоков;
блок (107) депакетирования для восстановления данных из пакетов транспортного потока (103), при этом получают элементарный поток (102), и выборочный энтропийный декодер (108) для декодирования, по меньшей мере, частей элементарного потока;
блок (111) вычисления непредсказуемости контента для вычисления в соответствии с коэффициентами DCT макроблоков и параметрами квантования макроблоков первой величины CU1, которая представляет собой локальную непредсказуемость контента, и второй величины CUg, которая представляет собой глобальную непредсказуемость контента, причем вторая величина вычисляется путем усреднения первых величин; и
элемент (114) обработки для вычисления для видеопоследовательности, содержащей множество кадров, общей оценки Q качества из оценки Qb базового качества, умноженной на корректирующий фактор Qc,
причем оценка Qb базового качества получена из величины (112) среднего параметра квантования кадров видеопоследовательности в соответствии с линейной функцией формы xb/(1+xb), где xb зависит от упомянутого среднего параметра Q P ¯
Figure 00000007
квантования, и причем корректирующий фактор Qc получен из средней дисперсии (113) пикселов внутри остаточных значений предсказания макроблоков в видеопоследовательности в соответствии с рациональной функцией формы b2*xc+b3, где b2, b3 являются константами, а хс является степенной функцией упомянутой средней дисперсии пикселов внутри остаточных значений предсказания.
9. Устройство по п. 8, дополнительно содержащее синтаксический анализатор (109) параметра квантования для обнаружения и усреднения параметров квантования макроблоков, причем синтаксический анализатор параметра квантования обеспечивает параметры квантования макроблоков и упомянутую величину среднего параметра квантования.
RU2014128824/08A 2011-12-15 2011-12-15 Способ и устройство для измерения качества видео RU2595917C2 (ru)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2011/002096 WO2013086654A1 (en) 2011-12-15 2011-12-15 Method and apparatus for video quality measurement

Publications (2)

Publication Number Publication Date
RU2014128824A RU2014128824A (ru) 2016-02-10
RU2595917C2 true RU2595917C2 (ru) 2016-08-27

Family

ID=48611776

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2014128824/08A RU2595917C2 (ru) 2011-12-15 2011-12-15 Способ и устройство для измерения качества видео

Country Status (13)

Country Link
US (1) US9961340B2 (ru)
EP (1) EP2792144B1 (ru)
JP (1) JP2015505196A (ru)
KR (1) KR20140102215A (ru)
CN (1) CN103999461A (ru)
AU (1) AU2011383036B2 (ru)
BR (1) BR112014014349A2 (ru)
CA (1) CA2857367A1 (ru)
HK (1) HK1203722A1 (ru)
MX (1) MX2014007041A (ru)
RU (1) RU2595917C2 (ru)
WO (1) WO2013086654A1 (ru)
ZA (1) ZA201403615B (ru)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101825761B1 (ko) 2010-03-31 2018-03-22 톰슨 라이센싱 3d 디스패리티 맵들
AU2011368712A1 (en) * 2011-05-26 2013-12-05 Thomson Licensing Scale-independent maps
CN106713901B (zh) * 2015-11-18 2018-10-19 华为技术有限公司 一种视频质量评价方法及装置
CN109089115B (zh) * 2018-05-28 2022-07-01 北方工业大学 在hevc用于对360度视频进行编码的方法
US10924741B2 (en) * 2019-04-15 2021-02-16 Novatek Microelectronics Corp. Method of determining quantization parameters

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010011112A (ja) * 2008-06-27 2010-01-14 Nippon Telegr & Teleph Corp <Ntt> 映像品質推定装置、方法、およびプログラム
RU2420022C2 (ru) * 2006-10-19 2011-05-27 Телефонактиеболагет Лм Эрикссон (Пабл) Способ определения качества видео

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7092448B2 (en) 2002-05-24 2006-08-15 Koninklijke Philips Electronics N.V. Method and system for estimating no-reference objective quality of video data
GB0228556D0 (en) 2002-12-06 2003-01-15 British Telecomm Video quality measurement
US7170933B2 (en) 2002-12-13 2007-01-30 International Business Machines Corporation Method and system for objective quality assessment of image and video streams
US8311113B2 (en) * 2004-11-12 2012-11-13 Broadcom Corporation Method and system for using motion prediction to equalize video quality across intra-coded frames
JP5043856B2 (ja) 2005-12-05 2012-10-10 ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー 映像品質測定
US20080019669A1 (en) * 2006-07-18 2008-01-24 Sahra Reza Girshick Automatically editing video data
CA2666376C (en) 2006-10-19 2015-06-02 Telefonaktiebolaget L M Ericsson (Publ) A method of determining video quality
EP1937002B1 (en) 2006-12-21 2017-11-01 Rohde & Schwarz GmbH & Co. KG Method and device for estimating the image quality of compressed images and/or video sequences
JP4635016B2 (ja) 2007-02-16 2011-02-16 株式会社東芝 情報処理装置およびインター予測モード判定方法
KR101452172B1 (ko) 2007-05-11 2014-10-21 코닌클리케 필립스 엔.브이. 깊이―관련 정보를 처리하기 위한 방법, 장치 및 시스템
JP2009260940A (ja) * 2008-03-21 2009-11-05 Nippon Telegr & Teleph Corp <Ntt> 映像品質客観評価方法、映像品質客観評価装置、およびプログラム
EP2144449A1 (en) 2008-07-07 2010-01-13 BRITISH TELECOMMUNICATIONS public limited company Video quality measurement
US20100110199A1 (en) 2008-11-03 2010-05-06 Stefan Winkler Measuring Video Quality Using Partial Decoding
US20100316131A1 (en) 2009-06-12 2010-12-16 Motorola, Inc. Macroblock level no-reference objective quality estimation of video
WO2011043793A1 (en) * 2009-10-05 2011-04-14 Thomson Licensing Methods and apparatus for embedded quantization parameter adjustment in video encoding and decoding
JP5484140B2 (ja) * 2010-03-17 2014-05-07 Kddi株式会社 映像品質の客観画質評価装置
EP2373049A1 (en) * 2010-03-31 2011-10-05 British Telecommunications Public Limited Company Video quality measurement
CN101895752B (zh) 2010-07-07 2012-12-19 清华大学 基于图像视觉质量的视频传输方法、系统及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2420022C2 (ru) * 2006-10-19 2011-05-27 Телефонактиеболагет Лм Эрикссон (Пабл) Способ определения качества видео
JP2010011112A (ja) * 2008-06-27 2010-01-14 Nippon Telegr & Teleph Corp <Ntt> 映像品質推定装置、方法、およびプログラム

Also Published As

Publication number Publication date
AU2011383036A1 (en) 2014-06-26
MX2014007041A (es) 2014-09-16
HK1203722A1 (en) 2015-10-30
CN103999461A (zh) 2014-08-20
EP2792144A1 (en) 2014-10-22
JP2015505196A (ja) 2015-02-16
KR20140102215A (ko) 2014-08-21
EP2792144A4 (en) 2015-08-05
AU2011383036B2 (en) 2017-03-16
US20140334555A1 (en) 2014-11-13
BR112014014349A2 (pt) 2017-06-13
ZA201403615B (en) 2016-02-24
US9961340B2 (en) 2018-05-01
RU2014128824A (ru) 2016-02-10
EP2792144B1 (en) 2017-02-01
WO2013086654A1 (en) 2013-06-20
CA2857367A1 (en) 2013-06-20

Similar Documents

Publication Publication Date Title
CN105635735B (zh) 感知图像和视频编码
US10009611B2 (en) Visual quality measure for real-time video processing
RU2595917C2 (ru) Способ и устройство для измерения качества видео
JP4987080B2 (ja) 映像符号化装置および方法、映像符号化プログラムおよびそのプログラムを記録した記録媒体
JP2005527159A (ja) 圧縮された映像データの客観的な品質を見積もる方法およびシステム
US9077972B2 (en) Method and apparatus for assessing the quality of a video signal during encoding or compressing of the video signal
US20090060027A1 (en) Compressed Signal Subjective Quality Ratings Prediction
Brandao et al. No-reference PSNR estimation algorithm for H. 264 encoded video sequences
JP4309703B2 (ja) 符号化誤差推定装置
RU2587412C2 (ru) Управление скоростью передачи видео на основе гистограммы коэффициентов преобразования
Eichermüller et al. Encoding Time and Energy Model for SVT-AV1 Based on Video Complexity
JP6373681B2 (ja) 客観画質評価装置、客観画質評価方法、およびプログラム
CN107749993B (zh) 基于mmse重构的分布式视频编码信源失真估算方法
JP4384629B2 (ja) 符号化誤差測定装置および符号化誤差測定プログラム
CN114762345B (zh) 用于在基于变换的视频编码中估计块效应的系统和方法
JP4133788B2 (ja) 符号化誤差推定方法および符号化誤差推定装置
US20150341659A1 (en) Use of pipelined hierarchical motion estimator in video coding
KR100703799B1 (ko) 역 양자화 방법 및 장치, 상기 방법을 이용한 비디오디코딩 방법 및 장치
KR101038205B1 (ko) 분산 비디오 압축 기법을 위한 가상 채널 모델링 방법 및 장치
JP5237222B2 (ja) 映像符号化難易度の定量化装置、方法およびプログラム
CN104488265B (zh) 用于视频流服务的内容相关的视频质量模型
US8953672B2 (en) Method and device for compressing a video sequence
Cui et al. Intra mode decision and frame layer Lagrange multiplier adjustment scheme for H. 264 based on structural similarity
CN104488265A (zh) 用于视频流服务的内容相关的视频质量模型

Legal Events

Date Code Title Description
PD4A Correction of name of patent owner
PC41 Official registration of the transfer of exclusive right

Effective date: 20191111

MM4A The patent is invalid due to non-payment of fees

Effective date: 20201216