KR101558636B1 - 비디오 품질 측정 방법 - Google Patents

비디오 품질 측정 방법 Download PDF

Info

Publication number
KR101558636B1
KR101558636B1 KR1020107027961A KR20107027961A KR101558636B1 KR 101558636 B1 KR101558636 B1 KR 101558636B1 KR 1020107027961 A KR1020107027961 A KR 1020107027961A KR 20107027961 A KR20107027961 A KR 20107027961A KR 101558636 B1 KR101558636 B1 KR 101558636B1
Authority
KR
South Korea
Prior art keywords
measurement
encoded
signal
dependent
predetermined relationship
Prior art date
Application number
KR1020107027961A
Other languages
English (en)
Other versions
KR20110039214A (ko
Inventor
앤드류 고든 데이비스
Original Assignee
브리티쉬 텔리커뮤니케이션즈 파블릭 리미티드 캄퍼니
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 브리티쉬 텔리커뮤니케이션즈 파블릭 리미티드 캄퍼니 filed Critical 브리티쉬 텔리커뮤니케이션즈 파블릭 리미티드 캄퍼니
Publication of KR20110039214A publication Critical patent/KR20110039214A/ko
Application granted granted Critical
Publication of KR101558636B1 publication Critical patent/KR101558636B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N17/00Diagnosis, testing or measuring for television systems or their details
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N17/00Diagnosis, testing or measuring for television systems or their details
    • H04N17/004Diagnosis, testing or measuring for television systems or their details for digital television systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

본 발명은 비디오 품질 측정 방법에 관한 것이며, 구체적으로는 상기 비디오 신호는 원시 형태, 부호화된 형태, 및 복호화된 형태를 갖고, 상기 부호화된 형태에서, 부호화된 신호가 그것과 관련된 양자화기 스텝 크기 파라미터를 갖도록 가변의 양자화기 스텝 크기를 이용하고, 상기 부호화된 신호가 상기 신호의 예측 잔류의 표시값을 포함하도록 차동 부호화를 이용하는 압축 알고리즘을 이용하여 상기 비디오 신호가 부호화되고, 상기 복호화된 형태에서, 상기 부호화된 비디오 신호는 적어도 부분적으로 상기 원시 형태로 재변환되고, 상기 방법은, a) 미리 결정된 관계에 의해 상기 양자화기 스텝 크기 파라미터에 종속하는 제 1 품질 측정값을 생성하는 단계; b) 미리 결정된 관계에 의해 상기 복호화된 형태로 상기 비디오 신호에 의해 표현된 프레임들의 적어도 일부의 공간 복잡도에 종속하는 마스킹 측정값을 생성하는 단계; 및 c) 미리 결정된 관계에 의해 제 1 측정값과 상기 마스킹 측정값 모두에 종속하는 조합된 측정값을 생성하는 단계를 포함하고, 미리 결정된 관계에 의해 상기 신호의 예측 잔류에 종속하는 제 2 측정값을 생성하는 단계; 및 상기 제 2 측정값이 문턱값을 초과하는 상기 화상의 하나 이상의 영역을 식별하는 단계를 추가로 포함하고, 상기 마스킹 측정값은 미리 결정된 관계에 의해 상기 식별된 영역의 공간 복잡도에 종속하는 것을 특징으로 한다.

Description

비디오 품질 측정 방법{VIDEO QUALITY MEASUREMENT}
본 발명은 비디오 품질 측정에 관한 것이고, 구체적으로는 비디오 신호가 압축 알고리즘을 사용하여 부호화된 상황에 관련된 것이다.
비디오 신호가 한 장소에서 다른 장소로 전송되는 경우, 부호화되지 않은 경우 필요한 것보다 더 작은 대역폭을 사용하여 부호화된 신호가 전송될 수 있도록 인코딩(encoding) 알고리즘을 사용하여 비디오 신호를 부호화 또는 압축하는 것이 알려져 있다. 수신한 경우, 부호화된 신호는 원시 신호를 복구하기 위해 복호화된다. 다수의 인코딩 기법에 있어서, 2차원 코사인 변환의 수행에 의해, 일련의 변환 계수가 얻어지고 그 크기가 양자화된다. 대역폭을 효율적으로 할당하는 것이 가능하도록, 양자화의 입도, 즉 스텝 크기는 가변적이다.
비디오 시퀀스의 부호화(encoding) 및 복호화(decoding) 프로세스에 의해 왜곡이 도입되거나 아니면 신호의 품질이 저하될 수 있다. 왜곡의 레벨을 측정하는 한 가지 방법은, 왜곡된 비디오 신호 내의 지각 가능한 왜곡의 레벨에 대한 관찰자의 견해를 수집하고, 그 결과를 평균하여 평균 견해 평점(MOS: Mean Opinion Score)을 구하는 것이다. 그러나, 이 방법은 시간이 소요되는 프로세스이다. 따라서, 관찰자가 비디오 시퀀스에서 지각하는 품질의 손실을 예측하는 것이 바람직할 수 있다. 부호화/복호화 및 전송 프로세스에 의한 비디오 품질의 저하는 원시 시퀀스에 기준하여 얻는 것이 가능하지만, 이와 같은 기법이 때로는 불편하다.
예측 부호화에 있어서, "예측 잔류(prediction residual)"로서 알려진, 실제 신호와 예측된 신호 사이의 차이가 전송된다. 통상, 상기 차이의 양자화된 형태가 전송된다.
국제 특허 출원 WO2007/066066에 의해, 복수의 프레임을 나타내는 비디오 신호에 대한 품질의 측정값을 생성하는 방법이 제공되며, 상기 비디오 신호는 원시 형태, 부호화된 형태, 및 복호화된 형태를 갖고, 상기 부호화된 형태에서, 부호화된 신호가 그것과 관련된 양자화기 스텝 크기 파라미터를 갖도록 가변의 양자화기 스텝 크기를 이용하고, 상기 부호화된 신호가 상기 신호의 예측 잔류의 표시값을 포함하도록 차동 부호화를 이용하는 압축 알고리즘을 이용하여 상기 비디오 신호가 부호화되고, 상기 복호화된 형태에서, 상기 부호화된 비디오 신호는 적어도 부분적으로 상기 원시 형태로 재변환되고, 상기 방법은, a) 상기 양자화기 스텝 크기 파라미터의 함수인 제 1 품질 측정값을 생성하는 단계; b) 상기 복호화된 형태의 상기 비디오 신호에 의해 표현된 프레임들의 적어도 일부의 공간 복잡도의 함수인 제 2 품질 측정값을 생성하는 단계; 및 c) 제 1 측정값과 제 2 측정값을 조합하는 단계를 포함한다.
예측 부호화에 있어서, "예측 잔류"로서 알려진, 실제 신호와 예측된 신호 사이의 차이가 전송된다. 통상, 상기 차이의 양자화된 형태가 전송된다.
본 발명에 의하면, 복수의 프레임을 나타내는 비디오 신호에 대한 품질의 측정값을 생성하는 방법이 제공되며, 상기 비디오 신호는 원시 형태, 부호화된 형태, 및 복호화된 형태를 갖고, 상기 부호화된 형태에서, 부호화된 신호가 그것과 관련된 양자화기 스텝 크기 파라미터를 갖도록 가변의 양자화기 스텝 크기를 이용하고, 상기 부호화된 신호가 상기 신호의 예측 잔류의 표시값을 포함하도록 차동 부호화를 이용하는 압축 알고리즘을 이용하여 상기 비디오 신호가 부호화되고, 상기 복호화된 형태에서, 상기 부호화된 비디오 신호는 적어도 부분적으로 상기 원시 형태로 재변환되고, 상기 방법은, a) 미리 결정된 관계로 상기 양자화기 스텝 크기 파라미터에 종속하는 제 1 품질 측정값을 생성하는 단계; b) 미리 결정된 관계로 상기 복호화된 형태의 비디오 신호에 의해 표현된 프레임들의 적어도 일부의 공간 복잡도에 종속하는 마스킹 측정값을 생성하는 단계; 및 c) 미리 결정된 관계로 제 1 측정값과 상기 마스킹 측정값 모두에 종속하는 조합된 측정값을 생성하는 단계를 포함하며, 상기 방법은 또한, 미리 결정된 관계로 비디오 신호의 예측 잔류에 종속하는 제 2 측정값을 생성하는 단계; 상기 제 2 측정값이 문턱값을 초과하는 화상의 하나 이상의 영역을 식별하는 단계를 포함하고, 상기 마스킹 측정값은 미리 결정된 관계로 상기 식별된 영역(들)의 공간 복잡도에 종속한다.
본 발명의 다른 측면들은 특허 청구범위에 제시된다.
이제 첨부한 다음 도면들을 참조하여 본 발명의 몇몇 실시예를 단지 예시로서 설명할 것이다.
도 1a는 비디오 시퀀스의 품질을 추정하는 장치의 기능 항목을 도시하는 블록 다이어그램이고,
도 1b는 화상 내의 한 픽셀에 대한 수평 콘트라스트 측정값이 어떻게 산출되는지를 도시하고,
도 1c는 도 1b의 화상 내의 상기 픽셀에 대한 수직 콘트라스트 측정값이 어떻게 산출되는지를 도시하고,
도 2 내지 도 11은 도 1a의 시스템에 대한 테스트 결과를 보여주는 도면이다.
아래에 설명된 실시예는 노-레퍼런스(no-reference) 디코더(decoder)-기반의 비디오 품질 평가 도구이다. 상기 도구를 위한 알고리즘은 비디오 디코더 내에서 동작 가능하며, 각각의 복호화된 매크로블록을 위한 양자화기 스텝-크기 파라미터(보통, 부호화된 비디오 스트림 입력 내에 포함된 변수)와 각각의 복호화된 화상의 픽셀 강도 값을 사용하여 상기 복호화된 비디오의 주관적 품질을 추정한다. 각 프레임의 복호화된 픽셀에 대해 슬라이딩-윈도우 평균 픽셀 강도 차(픽셀 콘트라스트 측정값)의 계산이 수행되고 결과적으로 얻어진 평균(CWS)은 상기 비디오의 노이즈 마스킹 특성의 측정값으로서 사용된다. 그 다음 상기 품질 추정이 CWS 파라미터와, 스텝 크기 파라미터의 평균의 함수로서 이루어진다. 상기 함수는 특징적인 복호화된 시퀀스의 트레이닝 데이터 베이스와 상기 시퀀스에 대해 미리 획득한 주관적 평점에 대한 다중 회귀분석에 의해 미리 결정된다. 상기 복잡도를 추정하기 위해 상기 스텝-크기와 슬라이딩-윈도우 평균 픽셀 강도 차 측정값의 조합을 사용함으로써 주관적 품질의 양호한 추정값을 제공하는 것이 가능하다.
원칙적으로 사용된 측정 프로세스는 변환 코딩을 사용하는 동시에 가변 양자화기 스텝 크기를 갖는 압축 기법을 사용하여 부호화된 비디오 신호에 일반적으로 적용 가능하다. 그러나 설명할 버젼은 (H.261, H.263, MPEG-2 (프레임 기반) 등과 같은 다른 DCT 기반 표준 코덱에도 적용 가능하지만) H.262 및 H.264 표준에 의해 부호화된 신호에 사용하도록 설계되어 있다.
본 측정 방법은 비간섭성 또는 "노-레퍼런스(no-reference)" 타입이다. 즉, 이 방법은 원시 신호의 사본에 액세스할 필요가 없다. 본 방법은 부호화된 비트스트림으로부터의 파라미터와 복호화된 비디오 화상으로부터의 파라미터 모두에 액세스를 필요로 하는 적절한 디코더에서 사용하도록 설계되어 있다.
예비사항으로, 상기 기법을 트레이닝하고 테스트하기 위해 사용된 비디오 데이터베이스는 18개의 상이한 8초의 시퀀스를 포함하고, 모두는 625-라인 브로드캐스트 포맷을 갖는다는 것을 밝힌다. 상기 시퀀스 중 6개의 출처는 VQEG 페이즈 I 데이터베이스 [7]이고, 나머지의 출처는 다른 곳이다. 품질 파라미터는 각 시퀀스의 기간 동안의 평균에 기초하기 때문에, 모션(motion) 및 디테일(detail)의 일관된 특성을 갖는 콘텐츠를 선택하는 것은 중요하다. 표 1에는 시퀀스의 상세가 정리되어 있다.
트레이닝 시퀀스 특징 테스트 시퀀스 특성
프리젠터 로컬 디테일 및 모션 운동경기 고속 팬 및 로컬 모션
댄스 고속 줌, 하이 모션, 로우 디테일 풋볼1 고속 줌 및 팬, 로컬 디테일및 모션
풋볼2 고속 팬, 로컬 디테일 및 모션 뉴스 저속 줌, 로컬 디테일 및
모션
저속 팬, 물, 디테일 날씨 로우 모션, 하이 텍스처
비누 저속 팬, 하이 콘트라스트, 모션 튀김 고속 팬, 필름
바르셀로나 포화된 색상, 저속 줌 바위 움직임, 콘트라스트 변량
카누 물 움직임, 팬, 디테일 스포츠 약한 디테일, 움직임
하프 저속 줌, 약한 디테일 달력 하이 디테일, 저속 팬
저속 움직임, 디테일 럭비 움직임, 고속 팬
(트레이닝 및 테스트 시퀀스)
인코딩(부호화)
트레이닝 및 테스트 시퀀스 모두는 각각에 대해 동일한 인코더 옵션이 설정된 H.262 인코더를 사용하여 부호화되었다. 레이트 제어가 작동하지 않는 상태에서 그리고 양자화 파라미터(QP)를 고정한 상태에서 I,P,B,P,B,P의 프레임 패턴이 사용되었다. 그 다음 양자화기 스텝-크기 파라미터는 각 소스 파일에 대해 테스트마다 증가되었다.
트레이닝 세트와 테스트 세트 모두에 대해 12개의 주체를 사용하여 정식의 단일-자극 주관 테스트가 수행되었다. 주관 평점은 5-등급 ACR 평가 척도를 사용하여 얻어졌다. 평균한 MOS(MMOS)가 표 2(트레이닝 세트) 및 표 3(테스트 세트)에 정리되어 있다.
Figure 112010081873439-pct00001
(트레이닝 시퀀스에 대한 주관적 평점)
Figure 112010081873439-pct00002
(테스트 시퀀스에 대한 주관적 평점)
도 1a에 도시된 장치에서, 입력신호는 입력(1)에서 수신되어 비디오 디코더에 전달되고 비디오 디코더는 그것을 복호화하여 각 화상에 대해 다음의 파라미터를 출력한다:
복호화된 화상(D);
픽셀 단위의 수평 복호화된 화상의 크기(X);
픽셀 단위의 수직 복호화된 화상의 크기(Y);
매클로블록 단위의 수평 복호화된 화상의 크기(Mx);
매크로블록 단위의 수직 복호화된 화상의 크기(My);
양자화기 스텝-크기 파라미터의 세트(Q);
DCT 계수(R).
장치 내에는 2개의 분석 경로가 존재하며, 이것들은 화상-평균 양자화기 스텝-크기 신호(AvQstep(n)(유닛 3)와 화상-평균 콘트라스트 측정값(CWS)(유닛 4)을 계산하는 기능을 한다. 유닛 5는 그 다음 신호 AvQstep(n)와 신호 CW(n)을 시간에 대해 평균하여 각각 신호 AvQstep와 신호 CWS를 제공한다. 최종적으로, 이들 신호는 유닛 6에서 조합되어 복호화된 비디오 시퀀스(D)에 대한 주관적 품질의 추정값(MOS)을 제공한다. 구성요소(3~6)는 개개의 하드웨어에 의해 구현이 가능하지만 모든 스테이지를 적합하게 프로그램된 프로세서를 사용하여 수행함으로써 더욱 편리하게 구현하는 것이 가능하다.
화상-평균(Picture-average)(Q)
H.264에 적응된, 이것의 제 1 버전은 디코더에서 출력된 양자화기 스텝 크기 신호(Q)를 사용한다. Q는 현재의 복호화된 화상의 각 매크로블록에 대해 하나의 양자화기 스텝-크기 파라미터 값(QP)을 포함한다. H.264에 대해서, 양자화기 파라미터(QP)는 상기 변환 계수를 부호화하기 위해 사용된 선형 양자화기의 간격(QSTEP)을 정의한다. 사실상, QP는 미리 정의된 간격들의 표에 색인을 만들며, 여기서 QSTEP의 크기는 QP가 6 증가할 때마다 2배가 된다. 상기 화상-평균 양자화기 파라미터(QPF)는 다음 식에 의해 유닛 3에서 계산된다.
Figure 112010081873439-pct00003
여기서 Mx와 My는 각각 화상 내의 수평 및 수직 매크로블록의 수이고, Q(i,j)는 위치(i,j)의 매크로블록에 대한 양자화기 스텝-크기 파라미터이다.
H.262의 양자화 프로세스는 H.264 메인-프로파일에 대해 위에서 정의된 분석에 잘 적용되지 않는다. 그러므로, 약간의 변경이 요구되었다. H.262에서, 양자화 프로세스는 인트라 DC 계수와 다른 모든 변환 계수 사이에 상이하다. 편의상, 양자화 효과의 분석은 AC 변환 계수에만 한정될 것이다.
AC 변환 계수에 대해서, 인코딩 프로세스에 의해 도입된 양자화 잡음의 양은 양자화기 스케일 팩터(QP)와 가중치 매트릭스(qWeight)의 조합에 의해 결정된다. 팩터 QP는 매크로블록 내 모든 DCT 계수의 양자화에 대해 상수이지만, 매클로블록마다 다르게 변할 수 있다(즉, 이전 매크로블록의 팩터(QP)로부터 작은 변량 +/-). 매트릭스(qWeight)는 8x8 DCT 매트릭스의 각 요소에 대해 사용자가 정의한 가중치 팩터를 제공하고 통상 인코더 초기화 시 설정될 것이다. 이것은 시퀀스 수준에서만 설정되기 때문에 각 매크로블록에 대해서 동일하다.
프레임(n) 내의 매크로블록(k)에 대해서, 레벨 수(lev)까지 양자화되는 DCT 계수 요소(j)는 식(1)에 의해 계수(qDCT)로 복호화될 것이다.
Figure 112010081873439-pct00004
여기서 N은 비디오 시퀀스의 프레임들의 세트를 나타내고 K(n)은 프레임(n) 내의 분석되는 매크로블록의 세트를 나타낸다. 변수 c는 [2]에서 정의된 바와 같이 {-1,0,1}의 값들 중 하나를 갖는 부호 오프셋이다.
요소(j)에 대한 실제 양자화 스텝 크기(Qstep)는 다음 식으로 계산될 수 있다:
Figure 112010081873439-pct00005
스케일 팩터(QP)는 고정된 한 세트의 미리 정해진 값들 중 하나로 인덱스(QPi)를 통해 설정된다. 2개 세트의 값들이 표준에 의해 정해져, 표 4에 제시된 바와 같이 선형으로 또는 비선형으로 이격된 파라미터의 선택을 제공한다.
선형_QP_어레이[32] 비선형_QP_어레이[32]
0, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62 0, 1, 2, 3, 4, 5, 6, 7, 8, 10, 12, 14, 16, 18, 20, 22, 24, 28, 32, 36, 40, 44, 48, 52, 56, 64, 72, 80, 88, 96, 104, 112
(MPEG-2 양자화기 스케일링 어레이)
가중치 양자화 파라미터(wQstep)는 각 매크로블록에 대한 가중치 매트릭스의 효과를 반영하도록 정의될 수 있다.
Figure 112010081873439-pct00006
식 (3)에서, f()는 가중치 매트릭스(qWeight)의 함수이고 식 (4)에 의해 정해질 수 있다.
Figure 112010081873439-pct00007
식 (4)에서, J는 평균이 수행되는 변환 계수들의 세트를 정의하고 Jtot는 상기 세트 내의 구성요소들의 수와 일치한다. 가중치 매트릭스(qWeight)의 효과에 대한 자세한 검토는 본 명세서의 범위를 벗어나지만, 세트 J의 2개의 상이한 정의를 테스트했다:
J1={3개의 최고 빈도 AC 계수(계수들의 활성여부에 무관함)}
J2={모든 활성(0이 아닌) AC 계수}
프레임 n에 대해, 평균 스텝-크기 측정값(AvQstep(n))은 식 (5)에 의해 계산될 수 있다.
Figure 112010081873439-pct00008
K(n)은 상기 분석이 실시되는 프레임(n) 내의 매크로블록들의 세트를 정의한다. 전형적으로 이것은 에지 영역을 제외한 전체 화상이 될 것이다. 즉 상기 화상의 끝을 잘라내어, 잘려나간 비디오의 존재로 인한 경계효과를 회피한다. 상기 화상의 중앙은 일반적으로 시각적 주목을 위해 가장 중요하다.
평균 양자화기 스텝-크기의 시퀀스-평균 측정값은 식 (6)에 의해 계산될 수 있다.
Figure 112010081873439-pct00009
각 테스트에 대해, 가중치 매트릭스는 고정되었고 QP의 값은 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26 및 32 중에서 QPi 값에 따라 설정되었다. AvQstep는 각 테스트에 대해 식 (6)에 따라 그리고 식 (4)에서 세트 J1을 사용하여 결정되었다. 도 2는 9개의 트레이닝 시퀀스 각각에 대해 측정된 평균 평가점(MMOS)에 대한 AvQstep을 보여주고 도 3은 9개의 테스트 시퀀스에 대한 것을 보여준다. 상기 시퀀스-평균은 초당 25 프레임으로 8초 동안의 시퀀스에 대해, 즉 식 (6)에서 N=200으로 취득되었다.
도 2와 도 3은 AvQstep가 주관적 평점(MMOS)의 우수한 기본 예측기이라는 것과 콘텐츠 유형에 따라 곡선에 아주 일관성있는 구별이 존재함을 도시한다. AvQstepMMOS 사이의 상관도는 트레이닝 세트에 대해서 0.89로 계산되고 테스트 세트에 대해서는 0.91로 계산되었다(표 4 참조).
H.264에 있어서, (H.262에 대해 유사한 원칙을 갖는) 양자화기 가중치 매트릭스는 "하이 프로파일(High Profile)"에서 정의될 수 있음을 주의해야 한다. 상기 가중치 매트릭스는 시퀀스 또는 화상 레벨에서 "평탄(Flat)", "디폴트 비평탄(Default non-flat)" 또는 "사용자-정의(User-defined)"로서 정의될 수 있고 4x4 인트라 변환, 4x4 인터 변환, 8x8 인트라 변환 및 8x8 인터 변환에 적용된다(8x8 변환은 하이 프로파일에서만 이용 가능하다). H.262에 대해 제안된 것과 유사한 기법이 H.264 하이 프로파일에 대해서도 사용될 수 있다.
콘트라스트 측정값 계산
왜곡 마스킹은 부호화된 비디오 내의 왜곡 지각에 영향을 미치는 중요한 인자이다. 이와 같은 마스킹은 동일한 스펙트럼 로캘러티(locality), 시간적 로캘러티, 또는 공간적 로캘러티 내 신호 성분과 잡음 성분 사이를 구별하는 인간의 지각 메커니즘의 무능함으로 인해 발생한다. 이와 같은 고려사항은 비트의 효율적인 할당이 필수적인 비디오 인코더의 설계에 있어서 아주 중요하다. 이 분야의 연구가 변환 및 픽셀 도메인 모두에서 수행되었지만([8, 9, 10]), CS에 대해서는 픽셀 도메인만이 고려된다. 도 1b 및 도 1c는 횡 방향 크기 X 픽셀과 종 방향 크기 Y 픽셀을 갖는 화상 내 위치(x,y)에서 픽셀 p(x,y)에 대해 콘트라스트 측정값이 어떻게 계산되는지를 도시한다.
도 2에는 수평 콘트라스트 측정값을 계산하는 분석이 도시되어 있다. 도 2에서, 콘트라스트 측정값은 음영 구역으로 도시된 픽셀 p(x,y)에 대해 계산된다. 동일한 크기의 인접 영역들이 선택된다(그 중 하나는 상기 음영 구역을 포함한다). 각 영역은 상기 음영 구역이 위치하고 있는 로우(row)부터 한 세트의 (바람직하게는 연속적인) 픽셀들로부터 형성된다. 각 영역 내의 픽셀 강도를 평균하고, 그 다음 평균들의 차이의 절대값이 아래에서 식 (2)에 의해 계산되며, 이 차이 값이 콘트라스트 측정값이 된다. 수직 콘트라스트 측정값은 도 3에 도시된 바와 같이 유사한 방식으로 계산된다. 도 3에서, 상부의 픽셀 세트와 하부의 픽셀 세트가 선택된다. 선택된 픽셀들 각각은 동일한 칼럼에 위치하며, 음영 픽셀은 상부 픽셀 세트와 하부 픽셀 세트 사이의 경계에 인접하고 있다. 상부 세트와 하부 세트 내의 픽셀들의 강도를 평균하고, 그 다음 각 세트의 평균 강도의 차이를 산정하며, 이 차이의 절대값이 아래에서 식 (3)에 의해 산출된 수직 콘트라스트 측정값, 즉 수직 방향의 콘트라스트 측정값이 된다. 이 실시예에 있어서, 상기 음영 구역은 하부 세트에 포함되어 있다. 그러나, 비교되는 픽셀들의 세트에 의해 공유되는 경계의 근처에 위치한다면, 콘트라스트 측정값이 관련되는 픽셀의 위치는 임의적이다.
따라서, 수평 콘트라스트 측정값을 얻기 위해 길이(H1, H2)의 로우 부분이 비교되지만, 수직 콘트라스트 측정값을 얻기 위해서는 길이(V1, V2)의 칼럼 부분이 비교된다(길이(H1, H2, V1, V2)는 동일할 수도 있고 동일하지 않을 수도 있다). 상기 콘트라스트 측정값은, 그 위치가 한편으로 상기 로우 부분들의 공통 경계에 그리고 다른 한편으로는 상기 칼럼 부분들의 공통 경계에 근접한 픽셀과 관련된다.
이와 같이 계산된 수평 콘트라스트 측정값과 수직 콘트라스트 측정값은 그 다음에 비교되어, 2개의 값 중 더 큰 값(식 (4)에서 제시된 바와 같이 수평-수직 측정값이라고 함)이 상기 음영 픽셀과 관련되고, 메모리에 저장된다.
이 절차는 화상 내의 (상기 화상의 수평 및 수직 에지로부터 각각 수직 거리(V1, V2)와 수평 거리(H1, H2) 내의) 각 픽셀에 대해 반복되며, 그에 의해 H1, H2, V1 또는 V2의 윈도우 크기를 갖는, 픽셀들에 대한 슬라이딩 윈도우 분석을 제공한다. 그 다음 화상(프레임) 내의 각 픽셀에 대한 수평-수직 측정값의 평균을 내고 복수의 화상에 대해 각 화상과 관련된 이러한 종합 측정값의 평균을 내어 시퀀스-평균 측정값을 얻는다. 종합 측정값의 평균을 내는 화상들의 수는 비디오 시퀀스의 속성과 장면 변경 사이의 시간에 좌우되며, 수 초가 될 수 있다. 이하에서 상세히 설명되는 바와 같이, 화상의 일부만이 이런 방식으로 분석될 필요가 있다.
화상 내의 상이한 위치에서 콘트라스트를 측정하고 평균을 구함으로써, 상기 화상의 복잡도에 대한 간단한 측정값이 얻어진다. 화상 내의 복잡도는 왜곡을 마스킹하는 것이 가능하고, 이에 의해 관찰자는 화상이 주어진 왜곡에서 더 양호한 품질을 갖는 것으로 믿게 되므로, 화상 내의 복잡도는, 관찰자가 비디오 신호와 관련시키는 주관적 품질 수준을 예측하는데 부분적으로 사용될 수 있다.
음영 픽셀에 대한 각각의 영역들의 너비 또는 높이는 관찰자가 복잡도를 인식하는 정밀도에 관련된다. 따라서, 만일 이미지를 멀리 떨어져서 보는 경우 관찰자가 이미지를 더 가까이서 보는 상황보다 상기 너비와 높이는 더 크게 선택될 것이다. 일반적으로 관찰자가 쾌적하게 여기는 화상으로부터의 거리는 화상의 크기에 좌우되기 때문에, 크기는 또 픽셀 크기와 픽셀 디멘죤에 좌우된다 (주어진 픽셀 밀도에서, 디스플레이 크기도 인자가 될 수 있지만, 더 큰 디스플레이는 통상 더 많은 픽셀이 아니라 더 큰 픽셀을 갖는다). 통상, H1, H2, V1 및 V2의 각각은 각각의 화상 디멘죤의 0.5% 와 2% 사이에 있을 것이 예상된다. 예를 들면, 수평으로 720개 픽셀이 존재하고 각 세트가 평균적으로 4개의 픽셀을 포함하는 경우 수평 값들은 4*100/720=0.56%이고, 수직 방향으로 576개의 픽셀이 존재하는 경우 수직방향 값은 4*100/576=0.69%이다.
더욱 상세하게는, 픽셀 차 콘트라스트 측정값 Ch 및 Cv가 식 (7)에 의해 계산된다.
Figure 112010081873439-pct00010
여기서 d(n,x,y)는 수평 X (x=0...X-1) 픽셀과 수직 Y (y=0...Y-1) 픽셀의 디멘죤을 갖는 복호화된 시퀀스(d)로부터의 N의 n번째 프레임 내의 픽셀 강도 값(0...255)이다.
Figure 112010081873439-pct00011
여기서 H1과 H2는 수평 픽셀 분석을 위한 윈도우 길이이고 V1과 V2는 수직 픽셀 분석을 위한 윈도우 길이이다.
그 다음 Ch와 Cv는 결합되어 수평-수직 측정값(Chv)을 제공하며,
Figure 112010081873439-pct00012
선행 특허 출원(WO2007/066066)에서, Chv는 그 다음에 식 (10)에 의해 프레임에 대한 종합 픽셀 차이 측정값(CF)을 계산하고,
Figure 112010081873439-pct00013
다음에 식 (11)에 의해 시퀀스-평균 측정값(CS)을 계산하는데 사용되었다.
Figure 112010081873439-pct00014
시퀀스-평균 측정값(CS)은 H1=4, H2=1, V1=2 및 V2=1을 사용하여 복호화된 트레이닝 시퀀스의 각각에 대해 계산되었고, 그 결과가 AvQstep에 대해 도 4에 도시되어 있다.
상기 선행 특허 출원의 결과에 의하면 측정값(CS)이 상기 시퀀스의 노이즈 마스킹 특성에 관련이 있는 것을 알 수 있다. 높은 CS는 높은 마스킹을 제공하고 따라서 주어진 양자화기 스텝-크기에 대해 더 높은 MMOS을 제공한다. 하기에 설명한 다중 회귀분석에 CS 측정값을 포함시키는 것에 의해 노-레퍼런스 품질 추정에서의 CS 측정값의 사용 가능성을 테스트했다. 상기 시퀀스-평균 콘트라스트 측정값(CS)은 수평 수직 픽셀-차 측정의 전체-이미지 평균(CF)을 이용했다. 이와 같은 측정값은 잘 부호화된 평이한 영역을 갖는 커다란 영역을 포함하는 이미지에서 어려움이 있을 수 있는데, 왜냐하면 그와 같은 영역은 시각적 영향을 미칠 가능성은 거의 없지만 CF와 CS의 크기에 크게 영향을 미치기 때문이다. 이 효과의 예는, 품질은 거의 최상급이지만(도 2) 마스킹에 있어서는 중급인(도 4) "하프(harp)" 테스트 시퀀스(도 5)에서 알 수 있다. 이와 같은 콘텐츠를 더욱 양호하게 처리하기 위해, 더 높은 수준의 모션과 디테일을 갖는 이미지의 부분들에 분석을 집중하기 위해 지역적(regional) 중요도의 측정값이 사용된다.
H.262, H.263 및 H.264와 같은 전형적인 하이브리드 비디오 부호화 알고리즘은 픽셀 블록의 예측 함수, 결과 얻어진 차 블록의 변환 함수, 변환된 계수의 양자화 및 이들 양자화된 심볼의 엔트로피 부호화 함수를 포함한다. 10 Mbit/s 미만의 비트율로의 방송 포맷 비디오 시퀀스의 부호화에 의해 통상 다수의 변환 계수는 0으로 양자화된다. 높은 비율의 0이 아닌 양자화된 계수는 예측하기 어려우면서 또한 높은 수준의 디테일을 갖는 영역을 지시하는 경향이 있다. 이들 영역은 시각적 주목을 끄는 경향이 있고 더 높은 양자화 효과를 받기 쉽기 때문에 지역적 분석에 유용할 가능성이 있다.
이들 인코더에서 발견된 정규의 매크로블록 구조체를 기반으로 지역적 분석을 수행하는 것이 편리하다. 프레임 번호 n에 대해서, 매크로블록 k에 대한 DCT 액티비티(activity)의 측정값(Act1)이 다음 식에 의해 산출될 수 있다.
Figure 112010081873439-pct00015
TCount(m)은 매크로블록(m) 내 복수의 0이 아닌 양자화된 변환 계수의 카운트의 합을 나타낸다. M(n,k)는 합계가 수행되는 매크로블록(k)에 중심을 둔 매크로블록의 세트를 정의한다. K(n)는 프레임(n)에서 고려되는 매크로블록의 세트를 정의한다. N은 고려되는 시퀀스 내 프레임들의 세트를 정의한다.
M의 중첩하지 않는 영역들에 대한 결과는, M의 형태와 크기에 따라 M에 대한 중앙 값들의 세트 K(n)을 제한하거나 또는 최초의 중첩 분석 이후 Actl()을 적당히 필터링 하거나 어느 하나에 의해 달성될 수 있다. 여기서, 두 번째 방법은 다음 단계에 따라 Actl을 필터링하는 것이 선호된다.
1. 화상(n)에 대한 탐색 MB의 임시 세트 KMAX를 KMAX=K(n)으로 초기화한다.
2. k∈KMAX인 모든 k에 대해 Actl(n,k)=0이면 단계 7로 간다.
3. k∈KMAX인 k에 대해 Actl(n,k)가 최대인 kmax=k를 찾는다.
4. (m∈M(n,kmax) ∩(m≠Kmax))에 대해 Actl(n,m)=0으로 설정한다.
6. 단계 2로 복귀한다.
7. 종료
매크로블록(k)에 중심을 갖는 3x3 영역의 매크로블록을 정의하는 M(n,k)를 갖고 "하프" 시퀀스를 MPEG2 인코딩하는데 식 (12)가 적용되었다. 전술한 바와 같이 Actl의 중첩하지 않는 필터링이 적용되었다.
도 6은 결과적으로 얻어진 액티비티 맵의 예를 도시한다. 도 6은 모션(손)과 하이 디테일 및 비예측성(샹들리에 및 셔츠의 부분)의 영역에서 최고의 액티비티를 보여준다. 프레임(n)에 대해, 그 다음에 식 (13)에 따라 액티비티 어레이(Acltl)에 문턱값을 적용함으로써 최대 액티비티 Kl(n)의 영역이 정의된다.
Figure 112010081873439-pct00016
- 조건 Actl(n,k1)>Thresh1(n)을 만족시키는 더 큰 세트 K1(n)의 모든 kl의 세트를 의미함.
Thresh1은 식 (14)에 따라 화상 내 최대 액티비티의 함수로서 정의될 수 있다.
Figure 112010081873439-pct00017
도 7은 도 6으로부터의 맵에 50% 액티비티 문턱값을 적용한 효과를 도시한다. 디스플레이 목적을 위해, 액티비티 영역들은 3x3 매크로블록 분석 영역에 대해 Actl의 관련 값들을 반복함으로써 도시된다. 도시된 영역들은 양자화 효과가 최대가 될 것으로 추정되는 영역들로 간주된다. 이들 영역의 중요성의 추정값은 그것들의 마스킹 특성과 나머지 화상의 마스킹 특성을 비교함으로써 이루어진다.
K1이 함께 취득된 최대 액티비티의 영역 또는 영역들을 의미하는 경우, 먼저 K1의 마스킹 특성이 식 (15)에 따라 평균 콘트라스트 함수를 계산함으로써 추정된다.
Figure 112010081873439-pct00018
여기서 K1tot(n)은 세트 K1(n)의 구성요소의 수이고 C0(kl)은 M(n,kl)에 의해 커버되는 픽셀 영역에 대한 콘트라스트 측정값이다.
따라서, C0(kl)은 k1에 의해 표시된 매크로블록에 대해 합산된 식 (7) 내지 (9)로부터의 픽셀 콘트라스트 측정값(Chv)으로 정의된다. 그러면,
Figure 112010081873439-pct00019
여기서 x,y는 각각의 픽셀(k1)의 픽셀 좌표이다.
최초 분석 영역 K(n) 내에 있으나 최대 액티비티 Kl(n)의 영역에 포함되지 않은 상기 화상의 영역도 역시 중요하다. 이 영역은 K2(n)으로 정의되고 그 구성요소들(k2)은 식 (17)을 준수한다.
Figure 112010081873439-pct00020
영역 K2는 영역 K1보다 더 적은 시각적 왜곡을 갖는 것으로 가정되지만, 그것의 콘트라스트 특성은 전체적인 왜곡의 지각에 의미 있는 영향을 미치는 것이 가능하다. 영역 K2는 잘 예측된 콘트라스트가 높은 영역을 가질 수 있고 따라서 영역 K1에 포함되지 않는다. 그러나, 그와 같은 영역은 시각적 주의를 끌어 K1에서 왜곡의 일반적 마스킹을 제공할 것이다. K1 내의 화상 영역과 비교할만한 콘트라스트 특성을 갖는 K2 내의 화상 영역은 식 (18)의 의해 세트 K3(n)를 정의하기 위해 문턱값 C0Thresh(n)을 사용함으로써 크로핑(cropping) 된 화상(K)의 분석에 포함된다.
Figure 112010081873439-pct00021
Figure 112010081873439-pct00022
최대 액티비티 K1의 영역에 대한 콘트라스트 측정값의 평균과 같은 CoThresh의 문턱값은 피시험 시퀀스를 위해 적합한 것으로 밝혀졌다. 높은 액티비티 영역 K1과, 액티비티는 낮지만 의미있는 콘트라스트를 갖는 영역 K3는 식 (20)에 의해 조합되어 영역 K4를 만들 수 있다.
Figure 112010081873439-pct00023
식 (15) 내지 식 (20)에 의해 "하프" 시퀀스에 대해 콘트라스트 분석이 수행되었으며 단일의 필드의 영역 K4에 대한 결과가 도 8에 도시되어 있다.
각 프레임에 대한 가중 콘트라스트 측정값이 이제 식 (21)에 의해 정의될 수 있다.
Figure 112010081873439-pct00024
K4tot(n)은 프레임 n에 대한 세트 K4의 구성요소의 수와 같다. 결과적으로, 시퀀스-평균 영역별 가중 콘트라스트 측정값(CWS)은 식(22)에 의해 계산될 수 있다.
Figure 112010081873439-pct00025
상기 시퀀스-평균 측정값(CWS)은 복호화된 트레이닝 시퀀스의 각각에 대해 계산되었고 그 결과는 평균 양자화기 스텝 크기에 대해 도 9에 도시되어 있다.
도 9의 CWS 결과는 도 4에 도시된 대응하는 CS 결과에 대한 고무적인 차이를 보여준다. 낮은-모션과 평이한 배경의 유사한 특성을 갖는 2개의 시퀀스 "하프"와 "뷰"는 CS에 의한 중상위 순위에서 CWS에 의한 최상위로 이동되었다. 이것은 도 2의 MMOS 순위와의 우수한 일치를 보여준다. 마찬가지로, 시퀀스 "바로셀로나"는 CS의 최상위 순위에서 CWS의 중간 순위로 이동하고, 이것은 도 2의 MMOS 중간 순위와 더욱 근사하게 일치한다.
양자화기 스텝 크기에 대한 파라미터 평균화는 MOS 추정이 요구되는 시간-간격(N)에 대해 수행되어야 한다. 이것은 AvQstep와 CWS의 단일 쌍을 생성하는 단일의 분석기간이거나 또는 일련의 파라미터를 생성하는 일련의 간격들일 수 있다. 전형적으르 초(second) 오더의 길이를 갖는 윈도우 간격으로 분석 윈도우를 타임 시퀀스릍 통해 시간상 "슬라이딩"시킴으로써 연속적 분석이 달성될 수 있다.
전술한 액티비티 측정값(Actl)은 전형적으로 변환 계수로부터 계산된 예측 잔류의 함수인 측정값의 한 예이다. 0이 아닌 계수의 카운트도 잘 작동하지만, 총 에너지와 같은, 상기 계수의 크기에도 종속하는 측정값도 사용 가능하고, 상기 카운트와 에너지의 조합을 사용하는 것도 가능하다.
MOS 추정
모델 설계
양자화기 스텝-크기의 시퀀스-평균 측정값(AvQstep)과 가중 콘트라스트(CWS) (또는 대안으로 픽셀 콘트라스트(CS))는 대응하는 주관적 MMOS(measured mean opinion score)의 추정값(PMOS)을 생성하는데 사용된다. PMOS는 식 (23)에 의해 파라미터들의 조합으로부터 산출된다.
Figure 112010081873439-pct00026
F1과 F2는 AvQstep과 CWS에서 적절한 선형 또는 비선형 함수이다. K0은 상수이다.
PMOS는 1...5의 범위에 있고, 여기서 5는 최상의 품질을 나타내고 1은 최하의 품질을 나타낸다. F1, F2 및 K0는 다수의 상용 통계 소프트웨어 패키지에서 가용한 적절한 회귀분석(예: 선형, 다항식 또는 대수)에 의해 결정될 수 있다. 이와 같은 분석은 알려진 주관적 품질을 갖는 트레이닝 시퀀스의 세트를 요구한다. F1, F2 및 K0에 의해 정해진 모델은 그 다음에 종속변수로서 MMOS와 독립변수로서 AvQstep 및 CWS를 가지고 회귀분석을 통해 도출될 수 있다. 결과적으로 얻어진 모델은 트레이닝 시퀀스에서 사용된 것과 유사하게 악화된 (코덱 유형 및 압축 레이트) 테스트 시퀀스의 품질을 예측하는데 통상 사용될 것이다. 그러나, 비디오 내용은 상이할 수 있다.
여기서 제시된 MPEG-2 부호화된 풀 해상도 방송 시퀀스에 대해, 적절한 비선형 모델이 다음과 같이 밝혀졌다.
Figure 112010081873439-pct00027
결과적으로 얻어진 추정값은 다음에 의해 제한될 것이다:
Figure 112010081873439-pct00028
상기 파라미터 평균화는 MOS 추정이 요구되는 시간-간격에 대해 수행되어야 한다. 이것은 상기 모델의 교정에서와 같은 단일 쌍의 AvQstep 및 CWS를 생성하는 단일의 분석기간이거나 또는 일련의 파라미터를 생성하는 일련의 간격들일 수 있다. 전형적으로 초 오더의 길이의 윈도우 간격으로 분석 윈도우를 AvQstep 및 CWS 시간 시퀀스를 통해 시간상 "슬라이딩"시키는 것에 의해 연속적 분석을 달성하는 것이 가능하다.
결과
먼저, 다수의 상용 통계 소프트웨어 패키지에서 가용한 선형 및 다항식/대수 회귀분석을 사용하여 AvQstep(독립변수)에 의해 트레이닝 세트를 위한 MMOS(종속변수)의 모델이 생성되었다. 결과적으로 얻어진 모델은 그 다음에 테스트 시퀀스에 대해 사용되었다. 이것은 그 다음에 추가 독립 변수로서 CS와 그 다음에 CWS를 사용하여 반복되었다. 각 모델에 대해 추정된 MOS(PMOS)와 측정된 MOS(MMOS) 사이의 상관과 RMS 잔류가 표 5에 제시되어 있다.
시퀀스 세트 AvQstep AvQstep AvQstep, CS AvQstep, CWS
0.89(0.554) 0.918(0.485) 0.926(0.452) 0.941(0.415)
테스트 시퀀스 0.91(0.46) 0.947(0.373) 0.955(0.356) 0.966(0.318)
(MMOS와 PMOS 사이의 상관 및 RMS 잔류)
결과에 의하면 AvQstep-기반 MOS 추정 모델에 시퀀스-평균된 영역별 가중 콘트라스트 측정값(CWS)를 포함하는 것은 트레이닝 데이터 세트와 테스트 데이터 세트 모두에 대해 성능을 크게 향상시킨다는 것을 알 수 있다. AvQP/CS 모델과 AvQP/CWS 모델에 대한 개별적인 트레이닝 결과와 테스트 결과가 도 10과 도 11에 각각 산란 모형으로 도시되어 있다.
전술한 방법의 다수의 변형이 창안될 수 있다. 예를 들면, 전술한 바와 같이, 에지 효과를 회피하기 위해 배제된 경계영역으로부터 떨어진 전체 화상 영역에 대해 품질 측정이 수행되었다. 그러나 원한다면 상기 평가는 화상 영역의 더 작은 부분에 제한될 수도 있다. 이것은 화상 내 대상 영역을 식별하는 공지의 "시각적 주의(visual attention)" 알고리즘을 사용하여 선택될 수도 있다. 다른 방법에서, 측정값(AvQstep)의 계산은 영역 K1(또는 K4)에 제한될 수도 있다.
화상이 예측을 사용하지 않고 부호화된 매크로블록을 포함하는 경우, 실제에 있어서 설명된 방식으로 이 블록들을 처리하는 것은 전체적인 결과에 크게 영향을 미치지 않는다는 것이 밝혀졌다. 그러나 만일 이것이 문제가 된다면, 이와 같은 매크로블록은 프로세스에서 완전히 배제될 수 있다.
결론
기존 연구[1]에 의하면 주관적 비디오 품질의 양호한 예측은 비디오 디코더 내에 구현된 2-파라미터 모델로부터 달성될 수 있음이 밝혀졌다. 여기서, 양자화기 스텝-크기와 평균 콘트라스트에 기초한 측정값을 사용하는 기존 기술은 새로운 영역별 가중 콘트라스트 측정값(CWS)의 사용에 의해 강화될 수 있다.
먼저, 최대 액티비티(K1)의 영역이 0이 아닌 양자화된 변환 계수의 카운트를 사용하여 화상의 가장 중요한 영역을 식별하기 위해 정의되었다. 높은 비율의 0이 아닌 양자화된 계수는 예측하기 어려운 그리고 높은 디테일 정도를 갖는 영역을 지시하는 경향을 가질 것이다. 이 영역들은 시각적 주의를 유인하는 경향이 있고 더 높은 양자화 효과를 받기 때문에 잠재적으로 영역분석에 유용하다.
최대 액티비티(K1)의 영역은 그 다음에 전체적인 화상의 마스킹 특성을 평가하기 위한 콘트라스트 임계값(C0Thresh)을 결정하는데 사용되었다. 영역(K1)에 포함되지 않은 상기 화상의 부분들은 더 낮은 시각적 왜곡을 갖는 것으로 간주되지만, 그것들의 콘트라스트 특성은 전체 왜곡의 인식에 중요한 영향을 미치는 것이 가능하다. 양호하게 예측되고 따라서 영역(K1)에 포함되지 않는 높은 콘트라스트 영역들은 시각적 주의를 끌어 K1 내의 왜곡의 포괄적인 마스킹을 제공하는 것이 가능하다. 임계값(C0Thresh)을 초과하는 콘트라스트 특성을 갖는 화상의 모든 영역들은 영역별 가중 콘트라스트 분석에 포함되어 측정값(CWS)을 제공한다. 이 기술은 높은-액티비티의 낮은-콘트라스트 영역과 낮은-액티비티의 높은-콘트라스트 영역을 고려하는 이점이 있으며, 양자는 품질의 인식에 중요하다.
700 Kbps 내지 18 Mbps의 비트율로 MPEG-2 부호화된 18개의 상이한 콘텐츠 클립에 대한 결과가 제시되고, 원래의 모델에 대해 유의미한 성능을 제공하는 CWS 측정값을 보여준다.
참조문헌
Figure 112010081873439-pct00029

Claims (13)

  1. 복수의 프레임을 나타내는 비디오 신호에 대한 품질 측정값을 생성하는 방법에 있어서,
    상기 비디오 신호는 원시 형태, 부호화된 형태, 및 복호화된 형태를 갖고,
    상기 부호화된 형태에서, 부호화된 신호가 그것과 관련된 양자화기 스텝 크기 파라미터를 갖도록 가변의 양자화기 스텝 크기를 이용하고, 상기 부호화된 신호가 상기 신호의 예측 잔류의 표시값을 포함하도록 차동 부호화를 이용하는 압축 알고리즘을 이용하여 상기 비디오 신호가 부호화되고,
    상기 복호화된 형태에서, 상기 부호화된 비디오 신호는 적어도 부분적으로 상기 원시 형태로 재변환되고,
    상기 방법은,
    a) 미리 결정된 관계에 의해 상기 양자화기 스텝 크기 파라미터에 종속하는 제 1 품질 측정값을 생성하는 단계;
    b) 미리 결정된 관계에 의해 상기 복호화된 형태로 상기 비디오 신호에 의해 표현된 프레임들의 적어도 일부의 공간 복잡도에 종속하는 마스킹 측정값을 생성하는 단계; 및
    c) 미리 결정된 관계에 의해 제 1 품질 측정값과 상기 마스킹 측정값 모두에 종속하는 조합된 측정값을 생성하는 단계를 포함하고,
    미리 결정된 관계에 의해 상기 신호의 예측 잔류에 종속하는 제 2 측정값을 생성하는 단계; 및
    상기 제 2 측정값이 문턱값을 초과하는 화상의 하나 이상의 영역을 식별하는 단계를 추가로 포함하고,
    상기 마스킹 측정값은 미리 결정된 관계에 의해 상기 식별된 영역의 공간 복잡도에 종속하는 것을 특징으로 하는 비디오 신호에 대한 품질 측정값을 생성하는 방법.
  2. 제 1 항에 있어서,
    상기 예측 잔류의 표시값은 픽셀-도메인 예측 잔류의 2차원 변환의 계수이고,
    제 2 측정값은 상기 계수들로부터 산출되는 것을 특징으로 하는 비디오 신호에 대한 품질 측정값을 생성하는 방법.
  3. 삭제
  4. 제 2 항에 있어서,
    상기 제 2 측정값은 복수의 0이 아닌 변환 계수의 카운트인 것을 특징으로 하는 비디오 신호에 대한 품질 측정값을 생성하는 방법.
  5. 제 2 항에 있어서,
    상기 제 2 측정값은 상기 변환 계수의 크기(amplitude)에 종속하는 것을 특징으로 하는 비디오 신호에 대한 품질 측정값을 생성하는 방법.
  6. 삭제
  7. 제 1 항, 제 2 항, 제 4 항 및 제 5 항 중 어느 한 항에 있어서,
    상기 마스킹 측정값은,
    (a) 상기 제 2 측정값이 문턱값을 초과하는 상기 화상의 식별된 영역과,
    (b) 상기 제 2 측정값이 상기 문턱값을 초과하지 않지만 공간 복잡도가 제 2 문턱값을 초과하는 상기 화상의 영역의,
    상기 공간 복잡도의 함수인 것을 특징으로 하는 비디오 신호에 대한 품질 측정값을 생성하는 방법.
  8. 제 7 항에 있어서,
    상기 제 2 문턱값은 동적으로 변하고 상기 식별된 영역에 대해 산출된 공간 복잡도의 함수인 것을 특징으로 하는 비디오 신호에 대한 품질 측정값을 생성하는 방법.
  9. 삭제
  10. 제 1 항, 제 2 항, 제 4 항 및 제 5 항 중 어느 한 항에 있어서,
    제 1 품질 측정값은 상기 마스킹 측정값이 도출되는 상기 화상의 부분들로부터만 도출되는 것을 특징으로 하는 비디오 신호에 대한 품질 측정값을 생성하는 방법.
  11. 제 1 항, 제 2 항, 제 4 항 및 제 5 항 중 어느 한 항에 있어서,
    상기 공간상의 복잡도는 프레임 내의 복수의 위치에서 로컬 콘트라스트 측정값을 판정함으로써 측정되는 것을 특징으로 하는 비디오 신호에 대한 품질 측정값을 생성하는 방법.
  12. 삭제
  13. 삭제
KR1020107027961A 2008-07-07 2009-04-23 비디오 품질 측정 방법 KR101558636B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP08252312.7 2008-07-07
EP08252312A EP2144449A1 (en) 2008-07-07 2008-07-07 Video quality measurement

Publications (2)

Publication Number Publication Date
KR20110039214A KR20110039214A (ko) 2011-04-15
KR101558636B1 true KR101558636B1 (ko) 2015-10-07

Family

ID=40265433

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020107027961A KR101558636B1 (ko) 2008-07-07 2009-04-23 비디오 품질 측정 방법

Country Status (7)

Country Link
US (1) US9578321B2 (ko)
EP (2) EP2144449A1 (ko)
JP (1) JP5384628B2 (ko)
KR (1) KR101558636B1 (ko)
CN (1) CN102084660B (ko)
CA (1) CA2726276C (ko)
WO (1) WO2010004238A1 (ko)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2373049A1 (en) * 2010-03-31 2011-10-05 British Telecommunications Public Limited Company Video quality measurement
WO2011142279A1 (ja) * 2010-05-13 2011-11-17 シャープ株式会社 符号化装置、復号装置、およびデータ構造
US8804815B2 (en) * 2011-07-29 2014-08-12 Dialogic (Us) Inc. Support vector regression based video quality prediction
WO2013075318A1 (en) * 2011-11-24 2013-05-30 Thomson Licensing Video quality measurement
KR20140102215A (ko) 2011-12-15 2014-08-21 톰슨 라이센싱 비디오 품질 측정 방법 및 장치
US8826314B2 (en) 2012-01-30 2014-09-02 At&T Intellectual Property I, Lp Method and apparatus for managing quality of service
CN104885452A (zh) * 2012-08-27 2015-09-02 汤姆逊许可公司 用于估计视频质量评估的内容复杂度的方法和装置
EP2888877B1 (en) * 2012-08-27 2018-05-02 Thomson Licensing Method and apparatus for estimating content complexity for video quality assessment
CN104796690B (zh) * 2015-04-17 2017-01-25 浙江理工大学 一种基于人脑记忆模型的无参考视频质量评价方法
CN106713901B (zh) * 2015-11-18 2018-10-19 华为技术有限公司 一种视频质量评价方法及装置
CN108271016B (zh) * 2016-12-30 2019-10-22 上海大唐移动通信设备有限公司 视频质量评估方法及装置
KR102350396B1 (ko) * 2017-07-27 2022-01-14 엘지디스플레이 주식회사 유기발광 표시장치와 그의 열화 센싱 방법
BR112021010170A2 (pt) * 2018-11-27 2021-08-17 Op Solutions, Llc fusão de figuração com base em bloco para segmentação e processamento contextual
US10970633B1 (en) * 2020-05-13 2021-04-06 StradVision, Inc. Method for optimizing on-device neural network model by using sub-kernel searching module and device using the same
US11532077B2 (en) 2020-08-17 2022-12-20 Netflix, Inc. Techniques for computing perceptual video quality based on brightness and color components
US11557025B2 (en) * 2020-08-17 2023-01-17 Netflix, Inc. Techniques for training a perceptual quality model to account for brightness and color distortions in reconstructed videos

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006507775A (ja) 2002-11-25 2006-03-02 サーノフ・コーポレーション 基準なしで圧縮ビデオシーケンスの品質を測定する方法及び装置
JP2006509435A (ja) 2002-12-06 2006-03-16 ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー ビデオ品質の測定
WO2007066066A2 (en) 2005-12-05 2007-06-14 British Telecommunications Public Limited Company Non-intrusive video quality measurement

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3289045B2 (ja) * 1994-04-12 2002-06-04 三菱電機株式会社 ディジタル記録再生装置
US5654759A (en) * 1995-02-15 1997-08-05 Hitachi America Ltd. Methods and apparatus for reducing blockiness in decoded video
JP3458600B2 (ja) * 1996-05-10 2003-10-20 Kddi株式会社 ディジタル画像品質評価装置
US6067118A (en) * 1997-12-16 2000-05-23 Philips Electronics North America Corp. Method of frame-by-frame calculation of quantization matrices
US6101278A (en) * 1998-01-30 2000-08-08 Philips Electronics North America Corp. System for extracting coding parameters from video data
US6219067B1 (en) * 1998-04-03 2001-04-17 Sarnoff Corporation Measures for characterizing compressed bitstreams
US6496221B1 (en) * 1998-11-02 2002-12-17 The United States Of America As Represented By The Secretary Of Commerce In-service video quality measurement system utilizing an arbitrary bandwidth ancillary data channel
US6671324B2 (en) * 2001-04-16 2003-12-30 Mitsubishi Electric Research Laboratories, Inc. Estimating total average distortion in a video with variable frameskip
US6810083B2 (en) * 2001-11-16 2004-10-26 Koninklijke Philips Electronics N.V. Method and system for estimating objective quality of compressed video data
US7212571B2 (en) * 2003-01-31 2007-05-01 Seiko Epson Corporation Method and apparatus for DCT domain filtering for block based encoding
US7873224B2 (en) * 2006-03-01 2011-01-18 Qualcomm Incorporated Enhanced image/video quality through artifact evaluation
CN100588271C (zh) * 2006-08-08 2010-02-03 安捷伦科技有限公司 基于分组度量和图像度量两者测量视频质量的系统和方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006507775A (ja) 2002-11-25 2006-03-02 サーノフ・コーポレーション 基準なしで圧縮ビデオシーケンスの品質を測定する方法及び装置
JP2006509435A (ja) 2002-12-06 2006-03-16 ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー ビデオ品質の測定
WO2007066066A2 (en) 2005-12-05 2007-06-14 British Telecommunications Public Limited Company Non-intrusive video quality measurement

Also Published As

Publication number Publication date
JP5384628B2 (ja) 2014-01-08
US20110102601A1 (en) 2011-05-05
KR20110039214A (ko) 2011-04-15
CA2726276A1 (en) 2010-01-14
CN102084660B (zh) 2012-12-05
JP2011527544A (ja) 2011-10-27
EP2294829B1 (en) 2017-06-21
EP2294829A1 (en) 2011-03-16
CN102084660A (zh) 2011-06-01
EP2144449A1 (en) 2010-01-13
WO2010004238A1 (en) 2010-01-14
US9578321B2 (en) 2017-02-21
CA2726276C (en) 2017-03-14

Similar Documents

Publication Publication Date Title
KR101558636B1 (ko) 비디오 품질 측정 방법
US8254438B2 (en) Video quality measurement
Marziliano et al. Perceptual blur and ringing metrics: application to JPEG2000
Vranješ et al. Review of objective video quality metrics and performance comparison using different databases
US8947538B2 (en) System for video quality prediction and related aspects
Ma et al. Reduced-reference video quality assessment of compressed video sequences
US20100061446A1 (en) Video signal encoding
Bhat et al. A new perceptual quality metric for compressed video based on mean squared error
KR20100116216A (ko) 비디오 품질의 객관적 평가 방법, 장치 및 프로그램
Xu et al. Consistent visual quality control in video coding
Sugimoto et al. A No Reference Metric of Video Coding Quality Based on Parametric Analysis of Video Bitstream
Lin et al. Network-based packet loss visibility model for SDTV and HDTV for H. 264 videos
Davis et al. Hybrid no-reference video quality prediction
Ben Amor et al. A no reference quality metric to measure the blocking artefacts for video sequences
Su et al. Content-adaptive bitstream-layer model for coding distortion assessment of H. 264/AVC networked video
Park et al. A noble method on no-reference video quality assessment using block modes and quantization parameters of H. 264/AVC
Zhu et al. Spatial quality index based rate perceptual-distortion optimization for video coding
Rahman et al. No-reference spatio-temporal activity difference PSNR estimation
Singam Computational Complexity of Human Visualization Characteristics based on Well Known Metric
Wang et al. Content aware video quality prediction model for HEVC encoded bitstream
Xu et al. Video quality metric for consistent visual quality control in video coding
Menkovski et al. Objective QoE Models
Yang No-reference objective quality assessment and enhancement for compressed images and videos

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20180921

Year of fee payment: 4