KR20220003087A

KR20220003087A - Vr 영상 품질 평가 방법 및 장치

Info

Publication number: KR20220003087A
Application number: KR1020217039548A
Authority: KR
Inventors: 지에 시옹; 이홍 후앙; 구앙 첸; 지안 첸
Original assignee: 후아웨이 테크놀러지 컴퍼니 리미티드
Priority date: 2019-05-17
Filing date: 2020-05-17
Publication date: 2022-01-07
Also published as: JP2022533928A; EP3958558A4; US20220078447A1; CN111953959A; JP7327838B2; WO2020233536A1; EP3958558A1; KR102600721B1

Abstract

본 발명은, VR 영상의 품질을 평가하는 방법으로서, VR 영상의 비트 레이트, 프레임 레이트, 해상도, 및 TI를 획득하는 단계와, VR 영상의 비트 레이트, 프레임 레이트, 해상도, 및 TI에 기초하여 VR 영상의 평균 오피니언 스코어(MOS)를 결정하는 단계를 포함하는 방법을 개시한다. VR 영상의 MOS는 VR 영상의 품질을 나타내는 데 사용된다. 본 발명은 또한 평가 장치를 개시한다. 본 발명의 실시예에서는 VR 영상의 평가 결과의 정확도가 향상될 수 있다.

Description

VR 영상 품질 평가 방법 및 장치

본 발명은 영상 처리 분야에 관한 것으로, 특히 VR 영상의 품질 평가 방법 및 장치에 관한 것이다.

가상현실(Virtual Reality, VR) 기술은, 복수의 분야(컴퓨터 그래픽스, 인간-머신 상호작용 기술, 센서 기술, 인간-머신 인터페이스 기술, 인공 지능 기술 등등을 포함함)를 결합하고, 현실과 완전히 분리된 세계를 생성 및 경험하고 그와 상호작용하도록 인간의 감각(예를 들어, 3차원 시각, 청각, 후각)을 기만하기 위해 적절한 장비가 사용되는 첨단 기술이다. 간단히 말해서, VR 기술은 컴퓨터를 사용하여 거짓 세계를 생성하고 몰입형 상호작용적 시청각 경험을 생성하는 기술이다. VR 서비스의 인기가 높아짐에 따라 VR 산업 생태계가 등장했다. 운영자, 산업 파트너, 일반 소비자 모두가 사용자 경험을 평가하기 위한 VR 서비스 품질 평가 방법을 필요로 한다. VR 서비스를 사용가능에서 사용자 친화적으로 면모시키고 VR 산업의 발전을 촉진하기 위해, 주로 VR 영상의 품질을 평가함으로써 사용자 경험이 평가된다.

종래 기술에서, 영상의 품질은 영상의 비트 레이트, 해상도 및 프레임 레이트를 사용하여 평가된다. 이것은 기존 영상의 품질을 평가하는 방법이다. 그러나, VR 영상은 기존 영상과 크게 다르다. VR 영상은 360도 파노라마 영상으로, VR 영상은 독특한 방식으로 인코딩된다. VR 영상의 품질을 기존 영상의 품질 평가 방법을 사용하여 평가하면 평가 결과의 정확도가 낮다.

본 발명의 실시예는 VR 영상의 품질을 평가하기 위한 방법 및 장치를 제공한다. 본 발명의 실시예에서는 VR 영상의 평가 결과의 정확도가 향상된다.

제1 측면에 따르면, 본 발명의 실시예는 VR 영상의 품질을 평가하는 방법으로서,

VR 영상의 비트 레이트, 프레임 레이트, 해상도, 및 시간적 지각 정보(temporal perceptual information, TI)를 획득하는 단계 ― VR 영상의 TI는 VR 영상의 영상 시퀀스의 시간 변화를 나타내는 데 사용됨 ― 와, VR 영상의 비트 레이트, 프레임 레이트, 해상도 및 TI에 기초하여 VR 영상의 평균 오피니언 스코어(mean opinion score, MOS)를 결정하는 단계 ― VR 영상의 MOS는 VR 영상의 품질을 나타내는 데 사용됨 ― 를 포함하는, 방법을 제공한다. 종래 기술에 비해, VR 영상의 품질을 평가하기 위한 파라미터로 TI를 도입함으로써 VR 영상의 품질 평가 결과의 정확도를 높인다.

실현가능한 실시예에서, VR 영상의 TI를 획득하는 것은,

VR 영상의 2개의 인접 이미지 프레임의 동일한 위치에서의 픽셀 값 간의 차이를 획득하는 것과, 표준편차 공식에 기초하여 2개의 인접 이미지 프레임의 동일한 위치에서의 픽셀 값 간의 차이를 계산하여 VR 영상의 TI를 획득하는 것을 포함한다.

표준 편차 공식은

이고,

이며, 여기서,

는 2개의 인접 이미지 프레임 중 현재 프레임의 i번째 행에 있는 j번째 픽셀의 픽셀 값과 현재 프레임의 이전 프레임의 i번째 행에 있는 j번째 픽셀의 픽셀 값 간의 차이를 나타내며,

W와 H는 각각 2개의 인접 이미지 프레임 각각의 폭과 높이를 나타낸다.

실현가능한 실시예에서, VR 영상의 TI를 획득하는 것은,

미리 설정된 지속 시간(

) 내에서 사용자의 머리 회전 각도(

)를 획득하는 것과, 미리 설정된 지속 시간(

) 및 사용자의 머리 회전 각도(

)에 기초하여 사용자의 평균 머리 회전 각도를 결정하는 것과, 사용자의 평균 머리 회전 각도에 기초하여 VR 영상의 TI를 결정하는 것을 포함한다. 사용자의 더 큰 평균 머리 회전 각도는 VR 영상의 더 큰 TI 값을 나타낸다.

실현가능한 실시예에서, 미리 설정된 지속 시간(

) 내에서 사용자의 머리 회전 각도(

)를 획득하는 것은,

시점(t)에서의 사용자의 머리 각도(

) 및 시점(

)에서의 사용자의 머리 각도(

)를 획득하는 것과, 다음과 같은 방법에 따라 사용자의 머리 회전 각도(

)를 결정하는 것을 포함한다:

와

간의 차이의 절대값이 180도보다 크고,

가

보다 작은 경우,

이고;

와

간의 차이의 절대값이 180도보다 크고,

가

보다 큰 경우,

이고;

와

간의 차이의 절대값이 180도보다 크지 않은 경우,

이다.

실현가능한 실시예에서, 사용자의 평균 머리 회전 각도에 기초하여 VR 영상의 TI를 결정하는 것은,

사용자의 평균 머리 회전 각도를 계산용 제1 TI 예측 모델에 입력하여 VR 영상의 TI를 획득하는 것을 포함한다. 제1 TI 예측 모델은

이며, 여기서

는 사용자의 평균 머리 회전 각도를 나타내고, m과 n은 상수이다. VR 영상의 TI는 사용자의 머리 회전 각도에 기초하여 예측되므로 TI를 계산하는 데 필요한 연산 능력(computing power)은 무시될 수 있다.

사용자의 평균 머리 회전 각도를 계산용 제2 TI 예측 모델에 입력하여 VR 영상의 TI를 획득하는 것을 포함한다. 제2 TI 예측 모델은 비-파라미터 모델(nonparametric model)이다. VR 영상의 TI는 사용자의 머리 회전 각도에 기초하여 예측되므로 TI를 계산하는 데 필요한 연산 능력은 무시될 수 있다.

실현가능한 실시예에서, VR 영상의 비트 레이트, 프레임 레이트, 해상도, 및 TI에 기초하여 VR 영상의 평균 오피니언 스코어(MOS)를 결정하는 것은,

VR 영상의 비트레이트, 해상도, 프레임 레이트, 및 TI를 계산용 품질 평가 모델에 입력하여 VR 영상의 MOS를 획득하는 것을 포함한다. 품질 평가 모델은

이고, 여기서,

B1은 VR 영상의 비트 레이트를 나타내고, B2는 VR 영상의 해상도를 나타내고, F는 VR 영상의 프레임 레이트를 나타내며, a, b, c 및 d는 상수이다.

제2 측면에 따르면, 본 발명의 실시예는 평가 장치로서,

VR 영상의 비트 레이트, 프레임 레이트, 해상도 및 시간적 지각 정보 TI를 획득하도록 구성된 획득 유닛 ― VR 영상의 TI는 VR 영상의 영상 시퀀스의 시간 변화를 나타내는 데 사용됨 ― 과,

VR 영상의 비트 레이트, 프레임 레이트, 해상도 및 TI에 기초하여 VR 영상의 평균 오피니언 스코어(MOS)를 결정하도록 구성된 결정 유닛 ― VR 영상의 MOS는 VR 영상의 품질을 나타내는 데 사용됨 ― 을 포함하는, 평가 장치를 제공한다.

실현가능한 실시예에서, VR 영상의 TI를 획득할 때, 획득 유닛은 구체적으로,

VR 영상의 2개의 인접 이미지 프레임의 동일한 위치에서의 픽셀 값 간의 차이를 획득하고, 표준편차 공식에 기초하여 2개의 인접 이미지 프레임의 동일한 위치에서의 픽셀 값 간의 차이를 계산하여 VR 영상의 TI를 획득하도록 구성된다.

표준 편차 공식은

이고,

이며, 여기서,

미리 설정된 지속 시간(

) 내에서 사용자의 머리 회전 각도(

)를 획득하고, 미리 설정된 지속 시간(

) 및 사용자의 머리 회전 각도(

)에 기초하여 사용자의 평균 머리 회전 각도를 결정하고, 사용자의 평균 머리 회전 각도에 기초하여 VR 영상의 TI를 결정하도록 구성된다. 사용자의 더 큰 평균 머리 회전 각도는 VR 영상의 더 큰 TI 값을 나타낸다.

실현가능한 실시예에서, 미리 설정된 지속 시간(

) 내에서 사용자의 머리 회전 각도(

)를 획득할 때, 획득 유닛은 구체적으로,

시점(t)에서의 사용자의 머리 각도(

) 및 시점(

)에서의 사용자의 머리 각도(

)를 획득하고, 다음과 같은 방법에 따라 사용자의 머리 회전 각도(

)를 결정하도록 구성된다:

와

간의 차이의 절대값이 180도보다 크고,

가

보다 작은 경우,

이고;

와

간의 차이의 절대값이 180도보다 크고,

가

보다 큰 경우,

이고;

와

간의 차이의 절대값이 180도보다 크지 않은 경우,

이다.

실현가능한 실시예에서, 사용자의 평균 머리 회전 각도에 기초하여 VR 영상의 TI를 결정할 때, 획득 유닛은 구체적으로,

사용자의 평균 머리 회전 각도를 계산용 제1 TI 예측 모델에 입력하여 VR 영상의 TI를 획득하도록 구성된다. 제1 TI 예측 모델은

이며, 여기서

는 사용자의 평균 머리 회전 각도를 나타내고, m과 n은 상수이다.

사용자의 평균 머리 회전 각도를 계산용 제2 TI 예측 모델에 입력하여 VR 영상의 TI를 획득하도록 구성된다. 제2 TI 예측 모델은 비-파라미터 모델이다.

실현가능한 실시예에서, VR 영상의 비트 레이트, 프레임 레이트, 해상도, 및 TI에 기초하여 VR 영상의 평균 오피니언 스코어(MOS)를 결정할 때, 결정 유닛은 구체적으로,

VR 영상의 비트레이트, 해상도, 프레임 레이트, 및 TI를 계산용 품질 평가 모델에 입력하여 VR 영상의 MOS를 획득하도록 구성된다. 품질 평가 모델은

이고, 여기서,

제3 측면에 따르면, 본 발명의 실시예는 평가 장치로서, 실행가능한 프로그램 코드를 저장하는 메모리와, 메모리에 결합된 프로세서를 포함하는, 평가 장치를 제공한다. 프로세서는 메모리에 저장된 실행가능한 프로그램 코드를 호출하여 제1 측면에 따른 방법의 일부 또는 모든 단계를 수행한다.

제4 측면에 따르면, 본 발명의 실시예는 컴퓨터 판독가능 저장 매체를 제공한다. 컴퓨터 저장 매체는 컴퓨터 프로그램을 저장하고, 컴퓨터 프로그램은 프로그램 명령어를 포함하고, 프로그램 명령어가 프로세서에 의해 실행될 때, 프로세서는 제1 측면에 따른 방법의 일부 또는 모든 단계를 수행할 수 있게 된다.

본 발명의 실시예의 솔루션에서는, VR 영상의 비트 레이트, 프레임 레이트, 해상도, 및 TI가 획득되고, VR 영상의 비트 레이트, 프레임 속도, 해상도, 및 TI에 기초하여 VR 영상의 평균 오피니언 스코어(MOS)가 결정되는데, VR 영상의 MOS는 VR 영상의 품질을 나타내는 데 사용됨을 알 수 있다. 본 발명의 실시예에서는 VR 영상의 평가 결과의 정확도가 향상될 수 있다.

본 발명의 이러한 측면 또는 다른 측면은 다음 실시예의 설명에서 더 명확해지고 더 이해가능하다.

본 발명의 실시예 또는 종래 기술의 기술적 방안을 보다 명확하게 설명하기 위해, 이하에서는 실시예 또는 종래 기술을 설명하는 첨부 도면을 간략히 설명한다. 이하의 설명에서 첨부 도면은 단지 본 발명의 일부 실시예를 도시한 것일 뿐이며, 당업자라면 이러한 첨부된 도면으로부터 창의적인 노력 없이도 다른 도면을 도출할 수 있음은 자명하다.
도 1은 본 발명의 일 실시예에 따른 VR 영상의 품질 평가 시나리오의 개략도이다.
도 2는 본 발명의 일 실시예에 따른 VR 영상의 품질을 평가하는 방법의 개략적인 흐름도이다.
도 3은 본 발명의 일 실시예에 따른 평가 장치의 개략적인 구조도이다.
도 4는 본 발명의 일 실시예에 따른 다른 평가 장치의 개략적인 구조도이다.

상세한 설명은 아래에서 별도로 제공된다.

도 1은 본 발명의 일 실시예에 따른 VR 영상의 품질 평가 시나리오의 개략도이다. 도 1에 도시된 바와 같이, 시나리오는 영상 서버(101), 중간 네트워크 디바이스(102) 및 단말 디바이스(103)를 포함한다.

영상 서버(101)는 영상 서비스를 제공하는 서버, 예를 들어, 운영자이다.

중간 네트워크 디바이스(102)는 영상 서버(101)와 단말 디바이스(103) 사이의 영상 전송을 구현하기 위한 디바이스, 예를 들어, 홈 게이트웨이이다. 홈 게이트웨이는 내부와 외부를 연결하는 허브 역할을 할 뿐만 아니라, 전체 홈 네트워크에서 가장 중요한 관제 센터(control center) 역할을 한다. 홈 게이트웨이는 광역 통신망에 액세스하기 위해 네트워크 측에 고속 액세스 인터페이스를 제공한다. 홈 게이트웨이는 개인용 컴퓨터, IP 셋톱 박스와 같은 가정의 다양한 서비스 단말을 연결하기 위해 사용자 측에 이더넷 인터페이스 및/또는 무선 근거리 통신망 기능을 제공한다.

단말 디바이스(103)는 사용자 장비(User Equipment, UE)로도 지칭되며, 사용자에게 음성 및/또는 데이터 연결을 제공하는 디바이스, 예를 들어, 휴대폰, 태블릿 컴퓨터, 노트북 컴퓨터, 팜탑 컴퓨터, 모바일 인터넷 디바이스(mobile internet device, MID), 또는 머리 장착형 디바이스와 같은 웨어러블 디바이스이다.

본 발명에서, 영상 서버(101), 중간 네트워크 디바이스(102), 및 단말 디바이스(103) 중 어느 하나는 본 발명에 따른 VR 영상의 품질을 평가하는 방법을 수행할 수 있다.

도 2는 본 발명의 일 실시예에 따른 VR 영상의 품질을 평가하는 방법의 개략적인 흐름도이다. 도 2에 도시된 바와 같이, 방법은 다음과 같은 단계를 포함한다.

S201. 평가 장치는 VR 영상의 비트레이트, 해상도, 프레임레이트, 및 TI를 획득한다.

VR 영상의 비트 레이트는 VR 영상의 비트스트림이 단위 시간당 전송되는 레이트이고, VR 영상의 해상도는 VR 영상의 이미지의 각 프레임의 해상도이고, VR 영상의 프레임 레이트는 단위 시간당 리프레시된 이미지의 프레임 수량이다. VR 영상의 TI는 VR 영상의 영상 시퀀스의 시간 변화를 나타내기 위해 사용된다. 영상 시퀀스의 더 큰 시간 변화는 영상 시퀀스의 더 큰 TI 값을 나타낸다. 상대적으로 높은 움직임 정도를 갖는 영상 시퀀스는 일반적으로 상대적으로 큰 시간 변화를 가지므로 영상 시퀀스는 일반적으로 상대적으로 큰 TI 값을 갖는다.

실현가능한 실시예에서, 평가 장치는 시간 주기에서 VR 영상의 비트스트림의 부하를 획득함으로써 VR 영상의 비트 레이트를 계산한다. 평가 장치는 VR 영상의 비트스트림을 파싱하여 VR 영상의 시퀀스 파라미터 세트(sequence parameter set, SPS) 및 픽쳐 파라미터 세트(picture parameter set, PPS)를 획득하고, 그런 다음 SPS 및 PPS 내의 신택스 요소에 기초하여 VR 영상의 해상도 및 프레임 레이트를 결정한다.

실현가능한 실시예에서, 평가 장치가 VR 영상의 TI를 획득하는 것은,

ITU-R BT.1788의 방식으로 VR 영상의 TI를 결정하는 것, 즉, VR 영상의 2개의 인접 이미지 프레임의 픽셀 값에 기초하여 VR 영상의 TI를 결정하는 것, 또는

사용자의 머리 회전 각도 정보에 기초하여 VR 영상의 TI를 결정하는 것을 포함한다.

구체적으로, 평가 장치가 VR 영상의 2개의 인접 이미지 프레임의 픽셀 값에 기초하여 VR 영상의 TI를 결정하는 것은,

평가 장치가 2개의 인접 이미지 프레임에서 동일한 위치에 있는 픽셀의 픽셀 값 간의 차이를 획득하는 것과, 표준 편차 공식에 기초하여 2개의 인접 이미지 프레임에서 동일한 위치에 있는 픽셀의 픽셀 값 간의 차이를 계산하여 VR 영상의 TI를 획득하는 것을 포함한다.

표준 편차 공식은

이고,

인데, 여기서,

W와 H는 각각 2개의 인접 이미지 프레임 각각의 폭과 높이를 나타낸다. 즉, W*H는 이미지의 인접한 두 프레임 각각의 해상도이다.

일 예에서, 평가 장치가 VR 영상의 N개의 연속 이미지 프레임에 있는 픽셀의 픽셀 값에 기초하여 VR 영상의 TI를 결정하면, 평가 장치는, 2개의 인접 이미지 프레임의 픽셀 값에 기초하여 VR 영상의 TI를 결정하는 프로세스의 관련 설명에 기초하여 N-1개의 후보 TI를 획득하고, 그런 다음 N-1개의 후보 TI의 평균값을 VR 영상의 TI로서 결정하는데, N은 2보다 큰 정수이다.

실현가능한 실시예에서, 평가 장치가 사용자의 머리 회전 각도 정보에 기초하여 VR 영상의 TI를 결정하는 것은,

미리 설정된 지속 시간(

) 내에서 사용자의 머리 회전 각도(

)를 획득하는 것과,

미리 설정된 지속 시간(

) 및 사용자의 머리 회전 각도(

)에 기초하여 사용자의 평균 머리 회전 각도를 결정하는 것과,

사용자의 평균 머리 회전 각도에 기초하여 VR 영상의 TI를 결정하는 것을 포함한다.

구체적으로, 평가 장치가 미리 설정된 지속 시간(

) 내에서 사용자의 머리 회전 각도(

)를 획득하는 것은,

시점(t)에서의 사용자의 머리 각도(

) 및 시점(

)에서의 사용자의 머리 각도(

)를 결정하는 것을 포함한다:

와

간의 차이의 절대값이 180도보다 크고,

가

보다 작은 경우,

이고;

와

간의 차이의 절대값이 180도보다 크고,

가

보다 큰 경우,

이고;

와

간의 차이의 절대값이 180도보다 크지 않은 경우,

이다.

그런 다음, 평가 장치는 미리 설정된 지속 시간(

) 및 사용자의 머리 회전 각도(

)에 기초하여 사용자의 평균 머리 회전 각도(

)를 결정하는데, 여기서

이다.

미리 설정된 지속 시간은 VR 영상의 이미지 프레임을 재생하는 지속 시간일 수 있음에 유의해야 한다.

가능한 실시예에서, 평가 장치가 사용자의 평균 머리 회전 각도에 기초하여 VR 영상의 TI를 결정하는 것은,

평가 장치가

를 계산용 제1 TI 예측 모델에 입력하여 VR 영상의 TI를 획득하는 것을 포함한다.

의 더 큰 값은 VR 영상의 더 큰 TI 값을 나타낸다는 점에 유의해야 한다.

선택적으로, TI 예측 모델은

이고, 여기서 m 및 n은 상수이다.

선택적으로, m 및 n은 경험적으로 설정될 수 있고, m과 n의 값 범위는 [-100, 100]일 수 있다. 또한, m 및 n의 값 범위는 구체적으로 [-50, 50]일 수 있다.

선택적으로, m 및 n은 대안적으로 훈련을 통해 획득될 수 있고, 훈련을 통해 획득된 m 및 n은 일반적으로 [-100, 100] 범위의 값이다. 훈련을 통해 m 및 n을 획득하는 프로세스는 훈련을 통해 TI 예측 모델을 획득하는 프로세스이다.

실현가능한 실시예에서,

가 계산용 제1 TI 예측 모델에 입력되기 전에, 평가 장치는 제1 파라미터 모델을 훈련시키는 복수의 데이터 항목을 포함하는 제1 훈련 데이터 세트를 획득하여 제1 TI 예측 모델을 획득한다. 제1 훈련 데이터 세트의 각각의 제1 데이터 항목은 평균 머리 회전 각도 및 TI를 포함한다. 평균 머리 회전 각도는 제1 파라미터 모델의 입력 데이터이고 TI는 제1 파라미터 모델의 출력 데이터이다.

제1 파라미터 모델은 대수 방정식, 미분 방정식, 미분 방정식 시스템, 전달 함수 등을 사용하여 기술된 모델이라는 점에 유의해야 한다. 제1 파라미터 모델을 수립하는 것은 알려진 모델 구조의 파라미터(예를 들어, TI 예측 모델의 m 및 n)를 결정하는 것이다.

일 예에서, 평가 장치는 훈련 데이터 세트를 사용하여 훈련 파라미터 모델을 훈련시켜 모델의 파라미터, 예를 들어, TI 예측 모델의 m 및 n을 획득할 수 있다.

실현가능한 실시예에서, 평가 장치가 사용자의 평균 머리 회전 각도에 기초하여 VR 영상의 TI를 결정하는 것은,

를 계산용 제2 TI 예측 모델에 입력하여 VR 영상의 TI를 획득하는 것을 포함한다. 제2 TI 예측 모델은 비-파라미터 모델이다.

여기서, 비-파라미터 모델에서는 목적 함수의 형태에 대한 강력한 가정이 이루어지지 않는다는 점에 유의해야 한다. 가정이 이루어지지 않음으로써, 목적 함수는 훈련 데이터로부터 학습을 통해 자유롭게 임의의 함수 형태가 될 수 있다. 비-파라미터 모델의 학습 단계는 파라미터 모델의 학습 방식과 유사하다. 모델을 훈련시키려면 많은 양의 훈련 데이터 세트가 준비되어야 한다. 그러나, 목적 함수가 결정되어야 하는 파라미터 모델의 경우와 달리 비-파라미터 모델에서는 목적 함수의 형태에 대해 어떠한 가정도 이루어질 필요가 없다. 예를 들어, k-최근접 이웃(k-Nearest Neighbor, KNN) 알고리즘이 사용될 수 있다.

본 발명의 평가 장치는 사용자의 머리 장착형 디바이스(Head Mount Display, HMD)와 유선 또는 무선 방식으로 연결되어 사용자의 머리 각도 정보를 획득할 수 있음에 유의해야 한다.

S202. 평가 장치는 VR 영상의 비트레이트, 해상도, 프레임 레이트, 및 TI에 기초하여 VR 영상의 MOS를 결정한다.

VR 영상의 MOS는 VR 영상의 품질을 나타내는 데 사용되며, 영상 품질을 측정하는 평가 기준이다. 스코어링 기준은 ITU-T P.910에서 가져온다. 영상 품질은 우수(Excellent), 좋음(Good), 보통(Fair), 나쁨(Poor), 매우 나쁨(Very Poor)의 5단계로 분류되며, 대응하는 MOS는 각각 5, 4, 3, 2, 1이다.

구체적으로, 평가 장치는 VR 영상의 비트레이트, 해상도, 프레임 레이트, 및 TI를 계산용 품질 평가 모델에 입력하여 VR 영상의 MOS를 획득한다.

선택적으로, 품질 평가 모델은

일 수 있고, 여기서,

선택적으로, a, b, c 및 d는 경험적으로 설정될 수 있고, a, b, c 및 d의 값 범위는 [-100, 100]일 수 있다. 또한, a, b, c 및 d의 값 범위는 구체적으로 [-50, 50]일 수 있다.

선택적으로, a, b, c 및 d는 대안적으로 훈련을 통해 획득될 수 있으며, 훈련을 통해 획득된 a, b, c 및 d는 일반적으로 [-100, 100] 범위의 값이다. 훈련을 통해 a, b, c 및 d를 획득하는 프로세스는 훈련을 통해 품질 평가 모델을 획득하는 프로세스이다.

VR 영상의 더 높은 비트레이트는 VR 영상의 더 큰 MOS 값을 나타낸다는 점, 즉, VR 영상의 더 높은 품질을 나타낸다는 점에 유의해야 한다. VR 영상의 더 높은 해상도는 VR 영상의 더 큰 MOS 값을 나타낸다. VR 영상의 더 높은 프레임 속도는 VR 영상의 더 큰 MOS 값을 나타낸다. VR 영상의 더 큰 TI 값은 VR 영상의 더 큰 MOS 값을 나타낸다.

실현가능한 실시예에서, VR 영상의 비트 레이트, 해상도, 프레임 레이트, 및 TI가 계산용 품질 평가 모델에 입력되기 전에, 평가 장치는 제2 파라미터 모델을 훈련시키기 위한 복수의 데이터 항목을 포함하는 제3 훈련 데이터 세트를 획득하여 품질 평가 모델을 획득한다. 제3 훈련 데이터 세트의 각각의 데이터 항목은 VR 영상에 대한 정보 및 MOS를 포함한다. VR 영상에 대한 정보는 제2 파라미터 모델의 입력 데이터이고, MOS는 제2 파라미터 모델의 출력 데이터이다. VR 영상에 대한 정보는 VR 영상의 비트레이트, 해상도, 및 프레임 레이트를 포함한다.

제2 파라미터 모델은 대수 방정식, 미분 방정식, 미분 방정식 시스템, 전달 함수 등을 사용하여 기술된 모델이라는 점에 유의해야 한다. 제2 파라미터 모델을 수립하는 것은 알려진 모델 구조의 파라미터(예를 들어, 품질 평가 모델의 a, b, c 및 d)를 결정하는 것이다.

본 발명의 이 실시예의 솔루션에서, 평가 장치는 VR 영상의 품질을 평가하기 위해 VR 영상의 TI를 도입한다는 것을 알 수 있다. 종래 기술에 비해 VR 영상의 품질 평가 정확도가 크게 향상된다.

도 3은 본 발명의 일 실시예에 따른 평가 장치의 개략적인 구조도이다. 도 3에 도시된 바와 같이, 평가 장치(300)는,

VR 영상의 비트 레이트, 프레임 레이트, 해상도, 및 시간적 지각 정보(TI)를 획득하도록 구성된 획득 유닛(301) ― VR 영상의 TI는 VR 영상의 영상 시퀀스의 시간 변화를 나타내는 데 사용됨 ― 과,

VR 영상의 비트 레이트, 프레임 레이트, 해상도, 및 TI에 기초하여 VR 영상의 평균 오피니언 스코어(MOS)를 결정하도록 구성된 결정 유닛(302) ― VR 영상의 MOS는 VR 영상의 품질을 나타내는 데 사용됨 ― 을 포함한다.

실현가능한 실시예에서, VR 영상의 TI를 획득할 때, 획득 유닛(301)은 구체적으로,

표준 편차 공식은

이고,

이며, 여기서,

미리 설정된 지속 시간(

) 내에서 사용자의 머리 회전 각도(

)를 획득하고, 미리 설정된 지속 시간(

) 및 사용자의 머리 회전 각도(

실현가능한 실시예에서, 미리 설정된 지속 시간(

) 내에서 사용자의 머리 회전 각도(

)를 획득할 때, 획득 유닛(301)은 구체적으로,

시점(t)에서의 사용자의 머리 각도(

) 및 시점(

)에서의 사용자의 머리 각도(

)를 결정하도록 구성된다:

와

간의 차이의 절대값이 180도보다 크고,

가

보다 작은 경우,

이고;

와

간의 차이의 절대값이 180도보다 크고,

가

보다 큰 경우,

이고;

와

간의 차이의 절대값이 180도보다 크지 않은 경우,

이다.

실현가능한 실시예에서, 사용자의 평균 머리 회전 각도에 기초하여 VR 영상의 TI를 결정할 때, 획득 유닛(301)은 구체적으로,

이며, 여기서

실현가능한 실시예에서, VR 영상의 비트 레이트, 프레임 레이트, 해상도, 및 TI에 기초하여 VR 영상의 평균 오피니언 스코어(MOS)를 결정할 때, 결정 유닛(302)은 구체적으로,

이고, 여기서,

유닛(획득 유닛(301) 및 결정 유닛(302))은 전술한 방법의 관련 단계를 수행하도록 구성된다는 점에 유의해야 한다. 획득 유닛(301)은 구체적으로 단계 S201의 관련 콘텐츠를 수행하도록 구성되고, 결정 유닛(302)은 구체적으로 단계 S202의 관련 콘텐츠를 수행하도록 구성된다.

이 실시예에서, 평가 장치(300)는 유닛의 형태로 제시된다. 본 명세서에서 "유닛"은 애플리케이션 특정 집적 회로(application-specific integrated circuit, ASIC), 하나 이상의 소프트웨어 또는 펌웨어 프로그램을 실행하는 프로세서 또는 메모리, 집적 로직 회로 및/또는 전술한 기능을 수행할 수 있는 다른 디바이스일 수 있다. 또한, 획득 유닛(301) 및 결정 유닛(302)은 도 4에 도시된 평가 장치의 프로세서(401)를 사용하여 구현될 수 있다.

도 4에 도시된 바와 같이, 평가 장치(400)는 도 4에 도시된 구조로 구현될 수 있다. 평가 장치(400)는 적어도 하나의 프로세서(401), 적어도 하나의 메모리(402), 및 적어도 하나의 통신 인터페이스(403)를 포함한다. 프로세서(401), 메모리(402) 및 통신 인터페이스(403)는 통신 버스를 사용하여 서로 연결되고 통신할 수 있다.

프로세서(401)는 범용 CPU(Central Processing Unit), 마이크로프로세서, 애플리케이션 특정 집적 회로(application-specific integrated circuit, ASIC), 또는 전술한 솔루션의 프로그램 실행을 제어하기 위한 하나 이상의 집적 회로일 수 있다.

통신 인터페이스(403)는 다른 디바이스 또는 통신 네트워크, 예를 들어, 이더넷, 무선 액세스 네트워크(RAN), 또는 무선 근거리 통신망(Wireless Local Area Networks, WLAN)과 통신하도록 구성된다.

메모리(402)는 판독 전용 메모리(read-only memory, ROM) 또는 정적 정보 및 명령어를 저장할 수 있는 다른 유형의 정적 저장 디바이스, 또는 랜덤 액세스 메모리(random access memory, RAM) 또는 정보 및 명령어를 저장할 수 있는 다른 유형의 동적 저장 장치일 수 있거나, 또는 전기적 소거가능 프로그램가능 판독 전용 메모리(Electrically Erasable Programmable Read-Only Memory, EEPROM), 컴팩트 디스크 판독 전용 메모리(CCompact Disc Read-Only Memory, CD-ROM) 또는 다른 컴팩트 디스크 저장소, 광 디스크 저장소(압축 광 디스크, 레이저 디스크, 광 디스크, 디지털 다목적 디스크, 블루-레이(Blu-ray) 광 디스크 등을 포함함), 자기 디스크 저장 매체 또는 다른 자기 저장 디바이스, 또는 명령어 또는 데이터 구조의 형태로 예상 프로그램 코드를 운반하거나 저장하는 데 사용할 수 있고 컴퓨터에 의해 액세스될 수 있는 임의의 다른 매체일 수 있다. 그러나, 이에 한정되는 것은 아니다. 메모리는 독립적으로 존재할 수 있으며, 버스를 사용하여 프로세서에 연결된다. 메모리는 대안적으로 프로세서와 통합될 수 있다.

메모리(402)는 전술한 솔루션을 실행하는 애플리케이션 프로그램 코드를 저장하도록 구성되고, 프로세서(401)는 실행을 제어한다. 프로세서(401)는 메모리(402)에 저장된 애플리케이션 프로그램 코드를 실행하도록 구성된다.

메모리(402)에 저장된 코드는, 도 2에 도시된 실시예에 개시된, VR 영상의 품질을 평가하기 위한 방법의 관련 콘텐츠를 수행하는 데 사용될 수 있다. 예를 들어, VR 영상의 비트 레이트, 프레임 레이트, 해상도, 및 시간적 지각 정보(TI)가 획득되는데, TI는 VR 영상의 영상 시퀀스의 시간 변화를 나타내는 데 사용되고, VR 영상의 비트 레이트, 프레임 레이트, 해상도, 및 TI에 기초하여 VR 영상의 평균 오피니언 스코어(MOS)가 결정되는데, VR 영상의 MOS는 VR 영상의 품질을 나타내는 데 사용된다.

본 발명의 실시예는 또한 컴퓨터 저장 매체를 제공한다. 컴퓨터 저장 매체는 프로그램을 저장할 수 있고, 프로그램이 실행될 때, 전술한 방법 실시예에서 기록된 VR 영상의 임의의 품질 평가 방법의 적어도 일부 또는 모든 단계가 수행될 수 있다.

설명을 간략하게 하기 위해, 전술한 방법 실시예는 일련의 동작으로 표현된다는 점에 유의해야 한다. 그러나, 본 발명에 따라 일부 단계는 다른 순서로 수행되거나 동시에 수행될 수 있기 때문에, 당업자는 본 발명이 설명된 동작 순서에 제한되지 않음을 인식해야 한다. 또한, 당업자는 명세서에 설명된 모든 실시예가 예시적인 실시예이며, 관련된 동작 및 모듈이 반드시 본 발명에 필수적인 것은 아님을 이해해야 한다.

전술한 실시예에서, 각 실시예의 설명은 각자의 주안점을 갖는다. 일 실시예에서 구체적으로 설명되지 않은 부분에 대해서는 다른 실시예의 관련 설명을 참조한다.

본 출원에 제공된 여러 실시예에서, 개시된 장치는 다른 방식으로 구현될 수 있음이 이해되어야 한다. 예를 들어, 설명된 장치 실시예는 단지 예일 뿐이다. 예를 들어, 유닛 분할은 단순히 논리적 기능 분할이며, 실제 구현 동안 다른 분할이 될 수 있다. 예를 들어, 복수의 유닛 또는 구성요소는 다른 시스템에 결합 또는 통합될 수 있고, 또는 일부 특징은 무시되거나 수행되지 않을 수 있다. 또한, 표시되거나 논의된 상호 결합 또는 직접 결합 또는 통신 연결은 일부 인터페이스를 통해 구현될 수 있다. 장치들 또는 유닛들 사이의 간접 결합 또는 통신 연결은 전자적 형태 또는 다른 형태로 구현될 수 있다.

별도의 부분으로 설명된 유닛은 물리적으로 분리되거나 분리되지 않을 수 있으며, 유닛으로 표시된 부분은 물리적 유닛이거나 아닐 수 있으며, 한 위치에 위치되거나 복수의 네트워크 유닛에 분산될 수 있다. 유닛의 일부 또는 전부는 실시예의 솔루션의 목적을 달성하기 위한 실제 요구사항에 기초하여 선택될 수 있다.

또한, 본 발명의 실시예에서 기능 유닛은 하나의 처리 유닛으로 통합될 수 있거나, 각 유닛이 물리적으로 단독으로 존재할 수 있거나, 둘 이상의 유닛이 하나의 유닛으로 통합될 수 있다. 통합 유닛은 하드웨어의 형태로 구현되거나, 소프트웨어 기능 유닛의 형태로 구현될 수 있다.

통합 유닛이 소프트웨어 기능 유닛의 형태로 구현되어 독립적인 제품으로 판매되거나 사용되는 경우, 통합 유닛은 컴퓨터 판독가능 메모리에 저장될 수 있다. 이러한 이해에 기초하여, 본질적으로 본 발명의 기술적 솔루션, 또는 종래 기술에 기여하는 부분, 또는 기술적 솔루션의 전부 또는 일부는 소프트웨어 제품의 형태로 구현될 수 있다. 소프트웨어 제품은 메모리에 저장되며, 본 발명의 실시예에 설명된 방법의 전체 또는 일부 단계를 수행하도록 컴퓨터 디바이스(개인용 컴퓨터, 서버 또는 네트워크 디바이스일 수 있음)에 지시하기 위한 여러 명령어를 포함한다. 전술한 메모리는 USB 플래시 드라이브, 판독 전용 메모리(Read-Only Memory, ROM), 랜덤 액세스 메모리(Random Access Memory, RAM), 이동식 하드 디스크, 자기 디스크 또는 광 디스크와 같이 프로그램 코드를 저장할 수 있는 임의의 매체를 포함한다.

당업자는 실시예의 방법의 전부 또는 일부 단계가 관련 하드웨어에 지시하는 프로그램에 의해 구현될 수 있음을 이해할 수 있다. 프로그램은 컴퓨터 판독가능 메모리에 저장될 수 있다. 이 메모리는 플래시 메모리, 판독 전용 메모리(Read-Only Memory, ROM), 랜덤 액세스 메모리(Random Access Memory, RAM), 자기 디스크, 광 디스크 등을 포함할 수 있다.

이상, 본 발명의 실시예가 상세히 설명되었다. 본 발명의 원리 및 구현은 본 명세서에서 구체적인 예를 통해 설명된다. 본 발명의 실시예에 대한 설명은 단지 본 발명의 방법 및 핵심 사상을 이해하는 데 도움을 주기 위해 제공되는 것이다. 또한, 당업자는 본 발명의 사상에 따라 특정 구현 및 적용 범위의 관점에서 본 발명을 변형 및 수정할 수 있다. 따라서, 명세서의 내용은 본 발명을 제한하는 것으로 해석되어서는 안 된다.

Claims

가상 현실(virtual reality: VR) 영상의 품질을 평가하는 방법으로서,
VR 영상의 비트 레이트, 프레임 레이트, 해상도, 및 시간적 지각 정보(temporal perceptual information: TI)를 획득하는 단계 ― 상기 VR 영상의 TI는 상기 VR 영상의 영상 시퀀스의 시간 변화를 나타내는 데 사용됨 ― 와,
상기 VR 영상의 비트 레이트, 프레임 레이트, 해상도, 및 TI에 기초하여 상기 VR 영상의 평균 오피니언 스코어(mean opinion score, MOS)를 결정하는 단계 ― 상기 VR 영상의 MOS는 상기 VR 영상의 품질을 나타내는 데 사용됨 ― 를 포함하는,
방법.
제1항에 있어서,
상기 VR 영상의 TI를 획득하는 것은,
미리 설정된 지속 시간(
) 내에서 사용자의 머리 회전 각도(
)를 획득하는 것과,
상기 미리 설정된 지속 시간(
) 및 상기 사용자의 머리 회전 각도(
)에 기초하여 상기 사용자의 평균 머리 회전 각도를 결정하는 것과,
상기 사용자의 평균 머리 회전 각도에 기초하여 상기 VR 영상의 TI를 결정하는 것을 포함하고,
상기 사용자의 더 큰 평균 머리 회전 각도는 상기 VR 영상의 더 큰 TI 값을 나타내는,
방법.
제2항에 있어서,
상기 미리 설정된 지속 시간(
) 내에서 사용자의 머리 회전 각도(
)를 획득하는 것은,
시점(t)에서의 상기 사용자의 머리 각도(
) 및 시점(
)에서의 상기 사용자의 머리 각도(
)를 획득하는 것과,

와
간의 차이의 절대값이 180도보다 크고,
가
보다 작은 경우,
이고,

와
간의 차이의 절대값이 180도보다 크고,
가
보다 큰 경우,
이고,

와
간의 차이의 절대값이 180도보다 크지 않은 경우,
인
방법에 따라 상기 사용자의 머리 회전 각도(
)를 결정하는 것을 포함하는,
방법.
제2항 또는 제3항에 있어서,
상기 사용자의 평균 머리 회전 각도에 기초하여 상기 VR 영상의 TI를 결정하는 것은, 상기 사용자의 평균 머리 회전 각도를 계산용 제1 TI 예측 모델에 입력하여 상기 VR 영상의 TI를 획득하는 것을 포함하고,
상기 제1 TI 예측 모델은
이며,

는 상기 사용자의 평균 머리 회전 각도를 나타내고, m과 n은 상수인,
방법.
제2항 또는 제3항에 있어서,
상기 사용자의 평균 머리 회전 각도에 기초하여 상기 VR 영상의 TI를 결정하는 것은, 상기 사용자의 평균 머리 회전 각도를 계산용 제2 TI 예측 모델에 입력하여 상기 VR 영상의 TI를 획득하는 것을 포함하고,
상기 제2 TI 예측 모델은 비-파라미터 모델(nonparametric model)인,
방법.
제1항 내지 제5항 중 어느 한 항에 있어서,
상기 VR 영상의 비트 레이트, 프레임 레이트, 해상도, 및 TI에 기초하여 상기 상기 VR 영상의 평균 오피니언 스코어(MOS)를 결정하는 것은, 상기 VR 영상의 비트레이트, 해상도, 프레임 레이트, 및 TI를 계산용 품질 평가 모델에 입력하여 상기 VR 영상의 MOS를 획득하는 것을 포함하고,
상기 품질 평가 모델은

이고,
B1은 상기 VR 영상의 비트 레이트를 나타내고, B2는 상기 VR 영상의 해상도를 나타내고, F는 상기 VR 영상의 프레임 레이트를 나타내며, a, b, c 및 d는 상수인,
방법.
평가 장치로서,
가상 현실(VR) 영상의 비트 레이트, 프레임 레이트, 해상도, 및 시간적 지각 정보(TI)를 획득하도록 구성된 획득 유닛 ― 상기 VR 영상의 TI는 상기 VR 영상의 영상 시퀀스의 시간 변화를 나타내는 데 사용됨 ― 과,
상기 VR 영상의 비트 레이트, 프레임 레이트, 해상도, 및 TI에 기초하여 상기 VR 영상의 평균 오피니언 스코어(MOS)를 결정하도록 구성된 결정 유닛 ― 상기 VR 영상의 MOS는 상기 VR 영상의 품질을 나타내는 데 사용됨 ― 을 포함하는,
평가 장치.
제7항에 있어서,
상기 VR 영상의 TI를 획득하는 측면에서, 상기 획득 유닛은 구체적으로,
미리 설정된 지속 시간(
) 내에서 사용자의 머리 회전 각도(
)를 획득하고,
상기 미리 설정된 지속 시간(
) 및 상기 사용자의 머리 회전 각도(
)에 기초하여 상기 사용자의 평균 머리 회전 각도를 결정하고,
상기 사용자의 평균 머리 회전 각도에 기초하여 상기 VR 영상의 TI를 결정하도록 구성되고,
상기 사용자의 더 큰 평균 머리 회전 각도는 상기 VR 영상의 더 큰 TI 값을 나타내는,
평가 장치.
제8항에 있어서,
상기 미리 설정된 지속 시간(
) 내에서 사용자의 머리 회전 각도(
)를 획득하는 측면에서, 상기 획득 유닛은 구체적으로,
시점(t)에서의 상기 사용자의 머리 각도(
) 및 시점(
)에서의 상기 사용자의 머리 각도(
)를 획득하고,

와
간의 차이의 절대값이 180도보다 크고,
가
보다 작은 경우,
이고,

와
간의 차이의 절대값이 180도보다 크고,
가
보다 큰 경우,
이고,

와
간의 차이의 절대값이 180도보다 크지 않은 경우,
인
방법에 따라 상기 사용자의 머리 회전 각도(
)를 결정하도록 구성되는,
평가 장치.
제8항 또는 제9항에 있어서,
상기 사용자의 평균 머리 회전 각도에 기초하여 상기 VR 영상의 TI를 결정하는 측면에서, 상기 획득 유닛은 구체적으로, 상기 사용자의 평균 머리 회전 각도를 계산용 제1 TI 예측 모델에 입력하여 상기 VR 영상의 TI를 획득하도록 구성되고,
상기 제1 TI 예측 모델은
이며,

는 상기 사용자의 평균 머리 회전 각도를 나타내고, m과 n은 상수인,
평가 장치.
제8항 또는 제9항에 있어서,
상기 사용자의 평균 머리 회전 각도에 기초하여 상기 VR 영상의 TI를 결정하는 측면에서, 상기 획득 유닛은 구체적으로, 상기 사용자의 평균 머리 회전 각도를 계산용 제2 TI 예측 모델에 입력하여 상기 VR 영상의 TI를 획득하도록 구성되고,
상기 제2 TI 예측 모델은 비-파라미터 모델인,
평가 장치.
제7항 내지 제11항 중 어느 한 항에 있어서,
상기 VR 영상의 비트 레이트, 프레임 레이트, 해상도, 및 TI에 기초하여 상기 VR 영상의 평균 오피니언 스코어(MOS)를 결정하는 측면에서, 상기 결정 유닛은 구체적으로, 상기 VR 영상의 비트레이트, 해상도, 프레임 레이트, 및 TI를 계산용 품질 평가 모델에 입력하여 상기 VR 영상의 MOS를 획득하도록 구성되고,
상기 품질 평가 모델은

이고,
B1은 상기 VR 영상의 비트 레이트를 나타내고, B2는 상기 VR 영상의 해상도를 나타내고, F는 상기 VR 영상의 프레임 레이트를 나타내며, a, b, c 및 d는 상수인,
평가 장치.
평가 장치로서,
실행가능한 프로그램 코드를 저장하는 메모리와,
상기 메모리에 결합된 프로세서를 포함하되,
상기 프로세서는 상기 메모리에 저장된 상기 실행가능한 프로그램 코드를 호출하여 제1항 내지 제6항 중 어느 한 항에 따른 방법을 수행하는,
평가 장치.
컴퓨터 판독가능 저장 매체로서,
상기 컴퓨터 판독가능 저장 매체는 컴퓨터 프로그램을 저장하고, 상기 컴퓨터 프로그램은 프로그램 명령어를 포함하고, 상기 프로그램 명령어가 프로세서에 의해 실행될 때, 상기 프로세서는 제1항 내지 제6항 중 어느 한 항에 따른 방법을 수행할 수 있게 되는,
컴퓨터 판독가능 저장 매체.