KR102284096B1 - System and method for estimating subject image quality using visual saliency and a recording medium having computer readable program for executing the method - Google Patents

System and method for estimating subject image quality using visual saliency and a recording medium having computer readable program for executing the method Download PDF

Info

Publication number
KR102284096B1
KR102284096B1 KR1020170177967A KR20170177967A KR102284096B1 KR 102284096 B1 KR102284096 B1 KR 102284096B1 KR 1020170177967 A KR1020170177967 A KR 1020170177967A KR 20170177967 A KR20170177967 A KR 20170177967A KR 102284096 B1 KR102284096 B1 KR 102284096B1
Authority
KR
South Korea
Prior art keywords
image
information
quality evaluation
image information
importance map
Prior art date
Application number
KR1020170177967A
Other languages
Korean (ko)
Other versions
KR20190076288A (en
Inventor
장민혜
진승오
강동구
김명준
배영민
신기영
Original Assignee
한국전기연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전기연구원 filed Critical 한국전기연구원
Priority to KR1020170177967A priority Critical patent/KR102284096B1/en
Publication of KR20190076288A publication Critical patent/KR20190076288A/en
Application granted granted Critical
Publication of KR102284096B1 publication Critical patent/KR102284096B1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N17/00Diagnosis, testing or measuring for television systems or their details
    • H04N17/02Diagnosis, testing or measuring for television systems or their details for colour television signals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • Biophysics (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

중요도 맵을 이용한 주관적 화질 평가 시스템, 방법, 및 상기 방법을 실행시키기 위한 컴퓨터 판독 가능한 프로그램을 기록한 기록 매체가 개시된다. 주관적 화질 평가 시스템은, 영상 획득부, 영상 정보 산출부, 중요도 맵 산출부, 정보 통합부, 및 화질 평가부를 포함한다. 영상 획득부는 테스트 영상을 획득하고, 영상 정보 산출부는 기계학습을 이용하여 테스트 영상에 대한 미리 설정된 영상 정보를 획득하고, 중요도 맵 산출부는 기계학습을 이용하여 테스트 영상에 대한 중요도 맵을 획득하고, 정보 통합부는 중요도 맵을 이용하여 영상 정보에 가중치를 부여하며, 화질 평가부는 가중치가 부여된 영상 정보를 이용하여 테스트 영상의 화질 평가 결과를 산출한다. 이와 같은 구성에 의하면, 기계 학습을 이용하여 영상 정보 및 중요도 맵을 획득함으로써, 참고 영상이 없이 테스트 영상만으로도 영상의 화질 평가가 가능하게 된다.Disclosed are a subjective image quality evaluation system using an importance map, a method, and a recording medium recording a computer readable program for executing the method. The subjective image quality evaluation system includes an image acquisition unit, an image information calculation unit, an importance map calculation unit, an information integration unit, and an image quality evaluation unit. The image acquisition unit acquires a test image, the image information calculation unit acquires preset image information for the test image using machine learning, and the importance map calculation unit acquires an importance map for the test image using machine learning, information The integration unit assigns weights to the image information using the importance map, and the image quality evaluation unit calculates a quality evaluation result of the test image using the weighted image information. According to such a configuration, image quality evaluation is possible only with the test image without the reference image by acquiring the image information and the importance map using machine learning.

Description

중요도 맵을 이용한 지능형 주관적 화질 평가 시스템, 방법, 및 상기 방법을 실행시키기 위한 컴퓨터 판독 가능한 프로그램을 기록한 기록 매체 {SYSTEM AND METHOD FOR ESTIMATING SUBJECT IMAGE QUALITY USING VISUAL SALIENCY AND A RECORDING MEDIUM HAVING COMPUTER READABLE PROGRAM FOR EXECUTING THE METHOD}An intelligent subjective image quality evaluation system using an importance map, a method, and a recording medium recording a computer readable program for executing the method METHOD}

본 발명은 품질 평가 시스템 및 방법에 관한 것으로서, 더욱 상세하게는 영상의 화질을 평가하기 위한 시스템, 및 방법에 관한 것이다.The present invention relates to a quality evaluation system and method, and more particularly, to a system and method for evaluating image quality.

일반적으로 화질 평가를 위해 테스트 영상(T)과 참고 영상(R)이 필요하며, 정해진 계산 모델을 통해 테스트 영상의 화질 점수를 구한다. 화질 평가시 정확도를 높이기 위해 중요도 맵(Visual saliency)을 반영하여 두 영상 간 지각 차이 정도 및 화질 점수를 도출할 수 있으며, 중요도 맵을 반영하는 방법은 크게 두 가지로 나뉜다. In general, a test image (T) and a reference image (R) are required for image quality evaluation, and the image quality score of the test image is obtained through a predetermined calculation model. In order to improve the accuracy in the quality evaluation, the degree of perceptual difference between the two images and the quality score can be derived by reflecting the visual saliency. There are two main methods for reflecting the importance map.

첫 번째 방법은 미리 두 영상 간 지각 차이를 계산한 후, 중요도 맵에 따라 지각 차이 값을 변형하여 화질 점수를 구한다(도 1). 두 번째 방법은 먼저 중요도 맵을 구하여 중요 영역(salient region; S)과 배경 영역(background region; B)을 나눈 뒤, 영역별로 지각 차이를 각각 계산하여 화질 점수를 구한다 (도 2). 도 1 및 도 2는 화질 평가를 위해 중요도 맵을 반영하는 방법의 예들이 개략적으로 도시된 도면이다.The first method calculates the perceptual difference between the two images in advance and then transforms the perceptual difference value according to the importance map to obtain a quality score ( FIG. 1 ). The second method first obtains an importance map, divides the salient region (S) and the background region (B), and then calculates the perceptual difference for each region to obtain a quality score ( FIG. 2 ). 1 and 2 are diagrams schematically illustrating examples of a method of reflecting an importance map for image quality evaluation.

이와 같이, 종래 화질 평가는 테스트 영상과 참고 영상의 비교로 이루어지므로 화질 평가를 위해서는 왜곡이 없고 아주 깨끗한 참고 영상이 꼭 필요하다는 문제점이 있다. As described above, since the conventional image quality evaluation is performed by comparing a test image and a reference image, there is a problem that a very clean reference image without distortion is absolutely necessary for image quality evaluation.

또한, 종래에는 화질 평가 과정에서 두 영상 간 지각 차이나 영상 특징을 획득하기 위해 변환(예를 들어 Discrete wavelet transform, discrete cosine transform)을 하거나 영상 정보를 직접 모델링한다. 그러나 왜곡(distortion)의 종류에 따라 사용되는 모델이나 평가 지표의 성능이 달라지는 문제점이 있다. Also, in the prior art, in order to obtain a perceptual difference or image characteristics between two images in the image quality evaluation process, transformation (eg, discrete wavelet transform, discrete cosine transform) is performed or image information is directly modeled. However, there is a problem in that the performance of the used model or evaluation index varies depending on the type of distortion.

또한, 화질 평가에서 중요도 맵은 주로 자극에 기반한 바텀업(Bottom-up) 방식의 모델이 이용되고 있는데, 아직까지 해당 방식의 특징 추출 및 중요도 맵 계산 과정에 대한 이해가 불완전하며, 의미 있는(semantic) 정보나 물체가 없는 영상에 대해서만 잘 동작한다는 문제가 있다. Also, in the image quality evaluation, the bottom-up method based on the stimulus is mainly used for the importance map, but the understanding of the process of feature extraction and importance map calculation of the method is still incomplete and meaningful (semantic). ), there is a problem that it works well only for images without information or objects.

KRUS 101717399101717399 B1B1

본 발명은 상술한 종래의 문제점을 해결하기 위해 안출된 것으로서, 참고 영상이 없이 테스트 영상만으로도 영상의 화질 평가가 가능하며, 왜곡의 종류 및 정도와 무관한 화질 정보와 탑다운(top-down) 큐(cue)와 바텀업 큐를 모두 포함할 수 있는 중요도 맵을 획득할 수 있는 화질 평가 시스템 및 방법을 제공하는 것을 목적으로 한다.The present invention has been devised to solve the above-mentioned problems of the prior art, and it is possible to evaluate the image quality only with a test image without a reference image, and image quality information independent of the type and degree of distortion and a top-down queue An object of the present invention is to provide a quality evaluation system and method capable of acquiring an importance map that can include both (cue) and bottom-up cues.

상기 목적을 달성하기 위해 본 발명에 따른 주관적 화질 평가 시스템은, 영상 획득부, 영상 정보 산출부, 중요도 맵 산출부, 정보 통합부, 및 화질 평가부를 포함한다.In order to achieve the above object, a subjective image quality evaluation system according to the present invention includes an image acquisition unit, an image information calculation unit, an importance map calculation unit, an information integration unit, and an image quality evaluation unit.

영상 획득부는 테스트 영상을 획득하고, 영상 정보 산출부는 기계학습을 이용하여 테스트 영상에 대한 미리 설정된 영상 정보를 획득하고, 중요도 맵 산출부는 기계학습을 이용하여 테스트 영상에 대한 중요도 맵을 획득하고, 정보 통합부는 중요도 맵을 이용하여 영상 정보에 가중치를 부여하며, 화질 평가부는 가중치가 부여된 영상 정보를 이용하여 테스트 영상의 화질 평가 결과를 산출한다.The image acquisition unit acquires a test image, the image information calculation unit acquires preset image information for the test image using machine learning, and the importance map calculation unit acquires an importance map for the test image using machine learning, information The integration unit assigns weights to the image information using the importance map, and the image quality evaluation unit calculates a quality evaluation result of the test image using the weighted image information.

이와 같은 구성에 의하면, 기계 학습을 이용하여 영상 정보 및 중요도 맵을 획득함으로써, 참고 영상이 없이 테스트 영상만으로도 영상의 화질 평가가 가능하게 된다.According to such a configuration, image quality evaluation is possible only with the test image without the reference image by acquiring the image information and the importance map using machine learning.

이때, 기계학습은 심층 신경망 기반 학습일 수 있다. 이와 같은 구성에 의하면, 심층 신경망을 이용하여 왜곡의 종류 및 정도와 무관하게 이용할 수 있는 영상 정보를 추출할 수 있게 된다.In this case, the machine learning may be deep neural network-based learning. According to such a configuration, it is possible to extract image information that can be used regardless of the type and degree of distortion using the deep neural network.

또한, 중요도 맵 산출을 위한 심층 신경망 기반 학습은 영상과 영상에 대한 시선 추적 데이터를 이용하여 학습될 수 있다. 이와 같은 구성에 의하면, top-down cue와 bottom-up cue를 모두 포함할 수 있는 높은 성능의 중요도 맵을 획득할 수 있다.In addition, deep neural network-based learning for calculating the importance map may be learned using images and eye tracking data for images. According to such a configuration, it is possible to obtain a high-performance importance map that can include both the top-down cue and the bottom-up cue.

또한, 영상 정보 산출을 위한 심층 신경망 기반 학습은 영상 정보가 표시된 영상과 대응하는 영상 정보를 이용하여 학습될 수 있으며, 화질 평가를 위한 신경망 기반 학습은 주관적 화질 평가 결과가 부여된 영상과 대응하는 화질 평가 결과를 이용하여 학습될 수 있다.In addition, deep neural network-based learning for image information calculation can be learned using image information corresponding to an image displayed with image information, and neural network-based learning for image quality evaluation is image quality corresponding to an image to which a subjective image quality evaluation result is given. It can be learned using the evaluation results.

또한, 정보 통합부는 영상 정보의 크기를 중요도 맵의 크기와 일치시킬 수 있다. 이와 같은 구성에 의하면, 심층 신경망을 기반하여 각각 산출된 영상 정보와 중요도 맵의 크기가 일치하지 않는 경우에도 영상 정보의 크기를 중요도 맵과 일치시킴으로써, 화질 평가가 가능하게 된다.Also, the information integrator may match the size of the image information with the size of the importance map. According to this configuration, even when the size of the image information calculated based on the deep neural network and the importance map do not match, the image quality is evaluated by matching the size of the image information with the importance map.

이때, 정보 통합부는 영상 정보를 미리 설정된 복수의 패치로 분리하고, 분리된 패치에서 대표값을 산출하며, 산출된 대표값을 결합할 수 있다. In this case, the information integrator may divide the image information into a plurality of preset patches, calculate a representative value from the separated patches, and combine the calculated representative values.

또한, 정보 통합부는 미리 설정된 중요도 맵의 신뢰도에 따라 영상 정보에 서로 다른 가중치를 부여할 수 있다. 이와 같은 구성에 의하면, 산출된 중요도 맵의 성능에 따라 영상 정보의 중요도를 위치별로 다르게 하여 분석이 가능하며, 영상 정보에 따라서 중요도 맵을 반영하는 정도를 다르게 할 수 있다.Also, the information integrator may assign different weights to the image information according to the reliability of the preset importance map. According to such a configuration, it is possible to analyze the importance of the image information differently for each location according to the performance of the calculated importance map, and the degree of reflection of the importance map can be varied according to the image information.

본 발명에 의하면, 기계 학습을 이용하여 영상 정보 및 중요도 맵을 획득함으로써, 참고 영상이 없이 테스트 영상만으로도 영상의 화질 평가가 가능하게 된다.According to the present invention, image quality evaluation is possible with only a test image without a reference image by acquiring image information and an importance map using machine learning.

또한, 심층 신경망을 이용하여 왜곡의 종류 및 정도와 무관하게 이용할 수 있는 영상 정보를 추출할 수 있다.Also, it is possible to extract image information that can be used irrespective of the type and degree of distortion by using a deep neural network.

또한, top-down cue와 bottom-up cue를 모두 포함할 수 있는 높은 성능의 중요도 맵을 획득할 수 있다.In addition, it is possible to obtain a high-performance importance map that can include both top-down cues and bottom-up cues.

또한, 심층 신경망을 기반하여 각각 산출된 영상 정보와 중요도 맵의 크기가 일치하지 않는 경우에도 영상 정보의 크기를 중요도 맵과 일치시킴으로써, 화질 평가가 가능하게 된다.In addition, even when the size of the image information calculated based on the deep neural network and the importance map do not match, the image quality is evaluated by matching the size of the image information with the importance map.

또한, 산출된 중요도 맵의 성능에 따라 영상 정보의 중요도를 위치별로 다르게 하여 분석이 가능하며, 영상 정보에 따라서 중요도 맵을 반영하는 정도를 다르게 할 수 있다.In addition, according to the performance of the calculated importance map, it is possible to analyze by varying the importance of the image information for each location, and the degree of reflection of the importance map can be varied according to the image information.

도 1 및 도 2는 화질 평가를 위해 중요도 맵을 반영하는 방법의 예들이 개략적으로 도시된 도면이다.
도 3은 본 발명의 일 실시예에 따른 주관적 화질 평가 시스템의 개략적인 블록도.
도 4는 테스트 영상과 심층 신경망을 이용해 획득한 영상 정보의 개념을 도시한 도면.
도 5는 영상 정보를 겹치는 패치로 나누어 최대값을 뽑는 방식으로 Resizing하는 방법의 예를 도시한 도면.
도 6은 영상 정보와 중요도 맵의 통합 예를 도시한 도면.
도 7은 영상 정보 종류에 따라 서로 다른 가중치가 적용되는 예가 도시된 도면.
도 8은 테스트 영상 일부에 대해서만 화질을 평가하는 경우의 예가 도시된 도면.
1 and 2 are diagrams schematically illustrating examples of a method of reflecting an importance map for image quality evaluation.
3 is a schematic block diagram of a subjective image quality evaluation system according to an embodiment of the present invention;
4 is a diagram illustrating the concept of image information acquired using a test image and a deep neural network.
5 is a diagram illustrating an example of a method of resizing image information by dividing image information into overlapping patches and extracting a maximum value.
6 is a diagram illustrating an example of integrating image information and an importance map;
7 is a diagram illustrating an example in which different weights are applied according to types of image information;
8 is a diagram illustrating an example of evaluating image quality only for a part of a test image.

이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 설명한다.Hereinafter, preferred embodiments of the present invention will be described with reference to the accompanying drawings.

도 3은 본 발명의 일 실시예에 따른 주관적 화질 평가 시스템의 개략적인 블록도이다. 도 3에서 주관적 화질 평가 시스템(100)은, 영상 획득부(110), 영상 정보 산출부(120), 중요도 맵 산출부(130), 정보 통합부(140), 및 화질 평가부(150)를 포함한다.3 is a schematic block diagram of a subjective image quality evaluation system according to an embodiment of the present invention. In FIG. 3 , the subjective image quality evaluation system 100 includes an image acquisition unit 110 , an image information calculation unit 120 , an importance map calculation unit 130 , an information integration unit 140 , and a picture quality evaluation unit 150 . include

도 3에서 영상 획득부(110)는 영상 획득 장치, 영상 정보 산출부(120)는 심층 신경망 기반 영상 정보 획득부, 중요도 맵 산출부(130)는 심층 신경망 기반 중요도 맵 획득부, 화질 평가부(150)는 주관적 화질 평가 결과 도출부로 각각 구현되어 있다. 3, the image acquisition unit 110 is an image acquisition device, the image information calculation unit 120 is a deep neural network-based image information acquisition unit, and the importance map calculation unit 130 is a deep neural network-based importance map acquisition unit, a quality evaluation unit ( 150) is implemented as a subjective image quality evaluation result derivation unit, respectively.

도 3에서 주관적 화질 평가 시스템(100)의 각 구성 요소들은 하드웨어만으로 구현될 수도 있겠지만, 하드웨어 및 하드웨어상에서 동작하는 소프트웨어로 함께 구현되는 것이 일반적일 것이다.In FIG. 3 , each of the components of the subjective image quality evaluation system 100 may be implemented only by hardware, but in general, it will be implemented together with hardware and software operating on the hardware.

영상 획득부(110)는 테스트 영상을 획득한다. 주관적 화질 평가를 위한 테스트 영상을 획득하는 것이다. 이때, 테스트 영상은 저장 장치에 저장된 정지 영상, 또는 실시간 촬영되고 있는 동영상에서 획득한 정지 영상을 포함한다.The image acquisition unit 110 acquires a test image. To acquire a test image for subjective image quality evaluation. In this case, the test image includes a still image stored in a storage device or a still image obtained from a moving picture being captured in real time.

영상 정보 산출부(120)는 기계학습을 이용하여 테스트 영상에 대한 미리 설정된 영상 정보를 획득한다. 화질 평가에 필요한 영상 정보를 획득하는 것으로서, 그 종류는 영상의 색상, 밝기, 대조, 엣지 정보 등 다양하다. The image information calculating unit 120 obtains preset image information for the test image by using machine learning. As image information required for image quality evaluation, the type is various, such as image color, brightness, contrast, edge information, and the like.

이때, 기계학습은 심층 신경망 기반 학습일 수 있다. 영상 정보 산출부(120) 뿐만 아니라, 중요도 맵 산출부(130), 화질 평가부(150)에서도 심층 신경망 기반 학습을 이용할 수 있으며, 이때, 사용되는 심층 신경망의 종류는 한정되지 않고 다양한 구조의 신경망으로 형성될 수 있다.In this case, the machine learning may be deep neural network-based learning. Deep neural network-based learning can be used not only in the image information calculating unit 120 but also in the importance map calculating unit 130 and the image quality evaluation unit 150 . can be formed with

영상 정보 산출을 위한 심층 신경망 기반 학습은 영상 정보가 표시된 영상과 대응하는 영상 정보를 이용하여 학습될 수 있다. 이를 위해, 심층 신경망을 학습시키기 위해 사용되는 데이터 셋은 해당 정보에 대해 직·간접적으로 표시(labeling)되어 있어야 한다. Deep neural network-based learning for calculating image information may be learned using image information corresponding to an image on which image information is displayed. To this end, the data set used to train the deep neural network must be directly or indirectly labeled for the corresponding information.

예를 들어, 화질 평가 결과(점수 또는 등급)가 표시된 데이터 셋, 또는 주관적 영상 정보(예를 들어 밝음/밝지 않음)가 표시된 데이터 셋, 또는 영상의 분류(물체의 종류)가 표시된 데이터 셋 등이 학습에 이용될 수 있다. 또는 전이 학습(transfer learning)을 통해 심층 신경망을 학습시킬 수도 있다. For example, a data set in which image quality evaluation results (scores or grades) are displayed, a data set in which subjective image information (eg, bright/not bright) is displayed, or a data set in which image classification (type of object) is displayed, etc. can be used for learning. Alternatively, a deep neural network may be trained through transfer learning.

획득된 영상 정보는 테스트 영상의 크기와 동일하거나 작은 크기일 수 있으며, 작은 크기일 경우 획득된 영상 정보의 한 픽셀은 테스트 영상에서 해당 위치의 수~수십 픽셀(>1 픽셀)에 대한 정보를 담고 있다고 생각할 수 있다 (도 4). 도 4는 테스트 영상과 심층 신경망을 이용해 획득한 영상 정보의 개념을 도시한 도면이다.The acquired image information may be the same as or smaller than the size of the test image, and in the case of a small size, one pixel of the acquired image information contains information about several to tens of pixels (>1 pixel) of the corresponding position in the test image. It can be considered that there is (FIG. 4). 4 is a diagram illustrating the concept of image information acquired using a test image and a deep neural network.

중요도 맵 산출부(130)는 기계학습을 이용하여 테스트 영상에 대한 중요도 맵을 획득한다. 심층 신경망을 기반으로 영상의 현저한 부분(Salient region)을 예측할 수 있는 중요도 맵을 획득하는 것이다.The importance map calculator 130 obtains an importance map for the test image by using machine learning. It is to acquire an importance map that can predict a salient region of an image based on a deep neural network.

중요도 맵 산출을 위한 심층 신경망 기반 학습은 영상과 영상에 대한 시선 추적 데이터를 이용하여 학습될 수 있으며, 보다 구체적으로 심층 신경망은 시선 추적 데이터가 표시(labeling)된 영상과 해당 데이터를 이용하여 학습될 수 있다. Deep neural network-based learning for calculating the importance map can be learned using eye tracking data for images and images. can

정보 통합부(140)는 중요도 맵을 이용하여 영상 정보에 가중치를 부여한다. 이를 통해, 심층 신경망 기반 영상 정보 획득부(120)에서 획득된 영상 정보와 심층 신경망 기반 중요도 맵 산출부(130)에서 획득된 중요도 맵을 통합한다.The information integrator 140 assigns weights to the image information by using the importance map. Through this, the image information obtained by the deep neural network-based image information obtaining unit 120 and the importance map obtained by the deep neural network-based importance map calculating unit 130 are integrated.

이때, 정보 통합부(140)는 영상 정보의 크기를 중요도 맵의 크기와 일치시킬 수 있다. 통합 전 영상 정보의 크기와 중요도 맵의 크기가 동일하지 않을 경우 Resizing 방법을 이용해서 동일한 크기로 맞추어 주는 것이다. 마찬가지로, 통합 전 획득된 중요도 맵은 테스트 영상의 크기와 동일하거나 동일하지 않을 수 있으며, 동일하지 않을 경우 Resizing 방법을 이용해 원하는 크기로 변경할 수 있다. In this case, the information integrator 140 may match the size of the image information with the size of the importance map. If the size of the image information before integration and the size of the importance map are not the same, the resizing method is used to adjust them to the same size. Similarly, the importance map obtained before integration may or may not be the same as the size of the test image, and if not the same, it may be changed to a desired size using the resizing method.

이를 위해, 정보 통합부(140)는 영상 정보 또는 중요도 맵을 미리 설정된 복수의 패치로 분리하고, 분리된 패치에서 대표값을 산출하며, 산출된 대표값을 결합할 수 있다. 보다 구체적으로, 영상 정보의 크기를 줄여야 할 경우, 정보를 겹치거나 겹치지 않는 패치로 나누어 각 패치에서 최대값/평균값을 대푯값으로 뽑는 방식으로 크기를 조정할 수 있다(도 5). 도 5는 영상 정보를 겹치는 패치로 나누어 최대값을 뽑는 방식으로 Resizing하는 방법의 예를 도시한 도면이다.To this end, the information integrator 140 may divide the image information or the importance map into a plurality of preset patches, calculate a representative value from the separated patches, and combine the calculated representative values. More specifically, when the size of image information needs to be reduced, the size can be adjusted by dividing the information into overlapping or non-overlapping patches and selecting the maximum/average value from each patch as a representative value (FIG. 5). 5 is a diagram illustrating an example of a method of resizing image information by dividing image information into overlapping patches and extracting a maximum value.

영상 정보와 중요도 맵의 크기가 동일해지면 두 정보를 element-wise product 형태로 통합한다. 이때, 정보 통합부(140)는 중요도 맵의 신뢰도에 따라 영상 정보에 서로 다른 가중치를 부여할 수 있다. When the size of the image information and the importance map becomes the same, the two information is integrated in the form of an element-wise product. In this case, the information integrator 140 may assign different weights to the image information according to the reliability of the importance map.

즉, 중요도 맵의 신뢰도에 따라 영상 정보에 더욱 가중치를 줄 수 있다(도 6). 도 6은 영상 정보와 중요도 맵의 통합 예를 도시한 도면이다. 도 6에서 영상 정보와 중요도 맵의 곱 이후 가중치(w)가 부여된 영상 정보값이 합해지는 것을 확인할 수 있다.That is, image information may be given more weight according to the reliability of the importance map ( FIG. 6 ). 6 is a diagram illustrating an example of integrating image information and an importance map. In FIG. 6 , it can be seen that the image information values to which the weight w is assigned after the product of the image information and the importance map are summed.

이 가중치는 영상 정보의 종류에 따라 서로 다를 수 있으며(도 7). 또한, 가중치는 학습을 통해 최적화할 수 있다. 도 7은 영상 정보 종류에 따라 서로 다른 가중치가 적용되는 예가 도시된 도면이다.This weight may be different depending on the type of image information (FIG. 7). In addition, weights can be optimized through learning. 7 is a diagram illustrating an example in which different weights are applied according to types of image information.

테스트 영상의 일부에 대해서만 화질을 평가할 경우 영상 정보는 해당 영역에 대해서만 추출할 수 있으며, 중요도 맵은 전체 영상에 대해서 구한 다음 해당 영역의 중요도 맵만 취하여 정보를 통합 한다(도 8). When the image quality is evaluated for only a part of the test image, image information can be extracted only for the corresponding region, and the importance map is obtained for the entire image, and then only the importance map of the corresponding region is taken and information is integrated (FIG. 8).

도 8은 테스트 영상 일부에 대해서만 화질을 평가하는 경우의 예가 도시된 도면이다. 도 8에서 영상 정보 분할시 이용된 위치 정보를 이용하여 전체 영상에 대해 산출된 중요도 맵을 보정한 이후 분할된 영상으로부터 산출된 영상 정보와 통합하는 예가 도시되어 있다.8 is a diagram illustrating an example of evaluating image quality only for a part of a test image. In FIG. 8 , an example of correcting the importance map calculated for the entire image using the location information used when image information is segmented and then integrating it with image information calculated from the segmented image is shown.

화질 평가부(150)는 가중치가 부여된 영상 정보를 이용하여 테스트 영상의 화질 평가 결과를 산출한다. 통합된 정보를 이용하여 주관적 화질 평가 결과를 도출하는 것이다. The image quality evaluation unit 150 calculates the image quality evaluation result of the test image by using the weighted image information. It is to derive the subjective image quality evaluation result using the integrated information.

이때, 화질 평가를 위한 신경망 기반 학습은 주관적 화질 평가 결과가 부여된 영상과 대응하는 화질 평가 결과를 이용하여 학습될 수 있다. 통합된 정보는 특징(feature) 벡터가 되어 다양한 머신 러닝 기법에 적용되고, 이를 통해 주관적 화질 점수 또는 등급 형태의 결과를 도출하게 된다. In this case, neural network-based learning for image quality evaluation may be learned using an image to which a subjective image quality evaluation result is given and a corresponding image quality evaluation result. The integrated information becomes a feature vector and is applied to various machine learning techniques, and through this, a result in the form of a subjective image quality score or grade is derived.

화질 평가 결과를 도출하기 위해 사용되는 머신 러닝 기법에는 Linear regression, Logistic regression, Discriminant analysis, Support vector machine, Neural network, Decision tree, Random forest, Clustering, Naive Bayesian classifier, Adaboost, Ensemble of classifiers 이 있을 수 있다.The machine learning techniques used to derive the quality evaluation result may include Linear regression, Logistic regression, Discriminant analysis, Support vector machine, Neural network, Decision tree, Random forest, Clustering, Naive Bayesian classifier, Adaboost, and Ensemble of classifiers. .

정리하면, 본 발명은 정지 영상에 대한 주관적인 화질 평가를 위하여, 화질 평가를 할 영상을 획득하는 부분과, 획득된 영상에 대한 중요도 맵을 획득하는 부분과, 획득된 영상에 대한 화질 정보를 획득하는 부분과, 획득된 중요도 맵을 이용하여 영상 정보에 가중치를 부여하는 정보 통합 부분과, 통합된 정보를 이용하여 주관적 화질 평가 결과를 도출하는 부분을 포함하는 시스템에 관한 것이다.In summary, the present invention provides a part for acquiring an image to be evaluated for image quality, a part for acquiring an importance map for the acquired image, and image quality information for the acquired image for subjective image quality evaluation of a still image. It relates to a system including a part, an information integration part for giving weight to image information using the obtained importance map, and a part for deriving a subjective image quality evaluation result using the integrated information.

중요도 맵 획득부와 화질 정보 획득부는 심층신경망의 형태로 구성된다. 중요도 맵 획득부는 영상과 해당 영상에 대한 시선 추적 데이터를 이용하여 학습되고, 화질 정보 획득부는 화질 또는 영상 정보가 표시(labeling)되어 있는 영상과 해당 정보를 이용하여 학습되며, 주관적 화질 평가 결과 도출부는 주관적 화질 평가 결과가 주어진 영상과 해당 결과를 이용하여 학습된다.The importance map acquisition unit and the image quality information acquisition unit are configured in the form of a deep neural network. The importance map acquisition unit is learned using an image and eye tracking data for the corresponding image, the image quality information acquisition unit is learned using the image and the corresponding information on which image quality or image information is labeled, and the subjective image quality evaluation result derivation unit The subjective image quality evaluation result is learned using the given image and the corresponding result.

본 발명은 참고 영상이 필요하던 종래 기술과 달리 평가가 필요한 테스트 영상만을 이용하여 주관적 화질 평가가 가능한 시스템이다. 테스트 영상만으로 중요도 맵과 화질 정보를 추출하여 화질 평가가 가능하다.The present invention is a system capable of subjective image quality evaluation using only a test image requiring evaluation, unlike the prior art in which a reference image is required. It is possible to evaluate the image quality by extracting the importance map and image quality information only from the test image.

중요도 맵과 화질 정보를 구하기 위해 직접 모델링한 (Hand-crafted) 특징을 이용하던 종래 기술과 달리, 심층 신경망을 이용하여 왜곡의 종류 및 정도와 무관하게 이용할 수 있는 중요도 맵과 특징을 추출한다. Unlike the prior art that uses hand-crafted features to obtain the importance map and quality information, the importance map and features that can be used regardless of the type and degree of distortion are extracted using a deep neural network.

또한, 종래에는 참고 영상과 테스트 영상 간의 지각 차이 값이 있어야만 화질 점수를 도출할 수 있었지만 본 발명에서는 테스트 영상 자체의 정보를 획득함으로써 화질 평가를 수행할 수 있다. Also, in the prior art, a quality score could be derived only when there is a perceptual difference value between a reference image and a test image, but in the present invention, image quality evaluation can be performed by acquiring information on the test image itself.

특히, 정보 통합부에서 중요도 맵의 성능에 따라 영상 정보의 중요도를 위치별로 다르게 하여 분석이 가능하며, 영상 정보에 따라서 중요도 맵을 반영하는 정도를 다르게 할 수 있다.In particular, the information integration unit can analyze the importance of the image information differently for each location according to the performance of the importance map, and the degree of reflection of the importance map can be varied according to the image information.

본 발명이 비록 일부 바람직한 실시예에 의해 설명되었지만, 본 발명의 범위는 이에 의해 제한되어서는 아니 되며, 특허청구범위에 의해 뒷받침되는 상기 실시예의 변형이나 개량에도 미쳐야 할 것이다.Although the present invention has been described with reference to some preferred embodiments, the scope of the present invention should not be limited thereto, but should also extend to modifications or improvements of the above embodiments supported by the claims.

100: 주관적 화질 평가 시스템
110: 영상 획득부
120: 영상 정보 산출부
130: 중요도 맵 산출부
140: 정보 통합부
150: 화질 평가부
100: subjective image quality evaluation system
110: image acquisition unit
120: image information calculating unit
130: importance map calculation unit
140: information integration unit
150: quality evaluation unit

Claims (17)

테스트 영상을 획득하는 영상 획득부;
기계학습을 이용하여 상기 테스트 영상에 대한 미리 설정된 영상 정보를 획득하는 영상 정보 산출부;
기계학습을 이용하여 상기 테스트 영상에 대한 중요도 맵을 획득하는 중요도 맵 산출부;
상기 중요도 맵을 이용하여 상기 영상 정보에 가중치를 부여하는 정보 통합부; 및
상기 가중치가 부여된 영상 정보를 이용하여 상기 테스트 영상의 화질 평가 결과를 산출하는 화질 평가부를 포함하는 주관적 화질 평가 시스템으로서,
상기 정보 통합부는 상기 영상 정보의 크기를 상기 중요도 맵의 크기와 일치시키고, 상기 영상 정보와 상기 중요도 맵을 element-wise product 형태로 곱한 결과에 상기 가중치가 부여된 상기 영상 정보를 합하며,
상기 기계학습은 심층 신경망 기반 학습이고,
상기 중요도 맵 산출을 위한 신경망 기반 학습은 영상과 상기 영상에 대한 시선 추적 데이터를 이용하여 학습되고,
상기 화질 평가를 위한 신경망 기반 학습은 주관적 화질 평가 결과가 부여된 영상과 대응하는 화질 평가 결과를 이용하여 학습되는 것을 특징으로 하는 주관적 화질 평가 시스템.
an image acquisition unit for acquiring a test image;
an image information calculator for obtaining preset image information for the test image by using machine learning;
an importance map calculation unit for obtaining an importance map for the test image by using machine learning;
an information integrator for assigning weights to the image information using the importance map; and
A subjective image quality evaluation system including a quality evaluation unit for calculating a quality evaluation result of the test image by using the weighted image information,
The information integrator matches the size of the image information with the size of the importance map, and adds the weighted image information to a result of multiplying the image information and the importance map in the form of an element-wise product,
The machine learning is deep neural network-based learning,
Neural network-based learning for calculating the importance map is learned using an image and eye tracking data for the image,
The neural network-based learning for the image quality evaluation is a subjective image quality evaluation system, characterized in that it is learned using the image to which the subjective image quality evaluation result is given and the image quality evaluation result corresponding to the image.
삭제delete 삭제delete 청구항 1에 있어서,
상기 영상 정보 산출을 위한 신경망 기반 학습은 영상 정보가 표시된 영상과 대응하는 영상 정보를 이용하여 학습되는 것을 특징으로 하는 주관적 화질 평가 시스템.
The method according to claim 1,
The neural network-based learning for calculating the image information is a subjective image quality evaluation system, characterized in that it is learned using image information corresponding to an image on which image information is displayed.
삭제delete 삭제delete 청구항 4에 있어서,
상기 정보 통합부는 상기 영상 정보를 미리 설정된 복수의 패치로 분리하고, 상기 분리된 패치에서 대표값을 산출하며, 상기 산출된 대표값을 결합하는 것을 특징으로 하는 주관적 화질 평가 시스템.
5. The method according to claim 4,
and the information integrator divides the image information into a plurality of preset patches, calculates a representative value from the separated patches, and combines the calculated representative values.
청구항 7에 있어서,
상기 정보 통합부는 상기 중요도 맵의 신뢰도에 따라 상기 영상 정보에 서로 다른 가중치를 부여하는 것을 특징으로 하는 주관적 화질 평가 시스템.
8. The method of claim 7,
and the information integrator assigns different weights to the image information according to the reliability of the importance map.
주관적 화질 평가 시스템의 화질 평가 방법으로서,
테스트 영상을 획득하는 영상 획득 단계;
기계학습을 이용하여 상기 테스트 영상에 대한 미리 설정된 영상 정보를 획득하는 영상 정보 산출 단계;
기계학습을 이용하여 상기 테스트 영상에 대한 중요도 맵을 획득하는 중요도 맵 산출 단계;
상기 중요도 맵을 이용하여 상기 영상 정보에 가중치를 부여하는 정보 통합 단계; 및
상기 가중치가 부여된 영상 정보를 이용하여 상기 테스트 영상의 화질 평가 결과를 산출하는 화질 평가 단계를 포함하는 주관적 화질 평가 방법으로서,
상기 정보 통합 단계는 상기 영상 정보의 크기를 상기 중요도 맵의 크기와 일치시키고, 상기 영상 정보와 상기 중요도 맵을 element-wise product 형태로 곱한 결과에 상기 가중치가 부여된 상기 영상 정보를 합하며,
상기 기계학습은 심층 신경망 기반 학습이고,
상기 중요도 맵 산출을 위한 신경망 기반 학습은 영상과 상기 영상에 대한 시선 추적 데이터를 이용하여 학습되고,
상기 화질 평가를 위한 신경망 기반 학습은 주관적 화질 평가 결과가 부여된 영상과 대응하는 화질 평가 결과를 이용하여 학습되는 것을 특징으로 하는 주관적 화질 평가 방법.
A method for evaluating the image quality of a subjective image quality evaluation system, comprising:
an image acquisition step of acquiring a test image;
an image information calculation step of obtaining preset image information for the test image using machine learning;
an importance map calculation step of obtaining an importance map for the test image by using machine learning;
an information integration step of assigning weights to the image information using the importance map; and
A subjective image quality evaluation method comprising: an image quality evaluation step of calculating a quality evaluation result of the test image using the weighted image information;
The information integration step matches the size of the image information with the size of the importance map, and adds the weighted image information to a result of multiplying the image information and the importance map in the form of an element-wise product,
The machine learning is deep neural network-based learning,
Neural network-based learning for calculating the importance map is learned using an image and eye tracking data for the image,
The neural network-based learning for the image quality evaluation is a subjective image quality evaluation method, characterized in that it is learned using the image to which the subjective image quality evaluation result is given and the image quality evaluation result corresponding to the image.
삭제delete 삭제delete 청구항 9에 있어서,
상기 영상 정보 산출을 위한 신경망 기반 학습은 영상 정보가 표시된 영상과 대응하는 영상 정보를 이용하여 학습되는 것을 특징으로 하는 주관적 화질 평가 방법.
10. The method of claim 9,
The neural network-based learning for calculating the image information is a subjective image quality evaluation method, characterized in that learning is performed using image information corresponding to an image on which image information is displayed.
삭제delete 삭제delete 청구항 12에 있어서,
상기 정보 통합 단계는 상기 영상 정보를 미리 설정된 복수의 패치로 분리하고, 상기 분리된 패치에서 대표값을 산출하며, 상기 산출된 대표값을 결합하는 것을 특징으로 하는 주관적 화질 평가 방법.
13. The method of claim 12,
The information integration step divides the image information into a plurality of preset patches, calculates a representative value from the separated patches, and combines the calculated representative values.
청구항 15에 있어서,
상기 정보 통합 단계는 상기 중요도 맵의 신뢰도에 따라 상기 영상 정보에 서로 다른 가중치를 부여하는 것을 특징으로 하는 주관적 화질 평가 방법.
16. The method of claim 15,
In the information integration step, different weights are given to the image information according to the reliability of the importance map.
청구항 9, 청구항 12, 청구항 15, 청구항 16 중 어느 한 청구항의 방법을 실행시키기 위한 컴퓨터 판독 가능한 프로그램을 기록한 기록 매체.

Claim 9, claim 12, claim 15, any one of claims 16 for executing the method of any one of the computer-readable recording medium recorded.

KR1020170177967A 2017-12-22 2017-12-22 System and method for estimating subject image quality using visual saliency and a recording medium having computer readable program for executing the method KR102284096B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170177967A KR102284096B1 (en) 2017-12-22 2017-12-22 System and method for estimating subject image quality using visual saliency and a recording medium having computer readable program for executing the method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170177967A KR102284096B1 (en) 2017-12-22 2017-12-22 System and method for estimating subject image quality using visual saliency and a recording medium having computer readable program for executing the method

Publications (2)

Publication Number Publication Date
KR20190076288A KR20190076288A (en) 2019-07-02
KR102284096B1 true KR102284096B1 (en) 2021-07-29

Family

ID=67258445

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170177967A KR102284096B1 (en) 2017-12-22 2017-12-22 System and method for estimating subject image quality using visual saliency and a recording medium having computer readable program for executing the method

Country Status (1)

Country Link
KR (1) KR102284096B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023163494A1 (en) * 2022-02-23 2023-08-31 삼성전자주식회사 Electronic apparatus and control method thereof

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111127386B (en) * 2019-07-08 2023-04-18 杭州电子科技大学 Image quality evaluation method based on deep learning
KR20210158261A (en) * 2020-06-23 2021-12-30 삼성전자주식회사 Method and apparatus for video quality assessment
KR20220014715A (en) 2020-07-29 2022-02-07 삼성전자주식회사 Method and apparatus for video quality assessment
KR102295652B1 (en) 2020-07-30 2021-08-30 국방과학연구소 Method and apparatus for measurement of image quality based on deep-learning
WO2022250388A1 (en) * 2021-05-25 2022-12-01 삼성전자 주식회사 Electronic device for assessing video quality and method for operating same
CN113486821B (en) * 2021-07-12 2023-07-04 西安电子科技大学 No-reference video quality evaluation method based on time domain pyramid
KR102418000B1 (en) * 2022-03-15 2022-07-07 광주과학기술원 Method for performing stereo matching by using color image and monochrome image and device using the same

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101717399B1 (en) 2016-01-29 2017-03-17 연세대학교 산학협력단 The automatic system and method for measuring subjective quality score, recording medium thereof
KR101832805B1 (en) * 2016-06-13 2018-02-28 인하대학교 산학협력단 Context Aware POMDP based Adaptive Eye Tracking for Robust Human Computer Interaction

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Weilong Hou, et al. "Saliency-guided deep framework for image quality assessment." IEEE MultiMedia 22.2 (2014): 46-55.2014.12.31.*
Zhengxue Cheng, et al. "A pre-saliency map based blind image quality assessment via convolutional neural networks." 2017 IEEE International Symposium on Multimedia (ISM). IEEE, 2017.12.13.*

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023163494A1 (en) * 2022-02-23 2023-08-31 삼성전자주식회사 Electronic apparatus and control method thereof

Also Published As

Publication number Publication date
KR20190076288A (en) 2019-07-02

Similar Documents

Publication Publication Date Title
KR102284096B1 (en) System and method for estimating subject image quality using visual saliency and a recording medium having computer readable program for executing the method
KR102596897B1 (en) Method of motion vector and feature vector based fake face detection and apparatus for the same
Wong et al. Patch-based probabilistic image quality assessment for face selection and improved video-based face recognition
KR102641115B1 (en) A method and apparatus of image processing for object detection
WO2019100282A1 (en) Face skin color recognition method, device and intelligent terminal
WO2019033572A1 (en) Method for detecting whether face is blocked, device and storage medium
US8498454B2 (en) Optimal subspaces for face recognition
US20160070956A1 (en) Method and Apparatus for Generating Facial Feature Verification Model
US20140254934A1 (en) Method and system for mobile visual search using metadata and segmentation
CN110428399B (en) Method, apparatus, device and storage medium for detecting image
WO2019061658A1 (en) Method and device for positioning eyeglass, and storage medium
CN111160275B (en) Pedestrian re-recognition model training method, device, computer equipment and storage medium
CN105813548A (en) Process for evaluation of at least one facial clinical sign
Li et al. Face spoofing detection with image quality regression
KR20160119932A (en) Method and apparatus for face recognition based quality assessment
CN108108658B (en) Biological feature recognition method
Raghavendra et al. Automatic face quality assessment from video using gray level co-occurrence matrix: An empirical study on automatic border control system
KR20120066462A (en) Method and system for providing face recognition, feature vector extraction apparatus for face recognition
CN111291605A (en) People flow analysis system and people flow analysis method
CN112528939A (en) Quality evaluation method and device for face image
CN110751069A (en) Face living body detection method and device
CN112633221A (en) Face direction detection method and related device
CN115984930A (en) Micro expression recognition method and device and micro expression recognition model training method
CN106611417B (en) Method and device for classifying visual elements into foreground or background
Ellahi et al. A machine-learning framework to predict TMO preference based on image and visual attention features

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant