KR101653223B1

KR101653223B1 - 영상 품질 조절 시스템 및 방법

Info

Publication number: KR101653223B1
Application number: KR1020100022413A
Authority: KR
Inventors: 장성환; 이상훈; 서창렬; 진영민
Original assignee: 주식회사 케이티
Priority date: 2010-03-12
Filing date: 2010-03-12
Publication date: 2016-09-02
Also published as: KR20110103196A

Abstract

영상 품질 조절 시스템 및 방법이 제공된다. 영상 품질 조절 시스템은 영상 신호의 차영상 신호를 복수의 블럭으로 분할하여 이산여현변환하고, 상기 이산여현변환 계수의 각 성분 별로 이산 여현 변환 계수의 히스토그램을 생성하는 차영상 신호 처리부, 상기 각 성분 별 히스토그램에 기초하여, 상기 계수를 양자화하는 경우에 양자화 간격에 따라 발생하는 상기 계수의 왜곡 값에 따른 인지적 영상품질 산출부 및 양자화 간격에 따른 영상의 발생 비트율 값을 산출하고, 상기 산출된 인지적 영상품질 값 및 상기 산출된 발생 비트율 값에 기초하여, 상기 영상 신호를 미리 설정된 품질의 영상으로 인코딩하기 위한 비트율 값을 산출하는 비트율 산출부를 포함한다.

Description

영상 품질 조절 시스템 및 방법{SYSTEM AND METHOD FOR CONTROLLING QUALITY OF IMAGE}

본 발명은 영상 품질 조절 시스템 및 방법에 관한 것으로서, 보다 상세하게는, 미리 설정된 영상 품질을 유지할 수 있도록, 촬영되는 영상의 왜곡 값 및 비트율을 예측하여 영상을 인코딩하는 영상 품질 조절 시스템 및 방법에 관한 것이다.

통신 기술의 눈부신 발달로 인해, 네트워크를 이용한 영상 정보의 전송 및 저장은 현대 사회를 살아가는데 없어서는 안 될 필수적인 생활 아이템으로 자리 잡고 있으며, 유비쿼터스 센서망(USN) 등을 통한 비디오 보안 감시가 많이 이루어지고 있다.

이러한 영상 서비스에 있어서, 사용할 수 있는 네트워크망의 용량이 한정되어 있으며, 이로 인하여, 영상 정보의 전송 및 저장 효율을 극대화시키기 위해서는 주어진 사용망의 용량 한도 내에서 최적의 영상 화질을 얻을 수 있도록 하는 영상 압축 기술이 필요하게 되었다. 영상 압축의 대표적인 기술로서, 정지 영상의 압축 기술은 JPEG, 동영상의 압축 기술은 H.261, H.263, MPEG-1, MPEG-2, MPEG-4 등으로 표준화되어 있으며, 이러한 영상 정보 압축 표준에서는 시간적 또는 공간적으로 중복되어 있는 정보를 제거하는 방법을 이용하고 있다.

한편, 영상 감시 시스템에 있어서, 종래에는 촬영되는 감시 영상을 상황과 관계없이 일정한 비트율로 인코딩하였다. 따라서, 보안에 아무 문제가 없을 때에는 필요보다 비트율이 높음으로써 망 대역폭의 낭비를 초래하게 되며, 막상 상황이 발생하여 높은 수준의 화질이 필요할 때엔 비트율이 부족함으로써 원하는 수준의 화질을 제공할 수 없는 문제가 있었다.

이에, 최근에는 영상 객체 인식 기술 및 동작 인식 기술이 발전함에 따라 비디오를 통해 감시하려는 대상을 자동으로 색출하는 기술이 가능하게 되었으며, 촬영되는 감시 영상으로부터 상황을 판단할 수 있게 되었다. 예를 들어, 마스크를 쓴 사람의 자동 현금 인출 시도, 공항에서 가방을 내려놓고 가는 행동, 화재 발생이나 침입자 발생 등 평상 시와 다른 특이 행동이나 특이 객체 출현의 특징을 분석하여, 이를 자동으로 검출하고 경보를 표시할 수 있게 되었으며 이를 통해 수많은 비디오를 24시간 일일이 인력을 사용하여 감시해야 하는 필요와 수고를 줄일 수 있게 되었다.

그러나, 일률적인 비트율로 보내는 종래 기술은, 피사체의 움직임 등이 많거나 화면이 복잡해질 경우에는 상대적으로 영상 화질이 떨어지기 때문에 원하는 품질의 영상을 보내기 힘들고, 상황에 상관없이 고정된 비트율로 전송하기 때문에 평상시엔 전송대역폭의 낭비가 발생하기 쉽고 상황이 발생했을 때는 원하는 화질을 얻기 어려운 문제가 있었다. 또한, 피사체의 움직임에 따라 영상 화질을 차별하여 제공하는 경우에도, 피사체의 동작 변화가 많은 경우에는 원하는 품질의 영상을 정확하게 예측하여 계속적으로 제공하기 힘든 문제가 있었다.

따라서 본 발명에서는 영상의 화질과 비트율간의 관계를 계산할 수 있는 기술을 제안하며, 본 발명에 의해 화질과 비트율간의 관계를 계산하면 미리 상황 별로 필요한 화질을 설정하고, 상황에 따라 필요한 비트율을 인코더의 파라미터로 줄 수가 있다.

본 발명의 일부 실시예는, 영상의 차영상 신호로부터 양자화 간격에 따른 영상 왜곡 값을 예측하고, 예측된 영상 왜곡 값에 기초하여 영상의 화질-비트율 관계를 계산함으로써 원하는 화질을 얻는데 필요한 비트율을 인코더에 출력하여 인코더가 입력 파라미터로 사용할 수 있도록 해주는 영상 품질 조절 시스템 및 방법을 제공한다.

또한, 본 발명의 일 실시예는, 영상의 차영상 신호를 양자화 간격에 따른 영상 품질을 인간 시각 특성을 반영하여 예측하고, 양자화 간격 및 영상 품질에 기초하여 영상의 인코딩에 적용될 비트율 값을 예측하는, 영상 품질 조절 시스템 및 방법을 제공한다.

또한, 본 발명의 일 실시예는, 감시 상황에 따라 미리 설정된 품질의 영상을 정확하고 지속적으로 제공할 수 있는 영상 품질 조절 시스템 및 방법을 제공한다.

상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본 발명의 제 1 측면은 영상 신호의 차영상 신호를 이산 여현 변환하고 주파수 성분 별로 이산 여현 변환 계수의 히스토그램을 생성하는 차영상 신호 처리부, 상기 각 성분 별 히스토그램에 기초하여, 상기 계수를 양자화하는 경우에 발생하는, 양자화 간격에 따른 상기 계수의 왜곡 값을 산출하는 왜곡값-양자기 관계 산출부, 양자화 간격에 따른 영상의 발생 비트율 값을 산출하는 양자기-비트율 관계 산출부 및 상기 산출된 양자화 간격에 따른 상기 계수의 왜곡 값 및 상기 산출된 양자화 간격에 따른 영상의 발생 비트율 값에 기초하여, 상기 영상 신호를 미리 설정된 품질의 영상으로 인코딩하기 위한 비트율 값을 산출하는 화질-비트율 관계 산출부를 포함하는, 영상 품질 조절 시스템을 제공할 수 있다.

또한, 본 발명의 제 2 측면은, 영상 신호의 차영상 신호를 복수의 블록으로 분할하는 단계, 상기 분할된 차영상 신호를 이산 여현 변환하고, 주파수 성분 별로 상기 이산 여현 변환 계수의 히스토그램을 생성하는 단계, 상기 히스토그램에 기초하여, 상기 계수를 양자화하는 경우에 양자화 간격에 따라 발생하는 상기 계수의 왜곡 값을 예측하는 단계, 상기 히스토그램에 기초하여, 양자화 간격에 따른 영상의 발생 비트율 값을 예측하는 단계 및 상기 왜곡 값 및 상기 발생 비트율 값에 기초하여, 미리 설정된 품질의 영상으로 인코딩하기 위한 비트율 값을 산출하는 단계를 포함하는 영상 품질 조절 방법을 제공할 수 있다.

전술한 본 발명의 과제 해결 수단에 의하면, 획득되는 영상의 주파수 성분 별로 양자화 간격에 따른 영상 품질 및 비트율 값을 예측하여, 획득되는 영상을 원하는 품질로 인코딩하여 제공할 수 있다.

또한, 전술한 본 발명의 과제 해결 수단에 의하면, 인간 시각 특성을 반영하여 영상 품질을 예측함으로써, 획득되는 영상을 보다 효과적으로 특정 품질의 영상으로 인코딩할 수 있다.

또한, 본 발명의 다른 과제 해결 수단 중 하나에 의하면, 감시 상황에 따라 미리 설정된 품질의 영상을 보다 정확하고 지속적으로 제공할 수 있다.

도 1은 본 발명의 일 실시예에 따라 감시 상황을 판단하고 판단 결과에 따라 적절한 화질로 영상을 인코딩하는 영상 감시 시스템의 일례를 도시한 개요도이다.
도 2는 본 발명의 일 실시예에 따른 영상 감시 시스템의 전체 구성도이다.
도 3은 본 발명의 일 실시예에 따른 영상 품질 조절 시스템(3000)의 세부 구성도이다.
도 4는 본 발명의 일 실시예에 따른 영상 품질-비트율 산출부(3200)의 세부 구성도이다.
도 5는 본 발명의 일 실시예에 따른 감시 상황 별 영상 품질 설정 테이블의 일례이다.
도 6은 본 발명의 일 실시예에 따른 4 x 4 개의 화소 단위로 분할된 차영상 신호의 각 성분 별 이산 여현 변환 계수의 히스토그램의 일례이다.
도 7은 본 발명의 일 실시예에 따른 양자화된 DCT 계수의 왜곡 발생을 설명하기 위한 그래프이다.
도 8은 본 발명의 일 실시예에 따른 영상 왜곡값(RMSE)과 인지적 영상 품질과의 관계를 도시한 그래프의 일례이다.
도 9는 본 발명의 일 실시예에 따른 감시 상황 별 영상 품질 조절 방법의 전체 흐름도이다.
도 10은 본 발명의 일 실시예에 따른 영상 품질 조절 방법의 세부 흐름도이다.

아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.

명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.

이하, 첨부된 도면을 참고하여 본 발명을 상세히 설명하기로 한다.

도 1은 본 발명의 일 실시예에 따른, 감시 상황을 판단하고 판단 결과에 따라 적절한 화질로 인코딩하는 영상 감시 시스템의 일례를 도시한 개요도이다. 도 1에 도시된 바와 같이, 본 발명의 일 실시예에 따른 영상 감시 시스템에서는 인식 장치에서 영상의 내용이나 상황을 인식하고 이에 기초하여 화질 조절 장치에서 영상의 화질-비트율 관계를 실시간 분석한 후 상황에 따른 최적의 화질에 맞는 비트율을 인코더에 알려주어 인코딩하도록 할 수 있다. 인코더는 파라미터로 입력된 비트율에 맞추어 비트율 제어(Rate Control)을 하기 때문에 입력된 비트율에 맞도록 인코딩할 수 있다. 따라서 본 발명의 일 실시예에 따르면 감시 상황에 맞도록 조절된 최적의 화질을 제공할 수 있고, 전송망 대역폭의 낭비를 줄일 수 있다.

도 2는 본 발명의 일 실시예에 따른 영상 감시 시스템의 전체 구성도이다.

도 2에 도시된 바와 같이, 본 발명의 일 실시예에 따른 영상 감시 시스템은 영상 촬영부(1000), 객체/동작 인식 시스템(2000), 영상 품질 조절 시스템(3000), 인코더(4000), 네트워크(5000) 및 감시 서버(6000)를 포함한다.

영상 촬영부(1000)는 피사체를 촬영한다. 영상 촬영부(1000)는, 특정 장소의 천정 등에 설치되어 해당 영역 및 영역 내의 피사체를 촬영할 수 있으며, 촬영된 영상을 후술할 객체/동작 인식 시스템(2000)과 영상 품질 조절 시스템(3000)에게 제공할 수 있다.

객체/동작 인식 시스템(2000)은 입력된 영상을 분석하여 감시하고 있는 상황에 관한 정보를 영상 품질 조절 시스템(3000)에게 제공한다. 객체/동작 인식 시스템(2000)은, 수신된 영상 내의 피사체의 움직임 정보 등에 기초하여 현재의 감시 상황에 관한 정보를 생성할 수 있다. 또한, 상황 판단부(2200)는 별도의 센서(모션 감지 센서, 온도 센서 등)를 이용하여 피사체의 움직임 변화율 또는 감시 대상의 온도 등을 수집하여 이용할 수도 있으나, 이에 제한되지 않는다.

영상 품질 조절 시스템(3000)은 감시 상황에 따른 영상 품질을 설정하고, 감시 상황에 대응하는 영상 품질로 수신된 영상 신호를 인코딩하도록 최적의 비트율을 출력한다.

또한, 영상 품질 조절 시스템(3000)은 수신된 영상 신호의 차영상 신호에 기초하여, 양자화 간격에 따른 영상 왜곡 값을 예측하고, 예측된 영상 왜곡 값 및 인간 시각 특성에 기초하여 영상 품질을 예측할 수 있다. 차영상 신호란, 이전 화상 신호와 현재 화상 신호의 차이를 나타내는 신호를 말한다. 영상 품질 조절 시스템(3000)은 양자화 간격에 따른 비트율 값을 수신된 영상 신호로부터 예측하고, 양자화 간격을 고려하여, 특정 영상 품질을 위한 비트율 값을 산출할 수 있다.

이러한, 영상 품질 조절 시스템(3000)의 세부 구성에 대하여는 후술하기로 한다.

인코더(4000)는, 영상 촬영부(1000)로부터 수신된 영상 신호를 영상 품질 조절 시스템(3000)에서 출력되는 비트율에 맞추어 인코딩한다.

네트워크(5000)는 근거리 통신망(Local Area Network; LAN), 광역 통신망(Wide Area Network; WAN) 또는 부가 가치 통신망(Value Added Network; VAN) 등과 같은 유선 네트워크나 이동 통신망(mobile radio communication network) 또는 위성 통신망 등과 같은 모든 종류의 무선 네트워크 및 이들의 상호 조합을 포함하며, 도 2에 도시된 각 네트워크 구성 주체가 서로 원활하게 통신을 할 수 있도록 하는 포괄적인 의미의 데이터 통신망을 의미한다.

도 2에서는 영상 촬영부(1000), 객체/동작 인식 시스템(2000) 및 인코더(4000)가 영상 품질 조절 시스템(3000)과 별개로 존재하는 것으로 설명하였지만, 이에 제한되지 않으며, 이들 중 하나 이상이 영상 품질 조절 시스템(3000)에 포함될 수도 있다.

감시 서버(6000)는, 인코더(4000)로부터 인코딩된 영상 신호를 수신하고 저장하며, 필요에 따라 경보를 울리는 등의 필요한 기능을 한다. 또한, 감시 서버(6000)는 수신된 신호에 기초하여, 감시 상황을 모니터링할 수 있다.

이하, 도 3을 참조하여, 본 발명의 일 실시예에 따른 영상 품질 조절 시스템(3000)의 세부 구성을 설명하기로 한다.

도 3은 본 발명의 일 실시예에 따른 영상 품질 조절 시스템(3000)의 세부 구성도이다.

도 3에 도시된 바와 같이, 본 발명의 일 실시예에 따른 영상 품질 조절 시스템(3000)은 영상 품질 설정부(3100), 영상 품질-비트율 관계 산출부(3200) 및 제어부 (3300)를 포함한다. 이러한 영상 품질 조절 시스템(3000)은 객체/동작 인식 시스템(2000)으로부터 판단된 현재 상황을 수신하고, 촬영부(1000)로부터 촬영된 영상 신호를 수신하며, 인코더(4000)에게 파라미터로 입력시킬 비트율을 출력할 수 있다.

영상 품질 설정부(3100)는 감시 상황 및 감시 상황에 대응하는 영상 품질을 설정한다. 영상 품질 설정부(3100)는, 복수의 감시 상황을 미리 설정할 수 있으며, 설정된 각각의 감시 상황 별로 제공하고자 하는 영상 품질을 각각 설정할 수 있다.

영상 품질 설정부(3100)는, 예를 들어, 감시 상황을 일반 상황, 이상 조짐 상황 및 긴급 상황 등으로 구별 할 수 있으며, 각 상황에 따라 영상 품질 또는 해상도를 달리하여 영상을 인코딩할 수 있도록 설정할 수 있다. 따라서, 일반 상황일 경우에는 낮은 화질로 영상을 인코딩하고, 긴급 상황일 경우에는 높은 화질로 영상을 인코딩하여, 망자원을 절약하는 동시에 효율적으로 감시 영상을 획득할 수 있도록 할 수 있다.

영상 품질 설정부(3100)에서는 객체/동작 인식 시스템(2000)으로부터 수신되는 현재의 감시 상황과 관련된 신호를 해석하고, 설정된 감시 상황 중 어느 하나와 맵핑할 수 있다.

영상 품질-비트율 관계 산출부(3200)는, 영상의 품질과 비트율 간의 관계를 산출하여 제어부(3300)에게 제공한다. 영상 품질-비트율 관계 산출부(3200)는, 영상 신호의 차영상 신호에 기초하여, 양자화 간격에 따른 영상 왜곡 값을 예측하고, 영상 왜곡 값 및 인간 시각 특성에 기초하여 영상 품질과 양자화 값의 관계를 예측할 수 있다. 여기서, 영상 왜곡 값은 차영상 신호의 DCT 계수 및 상기 차영상 신호의 양자화된 신호의 DCT 계수의 차이의 평균 제곱근 오차(RMSE: Root Mean Sqaure Error) 값일 수 있다. 또한, 차영상 신호는, 이전 화상 신호와 현재 화상 신호의 차이를 나타내는 신호로서, 현재 화상 신호에 움직임 보상을 한 이전 화상 신호를 감산함으로써 생성될 수 있다.

영상 품질-비트율 관계 산출부(3200)는, 이러한 차영상 신호를 이산 여현 변환(Discrete Cosine Transform: DCT)하고, 이산 여현 변환된 계수의 각 성분 별 히스토그램을 생성(누적 발생 빈도수를 산출)하고 히스토그램으로부터 양자화 간격에 따라 발생하는 영상 왜곡 값을 산출할 수 있다. 또한, 영상 품질-비트율 관계 산출부(3200)는 양자화 간격에 따라 산출된 영상 왜곡 값에 기초하여, 인간 시각 특성을 반영한 인지적 영상 품질을 산출할 수도 있다. 나아가, 영상 품질-비트율 관계 산출부(3200)는 양자화 간격에 따른 비트율을 산출할 수 있으며, 따라서 인지적 영상 품질과 비트율 간의 관계를 산출할 수 있다.

제어부(3300)는 영상 품질 조절 시스템(3000) 전체의 작동을 제어하며, 영상 품질 설정부(3100)로부터 현재 상황에 필요한 영상 품질 값을 수신하고, 영상 품질-비트율 관계 산출부(3200)로부터 영상 품질과 비트율의 관계에 관한 정보를 수신하여, 현재 영상을 현재 상황에 대응하는 영상 품질로 인코딩하는데 필요한 최적의 비트율을 출력한다.

제어부(3300)에서 출력되는 비트율 값은 인코더(4000)의 입력 파라미터로 입력되며, 인코더(4000)는 수신된 비트율에 맞도록 영상 신호를 인코딩하여 비트 스트림을 네트워크(5000)를 통해 감시 시스템(6000)으로 전송한다.

이하, 도 4를 참조하여, 본 발명의 일 실시예에 따른 영상 품질-비트율 관계 산출부(3200)의 세부 구성에 대하여 설명하기로 한다.

도 4는 본 발명의 일 실시예에 따른 영상 품질-비트율 관계 산출부(3200)의 세부 구성도이다.

도 4에 도시된 바와 같이, 본 발명의 일 실시예에 따른 영상 품질-비트율 관계 산출부(3200)는 차영상 신호 처리부(3210), 왜곡값-양자기 관계 산출부(3220), 화질-왜곡값 관계 산출부(3230), 양자기-비트율 관계 산출부(3240), 화질-비트율 관계 산출부(3250)를 포함한다.

차영상 신호 처리부(3210)는 영상 촬영부(1000)로부터 수신되는 영상 신호로부터 움직임 보상을 통해 차영상 신호를 생성하고, 생성된 차영상 신호에 기초한 히스토그램을 생성한다.

차영상 신호 처리부(3210)는 차영상을 복수의 블록으로 분할하고, 분할된 영상을 각각 이산 여현 변환할 수 있으며, 각 주파수 성분 별로 이산 여현 변환 계수의 히스토그램을 생성할 수 있다.

차영상 신호 처리부(3210)는, 예를 들어, 차영상을 N*N 화소 갯수의 블록으로 분할할 수 있으며, 각 블록에 대해 이산 여현 변환(DCT)을 수행할 수 있다. 이 경우, 한 블럭은 {(u, v), 0 ≤ u ≤ N-1 and 0 ≤ v ≤ N-1} 성분으로 구별될 수 있고, u는 수평 방향의 주파수, v는 수직 방향의 주파수이다. 또한, 차영상 신호 처리부(3210)는 각 블록 별로 이산 여현 변환을 한 후 이산 여현 변환 계수의 히스토그램을 생성할 수 있다. 즉, 예를 들어 352 x 288 화소의 차영상 신호를 4x4 블록으로 나눈 경우, 88 x 72 개의 블록이 된다. 이때 88 x 72개의 모든 블록에서 이산 여현 변환 계수의 (0,0) 성분 만을 모아 히스토그램을 만들 수 있다. 마찬가지로 (0,1) 성분부터 (3,3) 성분까지 16개의 히스토그램을 만들 수 있다.

이러한, 차영상 신호의 각 이산 여현 변환 계수의 각 성분 별 히스토그램은 라플라스 분포를 가질 수 있으며, 라플라스 모델을 이용하여 (u,v) 번째 DCT 성분의 계수의 히스토그램 분포를 아래 수학식 1과 같이 모델링하여 나타낼 수 있다.

여기서, u, v는 DCT 블록에서 수평, 수직 성분의 인덱스이다. 또한,

는 (u,v) 번째 DCT 성분의 계수의 히스토그램의 라플라스 모델 인자이며, 아래의 수학식 2와 같이 계산될 수 있다.

수학식 2에서,

는 (u,v) 번째 DCT 성분의 계수 히스토그램의 표준편차이다.

왜곡값-양자기 관계 산출부(3220)는 DCT 성분 계수의 히스토그램에 기초하여, 양자화 간격(Q)에 따라 발생하는 영상 왜곡 값(예를 들어, Root Mean Square Error 값)을 수학식 3과 같이 산출 또는 예측할 수 있다. 왜곡값-양자기 관계 산출부(3220)는 차영상 신호가 양자화 되는 과정에서의 계수의 왜곡을 예측함으로써 부호화된 영상의 왜곡을 측정할 수가 있다.

왜곡값-양자기 관계 산출부(3220)는 양자화 간격의 변화에 따른 왜곡 값 (RMSE)을 산출하는 과정에서 반복적인 양자화로 인한 연산량의 증가를 방지하기 위하여, 각 DCT 성분의 계수 분포의 히스토그램의 분포 함수를 모델링하여 사용할 수 있다.

본 발명의 일 실시예에서, 영상 왜곡 값은 차영상 신호의 원 신호의 DCT 계수와 양자화된 신호의 DCT 계수의 차이의 평균 제곱근 오차 값(RMSE: Root Mean Sqaure)으로 정의될 수 있으나, 이에 제한되지 않는다. 양자화 간격(Q)에 대한 (u,v) 번째 성분의 DCT 계수의 왜곡 예측 값은 아래의 수학식 3과 같이 산출될 수 있다.

수학식 3에서 Du,v(Q)는 (u,v)번째 DCT 성분의 양자기 Q에 따른 왜곡 값(RMSE), Pu,v는 (u,v)번째 DCT 성분의 히스토그램 분포 모델링 식(수학식 1), x는 도 7에 도시된 히스토그램의 가로축, iQ는 도 7에 도시된 히스토그램의 각 양자화 레벨 간격, N는 한 영상에서의 블록의 갯수이다.

화질-왜곡값 관계 산출부(3230)는 인간이 감지하는 화질(인지적 화질)과 영상 왜곡값과의 관계를 산출한다.

일반적으로 인간 시각이 인지하는 화질과 영상 왜곡값(RMSE) 간의 관계는, 도 8 에서와 같이, 선형 관계가 아니라 두 개의 변곡점을 포함하는 곡선으로 나타낼 수 있다. 도 8은 인간 시각이 인지하는 품질과 RMSE 간의 관계의 일례를 도시한 도면이며, 도 8에서 가로축은 영상 왜곡값(RMSE)을 나타내고, 세로축은 인간 시각이 인지하는 화질의 정도를 나타낸다. 세로축 값은 최대 1부터 최소 0까지 분포할 수 있다. 인간 시각이 인지하는 품질은, 예를 들어, 도 8에서와 같이, 구간 I, 구간 II 및 구간 III으로 나눌 수 있으며, 구간 I 까지는 왜곡값(RMSE)이 증가해도 인간 시각이 느끼는 품질은 그다지 변하지 않는다. 그러나, 왜곡값(RMSE)이 변곡점 B를 초과하여 증가하면(구간 II) 인간 시각이 인지하는 품질은 왜곡값(RMSE)와 함께 감소하기 시작한다. 이후, 왜곡값(RMSE)이 변곡점 C를 초과하면(구간 III) 인간 시각이 인지하는 품질은 왜곡값(RMSE)가 증가해도 더 이상 크게 감소하지 않는다. 이러한 구간 I, II 및 III은 다음과 같이 정의될 수 있다.

구간 I(지점a ~ 지점b): 신호의 RMSE 왜곡이 발생하지만, 인지적 영상 품질의 열화가 거의 느껴지지 않는 영역(인지적 화질 1~0.9에 해당).

구간 II(지점b ~ 지점c): 신호의 RMSE 왜곡의 증가에 따라 인지적 영상 품질의 열화가 증가하는 영역(인지적 화질 0.9~0.1에 해당).

구간III (지점c ~ 지점d): 신호의 RMSE 왜곡이 증가하지만, 인지적 영상 품질의 열화가 더 이상 증가하지 않는 영역(인지적 화질 0.1~0에 해당).

이 때 지점 a와 d는 이론적으로 결정될 수 있다. 즉, 이론적으로, 영상 코덱의 양자화로 인하여 발생할 수 있는 최대 왜곡은 최대 양자기값(예를 들어, H.264 코덱인 경우 51, MPEG-2 코덱인 경우 31)에서 발생할 수 있다. 이 때, H.264 코덱인 경우, 양자화 레벨 간격은 224이며, 유니폼 양자화기 가정에서 양자화에 의한 최대 왜곡은 112이고 MPEG-2 인 경우 양자화 레벨 간격은 32, 최대 왜곡은 31일 수 있다.

왜곡값(RMSE)이 최소(0)일 때와 최대(H.264 코덱: 112, MPEG-2 코덱: 31)일 때를 이론적으로 각각 인지적 영상 품질 1.0과 0.0으로 맵핑할 수 있다. 따라서 모든 영상에 대해 이론적인 지점 a와 d는 동일하게 설정될 수 있다. 그러나 지점 b와 c는 입력되는 영상의 특성에 따라 달라진다. 지점 b는 각각 원 영상의 영상 품질과 비슷한 영상 품질을 나타내는 최대 왜곡값(RMSE)을 나타내며, 지점 c는 최대 양자화 값으로 부호화한 영상과 비슷한 영상 품질을 나타내는 최소 왜곡값(RMSE)을 나타낸다. 지점 b와 지점 c의 인지적 영상 품질은 각각 0.9와 0.1로 정의될 수 있다.

왜곡값(RMSE)에 따른 인간 시각의 인지적 영상 품질을 도출하기 위하여, 앞의 4개 지점(a, b, c, d)을 기준으로 4개의 인자(

)를 갖는 로지스틱(logistic) 함수를 다음과 같이 정의할 수 있다.

수학식 4에서, D는 영상의 왜곡값(RMSE)이고, PQ는 인간 시각의 인지적 영상 품질이다.

수학식 4에서

는 아래 수학식 5와 같이 지점(a, b, c, d)와 모델의 제곱 오차를 최소화하는 모델 인자로서 구할 수 있다.

수학식 5에서 a와 d는 이론적으로 최소 왜곡값과 최대 왜곡값에 의해 구해지며, b와 c는 인간 시각의 특성과 실험에 의해 정해질 수 있다. 영상 신호의 주파수에 따른 민감도에 대한 기존의 연구들은 사람의 시각 체계가 저주파 성분의 신호에 더 민감하게 반응한다고 알려져 있다.

따라서, 전체 왜곡값, 즉, 각 DCT 성분에서 발생한 왜곡값의 총합에 대한 최하위 저주파 3개 성분{(u,v)=(0,0), (0,1) 및 (1,0)}에서의 왜곡값의 합의 비율이 40% 되는 지점을 b로 정하고 75% 되는 지점을 c로 정의할 수 있다.

수학식 4에서, 인지적 영상 품질 값 PQ(D)이 1에 가까울수록 인지적 왜곡이 거의 없는 원 영상에 가까운 영상임을 나타내고, 인지적 영상 품질 값이 0에 가까울수록 인간이 시각적으로 보기에 영상의 왜곡이 큰 영상이 된다.

양자기-비트율 관계 산출부(3240)는 설정된 품질의 영상으로 인코딩하는데 필요한 비트율 값을 산출하기 위해서 양자기와 비트율 간의 관계를 산출한다.

양자기-비트율 관계 산출부(3240)는 각 DCT 성분의 히스토그램 정보를 토대로, 각 DCT 성분에서 양자화 간격에 따른 발생 비트율을 추정할 수 있다. 각 DCT 성분의 발생 비트율은 양자화 인자에 따른 엔트로피(entropy)를 기반으로 추정될 수 있으며, DCT 블록에서 (u,v) 번째 DCT 성분에서의 발생 전송률은 수학식 6과 같이 예측될 수 있다.

여기서,

은 양자화 간격 Q로 영상을 부호화 했을 때, 양자화 레벨 iQ로 맵핑되는 DCT 계수의 분포 확률을 나타내며,

은 아래 수학식 7과 같이 정리될 수 있다.

또한, 양자화 간격에 따른 영상의 발생 비트율은, 수학식 6을 이용하여, 수학식 8에서와 같이, 모든 DCT 성분에서의 발생 비트율의 합으로 산출될 수 있다.

양자기-비트율 관계 산출부(3240)는 수학식 8에 기초하여, 양자화 간격 값(Q)와 비트율 간의 관계를 산출할 수 있으며, 산출된 양자기-비트율 관계 정보를 화질-비트율 관계 산출부(3250)로 제공할 수 있다.

화질-비트율 관계 산출부(3250)는 왜곡값-양자기 관계 산출부(3220), 인지적 화질-왜곡값 관계 산출부(3230) 및 양자기-비트율 관계 산출부(3240)에서 산출된 값에 기초하여, 화질과 비트율간의 관계를 산출할 수 있다. 화질-비트율 관계 산출부(3250)는 양자화 간격에 따른 영상 왜곡값(영상 왜곡값 및 양자기 사이의 관계), 화질과 왜곡값 간의 관계 및 양자화 간격에 따른 영상의 발생 비트율 값(양자기 비트율 간의 관계)에 기초하여, 화질과 비트율 간의 관계를 정확하게 산출할 수 있다.

또한, 화질-비트율 관계 산출부(3250)는 산출된 화질과 비트율 간의 관계 정보를 제어부(3300)에게 제공한다. 제어부(3300)는, 영상 품질 설정부(3100)으로부터 상황에 따라 설정해 둔 화질 정보를 받아 설정된 화질을 위해 필요한 비트율 값을 출력할 수 있으며, 인코더(4000)는 제어부(3300)로부터 출력된 비트율 값을 인코딩 파라미터로써 활용하여 수신된 영상 신호를 인코딩할 수 있다.

본 발명의 일 실시예에 의하면, 영상 내의 피사체의 이동량이 변화하더라도, 특정 품질의 영상을 유지시키기 위하여, 촬영되는 영상 신호로부터 양자화 간격에 따른 영상 품질을 예측하고, 양자화 간격에 따른 비트율 값을 예측할 수 있으며, 이를 통하여, 특정 영상 품질을 위한 비트율 값을 정확하게 산출할 수 있는 동시에 원하는 영상 품질을 계속적으로 유지할 수 있게 된다.

이하, 도 5를 참조하여, 본 발명의 일 실시예에 따른 감시 상황 별 영상 품질 설정 테이블의 일례를 설명하기로 한다.

도 5는 본 발명의 일 실시예에 따른 감시 상황 별 영상 품질 설정 테이블의 일례이다.

도 5에 도시된 바와 같이, 영상 품질 설정부(3100)는, 복수의 감시 상황을 설정하고, 설정된 각각의 감시 상황 별로 제공하고자 하는 영상 품질을 설정할 수 있다. 구체적으로, 영상 품질 설정부(3100)는, 감시 상황을 일반 상황, 이상 조짐 상황 및 긴급 상황으로 구별 할 수 있으며, 각 상황에 따른 영상 품질 또는 해상도를 설정할 수 있다. 또한, 인지적 영상 품질 값을 0 ~ 1 사이의 값으로 정규화하여 설정할 수 있다.

따라서, 본 발명의 일 실시예에 의하면, 일반 상황일 경우에는 낮은 화질로 영상을 인코딩하고, 긴급 상황일 경우에는 높은 화질로 영상을 인코딩하여, 망자원을 절약하는 긴급한 상황 발생 시에 고화질의 영상을 제공함으로써 효율적으로 감시 영상을 획득할 수 있게 된다.

이하, 도 6을 참조하여, 본 발명의 일 실시예에 따른 차영상 신호의 각 성분 별 이산 여현 변환 계수의 히스토그램의 일례에 대하여 설명하기로 한다.

도 6은 본 발명의 일 실시예에 따른 4 x 4 개의 화소 단위로 분할된 차영상 신호의 각 성분 별 이산 여현 변환 계수의 히스토그램의 일례이다.

도 6에서, 왼쪽 위의 1번째 그래프가 (0,0) 번째 DCT 성분의 계수의 히스토그램, 즉, DC 성분을 나타낸다. 나머지 그래프들은 AC 성분의 계수의 히스토그램을 나타낸다. DC 성분의 오른쪽과 아래의 그래프는 (0,1), (1,0) 번째 DCT 성분의 계수의 히스토그램을 나타낸다. 가장 오른쪽 맨 아래의 그래프는 (3,3) 번째 DCT 성분의 계수의 히스토그램을 나타낸다. 또한, 도 6에서와 같이, 차영상 신호의 각 DCT 성분의 계수의 히스토그램은 라플라스 분포를 가질 수 있다.

이하, 도 7을 참조하여, 본 발명의 일 실시예에 따른 양자화된 DCT 계수의 왜곡에 대하여 설명하기로 한다.

도 7은 본 발명의 일 실시예에 따른 양자화된 DCT 계수의 왜곡 발생을 설명하기 위한 그래프이다.

도 7에서와 같이, 라플라스 분포로 모델링된 차영상 신호의 DCT 계수가 양자화 과정을 통해 왜곡된 값을 갖게 된다. 도 7의 가로축은 DCT 계수의 값이며, 세로 축은 히스토그램의 돗수이다. 본래, 원신호의 DCT 계수는 양자화 과정을 통해 일정한 간격으로 분포하는 양자화 레벨로 맵핑되며, 원신호의 DCT 계수와 양자화로 인한 DCT 계수의 차이로 인하여 영상의 왜곡이 발생하게 된다.

이하, 도 8을 참조하여, 본 발명의 일 실시예에 따른 영상 왜곡값(RMSE)과 인간 시각이 인지하는 영상 품질 간의 관계에 대하여 설명하기로 한다.

도 8은 본 발명의 일 실시예에 따른 영상 왜곡값(RMSE)과 인지적 영상 품질과의 관계를 도시한 그래프의 일례이다.

도 8에 도시된 바와 같이, 인간 시각이 인지하는 영상 품질은 최대 1에서 최소 0까지 정규화될 수 있으며, 이론적으로 최대 영상 품질은 왜곡값(RMSE)이 0일 때(a 지점)이고 최소 영상 품질은 왜곡값(RMSE)이 최대일 때(d 지점)이다. 그러나 실험에 의하면 a와 d 사이의 인지적 영상 품질은 왜곡값(RMSE)과 선형적으로 반비례하는 관계는 아니며, 도 8과 같이 두 개의 변곡점 b와 c가 존재할 수 있다. a에서 변곡점 b까지는 왜곡값(RMSE)이 증가해도 인지적 영상 품질은 별로 감소하지 않으며, 변곡점 b에서 변곡점 c까지는 왜곡값(RMSE)이 증가함에 따라 인지적 영상 품질이 같이 감소한다. 변곡점 c에서 d까지는 왜곡값(RMSE)가 증가해도 인지적 영상 품질은 더 이상 감소하지 않는다. 왜곡값(RMSE)과 인지적 품질 간의 관계 식은 변곡점 b와 c를 구함으로써 얻을 수 있다.

이하, 도 9를 참조하여, 본 발명의 일 실시예에 따른 감시 상황 별로 영상 품질을 조절하는 방법에 대하여 설명하기로 한다.

도 9는 본 발명의 일 실시예에 따른 감시 상황 별 영상 품질 조절 방법의 전체 흐름도이다.

단계 S900은 감시 상황에 따른 영상 품질을 설정하는 단계이다. 단계 S900에서는, 복수의 감시 상황을 설정하고, 설정된 각각의 감시 상황 별로 제공하고자 하는 영상 품질을 설정할 수 있다. 또한, 예를 들어, 감시 상황을 일반 상황, 이상 조짐 상황 및 긴급 상황으로 구별 할 수 있으며, 각 상황에 따라 영상 품질 또는 해상도를 달리하여 영상을 인코딩할 수 있도록 설정할 수 있다. 따라서, 일반 상황일 경우에는 낮은 화질로 영상을 인코딩하고, 긴급 상황일 경우에는 높은 화질로 영상을 인코딩하여, 망자원을 절약하는 동시에 효율적으로 감시 영상을 획득할 수 있게 된다.

단계 S902는 감시 상황을 판단하는 단계이다. 단계 S902에서는, 객체/동작 인식 시스템(2000)으로부터 판단된 현재의 영상 신호 감시 상황에 관한 정보를 수신하고 수신된 신호를 해석하여 현재 영상 신호의 감시 상황을 S900에서 설정된 감시 상황 중 어느 하나와 맵핑할 수 있다.

단계 S904는 촬영되는 영상 신호를 미리 설정된 품질의 영상으로 인코딩하여, 영상 품질을 조절하는 단계이다.

단계 S904에서는, 촬영되는 영상 신호로부터 움직임 보상 후의 차영상 신호를 구하고, 양자화 간격에 따른 영상 왜곡 값 및 인지적 영상 품질을 예측할 수 있으며, 이에 기초하여, 미리 설정된 품질의 영상을 제공하기 위한 비트율 값을 양자화 간격을 고려하여 산출할 수 있다.

이하, 도 10을 참조하여, 본 발명의 일 실시예에 따른 영상 품질을 조절하는 구체적인 방법에 대하여 설명하기로 한다.

도 10은 본 발명의 일 실시예에 따른 영상 품질 조절 방법의 세부 흐름도이다.

단계 S1000은 차영상 신호를 분석하는 단계이다. 단계 S1000에서는, 촬영되어 수신되는 영상 신호로부터 움직임 보상 후의 차영상 신호를 생성하고, 생성된 차영상 신호에 기초한 히스토그램을 생성할 수 있다.

단계 S1000에서는, 차영상을 분할하고, 분할된 영상을 각각 이산 여현 변환할 수 있으며, 각 블록의 주파수 성분 별로 이산 여현 변환 계수의 히스토그램을 생성할 수 있다. 예를 들어, 차영상을 N*N 개의 화소를 갖는 블록들로 분할할 수 있으며, 각각의 블록을 이산 여현 변환할 경우, 한 블럭은 {(u, v), 0 ≤ u ≤ N-1 and 0 ≤ v ≤ N-1} 개의 성분으로 구별될 수 있다. 또한, 각 블록의 각 성분 별로 이산 여현 변환 계수의 히스토그램을 생성할 수 있다.

단계 S1002는 DCT 성분 계수의 히스토그램에 기초하여, 양자화 간격에 따라 발생하는 영상 왜곡 값(RMSE 왜곡 값)을 산출 또는 예측하는 단계이다. 단계 S1002에서는 차영상 신호가 양자화 되는 과정에서의 계수의 왜곡을 예측함으로써 부호화된 영상의 RMSE 왜곡을 측정할 수가 있다. 예를 들어, 차영상 신호를 4 x 4 개의 성분으로 분할한 경우에 총 16 개의 DCT 성분에서의 계수의 왜곡을 예측하여야 하며, 이 경우 16 개의 왜곡 예측기를 사용하여 계수의 왜곡을 산출하거나, 하나의 왜곡 예측기를 반복 사용하여 계수의 왜곡을 산출할 수 있다.

또한, 단계 S1002에서는 양자화 간격의 변화에 따른 왜곡 값을 산출하는 과정에서 반복적인 양자화로 인한 연산량의 증가를 방지하기 위하여, 각 DCT 성분의 계수 분포의 히스토그램의 분포 함수를 모델링하여 사용할 수 있다. 따라서, 히스토그램의 분포 함수를 이용하여 각 DCT 값 분포 함수를 왜곡에 곱함으로써 양자화로 인하여 발생되는 RMSE 왜곡을 계산할 수 있다.

단계 S1004는 예측된 영상 왜곡 값에 인간 시각 특성을 반영하여 인지적 영상 왜곡 값을 산출하는 단계이다. 또한, 단계 S1004에서는, 인지적 영상 왜곡 값 과 RMSE 영상 왜곡 값 간의 관계 등을 산출할 수 있다. 단계 S1004에서는, S1002에서 구한 RMSE 왜곡값을 이용하여 인간 시각이 인지하는 영상 품질을 구할 수 있다.

단계 S1006은 양자화 간격에 따른 인지적 영상 품질을 예측하는 단계이다. 단계 S1006에서는, 단계 S1002에서 산출된 양자화 간격에 따른 RMSE 영상 왜곡 값, S1004에서 산출된 인지적 영상 왜곡 값 및 인지적 영상 품질 간의 관계에 기초하여, 양자화 간격에 따른 인지적 영상 품질을 산출할 수 있다.

단계 S1008 양자화 간격에 따른 비트율을 예측하고, 특정 품질의 영상으로 인코딩하는데 필요한 비트율 값을 산출하는 단계이다.

단계 S1008에서는 각 DCT 성분의 히스토그램 정보를 토대로, 각 DCT 성분에서 양자화 간격에 따른 발생 비트율을 추정할 수 있다. 각 DCT 성분의 발생 비트율 예측은 양자화 인자에 따른 엔트로피(entropy)를 기반으로 추정할 수 있다. 또한, 단계 S1008에서는 양자화 간격에 따른 영상의 발생 비트율을 모든 DCT 성분에서의 발생 비트율의 합으로 산출할 수 있다.

따라서, 단계 S1008에서는, 양자화 간격에 따른 영상 품질 값 및 양자화 간격에 따른 영상의 발생 비트율 값에 기초하여, 양자화 간격 값(Q)를 매개로 하여, 미리 설정된 품질의 영상을 제공하기 위한 비트율 값을 산출할 수 있다.

단계 S1010은 산출된 비트율 값에 기초하여 영상 신호를 인코딩하는 단계이다. S1008에서 구한 비트율 값을 인코더로 출력하면 인코더는 S1008에서 구한 비트율 값을 인코딩 파라미터로 사용하여 인코딩함으로써 현재 상황에 필요한 화질을 얻을 수 있다.

따라서, 본 발명의 일 실시예에 의하면, 영상 내의 피사체의 상황이 변화하더라도, 촬영되는 영상 신호로부터 양자화 간격에 따른 영상 품질 및 양자화 간격에 따른 비트율 값을 예측함으로써, 상황에 따른 특정 영상 품질을 위한 비트율 값을 정확하게 산출할 수 있는 동시에 설정된 영상 품질을 계속적으로 유지할 수 있게 된다.

본 발명의 일 실시예는 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터에 의해 실행 가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체 및 통신 매체를 모두 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다. 통신 매체는 전형적으로 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈, 또는 반송파와 같은 변조된 데이터 신호의 기타 데이터, 또는 기타 전송 메커니즘을 포함하며, 임의의 정보 전달 매체를 포함한다.

전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.

본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

3000: 영상 품질 조절 시스템
3100: 영상 품질 설정부
3200: 영상 품질-비트율 관계 산출부
3300: 제어부
3210: 차영상 신호 처리부
3220: 왜곡값-양자기 관계 산출부
3230: 화질-왜곡값 관계 산출부
3240: 양자기-비트율 관계 산출부
3250: 화질-비트율 관계 산출부

Claims

촬영된 영상을 감시 상황에 대응하는 영상 품질로 인코딩하는 장치에 있어서,
기설정된 영역을 촬영하는 영상 촬영부;
상기 영상 촬영부에 의해 촬영된 영상을 분석하여 감시 상황을 생성하는 객체 및 동작 인식 시스템;
감시 상황에 따른 영상 품질을 설정하고, 상기 영상을 상기 영상의 감시 상황에 대응하는 영상 품질로 인코딩하도록 하는 비트율을 출력하는 영상 품질 조절 시스템; 및
상기 영상을 상기 영상 품질 조절 시스템에 의해 출력되는 비트율로 인코딩하는 인코더를 포함하고,
상기 영상 품질 조절 시스템은 상기 영상의 품질과 비트율 간의 관계를 산출하는 영상 품질-비트율 관계 산출부를 포함하고,
상기 영상 품질-비트율 관계 산출부는 영상 신호의 차영상 신호로부터 산출된 영상의 왜곡값과 인지적 영상 품질 간의 관계를 산출하는 화질-왜곡값 관계 산출부를 포함하고,
상기 화질-왜곡값 관계 산출부는 상기 왜곡 값과 인지적 영상 품질 간의 관계를 로지스틱 함수(logistic function)로 모델링하는 것인, 인코딩 장치.
제 1 항에 있어서,
상기 객체 및 동작 인식 시스템은 상기 영상의 움직임 정보에 기초하여 감시 상황을 생성하는 것인, 인코딩 장치.
제 1 항에 있어서,
상기 영상 품질 조절 시스템은,
복수의 감시 상황을 설정하고, 각 감시 상황에 따라 영상 품질을 달리하여 상기 영상을 인코딩하도록 설정하고, 상기 영상의 감시 상황을 상기 설정된 복수의 감시 상황 중 어느 하나와 매핑하는 영상 품질 설정부; 및
상기 영상 품질 조절 시스템의 전체 작동을 제어하고, 상기 영상을 상기 영상의 감시 상황에 대응하는 영상 품질로 인코딩하도록 하는 비트율을 출력하는 제어부
를 더 포함하는 것인, 인코딩 장치.
제 3 항에 있어서,
상기 영상 품질-비트율 관계 산출부는,
상기 영상 신호의 상기 차영상 신호를 이산 여현 변환하고 주파수 성분 별로 이산 여현 변환 계수의 히스토그램을 생성하는 차영상 신호 처리부,
상기 각 성분 별 히스토그램에 기초하여, 상기 계수를 양자화하는 경우에 발생하는, 양자화 간격에 따른 상기 계수의 왜곡 값을 산출하는 왜곡값-양자기 관계 산출부,
상기 양자화 간격에 따른 영상의 발생 비트율 값을 산출하는 양자기-비트율 관계 산출부 및
상기 산출된 양자화 간격에 따른 상기 계수의 왜곡 값 및 상기 산출된 양자화 간격에 따른 영상의 발생 비트율 값에 기초하여, 상기 영상 신호를 미리 설정된 품질의 영상으로 인코딩하기 위한 비트율 값을 산출하는 화질-비트율 관계 산출부
를 포함하는 것인, 인코딩 장치.
제 4 항에 있어서,
상기 화질-비트율 관계 산출부는, 상기 산출된 왜곡 값과 인지적 영상 품질 간의 관계에 기초하여 상기 영상 신호를 미리 설정된 품질의 영상으로 인코딩하기 위한 비트율 값을 산출하는 것인, 인코딩 장치.
제 4 항에 있어서,
복수의 감시 상황 및 상기 감시 상황에 대응하는 영상 품질을 설정하고, 상기 영상 신호에 대응하는 감시 상황 및 영상 품질을 판단하는 영상 품질 설정부
를 더 포함하며,
상기 화질-비트율 관계 산출부는 상기 판단된 영상 품질로 상기 영상 신호를 인코딩하기 위한 비트율 값을 산출하는 것인, 인코딩 장치.
제 4 항에 있어서,
상기 차영상 신호 처리부는, 상기 차영상 신호를 복수의 블록으로 분할하고, 상기 분할된 블록을 이산 여현 변환하여 상기 각 블록의 주파수 성분 별로 이산 여현 변환 계수의 히스토그램을 생성하는 것인, 인코딩 장치.
제 4 항에 있어서,
상기 차영상 신호는, 현재 영상 신호에 이전 영상 신호를 움직임 보상한 블록 단위로 감산하여 생성된 것인, 인코딩 장치.
제 4 항에 있어서,
상기 왜곡값-양자기 관계 산출부는, 상기 각 성분의 히스토그램의 분포 함수를 모델링하고, 상기 모델링된 분포 함수를 이용하여, 양자화로 인하여 발생되는 상기 왜곡 값을 계산하는 것인, 인코딩 장치.
제 4 항에 있어서,
상기 왜곡 값은, 상기 차영상 신호의 DCT 계수 및 상기 차영상 신호의 양자화된 신호의 DCT 계수의 차이의 평균 제곱근 오차(RMSE: Root Mean Sqaure) 값인 것인, 인코딩 장치.
삭제
제 5 항에 있어서,
상기 인지적 영상 품질 값은 1 ~ 0의 값으로 정규화된 것인, 인코딩 장치.
제 5 항에 있어서,
상기 양자기-비트율 관계 산출부는, 상기 각 성분 별 히스토그램에 기초하여, 양자화 간격에 따른 각 성분에서의 발생 비트율을 엔트로피(entropy)를 기반으로 추정하며, 상기 양자화 간격에 따른 영상의 발생 비트율을, 상기 추정된 각 성분에서의 발생 비트율의 합으로 산출하는 것인, 인코딩 장치.
제 13 항에 있어서,
상기 화질-비트율 관계 산출부는, 상기 양자화 간격에 따른 영상 품질 값 및 상기 양자화 간격에 따른 영상의 발생 비트율 값에 기초하여, 상기 양자화 간격 값을 매개로 하여, 상기 미리 설정된 품질의 영상을 제공하기 위한 비트율 값을 산출하는 것인, 인코딩 장치.
촬영된 영상을 감시 상황에 대응하는 영상 품질로 인코딩하는 방법에 있어서,
감시 상황에 따른 영상 품질을 설정하는 단계;
기설정된 영역이 촬영된 영상을 분석하여 감시 상황을 생성하는 단계;
상기 영상을 상기 영상의 감시 상황에 대응하는 영상 품질로 인코딩하도록 하는 비트율을 출력하는 단계; 및
상기 영상을 상기 비트율로 인코딩하는 단계
를 포함하고,
상기 영상을 상기 영상의 감시 상황에 대응하는 영상 품질로 인코딩하도록 하는 비트율을 출력하는 단계는,
영상 신호의 차영상 신호로부터 산출된 영상의 왜곡값과 인지적 영상 품질 간의 관계를 산출하되, 상기 왜곡 값과 인지적 영상 품질 간의 관계를 로지스틱 함수(logistic function)로 모델링하는 단계
를 포함하는, 인코딩 방법.
제 15 항에 있어서,
상기 영상을 상기 영상의 감시 상황에 대응하는 영상 품질로 인코딩하도록 하는 비트율을 출력하는 단계는,
상기 영상 신호의 상기 차영상 신호를 복수의 블록으로 분할하는 단계,
상기 분할된 차영상 신호를 이산 여현 변환하고, 주파수 성분 별로 상기 이산 여현 변환 계수의 히스토그램을 생성하는 단계,
상기 히스토그램에 기초하여, 상기 계수를 양자화하는 경우에 양자화 간격에 따라 발생하는 상기 계수의 왜곡 값을 예측하는 단계,
상기 히스토그램에 기초하여, 양자화 간격에 따른 영상의 발생 비트율 값을 예측하는 단계 및
상기 왜곡 값 및 상기 발생 비트율 값에 기초하여, 미리 설정된 품질의 영상으로 인코딩하기 위한 비트율 값을 산출하는 단계
를 더 포함하는 인코딩 방법.
삭제
제 16 항에 있어서,
상기 왜곡 값과 상기 인지적 영상 품질 간의 관계에 기초하여, 양자화 간격에 따른 인지적 영상 품질을 예측하는 단계
를 더 포함하며,
상기 비트율 값을 산출하는 단계는 상기 양자화 간격에 따른 인지적 영상 품질 값에 기초하여, 상기 미리 설정된 품질의 영상으로 인코딩하기 위한 비트율 값을 산출하는 것인, 인코딩 방법.
제 16 항에 있어서,
복수의 감시 상황 및 상기 감시 상황에 각각 대응하는 영상 품질을 설정하는 단계
를 더 포함하며,
상기 비트율 값을 산출하는 단계는, 상기 설정된 감시 상황에 대응하는 영상 품질로 상기 영상 신호를 인코딩하기 위한 비트율 값을 산출하는 것인, 인코딩 방법.