KR20200035380A

KR20200035380A - 비트율 제어 방법 및 이의 장치

Info

Publication number: KR20200035380A
Application number: KR1020200032237A
Authority: KR
Inventors: 이성원; 함정식
Original assignee: 광운대학교 산학협력단
Priority date: 2016-09-02
Filing date: 2020-03-16
Publication date: 2020-04-03
Also published as: KR20180026360A; KR102171227B1

Abstract

본 발명은 비트율 제어 방법 및 이의 장치에 관한 것이다. 본 발명의 일 실시예에 따른 비트율의 제어 방법은, 이전 프레임의 압축율에 기초하여 현재 프레임의 초기 양자화 레벨을 결정하는 단계; 상기 현재 프레임의 라인 압축율 및 로컬 타겟 압축율을 비교하여 현재 라인의 양자화 타입을 선택하는 단계; 상기 현재 라인의 압축 상태에 따라 양자화 레벨을 결정하는 단계; 상기 현재 라인을 기준으로 상기 현재 프레임의 양자화 레벨이 결정된 라인들 중 비압축 라인이 상기 현재 프레임 중 30% 이상인지 판단하는 단계; 상기 비압축 라인이 상기 현재 프레임 중 30% 이상인 경우, 상기 현재 라인의 고주파수 에너지 양을 기초로 하여 양자화 레벨을 수정하는 텍스트 라인 처리를 수행하는 단계; 및 상기 비압축 라인이 상기 현재 프레임 중 30% 미만인 경우, 상기 현재 라인의 양자화 레벨을 누적 압축율, 글로벌 타겟 압축율, 상기 현재 프레임 타겟 압축율, 및 상기 현재 라인의 양자화 타입을 이용하여 수정하는 잔여 라인 처리를 수행하는 단계를 포함한다.

Description

비트율 제어 방법 및 이의 장치{A METHOD OF CONTROLLING BIT RATE AND AN APPARATUS THEREFOR}

본 발명은 비트율 제어 기술에 관한 것으로서, 더욱 상세하게는, 라인별 비트율 제어 방법 및 비트율 제어 장치에 관한 것이다.

사물 인터넷 시스템(IoT)은 극히 저전력을 소비하여야 함에도 불구하고, 영상 정보를 이용하기 위한 어플리케이션 시스템에 실감형 영상, 카메라 및 디스플레이 장치의 향상된 기술, 및 영상 인식 시스템의 높은 정확도를 위한 사용자의 요구의 증가가 거세지고 있다. 초저전력 시스템은 큰 영상 데이터를 압축하고 상기 압축된 데이터를 전송함으로써 전력 소모를 감소시킬 수 있다. HEVC를 포함하는 현존하는 영상 압축 표준은 채택되는 광범위한 계산과 메모리 억세스에 의해 굉장히 많은 전력을 소비하면서 높은 압축율을 유지하고 있다.

그러므로, 사물 인터넷 시스템의 저전력 요구를 만족시키기 위하여 라인을 기초로 하는 메모리 압축 방법이 연구되었다. 또한, 엄격한 실시간 요건을 요구하는 향상된 드라이버 보조 시스템(ADAS)도 영상 데이터를 전송하기 위하여 라인을 기초로 하는 저 메모리 압축 방법에 의존하고 있다.

하나의 프레임 내에서 영상의 상단과 하단 사이의 특성 차이는 라인을 기초로 하는 영상 압축의 압축 효율을 크게 변동시키기 때문에, 영상의 하단 부분에서의 저 압축 효율에 기인하여 타겟 압축율을 만족시키기 어렵고, 압축율의 빠른 변화에 의하여 화질이 나빠질 수 있다. 누적되는 압축율을 기초로 하는 비트율 제어 방식은 타겟 압축율을 효율적으로 달성할 수는 있으나, 라인 특성의 변화를 채택함에 따라 전체 영상에 거친 영상의 화질 일관성을 보장할 수 없다. 다른 현존하는 비트율 제어 방식들도 타겟 압축율 및 영상 화질의 일관성은 가질 수 있더라도, 프레임-대-프레임 상관도를 예측하기 위한 부가적인 계산 복잡도 때문에 저 전력을 요구하는 어플리케이션에 적합하지 아니하다.

본 발명이 이루고자 하는 기술적 과제는, 저전력, 저 메모리를 사용하는 기기에서 영상의 화질 저하가 개선된 라인 기반의 비트율 제어 방법을 제공하는 것이다.

또한, 본 발명이 이루고자 하는 다른 기술적 과제는, 라인별로 압축률을 조절함으로써 제한된 리소스를 이용하여 기기에서의 디스플레이에 필요한 화질과 압축률을 유지할 수 있는 라인 기반의 비트율 제어 장치를 제공하는 것이다.

본 발명이 해결하고자 하는 과제는, 이전 프레임의 압축율에 기초하여 현재 프레임의 초기 양자화 레벨을 결정하는 단계; 상기 현재 프레임의 라인 압축율 및 로컬 타겟 압축율을 비교하여 다음 라인의 양자화 타입을 선택하는 단계; 상기 라인의 압축 상태에 따라 양자화 레벨을 결정하는 단계; 비압축 라인의 비율에 따라 잔여 라인 또는 텍스트 라인을 처리하는 단계를 포함한다.

상기 잔여 라인 또는 텍스트 라인을 처리하는 단계는, 상기 비압축 라인의 비율이 상기 현재 프레임 내에서 30% 이상인지 여부에 따라, 상기 현재 프레임 내에서 30% 이상인 경우, 상기 텍스트 라인을 처리하고, 상기 현재 프레임 내에서 30% 미만인 경우에는 상기 잔여 라인을 처리할 수 있다.

일 실시예에서, 상기 텍스트 라인을 처리하는 단계는, 상기 텍스트 라인의 가독력을 향상시키기 위하여 양자화 레벨을 조절할 수 있다. 상기 텍스트 라인을 처리하는 단계 이후에, 상기 텍스트 라인이 마지막 라인인지 판단하는 단계를 더 포함하고, 상기 텍스트 라인이 마지막 라인이 아닌 경우, 상기 양자화 타입을 선택하는 단계를 반복 수행할 수 있다.

상기 다음 라인의 양자화 타입은 현재 라인의 압축율, 로컬 타겟 압축율, 누적 압축율, 이전 라인들의 양자화 레벨, 및 최상위 양자화 타입의 제한 수 중 적어도 하나 이상을 이용하여 결정될 수 있다. 상기 잔여 라인을 처리하는 단계에서는 누적 압축율, 로컬 타겟 압축율, 및 현재 라인의 양자화 타입 중 적어도 하나 이상을 이용하여 다음 라인의 양자화 레벨을 결정할 수 있다.

일 실시예에서, 상기 텍스트 라인을 처리하는 단계는 일차원 DWT 의 적어도 일부의 라인들을 이용할 수 있다. 또한, 상기 텍스트 라인을 처리하는 단계는 라인들 사이의 양자화 레벨의 차이를 감소시키도록 상기 양자화 레벨을 조절할 수 있다.

본 발명이 해결하고자 하는 다른 과제는, 이전 프레임의 압축율에 기초하여 현재 프레임의 초기 양자화 레벨을 결정하는 초기 양자화 레벨 결정부; 상기 현재 프레임의 라인 압축율 및 로컬 타겟 압축율을 비교하여 다음 라인의 양자화 타입을 선택하는 양자화 타입 선택부; 상기 라인의 압축 상태에 따라 양자화 레벨을 결정하는 양자화 레벨 결정부; 비압축 라인의 비율에 따라 잔여 라인을 처리하는 잔여 라인 처리부; 및 비압축 라인의 비율에 따라 텍스트 라인을 처리하는 텍스트 라인 처리부를 포함한다.

상기 과제를 해결하기 위한 본 발명의 일 실시예에 따른 라인 기반의 비트율 제어 방법은, 프레임 내에서 일관적인 영상 화질을 유지하고, 다른 라인 특성에 맞춰 준비된 압축 파라미터들을 적응적으로 제어함으로써 타겟 압축율을 달성할 수 있다.

상기 과제를 해결하기 위한 본 발명의 다른 실시예에 따르면, 신호 에너지를 이용하여 텍스트 라인을 식별하고, 텍스트의 가독성을 보장할 수 있도록 적응적으로 비트율을 제어하고, 종래의 비트율 제어 방식에 비하여 나은 PSNR 피크를 가지며, 상기 PSNR 값은 어떠한 라인 메모리 또는 프레임 메모리를 이용하지 아니하여 프레임 메모리 기초 최적화된 PSNR의 값에 근접할 수 있는 라인 기반의 비트율 제어 장치를 제공할 수 있다. 또한, 본 발명의 라인 기반의 비트율 제어 방법 및 장치는 영상 영역으로부터 텍스트 영역까지 가용 비트를 재배치함으로써 텍스트의 화질이 나은 영상을 제공할 수 있다.

도 1은 본 발명의 일 실시예에 따른 라인 기반의 비트율 제어 장치의 블록도이다.
도 2는 본 발명의 일실시예에 따른 비트율 제어 방법을 나타내는 순서도이다.
도 3은 본 발명의 일실시예에 따른 비트율 제어 방법에서 다음 라인(next line)의 양자화 타입을 결정하기 위한 수도코드(pseudocode)를 도시한 것이다.
도 4는 본 발명의 일 실시예에 따른 비트율 제어 방법으로 코딩된 영상(실험예 1), 프레임 최적화된 비트율 제어 방법으로 코딩된 영상(비교예 1), 라인 최적화된 비트율 제어 방법으로 코딩된 영상(비교예 2), 베이스라인 비트율 제어 방법으로 코딩된 영상(비교예 3), Edirisinghe 및 Bedi의 비트율 제어 방법으로 코딩된 영상(비교예 4), 및 Jiang의 비트율 제어 방법으로 코딩된 영상(비교예 5)들의 PSNR 결과를 도시한 것이다.
도 5a 및 도 5b는 본 발명의 비트율 제어 방법으로 코딩된 영상(실험예 2) 및 베이스라인 비트율 제어 방법으로 코딩된 영상(비교예 6)의 라인별 PNSR의 비교 결과를 도시한 것이다.
도 6은 비교예 7의 영상 중 열화가 발생한 일부 영역을 나타낸 것이다.
도 7a는 원본 영상이고, 도 7b는 본 발명의 일 실시예에 따른 비트율 제어 방법을 적용하지 아니한 영상이며, 도 7c는 본 발명의 일 실시예에 따른 비트율 제어 방법을 적용한 영상이다.
도 8a 및 도 8b는 본 발명의 일 실시예에 따른 비트율 제어 방법을 적용한 텍스트가 포함되지 아니한 동영상과 많은 텍스트를 포함하는 동영상의 스크린 샷을 나타낸 것이다.
도 9a 내지 도 10b는 본 발명의 일 실시예에 따른 비트율 제어 방법을 텍스트를 포함하거나 포함하지 아니하는 영상 시퀀스에 적용한 후, 이들의 프레임 압축율 결과값과 PSNR을 나타내는 것이다.

이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 상세히 설명하기로 한다.

본 발명의 실시예들은 당해 기술 분야에서 통상의 지식을 가진 자에게 본 발명을 더욱 완전하게 설명하기 위하여 제공되는 것이며, 하기 실시예는 여러 가지 다른 형태로 변형될 수 있으며, 본 발명의 범위가 하기 실시예에 한정되는 것은 아니다. 오히려, 이들 실시예는 본 개시를 더욱 충실하고 완전하게 하고, 당업자에게 본 발명의 사상을 완전하게 전달하기 위하여 제공되는 것이다.

도면에서 동일 부호는 동일한 요소를 지칭한다. 또한, 본 명세서에서 사용된 바와 같이, 용어 "및/또는"은 해당 열거된 항목 중 어느 하나 및 하나 이상의 모든 조합을 포함한다.

본 명세서에서 사용된 용어는 실시예를 설명하기 위하여 사용되며, 본 발명의 범위를 제한하기 위한 것이 아니다. 또한, 본 명세서에서 단수로 기재되어 있다 하더라도, 문맥상 단수를 분명히 지적하는 것이 아니라면, 복수의 형태를 포함할 수 있다. 또한, 본 명세서에서 사용되는 "포함한다(comprise)" 및/또는 "포함하는(comprising)"이란 용어는 언급한 형상들, 숫자, 단계, 동작, 부재, 요소 및/또는 이들 그룹의 존재를 특정하는 것이며, 다른 형상, 숫자, 동작, 부재, 요소 및/또는 그룹들의 존재 또는 부가를 배제하는 것이 아니다.

이하, 실시예들을 첨부된 도면을 참조하여 상세하게 설명한다. 실시예들을 설명함에 있어 관련된 공지 기능 또는 구성에 관한 구체적인 설명이 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는, 그에 관한 상세한 설명은 생략할 것이다.

일실시예에 따른 라인 기반의 비트율 제어 방법은 비트율 제어 장치에 의해 수행될 수 있다. 각 도면에 제시된 동일한 참조부호는 동일한 부재를 나타낸다.

최근 모바일 기기 사용자들의 고해상도 디스플레이를 이용한 어플리케이션 사용이 증가하고 있다. 이로 인해, 디스플레이로 인한 파워 소비가 증가하고 있다. 디스플레이에서는 전력 및 하드웨어 용량 한계로 MPEG과 H.264/AVC와 같은 프레임 단위의 압축 방법을 사용하기 어려워 라인 단위 압축 방법과 그에 따른 BRC이 연구되었다.

누적 라인 압축률을 이용하는 BRC는 라인간 압축 특성의 변화를 알아차리기 쉽지 않아 화면 전체에 일관된 화질을 보장하지 못한다. 또한 2개의 라인 압축률의 기울기를 이용하는 BRC는 다음 라인의 압축률을 예측하는 데 있어 정확성이 떨어져 프레임 메모리 overflow가 생기는 문제가 있다. 그리고 기존의 라인 단위 JPEG2000을 위한 BRC는 2-D 기반의 압축 시스템이고 프레임간 유사성을 예측하기 위해 추가적인 계산량이 필요하므로 저복잡도 BRC가 요구되는 DDI에 적합하지 않다.

본 발명에서는 화면 전체에 일관된 화질을 유지하는 새로운 라인 기반의 BRC를 제안하였다. 또한 모바일 환경과 모니터기기에서 텍스트 영상이 많은 비중을 차지하는 것을 고려하여 고주파의 에너지를 분석하여 텍스트 라인을 검출하고 적응적인 비트율 제어를 적용한다. 이를 통해 텍스트를 포함하는 영상에서도 높은 화질을 보장한다.

본 발명의 일 실시예에 따른 라인 기반의 비트율 제어 방법 및 장치는 종래의 라인 기반의 비트율 제어 방법 및 장치에서의 단점을 극복할 수 있는 일관성 있는 좋은 화질을 보장하는 비트율 제어 방법 및 장치를 제안한다.

도 1 은 본 발명의 일 실시예에 따른 라인 기반의 비트율 제어 장치의 블록도이다.

도 1을 참조하면, 라인 기반의 비트율 제어 장치는 주파수 적응 라인 압축부(10) 및 비트율 제어부(20)를 포함할 수 있다. 주파수 적응 라인 압축부(10)는 디스플레이 장치를 위한 라인 기반의 압축 기술 중 하나를 이용할 수 있다. 상기 기술은 저전력 모바일 디스플레이 장치에서 채택될 수 있는 이산 웨이브렛 변환(DWTs)를 기초로 할 수 있고, 예측 코딩과 같은 낮은 복잡도의 알고리즘을 이용할 수 있다. 일 실시예에서, 압축율의 세밀한 제어를 위하여, 주파수 적응 라인 압축부(10)에서의 양자화 파라미터의 개수는 16개에서 89개로 증가하였다.

비트율 제어부(20)는 주파수 적응 라인 압축부(10)에서 결합될 수 있다. 일 실시예에서, 비트율 제어부(20)에 전송 포맷과 주파수 서플러 유닛(미도시)이 포함될 수 있다. 상기 전송 포맷은 기설정된 방법에 따라 주파수 성분을 서플렁함으로써 전송 버퍼 크기를 최소화하도록 설계될 수 있다. 또한, 고주파수 필터는 텍스트를 포함하는 라인들을 식별하기 위하여 구현될 수 있으며, 이로 인하여 적절한 압축율 및 텍스트의 퀄리티를 가질 수 있다.

도 2는 본 발명의 일실시예에 따른 비트율을 제어하는 방법을 나타내는 순서도이다.

도 2를 참조하면, 초기화 단계(initialization stage, S10)에서는 이전 프레임의 압축율에 기초하여 현재 프레임의 초기 양자화 레벨(initial quantization level)을 결정할 수 있다. 전체 영상 중 현재 프레임과 가장 유사한 프레임은 이전 프레임이기 때문에, 상기 이전 프레임의 압축율을 이용하여 상기 현재 프레임의 초기 양자화 레벨을 결정한다.

이후, 현재 프레임의 라인 압축율(line compression ratio) 및 로컬 타겟 압축율(local target compression ratio) 을 비교하여 다음 라인의 양자화 타입을 선택할 수 있다(S20). 또한, 양자화 레벨 결정 단계(S30)에서 양자화 레벨은 상기 라인의 압축 상태에 따라 결정될 수 있다.

비압축된 라인의 비율이 현재 프레임 내에서 30% 이상인지를 판단(S40)하여, 30% 미만인 경우에는 잔여 라인 처리 단계(S50)에서 잔여 라인들은 글로벌 타겟 압축율을 만족하도록 처리될 수 있다. 만일 비압축된 라인의 비율이 현재 프레임 내에서 30% 미만인 경우, 양자화 레벨은 버퍼가 오버플로우(overflow)되는 것을 방지하기 위하여 제어될 수 있다. 만일 비압축된 라인의 비율이 30% 이상인 경우에는, 텍스트 라인 처리 단계(S60)가 수행된다.

텍스트 라인 처리 단계(S60)는 텍스트들을 포함하는 라인을 식별하고, 텍스트의 가독력(legibility)을 향상시키기 위하여 양자화 레벨을 조절할 수 있다. 텍스트 라인 처리가 완료된 후, 현재 라인이 마지막 라인인지 판단(S70)하고, 마지막 라인인 경우 종료하며, 마지막 라인이 아닌 경우는, 양자화 타입 선택 단계(S20)를 수행할 수 있다. 이후, 초기 양자화 레벨 단계(S10)를 제외한 모든 단계들은 모든 라인에서 반복될 수 있다.

새로운 프레임 영상과 함께 장면들이 변경되는 경우, 프레임의 특성 변환으로 이하여 타겟 압축율을 놓칠 수 있다. 본 발명에서는 비트율 제어의 정확성을 향상시키기 위하여 타겟 압축율과 이전 프레임에서의 결정된 타겟 압축율의 차이에 기초하여 현재 프레임의 타겟 압축율을 적응적으로 조절할 수 있다.

연속적인 프레임들에서 시간적 유사도는 현재 프레임의 새로운 타겟 압축율을 결정할 수 있다. 이전 타겟 압축율에 비하여 상기 결정된 타겟 압축율이 낮거나 높은지 여부에 따라, 이전 프레임의 압축율은 결함 상태(deficiency state) 또는 과잉 상태(surplus state)로 구별될 수 있다. 만일 상기 이전 프레임의 압축율이 결함 상태라면 본 발명의 일 실시예에 따른 비트율 제어 방법은 반복되는 오버플로 발생을 방지하기 위하여 현재 프레임의 타겟 압축율을 높일 수 있다. 반대로, 과잉 상태라면, 본 발명의 비트율 제어 방법은 필요 이상의 이미지 화질의 열화를 방지하기 위하여 현재 프레임의 타겟 압축율을 낮출 수 있다. 상기 타겟 압축율을 높이거나 낮추는 정도는 경험적으로 결정될 수 있다.

하기 표 1은 현재 프레임의 타겟 압축율이 어떻게 선택되는지를 나타내는 것이다. 글로벌 타겟 압축율(GTCR)은 모든 이미지 시퀀스를 위한 타겟 압축율을 나타내며, 프레임 압출율(FCR)은 이전 프레임의 결과적인 타겟 압축율을 나타내는다. 로컬 타겟 압축율(LTCT)은 상기 글로벌 타겟 압축율과 상기 프레임 타겟 압축율 사이의 차이를 고려한 일시적 타겟 압축율을 나타낸다. 상기 글로벌 타겟 압축율보다 높은 값은 상위 타겟 압축율이라고 정의하며, 상기 상위 타겟 압축율보다 높은 값은 최상위 타겟 압축율이라고 지칭하기로 한다. 하기 수학식 1은 압축율의 정의를 나타낸다.

이전 프레임의 비트율 제어 방법의 결과			현재 프레임의 비트율 제어에 대한 새로운 설정
BRC 상태	이전 프레임 타겟 압축율(PFCR) 및 로컬 타겟 압축율(PLTCR)의 범위		케이스	오버플로	현재 LTCR
	이전 FCR	이전 LTCR
결함 상태 (PFCR<GTCR)	근접 범위 내	PLTCR≤상위 TCR	(1-1)		상위 TCR
	근접 범위 밖	PLTCR≥상위 TCR	(1-2)	허용	최상위 TCR
				허용 X	LTCR++
과잉 상태 (PFCR≥TCR)		PLTCR≤ PFCR	(1-3)		LTCR-
		PLTCR ≤PFCR	(1-4)		PLTCR

표 2는 현재 프레임이 오버플로를 허용하는 경우, 현재 프레임의 타겟 압축율이 어떻게 결정되는지에 대한 예시이다. 예를 들어, 일 실시예에서, 글로벌 타겟 압축율이 3.0 이고, 상위 타겟 압축율이 3.05 이며, 최상위 타겟 압축율이 3.1 이고, 근접 범위가 [2.97 : 3.00] 일 수 있다. 상기 표 1을 참조하여 표 2의 (2-1) 케이스를 살펴보면, 이전 프레임 압축율(PFCR)이 상기 글로벌 타겟 압축율(FTCR)보다 낮고, 근접 범위 내이며, 이전 로컬 타겟 압축율(PLTCR)이 상위 타겟 압축율보다 작다.

Case	PLTCR	PFCR	Current LTCR
(2-1)	PLTCR≤3.05	2.07≤PFCR〈3.00	3.05
(2-2)	PLTCR≤3.05	PFCR〈2.97	3.10
(2-3)	PLTCR〉3/05	PFCR〈3.00	3.10

표 1에서 (1-1) 케이스와 같이 압축율이 결함 상태로 판단되면, 현재 프레임의 타겟 압축율은 상기 상위 타겟 압축율로 결정될 수 있다. (2-3) 케이스는 이전 프레임의 로컬 타겟 압축율이 상위 타겟 압축율보다 크고, 이전 프레임 압축율이 글로벌 타겟 압축율보다 작기 때문에, 상기 표 1의 (1-2) 케이스에 따라 현재 프레임의 로컬 타겟 압축율이 결정될 수 있다. 만일 오버플로가 허용되면 로컬 타겟 압축율은 상위 타겟 압축율 값(3.5)으로 결정될 굿이다.

양자화 타입 선택 단계(S20)는 4 개의 양자화 타입(Q-type) 중 하나의 타입이 현재 라인의 양자화 레벨로서 적응적으로 결정될 수 있다. 상기 4 개의 양자화 타입은 하위-Q, 중간-Q, 상위-Q, 최상위-Q 일 수 있따. 각 타입은 압축율 위한 양자화 파라미터들로 표현되는 많은 양자화 레벨들을 포함할 수 있다. 상기 최상위-Q 타입은 정상화된 양자화 파라미터들 갖는 압축율이 매우 낮은 이미지를 위한 특별한 타입일 수 있다. 하기 표 3은 양자화 타입들(Q-Types)의 압축율들과 그들의 양자화 레벨들을 나타낸 것이다. 여기서, 각각의 압축율은 많은 샘플 영상들로부터 측정된 평균 압축율일 수 있다.

	High-Q	Middle-Q	Low-Q		Super-Q
QL	CR	CR	CR	QL	CR
0	1.820	2.051	2.511	73	2.554
1	1.888	2.229	2.733	74	2.653
2	1.921	2.306	2.813	75	2.793
3	1.958	2.352	2.854	76	3.049
...	...	...	...	...	...
69	3.437	4.257	4.827	85	4.360
70	3.522	4.302	4.845	86	4.455
71	3.628	4.414	4.970	87	4.561
72	3.663	4.452	5.019	88	4.636

양자화 레벨의 수는 표 3의 상기 평균 압축율이 양자화 레벨에 비례하여 선형적으로 증가하도록 설계될 수 있다. 그러나, 평균값을 이용하기 때문에 일부 비선형적인 값들이 존재할 수 있다. 일 실시예에서, 다음 라인의 양자화 타입을 결정하기 위하여, 현재 라인의 압축율, 로컬 타겟 압축율, 및 누적 압축율이 고려될 수 있다. 그러나, 글로벌 파라미터들만을 다음 라인의 양자화 타입을 결정하기 위하여 이용하는 경우, 부적절한 양자화 타입이 결정될 수 있다. 따라서, 본 발명의 일 실시예에 따른 비트율 제어 방법은 현재 라인의 압축율, 적어도 10 개 이상의 이전 라인들의 양자화 레벨, 및 최상위-Q 타입의 제한수에 의하여 결정될 수 있다.

도 3는 다음 라인의 양자화 타입을 결정하기 위한 수도코드(pseudocode)를 도시한 것이다. 만일 제한 수(limit count)가 역치의 상한값(UP_TH)에 다다르는 경우, 다음 라인의 양자화 타입은 최상위_Q로 결정될 수 있다. 일 실시예에서, 제한 수가 역치의 하한값(DOWN_TH)에 다다르는 경우에는 다음 라인의 양자화 타입은 현재 라인과 동일한 양자화 레벨을 갖는 현재 라인의 압축율에 가까운 압축율을 갖는 타입으로 결정될 수 있다. 제한 수를 이용하는 것은 영상의 화질을 열화시키므로, 만일 잔여 라인의 수가 전체 프레임의 30% 미만인 경우에는 최상위_Q를 위한 제한 수는 이용되지 아니한다.

양자화 레벨 결정 단계(S30)에서, 영상은 일반적으로 텍스트를 다량 포함하는 모바일 및 데스크탑 환경에서 출력되므로, 출발 양자화 레벨은 경험적으로 출발 상수로 설정될 수 있다. 두 번째 프레임부터는 이전 프레임 내의 평균 양자화 레벨 값을 출발 양자화 레벨로 설정할 수 있다. 출발 양자화 레벨은 하기 수학식 2와 같이 표현될 수 있다.

양자화 레벨 결정시, 다음 라인의 양자화 레벨은 현재 라인 압축율(LCR)에 의하여 결정될 수 있다. 다름 라인의 양자화 레벨이 결정되기 이전에, 현재 라인의 상태는 라인 압축율들 사이의 차이에 기초하여 유지 상태(Steady State) 또는 장면 변경 상태(Scene Change State)로 구별될 수 있다. 상기 유지 상태에서는 이전 및 현재 라인의 양자화 타입이 동일하므로, 양자화 레벨은 다음 수학식 3와 같이 결정될 수 있다.

상기 장면 변경 상태는 현재 라인의 압축율이 현저하게 변경되는 경우 선택될 수 있다. 상기 장면 변경 상태에서는, 양자화 타입 선택 단계(S20)에서 결정된 양자화 타입이 결정될 수 있다. 하기 수학식 4는 다름 라인의 양자화 레벨이 어떻게 결정되는지를 나타내는 것이다. 그리고, 하기 수학식 5는 양자화 스텝의 크기를 산출하는 수학식이다.

상기 수학식 4에서 QL_Base 는 로컬 타겟율의 달성을 허용하는 양자화 레벨을 지칭하고, 상기 수학식 5의 오프셋(offset)은 양자화 타입 표에서의 모든 압축율의 평균 기울기를 나타낸다.

잔여 라인 처리 단계(S50)는 만일 현재 프레임에서 압축되지 아니한 라인들이 40% 미만인 경우, 이미지의 화질이 열화됨에도 불구하고, 양자화 레벨을 메모리의 오버플로를 방지하기 위하여 조절할 수 있다. 누적되는 압축율(CCR), 로컬 타겟 압축율, 및 현재 라인의 양자화 타입이 다름 라인을 위한 양자화 레벨을 조절하기 위하여 고려될 수 있다. 하기 수학식 6은 양자화 레벨의 결정 방법을 나타내며, 파라미터 α은 경험적으로 결정될 수 있다.

텍스트 라인 처리 단계(S60)는 현재 프레임이 텍스트를 포함하는 경우, 텍스트의 가독력을 향상시키기 위하여 양자화 레벨을 조절할 수 있다. 2-D DWT에 기초하는 종래의 방법과는 달리, 본 발명의 일 실시예에 따른 비트율 제어 방법은 1-D DWT의 일부 라인들을 이용할 수 있다. 텍스트 라인을 낮은 복잡도로 처리하기 위하여, 본 발명은 일부 라인들에 걸친 고주파수의 에너지들을 조사할 수 있다. 또한, 일 실시예에서, 텍스트 라인들을 조사하기 위해 4-레벨 DWT 인코더의 H1 밴드의 FIR(finite impulse response) 하이패스 필터에 의하여 고주파수의 신호들이 선택될 수 있다.

이후, 고주파수의 에너지의 양은 측정되어 수직상의 텍스트 경계를 찾기 위하여 두 개의 이전 라인들의 측정된 에너지를 저장하는 히스토리 버퍼에 저장될 수 있다. 만일 히스토리 버퍼에 저장되는 에너지 데이터가 텍스트 에너지의 역치 값을 초과하는 경우, 다음 라인의 양자화 레벨은 하기 수학식 7에서 결정되는 특정 값에서 제한될 것이며, 이는 텍스트의 가독성을 보증할 수 있다. 텍스트 라인들을 위한 최대 양자화 레벨은 경험에 의해 QL_TEXT로 설정될 수 있다.

본 발명의 일 실시예에 따른 비트율 제어 방법의 향상도를 측정하기 위하여, 다음과 같이 실험을 진행하였다. 이 경우, 타겟 프레임 압축율은 3.0으로 설정하였다. 상기 비교 측정은 본 발명의 라인 레벨에서 결정된 압축율을 이용한 본 발명의 비트율 제어 방법과 프레임 레벨에서 최적화된 비트율 제어 방법의 결과를 비교함으로써 측정되었다. 텍스트 영역에서의 주관적인 영상의 화질은 그래픽과 텍스트 모두를 포함하는 이미지와 함께 테스트되었으며, 본 발명의 알고리즘은 영상과 함께 테스트되었다.

도 4는 본 발명의 일 실시예에 따른 비트율 제어 방법으로 코딩된 영상(실험예 1), 프레임 최적화된 비트율 제어 방법으로 코딩된 영상(비교예 1), 라인 최적화된 비트율 제어 방법으로 코딩된 영상(비교예 2), 베이스라인 비트율 제어 방법으로 코딩된 영상(비교예 3), Edirisinghe 및 Bedi의 비트율 제어 방법으로 코딩된 영상(비교예 4), 및 Jiang의 비트율 제어 방법으로 코딩된 영상(비교예 5)들의 PSNR 결과를 도시한 것이다.

도 4를 참조하면, 본 발명의 비트율 제어 방법으로 코딩된 실험예 1 영상은 평균적으로 비교예 3의 영상보다 1.5771 dB, 비교예 4의 영상보다 2.5254 dB, 및 비교예 5의 영상보다 6.4309 dB 만큼 PSNR이 높았다. 비교예 3의 평균은 타겟 프레임 압축율을 만족하는 이미지만을 이용하여 산출되었다. 또한, 실험예 1의 PSNR은 평균적으로 비교예 1의 영상보다 1.4592 dB 낮았고, 비교예 2의 영상보다 1.5821 dB 낮았다.

이에 따르면, 본 발명의 비트율 제어 방법을 적용한 영상은 타겟 프레임 압축율을 만족시키기 위한 어떠한 전지적인 정보 없이 두 개의 최적화된 비트율 제어 방법에 의한 영상(비교예 1 및 비교예 2)에 가까운 PSNR을 유지함을 알 수 있다. 그리고, 일부에서는 비교예 1에 의한 영상을 능가하는 화질을 보여준다.

한편, 비교예 3의 영상은 적절한 화질을 유지하지 못하였다. 도 5a 및 도 5b는 본 발명의 비트율 제어 방법으로 코딩된 영상(실험예 2) 및 베이스라인 비트율 제어 방법으로 코딩된 영상(비교예 6)의 라인별 PNSR의 비교 결과를 도시한 것이다.

도 5a를 참조하면, 비교예 6의 영상은 일정한 영상의 화질을 유지하지 못하는 것을 알 수 있다. 매우 작은 PSNR 값을 갖는 영상 중 비교예 6의 영상이 실험예 2의 영상보다 뛰어난 경우는 몇몇의 경우였다. 그러나, 비교예 6의 영상은 양자화 레벨을 변경할 수 있는 범위가 작기 때문에, 압축하기가 어렵다. 만일 양자화 레벨의 작은 차이라도 증가한다면, 비교예 6의 영상의 화질은 도 5b에서 나타나는 것과 같이 변동을 거듭할 것이다.

표 4는 타겟 프레임 압축율이 2.0, 3.0, 및 4.0 일 때의 본 발명의 일 실시예에 따른 영상(실험예 3), Edirisinghe 및 Bedi의 비트율 제어 방법에 따른 영상(비교예 7), Jiang의 비트율 제어 방법에 따른 영상(비교예 8), 베이스라인 비트율 제어 방법에 따른 영상(비교예 9), 프레임 최적화된 비트율 제어 방법에 따른 영상(비교예 10), 및 라인 최적화된 비트율 제어 방법에 따른 영상(비교예 11)의 비교 결과를 설명한 것이다. 비교를 위하여, 베이스 양자화 레벨 및 로컬 타겟 압축율과 같은 압축율과 관련된 일부 파라미터들은 타겟 프레임 압축율과 동일하게 설정하였다. 표 4에서 각 PSNR은 타겟 압축율을 만족시키는 압축된 영상들의 평균 PSNR이다.

비트율	평균 프레임 압축율			타겟 압축율을 만족시키못하는 프레임의 수			평균 PSNR
	타겟 프레임 압축율			타겟 프레임 압축율			타겟 프로엠 압축율
	2.0	3.0	4.0	2.0	3.0	4.0	2.0	3.0	4.0
실험예 3	2.05	3.01	4.03	0	0	0	52.2	41.3	36.0
비교예 7	2.02	3.00	4.01	0	0	0	50.7	38.8	33.5
비교예 8	4.18	4.37	4.47	0	0	0	34.9	35.2	35.2(34.8)
비교예 9	2.04	3.00	3.94	0	0	0	49.0	40.1	37.0(37.0)
비교예 10	2.05	3.04	4.03	0	0	0	53.2	42.6	37.0
비교예 11	2.00	3.00	4.00	0	0	0	54.0	42.9	37.4

표 4를 참조하면, 타겟 프레임 압축율 4.0에서 실험예 3 및 비교예 9를 제외한 모든 비교예들은 평균 프레임 압축율이 대응하는 타겟 프레임 압축율을 만족했다. 비교예 8은 Jiang의 비트율 제어 방법에서의 타겟 압축율 예측의 비정확성 때문에, 다른 비트율 제어 방법에 의한 영상들 보다 압축율이 클 수 있다. 결과적으로, 비교예 8의 방법에 의하여 복원된 영상은 34.9 내지 35.2 dB 사이의 작은 PSNR 평균값을 가질 수 있다. 본 발명의 일 실시예에 따른 비트율 제어 방법은 프레임 압축율이 3.0인 경우 영상의 화질을 유지하도록 설계되었기 때문에, 프레임 압축율이 4.0 인 경우를 만족시키는 것이 보증되지는 아니한다. 그러나, 프레임 압축율 4.0을 만족시키는 영상을 위해 실험예 3의 평균 PSNR은 비교예 7의 경우보다 2.4 dB 만큼 좋을 수 있다. 또한, 도 6에 도시된 바와 같이, 비교예 7의 영상은 일부 영역에서 영상의 열화가 발생함을 확인할 수 있다.

표 5는 실험예 4의 영상과 비교예 12 내지 16의 영상의 제작을 위한 하드웨어 리소스들을 비교한 것이다. 표 5를 참조하면, 상기 하드웨어 리소스들은 메모리 리소스(memory resource) 및 부가(addition)와 같은 컴퓨팅 리소스(computational resource)들로 비교될 수 있다. 표 5에서 N은 영상의 높이를 나타내고, K는 최적화를 위한 반복의 수를 나타낸다.

비트율	Addition	Shift	Memory
실험예 4	26N	N	0
비교예 12	11N	0	0
비교예 13	14N	2N	0
비교예 14	2N	0	0
비교예 15	K*2N	0	1 Frame Memory
비교예 16	K*(4N²+10N)	0	1 Frame Memory

비교예 15 및 16은 프레임 메모리를 이용하고 타겟 압축율을 만족시키는 동안 최적화된 양자화 레벨을 결정하기 위하여 영상을 K번 반복 스캔하였다. 한편, 실험예 4 및 다른 비교예들은 어떠한 프레임 메모리도 이용하지 아니하고, 비교예 15 및 16보다 적은 컴퓨팅 리소스들을 이용하였다. 또한, 실험예 4는 초기화, 양자화 타입 선택, 잔여 라인 처리, 및 텍스트 라인 처리 단계들에 의하여 비교예 12 내지 14의 경우보다 더 많은 컴퓨팅 리소스들을 이용하였다. 그러나, 실험예 4의 영상은, 도 4 및 6에 나타난 바와 같이, 주관적인 것은 물론 객관적으로도 비교예 12 내지 16의 영상보다 좋은 화질을 가짐을 확인할 수 있다.

본 발명의 일 실시예에 따른 비트율 제어 방법 중 텍스트 라인 처리는 많은 고주파 성분들과 유사한 비율의 텍스트를 갖는 영상으로 구성된 몇 개의 영상들로 평가되었다. 도 7a 내지 도 7c는 복호화된 프레임에서 확대된 텍스트 영역들을 비교한 것이다. 도 7a는 원본 영상이고, 도 7b는 본 발명의 일 실시예에 따른 비트율 제어 방법을 적용하지 아니한 영상이며, 도 7c는 본 발명의 일 실시예에 따른 비트율 제어 방법을 적용한 영상이다.

도 7a 내지 도 7c를 참조하면, 라인들 사이의 양자화 레벨의 다양성에 기인하여, 본 발명의 텍스트 라인 처리가 적용되지 아니한 도 7b의 영상에서는 열화가 발생되는 것을 확인할 수 있다. 한편, 도 7c에서 나타난 바와 같이, 텍스트 라인 처리가 적용된 텍스트 영상에서는 화질의 열화가 거의 나타내지 않았다. 이와 같이, 본 발명의 텍스트 라인 처리는 라인들 사이의 양자화 레벨의 급격한 변화를 방지함으로써, 화질을 열화를 감소시키는 효과를 제공할 수 있다.

본 발명의 일 실시예에 따른 비트율 제어 방법을 텍스트가 포함되지 아니한 1920 x 1080 해상도의 동영상과 많은 텍스트를 포함하는 1024 x 874 해상도의 동영상을 이용하여 평가하였으며, 상기 동영상의 스크린 샷을 도 8a 및 도 8b에 도시하였다.

이전 프레임의 압축 결과는 초기화 단계에서 고려되므로, 본 발명의 일 실시예에 따른 비트율 제어 방법의 성과는 적응적인 타겟 압축율 초기화가 없는 비트율 제어 방법의 성과와 비교될 수 있다. 도 9a 내지 도 10b는 텍스트를 포함하거나 포함하지 아니하는 영상 시퀀스를 이용한 비트율 제어 방법을 위한 프레임 압축율 결과값과 PSNR을 나타내는 것이다.

도 9a 내지 도 10b에서 나타난 바와 같이, 적응적인 로컬 타겟 압축율 초기화 없이 비트율 제어 방법이 적용되는 경우, 많은 프레임들에서 프레임 압축율들이 3.0의 프레임 압축율에 도달하지 못하는 결과를 보였다. 그러나, 본 발명의 비트율 제어 방법을 따르는 영상의 압축율은 한 프레임을 제외하고는 모두 프레임 압축율이 3.0이 도달함을 알 수 있다. 증가되는 프레임 압축율이 PSNR을 감소시키더라도, 본 발명의 비트율 제어 방법이 적용되는 영상의 상기 PSNR 값은, 도 9b 및 도 10b에서 나타난 바와 같이, 적응적인 로컬 타겟 압축율 초기화가 없었던 비트율 제어 방법에 의한 영상들의 PSNR 값에 가까운 것을 알 수 있다.

이와 같이, 본 발명의 일 실시예에 따른 비트율 제어 방법은, 각 라인별로 압축율을 결정하고, 화질을 유지하는 동안 타겟 프레임 압축율을 만족시키기 위하여 적은 양의 하드웨어를 이용할 수 있다. 영상 시퀀스의 다양한 타입을 다루기 위하여, 본 발명의 일 실시예에 따른 비트율 제어 방법은 적절한 양자화 레벨들을 포함하는 여러가지 양자화 타입들을 이용할 수 있다. 또한, 모바일 및 데스크탑 환경을 위해 영상 내의 텍스트의 가독성을 향상시키기 위하여 텍스트 라인 처리 알고리즘을 적용할 수 있다.

본 발명의 비트율 제어 방법의 PSNR은 최적화된 비트율 제어 방법의 PSNR 값에 가까울 수 있으며, 텍스트 라인 처리가 없는 방법에 비하여 텍스트의 가독성을 향상시킬 수 있다. 이전 프레임의 압축율의 간단한 데이터를 이용함으로써, 본 발명의 비트율 제어 방법은 영상 화질에 가능한 적은 열화를 발생시키면서 타겟 프레임 압축율에서 압축율의 결과값을 성공적으로 유지시킬 수 있다.

이상에서 설명한 본 발명이 전술한 실시예 및 첨부된 도면에 한정되지 않으며, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러가지 치환, 변형 및 변경이 가능하다는 것은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 명백할 것이다.

Claims

이전 프레임의 압축율에 기초하여 현재 프레임의 초기 양자화 레벨을 결정하는 단계;
상기 현재 프레임의 라인 압축율 및 로컬 타겟 압축율을 비교하여 현재 라인의 양자화 타입을 선택하는 단계;
상기 현재 라인의 압축 상태에 따라 양자화 레벨을 결정하는 단계;
상기 현재 라인을 기준으로 상기 현재 프레임의 양자화 레벨이 결정된 라인들 중 비압축 라인이 상기 현재 프레임 중 30% 이상인지 판단하는 단계;
상기 비압축 라인이 상기 현재 프레임 중 30% 이상인 경우, 상기 현재 라인의 고주파수 에너지 양을 기초로 하여 양자화 레벨을 수정하는 텍스트 라인 처리를 수행하는 단계; 및
상기 비압축 라인이 상기 현재 프레임 중 30% 미만인 경우, 상기 현재 라인의 양자화 레벨을 누적 압축율, 글로벌 타겟 압축율, 상기 현재 프레임 타겟 압축율, 및 상기 현재 라인의 양자화 타입을 이용하여 수정하는 잔여 라인 처리를 수행하는 단계를 포함하는 비트율의 제어 방법.
제 1 항에 있어서,
상기 텍스트 라인 처리를 수행하는 단계 또는 상기 잔여 라인 처리를 수행하는 단계 이후에, 상기 현재 라인이 마지막 라인인지 판단하는 단계를 더 포함하고,
상기 현재 라인이 마지막 라인이 아닌 경우, 상기 양자화 타입을 선택하는 단계를 반복 수행하는 비트율의 제어 방법.
제 1 항에 있어서,
상기 현재 라인의 양자화 타입은 현재 라인의 압축율, 로컬 타겟 압축율, 누적 압축율, 이전 라인들의 양자화 레벨, 및 최상위 양자화 타입의 제한 수 중 적어도 하나 이상을 이용하여 결정되는 비트율의 제어 방법.
제 1 항에 있어서,
상기 텍스트 라인 처리를 수행하는 단계는 일차원 DWT 의 적어도 일부의 라인들을 이용하는 비트율의 제어 방법.
제 4 항에 있어서,
상기 텍스트 라인 처리를 수행하는 단계는 라인들 사이의 양자화 레벨의 차이를 감소시키도록 상기 양자화 레벨을 조절하는 비트율의 제어 방법.
이전 프레임의 압축율에 기초하여 현재 프레임의 초기 양자화 레벨을 결정하는 초기 양자화 레벨 결정부;
상기 현재 프레임의 라인 압축율 및 로컬 타겟 압축율을 비교하여 현재 라인의 양자화 타입을 선택하는 양자화 타입 선택부;
상기 현재 라인의 압축 상태에 따라 양자화 레벨을 결정하는 양자화 레벨 결정부;
상기 현재 라인을 기준으로 상기 현재 프레임의 양자화 레벨이 결정된 라인들 중 비압축 라인이 상기 현재 프레임 중 30% 이상인지 여부를 판단하는 비압축 라인 비율 판단부;
상기 비압축 라인이 상기 현재 프레임 중 30% 미만인 경우, 상기 현재 라인의 양자화 레벨을 누적 압축율, 글로벌 타겟 압축율, 상기 현재 프레임 타겟 압축율, 및 상기 현재 라인의 양자화 타입을 이용하여 수정하는 잔여 라인 처리부; 및
상기 비압축 라인이 상기 현재 프레임 중 30% 미만인 경우, 상기 현재 라인의 양자화 레벨을 누적 압축율, 글로벌 타겟 압축율, 상기 현재 프레임 타겟 압축율, 및 상기 현재 라인의 양자화 타입을 이용하여 수정하는 텍스트 라인 처리부를 포함하는 비트율의 제어 장치.
제 6 항에 있어서,
상기 양자화 타입 선택부는 현재 라인의 압축율, 로컬 타겟 압축율, 누적 압축율, 이전 라인들의 양자화 레벨, 및 최상위 양자화 타입의 제한 수 중 적어도 하나 이상을 이용하여 상기 양자화 타입을 결정하는 비트율의 제어 장치.
제 6 항에 있어서,
상기 현재 라인이 마지막 라인인지를 판단하는 현재 라인 판단부를 더 포함하는 비트율의 제어 장치.
제 6 항에 있어서,
상기 텍스트 라인 처리부는 일차원 DWT의 적어도 일부 라인들을 이용하는 비트율의 제어 장치.
제 9 항에 있어서,
상기 텍스트 라인 처리부는 라인들 사이의 양자화 레벨의 차이를 감소시키도록 상기 양자화 레벨을 조절하는 비트율의 제어 장치.