KR101353289B1 - 율-왜곡 비용함수를 이용한 트랜스코딩 방법 및 이를 이용한 트랜스코더 - Google Patents

율-왜곡 비용함수를 이용한 트랜스코딩 방법 및 이를 이용한 트랜스코더 Download PDF

Info

Publication number
KR101353289B1
KR101353289B1 KR1020120073942A KR20120073942A KR101353289B1 KR 101353289 B1 KR101353289 B1 KR 101353289B1 KR 1020120073942 A KR1020120073942 A KR 1020120073942A KR 20120073942 A KR20120073942 A KR 20120073942A KR 101353289 B1 KR101353289 B1 KR 101353289B1
Authority
KR
South Korea
Prior art keywords
rate
distortion cost
motion vector
distortion
function
Prior art date
Application number
KR1020120073942A
Other languages
English (en)
Other versions
KR20140007114A (ko
Inventor
홍순기
최윤식
Original Assignee
인텔렉추얼디스커버리 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인텔렉추얼디스커버리 주식회사 filed Critical 인텔렉추얼디스커버리 주식회사
Priority to KR1020120073942A priority Critical patent/KR101353289B1/ko
Publication of KR20140007114A publication Critical patent/KR20140007114A/ko
Application granted granted Critical
Publication of KR101353289B1 publication Critical patent/KR101353289B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/567Motion estimation based on rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

트랜스코딩에 있어서, 율-왜곡 비용함수를 이용하여 움직임 벡터를 추정하는 방법 및 이를 이용한 트랜스코더가 개시된다.
본 발명에 따른 트랜스코딩 방법은 부호화된 입력 영상에서 입력 움직임 벡터의 주도적 에지 방향성에 따른 율-왜곡 비용 예측함수를 모델링하고, 상기 율-왜곡 비용 예측함수를 이용하여 율-왜곡 비용이 최소가 되는 출력 움직임 벡터를 추정한다.

Description

율-왜곡 비용함수를 이용한 트랜스코딩 방법 및 이를 이용한 트랜스코더{Transcoding method using Bitrate-Distortion cost and Transcoder using the same}
본 발명은 트랜스코딩 방법 및 이를 이용한 트랜스코더에 관한 것으로서, 보다 상세하게는 율-왜곡 비용함수를 이용한 트랜스코딩 기술과 관련된다.
디지털 비디오 신호는 아날로그 방식에 비하여 상당한 이점을 가진다. 예를 들어 디지털 비디오 신호는 정보의 왜곡 없이 데이터를 멀리 전송하고, 저장할 수 있다. 그러나, 디지털 신호는 그 방대한 양으로 인해 큰 대역폭을 필요로 하고, 큰 저장 공간을 필요로 한다. 따라서 대역폭이 제한되어있는 인터넷을 통한 비디오 방송 등에 있어서 이러한 디지털 신호의 한계는 심각한 문제가 되었다.
비디오 스트림과 같은 디지털 신호의 대역폭을 줄이기 위한 노력은 데이터 압축기술로 귀결되었다. 대표적인 예로 MPEG(Moving Pictures Expert Group)에 의해 정의된 MPEG-2를 들 수 있다. MPEG-2는 비디오 스트림에 존재하는 상당 양의 여분 정보(redundant information)를 줄여서 비디오 데이터를 압축한다. 이러한 압축기술에 의하여 디지털 비디오 신호는 현저하게 압축된다.
일반적으로 MPEG 부호화 과정은 다음과 같이 수행된다. 비디오 신호는 디지털 비디오 픽셀의 색 및 휘도 성분으로 샘플링 및 양자화 된다. 색 및 휘도 값을 나타내는 성분은 매크로블록의 구조로 저장된다. 매크로블록에 저장된 색 및 휘도 값은 이산 여현 변환(Discrete Cosine Transform; DCT)을 통하여 주파수 값으로 변환된다. DCT에 의하여 변환된 계수들은 화면의 휘도 및 색의 서로 다른 주파수를 나타낸다.
MPEG 인코딩 과정은 인간의 시각 시스템이 고주파 성분의 색 및 휘도 변화를 잘 감지하지 못한다는데 주목한다. 따라서 이러한 고주파 성분에 대해서는 비교적 덜 정밀하게 양자화를 한다. 양자화된 DCT 변환계수들은 런 레벨 코딩(RLC) 및
가변장 변환(VLC)을 거쳐서 더욱 압축되게 된다.
MPEG기준은 또한 움직임 보상 기법에 의한 추가적인 압축을 제공한다. MPEG기준에 따르면, 화면 또는 프레임은 I 프레임, P 프레임 및 B 프레임의 3가지 프레임으로 분류된다. I 프레임은 인트라 부호화된 프레임을 말하며, 다른 기준 프레임 없이 복호될 수 있다. P 프레임 및 B 프레임은 인터 부호화된 프레임을 말하며, 다른 기준 프레임을 참조하여 복호될 수 있다.
예를 들어, P 프레임 및 B 프레임은 기준 프레임에 대한 움직임을 나타내는 움직임벡터를 포함한다. MPEG에서 이러한 움직임벡터의 사용은 특히 비디오 스트림에서 대역폭을 낮추는데 크게 기여할 수 있다. 비디오 스트림에서 인접한 화면들은 상당히 유사한 경우가 많기 때문이다.
최근 들어, 상기 살펴본 MPEG와 같은 압축기법을 사용한 디지털 응용분야가 다양해져 가고 있다. 특히, 압축된 비트 스트림 상태에서 비디오 검색, 화면 내 화면(예, PIP), 비디오 결합, 비디오 편집, 전송 비트율 변환 등의 다양한 응용이 필요해 지면서 특정 비트율을 가지는 MPEG 비트 스트림을 다른 비트율로 변환시키는 트랜스코딩 기법들이 요구된다. 이러한 예로는 JPEG(Joint Photographic Coding Experts Group) 방식의 비트 스트림을 MPEG 비트 스트림으로 만들거나, 디지털 캠코더의 디지털 출력인 DV(Digital Video) 포맷을 MPEG 비트 스트림으로 변환하거나, 또는 고화질의 HD(High Definition)급 MPEG 비트 스트림을 저화질의 SD(Standard Definition)급 MPEG 비트 스트림으로 변환하는 방식 등을 들 수 있다.
트랜스코딩 알고리즘은 그 처리 영역에 따라 공간 영역 트랜스코딩과 DCT 영역의 트랜스코딩으로 나뉜다. 트랜스코딩 시에 트랜스코더는 부호화 과정에서 사용하게 될 출력 파라미터들을 효과적으로 산출하고, 이 출력 파라미터들을 이용하여 부호화 과정을 수행하게 된다. 출력 파라미터 산출 알고리즘은 주로 출력 매크로블록의 모드 및 출력 움직임벡터의 산출에 초점을 두게 된다. 왜냐하면 출력 매크로블록의 모드 및 출력 움직임벡터가 부호화 과정에서 매우 중요하게 사용되기 때문이다.
특히 고화질의 HD급 MPEG 비트 스트림을 저화질의 SD급 MPEG 비트 스트림으로 변환하는 경우와 같이 다운 사이징(downsizing)을 하는 경우는 크게 두 가지 경우로 나누어 볼 수 있다. 첫 번째는 정수 배의 스케일링을 하는 경우이고, 두 번째는 비 정수 배의 스케일링을 하는 경우이다.
특히 비 정수 배의 스케일링을 하는 경우에 있어서, 정수 배의 스케일링을 하는 경우와는 달리 각각의 입력 매크로블록들 중 출력 매크로블록과 연관되는 연관 영역과 겹치는 부분이 있는 매크로블록들이 동일한 정도로 출력 매크로블록에 영향을 주지 않기 때문에 용이하게 출력 움직임벡터를 추정하기 어렵다.
상기한 바와 같이 출력 움직임벡터를 추정하는 것은 용이하지 않고, 또한 트랜스코더의 성능에 큰 영향을 끼치기 때문에 움직임벡터 정밀화(Motion Vector Refinement)가 수행된다. 즉, 출력 움직임벡터를 보다 정확히 추정하기 위해서 먼저기준벡터를 찾고, 기준벡터를 중심으로 검색영역(search window)을 설정하여 검색 영역에서 움직임벡터 정밀화를 수행하여 보다 더 정확한 출력 움직임벡터를 찾는다.
한편, N-screen 서비스를 효율적으로 제공하기 위해서는, 고도로 집적된 멀티미디어를 클라우드 시스템에서 사용자의 단말기 상황에 맞게 실시간으로 변화시켜 제공해야 한다. 따라서 멀티미디어를 실시간으로 변환하기 위한 고속 트랜스코딩 기술이 필수적인데, 기존의 기술들은 변환시간 측면의 이득에 비하여 화질 측면에서의 손해가 너무 큰 문제점이 있었다. 따라서 기존 기술들과 유사한 변환시간을 제공하면서도 화질 측면에서는 크게 향상된 트랜스코딩 기술을 필요한 실정이다.
도 1은 종래 기술에 따른 트랜스코딩 방법의 개념도이다. 도 1에 도시된 바와 같이, 기존의 트랜스코딩은 Motion Vector Re-estimation, Motion Vector Refinement, 그리고 Fast Mode Re-decision의 세 단계로 구성된다. 각 단계는 서로 독립적인 최적화 알고리즘을 수행한다. 예를 들어, Motion Vector Re-estimation 은 mean, median 방법, K-means 방법 등의 최적화 알고리즘을 수행하고, Motion Vector Refinement은 dynamic window, asymmetric window 방법 등의 최적화 알고리즘을, Fast Mode Re-decision은 간소화된 율-왜곡 함수 방법 등의 최적화 알고리즘을 수행한다.
상기와 같은 기존의 트랜스코딩 방법은 각 단계에서 최적화된 성능을 보여주고 있지만, 전체 트랜스코딩 성능 면에서는 최적화된 효과를 보여주지 못하는 문제가 있었다.
본 발명은 상술한 종래 기술의 문제점을 해결하기 위하여, 변환 영상의 주도적인 에지 방향성을 고려하여 정확도 높은 율-왜곡 비용 예측 알고리즘을 설계하고, 이를 통해 높은 화질을 얻을 수 있는 트랜스코딩 방법 및 이를 이용한 트랜스코더를 제공하는 것을 목적으로 한다.
본 발명의 다른 목적은 종래에 독립적으로 수행되던 Motion Vector Re-estimation, Motion Vector Refinement, Fast Mode Re-decision 단계를 통합하여 최적 성능을 보여줄 수 있는 트랜스코딩 방법 및 트랜스코더를 제공하는 것이다.
본 발명의 목적은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
상술한 본 발명의 목적을 달성하기 위한 본 발명의 일 면에 따른 율-왜곡 비용함수를 이용한 트랜스코딩 방법은 부호화된 입력 영상에서 입력 움직임 벡터의 주도적 에지 방향성에 따른 율-왜곡 비용 예측함수를 모델링하는 단계와 상기 율-왜곡 비용 예측함수를 이용하여 율-왜곡 비용이 최소가 되는 출력 움직임 벡터를 추정하는 단계를 포함한다.
일 실시예에 있어서, 상기 율-왜곡 비용 예측함수를 모델링하는 단계는 상기 입력 움직임 벡터에 대한 율-왜곡 비용의 주도적인 에지 방향성을 예측하는 단계와 상기 주도적인 에지 방향성에서의 상기 입력 움직임 벡터에 대한 가중치 변수를 결정하는 단계를 포함한다.
여기서, 상기 주도적인 에지 방향성을 예측하는 단계는 상기 입력 움직임 벡터의 x축 방향 성분을 기준으로 0°, 45° 90°, 135°방향에 대한 율-왜곡 비용을 연산하는 단계를 포함할 수 있다.
상기 율-왜곡 비용 예측함수는 하기의 수학식을 포함할 수 있다.
Figure 112012054264312-pat00001
여기서, D(mv)는 움직임 벡터 mv에 대한 율-왜곡 예측 비용, mvx는 mv의 0°방향 성분, mvy는 mv의 90°방향 성분, mvx+mvy는 mv의 135°방향 성분, mvx-mvy는 mv의 45°방향 성분, α,β,γ,ζ는 mv에 대한 가중치 변수이다.
또한, 상기 가중치 변수를 결정하는 단계는 상기 입력 움직임 벡터에 대한 상기 주도적인 에지 방향성과 매칭되는 가중치 변수 집합을 선택하는 단계를 포함한다.
여기서, 상기 가중치 변수 집합은 움직임 벡터의 주도적인 에지 방향성을 변수로 하여 적응적인 값을 반환하도록 실험을 통해 데이터베이스로 기 구축되어 있는 것을 특징으로 한다.
한편, 본 발명의 일 면에 따른 율-왜곡 비용함수를 이용한 트랜스코딩 방법은 컴퓨터 프로그램으로 구현되어 컴퓨터에서 판독 가능한 기록매체에 저장될 수도 있다.
본 발명의 다른 면에 따른 율-왜곡 비용함수를 이용한 트랜스코더는 부호화된 입력 영상을 복호하는 복호화부와 상기 복호화부의 출력에서 입력 움직임 벡터에 대한 율-왜곡 비용의 주도적인 에지 방향성을 예측하는 방향성 예측부와 상기 주도적인 에지 방향성에 기초하여 율-왜곡 비용 예측함수를 모델링하는 모델링부와 상기 율-왜곡 비용 예측함수를 이용하여 율-왜곡 비용이 최소가 되는 출력 움직임 벡터를 추정하는 추정부를 포함한다.
상기 방향성 예측부는 상기 입력 움직임 벡터의 x축 방향 성분을 기준으로 0°, 45° 90°, 135°방향에 대한 율-왜곡 비용을 연한다.
일 실시예에서, 상기 모델링부는 상기 주도적인 에지 방향성에서의 상기 입력 움직임 벡터에 대한 가중치 변수를 결정한다.
다른 실시예에서 모델링부는 하기의 수학식을 포함하는 율-왜곡 비용 예측함수를 모델링한다.
Figure 112012054264312-pat00002
여기서, D(mv)는 움직임 벡터 mv에 대한 율-왜곡 예측 비용, mvx는 mv의 0°방향 성분, mvy는 mv의 90°방향 성분, mvx+mvy는 mv의 135°방향 성분, mvx-mvy는 mv의 45°방향 성분, α,β,γ,ζ는 mv에 대한 가중치 변수이다.
또한, 본 발명의 다른 면에 따른 트랜스코더는 움직임 벡터의 주도적인 에지 방향성을 변수로 하여 적응적인 값을 반환하도록 실험을 통해 기 구축된 가중치 변수 집합 데이터베이스를 저장부를 더 포함하되, 상기 모델링부는 상기 입력 움직임 벡터에 대한 상기 주도적인 에지 방향성과 매칭되는 가중치 변수 집합을 상기 데이터베이스 중에서 선택한다.
이상 상술한 바와 같이, 본 발명에 따른 트랜스코딩 방법은 변환 영상의 주도적인 에지 방향성을 고려하여 정확도 높은 율-왜곡 비용 예측 알고리즘을 설계하고, 이를 통해 트랜스코딩을 수행하므로 높은 화질을 얻을 수 있다.
도 1은 종래 기술에 따른 트랜스코딩 방법의 개념도이다.
도 2는 본 발명의 실시예에 따른 트랜스코더의 개략적인 구성을 도시한 블록 구성도이다.
도 3은 본 발명의 실시예에 따른 트랜스코딩 방법의 순서도이다.
도 4는 본 발명의 실시예에서 입력 움직임 벡터에 대한 율-왜곡 비용의 일 예를 도시한 예시도이다.
도 5는 본 발명의 실시예에서 모델링된 율-왜곡 비용 예측함수의 일 예를 도시한 예시도이다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 것이며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 한편, 본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다.
이하, 본 발명의 바람직한 실시예를 첨부된 도면들을 참조하여 상세히 설명한다. 우선 각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.
도 2는 본 발명의 실시예에 따른 트랜스코더(100)의 개략적인 구성을 도시한 블록 구성도이다.
도 2를 참조하면, 본 발명의 일 실시예에 따른 트랜스코더(100)는 복호화부(10)와, 방향성 예측부(20)와, 모델링부(30)와, 추정부(40)와 저장부(50)를 포함한다.
복호화부(10)는 입력 영상을 복호하고, 그 과정에서 움직임 벡터 추정에 필요한 정보들을 추출한다.
이 때, 복호화부(10)는 입력 매크로블록 모드, 입력 움직임 벡터 정보, DCT 계수정보, 양자화 파라미터를 추출한다. 입력 매크로블록 모드는 입력 매크로 블록들의 인트라/인터 모드, 프레임/필드 모드 및 예측방향 모드 등을 포함한다.
입력 움직임 벡터 정보는 입력 매크로블록들의 움직임 벡터들에 대한 정보이다. DCT 계수정보는 각 매크로블록마다 0인 DCT 계수의 개수 및 0이 아닌 DCT 계수의 개수를 포함한다. 양자화 파라미터는 양자화 스텝 사이즈를 포함한다.
방향성 예측부(20)는 복호화부(10)에 의해 추출된 정보 중에서, 일 실시예로서 입력 매크로블록들에 대한 움직임 벡터 정보를 이용하여 율-왜곡 비용의 주도적인 에지 방향성을 예측한다.
도 4는 본 발명의 실시예에서 입력 움직임 벡터에 대한 율-왜곡 비용의 일 예를 도시한 예시도이다. 도 4의 좌측에 도시된 도면은 입력 영상의 2번째 영상 프레임의 107번째 매크로블록의 움직임 벡터에 따른 율-왜곡 비용 그래프이고, 우측에 도시된 도면은 108번째 매크로블록의 움직임 벡터에 따른 율-왜곡 비용 그래프이다.
도 4의 도시된 도면에서 x축은 움직임 벡터의 x축 방향 성분을 기준으로 한 방향성 정보를 나타내고, y축은 방향에 따른 율-왜곡 비용의 정도를 나타낸다. 도 4의 좌측에 도시된 도면을 참조하면 mvx =0인 지점을 기준으로 굴곡이 발생함을 알 수 있고, 이로 인해 107번째 매크로블록의 움직임 벡터는 y 방향으로 에지가 있는 것을 추정할 수 있다. 이와 마찬가지 방법으로 108번째 매크로블록의 움직임 벡터는 x 방향으로 에지가 있는 것을 추정할 수 있다.
움직임 벡터에 대한 율-왜곡 비용은 다양한 방향성을 가질 수 있다. 방향성은 상대적인 개념이고, 방향성에 대한 정보를 계량화하기 위해서는 방향성을 나타내기 위한 기준이 필요하다. 본 발명에서는 일 예로 입력 움직임 벡터의 x축 방향 성분을 기준으로 한다. 전술한 바와 같이, 율-왜곡 비용은 움직임 벡터의 x축 방향 성분을 기준으로 다양한 방향성을 가질 수 있고, 이를 구체적으로 계량화하기 위해서 본 발명에서는 주도적인 에지 방향성을 입력 움직임 벡터의 x축 방향 성분을 기준으로 0°, 45° 90°, 135°방향 및 Non_Dir의 총 5가지 집합으로 분류한다.
즉, 방향성 예측부(20)는 입력 영상의 입력 움직임 벡터 각각에 대하여 입력 움직임 벡터의 x축 방향 성분을 기준으로 0°, 45° 90°, 135°방향에 대한 율-왜곡 비용을 연산한다.
모델링부(30)는 주도적인 에지 방향성에서의 입력 움직임 벡터 각각에 대한 가중치 변수를 결정하여 율-왜곡 비용 예측함수를 모델링한다. 율-왜곡 비용 예측함수는 트랜스코딩에 있어서 복호된 움직임 벡터를 재-예측하는데 사용되는 것으로서 아래의 수학식 1의 구성을 포함한다.
[수학식 1]
Figure 112012054264312-pat00003
(D(mv)는 움직임 벡터 mv에 대한 율-왜곡 예측 비용, mvx는 mv의 0°방향 성분, mvy는 mv의 90°방향 성분, mvx+mvy는 mv의 135°방향 성분, mvx-mvy는 mv의 45°방향 성분, α,β,γ,ζ는 mv에 대한 가중치 변수)
모델링부(30)는 방향성 예측부(20)에서 연산된 입력 움직임 벡터의 율-왜곡 비용을 사용하여 주도적인 에지 방향성에서의 가중치 변수를 결정한다.
만약, 입력 영상에서 특정 입력 움직임 벡터에 대한 율-왜곡 비용의 방향성을 연산한 결과, 입력 움직임 벡터의 x축 방향 성분을 기준으로 0°, 45° 90°, 135°방향에 대하여 각각 60%, 15%, 15%, 10%의 결과가 나왔다면, 이 결과와 매칭되는 가중치 변수 α,β,γ,ζ가 결정된다.
즉, 모델링부(30)는 입력 움직임 벡터 각각에 대하여 방향성 예측부(20)에서 예측한 결과를 사용하여 가중치 변수를 결정하고, 이를 이용하여 상기 수학식 1을 완성한다.
일 실시예로서, 모델링부(30)는 입력 움직임 벡터에 대한 상기 주도적인 에지 방향성과 매칭되는 가중치 변수 집합을 선택할 수 있다. 예를 들어, 저장부(50)에는 움직임 벡터의 주도적인 에지 방향성을 변수로 하여 적응적인 값을 반환하도록 실험을 통해 기 구축된 가중치 변수 집합 데이터베이스가 저장되고, 모델링부(30)는 방향성 예측부(20)에서 예측된 결과와 매칭되는 가중치 변수 집합을 데이터베이스로부터 선택할 수 있다. 도 5는 본 발명의 실시예에서 모델링된 율-왜곡 비용 예측함수의 일 예를 도시한 예시도이다.
도 5에서 모델링된 결과인 비용 예측함수는 좌측부터 시계방향으로, (α=1, β=γ=ζ=0), (β=1, α=γ=ζ=0), (γ =1, α=β=ζ=0), (ζ=1, α=β= γ=0)인 가중치 변수 집합을 가진다.
추정부(40)는 모델링부(30)에서 모델링된 율-왜곡 비용 예측함수를 이용하여 율-왜곡 비용이 최소가 되는 출력 움직임 벡터를 추정한다.
움직임 벡터 결정에 있어서, H.264/AVC는 각각의 움직임 벡터의 율-왜곡 비용(R-D cost)를 계산하여, 최소의 율-왜곡 비용을 갖는 움직임 벡터를 최적 움직임 벡터로 결정한다. 트랜스 코딩 상황에서 빠르고 정확한 움직임 벡터 결정을 위해서는 움직임 벡터 각각의 율-왜곡 비용을 이미 부호화된 입력 영상에서 빠르고 정확하게 예측할 수 있는 수단이 필요하다. 따라서, 본 발명에서는 입력 영상에서 율-왜곡 비용의 주도적인 방향성을 예측하고, 이를 이용하여 율-왜곡 비용 예측함수를 모델링하는 방법으로 빠르고 신뢰성 있는 움직임 벡터 재-예측 알고리즘을 제공한다.
도 3은 본 발명의 실시예에 따른 트랜스코딩 방법의 순서도이다.
도 3을 참조하면 먼저, 복호화부(10)는 입력 영상을 복호하고, 그 과정에서 움직임 벡터 추정에 필요한 정보들을 추출한다(S210).
이 때, 복호화부(10)는 입력 매크로블록 모드, 입력 움직임 벡터 정보, DCT 계수정보, 양자화 파라미터를 추출한다. 입력 매크로블록 모드는 입력 매크로 블록들의 인트라/인터 모드, 프레임/필드 모드 및 예측방향 모드 등을 포함한다.
다음으로, 방향성 예측부(20)는 복호화부(10)에 의해 추출된 정보 중에서, 일 실시예로서 입력 매크로블록들에 대한 움직임 벡터 정보를 이용하여 율-왜곡 비용의 주도적인 에지 방향성을 예측한다(S220).
예를 들어, 방향성 예측부(20)는 입력 움직임 벡터의 x축 방향 성분을 기준으로 0°, 45° 90°, 135°방향에 대한 율-왜곡 비용을 연산한다.
다음으로, 모델링부(30)는 주도적인 에지 방향성에서의 입력 움직임 벡터 각각에 대한 가중치 변수를 결정하여 율-왜곡 비용 예측함수를 모델링한다(S230).
모델링부(30)는 방향성 예측부(20)에서 연산된 입력 움직임 벡터의 율-왜곡 비용을 사용하여 주도적인 에지 방향성에서의 가중치 변수를 결정하여 상기 수학식 1을 완성한다.
다음으로, 추정부(40)는 모델링부(30)에서 모델링된 율-왜곡 비용 예측함수를 이용하여 율-왜곡 비용이 최소가 되는 출력 움직임 벡터를 추정한다(S240).
한편, 상술한 본 발명에 따른 영상 검색방법은 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현되는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체로는 컴퓨터 시스템에 의하여 해독될 수 있는 데이터가 저장된 모든 종류의 기록 매체를 포함한다. 예를 들어, ROM(Read Only Memory), RAM(Random Access Memory), 자기 테이프, 자기 디스크, 플래시 메모리, 광 데이터 저장장치 등이 있을 수 있다. 또한, 컴퓨터로 판독 가능한 기록매체는 컴퓨터 통신망으로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 읽을 수 있는 코드로서 저장되고 실행될 수 있다.
본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 본 발명의 보호범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구의 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

Claims (12)

  1. 부호화된 입력 영상에서 입력 움직임 벡터의 주도적 에지 방향성에 따른 율-왜곡 비용 예측함수를 모델링하는 단계; 및
    상기 율-왜곡 비용 예측함수를 이용하여 율-왜곡 비용이 최소가 되는 출력 움직임 벡터를 추정하는 단계
    를 포함하는 율-왜곡 비용함수를 이용한 트랜스코딩 방법.
  2. 제1항에 있어서, 상기 율-왜곡 비용 예측함수를 모델링하는 단계는,
    상기 입력 움직임 벡터에 대한 율-왜곡 비용의 주도적인 에지 방향성을 예측하는 단계; 및
    상기 주도적인 에지 방향성에서의 상기 입력 움직임 벡터에 대한 가중치 변수를 결정하는 단계를 포함하는 것
    인 율-왜곡 비용함수를 이용한 트랜스코딩 방법.
  3. 제2항에 있어서, 상기 주도적인 에지 방향성을 예측하는 단계는,
    상기 입력 움직임 벡터의 x축 방향 성분을 기준으로 0°, 45° 90°, 135°방향에 대한 율-왜곡 비용을 연산하는 단계를 포함하는 것
    인 율-왜곡 비용함수를 이용한 트랜스코딩 방법.
  4. 제1항에 있어서, 상기 율-왜곡 비용 예측함수는 하기의 수학식을 포함하는 것인 율-왜곡 비용함수를 이용한 트랜스코딩 방법.
    Figure 112012054264312-pat00004

    (D(mv)는 움직임 벡터 mv에 대한 율-왜곡 예측 비용, mvx는 mv의 0°방향 성분, mvy는 mv의 90°방향 성분, mvx+mvy는 mv의 135°방향 성분, mvx-mvy는 mv의 45°방향 성분, α,β,γ,ζ는 mv에 대한 가중치 변수)
  5. 제2항에 있어서, 상기 가중치 변수를 결정하는 단계는,
    상기 입력 움직임 벡터에 대한 상기 주도적인 에지 방향성과 매칭되는 가중치 변수 집합을 선택하는 단계를 포함하는 것
    인 율-왜곡 비용함수를 이용한 트랜스코딩 방법.
  6. 제5항에 있어서, 상기 가중치 변수 집합은,
    움직임 벡터의 주도적인 에지 방향성을 변수로 하여 적응적인 값을 반환하도록 실험을 통해 데이터베이스로 기 구축되어 있는 것
    인 율-왜곡 비용함수를 이용한 트랜스코딩 방법.
  7. 제1항 내지 제6항 중 어느 한 항에 기재된 트랜스코딩 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 판독 가능한 기록 매체.
  8. 부호화된 입력 영상을 복호하는 복호화부;
    상기 복호화부의 출력에서 입력 움직임 벡터에 대한 율-왜곡 비용의 주도적인 에지 방향성을 예측하는 방향성 예측부;
    상기 주도적인 에지 방향성에 기초하여 율-왜곡 비용 예측함수를 모델링하는 모델링부; 및
    상기 율-왜곡 비용 예측함수를 이용하여 율-왜곡 비용이 최소가 되는 출력 움직임 벡터를 추정하는 추정부
    를 포함하는 율-왜곡 비용함수를 이용한 트랜스코더.
  9. 제8항에 있어서, 상기 방향성 예측부는,
    상기 입력 움직임 벡터의 x축 방향 성분을 기준으로 0°, 45° 90°, 135°방향에 대한 율-왜곡 비용을 연산하는 것
    인 율-왜곡 비용함수를 이용한 트랜스코더.
  10. 제8항에 있어서, 상기 모델링부는,
    상기 주도적인 에지 방향성에서의 상기 입력 움직임 벡터에 대한 가중치 변수를 결정하는 것
    인 율-왜곡 비용함수를 이용한 트랜스코더.
  11. 제8항에 있어서, 상기 모델링부는,
    하기의 수학식을 포함하는 율-왜곡 비용 예측함수를 모델링하는 것인 율-왜곡 비용함수를 이용한 트랜스코더.
    Figure 112012054264312-pat00005

    (D(mv)는 움직임 벡터 mv에 대한 율-왜곡 예측 비용, mvx는 mv의 0°방향 성분, mvy는 mv의 90°방향 성분, mvx+mvy는 mv의 135°방향 성분, mvx-mvy는 mv의 45°방향 성분, α,β,γ,ζ는 mv에 대한 가중치 변수)
  12. 제10항에 있어서,
    움직임 벡터의 주도적인 에지 방향성을 변수로 하여 적응적인 값을 반환하도록 실험을 통해 기 구축된 가중치 변수 집합 데이터베이스를 저장부를 더 포함하되,
    상기 모델링부는 상기 입력 움직임 벡터에 대한 상기 주도적인 에지 방향성과 매칭되는 가중치 변수 집합을 상기 데이터베이스 중에서 선택하는 것
    인 율-왜곡 비용함수를 이용한 트랜스코더.
KR1020120073942A 2012-07-06 2012-07-06 율-왜곡 비용함수를 이용한 트랜스코딩 방법 및 이를 이용한 트랜스코더 KR101353289B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020120073942A KR101353289B1 (ko) 2012-07-06 2012-07-06 율-왜곡 비용함수를 이용한 트랜스코딩 방법 및 이를 이용한 트랜스코더

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120073942A KR101353289B1 (ko) 2012-07-06 2012-07-06 율-왜곡 비용함수를 이용한 트랜스코딩 방법 및 이를 이용한 트랜스코더

Publications (2)

Publication Number Publication Date
KR20140007114A KR20140007114A (ko) 2014-01-17
KR101353289B1 true KR101353289B1 (ko) 2014-01-27

Family

ID=50141689

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120073942A KR101353289B1 (ko) 2012-07-06 2012-07-06 율-왜곡 비용함수를 이용한 트랜스코딩 방법 및 이를 이용한 트랜스코더

Country Status (1)

Country Link
KR (1) KR101353289B1 (ko)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060029535A (ko) * 2004-10-02 2006-04-06 삼성전자주식회사 트랜스코딩을 위해 출력 매크로블록 모드와 출력움직임벡터를 추정하는 방법 및 이를 이용한 트랜스코더
KR100713012B1 (ko) 2004-10-18 2007-05-02 한국정보통신대학교 산학협력단 다차원 비트율 조절에 따른 비디오 트랜스코딩 방법 및 그장치
KR20080047954A (ko) * 2006-11-27 2008-05-30 한양대학교 산학협력단 Mpeg-2에서 h.264/avc로의 고속 트랜스코딩에서움직임 벡터 예측 방법 및 모드 예측 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060029535A (ko) * 2004-10-02 2006-04-06 삼성전자주식회사 트랜스코딩을 위해 출력 매크로블록 모드와 출력움직임벡터를 추정하는 방법 및 이를 이용한 트랜스코더
KR100713012B1 (ko) 2004-10-18 2007-05-02 한국정보통신대학교 산학협력단 다차원 비트율 조절에 따른 비디오 트랜스코딩 방법 및 그장치
KR20080047954A (ko) * 2006-11-27 2008-05-30 한양대학교 산학협력단 Mpeg-2에서 h.264/avc로의 고속 트랜스코딩에서움직임 벡터 예측 방법 및 모드 예측 방법

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
민경연 외 3인, "보조정보의 움직임 벡터를 이용한 분산 비디오 코딩에서 H.264/AVC로의 트랜스코딩", 방송공학회논문지, 2011년, 제16권, 제1호, pp.108-122. *

Also Published As

Publication number Publication date
KR20140007114A (ko) 2014-01-17

Similar Documents

Publication Publication Date Title
US7602851B2 (en) Intelligent differential quantization of video coding
KR100987765B1 (ko) 동영상 부호화기에서의 예측 수행 방법 및 장치
AU2007202789B2 (en) High-fidelity motion summarisation method
JP5173409B2 (ja) 符号化装置および符号化装置を備えた動画像記録システム
US20110176614A1 (en) Image processing device and method, and program
US9591313B2 (en) Video encoder with transform size preprocessing and methods for use therewith
JP4847076B2 (ja) トランスコーディングのために出力マクロブロック及び動きベクトルを推定する方法及びトランスコーダ
JP2013502140A (ja) 動きベクトルの正確度の調節を利用した映像符号化、復号化方法及び装置
US8165411B2 (en) Method of and apparatus for encoding/decoding data
JP2006109465A (ja) トランスコーディングのための精密化基盤出力動きベクトル推定方法
JP2005191706A (ja) 動画像符号化方法及びその装置
JP2004207802A (ja) 画像データ処理装置および方法、記録媒体、並びにプログラム
JP2001145113A (ja) 画像情報変換装置及び方法
KR100386583B1 (ko) 영상 변환 부호화 장치 및 방법
JP4494803B2 (ja) 動き補償に基づいた改善されたノイズ予測方法及びその装置とそれを使用した動画符号化方法及びその装置
US8699576B2 (en) Method of and apparatus for estimating motion vector based on sizes of neighboring partitions, encoder, decoding, and decoding method
KR20130103140A (ko) 영상압축 전에 행해지는 전처리 방법, 영상 압축률 개선을 위한 적응성 움직임 추정방법 및 영상 타입별 영상 데이터 제공방법
KR101353289B1 (ko) 율-왜곡 비용함수를 이용한 트랜스코딩 방법 및 이를 이용한 트랜스코더
US20130077674A1 (en) Method and apparatus for encoding moving picture
JP4243286B2 (ja) 符号化方法
US9544594B2 (en) Moving image reencoding device and moving image reencoding method
JP2003219428A (ja) 動画像符号化装置
Ibaba et al. A review of video compression optimization techniques
JP4561701B2 (ja) 動画像符号化装置
JP2008245237A (ja) 画像処理方法、画像処理装置およびそれを用いた撮像装置

Legal Events

Date Code Title Description
N231 Notification of change of applicant
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee