KR100788704B1 - 영상 변환 방법 및 그 장치 - Google Patents

영상 변환 방법 및 그 장치 Download PDF

Info

Publication number
KR100788704B1
KR100788704B1 KR1020060113047A KR20060113047A KR100788704B1 KR 100788704 B1 KR100788704 B1 KR 100788704B1 KR 1020060113047 A KR1020060113047 A KR 1020060113047A KR 20060113047 A KR20060113047 A KR 20060113047A KR 100788704 B1 KR100788704 B1 KR 100788704B1
Authority
KR
South Korea
Prior art keywords
image frame
background
input image
converting
foreground
Prior art date
Application number
KR1020060113047A
Other languages
English (en)
Inventor
김소영
이재출
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020060113047A priority Critical patent/KR100788704B1/ko
Application granted granted Critical
Publication of KR100788704B1 publication Critical patent/KR100788704B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 발명은 영상의 변환시에 입력된 영상 프레임에 대하여 배경(background)과 전경(foreground)을 분리하고 각각에 대하여 서로 다른 변환 알고리즘을 적용하여 영상 프레임 내의 블록을 주파수 영역으로 변환하는 영상 변환 방법에 관한 것으로서, 입력된 영상 프레임에 대하여 움직임 여부를 검출하는 단계와 검출된 움직임 여부에 따라서 입력된 영상 프레임을 배경과 전경으로 분리하는 단계와 분리된 배경과 전경에 대하여 서로 다른 변환 알고리즘을 적용하여 입력된 영상 프레임 내의 블록을 주파수 영역으로 변환하는 단계를 포함하여, 변환 과정에서 발생하는 오버헤드 및 비트율의 증가를 최소화하고 보다 고효율 압축된 부호화 영상 데이터 스트림을 제공한다.

Description

영상 변환 방법 및 그 장치{Method for transforming image and apparatus thereof}
도 1은 일반적인 동영상 부호화 장치를 나타내는 도면이다.
도 2는 N×N DCT 에 대한 표준 기본 패턴(basis pattern)을 나타내는 도면이다.
도 3은 본 발명의 일 실시예에 따른 영상 변환 방법을 설명하기 위한 플로우 차트이다.
도 4는 본 발명의 일 실시예에 따른 영상 변환 방법을 구체적으로 나타내는 플로우 차트이다.
도 5는 본 발명의 다른 실시예에 따른 영상 변환 장치를 나타내는 기능 블록도이다.
본 발명은 영상의 변환 방법에 관한 것으로, 보다 구체적으로는 입력된 영상 프레임에 대하여 배경(background)과 전경(foreground)으로 분리하고 각각에 서로 다른 변환 알고리즘을 적용하여 영상 프레임 내의 블록을 주파수 영역으로 변환하 는 영상 변환 방법 및 장치에 관한 것이다.
디지털 TV와 DVD-비디오가 등장함에 따라서 방송 서비스 및 홈 엔터테인먼트(home entertainment) 서비스가 크게 변화하여, 이러한 방송 서비스 및 홈 엔터테인먼트 서비스에서 제공되는 여러 가지 응용 서비스는 비디오 압축 기술의 표준화에 의해 가능하게 되었는데, 이러한 비디오 압축 기술에 관한 표준들에는 MPEG 2, MPEG 4, H.264, VC 1 등이 있다. 하지만, 보다 고품질(high-quality) 및 저속 비트율(low bit-rate)의 비디오 서비스를 제공하기 위해서는, 기존의 압축 효율을 향상시킨 개선된 영상 압축 기법이 요구된다.
도 1은 일반적인 영상 부호화 장치를 나타내는 도면이다.
먼저, DCT(Discrete Cosine Transform) 변환부(110)는 공간적 상관성을 제거하기 위해 블록 단위로 입력되는 영상 데이터에 대해 DCT 연산을 수행하고, 양자화부(Quantization: Q)(120)는 변환부(110)에서 얻어진 DCT 계수에 대해 양자화를 수행하여 몇 개의 대표값으로 표현함으로써, 고효율 손실 압축을 수행한다.
역양자화부(Inverse Quantization: IQ)(130)는 양자화부(120)에서 양자화된 영상 데이터를 역양자화한다. 역변환부(140)는 역양자화부(130)에서 역양자화된 영상 데이터에 대해 IDCT(Inverse Discrete Cosine Transform), 즉 역변환을 수행하고, 프레임 메모리부(150)는 역변환부(140)에서 역변환된 영상 데이터를 프레임 단위로 저장한다.
움직임 추정 및 보상부(Motion Estimation and Compensation: ME/MC)(160)는 입력되는 현재 프레임의 영상 데이터와 프레임 메모리부(150)에 저장된 이전 프레 임의 영상 데이터를 이용하여 매크로 블록당 움직임 벡터(MV)와 블록정합오차(block matching error)에 해당하는 SAD(sum of absolute difference)를 추정한다.
가변 길이 부호화부(variable length coding: VLC)(170)는 DCT 및 양자화 처리된 데이터에서 통계적 중복성을 제거한다.
위와 같은 이미지와 비디오 등의 영상 압축 장치에서 사용되는 변환 기법과 관련하여 지금껏 많은 변환 알고리즘이 제안되어 왔다. 가장 널리 사용되는 변환 알고리즘은 블록 기반 변환과 이미지 기반 변환의 두 가지 종류로 나누어진다. 여기서 블록 기반 변환의 예로는 카루넨-루베 변환(Karhuhen-Loeve Transform, 이하 "KLT"라고 함), Singular Value Decomposition(SVD) 및 이산 여현 변환(Discrete Cosine Transform, 이하 "DCT"라고 함) 등이 있다.
이러한 변환에서 변환을 통해 얻은 계수들이 영상 프레임에 관계없이 분포하고, 변환 계수들의 숫자가 줄어들어 압축 효과를 높이는 것이 중요하다. 즉, 변환후에 양자화부(120)를 통한 양자화 단계에서 최소의 손실을 끌어내기 위해서는 프레임의 중요정보들이 변환된 이후 몇몇의 계수에 집중적으로 분포되도록 하는 것이 중요한데, 이러한 조건을 최대한 만족하는 변환 알고리즘이 KLT 이다.
KLT 는 이론적으로 영상신호의 에너지 집중특성이 가장 뛰어나 압축에 가장 최적화된 이상적인 변환 방법으로 알려져 있으나, 입력 신호의 통계적 특성에 의존하여 입력 영상에 따라 변환함수가 새로 정의되어야 하고, 연산 알고리즘이 복잡하여 영상을 실시간으로 부호화, 복호화하는 장치에 적용하기에는 어려움이 있었다.
따라서 본 발명은 상기와 같은 문제점을 해결하기 위하여 고안된 것으로, 본 발명이 이루고자 하는 기술적 과제는 입력된 영상 프레임에 대하여 배경과 전경으로 분리하고 각각에 서로 다른 변환 알고리즘을 적용하여 영상 프레임 내의 블록을 주파수 영역으로 변환하는 영상 변환 방법 및 장치를 제공하는 것이다.
상기 기술적 과제는 본 발명에 따라, 영상의 변환 방법에 있어서, 입력된 영상 프레임에 대하여 움직임 여부를 검출하는 단계와; 상기 검출된 움직임 여부에 따라서 상기 입력된 영상 프레임을 배경과 전경으로 분리하는 단계와; 상기 분리된 배경과 전경에 대하여 서로 다른 변환 알고리즘을 적용하여 상기 입력된 영상 프레임 내의 블록을 주파수 영역으로 변환하는 단계를 포함하는 것을 특징으로 하는 영상 변환 방법에 의해 달성된다.
또한 상기 변환하는 단계는, 상기 분리된 배경에 KLT(Karhunen-Loeve transform) 변환 알고리즘을 적용하는 것이 바람직하다.
아울러, 상기 변환하는 단계는, 상기 입력된 영상 프레임의 이전 영상 프레임의 기저벡터(basis vector)를 이용하여 KLT 변환 알고리즘을 적용하는 것이 더욱 바람직하다.
본 발명의 다른 분야에 따르면, 상기 목적은 입력된 영상 프레임에 대하여 움직임 여부를 검출하고 상기 검출된 움직임 여부에 따라서 상기 입력된 영상 프레임을 배경과 전경으로 분리하는 분류기와; 상기 분류기로부터 분리된 상기 전경에 DCT 변환 알고리즘을 적용하여 주파수 영역으로 변환하는 제 1변환부와; 상기 분류기로부터 분리된 상기 배경에 KLT 변환 알고리즘을 적용하여 주파수 영역으로 변환하는 제 2변환부를 포함하는 것을 특징으로 하는 영상 변환 장치에 의해서도 달성된다.
또한 상기 분류기는, 상기 움직임을 검출함에 있어서 상기 입력된 영상 프레임과 이전의 프레임간의 휘도 차이값을 소정의 임계값과 비교하여 상기 입력된 영상 프레임 내의 화소의 움직임 여부를 결정하는 것이 바람직하다.
이하 첨부된 도면을 참조하여 본 발명의 바람직한 실시예에 대해 상세히 설명한다.
도 2는 N×N DCT 에 대한 표준 기본 패턴(basis pattern)을 나타내는 도면이다.
도 2를 참조하여 DCT 변환 과정을 개괄적으로 살펴보면, DCT 는 입력 영상 프레임(210)을 저주파와 고주파 성분으로 분류한다. DCT 변환 결과 저주파 성분에 에너지가 집중되어 양자화 수행시 고주파 성분이 쉽게 제거될 수 있다. 인간의 시각은 고주파 성분의 손실보다 저주파 성분의 손실에 더욱 민감하기 때문에 고주파 성분을 제거하더라도 큰 화질의 열화없이 영상 압축이 가능하다는 점을 이용한 것이다.
보다 자세히 설명하면, DCT 는 N×N 입력 블록에 대해서 열 방향 변환(column-wise transform) 및 행 방향 변환(row-wise transform)을 수행하여 N×N 계수 블록을 생성한다. N×N 입력 블록을 x, N×N DCT 변환 행렬을 A, Y를 N×N 계수 블록이라고 하면, 순방향 DCT 는 Y=AxAT와 같이 정의된다. 첫 번째 행렬 곱셈 Ax는 N×N 입력 블록인 x의 각 열(column)에 대해서 1차원 DCT 를 수행하는 것에 해당되며, Ax에 이항 행렬 AT를 곱하는 것은 x의 각 행(row)에 대해 1차원 DCT 를 수행하는 것에 해당된다.
N×N DCT 변환 행렬 A의 (i,k)의 성분 αik는 다음의 수학식 1과 같다.
Figure 112006083688519-pat00001
(i,k=0,...,N-1 ,
Figure 112006083688519-pat00002
,
Figure 112006083688519-pat00003
)
N×N 입력 블록에 대해서 DCT 를 수행하면 DCT 계수들로 구성된 N×N 계수 블록이 생성된다. 이러한 DCT 계수들은 도 2에 도시된 바와 같은 표준 기본 패턴 집합(220)의 가중치에 해당된다. 표준 기본 패턴(220)은 수평 코사인 함수와 수직 코사인 함수의 조합으로 구성되어 있다. 영상 블록은 표준 기본 패턴의 각 패턴에 대응되는 DCT 계수를 곱한 다음 각 패턴들을 결합함으로써 재구성될 수 있다. 이와 같은 DCT 변환 알고리즘은 아래에서 살펴볼 분리된 전경(foreground)에 대해 적용될 수 있다.
도 3은 본 발명의 일 실시예에 따른 영상 변환 방법을 설명하기 위한 플로우 차트이다.
영상 변환 방법의 흐름을 보면, 먼저 입력 영상 프레임의 움직임을 검출하고(310), 이로부터 영상 프레임의 배경(background)과 전경(foreground)을 분리한 다음(320), 변환 알고리즘을 이용하여 변환을 수행한다(330).
단계 310에서, 입력 영상 프레임의 움직임을 검출하는 것은 영상 프레임 내에서 배경 부분과 전경 부분을 구분하기 위함이다. 만약 입력 영상 프레임에서 배경과 전경을 구분할 수 있는 정보가 포함되어 있는 등의 다른 방법을 이용할 수 있다면 움직임을 검출하는 단계에서 이를 이용할 수도 있다.
영상 프레임 내의 움직임을 검출하기 위한 방법으로 연속된 두 프레임간의 휘도 차이를 구한 후, 실험으로 정한 임계값을 이용하여 임계값 보다 낮은 휘도 차이를 가진 부분은 움직임이 없는 배경으로 구별하고, 임계값 보다 큰 휘도 차이를 가진 부분은 움직임이 있는 객체로써 구별하는 차분영상법, 현재 프레임 탐색영역 안에서 이전 프레임의 지정된 블록과 가장 유사한 블록을 찾아 움직임 여부를 판단하는 블록정합기법 등을 이용할 수 있다.
단계 320에서는, 상기 단계 310에서 검출된 움직임 여부에 따라서 프레임 내의 배경과 전경을 분리한다. 전경(foreground)이란, 배경에 반대되는 용어로서 움직임을 갖고 있는 객체와 같이 배경이외의 부분을 일컫는다. 배경과 전경을 분리하는 이유는 배경과 전경에 대해 별도의 서로 다른 변환 알고리즘을 적용하기 위함이다. 즉, 프레임에서 배경 부분과 전경 부분이 가지고 있는 특성에 가장 적합한 알고리즘을 각기 적용함으로서 최대의 효율을 갖는 변환 결과를 도출하고 궁극적으로 영상 부호화 효율을 극대화 시킬 수 있도록 하기 위함이다. 적용될 수 있는 변 환 알고리즘들은 예를 들어, 널리 알려진 카루넨-루베 변환(Karhuhen-Loeve Transform), Singular Value Decomposition(SVD), 이산 여현 변환(Discrete Cosine Transform,), 정수 변환(Integer Transform) 등이 있다.
단계 330에서는, 분리된 배경과 전경에 대해 변환 알고리즘을 적용하여 변환한다. 즉, 상기 언급된 바와 같은 변환 알고리즘을 분리된 배경과 전경에 각각 적용하여 변환 계수를 산출하게 된다.
이하, 본 발명의 일 예로서, 배경 부분에 대해서 KLT 변환 알고리즘을 적용하는 동작 과정을 자세히 살펴본다.
도 4는 본 발명의 일 실시예에 따른 영상 변환 방법을 구체적으로 나타내는 플로우 차트이다.
도 4를 참조하면, 상기 도 3과 같이 먼저 입력 영상 프레임 내에서의 배경 부분과 전경 부분을 구분하기 위해 입력 영상 프레임의 움직임을 검출한다(410). 상기 언급한 바와 같이, 만약 입력 영상 프레임에서 배경과 전경을 구분할 수 있는 정보가 별도로 포함되어 있는 등의 다른 방법이 구비된다면 단계 410에서 이를 이용할 수도 있다.
그런 다음, 상기 도 3의 과정과 동일하게 상기 검출된 움직임 여부에 따라서 프레임 내의 배경과 전경을 분리한다(420).
분리된 배경에 대해서, KLT 를 적용한다. KLT는 직교 변환 부호화 방식의 하나로서, 시간축의 화상 신호를 주파수축으로 변환하여 부호화하는 변환 부호화 방식 중에서 입력 신호의 성질에 따라서 최적화한 변환 방식이다. 블록화된 화상 신호의 고유 행렬을 구하고, 이 행렬을 사용하여 직교 변환을 하기 때문에 변환된 신호 사이에는 상관이 없다. KLT는 벡터 표현의 통계적 특성에 기반을 두고 있다. 배경 부분에 KLT 변환 알고리즘을 적용하는 이유는, 입력 영상 프레임의 통계적 특성에 기초하여 가장 최적화된 압축을 위한 변환 효율을 갖는 KLT 라고 하더라도, 통계적 특성이 거의 없는 레지듀(residue) 신호에서는 DCT 와 비슷한 성능을 갖기 때문이다. 아울러, 프레임에서 화소값의 변화량이 큰 경우에 고유 행렬을 구하여 블록마다 적용한다 하더라도 이는 전체 프레임의 통계적 특성을 부분적인 특성을 가진 블록에 적용한 것이기 때문에 KLT 를 상대적으로 움직임이 많은 전경에 적용하는 경우 성능이 좋지 못하기 때문이다.
배경 부분에 대하여 KLT 가 적용되는 동작과정은 크게 배경에 대하여 공분산 행렬(covariance matrix)을 계산하고(430), 계산된 공분산 행렬로부터 기저 벡터(basis vector)를 계산하여(440), 입력 영상의 블록 단위로 변환 계수를 산출하는 과정(450)으로 구성된다. 즉, KLT는 입력 벡터들의 공분산 행렬을 구하고, 이의 고유값에 따라 고유벡터를 정렬하여 변환행렬로 사용하는데 자세한 과정을 보면 다음과 같다.
아래의 수학식 2와 같은 형태를 갖는 블록 단위 화소값의 모집단이 있을 때,
Figure 112006083688519-pat00004
이 모집단의 평균 벡터(mean vector)는 다음 수학식 3과 같이 정의된다
Figure 112006083688519-pat00005
E{arg} 는 arg는 기대값(expected value)이다.
벡터 모집단의 공분산 행렬(covariance matrix)은 다음 수학식 4과 같다.
Figure 112006083688519-pat00006
T 는 벡터의 전치(transposition)를 나타내며 X 는 n차이고, Cx 와 (X-mx)(X-mx)T 는 n×n 차이다. 행렬 Cx의 원소 cij 는 벡터들의 원소인 xi와 xj간의 공분산이 되고, Cx는 실수값을 가지며 대칭이 되고, xi와 xj가 상관성이 없다면 이 원소들의 공분산은 0이며, 따라서 cij=cji=0 이 된다.
공분산 행렬을 표현하면 다음 수학식 5와 같다.
Figure 112006083688519-pat00007
여기서,
Figure 112006083688519-pat00008
이고, Cx가 대칭행렬의 성질을 만족할 때, n개의 고유벡터(eigen vector)는 항상 구할 수 있다. 고유벡터들과 대응되는 고유값(eigen value), i의 크기에 따라 고유벡터등을 정렬하여 새로운 행렬 A를 만들어 이를 변환행렬로 사용하여 벡터 x를 y로 변환하는 KLT식을 만들 수 있다.
Figure 112006083688519-pat00009
변환을 통해 얻어진 y벡터는 다음의 특성을 갖는다. y벡터의 평균은 0이 되고, 둘째, 아래 수학식 6과 같이 공분산 행렬은 Cx로부터 구한 고유값만으로 이루어진 대각 행렬이 된다. 이것은 KLT가 이산변수를 상관관계가 0인 계수로 변환한다는 것을 의미하며, 이 때 CxCy 는 동일한 고유값과 고유벡터를 갖는다.
Figure 112006083688519-pat00010
아래 수학식 7,8은 KLT의 역변환을 유도한 것이며 K개의 가장 큰 고유값에 해당하는 고유벡터만을 사용하여 적은 오차만으로 복원이 가능함을 보여 준다.
Figure 112006083688519-pat00011
Figure 112006083688519-pat00012
x와 hat x의 평균제곱의 오차는 아래 수학식 9로 나타낼 수 있다.
Figure 112006083688519-pat00013
여기서 K의 크기를 적절하게 선택하기 위해서 전체 고유값의 합에 대한 특정 고유값의 상대적 비율을 이용한다. 임의의 고유해 λi의 기여도 di는 다음 수학식 10과 같다.
Figure 112006083688519-pat00014
이렇게 구한 기여도 di 값 중에서 비교적 큰 값을 갖는 개수에 따라 적절한 K를 결정한다. 이러한 과정을 통해 알 수 있듯이, 현재 입력된 영상 프레임에서 얻은 입력 영상의 벡터로부터 구한 공분산 행렬의 고유 벡터가 기저 벡터이다.
나머지 분리된 전경 부분에는 예컨대 적은 연산량으로 압축 효율이 뛰어난 DCT 변환 알고리즘이 적용될 수 있다.
다시 말해서, 움직임이 있는 객체인 전경 부분에 대해서는 움직임 추정(motion estimation) 및 움직임 보상(motion compensation)이 적용되어 산출된 레지듀 신호를 가지고 DCT 변환하고, 배경 부분에 대해서는 원영상의 블록 단위 화소값을 가지고 KLT 변환을 수행하게 된다. 따라서, 상대적으로 연산 속도가 빠른 DCT 변환을 전경에 적용하고, 보다 압축 변환 효율이 뛰어난 KLT 변환을 배경에 적용함으로써 부호화 과정에 있어서 전체적으로 압축 효율을 향상시킬 수 있다.
한편, 매 프레임마다 기저 벡터를 구하는 것은 오버헤드가 증가하고, 이를 전송하기 위해 비트율(bit-rate)이 증가할 수 있으므로 이전 영상 프레임의 기저 벡터를 현재 입력된 영상 프레임의 KLT 변환에서 기저 벡터로 이용할 수도 있다.
또한 장면 전환(scene change)이 일어나는 경우, 장면 전환된 최초 프레임의 기저 벡터만을 구한 후, 동일한 장면 그룹에 속하는 이후의 프레임의 기저 벡터는 최초 프레임의 기저 벡터를 이용할 수도 있다.
KLT 변환 계수는 입력 신호값에 의존하고, 입력 신호는 실질적으로 통계적 정상상태가 아니므로 공분산 행렬에 대한 고유벡터를 계속해서 전송하여야하는 부담이 있다. 따라서 역변환시 현재 입력된 영상 프레임 내의 첫 번째 블록(또는 프레임 내의 다른 블록)에 대한 기저 벡터를 이용하여 그 이웃한 블록에 대한 KLT 역변환에 있어서 기저 벡터로 이용하는 방식을 적용할 수도 있다.
도 5는 본 발명의 다른 실시예에 따른 영상 변환 장치를 나타내는 기능 블록 도이다.
도 5를 참조하면, 영상 변환 장치는 크게 분류기(510)와 변환부(520)로 이루어져 있다. 분류기(510)는 현재 입력된 영상 프레임에 대하여 움직임 여부를 검출하여 검출된 움직임 여부에 따라서 배경과 전경을 분리하고, 변환부(520)은 분류기(510)로부터 분리된 배경에만 KLT 변환 알고리즘을 적용하여 영상 프레임 내의 블록을 주파수 영역으로 변환한다.
동작과정을 살펴보면, 입력 영상의 프레임이 분류기(510)로 입력되면 분류기(510)는 이상에서 살펴본 움직임 검출 방법을 통해 프레임 내의 배경 부분과 전경 부분을 분리하여 변환부(520)로 전송한다. 변환부(520)는 제 1변환부(522)와 제 2변환부(523)를 구비하는데, 전경 부분에 대한 변환 과정을 수행하는 제 1변환부(522)는 DCT 알고리즘을 사용하여 DCT 변환 계수를 산출하고, 배경 부분의 변환 과정을 수행하는 제 2변환부(523)는 KLT 알고리즘을 사용하여 KLT 변환 계수를 산출한다. 변환되어 산출된 계수는 이후 부호화 과정에서 양자화 및 엔트로피 부호화 과정에 이용된다.
본 발명에 따른 영상의 변환 방법은, 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, 자기 테이프, 플로피디스크와 같은 마그네틱 저장매체와 CD-ROM, 광 데이터 저장장치와 같은 광학적 판독매체 등이 있으며, 또한 캐리어 웨이브(예를 들어 인 터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
이상에서 설명한 바와 같이 본 발명에 의한 영상의 변환 방법 및 장치에 따르면, 입력 영상 프레임에서 움직임이 있는 객체와 분리된 배경 부분에 대해서 최적의 압축 효율을 갖는 KLT 변환을 적용함으로써, 변환 과정에서 발생하는 오버헤드 및 비트율의 증가를 최소화하고 보다 고효율 압축된 부호화 영상 데이터 스트림을 얻을 수 있는 효과가 있다.

Claims (5)

  1. 영상의 변환 방법에 있어서,
    입력된 영상 프레임에 대하여 움직임 여부를 검출하는 단계와;
    상기 검출된 움직임 여부에 따라서 상기 입력된 영상 프레임을 배경과 전경으로 분리하는 단계와;
    상기 분리된 배경과 전경에 대하여 서로 다른 변환 알고리즘을 적용하여 상기 입력된 영상 프레임 내의 블록을 주파수 영역으로 변환하는 단계를 포함하는 것을 특징으로 하는 영상 변환 방법.
  2. 제1항에 있어서,
    상기 변환하는 단계는, 상기 분리된 배경에 KLT(Karhunen-Loeve transform) 변환 알고리즘을 적용하는 것을 특징으로 하는 영상 변환 방법.
  3. 제2항에 있어서,
    상기 변환하는 단계는, 상기 입력된 영상 프레임의 이전 영상 프레임의 기저벡터(basis vector)를 이용하여 KLT 변환 알고리즘을 적용하는 것을 특징으로 하는 영상 변환 방법.
  4. 영상 변환 장치에 있어서,
    입력된 영상 프레임에 대하여 움직임 여부를 검출하고 상기 검출된 움직임 여부에 따라서 상기 입력된 영상 프레임을 배경과 전경으로 분리하는 분류기와;
    상기 분류기로부터 분리된 상기 전경에 DCT 변환 알고리즘을 적용하여 주파수 영역으로 변환하는 제 1변환부와;
    상기 분류기로부터 분리된 상기 배경에 KLT 변환 알고리즘을 적용하여 주파수 영역으로 변환하는 제 2변환부를 포함하는 것을 특징으로 하는 영상 변환 장치.
  5. 제4항에 있어서,
    상기 분류기는, 상기 움직임을 검출함에 있어서 상기 입력된 영상 프레임과 이전의 프레임간의 휘도 차이값을 소정의 임계값과 비교하여 상기 입력된 영상 프레임 내의 화소의 움직임 여부를 결정하는 것을 특징으로 하는 영상 변환 장치.
KR1020060113047A 2006-11-15 2006-11-15 영상 변환 방법 및 그 장치 KR100788704B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020060113047A KR100788704B1 (ko) 2006-11-15 2006-11-15 영상 변환 방법 및 그 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020060113047A KR100788704B1 (ko) 2006-11-15 2006-11-15 영상 변환 방법 및 그 장치

Publications (1)

Publication Number Publication Date
KR100788704B1 true KR100788704B1 (ko) 2007-12-26

Family

ID=39147992

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060113047A KR100788704B1 (ko) 2006-11-15 2006-11-15 영상 변환 방법 및 그 장치

Country Status (1)

Country Link
KR (1) KR100788704B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101475479B1 (ko) * 2013-06-27 2014-12-23 삼성중공업 주식회사 선박용 영상 데이터 처리 장치 및 방법
CN112426163A (zh) * 2019-08-26 2021-03-02 上海西门子医疗器械有限公司 X-射线医疗设备的辅助摆位方法和系统及计算机存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR960028542A (ko) * 1994-12-28 1996-07-22 김주용 영상데이타의 물체별 정보 계층별 부호화 방법
KR20000039731A (ko) * 1998-12-15 2000-07-05 안재기 영역분할기반동영상압축부호화방법및장치
KR20010019448A (ko) * 1999-08-27 2001-03-15 윤종용 영상 데이터 세그먼테이션 방법 및 장치
KR20030072909A (ko) * 2002-03-07 2003-09-19 주식회사 엘지이아이 동영상 디코더의 객체 세그멘테이션 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR960028542A (ko) * 1994-12-28 1996-07-22 김주용 영상데이타의 물체별 정보 계층별 부호화 방법
KR20000039731A (ko) * 1998-12-15 2000-07-05 안재기 영역분할기반동영상압축부호화방법및장치
KR20010019448A (ko) * 1999-08-27 2001-03-15 윤종용 영상 데이터 세그먼테이션 방법 및 장치
KR20030072909A (ko) * 2002-03-07 2003-09-19 주식회사 엘지이아이 동영상 디코더의 객체 세그멘테이션 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101475479B1 (ko) * 2013-06-27 2014-12-23 삼성중공업 주식회사 선박용 영상 데이터 처리 장치 및 방법
CN112426163A (zh) * 2019-08-26 2021-03-02 上海西门子医疗器械有限公司 X-射线医疗设备的辅助摆位方法和系统及计算机存储介质

Similar Documents

Publication Publication Date Title
EP1379000B1 (en) Signal encoding method and apparatus and decoding method and apparatus
US6625216B1 (en) Motion estimation using orthogonal transform-domain block matching
JP4601966B2 (ja) 動映像符号化及び復号化方法、並びにその装置
US5760846A (en) Apparatus for estimating motion vectors for feature points of a video signal
US7336829B2 (en) Data processing apparatus and method and recording medium
KR100772391B1 (ko) 직교 변환 및 벡터 양자화에 기반한 동영상 부호화 및복호화 방법과 이를 이용한 장치
KR101354151B1 (ko) 영상 변환 방법 및 장치, 역변환 방법 및 장치
KR100961760B1 (ko) 이산코사인변환 계수를 참조하는 움직임 추정 방법 및 장치
JP2007143176A (ja) 動きベクトルの圧縮方法
KR20050009372A (ko) 영상 잡음 제거방법 및 장치
EP2252059B1 (en) Image encoding and decoding method and device
JP2005530423A (ja) 画像鮮鋭度を符号化中に最適化する方法及びシステム
EP3335425A1 (en) Vector quantization for video coding using codebook generated by selected training signals
KR100788704B1 (ko) 영상 변환 방법 및 그 장치
CN103139563A (zh) 编码和重构像素块的方法以及相应设备
AU2001293994A1 (en) Compression of motion vectors
KR20030034923A (ko) 움직임 벡터 추정 방법 및 이에 적합한 장치
Irannejad et al. Block matching video compression based on sparse representation and dictionary learning
US20040013200A1 (en) Advanced method of coding and decoding motion vector and apparatus therefor
Kuo et al. Multiresolution video coding based on Kalman filtering motion estimation
KR101627069B1 (ko) 동영상 인코딩에서 잔차 신호에 대한 희소 변환 방법, 희소 변환을 이용한 동영상 인코딩 방법 및 희소 변환을 이용하여 부호화된 신호에 대한 디코딩 방법
KR0153984B1 (ko) 분류 벡터양자화를 이용한 영상 압축방법 및 장치
KR20180088188A (ko) 적응적 영상 변환 방법 및 장치
KR20200084971A (ko) 주파수 영역의 움직임 예측을 이용한 부호화 장치 및 방법
Gregory et al. Video compression employing algorithm using temporal blocking structures

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121129

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20131128

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20141127

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20151127

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20161129

Year of fee payment: 10

LAPS Lapse due to unpaid annual fee