KR101396618B1

KR101396618B1 - 이동 물체 경계 추출

Info

Publication number: KR101396618B1
Application number: KR1020087009016A
Authority: KR
Inventors: 마르코 파니코니; 제임스 제이. 캐릭; 져롱 미아오
Original assignee: 소니 일렉트로닉스 인코포레이티드
Priority date: 2005-09-16
Filing date: 2006-09-14
Publication date: 2014-05-21
Also published as: EP1946244A2; JP2009509417A; WO2007035538A2; CN101283364A; US7596243B2; WO2007035538A3; EP1946244A4; JP5312942B2; KR20080063770A; CN101283364B; US20070065025A1; WO2007035538A8

Abstract

이동 물체 경계를 추출하는 방법은 타겟 화상과 참조 화상간의 위치의 변동에 의해 움직임이 표현되는 물체에 대한 초기 움직임 벡터를 추정하는 단계, 상기 물체가 나타나 움직이는 배경 영역에 대한 초기 벡터를 추정하는 단계, 상기 추정된 벡터들을 이용하여 다이내믹 모델 솔루션의 제1회째의 반복을 구하는 단계, 및 상기 물체의 경계를 추출하기 위하여 상기 다이내믹 모델 솔루션의 적어도 한번의 후속되는 반복을 완료하는 단계를 포함한다.

이동 물체, 경계, 배경 영역, 다이내믹 모델

Description

이동 물체 경계 추출{EXTRACTING A MOVING OBJECT BOUNDARY}

본 발명은 비디오 압축 분야에 관한 것이다.

이동 물체 추출(moving object extraction) 방법은 전통적으로 비디오 시퀀스에서 이동 물체의 윤곽(contour)을 추출하기 위해 비디오 압축 기술에서 사용된다. 전통적인 방법은 대개의 경우 명백하게 윤곽을 추출하기 위해 모델을 도입한다. 이러한 전통적인 방법은 윤곽의 이산화(discretization) 및 윤곽이 발전됨에 따라 길이와 곡률(curvature)을 조절하기 어려운 것과 같은 심각한 문제를 갖는다.

예를 들어, 예측 에러를 줄이기 위하여 움직임 블록을 단순히 영역분할(segmentation)하여 다수의 이동 물체를 캡쳐할 수 있다. 이러한 과정은 개선된 움직임 추정을 위하여 예측 에러가 큰 블록을 서브 블록으로 분할하는 쿼드트리 영역분할(quadtree segmentation)을 이용함으로써 달성될 수 있다. 예측 에러가 큰 블록은 전형적으로 이동 물체의 경계의 직선화 모델(straight line model)을 이용하여 쿼드트리 영역분할된다.

움직임 영역분할의 다른 접근법은 광류 추정(optical flow estimate) 또는 파라메트릭(parametric)(즉, 아핀(affine)) 움직임 모델에 의존한다. 이들 접근법은 물체 경계 근처에서 폐색 효과(occlusion effects)와 같은 문제를 갖는다. 영역분할 필드에서, 그리고 물체 경계에서 어느 정도의 평활도(smoothness)는 우선 확률 항(prior probability term)을 포함하는 MAP/Bayesian 방법들을 이용하여 달성될 수 있다. 이들 방법은 물체 경계 및 움직임 필드를 고려하는 어떤 명확하게 결합된 모델 없이도 영역분할 필드의 연결성(connectivity)을 제한한다.

몇몇 통상의 접근법에서, 곡률 발전 모델(curvature evolution model)은 이동 물체 경계를 캡쳐하는데 사용된다. 그러나, 이러한 접근법들은 움직임 추정을 수반하지 않으며, 물체 경계 발전을 위한 모델에서 시간차 연산자(temporal difference operator)에 의존할 뿐이다.

초기의 조건으로부터 물체를 성장시키고, 예측 에러 저감, 경계 안정성(boundary stability)(즉, 물체에 빈틈이 없고, 윤곽이 평활한 것), 및 화상 특징들과의 결합 사이에서 균형을 이룬 상태에 도달하기 위하여, 영역 경쟁(region competition)을 수행하는 이동 물체 추출 방법이 필요하다.

이동 물체 경계를 추출하는 방법은 타겟 화상과 참조 화상 간의 위치의 변동에 의해 움직임이 표현된 물체에 대한 초기 움직임 벡터를 추정하는 단계, 물체가 나타나 움직이는 배경 영역에 대한 초기 벡터를 추정하는 단계, 상기 추정된 벡터들을 이용하여 다이내믹 모델 솔루션의 제1회째의 반복을 구하는 단계, 및 상기 물체의 경계를 추출하기 위하여 상기 다이내믹 모델 솔루션의 적어도 한번의 후속되는 반복을 완료하는 단계를 포함한다.

본 발명은 예를 들어 예시되며 첨부 도면과 함께 다음의 설명을 참조함으로써 보다 잘 이해될 것이다.

도 1은 배경 영역으로부터 이동 물체 경계를 추출하는 방법의 예를 도시한다.

도 2는 다이내믹 모델을 이용하여 성장된 경계 필드의 예를 도시한다.

도 3a는 하나의 참조 화상을 다이내믹 모델로 이용할 때 발생할 수 있는 폐색의 예를 도시하며,

도 3b, 도 3c 및 도 3d는 다수의 참조 화상을 다이내믹 모델로 이용할 때 폐색을 방지하는 예를 도시한다.

도 4는 배경 움직임 필드에 대한 가설을 생성하는 방법의 예를 도시한다.

도 5는 물체 움직임 필드에 대한 가설을 생성하는 방법의 예를 도시한다.

도 6은 경계 필드 및 법선 벡터의 일부의 예를 도시한다.

도 7은 화상 커플링 드라이빙 항(image coupling driving term)의 효과의 예를 도시한다.

도 8은 물체의 출현 경계 필드의 예와 국부 경계 움직임 벡터를 도시한다.

도 9는 이동 물체 경계를 추출하는 방법을 이용하는 비디오 데이터의 화상(또는 프레임, 또는 필드)를 인코딩하는 비디오 코딩의 예를 도시한다.

도 10은 비디오 데이터의 화상(또는 프레임, 또는 필드)를 디코딩하는 예를 도시한다.

도 11은 이동 물체 경계를 추출하는 방법을 이용하는 시스템의 예를 도시한다.

다음의 설명에서, 본 명세서의 일부를 구성하는 첨부 도면이 참조되며, 첨부 도면에서 본 발명이 실시될 수 있는 특정 실시예가 예시적으로 도시된다. 다른 실시예들이 이용될 수 있으며 본 발명의 범주를 일탈함이 없이도 구조적인 변경이 이루어질 수 있음은 물론이다. 예를 들어, 숙련된 기술자들은 여러 실시예들을 기술하는데 사용되는 필드(field), 프레임(frame) 또는 화상(image) 이라는 용어가 비디오 데이터를 지칭하여 사용될 때 통상 상호 대체될 수 있음을 이해할 것이다.

물체 추출 방법은 다이내믹 모델(dynamical model)을 이용하여 물체의 경계를 발전시킴으로써 비디오 화상에 표현된 이동 전경 물체(moving foreground object)의 윤곽을 추정한다. 다이내믹 모델은 간결하고 일관된 구조가 발생하도록 해준다. 몇몇 실시예에서, 다이내믹 모델은 아무 구속없는 또는 파라미터화된 경계 모델이 필요하도록 화상 내 각 화소에서 규정된 2차원 경계 필드를 사용하여 물체 경계를 추출한다. 다이내믹 모델은 또한 국부 물체 움직임 필드를 사용하여 물체의 일정하지 않은 움직임(non-grid motion)을 설명하는 경계를 따라서 있는 움직임 벡터를 제공한다. 다이내믹 모델은 확산항(diffusion term)과 어닐링항 (annealing term)을 통합하여 경계를 화상 구배 특징과 결합한다. 물체 추출 방법은 폐색(occlusion)에 의해 야기된 에러를 최소화하기 위해 과거와 미래의 예측 에러의 가설 시험(hypothesis testing)을 실행한다. 이 방법은 물체의 경계에 있는 물체 움직임 벡터가 더욱 복잡한 국부 물체 움직임을 다룰 수 있게 해준다. 이 방법은 움직임 영역분할(motion segmentation) 또는 비디오 코딩 용도로 사용되어 타겟 화상의 개선된 시간 예측을 위해 움직임 벡터를 샘플링할 수 있다.

배경 영역으로부터 이동 물체 경계를 추출하는 방법의 일예는 도 1에 도시된 바와 같이 배경으로부터 단일 물체의 윤곽을 추출하는 것이다. 참조번호(110)에서 다이내믹 모델이 규정된다. 참조번호(120)에서 경계 필드에 대한 초기 시드(seed)가 타겟 화상의 영역에 배치된다. 참조번호(125)에서 움직임 벡터의 초기값이 결정된다. 참조번호(130)에서, 다이내믹 모델의 상태가 한 시간 스텝씩 진행하여 경계 필드를 발전시킨다. 참조번호(140)에서, 배경과 이동 물체를 나타내는 움직임 벡터들이 재추정된다. 참조번호(150)에서, 본 방법은 정지 기준(stopping criterion)에 도달했는지를 판단한다. 그렇다면, 본 방법은 160에서 종료한다. 그렇지 않다면, 본 방법은 130으로 리턴된다.

경계 필드의 다이내믹 모델( Dynamical Model for the Boundary Field )

2차원 경계 필드 B(x,y)의 다이내믹 모델이 규정되며, 여기서 B는 화상 내 위치(x,y)에서의 화소값이다. B가 양의 값이면 대응하는 화소가 물체 내에 존재함을 나타내며, 음의 값은 그 화소가 배경에 존재함을 나타낸다. 본 방법은 B(x,y)라는 초기 조건에서 시작하며 경계 필드를 반복적으로 발전시켜 보다 나은 물체 경계를 추정한다.

몇몇 실시예에서, 본 방법은 다이내믹 모델을 수치적으로 해석하고 이를 시간에 맞추어 진행시킴으로써 경계 필드를 발전시킨다. 그 다음에 경계 필드는 시간의 함수 B(x,y,t)로서 표현되며, 여기서 초기 조건 B₀(x,y)는 아래와 같도록 초기 시간 0에서 시작한다.

초기 조건은 물체내에 영역이 있는 경우 다음과 같으며,

두 상태 사이에서 점진적으로 전이가 이루어지는 경우라면, 다음과 같다.

초기 조건은, 물체 경계에 관한 사전 지식이 이용가능하다면, 그 사전지식으로 시드를 공급하여 성능을 향상시킬 수 있다. 몇몇 실시예에서, 경계 필드의 초기값은 다음과 같다.

여기서, (x₀,y₀)는 시드의 중앙이고,

는 시드의 크기를 나타낸다.

본 방법은 하기 발전 방정식을 이용하여 경계 필드 B(x,y)의 구배

주변의 시드를 성장시키며, 여기서, B(x,y)~0이고, 하기의 수학식을 이용하여 다이내믹 모델을 발전시킨다.

삭제

여기서 T는 복합 드라이빙 항(composite driving term)이며, τ는 시간 t에서 t+τ 까지의 상태로 진행하는 시간 스텝 파라미터이다. 본 방법은 컨버전스(convergence)와 같은 정지 기준에 도달할 때까지 반복된다.

다이내믹 모델에 따라 성장된 경계 필드의 일예는 도 2에 도시된다. 타겟 화상은 블록(205)에서 도시된다. 타겟 화상(205) 내 물체(202)의 경계를 결정하기 위하여, 블록(210)에서 도시된 바와 같이 시드(212)가 타겟 화상 내에 배치된다. 물체(204)의 경계를 결정하기 위하여, 블록(210)에서 도시된 바와 같이 시드(214)가 타겟 화상 내에 배치된다. 블록(220 및 230)에서 도시된 바와 같이 시드(212)의 경계가 발전되어, 흰색 영역(222)으로 표시된 물체 영역을 형성한다. 마찬가지로, 시드(214)의 경계가 발전되어, 회색 영역(224)으로 표시된 물체 영역을 형성한다. 블록(230)에서 도시된 바와 같이, 시드(214)로부터 결정된 전체 회색 물체 영역(234)은 보다 큰 부분뿐만 아니라 보다 큰 부분 내의 배경 영역에 연결되지 않은 보다 작은 부분을 갖는다. 마찬가지로, 흰색 영역으로 표시된 전체 물체 영역(232)은 약간의 연결되지 않은 부분을 갖는다. 아래에서 설명되는 안전성 드라이빙 항(stability driving term)이 사용되어 연결되지 않은 영역을 조절한다. 물체(202) 전체의 경계(242)는 블록(240)에서 도시된 바와 같이 캡쳐된다. 마찬가지로, 물체(204) 전체의 경계(244)가 캡쳐될 때까지 시드(214)의 경계가 발전된다.

수학식(2)에서 복합 드라이빙 항 T는 예측 에러, 안정성, 커플링, 및 템플릿 드라이빙 항과 같은 항들의 조합이다.

각각의 가중치 {λ_i}는 대응하는 드라이빙 항의 상대 세기를 결정한다. 과거/미래 예측 에러 드라이빙 항은 과거 및 미래 참조 화상 처리에서 발생한 에러를 포함한다. 이 드라이빙 항은, 아래에서 설명되는 바와 같이, 폐색 및 가리지 않은 영역을 설명하는 가설 시험 방법 동안 고려된다. 안전성 드라이빙 항 T_stability 는 추출된 움직임 층들이 어느 정도의 간결성(compactness)을 가지며 추출된 이동 물체 경계가 어느 정도의 연결성(connectivity)을 가지도록 B(x,y)가 평활성을 유지하는데 사용된다. 결합 드라이빙 항 T_{image_coupling} 은 화상 내에서의 공간 활동(spatial activity)과 관련된다. 예를 들어, 물체는 물체 경계와 화상 구배 간의 상관관계와 같은 국부적인 공간 활동과 상관관계를 가질 수 있다. 드라이빙 항 T_temporate 은 이용가능하다면 화상 내 경계에 관한 기존 지식을 고려한다.

수학식(3)으로부터의 드라이빙 항들의 표현을 수학식(2)의 다이내믹 모델에 삽입하면 다음과 같다.

과거 및 미래 예측 에러 드라이빙 항( Past and Future Prediction Error Driving Term )

과거 및 미래 예측 에러 드라이빙 항은 어떤 화소 위치에서 물체 움직임 벡터를 이용하는 것과 배경 움직임 벡터를 이용하는 것 간의 예측 에러 차를 나타낸다. 배경 움직임 벡터의 추정은 V_b(x,y)로 표시되고 물체 움직임 벡터는 V₀(x,y)로 표시된다. 이러한 드라이빙 항은 다음과 같이 표현된다.

여기서

는 움직임 벡터 V₀(x,y)가 사용될 때 어떤 화소 위치에서의 예측 에러이며,

는 움직임 벡터 V_b(x,y)가 사용될 때 화소 위치에서의 예측 에러이다. 이 항을 수학식(3)의 다이내믹 모델에 대입하면 이 항은 다음과 같이 된다.

그러므로, 화소 위치(x,y)에서, 만일 물체 움직임 벡터가 사용될 때 (즉,

가 양의 값일 때) 예측 에러가 더 작다면, 시간 유도함수가 양의 값이므로 B(x,y)는 증가하며, 화소는 물체를 향해 이동하여, B(x,y)가 양의 값인 화소 위치로서 표현된다. 마찬가지로, 화소 위치(x,y)에서, 배경 움직임 벡터가 사용될 때 (즉,

가 음의 값일 때) 예측 에러가 더 작다면, 시간 유도함수가 음의 값이므로 B(x,y)는 감소하며, 화소는 배경을 향해 이동하여, B(x,y)가 음의 값인 화소 위치로서 표현된다.

만일 참조 화상에서 폐색이 존재하는 경우에는 예측 에러가 증가한다. 도 3A는 단지 하나의 참조 화상이 과거 또는 미래의 화상으로 사용될 때 경계 추출 방법에 의해 생성된 폐색의 예를 도시한다. 블록(310)에서, 타겟 화상은 과거 참조 화상 내에서는 물체(315)에 의해 가려지지만 타겟 화상 내에서는 물체(315)에 의해 가려지지 않는 화소들의 폐색 영역(317)을 갖는다. 과거 참조 화상에 의존하는 폐색 영역의 결과로서, 이동 물체의 경계를 추출할 때 하나의 과거 참조 필드가 다이내믹 모델을 반복적으로 해석하기 위해 사용되었기 때문에 폐색 영역(317)에 근접한 진짜 물체 경계와의 대응이 잘못된 이동 물체 경계가 있다. 폐색의 생성을 방지하기 위하여, 폐색 영역(317) 내의 화소들이 미래 참조 화상 내에서 물체(315)에 의해 가려지지 않기 때문에 폐색 영역 내 화소들을 예측하기 위해서는, 이용가능하다면, 미래 참조 화상이 사용되어야 한다. 마찬가지로, 블록(320)에서, 폐색 영역(327)은 타겟 화상 내에서는 물체(315)에 의해 가려지지 않지만 미래 참조 화상 내에서는 물체(315)에 의해 가려지는 영역이다. 그 결과는, 이동 물체의 경계를 추출할 때 다이내믹 모델을 반복적으로 해석하기 위하여 단지 하나의 미래 참조 필드가 사용될 때 폐색 영역(327)에 근접한 진짜 물체 경계와 대응이 잘못된 이동 물체 경계이다. 그러므로, 이용가능하다면, 폐색 영역(327) 내 화소들을 예측하기 위하여 과거 참조 화상이 사용되어야 한다.

도 3a에 도시된 폐색 영역은 도 3b, 도 3c 및 도 3d에 도시된 바와 같이, 이동 물체 경계를 추출할 때 과거 및 미래 참조 화상 둘다를 사용함으로써 방지될 수 있다. 폐색을 처리하기 위하여, 과거 및 미래 움직임 정보가 사용된다. 다이내믹 모델의 반복 동안 언제라도, 물체의 성장 상태와, 물체 및 배경의 움직임은 어떤 화소들이 움직임 추정을 위해 과거 또는 미래 참조 화상을 사용하여야 하는지를 판단하기 위해 이용된다. 도 3b에 도시된 바와 같이, 미래 참조 화상(330) 및 과거 참조 화상(350)은 타겟 화상(340) 내의 이동 물체의 경계를 추출하는데 사용된다. 도 3c에 도시된 바와 같이, 다이내믹 모델은 블록(370)의 검은색 영역(341)에서 초기화되어 검은색 사각형으로 표시된 배경 영역 및 이동 물체의 경계 내 시드(342)를 생성한다. 블록(380)에서 도시된 바와 같이, 다이내믹 모델은 반복적으로 해석되어 이동 물체의 경계를 확장하여 이동 물체 영역(344)을 생성한다. 이동 물체는 타겟 화상의 우측을 향하고 있는 물체의 움직임을 보여주는 움직임 벡터(346)를 갖는다. 그러므로, 폐색 영역의 생성을 회피하기 위하여, 다이내믹 모델은 미래 참조 화상(330)을 이용하여, 점선(347) 좌측의 영역(381)에 대한 움직임 벡터 및 예측 에러를 추정하고, 과거 참조 화상(350)을 이용하여 점선(347) 우측의 영역(382)에 대한 움직임 벡터 및 예측 에러를 추정한다. 몇몇 실시예에서, 과거 참조 화상 또는 미래 참조 화상 중 어느 화상을 사용할 지의 여부는 아래에서 설명되는 바와 같이, 배경 및 물체 움직임 벡터에 대하여 가설 시험을 수행함으로써 각 화소마다 결정된다. 최종 결과는 도 3D에서 물체를 중심으로 흰색 선들로 표시된 추출된 경계(349)로서 도시되며, 이 결과는 폐색 영역 없이 생성된 것으로 보다 양호한 품질의 추출을 나타낸다.

과거 또는 미래 참조 필드를 사용할 지의 여부에 관한 보다 상세한 화소별 결정은 아래와 같이 예측 에러 드라이빙 항을 확장함으로써 이루어진다.

여기서 v^hyp는 화소 위치(x,y)에서 움직임 벡터에 대한 가설을 나타낸다. 배경 움직임 벡터에 대한 가설 시험은 도 4에 도시된 바와 같이 수행된다. 과거 또는 미래 참조 화상을 이용하여, 물체의 움직임 벡터는

또는

로 표시된다. 과거 또는 미래 참조 화상을 이용하여, 배경의 움직임 벡터는

또는

로 표시된다. 참조번호(410)에서, 만일 움직임 벡터

가 현재 물체 상태 및 움직임과 일치하고

가 일치하지 않으면, 참조번호(415)에서

를 선택한다. 그렇지 않으면, 참조번호(420)에서, 만일 움직임 벡터

가 현재 물체 상태 및 움직임과 일치하지 않고,

가 일치하면, 참조번호(425)에서

를 선택한다. 그렇지 않고, 만일 두 움직임 벡터가 일치한다면, 참조번호(435)에서 최소 예측 에러를 갖는 움직임 벡터를 선택한다.

전경 물체 움직임 벡터에 대한 가설 시험은 도 5에 도시된 바와 같이 수행된다. 참조번호(505)에서, 경계 필드 B(x,y)의 값이 수신된다. 참조번호(510)에서, B(x,y)≥S 인지를 판단한다. 그렇다면, 참조번호(520)에서,

,

를 선택한다. 그렇지 않다면, 참조번호(530)에서,

,

를 선택한다. 따라서, 만일 화소(x, y)에서 현재 상태가 화소가 물체 내에 있을 가능성이 있음을 의미하는 B(x,y)≥S이 되게 하는 값을 가지면, 본 방법은

을 이용하여 물체 움직임 벡터의 더 작은 예측 에러를 선택하는데, 이것은 물체 성장에 도움을 준다. 한편, 만일 화소(x,y)에서 현재 상태가 화소가 배경에 더욱 더 존재할 가능성이 있음을 의미하는 B(x,y)<S 이라는 값을 갖는다면, 본 방법은

을 이용하여 배경 성장에 도움이 되도록 하기 위해 물체 움직임 벡터에 대해 더 큰 예측 에러를 선택한다.

본 예에서, 파라미터 S는 0으로 설정되는데, 그 이유는 물체 및 배경이 제로 값의 B(x,y)로 분리되기 때문이다. 물체 또는 배경 움직임 벡터의 가설 선택은 현재 물체 상태 정보와 함께 과거 및 미래 참조 화상 정보를 이용하여, 폐색을 보다 양호하게 처리한다.

안정성 드라이빙 항( Stability Driving Term )

안정성 드라이빙 항은 비선형 모델로부터 간결하고, 안정한 구조가 출현하는 것을 가능하게 하고, 이 항은 다음과 같이 표현된다.

여기서

은 경계 필드의 법선 벡터이고, 다음과 같이 규정된다.

이것은 곡선의 법선인 방향이며, 여기서 B(x,y)=상수이다. 이 항을 수학식(3)에 대입하면 다음과 같다.

따라서,

가 제로가 아닌 경우, 경계 근처의 물체의 윤곽이 양의 곡률(즉, 양의 영역으로부터 외부로 향한 형상)을 가지면,

은 양의 값이며, B(x,y)는 감소하여 곡률을 일직선화한다. 마찬가지로,

가 제로가 아닌 경우, 만일 경계 근처의 물체의 윤곽이 음의 곡률(즉, 양의 영역으로부터 내부를 향하는 형상)을 가지면,

은 음의 값이며, B(x,y)는 증가하여 곡률을 일직선화한다.

안전성 드라이빙 항은 물체 경계 토폴로지의 곡률의 정도를 조절한다. 이 항은 윤곽의 길이를 줄이는 확산항(diffusion term)으로서 작용한다. 도 6은 경계 필드(610) 및 법선 벡터(620)의 일부의 예를 도시한다. 안정성 드라이빙 항은 파선(630)으로 도시된 바와 같이 경계 필드의 윤곽을 일직선화한다. 명백한 확산항은 수학식(9)에도 추가되어서, 수학식(10)에서와 같이, 작은 양 또는 음의 영역의 제거(즉, 확산)를 더욱 직접적으로 조절할 수 있다.

수학식(10)의 우측 라플라시안 항(Laplacian term)은 경계 필드를 비교적 부드럽고 동질적으로 만들어준다.

화상 커플링 드라이빙 항( Image Coupling Driving Term )

이동 물체 경계는 어떤 국부적 공간 화상 활동(local spatial image activity)과의 상관관계를 가질 수 있다. 예를 들어, 물체 경계는 대개의 경우 그 경계에 대한 법선의 강도 구배(intensity gradient)를 갖는다. 이러한 형태의 국부적 공간 활동 상관관계는 화상 커플링 드라이빙 항을 이용하는 모델에 포함된다.

여기서

은 경계 필드에 대해 법선이며,

는 화상 강도 구배의 치수이다. 이 항을 수학식(3)에 대입하면 이 팩터는 다음과 같이 된다.

따라서, 만일 화상 구배가 물체 경계의 폭에 근접하다면, 경계는 화상 구배를 따라서 정렬한다. 도 7은 화상 커플링 드라이빙 항의 영향의 예를 도시한다. 경계 곡선(710)의 일부는 강도 구배에서 국부적인 피크와 같은 화상 구조(720)에 가깝다. 화상 커플링 드라이빙 항은 곡선(730) 및 파선(740)으로 도시된 바와 같이 경계를 화상 구조로 유도한다.

템플릿 드라이빙 항( Template Driving Term )

템플릿 드라이빙 항은, 예를 들어, 이전의 시퀀스로부터의 장면 내 물체에 관한 정보를 학습하거나, 또는 물체의 예상된 형태에 관한 과거의 정보를 갖는 실시예에서 사용된다. 이러한 정보는 물체 경계의 템플릿을 제공한다. 물체 경계 템플릿 드라이빙 팩터는 2차원 함수

의 교차점으로 특징지을 수 있다. 템플릿 드라이빙 항은 하기와 같이 표현된다.

그래서, 만일 경계 필드 B(x,y)가 물체 경계 근처의 화소 위치에서의 템플릿

보다 크면, B(x,y)는 감소한다. 마찬가지로, 만일 경계 필드 B(x,y)가 물체 경계 근처의 화소 위치에서의 템플릿

보다 작으면, B(x,y)는 증가한다. 결국,

라는 평형상태에 도달한다.

다이내믹 모델은 수학식(4)에 따라서 공간 2차원 경계 필드 B(x,y)를 발전시킨다. 파라미터

는 각 항의 상대 가중치를 결정한다. 몇몇 실시예에서,

는 초기에 0으로 설정되고 물체 경계가 성장하는 차후 단계에서 더 효과적이 되도록 서서히 증가한다. 대개의 경우, 종종

는 물체 경계에 관한 아무런 과거의 지식도 이용가능하지 않기 때문에 전체 방법 동안 0으로 설정된다. 드라이빙 항들은 경계 필드 B(x,y) 및 움직임 필드의 함수이다. 드라이빙 항들의 비선형 협력 효과는 이동 물체에 대한 경계 필드의 안정적인 발전 및 생성을 고려한다.

다이내믹 모델에서 경계 필드가 갱신됨에 따라, 각 화소 "x" 마다 배경 움직임을 사용하는 것과 물체 움직임을 사용하는 것 간의 예측 에러는 매 반복마다 계산될 필요가 있다. 배경 움직임은 통상 매우 강건하고 안정적이며, 그래서 단일의 배경 움직임은 모든 화소에 사용될 수 있다. 그러나, 몇몇 경우에서, 물체 움직임은 국부적이 아니거나 비강체적인 움직임을 수반할 수 있다. 이러한 경우에, 물체 움직임에 대한 벌크 및 국부적인/경계 움직임 벡터가 몇몇 실시예에서 사용된다.

도 8은 물체에 대해 생성된 경계 필드의 예를 도시한다. 시간 t₁ 에서, 타겟 화상(800) 내 물체의 식별된 부분은 참조번호(810)로 도시되며, 타겟 화상의 나머지는 배경 영역으로 생각된다. 시간 t₂에서 배경 필드가 발전됨에 따라, 식별된 물체 부분은 참조번호(820)에 도시된 바와 같이 성장한다. 경계 움직임 벡터들(830)은 이동 물체의 경계를 따라서 배치되며, 이들 움직임 벡터의 값이 추정된다. 경계 움직임 벡터의 값은 현재 시간 t₂에서 물체의 일부로서 식별된 화소를 이용하여 결정된다. 즉, 물체(820)의 식별된 부분 내부의 화소들만이 경계 움직임 벡터(830)를 추정하는데 사용된다. 각각의 경계 움직임 벡터는 경계로부터 기설정 거리 내에 있는 물체의 식별된 부분 내부의 영역을 이용하여 추정된다. 그러므로 각각의 경계 움직임 벡터는 물체의 작은 부분의 움직임을 나타낸다. 물체의 벌크 움직임 벡터, V_bulk는 식별된 부분의 화소를 이용하여 추정되어 물체 전체의 전체 움직임을 나타낸다.

일반적으로, 벌크 움직임 벡터 V_bul _k 는 물체 내 각 화소의 물체 움직임을 나타내는데 사용될 수 있다. 물체의 여러 부분들이 상이한 방향으로 움직이는 비강체적인 움직임을 처리하기 위하여, 경계를 따른 화소의 경우, 그 화소에 근접하거나, 그와 국부적인 공간 상관관계를 갖는 경계 움직임 벡터를 물체 움직임을 나타내는데 사용할 수 있다. 예를 들어, 만일 물체가 사람이라면, 벌크 움직임 벡터는 사람이 우측으로 움직이고 있음을 나타낼 수 있고, 사람의 손을 따른 경계 움직임 벡터는 손이 벌크 움직임 벡터에 대해 좌측으로 움직이고 있음을 나타낼 수 있다.

일 실시예에서, 경계 추출 방법은 도 9에 도시된 바와 같이 비디오 데이터의 화상(또는 프레임, 또는 필드)을 인코딩하기 위한 비디오 코딩에 사용된다. 참조번호(910)에서, 인코더는 입력 타겟 화상을 수신한다. 타겟 화상과 관련된 디코드된 화상 데이터를 포함하는 한 세트의 참조 화상은 인코딩 프로세스 동안 인코더에서 이용가능하며, 디코딩 프로세스 동안 디코더에서도 이용가능하다. 참조번호(915)에서, 이동 물체 경계가 추출된다. 참조번호(920)에서, 인코더는 타겟 화상과 연관된 움직임 벡터들의 불규칙 샘플링 또는 분포를 생성한다. 참조번호(930)에서, 샘플링 패턴 정보(예컨대, 패턴을 나타내는 비트)는 디코더로 전송된다.

참조번호(940)에서, 시간 예측 필터링 프로세스가 불규칙 움직임 샘플링 패턴에 적용된다. 이러한 적응적인 필터링 프로세스는 움직임 벡터, 불규칙 샘플링 패턴, 및 참조 화상을 이용하여 타겟 화상의 예측을 생성한다. 참조번호(950)에서, 움직임 벡터값들이 코드화되어 디코더로 전송된다. 참조번호(960)에서, 타겟 화상의 실제 타겟 데이터에서 적응적 필터링 프로세스로부터의 예측 에러를 감산한 나머지가 생성된다. 참조번호(970)에서 나머지가 코드화되고, 참조번호(980)에서 디코더로 전송된다.

또 다른 실시예에서, 움직임 벡터의 적응적 샘플링 패턴은 도 10에 도시된 바와 같이, 비디오 데이터의 화상(또는 프레임 또는 화상)을 디코드하는데 사용된다. 참조번호(1010)에서, 인코드된 나머지가 수신된다. 참조번호(1020)에서, 디코더는 수신된 인코드된 나머지를 디코드한다. 참조번호(1030)에서, 디코더는 샘플 패턴 정보, 참조 화상, 및 움직임 벡터값들을 수신한다. 그런 다음, 참조번호(1040)에서, 디코더는 적응적 시간 필터 절차를 적용하여 시간 예측을 생성한다. 참조번호(1050)에서, 디코드된 나머지를 시간 예측에 가산함으로써 디코드된 타겟 화상이 생성된다.

도 11은 적응형 영향 영역 필터를 이용하는 시스템의 일례를 도시한다. 디지털 비디오 카메라(1110)는 전자적 형태로 화상을 캡쳐하고, 압축 및 인코딩 프로세스 동안 움직임 벡터 선택 방법을 이용하는 압축 장치(1120)를 이용하여 이 화상을 처리한다. 인코드된 화상은 전자 전송 매체(1130)를 통해 디지털 재생 장치(1140)로 전송된다. 이 화상은 디코딩 프로세스 동안 필터를 이용하는 디코딩 장치(1150)에 의해 디코드된다. 카메라(1110)는 본 발명의 실시예들을 포함하는 각종 화상 처리 장치(예를 들어, 다른 화상 캡쳐 장치, 화상 편집기, 화상 프로세서, 개인용 및 상업용 컴퓨팅 플랫폼 등)의 실례이다. 마찬가지로, 디코딩 장치(1150)는 화상 데이터를 디코드하는 각종 장치의 실례이다.

본 발명이 특정 시스템 환경에서의 실시예의 관점에서 설명되었지만, 본 기술 분야에서 통상의 지식을 갖는 자들은 첨부된 특허청구범위의 사상과 범주 내에서 다른 그리고 상이한 하드웨어 및 소프트웨어 환경에서 본 발명이 변형 실시될 수 있음을 인식할 것이다.

Claims

전자 데이터 프로세서에 의해 실행되는, 이동 물체 경계 추출 방법으로서,

타겟 화상과 참조 화상간의 위치의 변동에 의해 움직임이 표현되는 물체에 대한 초기 움직임 벡터를 추정하는 단계와,

상기 물체가 나타나 움직이는 배경 영역에 대한 초기 벡터를 추정하는 단계와,

상기 추정된 벡터를 이용하는, 물체의 움직임 벡터 및 배경 영역의 움직임 벡터에 대한 예측 에러 추정 과정을 포함하는 다이내믹 모델의 적어도 한번의 반복을 계산하는 단계와 - 상기 타겟 화상 내의 화소가 미래의 참조 프레임에 대하여 추정된 폐색 영역에 근접하면 과거의 참조 프레임을 이용하여 예측 에러를 추정하고, 상기 타겟 화상 내의 화소가 상기 과거의 참조 프레임에 대하여 추정된 폐색 영역에 근접하면 상기 미래의 참조 프레임을 이용하여 예측 에러를 추정함 -,

물체 움직임 필드에 대한 가설 시험 절차(hypothesis testing procedure)를 이용하는 단계 - 상기 타겟 화상 내의 픽셀이 임계치보다 크거나 같은 경계 필드 내의 대응 값을 가지면, 물체 가설은 과거 화상 물체 움직임 벡터 및 미래 화상 물체 움직임 벡터 중 더 작은 예측 에러를 갖는 물체 움직임 벡터이고, 상기 타겟 화상 내의 픽셀이 상기 임계치보다 작은 경계 필드 내의 대응 값을 가지면, 물체 가설은 과거 화상 물체 움직임 벡터 및 미래 화상 물체 움직임 벡터 중 더 큰 예측 에러를 갖는 물체 움직임 벡터임 -,

상기 물체 움직임 필드에 대한 가설 시험 절차를 이용하여 결정된 물체 움직임 벡터에 기초하여 상기 다이내믹 모델의 적어도 한번의 반복을 이용하여 상기 물체의 경계를 추출하는 단계

를 포함하는, 전자 데이터 프로세서에 의해 실행되는 이동 물체 경계 추출 방법.
삭제
삭제
제1항에 있어서,

상기 다이내믹 모델은 예측 에러 항을 참조하며,

상기 예측 에러 항은 상기 물체와 연관된 움직임 벡터를 이용하여 구한 예측 에러와 상기 배경 영역과 연관된 움직임 벡터를 이용하여 구한 예측 에러 간의 차를 포함하는, 전자 데이터 프로세서에 의해 실행되는 이동 물체 경계 추출 방법.
제1항에 있어서,

상기 다이내믹 모델은 안정성 항을 참조하며,

상기 안정성 항은 상기 경계의 곡률(curvature)을 추출하는 것과 연관된 곡률 항을 포함하며,

상기 안정성 항은 움직이는 상기 물체의 평활도(smoothness) 또는 간결성(compactness)을 추출하는 것과 연관된 확산항(diffusion term)을 포함하는, 전자 데이터 프로세서에 의해 실행되는 이동 물체 경계 추출 방법.
제1항에 있어서,

상기 다이내믹 모델은 화상 커플링 항을 참조하고,

상기 화상 커플링 항은 상기 물체 경계에 법선인 강도 구배(intensity gradient)와 연관되며,

상기 강도 구배는 상기 물체에 근접한 상기 타겟 화상의 일부분과 연관되는, 전자 데이터 프로세서에 의해 실행되는 이동 물체 경계 추출 방법.
제1항에 있어서,

상기 다이내믹 모델은 템플릿 항을 참조하며,

상기 템플릿 항은 템플릿을 움직이는 상기 물체 경계에 제공하는, 전자 데이터 프로세서에 의해 실행되는 이동 물체 경계 추출 방법.
삭제
제1항에 있어서, 상기 예측 에러 추정 과정은 상기 배경 움직임 필드에 대한 가설 시험 절차(hypothesis testing procedure)를 더 포함하고,

상기 배경 움직임 필드에 대한 가설 시험 절차는,

상기 물체의 현재 상태와의 일관성에 대해 제1 배경 움직임 필드를 시험하고 - 상기 제1 배경 움직임 필드는 과거의 참조 프레임에 근거함 - ,

상기 물체의 상기 현재 상태와의 일관성에 대해 제2 배경 움직임 필드를 시험하고 - 상기 제2 배경 움직임 필드는 미래의 참조 프레임에 근거함 - ,

상기 시험들의 결과를 이용하여 상기 제1 배경 필드 또는 상기 제2 배경 필드를 선택하는 것인, 전자 데이터 프로세서에 의해 실행되는 이동 물체 경계 추출 방법.
제1항에 있어서, 상기 물체 움직임 필드에 대한 가설 시험 절차는,

이면,

를 선택하고,

그렇지 않으면
를 선택하는 수학식에 의해 나타나고,

는 과거 또는 미래의 참조 필드에 근거하는 물체에 대한 움직임 벡터를 나타내고, ε은 상기 예측 에러를 나타내고,
는 상기 움직임 벡터에 대한 가설을 나타내고,
는 임계치를 나타내며,
는 화소(x, y)에서의 경계 필드 상태를 나타내는, 전자 데이터 프로세서에 의해 실행되는 이동 물체 경계 추출 방법.
제1항에 있어서, 상기 다이내믹 모델은,

을 포함하고,

는 화소(x, y) 마다 시간 t에서의 물체 또는 배경 상태를 규정하는 시간 t에서의 화소(x, y)에서의 경계 필드의 상태를 나타내고, ∇는 상기 경계 필드의 구배를 나타내고, T는 복수의 경계 특징으로부터의 영향을 조합하는 복합 드라이빙 항을 나타내며, τ는 시간 t로부터 t+τ로 상태를 진행시키는 시간 스텝 파라미터를 나타내는, 전자 데이터 프로세서에 의해 실행되는 이동 물체 경계 추출 방법.
제11항에 있어서,

T는,

로서 정의되고,

는 가중 팩터를 나타내고,
는 예측 에러 항을 나타내고,
는 안정성 항을 나타내고,
은 화상 커플링 항을 나타내고,
는 템플릿 항을 나타내는, 전자 데이터 프로세서에 의해 실행되는 이동 물체 경계 추출 방법.
제1항에 있어서,

상기 다이내믹 모델의 특정 횟수의 반복을 완료한 이후 상기 물체에 대한 제2 움직임 벡터를 추정하는 단계와,

상기 다이내믹 모델의 상기 특정 횟수의 반복을 완료한 이후 상기 배경 영역에 대한 제2 움직임 벡터를 추정하는 단계를 더 포함하는, 전자 데이터 프로세서에 의해 실행되는 이동 물체 경계 추출 방법.
제13항에 있어서,

상기 물체 및 상기 배경 영역에 대한 제2 움직임 벡터를 추정하는 단계는,

상기 물체의 움직임을 나타내는 벌크 움직임 벡터 및 국부 경계 움직임 벡터를 추정하는 단계와,

상기 추정된 국부 경계 움직임 벡터를 이용하여 비강체적인 움직임(non-rigid motion)을 갖는 상기 물체 내 영역들에 근접한 화소들에 대해 다이내믹 모델에서의 예측 에러 항을 계산하는 단계를 포함하는, 전자 데이터 프로세서에 의해 실행되는, 전자 데이터 프로세서에 의해 실행되는 이동 물체 경계 추출 방법.
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
이동 물체 경계 추출 장치로서,

마이크로프로세서를 포함하며,

상기 마이크로프로세서는 타겟 화상과 참조 화상 간의 위치의 변동에 의해 움직임이 표현되는 물체에 대한 초기 움직임 벡터를 추정하고,

상기 물체가 나타나 움직이는 배경 영역에 대한 초기 벡터를 추정하고,

상기 추정된 벡터를 이용하는, 물체의 움직임 벡터 및 배경 영역의 움직임 벡터에 대한 예측 에러 추정 과정을 포함하는 다이내믹 모델의 적어도 한번의 반복을 계산하고 - 상기 타겟 화상 내의 화소가 미래의 참조 프레임에 대하여 추정된 폐색 영역에 근접하면 과거의 참조 프레임을 이용하여 예측 에러를 추정하고, 상기 타겟 화상 내의 화소가 상기 과거의 참조 프레임에 대하여 추정된 폐색 영역에 근접하면 상기 미래의 참조 프레임을 이용하여 예측 에러를 추정함 -,

물체 움직임 필드에 대한 가설 시험 절차를 이용하고 - 상기 타겟 화상 내의 픽셀이 임계치보다 크거나 같은 경계 필드 내의 대응 값을 가지면, 물체 가설은 과거 화상 물체 움직임 벡터 및 미래 화상 물체 움직임 벡터 중 더 작은 예측 에러를 갖는 물체 움직임 벡터이고, 상기 타겟 화상 내의 픽셀이 상기 임계치보다 작은 경계 필드 내의 대응 값을 가지면, 물체 가설은 과거 화상 물체 움직임 벡터 및 미래 화상 물체 움직임 벡터 중 더 큰 예측 에러를 갖는 물체 움직임 벡터임 -,

상기 물체 움직임 필드에 대한 가설 시험 절차를 이용하여 결정된 물체 움직임 벡터에 기초하여 상기 다이내믹 모델의 적어도 한번의 반복을 이용하여 상기 물체의 경계를 추출하는, 이동 물체 경계 추출 장치.
삭제
삭제
제29항에 있어서,

상기 다이내믹 모델은 예측 에러 항을 참조하며,

상기 예측 에러 항은 상기 물체와 연관된 움직임 벡터를 이용하여 구한 예측 에러와 상기 배경 영역과 연관된 움직임 벡터를 이용하여 구한 예측 에러 간의 차를 포함하는, 이동 물체 경계 추출 장치.
제29항에 있어서,

상기 다이내믹 모델은 안정성 항을 참조하며,

상기 안정성 항은 상기 경계의 곡률(curvature)을 추출하는 것과 연관된 곡률 항을 포함하며,

상기 안정성 항은 움직이는 상기 물체의 평활도(smoothness) 또는 간결성(compactness)을 추출하는 것과 연관된 확산항(diffusion term)을 포함하는, 이동 물체 경계 추출 장치.
제29항에 있어서,

상기 다이내믹 모델은 화상 커플링 항을 참조하고,

상기 화상 커플링 항은 상기 물체 경계에 법선인 강도 구배(intensity gradient)와 연관되며,

상기 강도 구배는 상기 물체에 근접한 상기 타겟 화상의 일부분과 연관되는, 이동 물체 경계 추출 장치.
제29항에 있어서,

상기 다이내믹 모델은 템플릿 항을 참조하며,

상기 템플릿 항은 템플릿을 이동하는 상기 물체 경계에 제공하는, 이동 물체 경계 추출 장치.
삭제
제29항에 있어서, 상기 예측 에러 추정 과정은 상기 배경 움직임 필드에 대한 가설 시험 절차(hypothesis testing procedure)를 포함하고,

상기 배경 움직임 필드에 대한 가설 시험 절차는,

상기 물체의 현재 상태와의 일관성에 대해 제1 배경 움직임 필드를 시험하고 - 상기 제1 배경 움직임 필드는 과거의 참조 프레임에 근거함 - ,

상기 물체의 상기 현재 상태와의 일관성에 대해 제2 배경 움직임 필드를 시험하고 - 상기 제2 배경 움직임 필드는 미래의 참조 프레임에 근거함 - ,

상기 시험들의 결과를 이용하여 상기 제1 배경 필드 또는 상기 제2 배경 필드를 선택하는 것인, 이동 물체 경계 추출 장치.
제29항에 있어서, 상기 물체 움직임 필드에 대한 가설 시험 절차는,

이면,

를 선택하고,

그렇지 않으면
를 선택하는 수학식에 의해 나타나고,

는 과거 또는 미래의 참조 필드에 근거하는 물체에 대한 움직임 벡터를 나타내고, ε은 상기 예측 에러를 나타내고,
는 상기 움직임 벡터에 대한 가설을 나타내고,
는 임계치를 나타내며,
는 화소(x, y)에서의 경계 필드 상태를 나타내는 이동 물체 경계 추출 장치.
제29항에 있어서, 상기 다이내믹 모델은,

을 포함하고,

는 시간 t에서의 화소(x,y)에서의 경계 필드의 상태를 나타내고, ∇는 상기 경계 필드의 구배를 나타내고, T는 복수의 경계 특징으로부터의 영향을 조합하는 복합 드라이빙 항을 나타내며, τ는 시간 t로부터 t+τ로 상태를 진행시키는 시간 스텝 파라미터를 나타내는, 이동 물체 경계 추출 장치.
제39항에 있어서,

T는,

로서 정의되고,

는 가중 팩터를 나타내고,
는 예측 에러 항을 나타내고,
는 안정성 항을 나타내고,
은 화상 커플링 항을 나타내고,
는 템플릿 항을 나타내는, 이동 물체 경계 추출 장치.
제29항에 있어서, 상기 마이크로프로세서는,

상기 다이내믹 모델의 특정 횟수의 반복을 완료한 이후 상기 물체에 대한 제2 움직임 벡터를 추정하고, 상기 다이내믹 모델의 상기 특정 횟수의 반복을 완료한 이후 상기 배경 영역에 대한 제2 움직임 벡터를 추정하는, 이동 물체 경계 추출 장치.
제41항에 있어서, 상기 마이크로프로세서는,

상기 물체의 움직임을 나타내는 벌크 움직임 벡터 및 국부 경계 움직임 벡터를 추정하고, 상기 추정된 국부 경계 움직임 벡터를 이용하여 비강체적인 움직임을 갖는 상기 물체 내 영역들에 근접한 화소들에 대해 다이내믹 모델에서의 예측 에러 항을 계산함으로써 상기 물체 및 상기 배경 영역에 대한 제2 움직임 벡터를 추정하는, 이동 물체 경계 추출 장치.