KR101834279B1 - 지연 특징 추출을 이용하여 얼굴을 검출하기 위한 이미지 처리 방법 및 시스템 - Google Patents
지연 특징 추출을 이용하여 얼굴을 검출하기 위한 이미지 처리 방법 및 시스템 Download PDFInfo
- Publication number
- KR101834279B1 KR101834279B1 KR1020160127760A KR20160127760A KR101834279B1 KR 101834279 B1 KR101834279 B1 KR 101834279B1 KR 1020160127760 A KR1020160127760 A KR 1020160127760A KR 20160127760 A KR20160127760 A KR 20160127760A KR 101834279 B1 KR101834279 B1 KR 101834279B1
- Authority
- KR
- South Korea
- Prior art keywords
- image
- generated
- pyramid
- search
- feature
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G06K9/00228—
-
- G06K9/00248—
-
- G06K9/00288—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/30—Determination of transform parameters for the alignment of images, i.e. image registration
- G06T7/32—Determination of transform parameters for the alignment of images, i.e. image registration using correlation-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
- G06V40/165—Detection; Localisation; Normalisation using facial parts and geometric relationships
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20016—Hierarchical, coarse-to-fine, multiscale or multiresolution image processing; Pyramid transform
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Geometry (AREA)
- Image Analysis (AREA)
Abstract
지연 특징 추출을 이용하여 얼굴을 검출하기 위한 이미지 처리 방법 및 시스템이 개시된다. 입력된 이미지로부터의 객체 탐색 과정을 처리하는 이미지 처리 방법은, 상기 입력된 이미지로부터 서로 다른 스케일 레벨의 복수의 이미지들을 포함하는 이미지 피라미드를 생성하는 전처리 단계, 상기 이미지 피라미드에서 제1 이미지를 선택하는 제1 단계(상기 제1 이미지는 상기 이미지 피라미드가 포함하는 이미지들 중 아직 선택되지 않은 가장 작은 스케일 레벨의 이미지를 포함함), 상기 선택된 제1 이미지를 위한 특징 이미지를 생성하는 제2 단계, 상기 생성된 특징 이미지로부터 기설정된 객체를 탐색하는 제3 단계, 상기 생성된 특징 이미지로부터 상기 기설정된 객체가 탐색되는 경우, 상기 객체 탐색 과정을 중단하는 제4 단계 및 상기 생성된 특징 이미지로부터 상기 기설정된 객체가 탐색되지 않는 경우, 상기 제1 단계 내지 상기 제4 단계를 반복 처리하는 제5 단계를 포함할 수 있다.
Description
아래의 설명은 지연 특징 추출(lazy feature extract)을 이용하여 얼굴을 검출하기 위한 이미지 처리 방법 및 시스템, 그리고 컴퓨터와 결합되어 상기 이미지 처리 방법을 컴퓨터에 실행시키기 위해 컴퓨터에서 판독 가능한 기록매체에 저장된 컴퓨터 프로그램과 그 기록매체에 대한 것이다.
이미지를 여러 스케일(scale)에 걸쳐서 분석하는 가장 기본적인 방법은 입력 이미지의 크기를 단계적으로 변화(축소)시켜 가면서 필요한 분석 작업을 하는 것이다. 이때 이렇게 생성된 일련의 이미지 집합을 이미지 피라미드(image pyramid)라 부른다. 예를 들어, 한국공개특허 제10-2009-0057547호는 단말기 이미지 필터링을 위한 장치 및 방법에 관한 것으로, 입력받은 이미지에 대한 가우시안 피라미드(Gaussian pyramid)를 계산하고, 계산된 가우시안 피라미드에 대한 특징 벡터를 계산하여 입력받은 이미지에 대한 고차원적 이미지 필터를 적용하는 기술을 개시하고 있다.
이러한 이미지 파라미드를 이용한 분석 기법들에서는 입력된 이미지를 다양한 스케일의 이미지로 변환시킨 후, 변환된 이미지들 각각에 대해 특징점을 추출하거나 또는 기타 이미지 처리 알고리즘에 맞게 연산을 처리한다. 따라서, 입력된 이미지를 여러 스케일 레벨의 이미지로 크기 조정 후, 각각의 이미지마다 화면 전역에 대하여 특징점을 검출하거나 기타 이미지 처리 과정을 반복적으로 수행해야 하기 때문에 연산 시간이 너무 오래 소요된다는 문제점을 갖고 있다.
각각의 스케일 레벨을 위한 모든 특징 피라미드를 생성할 필요 없이 특징 피라미드를 구성하는 특징 이미지들 중 일부만을 생성하고도 입력된 이미지에서 사람의 얼굴과 같은 특정 객체의 검출이 가능한 이미지 처리 방법 및 시스템, 그리고 컴퓨터와 결합되어 상기 이미지 처리 방법을 컴퓨터에 실행시키기 위해 컴퓨터에서 판독 가능한 기록매체에 저장된 컴퓨터 프로그램과 그 기록매체를 제공한다.
가장 작은 스케일 레벨의 이미지로부터 필요에 따라 순차적으로 특징 이미지들을 생성 및 이용하여 입력된 이미지에서 사람의 얼굴과 같은 특정 객체의 검출이 가능한 이미지 처리 방법 및 시스템, 그리고 컴퓨터와 결합되어 상기 이미지 처리 방법을 컴퓨터에 실행시키기 위해 컴퓨터에서 판독 가능한 기록매체에 저장된 컴퓨터 프로그램과 그 기록매체를 제공한다.
입력된 이미지로부터의 객체 탐색 과정을 처리하는 이미지 처리 방법에 있어서, 상기 입력된 이미지로부터 서로 다른 스케일 레벨의 복수의 이미지들을 포함하는 이미지 피라미드를 생성하는 전처리 단계; 상기 이미지 피라미드에서 제1 이미지를 선택하는 제1 단계 - 상기 제1 이미지는 상기 이미지 피라미드가 포함하는 이미지들 중 아직 선택되지 않은 가장 작은 스케일 레벨의 이미지를 포함함 -; 상기 선택된 제1 이미지를 위한 특징 이미지를 생성하는 제2 단계; 상기 생성된 특징 이미지로부터 기설정된 객체를 탐색하는 제3 단계; 상기 생성된 특징 이미지로부터 상기 기설정된 객체가 탐색되는 경우, 상기 객체 탐색 과정을 중단하는 제4 단계; 및 상기 생성된 특징 이미지로부터 상기 기설정된 객체가 탐색되지 않는 경우, 상기 제1 단계 내지 상기 제4 단계를 반복 처리하는 제5 단계를 포함하는 것을 특징으로 하는 이미지 처리 방법을 제공한다.
일측에 따르면, 상기 제4 단계는, 상기 생성된 특징 이미지로부터 상기 기설정된 객체가 탐색되는 경우, 상기 탐색된 기설정된 객체의 크기보다 n(상기 n은 양의 유리수)배 이상의 크기를 갖는 객체가 탐색될 때까지 상기 제1 단계 내지 상기 제3 단계를 반복 처리한 후, 상기 객체 탐색 과정을 중단하는 것을 특징으로 할 수 있다.
다른 측면에 따르면, 상기 특징 이미지는 HOG(Histogram of Oriented Gradients) 특징 이미지를 포함하는 것을 특징으로 할 수 있다.
또 다른 측면에 따르면, 상기 객체 탐색 과정이 중단되는 경우, 상기 이미지 피라미드에 포함된 이미지들 중 아직 선택되지 않은 이미지들에 대한 특징 이미지가 생성되지 않는 것을 특징으로 할 수 있다.
또 다른 측면에 따르면, 상기 이미지 처리 방법은 상기 제4 단계에서 상기 기설정된 객체가 탐색되는 경우, 상기 입력된 이미지에서의 상기 탐색된 객체의 위치에 기반하여 상기 입력된 이미지를 변경하는 제6 단계를 더 포함하는 것을 특징으로 할 수 있다.
상기 이미지 처리 방법을 컴퓨터에 실행시키기 위한 프로그램이 기록되어 있는 것을 특징으로 하는 컴퓨터에서 판독 가능한 기록매체를 제공한다.
컴퓨터와 결합되어 상술한 이미지 처리 방법을 컴퓨터에 실행시키기 위해 컴퓨터 판독 가능한 기록매체에 저장된 컴퓨터 프로그램을 제공한다.
입력된 이미지로부터의 객체 탐색 과정을 처리하는 이미지 처리 방법을 실행하기 위해 컴퓨터로 구현되는 이미지 처리 시스템에 있어서, 상기 입력된 이미지로부터 서로 다른 스케일 레벨의 복수의 이미지들을 포함하는 이미지 피라미드를 생성하는 이미지 피라미드 생성부; 및 상기 이미지 피라미드에 포함된 복수의 이미지들 중 적어도 하나의 이미지로부터 기설정된 객체를 탐색하는 객체 탐색부를 포함하고, 상기 객체 탐색부는, 상기 이미지 피라미드에서 제1 이미지를 선택하는 제1 프로세스 - 상기 제1 이미지는 상기 이미지 피라미드가 포함하는 이미지들 중 아직 선택되지 않은 가장 작은 스케일 레벨의 이미지를 포함함 -; 상기 선택된 제1 이미지를 위한 특징 이미지를 생성하는 제2 프로세스; 상기 생성된 특징 이미지로부터 기설정된 객체를 탐색하는 제3 프로세스; 상기 생성된 특징 이미지로부터 상기 기설정된 객체가 탐색되는 경우, 상기 객체 탐색 과정을 중단하는 제4 프로세스; 및 상기 생성된 특징 이미지로부터 상기 기설정된 객체가 탐색되지 않는 경우, 상기 제1 프로세스 내지 상기 제4 프로세스를 반복 처리하는 제5 프로세스를 처리하는 것을 특징으로 하는 이미지 처리 시스템을 제공한다.
각각의 스케일 레벨을 위한 모든 특징 피라미드를 생성할 필요 없이 특징 피라미드를 구성하는 특징 이미지들 중 일부만을 생성하고도 입력된 이미지에서 사람의 얼굴과 같은 특정 객체를 검출할 수 있다.
가장 작은 스케일 레벨의 이미지로부터 필요에 따라 순차적으로 특징 이미지들을 생성 및 이용하여 입력된 이미지에서 사람의 얼굴과 같은 특정 객체를 검출할 수 있다.
도 1은 본 발명의 일실시예에 따라 생성되는 이미지 피라미드의 예를 도시한 도면이다.
도 2는 본 발명의 일실시예에 따라 생성된 이미지 피라미드의 가장 작은 스케일 레벨의 이미지에 대한 HOG 특징 이미지를 생성한 예를 도시한 도면이다.
도 3은 본 발명의 일실시예에 따라 생성된 특징 이미지에서 객체를 탐색하는 예를 도시한 도면이다.
도 4는 본 발명의 일실시예에 있어서, 다음 스케일 레벨의 이미지에 대한 HOG 특징 이미지를 생성한 예를 도시한 도면이다.
도 5는 본 발명의 일실시예에 있어서, 도 4에서 생성된 HOG 특징 이미지에서 객체를 탐색하는 예를 도시한 도면이다.
도 6은 본 발명의 일실시예에 있어서, 추가 탐색을 위한 예를 설명하기 위한 도면이다.
도 7은 본 발명의 일실시예에 있어서, 이미지 처리 시스템의 내부 구성을 설명하기 위한 블록도이다.
도 8은 본 발명의 일실시예에 있어서, 이미지 처리 시스템의 프로세서가 포함할 수 있는 구성요소의 예를 도시한 블록도이다.
도 9는 본 발명의 일실시예에 있어서, 이미지 처리 시스템이 수행할 수 있는 이미지 처리 방법의 예를 도시한 흐름도이다.
도 2는 본 발명의 일실시예에 따라 생성된 이미지 피라미드의 가장 작은 스케일 레벨의 이미지에 대한 HOG 특징 이미지를 생성한 예를 도시한 도면이다.
도 3은 본 발명의 일실시예에 따라 생성된 특징 이미지에서 객체를 탐색하는 예를 도시한 도면이다.
도 4는 본 발명의 일실시예에 있어서, 다음 스케일 레벨의 이미지에 대한 HOG 특징 이미지를 생성한 예를 도시한 도면이다.
도 5는 본 발명의 일실시예에 있어서, 도 4에서 생성된 HOG 특징 이미지에서 객체를 탐색하는 예를 도시한 도면이다.
도 6은 본 발명의 일실시예에 있어서, 추가 탐색을 위한 예를 설명하기 위한 도면이다.
도 7은 본 발명의 일실시예에 있어서, 이미지 처리 시스템의 내부 구성을 설명하기 위한 블록도이다.
도 8은 본 발명의 일실시예에 있어서, 이미지 처리 시스템의 프로세서가 포함할 수 있는 구성요소의 예를 도시한 블록도이다.
도 9는 본 발명의 일실시예에 있어서, 이미지 처리 시스템이 수행할 수 있는 이미지 처리 방법의 예를 도시한 흐름도이다.
이하, 실시예를 첨부한 도면을 참조하여 상세히 설명한다.
앞서 설명한 바와 같이, 이미지 피라미드는 하나의 원본 영상을 원하는 단계까지 다양한 스케일로 변화시켜 생성한 이미지들의 집합을 의미할 수 있다. 본 발명의 실시예들은 이러한 이미지 피라미드가 포함하는 전체 이미지들 각각에서 특징 피라미드를 생성할 필요 없이, 일부의 특징 피라미드를 통해 사람의 얼굴과 같은 특정 객체를 빠르게 검출할 수 있는 방법 및 시스템, 그리고 컴퓨터와 결합되어 상기 이미지 처리 방법을 컴퓨터에 실행시키기 위해 컴퓨터에서 판독 가능한 기록매체에 저장된 컴퓨터 프로그램과 그 기록매체를 제공할 수 있다.
이하에서는 이미지에서 원하는 객체의 추출을 위해 HOG(histogram of Oriented Gradients) 디스크립터(descriptor)를 활용하는 경우의 예를 설명한다. HOG는 객체 탐색의 목적을 위해 컴퓨터 비전이나 이미지 프로세싱에서 사용되는 특징 디스크립터(feature descriptor)이다. 상술한 HOG 디스크립터 이외에 이미지의 특징점을 찾기 위한 알고리즘으로서 SIFT(Scale Invariant Feature Transform), SURF(Speed Up Robust Feature) 등과 같이 이미지 피라미드 기법에 적용 가능한 것으로 잘 알려진 다양한 기법들이 활용될 수 있음을 당업자라면 쉽게 이해할 수 있다.
도 1은 본 발명의 일실시예에 따라 생성되는 이미지 피라미드의 예를 도시한 도면이고, 도 2는 본 발명의 일실시예에 따라 생성된 이미지 피라미드의 가장 작은 스케일 레벨의 이미지에 대한 HOG 특징 이미지를 생성한 예를 도시한 도면이다. 또한, 도 3은 본 발명의 일실시예에 따라 생성된 특징 이미지에서 객체를 탐색하는 예를 도시한 도면이다.
우선 도 1을 참조하면, 본 실시예에 따른 이미지 처리 시스템은 입력된 이미지(110)의 크기를 단계적으로 변화(축소)시켜가면서 서로 다른 스케일 레벨의 이미지들(120, 130, 140, 150)을 생성할 수 있다. 이때, 생성하기 위한 이미지들의 개수나 축소 비율이 필요에 따라 기설정될 수 있음은 이미 잘 알려진 이미지 피라미드 기법을 통해 당업자들이 쉽게 이해할 수 있다. 이 경우, 종래기술에서는 이미 설명한 바와 같이 생성된 이미지 파라미드가 포함하는 다섯 개의 이미지들(110, 120, 130, 140, 150) 각각에 대해 특징점을 추출하거나 원하는 이미지 처리를 수행해야 하기 때문에 탐색 시간이 매우 많이 걸리게 된다. 예를 들어, 종래기술에서는 다섯 개의 이미지들(110, 120, 130, 140, 150) 모두에 대해 각각 HOG 특징 이미지를 생성한 다음 생성된 HOG 특징 이미지들 전체에 대해 객체 탐색 과정을 진행한다. 반면, 본 발명의 실시예들에서는 이미지 피라미드가 포함하는 이미지들(110, 120, 130, 140, 150) 전체에 대해 HOG 특징 이미지를 생성하지 않고, 이미지 피라미드가 포함하는 이미지들(110, 120, 130, 140, 150) 중 아직 선택되지 않은 가장 작은 스케일 레벨의 이미지(150)에 대해서만 HOG 특징 이미지를 생성한다.
도 2를 참조하면, 본 실시예에 따른 이미지 처리 시스템은 이미지 피라미드가 포함하는 이미지들(110, 120, 130, 140, 150) 중에서 가장 작은 스케일 레벨의 이미지(150)에 대해 HOG 특징 이미지(210)를 생성할 수 있다. 이 경우, 이미지 처리 시스템은 생성된 HOG 특징 이미지(210)에서 요구된 객체(일례로, 사람의 얼굴 영역)를 탐색할 수 있다.
도 3을 참조하면, 본 실시예에 따른 이미지 처리 시스템은 생성된 HOG 특징 이미지(210)에서 슬라이딩 윈도우(sliding window) 방식으로 윈도우(310)를 이동시켜가면서 윈도우(310)의 영역에서 요구된 객체(320)를 탐색할 수 있다. 이때, 이미지 처리 시스템은 요구된 객체(320)가 탐색됨에 따라 객체 탐색 과정을 중단할 수 있다. 도 3의 예에서는 HOG 특징 이미지(210)에서 객체(320)가 탐색됨에 따라 HOG 특징 이미지(210)의 나머지 영역에 대한 탐색을 진행하지 않고, 객체 탐색 과정이 중단된 예를 나타내고 있다. 이 경우, HOG 특징 이미지(210) 전체에 대한 탐색이 이루어지지 않을 뿐만 아니라, 이미지 피라미드가 포함하는 나머지 이미지들(110, 120, 130, 140)에 대해서는 HOG 특징 이미지를 생성하지 않기 때문에 객체의 검출을 위해 소요되는 시간을 줄일 수 있다. 또한, 나머지 이미지들(110, 120, 130, 140)에 대응하는 HOG 특징 이미지를 탐색해야 하는 탐색 시간 역시 줄일 수 있다.
반면, 가장 작은 스케일 레벨의 이미지(150)에 대한 HOG 특징 이미지(210)에서는 객체가 탐색되지 않을 수도 있다. 이 경우 이미지 처리 시스템은 다음으로 작은 스케일 레벨의 이미지(140)에 대해 HOG 특징 이미지를 생성하여 객체를 탐색할 수 있다.
도 4는 본 발명의 일실시예에 있어서, 다음 스케일 레벨의 이미지에 대한 HOG 특징 이미지를 생성한 예를 도시한 도면이고, 도 5는 본 발명의 일실시예에 있어서, 도 4에서 생성된 HOG 특징 이미지에서 객체를 탐색하는 예를 도시한 도면이다.
도 4를 참조하면, 본 실시예에 따른 이미지 처리 시스템은 가장 작은 스케일 레벨의 이미지(150)로부터 생성된 HOG 특징 이미지(210)에서 객체가 탐색되지 않음에 따라 다음 스케일 레벨의 이미지(140)로부터 HOG 특징 이미지(410)를 생성할 수 있다.
도 5를 참조하면, 본 실시예에 따른 이미지 처리 시스템은 도 3을 통해 설명한 바와 동일한 크기의 윈도우(310)를 HOG 특징 이미지(410)에서 이동시켜가면서, 윈도우(310)의 영역 내에 원하는 객체(510)가 존재하는지 탐색할 수 있다. 이때, 윈도우(310)의 크기는 동일한 반면, 객체(510)의 크기는 이미지 자체의 스케일 레벨이 커짐에 따라 더 커지기 때문에 HOG 특징 이미지(210)에서 객체(320)를 찾는 것보다 HOG 특징 이미지(410)에서 객체(510)를 찾을 확률이 더 높아지게 된다. 이 경우 객체(510)가 탐색되면, 이미지 처리 시스템은 객체 탐색 과정을 중단할 수 있다. 따라서, 나머지 스케일 레벨의 이미지들(110, 120, 130)에 대해서는 HOG 특징 이미지가 생성되지 않기 때문에 HOG 특징 이미지의 생성을 위한 시간을 줄일 수 있을 뿐만 아니라, 객체의 탐색 또한 처리되지 않기 때문에 객체 탐색 시간 역시 줄일 수 있다.
입력된 이미지와 탐색하고자 하는 객체에 따라 최종 스케일 레벨의 이미지(일례로 입력된 이미지(110))까지 HOG 특징 이미지의 생성과 객체의 탐색이 진행될 수도 있다. 그러나, 다수의 탐색(일례로, 1억 번의 서로 다른 입력 이미지들에 대한 탐색)을 고려할 때, 전체적으로 검출을 위한 소요 시간뿐만 아니라 연산 비용 역시 매우 큰 폭으로 감소하게 됨을 알 수 있다.
한편, 상대적으로 작은 스케일 레벨에서 객체를 탐색함에 따라 원하는 객체가 아닌 다른 객체가 탐색될 가능성도 존재한다. 따라서, 본 실시예에 따른 이미지 처리 시스템은 하나의 객체가 탐색된 이후에 바로 모든 작업을 중단하지 않고, 처음 탐색된 객체의 크기의 n배(일례로, 1/2 배) 이상의 크기를 가진 객체가 검출될 때까지 객체의 탐색을 계속 진행할 수도 있다.
도 6은 본 발명의 일실시예에 있어서, 추가 탐색을 위한 예를 설명하기 위한 도면이다. 도 6은 가장 작은 스케일 레벨의 이미지(150)에 대해 HOG 특징 이미지(210)를 생성하였으나, 생성된 HOG 특징 이미지(210)에서 객체가 탐색되지 않음에 따라 다음 스케일 레벨의 이미지(140)에 대해 HOG 특징 이미지(410)를 생성하여 객체(610)를 탐색한 예를 나타내고 있다. 이때, 이전 실시예에서 이미지 처리 시스템은 모든 작업을 중단할 수 있으나, 본 실시예에서는 탐색된 객체(610)의 크기의 n배 이상의 크기를 가진 객체가 검출할 때까지 객체 탐색 과정을 계속 진행하는 예를 나타내고 있다. 이때, 도 6에서는 탐색된 객체(610)의 크기의 1/2배 이상의 크기를 가진 객체의 검출을 위해, HOG 특징 이미지(410)의 전체를 모두 탐색하였으나, 추가 객체가 탐색되지 않음에 따라 그 다음 스케일 레벨의 이미지(130)에 대해 HOG 특징 이미지(620)를 생성하여 객체(630)를 검색한 예를 나타내고 있다. 여기서, 객체(610)와 객체(630)가 HOG 특징 이미지(410)와 HOG 특징 이미지(620)에서 상대적으로 동일한 위치에 존재하는 객체인 경우, 원하는 객체가 검출되었을 확률이 더 높아지게 되기 때문에 객체 탐색의 검출율을 높일 수 있게 된다. 한편, 객체(610)와 객체(630)가 HOG 특징 이미지(410)와 HOG 특징 이미지(620)에서 상대적으로 서로 다른 위치에 존재하는 객체인 경우에는, 두 객체들(610, 630) 중 어느 객체가 요구된 객체에 더 가까운지 추가적인 분석이 더 이루어질 수도 있다.
상술한 실시예들에 따른 이미지 처리 방법에 따라 탐색된 객체는 일실시예로, 사진에서 자동으로 특정 영역을 크롭(crop)하기 위해 이용될 수 있다. 예를 들어, 입력된 이미지에서 사람의 얼굴을 탐색하고, 탐색된 얼굴의 위치를 기준으로 이미지에서 특정 영역을 잘라내는 방식에서 상술한 이미지 처리 방법이 활용될 수 있다. 이러한 실시예에서는 이미지상의 모든 얼굴을 추출할 필요가 없으며, 일례로 가장 큰 얼굴과 같이 주요 객체만을 추출하면 된다. 예를 들어, 가장 작은 스케일 레벨의 이미지에서 배경에 속한 사람의 얼굴은 그 크기가 매우 작기 때문에 검출되지 않을 가능성이 높고, 이미지에서 주가 되는 사람의 얼굴만이 검출될 확률이 높다. 따라서 이러한 실시예에서는 모든 스케일 레벨의 이미지들에 대해 모든 얼굴을 탐색할 필요 없이, 가장 작은 스케일 레벨의 이미지부터 순차적으로 얼굴과 같은 객체를 추출하는 것만으로도 이미지의 크롭을 위한 기준 위치를 얻기 위해 원하는 객체를 쉽게 탐색할 수 있다.
도 7은 본 발명의 일실시예에 있어서, 이미지 처리 시스템의 내부 구성을 설명하기 위한 블록도이다. 도 7은 컴퓨터와 같은 물리적인 장치로서 이미지 처리 시스템(700)을 구현하기 위한 실시예를 설명하고 있으나, 실시예에 따른 이미지 처리 시스템(700)은 복수의 장치들이 네트워크를 통해 서로 연동된 형태로 구현될 수도 있다.
이미지 처리 시스템(700)은 도 7에 도시된 바와 같이 메모리(710), 프로세서(720), 통신 모듈(730) 그리고 입출력 인터페이스(740)를 포함할 수 있다. 메모리(710)는 컴퓨터에서 판독 가능한 기록매체로서, RAM(random access memory), ROM(read only memory) 및 디스크 드라이브와 같은 비소멸성 대용량 기록장치(permanent mass storage device)를 포함할 수 있다. 여기서 ROM과 비소멸성 대용량 기록장치는 메모리(710)와 분리되어 별도의 영구 저장 장치로서 이미지 처리 시스템(700)에 포함될 수도 있다. 또한, 메모리(710)에는 운영체제 및/또는 적어도 하나의 프로그램 코드(일례로 이미지 처리 방법을 수행하도록 이미지 처리 시스템(700)이 포함하는 기록매체에 저장되어 이미지 처리 시스템(700)을 제어하기 위한 컴퓨터 프로그램)가 저장될 수 있다. 이러한 소프트웨어 구성요소들은 메모리(710)와는 별도의 컴퓨터에서 판독 가능한 기록매체로부터 로딩될 수 있다. 여기서 컴퓨터에서 판독 가능한 기록매체는 플로피 드라이브, 디스크, 테이프, DVD/CD-ROM 드라이브, 메모리 카드 등의 컴퓨터에서 판독 가능한 기록매체를 포함할 수 있다. 다른 실시예에서 소프트웨어 구성요소들은 컴퓨터에서 판독 가능한 기록매체가 아닌 통신 모듈(730)을 통해 메모리(710)에 로딩될 수도 있다.
프로세서(720)는 기본적인 산술, 로직 및 입출력 연산을 수행함으로써, 컴퓨터 프로그램에 따른 명령을 처리하도록 구성될 수 있다. 명령은 메모리(710) 또는 통신 모듈(730)에 의해 프로세서(720)로 제공될 수 있다. 예를 들어 프로세서(720)는 메모리(710)와 같은 기록 장치에 저장된 프로그램 코드에 따라 수신되는 명령을 실행하도록 구성될 수 있다. 보다 구체적인 예로, 프로세서(720)는 메모리(710)에 로딩된 컴퓨터 프로그램의 코드에 따른 명령을 순차적으로 실행하여 이미지 처리 방법을 수행할 수 있다.
통신 모듈(730)은 실제 컴퓨터 네트워크를 통해 다른 물리적인 기기들과 서로 통신하기 위한 기능을 제공할 수 있다. 일례로, 이미지 처리 시스템(700)의 프로세서(720)가 처리하기 위한 이미지는 네트워크의 다른 물리적인 기기로부터 컴퓨터 네트워크와 통신 모듈(730)을 통해 이미지 처리 시스템(700)으로 수신되어 메모리(710)나 프로세서(720)로 전달될 수 있다. 역으로, 이미지 처리 시스템(700)이 수신된 이미지에 대해 연산을 처리한 처리 결과가 통신 모듈(730)과 컴퓨터 네트워크를 통해 다른 물리적인 기기로 전송될 수도 있다. 구체적인 예로, 이미지 처리 시스템(700)은 서버의 형태로 구현되어 클라이언트 프로그램이 설치된 단말로부터 수신되는 이미지를 처리하여 이미지 처리 결과를 단말로 전송하도록 구현될 수 있다. 다른 실시예로, 이미지 처리 시스템(700) 클라이언트 프로그램이 설치된 단말에 구현되어 단말이 수신하거나 또는 단말에 저장된 이미지를 처리하여 이미지 처리 결과를 사용자에게 제공하도록 구현될 수 있다.
입출력 인터페이스(740)는 입출력 장치(750)와의 인터페이스를 위한 수단일 수 있다. 예를 들어, 입출력 장치(750)에서 입력 장치는 키보드 또는 마우스 등의 장치를, 그리고 출력 장치는 디스플레이나 스피커와 같은 장치를 포함할 수 있다. 도 7에서 입출력 장치(750)는 이미지 처리 시스템(700)과 별도의 장치로 표현되었으나, 실시예에 따라 입출력 장치(750)가 이미지 처리 시스템(700)에 포함되도록 이미지 처리 시스템(700)이 구현될 수도 있다.
또한, 다른 실시예들에서 이미지 처리 시스템(700)은 도 7의 구성요소들보다 더 많은 구성요소들을 포함할 수도 있다. 그러나, 대부분의 종래기술적 구성요소들을 명확하게 도시할 필요성은 없다. 예를 들어, 이미지 처리 시스템(700)은 각종 물리적인 버튼이나 센서, 터치패널, 또는 입출력 포트 등의 다양한 구성요소들을 더 포함하도록 구현될 수도 있다.
도 8은 본 발명의 일실시예에 있어서, 이미지 처리 시스템의 프로세서가 포함할 수 있는 구성요소의 예를 도시한 블록도이고, 도 9는 본 발명의 일실시예에 있어서, 이미지 처리 시스템이 수행할 수 있는 이미지 처리 방법의 예를 도시한 흐름도이다. 도 8은 앞서 설명한 이미지 처리 시스템(700)의 프로세서(720)가 포함할 수 있는 구성요소들로서 이미지 피라미드 생성부(810), 객체 탐색부(820) 및 이미지 변경부(830)를 나타내고 있다. 이러한 프로세서(720) 및 프로세서(720)의 구성요소들은 도 9에 도시된 입력된 이미지로부터의 객체 탐색 과정을 처리하는 이미지 처리 방법이 포함하는 단계들(S910 내지 S980)을 수행할 수 있다. 이때, 프로세서(720) 및 프로세서(720)의 구성요소들은 메모리(710)가 포함하는 운영체제의 코드 및/또는 적어도 하나의 컴퓨터 프로그램의 코드에 따른 명령(instruction)을 실행하도록 구현될 수 있다. 여기서, 프로세서(720)의 구성요소들은 이미지 처리 시스템(700)에 저장된 컴퓨터 프로그램의 코드가 제공하는 제어 명령에 따라 프로세서(720)에 의해 수행되는 프로세서(720)의 서로 다른 기능들(different functions)의 표현들일 수 있다. 이때, 프로세서(720)는 이미지 처리 시스템(700)의 제어와 관련된 명령이 로딩된 메모리(710)로부터 필요한 제어 명령을 읽어드릴 수 있으며, 읽어드린 제어 명령에 따라 이후 설명될 단계들(S910 내지 S980)을 수행하도록 이미지 처리 시스템(700)을 제어할 수 있다.
단계(S910)에서 이미지 피라미드 생성부(810)는 입력된 이미지로부터 서로 다른 스케일 레벨의 복수의 이미지들을 포함하는 이미지 피라미드를 생성할 수 있다. 이미지 피라미드에 대해서는 이미 자세히 설명하였기에 반복적인 설명은 생략한다.
단계(S920)에서 객체 탐색부(820)는 이미지 피라미드에서 제1 이미지를 선택할 수 있다. 이때, 제1 이미지는 이미지 피라미드가 포함하는 이미지들 중 아직 선택되지 않은 가장 작은 스케일 레벨의 이미지를 포함할 수 있다. 다시 말해, 객체 탐색부(820)는 단계(S920)에서 이미지 피라미드가 포함하는 이미지들 중에서 아직 선택되지 않은 가장 작은 스케일 레벨의 이미지를 선택할 수 있다.
단계(S930)에서 객체 탐색부(820)는 선택된 제1 이미지를 위한 특징 이미지를 생성할 수 있다. 특징 이미지의 생성은 이미 설명한 바와 같이 HOG 디스크립터를 활용할 수 있다. 예를 들어, 특징 이미지는 HOG 특징 이미지를 포함할 수 있다. 그러나 이미 설명한 바와 같이 이미지 피라미드 기법에서 특징점을 찾기 위한 다양한 기법들 중 하나가 HOG 디스크립터 대신 활용될 수도 있다.
단계(S940)에서 객체 탐색부(820)는 생성된 특징 이미지로부터 기설정된 객체를 탐색할 수 있다. 객체의 탐색은 앞서 설명한 바와 같이 특징 이미지를 이동하는 윈도우의 영역에서 객체를 탐색하는 슬라이딩 윈도우를 이용한 탐색 기법이 활용될 수 있다.
단계(S950)에서 객체 탐색부(820)는 단계(S940)에서 객체가 탐색되는 경우 단계(S960)을 수행할 수 있고, 단계(S940)에서 객체가 탐색되지 않는 경우 단계(S920)가 다시 수행될 수 있다. 예를 들어, 객체 탐색부(820)는 단계(S940)을 통해 특징 이미지에서 객체가 발견되는 즉시 단계(S960)을 수행할 수 있다. 또한, 객체 탐색부(820)는 특징 이미지 전체에서 객체가 탐색되지 않는 경우에 단계(S920)부터 새로 이미지를 선택하여 다시 객체의 탐색을 진행할 수 있다. 다시 말해, 가장 작은 스케일 레벨의 이미지에 대응하는 특징 이미지에서 객체가 탐색되지 않는 경우, 다음 스케일 레벨의 이미지를 이용하여 다시 객체의 탐색이 이루어질 수 있다.
단계(S960)에서 객체 탐색부(820)는 객체 탐색 과정을 중단할 수 있다. 이미 설명한 바와 같이, 모든 스케일 레벨의 이미지들에서 특징 이미지가 생성되지 않기 때문에(아직 선택되지 않은 이미지들에 대한 특징 이미지가 생성되지 않기 때문에) 특징 이미지의 생성을 위해 요구되는 시간과 자원에 대한 비용을 줄일 수 있다. 또한, 생성되지 않는 특징 이미지들에서의 객체 탐색 시간을 줄일 수 있기 때문에 추가적으로 비용을 줄일 수 있으며, 생성된 특징 이미지에서도 객체가 탐색되는 경우 바로 객체 탐색 과정이 중단되기 때문에 객체 탐색을 위한 추가적인 비용을 더 줄일 수 있다.
실시예에 따른 객체 탐색부(820)는 객체가 탐색된 후에 추가적인 객체를 더 탐색할 수도 있다. 이 경우, 객체 탐색부(820)는 탐색된 기설정된 객체의 크기보다 n(상기 n은 양의 유리수)배 이상의 크기를 갖는 객체가 탐색될 때까지 단계(S920) 내지 단계(S950)를 반복 처리한 후, 객체 탐색 과정을 중단할 수도 있다. 이 경우, 두 개의 객체가 탐색될 수 있으며, 두 개의 객체는 서로 다른 스케일의 이미지들에서 서로 동일한 객체일 수도 있고, 서로 다른 스케일의 이미지들에서 서로 다른 객체일 수도 있다. 이미 설명한 바와 같이, 탐색된 두 개의 객체가 서로 동일한 객체인 경우에는 탐색된 객체가 기설정된 객체일 확률이 더 커지게 된다. 또한, 탐색된 두 개의 객체가 서로 다른 객체인 경우에는 추가적으로 탐색된 객체를 이용하거나 또는 추가적인 이미지 분석을 통해 두 개의 객체 중 하나의 객체를 선택하여 이용할 수 있다.
단계(S970)에서 이미지 변경부(830)는 단계(S960)에서 객체 탐색 과정이 중단된 후, 상기 입력된 이미지에서의 탐색된 객체의 위치에 기반하여 입력된 이미지를 변경할 수 있다. 예를 들어, 이미지 변경부(830)는 입력된 이미지에서 탐색된 객체의 위치를 중심으로 일정 크기의 영역을 잘라내거나 또는 탐색된 객체의 위치를 중심으로 일정 크기의 영역에 필터를 적용하는 등과 같이 입력된 이미지를 변경하기 위한 처리를 할 수 있다. 따라서, 본 발명의 실시예들에 따르면, 자동으로 입력된 이미지를 변경함에 있어서 기준이 되는 객체의 위치를 보다 빠르고 낮은 비용으로 탐색하는 것이 가능해진다.
이처럼 본 발명의 실시예들에 따르면, 각각의 스케일 레벨을 위한 모든 특징 피라미드를 생성할 필요 없이 특징 피라미드를 구성하는 특징 이미지들 중 일부만을 생성하고도 입력된 이미지에서 사람의 얼굴과 같은 특정 객체를 검출할 수 있다. 또한, 가장 작은 스케일 레벨의 이미지로부터 필요에 따라 순차적으로 특징 이미지들을 생성 및 이용하여 입력된 이미지에서 사람의 얼굴과 같은 특정 객체를 검출할 수 있다.
이상에서 설명된 시스템 또는 장치는 하드웨어 구성요소, 소프트웨어 구성요소 또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 어플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록매체에 저장될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.
Claims (10)
- 입력된 이미지로부터 기설정된 객체의 탐색 과정을 처리하는 이미지 처리 방법에 있어서,
상기 입력된 이미지로부터 상기 입력된 이미지의 크기를 단계적으로 축소시킨 서로 다른 스케일 레벨의 복수의 이미지들을 포함하는 이미지 피라미드를 생성하는 전처리 단계;
상기 생성된 이미지 피라미드에서 제1 이미지를 선택하는 제1 단계 - 상기 제1 이미지는 상기 이미지 피라미드가 포함하는 상기 복수의 이미지들 중 아직 선택되지 않은 가장 작은 스케일 레벨의 이미지를 포함함 -;
상기 선택된 제1 이미지를 위한 특징 이미지를 생성하는 제2 단계;
슬라이딩 윈도우를 통해 상기 생성된 특징 이미지의 영역을 이동하면서 객체를 탐색하는 탐색 기법을 통해 상기 기설정된 객체를 탐색하는 제3 단계;
상기 생성된 특징 이미지로부터 상기 슬라이딩 윈도우의 영역을 통해 상기 기설정된 객체가 탐색되는 경우, 상기 기설정된 객체의 탐색 과정을 중단하는 제4 단계; 및
상기 생성된 특징 이미지로부터 상기 기설정된 객체가 탐색되지 않는 경우, 상기 제1 단계 내지 상기 제4 단계를 반복 처리하는 제5 단계
를 포함하는 것을 특징으로 하는 이미지 처리 방법. - 제1항에 있어서,
상기 제4 단계는,
상기 생성된 특징 이미지로부터 상기 기설정된 객체가 탐색되는 경우, 상기 탐색된 기설정된 객체의 크기보다 n(상기 n은 양의 유리수)배 이상의 크기를 갖는 객체가 탐색될 때까지 상기 제1 단계 내지 상기 제3 단계를 반복 처리한 후, 상기 기설정된 객체의 탐색 과정을 중단하는 것을 특징으로 하는 이미지 처리 방법. - 제1항에 있어서,
상기 특징 이미지는 HOG(Histogram of Oriented Gradients) 특징 이미지를 포함하는 것을 특징으로 하는 이미지 처리 방법. - 제1항에 있어서,
상기 제4 단계에서 상기 기설정된 객체의 탐색 과정이 중단되는 경우, 상기 이미지 피라미드에 포함된 이미지들 중 아직 선택되지 않은 이미지들에 대한 특징 이미지가 생성되지 않는 것을 특징으로 하는 이미지 처리 방법. - 제1항에 있어서,
상기 기설정된 객체의 탐색 과정이 중단되는 경우, 상기 입력된 이미지에서의 상기 탐색된 객체의 위치에 기반하여 상기 입력된 이미지를 변경하는 제6 단계
를 더 포함하는 것을 특징으로 하는 이미지 처리 방법. - 제1항 내지 제5항 중 어느 한 항의 방법을 컴퓨터에 실행시키기 위한 프로그램이 기록되어 있는 것을 특징으로 하는 컴퓨터에서 판독 가능한 기록매체.
- 컴퓨터와 결합되어 입력된 이미지로부터 기설정된 객체의 탐색 과정을 처리하는 이미지 처리 방법을 컴퓨터에 실행시키기 위해 컴퓨터 판독 가능한 기록매체에 저장된 컴퓨터 프로그램에 있어서,
상기 이미지 처리 방법은,
상기 입력된 이미지로부터 상기 입력된 이미지의 크기를 단계적으로 축소시킨 서로 다른 스케일 레벨의 복수의 이미지들을 포함하는 이미지 피라미드를 생성하는 전처리 단계;
상기 생성된 이미지 피라미드에서 제1 이미지를 선택하는 제1 단계 - 상기 제1 이미지는 상기 이미지 피라미드가 포함하는 상기 복수의 이미지들 중 아직 선택되지 않은 가장 작은 스케일 레벨의 이미지를 포함함 -;
상기 선택된 제1 이미지를 위한 특징 이미지를 생성하는 제2 단계;
슬라이딩 윈도우를 통해 상기 생성된 특징 이미지의 영역을 이동하면서 객체를 탐색하는 탐색 기법을 통해 상기 기설정된 객체를 탐색하는 제3 단계;
상기 생성된 특징 이미지로부터 상기 슬라이딩 윈도우를 통해 상기 기설정된 객체가 탐색되는 경우, 상기 기설정된 객체의 탐색 과정을 중단하는 제4 단계; 및
상기 생성된 특징 이미지로부터 상기 기설정된 객체가 탐색되지 않는 경우, 상기 제1 단계 내지 상기 제4 단계를 반복 처리하는 제5 단계
를 포함하는 것을 특징으로 하는 컴퓨터 프로그램. - 입력된 이미지로부터 기설정된 객체의 탐색 과정을 처리하는 이미지 처리 방법을 실행하기 위해 컴퓨터로 구현되는 이미지 처리 시스템에 있어서,
상기 입력된 이미지로부터 상기 입력된 이미지의 크기를 단계적으로 축소시킨 서로 다른 스케일 레벨의 복수의 이미지들을 포함하는 이미지 피라미드를 생성하는 이미지 피라미드 생성부; 및
상기 이미지 피라미드에 포함된 상기 복수의 이미지들 중 적어도 하나의 이미지로부터 기설정된 객체를 탐색하는 객체 탐색부
를 포함하고,
상기 객체 탐색부는,
상기 생성된 이미지 피라미드에서 제1 이미지를 선택하는 제1 프로세스 - 상기 제1 이미지는 상기 이미지 피라미드가 포함하는 상기 복수의 이미지들 중 아직 선택되지 않은 가장 작은 스케일 레벨의 이미지를 포함함 -;
상기 선택된 제1 이미지를 위한 특징 이미지를 생성하는 제2 프로세스;
슬라이딩 윈도우를 통해 상기 생성된 특징 이미지의 영역을 이동하면서 객체를 탐색하는 탐색 기법을 통해 상기 기설정된 객체를 탐색하는 제3 프로세스;
상기 생성된 특징 이미지로부터 상기 슬라이딩 윈도우를 통해 상기 기설정된 객체가 탐색되는 경우, 상기 기설정된 객체의 탐색 과정을 중단하는 제4 프로세스; 및
상기 생성된 특징 이미지로부터 상기 기설정된 객체가 탐색되지 않는 경우, 상기 제1 프로세스 내지 상기 제4 프로세스를 반복 처리하는 제5 프로세스
를 처리하는 것을 특징으로 하는 이미지 처리 시스템. - 제8항에 있어서,
상기 제4 프로세스는,
상기 생성된 특징 이미지로부터 상기 기설정된 객체가 탐색되는 경우, 상기 탐색된 기설정된 객체의 크기보다 n(상기 n은 양의 유리수)배 이상의 크기를 갖는 객체가 탐색될 때까지 상기 제1 프로세스 내지 상기 제3 프로세스를 반복 처리한 후, 상기 기설정된 객체의 탐색 과정을 중단하는 것을 특징으로 하는 이미지 처리 시스템. - 제8항에 있어서,
상기 제4 프로세스에서 상기 기설정된 객체의 탐색 과정이 중단되는 경우, 상기 이미지 피라미드에 포함된 이미지들 중 아직 선택되지 않은 이미지들에 대한 특징 이미지가 생성되지 않는 것을 특징으로 하는 이미지 처리 시스템.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020160127760A KR101834279B1 (ko) | 2016-10-04 | 2016-10-04 | 지연 특징 추출을 이용하여 얼굴을 검출하기 위한 이미지 처리 방법 및 시스템 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020160127760A KR101834279B1 (ko) | 2016-10-04 | 2016-10-04 | 지연 특징 추출을 이용하여 얼굴을 검출하기 위한 이미지 처리 방법 및 시스템 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR101834279B1 true KR101834279B1 (ko) | 2018-03-06 |
Family
ID=61727320
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020160127760A KR101834279B1 (ko) | 2016-10-04 | 2016-10-04 | 지연 특징 추출을 이용하여 얼굴을 검출하기 위한 이미지 처리 방법 및 시스템 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101834279B1 (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200075776A (ko) * | 2018-12-18 | 2020-06-26 | 경희대학교 산학협력단 | 모바일 증강현실 환경에서 객체의 특징을 추출하는 방법, 장치, 시스템 및 컴퓨터 프로그램 |
JP2022523207A (ja) * | 2019-02-25 | 2022-04-21 | グーグル エルエルシー | ピラミッドレイヤのアーキテクチャを生成するためのシステムおよび方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006202184A (ja) * | 2005-01-24 | 2006-08-03 | Konica Minolta Holdings Inc | 検出装置、検出方法及び検出プログラム |
JP2014199506A (ja) * | 2013-03-29 | 2014-10-23 | キヤノン株式会社 | 物体検出装置、物体検出方法及びプログラム |
-
2016
- 2016-10-04 KR KR1020160127760A patent/KR101834279B1/ko active IP Right Grant
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006202184A (ja) * | 2005-01-24 | 2006-08-03 | Konica Minolta Holdings Inc | 検出装置、検出方法及び検出プログラム |
JP2014199506A (ja) * | 2013-03-29 | 2014-10-23 | キヤノン株式会社 | 物体検出装置、物体検出方法及びプログラム |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200075776A (ko) * | 2018-12-18 | 2020-06-26 | 경희대학교 산학협력단 | 모바일 증강현실 환경에서 객체의 특징을 추출하는 방법, 장치, 시스템 및 컴퓨터 프로그램 |
JP2022523207A (ja) * | 2019-02-25 | 2022-04-21 | グーグル エルエルシー | ピラミッドレイヤのアーキテクチャを生成するためのシステムおよび方法 |
JP7317979B2 (ja) | 2019-02-25 | 2023-07-31 | グーグル エルエルシー | ピラミッドレイヤのアーキテクチャを生成するためのシステムおよび方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10242289B2 (en) | Method for analysing media content | |
US9542621B2 (en) | Spatial pyramid pooling networks for image processing | |
KR102036955B1 (ko) | 미세 얼굴 다이나믹의 딥 러닝 분석을 통한 미세 표정 인식 방법 및 장치 | |
JP7286013B2 (ja) | ビデオコンテンツ認識方法、装置、プログラム及びコンピュータデバイス | |
KR101481253B1 (ko) | 워드 클라우드 기반 텍스트 문서의 이미지화 요약 방법 및 이를 이용한 정보 제공 시스템 | |
CN112749758B (zh) | 图像处理方法、神经网络的训练方法、装置、设备和介质 | |
US11106949B2 (en) | Action classification based on manipulated object movement | |
US20210303905A1 (en) | Method, system, and non-transitory computer readable record medium for extracting and providing text color and background color in image | |
KR20220059194A (ko) | 대상 객체에 적응적인 객체 추적 방법 및 장치 | |
KR102449680B1 (ko) | 합성 개구면 레이더 영상에서 딥러닝을 기초로 표적과 클러터 구분을 위한 가중치 기반 간소화된 이진 분류 방법 및 그 장치 | |
KR101834279B1 (ko) | 지연 특징 추출을 이용하여 얼굴을 검출하기 위한 이미지 처리 방법 및 시스템 | |
KR20230099244A (ko) | 객체 추적 방법 및 장치 | |
US11164036B2 (en) | Human-assisted machine learning through geometric manipulation and refinement | |
KR20210108082A (ko) | 위상 차를 이용하는 라이브니스 검출 방법 및 장치 | |
KR101817440B1 (ko) | 다중 카메라를 통한 3차원 모델 기반 객체 인식 기법과 시스템 | |
KR102127855B1 (ko) | 검출 반복성을 최대화 하는 특징점 선별방법 | |
JP6815743B2 (ja) | 画像処理装置及びその方法、プログラム | |
KR102580131B1 (ko) | 순환 생성 적대 네트워크 조건부 생성 적대 네트워크 | |
KR20210058614A (ko) | 적응적인 임계치를 이용한 얼굴 검출 방법 및 장치 | |
KR20220133567A (ko) | 객체 추적 방법 및 장치 | |
KR20220062961A (ko) | 자율주행 자동차의 판단에 대한 근거 설명 모델 | |
KR102564477B1 (ko) | 객체 검출 방법 및 장치 | |
KR102518871B1 (ko) | 가상 카메라 레이아웃 생성을 위한 3d 타겟 객체 프레이밍 방법 및 장치 | |
KR102605708B1 (ko) | 조정 가능한 Grad-CAM을 기반으로 한 이미지 분류 작업에 시각적 설명 | |
CN113096134A (zh) | 基于单阶段网络的实时实例分割方法及其系统和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
AMND | Amendment | ||
AMND | Amendment | ||
X701 | Decision to grant (after re-examination) | ||
GRNT | Written decision to grant |