KR20210073135A - 눈 복원 기반의 눈 추적 방법 및 장치 - Google Patents

눈 복원 기반의 눈 추적 방법 및 장치 Download PDF

Info

Publication number
KR20210073135A
KR20210073135A KR1020190163642A KR20190163642A KR20210073135A KR 20210073135 A KR20210073135 A KR 20210073135A KR 1020190163642 A KR1020190163642 A KR 1020190163642A KR 20190163642 A KR20190163642 A KR 20190163642A KR 20210073135 A KR20210073135 A KR 20210073135A
Authority
KR
South Korea
Prior art keywords
image
eye
eye tracking
input image
threshold
Prior art date
Application number
KR1020190163642A
Other languages
English (en)
Inventor
허진구
강동우
남동경
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020190163642A priority Critical patent/KR20210073135A/ko
Priority to US16/895,600 priority patent/US11327562B2/en
Priority to CN202010647052.3A priority patent/CN112950670A/zh
Priority to EP20191104.7A priority patent/EP3836073B1/en
Priority to JP2020142548A priority patent/JP2021093125A/ja
Publication of KR20210073135A publication Critical patent/KR20210073135A/ko
Priority to US17/740,076 priority patent/US20220269343A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • G06T7/74Determining position or orientation of objects or cameras using feature-based methods involving reference images or patches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • G06F3/013Eye tracking input arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/001Image restoration
    • G06T5/002Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration by the use of more than one image, e.g. averaging, subtraction
    • G06T5/70
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
    • G06T7/248Analysis of motion using feature-based methods, e.g. the tracking of corners or segments involving reference images or patches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/254Analysis of motion involving subtraction of images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/7715Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/18Eye characteristics, e.g. of the iris
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/18Eye characteristics, e.g. of the iris
    • G06V40/19Sensors therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/18Eye characteristics, e.g. of the iris
    • G06V40/193Preprocessing; Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30041Eye; Retina; Ophthalmic
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • G06T2207/30201Face

Abstract

눈 복원 기반의 눈 추적 방법 및 장치가 개시된다. 일 실시예에 따르면, 눈 추적 방법은 입력 영상과 복원 영상 간의 차이를 결정하고, 그 결정된 차이에 기초하여 입력 영상, 복원 영상 및 대체 영상 중 어느 하나를 선정하여 눈 추적을 수행하는 단계들을 포함한다.

Description

눈 복원 기반의 눈 추적 방법 및 장치{METHOD AND APPARATUS FOR TRACKING EYE BASED ON EYE RECONSTRUCTION}
아래 실시예들은 눈 복원 기반의 눈 추적 방법 및 장치에 관한 것이다.
HUD(head up display) 장치는 운전자의 전방에 허상(virtual image)을 표시하여 운전자에게 운행에 도움이 되는 다양한 운행 정보를 제공할 수 있다. 최근 3차원 HUD 장치가 개발되고 있는데, 예를 들어 3차원 HUD 장치는 AR(augmented reality) 기법을 이용할 수 있다. 이 경우, 운행 정보는 실제 사물에 겹쳐지게 표현될 수 있고, 운전자는 운행 정보를 보다 직관적으로 인지할 수 있다. 현재 다양한 3차원 디스플레이 방식이 존재하는데, 이 중에 상대적으로 높은 해상도와 자유도를 갖는 시점 추적형 3차원 디스플레이 방식이 3차원 HUD 장치에 적용될 수 있다. 이 경우, 눈 추적의 정밀도와 안정성은 안전한 주행을 위해 매우 중요하다. 특히, 열악한 환경 속에서도 눈 추적이 정밀하고 안정적으로 수행될 필요가 있다.
일 실시예에 따르면, 눈 추적 방법은 입력 영상에 관한 눈 복원을 수행하여 복원 영상을 생성하는 단계; 상기 입력 영상과 상기 복원 영상 간의 차이를 결정하는 단계; 상기 결정된 차이에 기초하여 상기 입력 영상, 상기 복원 영상 및 대체 영상 중 어느 하나를 선정하여 대상 영상을 결정하는 단계; 및 상기 대상 영상에 기초하여 눈 추적을 수행하는 단계를 포함한다.
상기 눈 복원은 상기 입력 영상에서 노이즈 성분을 감소시키는 것을 포함할 수 있다. 상기 복원 영상을 생성하는 단계는 상기 입력 영상에 대응하는 주 성분 벡터(principal component vector)들 중 높은 순위를 갖는 일부를 이용하여 상기 복원 영상을 생성하는 단계를 포함할 수 있고, 상기 주 성분 벡터들은 각각 다양한 얼굴 영상들에 관한 주 성분 분석(principal component analysis)에 기초하여 미리 결정된 고유얼굴(eigenface)에 대응할 수 있다.
상기 대상 영상을 선정하는 단계는 상기 결정된 차이가 제1 임계치보다 작은 경우, 상기 입력 영상을 상기 대상 영상으로 선정하는 단계; 상기 결정된 차이가 제1 임계치보다 크고 제2 임계치보다 작은 경우, 상기 복원 영상을 상기 대상 영상으로 선정하는 단계; 및 상기 결정된 차이가 상기 제2 임계치보다 큰 경우, 상기 대체 영상을 상기 대상 영상으로 선정하는 단계를 포함할 수 있다.
상기 대체 영상은 상기 입력 영상 및 상기 복원 영상과 구분될 수 있다. 상기 눈 추적 방법은 데이터베이스에 저장된 샘플 영상들 중 상기 입력 영상과 유사도가 가장 높은 샘플 영상을 상기 대체 영상으로 선택하는 단계를 더 포함할 수 있다. 상기 유사도는 상기 입력 영상의 특징 점들과 상기 샘플 영상들의 각 샘플 영상의 특징 점들 간의 비교에 기초하여 결정될 수 있다. 상기 입력 영상의 상기 특징 점들 및 상기 각 샘플 영상의 상기 특징 점들은 각각 눈을 제외한 영역에서 추출된 것일 수 있다. 상기 샘플 영상들은 과거에 눈 추적에 성공한 영상들에 해당할 수 있다. 상기 눈 추적 방법은 상기 입력 영상 또는 상기 복원 영상에 기초하여 상기 눈 추적에 성공한 경우, 상기 입력 영상을 데이터베이스에 샘플 영상으로 저장하는 단계를 더 포함할 수 있다.
상기 복원된 영상을 생성하는 단계는 상기 입력 영상에 관한 눈 검출이 성공한 경우에 수행될 수 있다. 상기 대체 영상이 상기 대상 영상으로 선정된 경우, 상기 눈 추적을 수행하는 단계는 상기 대체 영상에 매핑된 눈 위치 정보를 이용하여 상기 눈 추적을 수행하는 단계를 포함할 수 있다.
일 실시예에 따르면, 눈 추적 장치는 프로세서; 및 상기 프로세서에서 실행가능한 명령어들을 포함하는 메모리를 포함하고, 상기 명령어들이 상기 프로세서에서 실행되면, 상기 프로세서는 입력 영상에 관한 눈 복원(eye reconstruction)을 수행하여 복원 영상을 생성하고, 상기 입력 영상과 상기 복원 영상 간의 차이를 결정하고, 상기 결정된 차이에 기초하여 상기 입력 영상, 상기 복원 영상 및 대체 영상 중 어느 하나를 선정하여 대상 영상을 결정하고, 상기 대상 영상에 기초하여 눈 추적을 수행한다.
도 1은 일 실시예에 따른 입력 영상, 복원 영상 및 대체 영상을 이용한 눈 추적 장치의 동작을 나타낸 도면.
도 2는 일 실시예에 따른 눈 검출 과정 및 눈 추적 과정을 나타낸 플로우 차트.
도 3은 일 실시예에 따른 대상 영상의 결정 및 눈 추적 과정을 나타낸 플로우 차트.
도 4는 일 실시예에 따른 증강된 외모 공간을 나타낸 도면.
도 5는 일 실시예에 따른 눈 복원 과정을 나타낸 도면.
도 6은 일 실시예에 따른 차이 값이 제2 임계치보다 작은 경우의 대상 영상 선정 동작을 나타낸 도면.
도 7은 일 실시예에 따른 차이 값이 제2 임계치보다 큰 경우의 대상 영상 선정 동작을 나타낸 도면.
도 8은 일 실시예에 따른 입력 영상과 샘플 영상 간의 특징 매칭 동작을 나타낸 도면.
도 9는 일 실시예에 따른 데이터베이스에 저장된 샘플 영상들을 나타낸 도면.
도 10은 일 실시예에 따른 눈 복원 기반의 눈 추적 방법을 나타낸 플로우 차트.
도 11은 일 실시예에 따른 눈 복원 기반의 눈 추적 장치를 나타낸 블록도.
도 12는 일 실시예에 따른 눈 추적 장치를 포함하는 전자 장치를 나타낸 도면.
아래 개시되어 있는 특정한 구조 또는 기능들은 단지 기술적 개념을 설명하기 위한 목적으로 예시된 것으로서, 아래 개시와는 달리 다른 다양한 형태로 실시될 수 있으며 본 명세서의 실시예들을 한정하지 않는다.
제1 또는 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 이런 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 이해되어야 한다. 예를 들어, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소는 제1 구성요소로도 명명될 수 있다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 등의 용어는 설시된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함으로 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 해당 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 갖는 것으로 해석되어야 하며, 본 명세서에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하, 실시예들을 첨부된 도면을 참조하여 상세하게 설명한다. 각 도면에 제시된 동일한 참조 부호는 동일한 부재를 나타낸다.
도 1은 일 실시예에 따른 입력 영상, 복원 영상 및 대체 영상을 이용한 눈 추적 장치의 동작을 나타낸 도면이다. 도 1을 참조하면, 눈 추적 장치(100)는 입력 영상(110)에 관한 눈 추적을 수행하고, 그 결과로서 눈 위치 정보를 출력한다. 입력 영상(110)은 사용자(예: 시청자, 운전자)의 얼굴을 포함할 수 있다. 눈 위치 정보는 무안경식 3차원 디스플레이, 운전자 상태 모니터링 등과 같은 다양한 어플리케이션에 이용될 수 있다. 무안경식 3차원 디스플레이는 3차원 HUD(head up display), 3차원 TV, 3차원 모바일 디바이스 등의 다양한 타입의 디스플레이를 포함할 수 있다.
무안경식 3차원 디스플레이는 사용자의 양 눈에 서로 다른 영상을 보여주는 방식인데, 이를 구현하기 위해 사용자의 양 눈의 위치 정보가 요구될 수 있다. 예를 들어, 3차원 영상의 제공을 위해 왼쪽 눈을 위한 왼쪽 영상 및 오른쪽 눈을 위한 오른쪽 영상이 준비될 수 있다. 이 경우, 3차원 디스플레이 장치는 눈 위치 정보를 통해 사용자의 양 눈의 위치를 파악하고, 왼쪽 눈의 위치에 왼쪽 영상을 제공하고, 오른쪽 눈의 위치에 오른쪽 영상을 제공할 수 있다. 이와 같은 방식을 통해 사용자는 3차원 영상을 시청할 수 있게 된다.
적절한 빛이 존재하고 사용자의 눈이 온전히 드러난 상태에서 사용자를 촬영하여 입력 영상(110)이 생성된 경우, 사용자의 눈은 비교적 쉽게 추적될 수 있다. 반면에, 빛이 충분히 존재하지 않거나, 선글라스 등으로 사용자의 눈이 가려지거나, 사용자의 눈 주변에 빛 반사 성분이 존재하는 상태에서 사용자를 촬영하여 입력 영상(110)이 생성된 경우, 사용자의 눈을 추적하는 것은 어려울 수 있다. 눈 추적 장치(100)는 상황에 맞게 입력 영상(110), 복원 영상(121) 및 대체 영상(131)을 선택적으로 이용하여 이와 같은 열악한 환경에서도 눈 추적을 성공적으로 수행해낼 수 있다.
입력 영상(110)은 복수의 프레임들을 포함하는 비디오에 해당할 수 있다. 입력 영상(111)은 입력 영상(110)의 하나의 프레임에 해당할 수 있다. 아래에서 설명되는 눈 추적 과정은 입력 영상(110)의 각 프레임에 관해 순차적으로 수행될 수 있다.
입력 영상(111)이 수신되면, 눈 추적 장치(100)는 입력 영상(111)에 관한 눈 복원(eye reconstruction)을 수행하여 복원 영상(121)을 생성한다. 눈 복원은 입력 영상(111)에서 노이즈 성분을 감소시키는 다양한 기법을 포함할 수 있다. 예를 들어, 노이즈 성분은 고주파 성분(예: 안경에 반사된 빛, 후광 등) 및 폐색 성분(예: 선글라스, 두꺼운 안경, 머리카락 등) 등을 포함할 수 있다. 눈 복원을 위해 주 성분 분석(principal component analysis, PCA)을 통한 차원 감소(dimension reduction)가 이용될 수 있다. 눈 복원의 구체적인 예시는 추후 상세히 설명한다.
복원 영상(121)이 생성되면, 눈 추적 장치(100)는 입력 영상(111)과 복원 영상(121)을 비교하여 입력 영상(111)과 복원 영상(121) 간의 차이를 결정할 수 있다. 이하, 그 결정된 차이는 차이 값으로 지칭될 수 있다. 예를 들어, 눈 추적 장치(100)는 입력 영상(111)과 복원 영상(121)의 대응 픽셀들을 서로 비교하여 입력 영상(111)과 복원 영상(121) 간의 차이를 결정할 수 있다. 대응 픽셀들이란 각 영상에서 동일한 위치에 존재하는 픽셀들을 의미할 수 있다.
눈 추적 장치(100)는 차이 값에 기초하여 입력 영상(111), 복원 영상(121) 및 대체 영상(131) 중 어느 하나를 선정하여 대상 영상을 결정할 수 있다. 대상 영상은 눈 추적의 대상이 되는 영상을 의미하며, 입력 영상(111), 복원 영상(121) 및 대체 영상(131) 중 어느 하나에 해당할 수 있다. 예를 들어, 차이 값이 제1 임계치보다 작은 경우 입력 영상(111)이 대상 영상으로 선정될 수 있고, 차이 값이 제1 임계치보다 크고 제2 임계치보다 작은 경우 복원 영상(121)이 대상 영상으로 선정될 수 있고, 차이 값이 제2 임계치보다 큰 경우 대체 영상(131)이 대상 영상으로 선정될 수 있다. 제2 임계치는 상기 제1 임계치보다 큰 것이 가정된다.
대체 영상(131)은 입력 영상(111) 및 복원 영상(121)과 구분되는 것으로, 샘플 영상들(130) 중에 선택된 것일 수 있다. 샘플 영상들(130)은 눈 추적에 적합한 상태의 다양한 영상들을 포함할 수 있고, 샘플 영상들(130) 중 입력 영상(111)과 유사도가 가장 높은 것이 대체 영상(131)으로 선택될 수 있다. 예를 들어, 입력 영상(111)의 특징 점들과 샘플 영상들(130)의 각 샘플 영상의 특징 점들 간의 비교에 기초하여 입력 영상(111)과 각 샘플 영상 간의 유사도가 결정될 수 있다.
눈 추적 장치(100)는 유사도와 임계치를 비교하여 입력 영상(111), 복원 영상(121) 및 대체 영상(131) 중 눈 추적에 가장 적합한 어느 하나를 선정할 수 있다. 예를 들어, 입력 영상(111)이 눈 추적에 적합한 상태에 해당하는 경우, 입력 영상(111)과 복원 영상(121) 간에 작은 차이(예: 제1 임계치보다 작은 차이)가 존재하므로, 입력 영상(111)이 대상 영상으로 선정될 수 있다.
혹은, 입력 영상(111)에 빛 반사와 같은 노이즈 성분이 존재하는 경우, 입력 영상(111)보다 복원 영상(121)이 눈 추적에 더 적합할 수 있다. 이 경우, 눈 복원을 통해 해당 노이즈 성분이 제거될 수 있고, 노이즈 성분의 유무로 인해 입력 영상(111)과 복원 영상(121) 간에 차이(예: 제1 임계치보다 크고 제2 임계치보다 작은 차이)가 발생할 수 있다. 이에 따라 복원 영상(121)이 대상 영상으로 선정될 수 있다.
혹은, 사용자가 선글라스를 낀 경우와 같이 입력 영상(111)에 많은 노이즈 성분이 존재하는 경우, 입력 영상(111) 및 복원 영상(121)보다 대체 영상(131)이 눈 추적에 더 적합할 수 있다. 이 경우, 눈 복원 과정에서 입력 영상(111)과 복원 영상(121) 간에 큰 차이(예: 제2 임계치보다 큰 차이)가 발생할 수 있으며, 이에 따라 대체 영상(131)이 대상 영상으로 선정될 수 있다.
입력 영상(111)을 구성하는 성분들 중 눈 추적에 방해가 되는 성분들은 눈 복원 과정에서 제거될 수 있다. 예를 들어, 눈 복원 과정에서 일반적인 얼굴에 대응하는 성분은 유지될 수 있고, 일반적인 얼굴에 해당하지 않는 성분들은 제거될 수 있다. 입력 영상(111)에서 눈 복원 과정에서 제거된 성분의 비중에 따라 입력 영상(111), 복원 영상(121) 및 대체 영상(131) 중 어느 하나가 선택될 수 있다. 예를 들어, 고주파 성분의 경우 제거된 성분의 비중이 적을 수 있으므로, 복원 영상(121)이 대상 영상으로 선택될 수 있고, 폐색 성분의 경우 제거된 성분의 비중이 클 수 있으므로, 대체 영상(131)이 대상 영상으로 선택될 수 있다.
대상 영상에 선택되면, 눈 추적 장치(100)는 대상 영상에 관해 눈 추적을 수행하여 눈 위치 정보를 생성할 수 있다. 눈 추적 장치(100)는 복수의 프레임들을 순차적으로 수신하고, 각 프레임에서 눈을 추적할 수 있다. 눈 위치 정보는 각 프레임에 존재하는 눈의 위치를 포함할 수 있다. 예를 들어, 눈의 위치는 영상 내 눈의 좌표로 표현될 수 있다.
도 2는 일 실시예에 따른 눈 검출 과정 및 눈 추적 과정을 나타낸 플로우 차트이다. 도 2를 참조하면, 입력 영상의 제1 프레임이 수신되면, 눈 추적 장치는 단계(210)에서 입력 영상의 제1 프레임에 관한 눈 검출을 수행한다. 눈 추적 장치는 눈 검출 과정을 통해 사용자의 눈을 포함하는 눈 검출 영역을 결정할 수 있다. 단계(220)에서 눈 추적 장치는 눈 검출에 성공했는지 결정한다. 눈 검출에 실패한 경우 입력 영상의 제2 프레임에 관해 단계(210)가 수행되고, 눈 검출에 성공한 경우 단계(230)가 수행된다. 다시 말해, 눈 검출에 성공할 때까지 각 프레임에 관해 단계들(210, 220)이 반복된다.
단계(230)에서 눈 추적 장치는 입력 영상의 제1 프레임에 관해 눈 복원을 수행한다. 눈 복원 이후 입력 영상의 제1 프레임에 대응하는 복원 영상 및 대체 영상이 생성될 수 있고, 입력 영상의 제1 프레임, 복원 영상 및 대체 영상 중 어느 하나가 대상 영상으로 선택될 수 있다. 단계(240)에서 눈 추적 장치는 대상 영상에 관한 눈 추적을 수행한다. 눈 추적 장치는 눈 검출 영역에 기초하여 눈 추적을 위한 눈 추적 영역을 결정할 수 있다. 눈 추적 장치는 눈 추적 영역 내에서 특징 점을 추출하고, 추출된 특징 점을 얼라인(align)하여, 눈 추적을 수행할 수 있다.
단계(250)에서 눈 추적 장치는 눈 추적에 성공했는지 결정한다. 눈 추적 영역 내 사용자의 눈이 존재하는 경우 눈 추적에 성공한 것으로 결정될 수 있고, 눈 추적 영역 내 사용자의 눈이 존재하지 않는 경우 눈 추적에 실패한 것으로 결정될 수 있다. 눈 추적에 성공한 경우, 눈 추적 장치는 눈 추적 영역을 업데이트하고, 입력 영상의 제2 영역에 관해 단계(230)를 수행한다. 예를 들어, 눈 추적 장치는 눈 위치에 맞추어 눈 추적 영역의 위치를 조절할 수 있다. 일례로, 추적 장치는 두 눈의 중심이 눈 추적 영역의 가운데 오도록 눈 추적 영역의 위치를 조절할 수 있다. 눈 추적 장치는 입력 영상의 제2 프레임에 대응하는 대상 영상을 결정하고, 대상 영상 및 업데이트된 눈 추적 영역을 이용하여 눈 추적을 계속할 수 있다.
도 3은 일 실시예에 따른 대상 영상의 결정 및 눈 추적 과정을 나타낸 플로우 차트이다. 도 3의 단계들(310 내지 390)은 도 2에서 점선 박스로 표시된 단계들(230, 240)에 대응할 수 있고, 도 2의 단계(220)에서 눈 검출에 성공한 것으로 결정됨에 따라 단계(310)가 수행될 수 있다.
도 3을 참조하면, 단계(310)에서 눈 추적 장치는 눈 복원을 수행하여 복원 영상을 생성한다. 눈 복원은 입력 영상에서 노이즈 성분을 감소시키는 다양한 기법을 포함할 수 있다. 예를 들어, 눈 복원을 위해 PCA를 통한 차원 감소가 적용될 수 있다. 이는 도 4 및 도 5를 참조하여 보다 상세히 설명한다.
도 4는 일 실시예에 따른 증강된 외모 공간을 나타낸 도면이다. 다양한 참조 얼굴 영상들에 관해 PCA를 수행하여 주 성분 벡터들이 획득될 수 있다. 주 성분 벡터들의 차원 수는 각 영상의 데이터(예: 픽셀)의 차원 수와 동일할 수 있다. 이 경우, 지배적인 얼굴 성분부터 예외적인 얼굴 성분에 이르는 주 성분 벡터들이 획득될 수 있다. 참조 얼굴 영상들에서 지배적인 얼굴 형태를 포함하는 영상들의 비중이 높을 수 있다. 이 경우, 지배적인 얼굴 성분은 표준적인 얼굴에 해당할 수 있고, 예외적인 얼굴 성분은 노이즈에 해당할 수 있다. 주 성분 벡터들은 각각 서로 직교하므로, 모든 입력 영상 내 얼굴 영상은 주 성분 벡터들을 통해 표현될 수 있다.
주 성분 벡터들은 다시 얼굴 영상으로 해석될 수 있으며, 해석된 얼굴 영상은 고유얼굴(eigenface)이라 지칭될 수 있다. 다시 말해, 다양한 얼굴 영상들에 관한 PCA에 기초하여 고유얼굴들이 결정될 수 있고, 주 성분 벡터들은 각각 고유얼굴에 대응할 수 있다. 입력 영상 내 얼굴 영상은 고유얼굴을 이용하여 증강된 외모 공간(augmented appearance space)에 표현될 수 있다.
도 4를 참조하면, 얼굴 영상(A)은 λiAi의 합으로 표현될 수 있다. Ai는 주 성분 벡터를 나타내고, λi는 주 성분 벡터의 계수를 의미한다. λi는 외모 파라미터로 지칭될 수도 있다. λi는 는 얼굴 영상(A)에서 Ai가 차지하는 비중을 의미할 수 있다. 각 λiAi의 값에 따라 도 4와 같은 얼굴 영상들이 표현될 수 있다. 인덱스 i는 1 내지 n의 값을 가질 수 있다. Ai는 i의 값이 작을수록 표준에 가까운 성분임을 의미하고, i의 값이 클수록 노이즈에 가까운 성분임을 의미한다.
도 5는 일 실시예에 따른 눈 복원 과정을 나타낸 도면이다. 도 5를 참조하면, 입력 영상(I)은 λ0A0 내지 λnAn의 합으로 표현될 수 있고, 복원 영상(I`)은 λ0A0 내지 λmAm의 합으로 표현될 수 있다. n은 m보다 클 수 있고, 눈 복원에 따라 차원이 감소된 것으로 볼 수 있다. 또한, 입력 영상(I)에서 인덱스의 값이 작은 성분(노이즈에 가까운 성분)이 제거되므로, 입력 영상(I)에서 고주파 성분이나 폐색 성분과 같은 노이즈 성분이 제거될 수 있다. 입력 영상(I)에서 λm+1Im+1내지 λnAn은 제거된 성분 또는 노이즈 성분으로 지칭될 수 있다. 인덱스 값이 작을수록 주 성분 벡터의 우선 순위가 높은 것으로 표현될 수 있다. 이 경우, 눈 추적 장치는 입력 영상에 대응하는 주 성분 벡터들(A0 내지 An) 중 높은 순위를 갖는 일부(A0 내지 Am)을 이용하여 복원 영상을 생성할 수 있다.
다시 도 3을 참조하면, 단계(320)에서 눈 추적 장치는 입력 영상과 복원 영상 간의 차이를 결정한다. 예를 들어, 눈 추적 장치는 입력 영상과 복원 영상의 대응 픽셀들을 서로 비교하여 차이 값을 결정할 수 있다. 눈 복원 과정에서 제거된 각 노이즈 성분의 계수가 클수록 입력 영상에 노이즈가 많은 것으로 해석될 수 있고, 또한 입력 영상과 복원 영상 간의 차이가 크게 결정될 수 있다. 따라서, 복원 영상이나 대체 영상이 대상 영상으로 활용될 가능성이 높아질 수 있다.
일 실시예에 따르면, 차이 값은 눈 영역을 기준으로 결정될 수 있다. 다시 말해, 눈 추적 장치는 입력 영상의 눈 영역 및 복원 영상의 눈 영역의 대응 픽셀을 서로 비교하여 차이 값을 결정할 수 있다. 눈 복원에 따라 영상 전체에 발생하는 변화를 비교하는 것보다 눈 영역에 발생하는 변화를 비교하는 것이 복원 영상이나 대체 영상의 활용에 효과적일 수 있기 때문이다.
예를 들어, 사용자가 마스크를 낀 경우 눈 추적이 가능하지만, 사용자가 선글라스를 낀 경우 눈 추적이 어려울 수 있다. 따라서, 마스크를 낀 경우가 아닌 선글라스를 낀 경우를 검출하여, 해당 경우에 복원 영상이나 대체 영상을 이용할 필요성이 높다. 이 경우, 눈 영역은 눈 검출 영역 또는 눈 추적 영역에 기초하여 결정될 수 있다.
단계(330)에서 눈 추적 장치는 차이 값과 제1 임계치를 비교한다. 차이 값이 제1 임계치보다 작은 경우, 눈 추적 장치는 단계(340)에서 입력 영상을 대상 영상으로 결정한다. 차이 값이 제1 임계치보다 큰 경우, 눈 추적 장치는 단계(350)에서 차이 값과 제2 임계치를 비교한다. 차이 값이 제2 임계치보다 작은 경우, 눈 추적 장치는 단계(360)에서 복원 영상을 대상 영상으로 결정한다. 차이 값이 제2 임계치보다 큰 경우, 눈 추적 장치는 단계(370)에서 샘플 영상들 중에 대체 영상을 선택하고, 단계(380)에서 대체 영상을 대상 영상으로 결정한다. 단계(390)에서 눈 추적 장치는 대상 영상에서 눈 추적을 수행한다.
도 6은 일 실시예에 따른 차이 값이 제2 임계치보다 작은 경우의 대상 영상 선정 동작을 나타낸 도면이다. 도 6을 참조하면, 입력 영상(610)에 관한 눈 복원에 따라 복원 영상(620)이 생성된다. 눈 복원에 따라 입력 영상(610)에서 안경의 빛 반사를 포함하는 고주파 성분이 제거되고, 복원 영상(620)은 입력 영상(610)에 비해 스무스(smooth)하게 표현될 수 있다.
눈 복원 이후에 입력 영상(610)과 복원 영상(620) 간의 차이 값이 결정될 수 있다. 차이 값이 제1 임계치보다 작은 경우 입력 영상(610)이 대상 영상으로 결정될 수 있고, 차이 값이 제1 임계치보다 크고 제2 임계치보다 작은 경우 복원 영상(620)이 대상 영상으로 결정될 수 있다. 예를 들어, 입력 영상(610)에 포함된 고주파 성분이 제거되었으므로, 복원 영상(620)이 대상 영상으로 결정될 수 있다.
도 7은 일 실시예에 따른 차이 값이 제2 임계치보다 큰 경우의 대상 영상 선정 동작을 나타낸 도면이다. 도 7을 참조하면, 입력 영상(710)에 관한 눈 복원에 따라 복원 영상(720)이 생성된다. 눈 복원에 따라 입력 영상(710)에서 선글라스의 빛 반사를 포함하는 고주파 성분 및 선글라스를 포함하는 폐색 성분이 제거되고, 복원 영상(720)은 입력 영상(710)에 비해 스무스(smooth)하게 표현될 수 있다.
눈 복원 이후에 입력 영상(710)과 복원 영상(720) 간의 차이 값이 결정될 수 있다. 차이 값이 제1 임계치보다 작은 경우 입력 영상(710)이 대상 영상으로 결정될 수 있고, 차이 값이 제1 임계치보다 크고 제2 임계치보다 작은 경우 복원 영상(720)이 대상 영상으로 결정될 수 있고, 차이 값이 제2 임계치보다 큰 경우 대체 영상(740)이 생성될 수 있다. 예를 들어, 입력 영상(710)에 포함된 폐색 성분 및 고주파 성분이 제거되었으므로, 차이 값이 제2 임계치보다 크게 결정될 수 있다.
이 경우, 입력 영상(710)과 샘플 영상들(730)의 각 샘플 영상 간의 특징 매칭이 수행될 수 있고, 샘플 영상들(730) 중 입력 영상(710)과 가장 유사한 샘플 영상이 대체 영상(740)으로 선택될 수 있다. 이후에, 대체 영상(740)이 대상 영상으로 결정되어 눈 추적에 이용될 수 있다. 샘플 영상들(730)은 눈 추적에 용이한 다양한 얼굴 영상들을 포함할 수 있다. 예를 들어, 샘플 영상들(730)은 안경이 존재하지 않는 얼굴 영상, 안경이 존재하지만 안경 내 빛 반사가 없는 영상 등을 포함할 수 있다. 도 7의 실시예에서 안경이 존재하는 샘플 영상이 선글라스가 존재하는 입력 영상(710)과 가장 유사한 것으로 결정되었으며, 이에 따라 해당 샘플 영상이 대체 영상(740)으로 선택될 수 있다.
도 8은 일 실시예에 따른 입력 영상과 샘플 영상 간의 특징 매칭 동작을 나타낸 도면이다. 도 8을 참조하면, 입력 영상(810)의 특징 점들 및 샘플 영상(820)의 특징 점들이 비교되고, 이에 따라 입력 영상(810)과 샘플 영상(820)의 유사도가 결정될 수 있다. 입력 영상의 특징 점들 및 샘플 영상(820)의 특징 점들은 각각 눈을 제외한 영역에서 추출될 수 있다. 예를 들어, 특징 점들은 코, 입, 얼굴 윤곽 등에서 추출될 수 있다. 대체 영상은 눈 위치에 선글라스나 다른 폐색이 있을 경우에 이용될 가능성이 높다. 따라서, 눈을 제외한 영역에서 특징 점들을 추출하는 것이 입력 영상과 유사한 대체 영상을 획득하고, 대체 영상으로부터 적합한 시점을 얻는데 유리할 수 있다.
도 9는 일 실시예에 따른 데이터베이스에 저장된 샘플 영상들을 나타낸 도면이다. 도 9를 참조하면, 데이터베이스(910)는 샘플 영상들(921 내지 923)을 포함한다. 데이터베이스(910)는 눈 추적 장치에 존재하거나, 눈 추적 장치와 구분되는 다른 장치에 존재할 수 있다. 데이터베이스(910)가 다른 장치에 존재하는 경우, 눈 추적 장치는 네트워크를 통해 데이터베이스(910)에 접근하여 샘플 영상들(921 내지 923)을 이용할 수 있다. 샘플 영상들(921 내지 923)은 각각 눈 추적에 적합한 상태를 가질 수 있다. 눈 추적에 적합한 상태는 고주파 성분이나 폐색 성분이 존재하지 않는 상태를 포함할 수 있다.
샘플 영상들(921 내지 923)은 과거에 눈 추적에 성공한 영상들에 해당할 수 있다. 여기서, 과거는 현재 프레임에 관한 눈 추적이 수행되기 이전 시점을 의미할 수 있다. 예를 들어, 눈 추적 장치의 제조 과정에서 눈 추적에 성공한 영상들 중에 대체 영상으로 적합한 영상들이 샘플 영상들(921 내지 923)로 선별될 수 있다. 혹은, 샘플 영상들(921 내지 923)은 이전 입력 영상의 각 프레임에 관한 눈 추적이 수행되는 과정 또는 현재 입력 영상의 이전 프레임에 관한 눈 추적이 수행되는 과정에서 저장된 것일 수 있다. 일례로, 현재 프레임 또는 현재 프레임에 대응하는 복원 영상에 기초하여 눈 추적에 성공한 경우, 현재 프레임은 미래의 대체 영상으로 활용되기 위해 데이터베이스(910)에 저장될 수 있다.
샘플 영상들(921 내지 923)에 눈 위치 정보(931 내지 933)에 매핑될 수 있다. 샘플 영상들(921 내지 923)은 과거에 눈 추적에 성공한 것들이므로, 과거 눈 추적에 성공했을 때 샘플 영상들(921 내지 923)에 관해 눈 위치 정보(931 내지 933)가 확보될 수 있다. 따라서, 샘플 영상들(921 내지 923)이 대체 영상으로 활용될 때, 샘플 영상들(921 내지 923)에서 별도로 눈을 추적하는 대신, 기 확보된 눈 위치 정보(931 내지 933)를 이용할 수 있다. 예를 들어, 입력 영상의 대체 영상으로 샘플 영상(921)이 선택된 것을 가정하면, 눈 추적 장치는 샘플 영상(921)에서 눈을 추적하여 눈 위치 정보를 생성하는 대신, 샘플 영상(921)에 매핑된 눈 위치 정보(931)를 바로 출력할 수 있다.
도 10은 일 실시예에 따른 눈 복원 기반의 눈 추적 방법을 나타낸 플로우 차트이다. 도 10을 참조하면, 눈 추적 장치는 단계(1010)에서 입력 영상에 관한 눈 복원을 수행하여 복원 영상을 생성하고, 단계(1020)에서 입력 영상과 복원 영상 간의 차이를 결정하고, 단계(1030)에서 결정된 차이에 기초하여 입력 영상, 복원 영상 및 대체 영상 중 어느 하나를 선정하여 대상 영상을 결정하고, 단계(1040)에서 대상 영상에 기초하여 눈 추적을 수행한다. 그 밖에, 도 1 내지 도 9를 통해 설명된 사항이 도 10의 눈 추적 방법에 적용될 수 있다.
도 11은 일 실시예에 따른 눈 복원 기반의 눈 추적 장치를 나타낸 블록도이다. 도 11를 참조하면, 눈 추적 장치(1100)는 눈 추적과 관련하여 본 명세서에 기술되거나 또는 도시된 하나 이상의 동작을 수행할 수 있고, 눈 위치 정보를 눈 추적 결과로서 사용자에게 제공할 수 있다.
눈 추적 장치(1100)는 하나 이상의 프로세서(1110) 및 메모리(1120)를 포함할 수 있다. 메모리(1120)는 프로세서(1110)에 연결되고, 프로세서(1110)에 의해 실행가능한 명령어들, 프로세서(1110)가 연산할 데이터 또는 프로세서(1110)에 의해 처리된 데이터를 저장할 수 있다. 메모리(1120)는 비일시적인 컴퓨터 판독가능 매체, 예컨대 고속 랜덤 액세스 메모리 및/또는 비휘발성 컴퓨터 판독가능 저장 매체(예컨대, 하나 이상의 디스크 저장 장치, 플래쉬 메모리 장치, 또는 기타 비휘발성 솔리드 스테이트 메모리 장치)를 포함할 수 있다.
프로세서(1110)는 도 1 내지 도 10을 참조하여 설명된 하나 이상의 동작을 실행하기 위한 명령어들을 실행할 수 있다. 일 실시예에 따르면, 메모리(1120)에 저장된 명령어가 프로세서(1110)에서 실행되면, 프로세서(1110)는 입력 영상에 관한 눈 복원을 수행하여 복원 영상을 생성하고, 입력 영상과 복원 영상 간의 차이를 결정하고, 결정된 차이에 기초하여 입력 영상, 복원 영상 및 대체 영상 중 어느 하나를 선정하여 대상 영상을 결정하고, 대상 영상에 기초하여 눈 추적을 수행할 수 있다.
도 12는 일 실시예에 따른 눈 추적 장치를 포함하는 전자 장치를 나타낸 도면이다. 도 12을 참조하면, 전자 장치(1200)는 도 1 내지 도 11을 통해 설명된 눈 추적 장치를 포함하거나, 도 1 내지 도 12를 통해 설명된 눈 추적 장치의 기능을 수행할 수 있다.
전자 장치(1200)는 프로세서(1210), 메모리(1220), 카메라(1230), 저장 장치(1240), 입력 장치(1250), 출력 장치(1260) 및 네트워크 인터페이스(1270)를 포함할 수 있다. 프로세서(1210), 메모리(1220), 카메라(1230), 저장 장치(1240), 입력 장치(1250), 출력 장치(1260) 및 네트워크 인터페이스(1270)는 통신 버스(1280)를 통해 서로 통신할 수 있다. 예를 들어, 전자 장치(1200)는 스마트 폰, 태블릿 PC, 노트북, 데스크톱 PC, 웨어러블 디바이스, 스마트 가전기기, 스마트 스피커, 스마트 카 등을 포함할 수 있다. 일례로, 전자 장치(1200)는 차량에 탑재되어 3차원 HUD를 위한 기능을 제공할 수 있다.
프로세서(1210)는 전자 장치(1200) 내에서 실행하기 위한 기능 및 명령어들을 실행한다. 예를 들어, 프로세서(1210)는 메모리(1220) 또는 저장 장치(1240)에 저장된 명령어들을 처리할 수 있다. 프로세서(1210)는 도 1 내지 도 11을 통하여 설명된 하나 이상의 동작을 수행할 수 있다.
메모리(1220)는 뉴럴 네트워크의 동작을 처리하기 위한 정보를 저장한다. 메모리(1220)는 컴퓨터 판독가능한 저장 매체 또는 컴퓨터 판독가능한 저장 장치를 포함할 수 있다. 메모리(1220)는 프로세서(1210)에 의해 실행하기 위한 명령어들을 저장할 수 있고, 전자 장치(1200)에 의해 소프트웨어 또는 애플리케이션이 실행되는 동안 관련 정보를 저장할 수 있다.
카메라(1230)는 정지 영상, 비디오 영상, 또는 이들 모두를 촬영할 수 있다. 카메라(1230)는 눈 추적을 위해 사용자의 얼굴을 촬영할 수 있다. 카메라(1230)는 객체들에 관한 깊이 정보를 포함하는 3차원 영상을 제공할 수도 있다.
저장 장치(1240)는 컴퓨터 판독가능한 저장 매체 또는 컴퓨터 판독가능한 저장 장치를 포함한다. 일 실시예에 따르면, 저장 장치(1240)는 메모리(1220)보다 더 많은 양의 정보를 저장하고, 정보를 장기간 저장할 수 있다. 예를 들어, 저장 장치(1240)는 자기 하드 디스크, 광 디스크, 플래쉬 메모리, 플로피 디스크 또는 이 기술 분야에서 알려진 다른 형태의 비휘발성 메모리를 포함할 수 있다. 저장 장치(1240)는 도 9의 데이터베이스(910)를 포함할 수 있다.
입력 장치(1250)는 키보드 및 마우스를 통한 전통적인 입력 방식, 및 터치 입력, 음성 입력, 및 이미지 입력과 같은 새로운 입력 방식을 통해 사용자로부터 입력을 수신할 수 있다. 예를 들어, 입력 장치(1250)는 키보드, 마우스, 터치 스크린, 마이크로폰, 또는 사용자로부터 입력을 검출하고, 검출된 입력을 전자 장치(1200)에 전달할 수 있는 임의의 다른 장치를 포함할 수 있다. 입력 장치(1250)를 통해 사용자의 지문, 홍채, 발화(speech), 음성(voice), 및 오디오 등의 데이터가 입력될 수 있다.
출력 장치(1260)는 시각적, 청각적 또는 촉각적인 채널을 통해 사용자에게 사용자 디바이스(1200)의 출력을 제공할 수 있다. 출력 장치(1260)는 예를 들어, 디스플레이, 터치 스크린, 스피커, 진동 발생 장치 또는 사용자에게 출력을 제공할 수 있는 임의의 다른 장치를 포함할 수 있다. 일례로, 출력 장치(1260)는 3차원 HUD의 구현을 위한 디스플레이 패널, 3차원 광학 레이어(패럴렉스 베리어, 렌티큘러 렌즈, 방향성 백라이트 등), 광학 시스템(거울, 렌즈 등) 등을 포함할 수 있다. 네트워크 인터페이스(1270)는 유선 또는 무선 네트워크를 통해 외부 장치와 통신할 수 있다.
이상에서 설명된 실시예들은 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치, 방법 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(Arithmetic Logic Unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(Field Programmable Gate Array), PLU(Programmable Logic Unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 실시예들이 비록 한정된 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기를 기초로 다양한 기술적 수정 및 변형을 적용할 수 있다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.

Claims (19)

  1. 입력 영상에 관한 눈 복원을 수행하여 복원 영상을 생성하는 단계;
    상기 입력 영상과 상기 복원 영상 간의 차이를 결정하는 단계;
    상기 결정된 차이에 기초하여 상기 입력 영상, 상기 복원 영상 및 대체 영상 중 어느 하나를 선정하여 대상 영상을 결정하는 단계; 및
    상기 대상 영상에 기초하여 눈 추적을 수행하는 단계
    를 포함하는 눈 추적 방법.
  2. 제1항에 있어서,
    상기 눈 복원은
    상기 입력 영상에서 노이즈 성분을 감소시키는 것을 포함하는,
    눈 추적 방법.
  3. 제1항에 있어서,
    상기 복원 영상을 생성하는 단계는
    상기 입력 영상에 대응하는 주 성분 벡터(principal component vector)들 중 높은 순위를 갖는 일부를 이용하여 상기 복원 영상을 생성하는 단계를 포함하고,
    상기 주 성분 벡터들은 각각 다양한 얼굴 영상들에 관한 주 성분 분석(principal component analysis)에 기초하여 미리 결정된 고유얼굴(eigenface)에 대응하는,
    눈 추적 방법.
  4. 제1항에 있어서,
    상기 대상 영상을 선정하는 단계는
    상기 결정된 차이가 제1 임계치보다 작은 경우, 상기 입력 영상을 상기 대상 영상으로 선정하는 단계;
    상기 결정된 차이가 제1 임계치보다 크고 제2 임계치보다 작은 경우, 상기 복원 영상을 상기 대상 영상으로 선정하는 단계; 및
    상기 결정된 차이가 상기 제2 임계치보다 큰 경우, 상기 대체 영상을 상기 대상 영상으로 선정하는 단계
    를 포함하고,
    상기 제2 임계치는 상기 제1 임계치보다 큰,
    눈 추적 방법.
  5. 제1항에 있어서,
    상기 대체 영상은 상기 입력 영상 및 상기 복원 영상과 구분되는,
    눈 추적 방법.
  6. 제1항에 있어서,
    데이터베이스에 저장된 샘플 영상들 중 상기 입력 영상과 유사도가 가장 높은 샘플 영상을 상기 대체 영상으로 선택하는 단계
    를 더 포함하는, 눈 추적 방법.
  7. 제6항에 있어서,
    상기 유사도는
    상기 입력 영상의 특징 점들과 상기 샘플 영상들의 각 샘플 영상의 특징 점들 간의 비교에 기초하여 결정되는,
    눈 추적 방법.
  8. 제7항에 있어서,
    상기 입력 영상의 상기 특징 점들 및 상기 각 샘플 영상의 상기 특징 점들은 각각 눈을 제외한 영역에서 추출된 것인,
    눈 추적 방법.
  9. 제6항에 있어서,
    상기 샘플 영상들은 과거에 눈 추적에 성공한 영상들에 해당하는, 눈 추적 방법.
  10. 제1항에 있어서,
    상기 입력 영상 또는 상기 복원 영상에 기초하여 상기 눈 추적에 성공한 경우, 상기 입력 영상을 데이터베이스에 샘플 영상으로 저장하는 단계
    를 더 포함하는, 눈 추적 방법.
  11. 제1항에 있어서,
    상기 복원된 영상을 생성하는 단계는 상기 입력 영상에 관한 눈 검출이 성공한 경우에 수행되는,
    눈 추적 방법.
  12. 제1항에 있어서,
    상기 대체 영상이 상기 대상 영상으로 선정된 경우,
    상기 눈 추적을 수행하는 단계는
    상기 대체 영상에 매핑된 눈 위치 정보를 이용하여 상기 눈 추적을 수행하는 단계를 포함하는,
    눈 추적 방법.
  13. 제1항 내지 제12항 중 어느 한 항의 방법을 수행하는 명령어들을 포함하는 하나 이상의 프로그램을 저장한 컴퓨터 판독 가능 저장매체.
  14. 프로세서; 및
    상기 프로세서에서 실행가능한 명령어들을 포함하는 메모리
    를 포함하고,
    상기 명령어들이 상기 프로세서에서 실행되면, 상기 프로세서는 입력 영상에 관한 눈 복원(eye reconstruction)을 수행하여 복원 영상을 생성하고, 상기 입력 영상과 상기 복원 영상 간의 차이를 결정하고, 상기 결정된 차이에 기초하여 상기 입력 영상, 상기 복원 영상 및 대체 영상 중 어느 하나를 선정하여 대상 영상을 결정하고, 상기 대상 영상에 기초하여 눈 추적을 수행하는,
    눈 추적 장치.
  15. 제14항에 있어서,
    상기 프로세서는
    상기 입력 영상에 대응하는 주 성분 벡터(principal component vector)들 중 높은 순위를 갖는 일부를 이용하여 상기 복원 영상을 생성하고,
    상기 주 성분 벡터들은 각각 다양한 얼굴 영상들에 관한 주 성분 분석(principal component analysis)에 기초하여 미리 결정된 고유얼굴(eigenface)에 대응하는,
    눈 추적 장치.
  16. 제14항에 있어서,
    상기 프로세서는
    상기 결정된 차이가 제1 임계치보다 작은 경우, 상기 입력 영상을 상기 대상 영상으로 선정하고,
    상기 결정된 차이가 제1 임계치보다 크고 제2 임계치보다 작은 경우, 상기 복원 영상을 상기 대상 영상으로 선정하고,
    상기 결정된 차이가 상기 제2 임계치보다 큰 경우, 상기 대체 영상을 상기 대상 영상으로 선정하고,
    상기 제2 임계치는 상기 제1 임계치보다 큰,
    눈 추적 장치.
  17. 제14항에 있어서,
    상기 프로세서는
    데이터베이스에 저장된 샘플 영상들 중 상기 입력 영상과 유사도가 가장 높은 샘플 영상을 상기 대체 영상으로 선택하는,
    눈 추적 장치.
  18. 제17항에 있어서,
    상기 유사도는 상기 입력 영상의 특징 점들과 상기 샘플 영상들의 각 샘플 영상의 특징 점들 간의 비교에 기초하여 결정되고,
    상기 입력 영상의 상기 특징 점들 및 상기 각 샘플 영상의 상기 특징 점들은 각각 눈을 제외한 영역에서 추출된 것인,
    눈 추적 장치.
  19. 제14항에 있어서,
    상기 대체 영상이 상기 대상 영상으로 선정된 경우,
    상기 눈 추적을 수행하는 단계는
    상기 대체 영상에 매핑된 눈 위치 정보를 이용하여 상기 눈 추적을 수행하는 단계를 포함하는,
    눈 추적 장치.
KR1020190163642A 2019-12-10 2019-12-10 눈 복원 기반의 눈 추적 방법 및 장치 KR20210073135A (ko)

Priority Applications (6)

Application Number Priority Date Filing Date Title
KR1020190163642A KR20210073135A (ko) 2019-12-10 2019-12-10 눈 복원 기반의 눈 추적 방법 및 장치
US16/895,600 US11327562B2 (en) 2019-12-10 2020-06-08 Method and apparatus for tracking eye based on eye reconstruction
CN202010647052.3A CN112950670A (zh) 2019-12-10 2020-07-07 眼睛跟踪方法和眼睛跟踪设备
EP20191104.7A EP3836073B1 (en) 2019-12-10 2020-08-14 Method and apparatus for tracking eye based on eye reconstruction
JP2020142548A JP2021093125A (ja) 2019-12-10 2020-08-26 目復元に基づく目追跡方法及び装置
US17/740,076 US20220269343A1 (en) 2019-12-10 2022-05-09 Method and apparatus for tracking eye based on eye reconstruction

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190163642A KR20210073135A (ko) 2019-12-10 2019-12-10 눈 복원 기반의 눈 추적 방법 및 장치

Publications (1)

Publication Number Publication Date
KR20210073135A true KR20210073135A (ko) 2021-06-18

Family

ID=72087947

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190163642A KR20210073135A (ko) 2019-12-10 2019-12-10 눈 복원 기반의 눈 추적 방법 및 장치

Country Status (5)

Country Link
US (2) US11327562B2 (ko)
EP (1) EP3836073B1 (ko)
JP (1) JP2021093125A (ko)
KR (1) KR20210073135A (ko)
CN (1) CN112950670A (ko)

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3045129B2 (ja) 1997-11-28 2000-05-29 沖電気工業株式会社 動物の個体識別装置
US7206435B2 (en) * 2002-03-26 2007-04-17 Honda Giken Kogyo Kabushiki Kaisha Real-time eye detection and tracking under various light conditions
US8472681B2 (en) 2009-06-15 2013-06-25 Honeywell International Inc. Iris and ocular recognition system using trace transforms
WO2011158463A1 (ja) * 2010-06-17 2011-12-22 パナソニック株式会社 外光映り込み判定装置、視線検出装置及び外光映り込み判定方法
JP5538160B2 (ja) * 2010-09-24 2014-07-02 パナソニック株式会社 瞳孔検出装置及び瞳孔検出方法
US9230180B2 (en) * 2013-01-18 2016-01-05 GM Global Technology Operations LLC Eyes-off-the-road classification with glasses classifier
US9239957B2 (en) 2014-04-04 2016-01-19 Fotonation Limited Image processing method and apparatus
WO2015154205A1 (en) * 2014-04-11 2015-10-15 Xiaoou Tang Methods and systems for verifying face images based on canonical images
US20160140390A1 (en) * 2014-11-13 2016-05-19 Intel Corporation Liveness detection using progressive eyelid tracking
US9704038B2 (en) * 2015-01-07 2017-07-11 Microsoft Technology Licensing, Llc Eye tracking
US9691165B2 (en) * 2015-07-24 2017-06-27 Disney Enterprises, Inc. Detailed spatio-temporal reconstruction of eyelids
CN112836664A (zh) 2015-08-21 2021-05-25 奇跃公司 使用眼睛姿态测量的眼睑形状估计
KR102415503B1 (ko) 2015-08-21 2022-07-01 삼성전자주식회사 분류기 학습 방법 및 객체 검출 방법
KR102564476B1 (ko) 2015-11-30 2023-08-07 삼성전자주식회사 영상 내의 객체 정렬 방법 및 장치
US10423830B2 (en) * 2016-04-22 2019-09-24 Intel Corporation Eye contact correction in real time using neural network based machine learning
US10739851B2 (en) 2016-04-29 2020-08-11 Tobii Ab Eye-tracking enabled wearable devices
EP3438948B1 (en) 2016-05-11 2023-08-30 Sony Group Corporation Image processing apparatus, image processing method, and mobile body
KR102476897B1 (ko) * 2016-10-05 2022-12-12 삼성전자주식회사 객체 추적 방법 및 장치, 및 이를 이용한 3d 디스플레이 장치
EP3404611A1 (en) * 2017-05-19 2018-11-21 RetinAI Medical GmbH Reducing noise in an image
KR102495359B1 (ko) 2017-10-27 2023-02-02 삼성전자주식회사 객체 트래킹 방법 및 장치
KR102410834B1 (ko) * 2017-10-27 2022-06-20 삼성전자주식회사 반사 영역을 제거하는 방법, 사용자의 눈을 추적하는 방법 및 그 장치
US11068052B2 (en) * 2019-03-15 2021-07-20 Microsoft Technology Licensing, Llc Holographic image generated based on eye position
KR20190119548A (ko) * 2019-10-02 2019-10-22 엘지전자 주식회사 이미지 노이즈 처리방법 및 처리장치
US11163995B2 (en) * 2019-12-31 2021-11-02 Logitech Europe S.A. User recognition and gaze tracking in a video system

Also Published As

Publication number Publication date
JP2021093125A (ja) 2021-06-17
US20220269343A1 (en) 2022-08-25
EP3836073B1 (en) 2023-11-29
US11327562B2 (en) 2022-05-10
EP3836073A1 (en) 2021-06-16
CN112950670A (zh) 2021-06-11
US20210173476A1 (en) 2021-06-10

Similar Documents

Publication Publication Date Title
US10621751B2 (en) Information processing device and computer program
EP3602399B1 (en) Accumulation and confidence assignment of iris codes
US9264702B2 (en) Automatic calibration of scene camera for optical see-through head mounted display
US20190197196A1 (en) Object detection and tracking
EP3226208A1 (en) Information processing device and computer program
US10595001B2 (en) Apparatus for replaying content using gaze recognition and method thereof
US20140375542A1 (en) Adjusting a near-eye display device
KR20160087167A (ko) 사용자 인증 방법 및 장치
WO2023173668A1 (zh) 一种虚拟场景中的输入识别方法、设备及存储介质
CN110895433B (zh) 用于增强现实中用户交互的方法和装置
US9265415B1 (en) Input detection
US20210133431A1 (en) Image processing method and apparatus
US20160110883A1 (en) Expectation Maximization to Determine Position of Ambient Glints
KR20210073135A (ko) 눈 복원 기반의 눈 추적 방법 및 장치
WO2022005658A1 (en) Visual interface for a computer system
KR20220067964A (ko) 카메라 시야(fov) 가장자리에서 움직임을 인식하여 전자 장치를 제어하는 방법 및 그 전자 장치
KR101828340B1 (ko) 객체 추출 방법 및 그 장치
US20210405852A1 (en) Visual interface for a computer system
KR20220013834A (ko) 영상 처리 방법 및 장치
KR20230122263A (ko) 시선 기반 촉각 인터페이스를 제공하기 위한 컴퓨터 장치 및 그의 방법