KR102450236B1 - 전자 장치, 그 제어 방법 및 컴퓨터 판독가능 기록 매체 - Google Patents

전자 장치, 그 제어 방법 및 컴퓨터 판독가능 기록 매체 Download PDF

Info

Publication number
KR102450236B1
KR102450236B1 KR1020170113647A KR20170113647A KR102450236B1 KR 102450236 B1 KR102450236 B1 KR 102450236B1 KR 1020170113647 A KR1020170113647 A KR 1020170113647A KR 20170113647 A KR20170113647 A KR 20170113647A KR 102450236 B1 KR102450236 B1 KR 102450236B1
Authority
KR
South Korea
Prior art keywords
image
gaze point
eye gaze
user
right eye
Prior art date
Application number
KR1020170113647A
Other languages
English (en)
Other versions
KR20190027079A (ko
Inventor
전강원
고성제
나태영
강문천
채성호
Original Assignee
삼성전자주식회사
고려대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사, 고려대학교 산학협력단 filed Critical 삼성전자주식회사
Priority to KR1020170113647A priority Critical patent/KR102450236B1/ko
Priority to US16/122,382 priority patent/US10817054B2/en
Publication of KR20190027079A publication Critical patent/KR20190027079A/ko
Application granted granted Critical
Publication of KR102450236B1 publication Critical patent/KR102450236B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • G06F3/013Eye tracking input arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/204Image signal generators using stereoscopic image cameras
    • H04N13/246Calibration of cameras
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • H04N13/366Image reproducers using viewer tracking
    • H04N13/383Image reproducers using viewer tracking for tracking with gaze detection, i.e. detecting the lines of sight of the viewer's eyes
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B3/00Apparatus for testing the eyes; Instruments for examining the eyes
    • A61B3/10Objective types, i.e. instruments for examining the eyes independent of the patients' perceptions or reactions
    • A61B3/113Objective types, i.e. instruments for examining the eyes independent of the patients' perceptions or reactions for determining or recording eye movement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • G06T7/74Determining position or orientation of objects or cameras using feature-based methods involving reference images or patches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/18Eye characteristics, e.g. of the iris
    • G06V40/19Sensors therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/128Adjusting depth or disparity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/204Image signal generators using stereoscopic image cameras
    • H04N13/239Image signal generators using stereoscopic image cameras using two 2D image sensors having a relative position equal to or related to the interocular distance
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/271Image signal generators wherein the generated image signals comprise depth maps or disparity maps
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • H04N13/327Calibration thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10012Stereo images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10048Infrared image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • G06T2207/30201Face
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/204Image signal generators using stereoscopic image cameras
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N2013/0074Stereoscopic image analysis
    • H04N2013/0081Depth or disparity estimation from stereoscopic image signals

Abstract

전자 장치가 개시된다. 본 전자 장치는, 사용자의 양안을 촬영한 양안 영상 및 사용자의 시선에 대응되는 방향을 이격된 거리에서 촬상한 스테레오 영상을 입력받는 입력부 및 양안 영상을 이용하여 스테레오 영상에서의 사용자의 주시점을 검출하고, 입력된 스테레오 영상에서 대응거리 맵(disparity map)을 생성하고, 생성된 대응거리 맵을 이용하여 검출된 주시점을 보정하는 프로세서를 포함한다.

Description

전자 장치, 그 제어 방법 및 컴퓨터 판독가능 기록 매체{ ELECTRONIC APPARATUS, METHOD FOR CONTROLLING THEREOF AND THE COMPUTER READABLE RECORDING MEDIUM }
본 개시는 전자 장치, 그 제어 방법 및 컴퓨터 판독가능 기록 매체에 대한 것으로, 보다 상세하게는, 3차원 공간 상에서 사용자의 주시점 검출을 위한 전자 장치, 그 제어 방법 및 컴퓨터 판독가능 기록 매체에 관한 것이다.
몇 년 전부터 전세계를 휩쓴 스마트폰, 태블릿 PC 열풍이 소비 성향을 비롯하여 생활 패턴까지 변화시키고 있다. 그만큼 요즘 IT 기기는 우리의 일상과 대단히 밀접한 관계를 맺고 있다. 그동안 영화에서나 볼 법한 신기술을 이제는 누구라도 쉽게 사용할 수 있게 되었기 때문이다. 그 가운데 대표적인 신기술 중 하나가 바로 '증강현실(Augmented Reality, AR)'이다.
사용자 시선으로부터 3차원 공간에서 사용자가 주시하는 물체를 검출하는 것은 AR(augmented reality), HUD(Head-up display) 등의 시스템에서 사람-컴퓨터 상호작용(Human-computer interaction, HCI)을 위한 기본적인 인터페이스다.
3차원 공간 상에서 사용자의 시선을 추적하는 기법은 사물 인식, 사람-컴퓨터 상호작용(HCI) 등에 중요한 요소 기술로 현재 활발히 연구되고 있다. 3차원 공간에서의 사용자 시선 추적은 기본적으로 사용자 양안을 관찰하고 그 결과를 기반으로 이루어져왔다. 하지만, 양안 관찰 결과만으로는 측정 정확도의 한계로 원거리에 있는 3차원 공간의 주시점을 정확히 찾는데 한계가 있다.
이에 최근에는 추적 성능을 향상시키고, 사물 인식, 컴퓨터 상호작용 등에 그 결과를 활용하기 위한 목적으로, 사용자와 같은 주시 방향을 촬영하는 카메라를 추가로 사용하는 방식이 활발히 연구되고 있다. 구체적으로, 양안을 관찰한 양안 시선 벡터 및 사용자 주시 방향을 촬영한 영상 간의 정교한 정합 과정이 필요한데, 사전에 정교한 정합이 이루어졌다고 해도 양안 시선 벡터의 오차, 정합 오차 등의 원인으로 3차원 공간 상의 사용자 주시점을 정확히 검출하기 어려운 문제가 있다.
이에 따라, 사용자의 3차원 공간 상에서의 주시점을 정확하게 검출하기 위해 시선 벡터의 오차를 보정하는 기술에 대한 필요성이 대두되고 있다.
본 개시는 상술한 필요성에 따라 안출된 것으로, 본 개시의 목적은 대응거리 맵(disparity map)을 이용하여 3차원 공간 상에서 사용자의 주시점을 보다 정확하게 검출하는 전자 장치, 그 제어 방법 및 컴퓨터 판독가능 기록 매체를 제공하는 데 있다.
본 개시의 일 실시 예에 따른 전자 장치는, 사용자의 양안을 촬영한 양안 영상 및 상기 사용자의 시선에 대응되는 방향을 이격된 거리에서 촬상한 스테레오 영상을 입력받는 입력부 및 상기 양안 영상을 이용하여 상기 스테레오 영상에서의 사용자의 주시점을 검출하고, 상기 입력된 스테레오 영상에서 대응거리 맵(disparity map)을 생성하고, 상기 생성된 대응거리 맵을 이용하여 상기 검출된 주시점을 보정하는 프로세서를 포함한다.
이 경우, 상기 스테레오 영상은 사용자의 좌안에 대응되는 제1 영상과 사용자의 우안에 대응되는 제2 영상을 포함하고, 상기 프로세서는, 상기 양안 영상을 이용하여 상기 제1 영상에서의 사용자의 좌안 주시점 및 상기 제2 영상에서의 우안 주시점을 검출하고, 상기 제1 영상과 상기 제2 영상을 스테레오 매칭하여 제1 대응거리 맵 및 제2 대응거리 맵을 생성하고, 상기 제1 대응거리 맵 및 상기 제2 대응거리 맵을 이용하여 상기 검출된 좌안 주시점 및 상기 검출된 우안 주시점을 보정할 수 있다.
이 경우, 상기 프로세서는, 상기 제1 대응거리 맵 및 제2 대응거리 맵을 이용하여 좌안 주시점의 대응거리와 우안 주시점의 대응거리의 차이가 최소가 되도록 상기 검출된 좌안 주시점 및 상기 검출된 우안 주시점을 보정할 수 있다.
한편, 상기 프로세서는, 상기 제1 영상 및 상기 제2 영상의 수평 편차가 보정된 상태에서 좌안 주시점의 위치 및 우안 주시점의 위치의 차이가 최소가 되도록 상기 검출된 좌안 주시점 및 상기 검출된 우안 주시점을 보정할 수 있다.
한편, 상기 프로세서는, 상기 제1 영상과 상기 제2 영상의 수직 편차를 보정하고, 보정된 제1 영상 및 보정된 제2 영상을 이용하여 스테레오 매칭을 수행할 수 있다.
한편, 상기 프로세서는, 상기 보정된 좌안 주시점과 상기 보정된 우안 주시점을 이용하여 3차원 주시점을 생성할 수 있다.
한편, 상기 프로세서는, 상기 보정된 좌안 주시점과 상기 보정된 우안 주시점을 이용하여 양안 시선 벡터 및 거리 정보를 생성할 수 있다.
한편, 상기 입력부는, 상기 사용자의 양안을 촬상하는 적외선 카메라 및 상기 사용자의 시선에 대응되는 방향을 이격된 거리에서 촬상한 스테레오 카메라를 포함할 수 있다.
한편, 본 개시의 일 실시 예에 따른 전자 장치의 제어 방법은, 사용자의 양안을 촬영한 양안 영상 및 상기 사용자의 시선에 대응되는 방향을 이격된 거리에서 촬상한 스테레오 영상을 입력받는 단계 및 상기 양안 영상을 이용하여 상기 스테레오 영상에서의 사용자의 주시점을 검출하는 단계, 상기 입력된 스테레오 영상에서 대응거리 맵(disparity map)을 생성하는 단계, 상기 생성된 대응거리 맵을 이용하여 상기 검출된 주시점을 보정하는 단계를 포함할 수 있다.
이 경우, 상기 스테레오 영상은 사용자의 좌안에 대응되는 제1 영상과 사용자의 우안에 대응되는 제2 영상을 포함하고, 상기 주시점을 검출하는 단계는, 상기 양안 영상을 이용하여 상기 제1 영상에서의 사용자의 좌안 주시점 및 상기 제2 영상에서의 우안 주시점을 검출하고, 상기 생성하는 단계는, 상기 제1 영상과 상기 제2 영상을 스테레오 매칭하여 제1 대응거리 맵 및 제2 대응거리 맵을 생성하고, 상기 보정하는 단계는, 상기 제1 대응거리 맵 및 상기 제2 대응거리 맵을 이용하여 상기 검출된 좌안 주시점 및 상기 검출된 우안 주시점을 보정할 수 있다.
이 경우, 상기 보정하는 단계는, 상기 제1 대응거리 맵 및 제2 대응거리 맵을 이용하여 좌안 주시점의 대응거리와 우안 주시점의 대응거리의 차이가 최소가 되도록 상기 검출된 좌안 주시점 및 상기 검출된 우안 주시점을 보정할 수 있다.
한편, 상기 보정하는 단계는, 상기 제1 영상 및 상기 제2 영상의 수평 편차가 보정된 상태에서 좌안 주시점의 위치 및 우안 주시점의 위치의 차이가 최소가 되도록 상기 검출된 좌안 주시점 및 상기 검출된 우안 주시점을 보정할 수 있다.
한편, 상기 제1 영상과 상기 제2 영상의 수직 편차를 보정하는 단계를 더 포함하고, 상기 생성하는 단계는, 상기 보정된 제1 영상 및 보정된 제2 영상을 이용하여 스테레오 매칭을 수행할 수 있다.
한편, 상기 보정된 좌안 주시점과 상기 보정된 우안 주시점을 이용하여 3차원 주시점을 생성하는 단계를 더 포함할 수 있다.
한편, 상기 보정된 좌안 주시점과 상기 보정된 우안 주시점을 이용하여 양안 시선 벡터 및 거리 정보를 생성하는 단계를 더 포함할 수 있다.
한편, 상기 입력받는 단계는, 적외선 카메라를 이용하여 상기 사용자의 양안을 촬상하고, 상기 사용자의 시선에 대응되는 방향을 이격된 거리에서 촬상할 수 있다.
한편, 본 개시의 일 실시 예에 따른 전자 장치의 제어 방법을 실행하기 위한 프로그램을 포함하는 컴퓨터 판독가능 기록 매체에 있어서, 상기 제어 방법은, 사용자의 양안을 촬영한 양안 영상 및 상기 사용자의 시선에 대응되는 방향을 이격된 거리에서 촬상한 스테레오 영상을 입력받는 단계 및 상기 양안 영상을 이용하여 상기 스테레오 영상에서의 사용자의 주시점을 검출하는 단계, 상기 입력된 스테레오 영상에서 대응거리 맵(disparity map)을 생성하는 단계, 상기 생성된 대응거리 맵을 이용하여 상기 검출된 주시점을 보정하는 단계를 포함한다.
도 1은 본 개시의 일 실시 예에 따른 3차원 공간 상의 사용자의 주시점을 검출하기 위한 시스템을 설명하기 위한 도면,
도 2는 본 개시의 일 실시 예에 따른 전자 장치의 간략한 구성을 설명하기 위한 블럭도,
도 3은 도 2의 전자 장치의 구성을 구체적으로 나타낸 블럭도,
도 4는 본 개시의 일 실시 예에 따른 대응거리 맵을 설명하기 위한 도면,
도 5는 본 개시의 일 실시 예에 따른 주시점 보정 방법을 설명하기 위한 도면,
도 6은 스테레오 영상 내 검출된 주시점을 설명하기 위한 도면,
도 7은 도 6의 주시점을 본 개시의 일 실시 예에 따라 보정한 주시점을 설명하기 위한 도면, 그리고,
도 8은 본 개시의 일 실시 예에 따른 주시점 보정 방법을 설명하기 위한 흐름도이다.
본 명세서에서 사용되는 용어에 대해 간략히 설명하고, 본 개시에 대해 구체적으로 설명하기로 한다.
본 개시의 실시 예에서 사용되는 용어는 본 개시에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 개시의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 개시에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 개시의 전반에 걸친 내용을 토대로 정의되어야 한다.
본 개시의 실시 예들은 다양한 변환을 가할 수 있고 여러 가지 실시 예를 가질 수 있는바, 특정 실시 예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나 이는 특정한 실시 형태에 대해 범위를 한정하려는 것이 아니며, 발명된 사상 및 기술 범위에 포함되는 모든 변환, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 실시 예들을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.
제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 구성요소들은 용어들에 의해 한정되어서는 안 된다. 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "구성되다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
본 개시의 실시 예에서 '모듈' 혹은 '부'는 적어도 하나의 기능이나 동작을 수행하며, 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다. 또한, 복수의 '모듈' 혹은 복수의 '부'는 특정한 하드웨어로 구현될 필요가 있는 '모듈' 혹은 '부'를 제외하고는 적어도 하나의 모듈로 일체화되어 적어도 하나의 프로세서로 구현될 수 있다.
아래에서는 첨부한 도면을 참고하여 본 개시의 실시 예에 대하여 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 개시는 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시 예에 한정되지 않는다. 그리고 도면에서 본 개시를 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
이하에서는 도면을 참조하여 본 개시에 대해 더욱 상세히 설명하기로 한다.
도 1은 본 개시의 일 실시 예에 따른 3차원 공간 상의 사용자의 주시점(watch point)을 검출하기 위한 시스템을 설명하기 위한 도면이다.
도 1을 참조하면, 본 개시의 일 실시 예에 따른 사용자(10)의 주시점을 검출하는 시스템은 사용자(10)의 양안을 촬영하는 복수의 카메라(111, 112) 및 사용자(10)가 주시하고 있는 방향을 촬영하는 복수의 카메라(113, 114)를 포함할 수 있다.
구체적으로, 사용자(10)의 양안을 촬영하는 복수의 카메라(111, 112)는 사용자(10)의 좌안을 촬영하는 카메라(111) 및 사용자(10)의 우안을 촬영하는 카메라(112)를 포함할 수 있다. 이때, 사용자(10)의 양안을 촬영하는 복수의 카메라(111, 112)는 사용자(10)의 시선을 검출하기 위한 것일 수 있다. 이때, 사용자(10)의 양안을 촬영하는 복수의 카메라(111, 112)는 적외선 카메라 또는 가시광선을 이용한 일반 카메라일 수 있다.
한편, 도 1에서는 복수의 카메라 사용자(10)의 양안을 각각 촬영하는 것으로 도시하였지만, 실제 구현시에는 하나의 카메라를 이용하여 사용자의 양안을 함께 촬영하고, 양안이 함께 촬영된 영상에서 사용자(10)의 좌안 및 우안의 시선이 각각 검출될 수 있다.
한편, 사용자(10)가 주시하고 있는 방향을 촬영하는 복수의 카메라(113, 114)는 사용자(10)의 좌안이 주시하는 방향을 촬영하는 카메라(113) 및 사용자(10)의 우안이 주시하는 방향을 촬영하는 카메라(114)를 포함할 수 있다. 이때, 사용자(10)가 주시하고 있는 방향을 촬영하는 복수의 카메라(113, 114)는 사용자(10)가 보고 있는 것으로 추정되는 영역의 영상을 촬영하기 위한 것이다. 이때, 사용자(10)가 주시하고 있는 방향을 촬영하는 복수의 카메라(113, 114)는 입체 영상을 얻기 위한 스테레오 카메라일 수 있다.
한편, 3차원 공간 상에서 사용자의 주시점(watch point)을 검출하기 위한 시스템은, 사용자(10)의 양안을 촬영하는 복수의 카메라(111, 112)에 의해 촬영된 사용자(10)의 양안 영상 및 사용자(10)가 주시하고 있는 방향을 촬영하는 복수의 카메라(113, 114)에 의해 촬영된 스테레오 영상을 이용하여 스테레오 영상 내 사용자의 주시점을 검출하고, 스테레오 영상으로 생성한 대응거리 맵(disaprity map)을 이용하여 검출된 주시점을 보정할 수 있다. 한편, 검출된 주시점을 보정하는 방법은 이하 도 2 내지 도 8을 참조하여 자세히 설명하기로 한다.
도 2는 본 개시의 일 실시 예에 따른 전자 장치의 간략한 구성을 설명하기 위한 블럭도이다.
도 2를 참조하면, 전자 장치(100)는 입력부(110) 및 프로세서(120)를 포함한다.
입력부(110)는 사용자의 양안을 촬영한 양안 영상을 입력받을 수 있다. 이때, 입력부(110)는 사용자의 양안을 각각 촬영한 복수의 영상을 입력받거나, 사용자의 양안을 동시에 촬영한 하나의 영상을 입력받을 수 있다.
구체적으로, 입력부(110)는 사용자의 양안을 촬영하기 위한 적어도 하나의 카메라를 포함할 수 있다. 이때, 입력부(110)는 사용자의 양안을 동시에 촬영하면 적어도 하나의 카메라를 포함할 수 있고, 사용자의 양안을 각각 촬영하면, 적어도 둘 이상의 카메라를 포함할 수 있다. 이때, 입력부(110)는 적외선 카메라 또는 가시광선을 이용한 일반 카메라 등으로 사용자의 양안을 촬영할 수 있다.
그리고, 입력부(110)는 사용자의 시선에 대응되는 방향을 이격된 거리에서 촬상한 스테레오 영상을 입력받을 수 있다.
구체적으로, 입력부(110)는 사용자의 좌안의 시선에 대응되는 방향을 촬영하기 위한 카메라 및 사용자의 우안의 시선에 대응되는 방향을 촬영하기 위한 카메라를 포함할 수 있다. 이때, 사용자의 시선에 대응되는 방향을 각각 촬상한 복수의 영상을 스테레오 영상이라고 지칭할 수 있다. 이때, 스테레오 영상은 사용자의 좌안에 대응되는 좌안 영상 및 사용자의 우안에 대응되는 우안 영상을 포함할 수 있다. 그리고, 실제로 사용자의 좌안 및 우안 사이의 거리에 의해 좌안 및 우안이 보는 영역에 차이가 존재하는 바, 제1 영상 및 제2 영상 또한 각 영상 내 대응되는 점의 위치가 차이나도록 생성될 수 있다.
한편, 전자 장치(100)에 카메라가 구비되지 않으면, 입력부(110)는 외부 카메라로부터 양안 영상 및 스테레오 영상을 수신하는 통신부(미도시)를 포함할 수 있다.
프로세서(120)는 입력부(110)에 의해 수신된 양안 영상을 이용하여 스테레오 영상에서의 사용자의 주시점을 검출할 수 있다. 구체적으로, 프로세서(120)는 수신된 양안 영상에서 검출된 좌안의 시선 벡터를 이용하여 좌안에 대응되는 좌안 영상 내, 좌안이 주시하고 있는 좌안 주시점을 검출할 수 있다. 그리고, 프로세서(120)는 수신된 양안 영상에서 검출된 우안의 시선 벡터를 이용하여 우안에 대응되는 우안 영상 내, 우안이 주시하고 있는 우안 주시점을 검출할 수 있다.
그리고, 프로세서(120)는 스테레오 영상을 이용하여 대응거리 맵(disparity map)을 생성할 수 있다. 구체적으로, 프로세서(120)는 좌안 영상 및 우안 영상 각각에 대한 대응거리 맵을 생성할 수 있다. 구체적으로, 프로세서(120)는 좌안 영상 및 우안 영상을 스테레오 매칭하여 각각의 영상에 대한 대응거리 맵을 생성할 수 있다. 여기서, 스테레오 매칭이란 서로 다른 시점의 두 영상의 대응점의 위치가 차이나는 정도를 이용해 거리 정보를 추출하는 것을 의미할 수 있다.
이는 좌안 및 우안 사이의 거리에 의해 좌안 및 우안이 보이는 영역에 차이가 있음을 반영한 것으로, 영상 내 동일한 객체가 가까이 있으면, 두 영상에서의 객체의 위치의 차이가 크고, 동일한 객체가 멀리 있으면, 두 영상에서의 객체의 위치의 차이가 작은 것을 이용하여 맵을 생성한 것이다. 이와 같이, 대응거리 맵을 이용하면, 영상 내 객체와 카메라가 놓인 위치 사이의 거리 정보를 알 수 있다.
이때, 프로세서(120)는 입력된 스테레오 영상인 좌안 영상 및 우안 영상의 수직 편차를 보정할 수 있다. 이로 인해, 수직 편차가 보정된 좌안 영상 및 보정된 우안 영상 사이의 대응점의 위치는 좌우 편차만이 존재하여 보다 정확한 주시점 검출이 가능해진다. 그리고, 프로세서(120)는 보정된 좌안 영상 및 우안 영상을 스테레오 매칭하여 좌안 영상 및 우안 영상 각각에 대한 대응거리 맵을 생성할 수 있다.
프로세서(120)는 생성된 대응거리 맵을 이용하여 검출된 주시점을 보정할 수 있다. 구체적으로, 프로세서(120)는 좌안 영상에 대하여 생성된 대응거리 맵 및 우안 영상에 대하여 생성된 대응거리 맵을 이용하여, 좌안 주시점의 위치 및 우안 주시점의 위치를 보정할 수 있다.
구체적으로, 프로세서(120)는 검출된 좌안 주시점 및 우안 주시점을 중심으로 주시점 각각에 대한 보정 가능한 범위를 산출하고, 산출된 범위 내에서 좌안 주시점 및 우안 주시점을 보정할 수 있다.
구체적으로, 프로세서(120)는 좌안 주시점 및 우안 주시점의 위치의 차이가 최소가 되도록 검출된 좌안 주시점 및 검출된 우안 주시점의 위치를 보정할 수 있다. 구체적으로, 프로세서(120)는 좌안 영상 및 우안 영상의 수평 편차를 보정한 상태에서, 수평 편차가 보정된 좌안 영상 내의 좌안 주시점의 위치 및 수평 편차가 보정된 우안 영상 내의 우안 주시점의 위치의 차이가 최소가 되도록 검출된 좌안 주시점 및 검출된 우안 주시점의 위치를 보정할 수 있다. 한편, 좌안 영상 및 우안 영상의 수평 편차를 보정하지 않은 상태에서는, 프로세서(120)는 좌안 영상 및 우안 영상 내의 대응점의 위치 차이에 수렴하도록 검출된 좌안 주시점 및 검출된 우안 주시점의 위치를 보정할 수 있다.
그리고, 프로세서(120)는 좌안 영상에 대하여 생성된 대응거리 맵 및 우안 영상에 대하여 생성된 대응거리 맵을 이용하여 좌안 주시점 및 우안 주시점의 대응거리의 차이가 최소가 되도록 검출된 좌안 주시점 및 검출된 우안 주시점의 위치를 보정할 수 있다. 이는 2차원 영상 상에서는 거리의 차이가 크지 않더라도, 객체의 경계를 기준으로 다른 영역 상에 주시점이 각각 검출된다면, 이는 사용자가 주시하고 있는 주시점으로 결정하기는 어렵기 때문이다.
한편, 프로세서(120)는 산출된 보정 가능한 영역 내에서 상술한 보정 방식을 반영한 다음과 같은 식(1)을 만족하는 최적의 보정된 좌안 주시점(
Figure 112017086383549-pat00001
) 및 보정된 우안 주시점(
Figure 112017086383549-pat00002
)을 선택할 수 있다.
Figure 112017086383549-pat00003
(1)
여기서, x1' 및 x2'는 수직 편차가 보정된 스테레오 영상 각각에서 검출된 좌안 주시점 및 우안 주시점의 위치, M1(x) 및 M2(x)는 수직 편차가 보정된 스테레오 영상 각각 내 특정 위치에서의 대응거리(disparity) 값,
Figure 112017086383549-pat00004
는 수직 편차가 보정된 스테레오 영상에서 보정된 좌안 주시점(
Figure 112017086383549-pat00005
) 및 보정된 우안 주시점(
Figure 112017086383549-pat00006
)의 상대적 좌표 차이를 의미할 수 있다.
식(1)를 참조하면, 프로세서(120)는 검출된 주시점과 보정된 주시점의 위치 변화가 최소이면서, 각 대응거리 맵 내 주시점의 대응거리의 차이가 최소이도록
Figure 112017086383549-pat00007
Figure 112017086383549-pat00008
를 선택할 수 있다.
그리고, 프로세서(120)는 보정된 좌안 주시점의 대응거리 및 보정된 우안 주시점의 대응거리 각각과 보정된 좌안 주시점(
Figure 112017086383549-pat00009
) 및 보정된 우안 주시점(
Figure 112017086383549-pat00010
)의 상대적 좌표 차이의 차가 최소이도록
Figure 112017086383549-pat00011
Figure 112017086383549-pat00012
를 선택할 수 있다. 이는 주시점의 대응거리가 스테레오 영상 내 각 대응점의 차이에 의해 산출되기 때문이다.
그리고, 프로세서(120)는 보정된 좌안 주시점과 보정된 우안 주시점을 이용하여 3차원 주시점을 생성할 수 있다. 구체적으로, 스테레오 영상에서 1차적으로 검출된 좌안 주시점과 우안 주시점이 정합되지 않아 3차원 주시점은 생성될 수 없거나 부정확한 위치에 생성되었으나, 보정된 좌안 주시점과 보정된 우안 주시점을 이용하여 보다 정확한 3차원 주시점을 생성할 수 있다.
그리고, 프로세서(120)는 보정된 좌안 주시점과 보정된 우안 주시점을 이용하여 양안 시선 벡터 및 거리 정보를 생성할 수 있다. 구체적으로, 프로세서(120)는 생성된 3차원 주시점에 대한 양안 시선 벡터 및 거리 정보를 생성할 수 있다.
상술한 바와 같이, 대응거리 맵을 이용하여 좌안 주시점 및 우안 주시점을 각각 보정함에 따라 3차원 공간 내에서 보다 정확한 사용자의 주시점을 검출할 수 있게 된다.
도 3은 도 2의 전자 장치의 구성을 구체적으로 나타낸 블럭도이다.
도 3을 참조하면, 전자 장치(100)는 입력부(110), 프로세서(120), 메모리(130), 통신부(140), 디스플레이(150) 및 비디오 프로세서(160)를 포함할 수 있다. 여기서, 입력부(110) 및 프로세서(120)의 일부 동작은 도 2에 도시된 구성과 동일한 바, 중복된 기재는 생략한다.
프로세서(120)는 프로세서(120)는 RAM(121), ROM(122), CPU(123), GPU(Graphic Processing Unit)(124), 버스(125)를 포함할 수 있다. RAM(121), ROM(122), CPU(123), GPU(Graphic Processing Unit)(124) 등은 버스(125)를 통해 서로 연결될 수 있다.
CPU(123)는 메모리(140)에 액세스하여, 메모리(140)에 저장된 O/S를 이용하여 부팅을 수행한다. 그리고 메모리(140)에 저장된 각종 프로그램, 컨텐츠, 데이터 등을 이용하여 다양한 동작을 수행한다.
ROM(122)에는 시스템 부팅을 위한 명령어 세트 등이 저장된다. 턴-온 명령이 입력되어 전원이 공급되면, CPU(123)는 ROM(122)에 저장된 명령어에 따라 메모리(180)에 저장된 O/S를 RAM(121)에 복사하고, O/S를 실행시켜 시스템을 부팅시킨다. 부팅이 완료되면, CPU(123)는 메모리(140)에 저장된 각종 프로그램을 RAM(121)에 복사하고, RAM(121)에 복사된 프로그램을 실행시켜 각종 동작을 수행한다.
GPU(124)는 전자 장치(100)의 부팅이 완료되면, 디스플레이(170)에 UI를 디스플레이한다. 구체적으로는, GPU(124)는 연산부(미도시) 및 렌더링부(미도시)를 이용하여 아이콘, 이미지, 텍스트 등과 같은 다양한 객체를 포함하는 화면을 생성할 수 있다. 연산부는 화면의 레이아웃에 따라 각 객체들이 표시될 좌표값, 형태, 크기, 컬러 등과 같은 속성값을 연산한다. 렌더링부는 연산부에서 연산한 속성값에 기초하여 객체를 포함하는 다양한 레이아웃의 화면을 생성한다. 렌더링부에서 생성된 화면(또는 사용자 인터페이스 창)은 디스플레이로 제공되어, 메인 표시 영역 및 서브 표시 영역에 각각 표시된다. 한편, 이상에서는 본 개시에 따른 영상 처리 동작이 GPU(124)에 의해 수행되는 것으로 설명하였지만, 실제 구현시에는 CPU(123) 또는 GPU(124)에서 수행될 수 있다.
메모리(130)는 전자 장치(100) 내의 저장 매체 및 외부 저장 매체, 예를 들어, USB 메모리를 포함한 Removable Disk, 네트워크를 통한 웹서버(Web server) 등으로 구현될 수 있다. 구체적으로, 메모리(130)는 하드 디스크, SSD, 메모리 카드, ROM, USB 메모리 등을 포함할 수 있다.
구체적으로, 메모리(130)는 입력부(110)를 통해 입력된 양안 영상 및 스테레오 영상을 이용하여 검출된 양안 주시점에 대한 정보를 저장할 수 있다. 그리고, 메모리(130)는 스테레오 영상에 대하여 각각 생성된 대응거리 맵을 저장할 수 있다. 그리고, 메모리(130)는 프로세서(130)에 의해 대응거리 맵을 이용하여 보정된 양안 주시점에 대한 정보를 저장할 수 있다.
그리고, 메모리(130)는 보정된 양안 주시점을 이용하여 생성된 3차원 주시점에 대한 정보를 저장할 수 있다. 구체적으로, 3차원 주시점에 대한 정보는 스테레요 영상 내에서의 위치 정보 및 거리 정보를 포함할 수 있다. 여기서 스테레오 영상 내에서의 위치 정보는 양안 시선 벡터에 대한 정보를 포함할 수 있다.
통신부(140)는 다양한 유형의 통신 방식에 따라 다양한 유형의 외부 기기와 통신을 수행하는 구성이다. 구체적으로, 통신부(140)는 외부의 촬상 장치, 외부 서버, 외부의 디스플레이 장치 등과 같은 외부 장치와 통신을 수행할 수 있다.
구체적으로, 통신부(140)는 외부 장치로부터 안테나, 케이블 또는 포트와 같은 유선 방식을 통하여 복수의 이미지를 입력받거나, 와이파이(Wi-Fi), 블루투스와 같은 무선 방식을 통하여 복수의 이미지를 입력받을 수 있다.
그리고, 통신부(140)는 프로세서(120)의 동작에 의해 보정된 양안 주시점에 대한 정보 및 보정된 양안 주시점에 의해 생성된 3차원 주시점에 대한 정보를 외부 장치에 전송할 수 있다.
한편, 도 3에서는 입력부(110)와 통신부(140)가 별도의 구성인 것으로 도시되어 있으나, 전자 장치(100)에 촬상부가 구비되어 있지 않거나, 설정에 의해 입력부(110)는 통신부(140)의 기능을 일부 또는 전부 포함하는 구성일 수 있다.
디스플레이(150)는 생성된 3차원 주시점에 대응되는 영상을 표시할 수 있다. 구체적으로, 디스플레이(150)는 스테레오 영상을 이용하여 생성된 입체 영상 상에서 사용자가 주시하고 있는 3차원 주시점에 대응되는 위치에 커서 등을 더 표시할 수 있다.
비디오 프로세서(160)는 전자 장치(100)에 디스플레이(150)가 구비된 경우, 통신부(140)를 통해 수신된 컨텐츠 또는, 메모리(130)에 저장된 컨텐츠에 포함된 비디오 데이터를 처리하기 위한 구성요소이다. 비디오 프로세서(160)에서는 비디오 데이터에 대한 디코딩, 스케일링, 노이즈 필터링, 프레임 레이트 변환, 해상도 변환, 스테레오 영상을 이용한 입체 영상으로의 변환 등과 같은 다양한 이미지 처리를 수행할 수 있다.
그리고, 비디오 프로세서(160)는 프로세서(120)에 의해 검출된 사용자의 시선에 기초하여 비디오 데이터에 대한 이미지 처리를 수행할 수 있다. 구체적으로, 비디오 프로세서(160)는 보정된 양안 주시점에 의해 생성된 3차원 주시점에 기초하여 수신된 입체 영상 상에 커서 등을 표시하도록 이미지 처리를 수행할 수 있다.
도 4는 본 개시의 일 실시 예에 따른 대응거리 맵을 설명하기 위한 도면이다. 구체적으로, 전자 장치는 스테레오 영상을 구성하는 좌안 영상 및 우안 영상을 이용하여 좌안 영상 및 우안 영상 각각에 대한 대응거리 맵을 생성할 수 있다.
도 4a는 스테레오 영상을 구성하는 좌안 영상 및 우안 영상 중 하나의 영상이고, 도 4b는 도 4a에 도시된 영상에 대응되는 대응거리 맵이다.
구체적으로, 대응거리 맵은 거리에 대응되는 그레이 값으로 표현될 수 있다. 도 4b를 참조하면, 전자 장치는 좌안 영상 및 우안 영상의 대응점의 위치 차이가 클수록 밝은 그레이 값으로 표현하고, 대응점의 위치 차이가 작을수록 어두운 그레이 값으로 표현하여 대응거리 맵을 생성할 수 있다. 이에 따라, 전자 장치는 대응거리 맵 내 특정 지점의 그레이 값을 이용하여 특정 지점에 위치하는 객체와 촬상 지점 사이의 거리 정보를 산출할 수 있다.
도 5는 본 개시의 일 실시 예에 따른 주시점 보정 방법을 설명하기 위한 도면이다.
도 5를 참조하면, 스테레오 카메라(113, 114)는 사용자의 시선에 대응되는 방향을 촬상하여 스테레오 영상(510, 520)을 생성할 수 있다. 구체적으로, 좌안에 대응되는 카메라(113)는 좌안 영상(510)을 생성하고, 우안에 대응되는 카메라(114)는 우안 영상(520)을 생성할 수 있다. 여기서, 좌안에 대응되는 카메라(113) 및 우안에 대응되는 카메라(114)는 좌안 및 우안 사이의 거리에 대응되는 거리만큼 이격되어 있을 수 있다. 그리고, 좌안 영상(510) 및 우안 영상(520) 내 대응점의 위치 차이는 좌안 및 우안 사이의 거리에 대응될 수 있다.
전자 장치는 양안 영상을 이용하여 좌안 영상(510) 내 좌안 주시점(X1)을 검출하고, 우안 영상(520) 내 우안 주시점(X2)을 검출할 수 있다. 그러나, 검출된 좌안 주시점(X1) 및 검출된 우안 주시점(X2)을 정합하여 3차원 공간 상의 주시점을 산출하면, 3차원 공간 상의 좌안 주시점(11) 및 3차원 공간 상의 우안 주시점(12)이 일치하지 않을 수 있으며, 이에 따라 전자 장치는 3차원 공간 상의 정확한 주시점을 산출할 수 없을 수 있다.
이에 따라 전자 장치는 좌안 영상(510)에 대한 대응거리 맵(530) 및 우안 영상(520)에 대한 대응거리 맵(540)을 생성할 수 있다. 그리고, 생성된 대응거리 맵(530, 540)을 이용하여 검출된 좌안 주시점(X1) 및 검출된 우안 주시점(X2)을 각각 보정할 수 있다.
구체적으로, 전자 장치는 대응거리 맵(530, 540)을 이용하여 검출된 좌안 주시점(X1) 및 검출된 우안 주시점(X2)의 대응 거리를 각각 산출할 수 있다. 도 5를 참조하면, 검출된 좌안 주시점(X1)의 대응 거리는 멀고 검출된 우안 주시점(X2)의 대응 거리는 가까운 바, 전자 장치는 주시점이 잘못 검출된 것으로 판단할 수 있다.
그리고, 전자 장치는 검출된 좌안 주시점(X1) 및 검출된 우안 주시점(X2)을 기준으로 보정 가능한 범위를 각각 설정하고, 보정 가능한 범위 내에서 가장 적합한 좌안 주시점(
Figure 112017086383549-pat00013
) 및 우안 주시점(
Figure 112017086383549-pat00014
)을 선택할 수 있다. 주시점을 보정하는 동작에 대해서는 도 1에 대한 설명에 기재되었는 바, 중복된 기재는 생략하기로 한다.
그리고, 전자 장치는 선택된 좌안 주시점(
Figure 112017086383549-pat00015
) 및 선택된 우안 주시점(
Figure 112017086383549-pat00016
)으로 주시점을 보정할 수 있다. 그리고 전자 장치는 보정된 좌안 주시점(
Figure 112017086383549-pat00017
) 및 보정된 우안 주시점(
Figure 112017086383549-pat00018
)을 이용하여 3차원 공간 상의 주시점(13)을 생성할 수 있다. 도 5를 참조하면, 보정된 좌안 주시점(
Figure 112017086383549-pat00019
)을 이용하여 생성된 3차원 공간 상의 주시점 및 보정된 우안 주시점(
Figure 112017086383549-pat00020
)을 이용하여 생성된 3차원 공간 상의 주시점은 일치하는 바, 전자 장치는 생성된 3차원 공간 상의 주시점에 대한 정보를 생성할 수 있다. 이때, 생성되는 정보는 3차원 공간 상의 주시점에 대한 양안 시선 벡터 및 거리 정보를 포함할 수 있다.
도 6은 스테레오 영상 내 검출된 주시점을 설명하기 위한 도면이다. 구체적으로 도 6a는 좌안 영상(610)이고, 도 6b는 우안 영상(620)일 수 있다. 그리고, 도 7은 도 6의 주시점을 본 개시의 일 실시 예에 따라 보정한 주시점을 설명하기 위한 도면이다. 구체적으로 도 7a는 좌안 영상(610)이고, 도 7b는 우안 영상(620)일 수 있다.
도 6을 참조하면, 좌안 영상(610)에서 검출된 좌안 주시점(611)은 객체 상에 위치한다. 반면, 우안 영상(620)에서 검출된 우안 주시점(621)은 객체 밖에 위치한다.
전자 장치는 좌안 영상(610) 및 우안 영상(620) 각각에 대한 대응거리 맵을 생성하고, 생성된 대응거리 맵을 이용하여 좌안 주시점(611) 및 우안 주시점(621)의 대응거리가 일치하지 않음을 판단할 수 있다. 그리고, 전자 장치는 대응거리 맵을 이용하여 좌안 주시점(611) 및 우안 주시점(621)을 보정할 수 있다.
구체적으로, 전자 장치는 좌안 주시점(611) 및 우안 주시점(621)을 기준으로 보정 가능한 영역을 각각 설정하고, 보정 가능한 영역 내에서 보정 거리가 최소이고, 보정된 각 주시점의 대응거리의 차이가 최소이도록 가장 적합한 좌안 주시점 및 우안 주시점을 각각 선택할 수 있다.
전자 장치는 좌안 주시점 및 우안 주시점을 선택된 좌안 주시점 및 우안 주시점으로 보정할 수 있다. 본 개시에 따른 보정을 수행한 결과, 도 7에 도시된 바와 같이 좌안 영상(610)에서의 보정된 좌안 주시점(613)은 객체 상에 위치하고, 우안 영상(620)에서의 보정된 우안 주시점(622) 또한 객체 상에 위치하게 된다.
이와 같이, 전자 장치는 좌안 영상(610) 및 우안 영상(620)의 수평 편차를 보정한 상태에서 보정된 좌안 주시점(613) 및 보정된 우안 주시점(622)의 위치 차이가 최소가 되고, 보정된 좌안 주시점(613) 및 보정된 우안 주시점(622)의 대응거리의 차이가 최소가 되도록 보정을 수행할 수 있다.
도 8은 본 개시의 일 실시 예에 따른 주시점 보정 방법을 설명하기 위한 흐름도이다.
전자 장치는 우선 사용자의 양안을 촬영한 양안 영상 및 사용자의 시선에 대응되는 방향을 이격된 거리에서 촬상한 스테레오 영상을 입력받을 수 있다(S810). 구체적으로, 전자 장치는 구비된 복수의 카메라를 이용하여 양안 영상 및 스테레오 영상을 촬상할 수 있다. 한편, 전자 장치에 카메라가 구비되지 않은 경우 외부 장치를 통해 양안 영상 및 스테레오 영상 중 적어도 하나를 수신할 수 있다.
그 다음, 전자 장치는 양안 영상을 이용하여 사용자의 주시점을 검출할 수 있다(S820). 구체적으로, 전자 장치는 양안 영상을 이용하여 스테레오 영상에서의 사용자의 주시점을 검출할 수 있다.
그리고, 전자 장치는 입력된 스테레오 영상에서 대응거리 맵을 생성할 수 있다(S830). 구체적으로, 전자 장치는 스테레오 영상을 구성하는 좌안 영상 및 우안 영상을 이용하여 좌안 영상 및 우안 영상에 대한 대응거리 맵을 각각 생성할 수 있다. 이때, 전자 장치는 좌안 영상 및 우안 영상 내 대응점의 위치 차이를 이용하여 대응거리 맵을 생성할 수 있다.
그 다음, 전자 장치는 생성된 대응거리 맵을 이용하여 검출된 주시점을 보정할 수 있다(S840). 구체적으로, 전자 장치는 좌안 영상에 대하여 생성된 대응거리 맵을 및 우안 영상에 대하여 생성된 대응거리 맵을 이용하여, 좌안 영상에서 검출된 좌안 주시점 및 우안 영상에서 검출된 우안 주시점을 보정할 수 있다. 이때, 전자 장치는 좌안 주시점 및 우안 주시점을 한 번에 보정할 수 있다.
상술한 바와 같이, 대응거리 맵을 이용하여 좌안 주시점 및 우안 주시점을 보정함에 따라 3차원 공간 내에서 보다 정확한 사용자의 주시점을 검출할 수 있게 된다.
한편, 이상에서 설명된 다양한 실시 예들은 소프트웨어(software), 하드웨어(hardware) 또는 이들의 조합된 것을 이용하여 컴퓨터(computer) 또는 이와 유사한 장치로 읽을 수 있는 기록 매체 내에서 구현될 수 있다. 하드웨어적인 구현에 의하면, 본 개시에서 설명되는 실시 예들은 ASICs(Application Specific Integrated Circuits), DSPs(digital signal processors), DSPDs(digital signal processing devices), PLDs(programmable logic devices), FPGAs(field programmable gate arrays), 프로세서(processors), 제어기(controllers), 마이크로 컨트롤러(micro-controllers), 마이크로 프로세서(microprocessors), 기타 기능 수행을 위한 전기적인 유닛(unit) 중 적어도 하나를 이용하여 구현될 수 있다. 일부의 경우에 본 명세서에서 설명되는 실시 예들이 프로세서(120) 자체로 구현될 수 있다. 소프트웨어적인 구현에 의하면, 본 명세서에서 설명되는 절차 및 기능과 같은 실시 예들은 별도의 소프트웨어 모듈들로 구현될 수 있다. 상기 소프트웨어 모듈들 각각은 본 명세서에서 설명되는 하나 이상의 기능 및 작동을 수행할 수 있다.
한편, 상술한 본 개시의 다양한 실시 예들에 따른 전자 장치의 제어 방법은 비일시적 판독 가능 매체(non-transitory readable medium) 에 저장될 수 있다. 이러한 비일시적 판독 가능 매체는 다양한 장치에 탑재되어 사용될 수 있다.
비일시적 판독 가능 매체란 레지스터, 캐쉬, 메모리 등과 같이 짧은 순간 동안 데이터를 저장하는 매체가 아니라 반영구적으로 데이터를 저장하며, 기기에 의해 판독(reading)이 가능한 매체를 의미한다. 구체적으로는, 상술한 다양한 방법을 수행하기 위한 프로그램들은 CD, DVD, 하드 디스크, 블루레이 디스크, USB, 메모리카드, ROM 등과 같은 비일시적 판독 가능 매체에 저장되어 제공될 수 있다.
또한, 이상에서는 본 개시의 바람직한 실시 예에 대하여 도시하고 설명하였지만, 본 개시는 상술한 특정의 실시 예에 한정되지 아니하며, 청구범위에서 청구하는 본 개시의 요지를 벗어남이 없이 당해 개시가 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 개시의 기술적 사상이나 전망으로부터 개별적으로 이해되어서는 안될 것이다.
100 : 전자 장치 110 : 입력부
120 : 프로세서

Claims (17)

  1. 전자 장치에 있어서,
    사용자의 양안을 촬영한 양안 영상 및 상기 사용자의 시선에 대응되는 방향을 이격된 거리에서 촬상한 사용자의 좌안에 대응되는 제1 영상과 사용자의 우안에 대응되는 제2 영상을 포함하는 스테레오 영상을 입력받는 카메라; 및
    상기 양안 영상을 이용하여 상기 제1 영상에서의 사용자의 좌안 주시점 및 상기 제2 영상에서의 사용자의 우안 주시점을 검출하고,
    상기 제1 영상과 상기 제2 영상을 스테레오 매칭하여 제1 대응거리 맵(disparity map) 및 제2 대응거리 맵을 생성하고,
    상기 생성된 제1 대응거리 맵 및 제2 대응거리 맵을 이용하여 상기 검출된 좌안 주시점 및 우안 주시점을 보정하는 프로세서;를 포함하는 전자 장치.
  2. 삭제
  3. 제1항에 있어서,
    상기 프로세서는,
    상기 제1 대응거리 맵 및 제2 대응거리 맵을 이용하여 좌안 주시점의 대응거리와 우안 주시점의 대응거리의 차이가 최소가 되도록 상기 검출된 좌안 주시점 및 상기 검출된 우안 주시점을 보정하는 전자 장치.
  4. 제1항에 있어서,
    상기 프로세서는,
    상기 제1 영상 및 상기 제2 영상의 수평 편차가 보정된 상태에서 좌안 주시점의 위치 및 우안 주시점의 위치의 차이가 최소가 되도록 상기 검출된 좌안 주시점 및 상기 검출된 우안 주시점을 보정하는 전자 장치.
  5. 제1항에 있어서,
    상기 프로세서는,
    상기 제1 영상과 상기 제2 영상의 수직 편차를 보정하고, 보정된 제1 영상 및 보정된 제2 영상을 이용하여 스테레오 매칭을 수행하는 전자 장치.
  6. 제1항에 있어서,
    상기 프로세서는,
    상기 보정된 좌안 주시점과 상기 보정된 우안 주시점을 이용하여 3차원 주시점을 생성하는 전자 장치.
  7. 제1항에 있어서,
    상기 프로세서는,
    상기 보정된 좌안 주시점과 상기 보정된 우안 주시점을 이용하여 양안 시선 벡터 및 거리 정보를 생성하는 전자 장치.
  8. 제1항에 있어서,
    상기 카메라는,
    상기 사용자의 양안을 촬상하는 적외선 카메라; 및
    상기 사용자의 시선에 대응되는 방향을 이격된 거리에서 촬상한 스테레오 카메라;를 포함하는 전자 장치.
  9. 전자 장치의 제어 방법에 있어서,
    사용자의 양안을 촬영한 양안 영상 및 상기 사용자의 시선에 대응되는 방향을 이격된 거리에서 촬상한 사용자의 좌안에 대응되는 제1 영상과 사용자의 우안에 대응되는 제2 영상을 포함하는 스테레오 영상을 입력받는 단계;
    상기 양안 영상을 이용하여 상기 제1 영상에서의 사용자의 좌안 주시점 및 상기 제2 영상에서의 사용자의 우안 주시점을 검출하는 단계;
    상기 제1 영상과 상기 제2 영상을 스테레오 매칭하여 제1 대응거리 맵(disparity map) 및 제2 대응거리 맵을 생성하는 단계; 및
    상기 생성된 제1 대응거리 맵 및 제2 대응거리 맵을 이용하여 상기 검출된 좌안 주시점 및 우안 주시점을 보정하는 단계;를 포함하는 전자 장치의 제어 방법.
  10. 삭제
  11. 제9항에 있어서,
    상기 보정하는 단계는,
    상기 제1 대응거리 맵 및 제2 대응거리 맵을 이용하여 좌안 주시점의 대응거리와 우안 주시점의 대응거리의 차이가 최소가 되도록 상기 검출된 좌안 주시점 및 상기 검출된 우안 주시점을 보정하는 전자 장치의 제어 방법.
  12. 제9항에 있어서,
    상기 보정하는 단계는,
    상기 제1 영상 및 상기 제2 영상의 수평 편차가 보정된 상태에서 좌안 주시점의 위치 및 우안 주시점의 위치의 차이가 최소가 되도록 상기 검출된 좌안 주시점 및 상기 검출된 우안 주시점을 보정하는 전자 장치의 제어 방법.
  13. 제9항에 있어서,
    상기 제1 영상과 상기 제2 영상의 수직 편차를 보정하는 단계;를 더 포함하고,
    상기 생성하는 단계는,
    상기 보정된 제1 영상 및 보정된 제2 영상을 이용하여 스테레오 매칭을 수행하는 전자 장치의 제어 방법.
  14. 제9항에 있어서,
    상기 보정된 좌안 주시점과 상기 보정된 우안 주시점을 이용하여 3차원 주시점을 생성하는 단계;를 더 포함하는 전자 장치의 제어 방법.
  15. 제9항에 있어서,
    상기 보정된 좌안 주시점과 상기 보정된 우안 주시점을 이용하여 양안 시선 벡터 및 거리 정보를 생성하는 단계;를 더 포함하는 전자 장치의 제어 방법.
  16. 제9항에 있어서,
    상기 입력받는 단계는,
    적외선 카메라를 이용하여 상기 사용자의 양안을 촬상하고, 상기 사용자의 시선에 대응되는 방향을 이격된 거리에서 촬상하는 전자 장치의 제어 방법.
  17. 전자 장치의 제어 방법을 실행하기 위한 프로그램을 포함하는 컴퓨터 판독가능 기록 매체에 있어서,
    상기 제어 방법은,
    사용자의 양안을 촬영한 양안 영상 및 상기 사용자의 시선에 대응되는 방향을 이격된 거리에서 촬상한 사용자의 좌안에 대응되는 제1 영상과 사용자의 우안에 대응되는 제2 영상을 포함하는 스테레오 영상을 입력받는 단계; 및
    상기 양안 영상을 이용하여 상기 제1 영상에서의 사용자의 좌안 주시점 및 상기 제2 영상에서의 사용자의 우안 주시점을 검출하는 단계;
    상기 제1 영상과 상기 제2 영상을 스테레오 매칭하여 제1 대응거리 맵(disparity map) 및 제2 대응거리 맵을 생성하는 단계;
    상기 생성된 제1 대응거리 맵 및 제2 대응거리 맵을 이용하여 상기 검출된 좌안 주시점 및 우안 주시점을 보정하는 단계;를 포함하는 컴퓨터 판독가능 기록 매체.
KR1020170113647A 2017-09-06 2017-09-06 전자 장치, 그 제어 방법 및 컴퓨터 판독가능 기록 매체 KR102450236B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020170113647A KR102450236B1 (ko) 2017-09-06 2017-09-06 전자 장치, 그 제어 방법 및 컴퓨터 판독가능 기록 매체
US16/122,382 US10817054B2 (en) 2017-09-06 2018-09-05 Eye watch point tracking via binocular and stereo images

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170113647A KR102450236B1 (ko) 2017-09-06 2017-09-06 전자 장치, 그 제어 방법 및 컴퓨터 판독가능 기록 매체

Publications (2)

Publication Number Publication Date
KR20190027079A KR20190027079A (ko) 2019-03-14
KR102450236B1 true KR102450236B1 (ko) 2022-10-04

Family

ID=65518155

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170113647A KR102450236B1 (ko) 2017-09-06 2017-09-06 전자 장치, 그 제어 방법 및 컴퓨터 판독가능 기록 매체

Country Status (2)

Country Link
US (1) US10817054B2 (ko)
KR (1) KR102450236B1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6897467B2 (ja) * 2017-10-02 2021-06-30 富士通株式会社 視線検出装置、視線検出プログラム、及び視線検出方法
CN110110131B (zh) * 2019-05-23 2021-04-13 北京航空航天大学 一种基于深度学习与双目立体视觉的飞机线缆支架识别与参数获取方法
US11835997B2 (en) * 2019-09-27 2023-12-05 Electronic Theatre Controls, Inc. Systems and methods for light fixture location determination
CN111028288B (zh) * 2019-10-23 2023-12-26 深圳市聚业自动化技术有限公司 一种基于深度学习技术的双目标定系统
KR20220058277A (ko) * 2020-10-30 2022-05-09 삼성전자주식회사 스테레오 매칭 방법 및 이를 수행하는 영상 처리 장치

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5360971A (en) 1992-03-31 1994-11-01 The Research Foundation State University Of New York Apparatus and method for eye tracking interface
AUPP048097A0 (en) 1997-11-21 1997-12-18 Xenotech Research Pty Ltd Eye tracking apparatus
US6579282B2 (en) 2001-04-25 2003-06-17 20/10 Perfect Vision Optische Geraete Gmbh Device and method for creating a corneal reference for an eyetracker
JP4926437B2 (ja) 2005-09-28 2012-05-09 富士重工業株式会社 車両の運転支援装置
KR100897542B1 (ko) * 2007-05-17 2009-05-15 연세대학교 산학협력단 임의 시점 영상 합성 시 영상 보정 방법 및 장치
US7857452B2 (en) 2007-08-27 2010-12-28 Catholic Healthcare West Eye movements as a way to determine foci of covert attention
JP2011203811A (ja) 2010-03-24 2011-10-13 Fujifilm Corp 画像処理装置、画像処理方法、画像処理プログラム、及び複眼デジタルカメラ
DE102010024407B4 (de) 2010-06-19 2017-03-30 Chronos Vision Gmbh Verfahren und Vorrichtung zur Bestimmung der Augenposition
JP2012257022A (ja) 2011-06-08 2012-12-27 Sony Corp 画像処理装置および方法、並びにプログラム
EP2899585A4 (en) 2012-09-19 2016-05-18 Nikon Corp SIGHT LINE DETECTION DEVICE, DISPLAY METHOD, SIGHT LINE DETECTION DEVICE CALIBRATION METHOD, GLASS GLASS DESIGN METHOD, GLASS SELECTION GLASS SELECTION METHOD, GLASS GLASS MANUFACTURING METHOD, PRINTED MATERIAL, SUNGLASS GLASS SELLING METHOD, OPTICAL DEVICE, SIGHT LINE INFORMATION DETECTING METHOD, OPTICAL INSTRUMENT, DESIGN METHOD, OPTICAL INSTRUMENT, OPTICAL INSTRUMENT SELECTION METHOD, AND OPTICAL INSTRUMENT PRODUCTION METHOD
WO2015064080A1 (ja) * 2013-11-01 2015-05-07 パナソニックIpマネジメント株式会社 視線方向検出装置および視線方向検出方法
KR102178333B1 (ko) 2013-12-31 2020-11-12 엘지디스플레이 주식회사 영상처리방법 및 투명표시장치
US9361519B2 (en) 2014-03-28 2016-06-07 Intel Corporation Computational array camera with dynamic illumination for eye tracking
KR102350232B1 (ko) * 2014-11-20 2022-01-13 삼성전자주식회사 스테레오 영상 매칭 방법 및 장치
US10942024B2 (en) * 2016-02-02 2021-03-09 Sony Corporation Information processing apparatus, information processing method, and recording medium

Also Published As

Publication number Publication date
US10817054B2 (en) 2020-10-27
KR20190027079A (ko) 2019-03-14
US20190073793A1 (en) 2019-03-07

Similar Documents

Publication Publication Date Title
KR102450236B1 (ko) 전자 장치, 그 제어 방법 및 컴퓨터 판독가능 기록 매체
EP3195595B1 (en) Technologies for adjusting a perspective of a captured image for display
US11747893B2 (en) Visual communications methods, systems and software
US9406137B2 (en) Robust tracking using point and line features
CN109074681B (zh) 信息处理装置、信息处理方法和程序
JP6348574B2 (ja) 総体的カメラ移動およびパノラマカメラ移動を使用した単眼視覚slam
EP2992508B1 (en) Diminished and mediated reality effects from reconstruction
WO2015180659A1 (zh) 图像处理方法和图像处理装置
CN109615664B (zh) 一种用于光学透视增强现实显示器的标定方法与设备
US11244145B2 (en) Information processing apparatus, information processing method, and recording medium
JP7184748B2 (ja) 場面の積層深度データを生成するための方法
US20180218714A1 (en) Image display apparatus, image processing apparatus, image display method, image processing method, and storage medium
US9478068B2 (en) Computer-readable medium, image processing device, image processing system, and image processing method
US9600938B1 (en) 3D augmented reality with comfortable 3D viewing
US10834380B2 (en) Information processing apparatus, information processing method, and storage medium
US20200211275A1 (en) Information processing device, information processing method, and recording medium
WO2015072091A1 (ja) 画像処理装置、画像処理方法及びプログラム記憶媒体
US8983125B2 (en) Three-dimensional image processing device and three dimensional image processing method
US10586392B2 (en) Image display apparatus using foveated rendering
US20130009949A1 (en) Method, system and computer program product for re-convergence of a stereoscopic image
KR20110025083A (ko) 입체 영상 시스템에서 입체 영상 디스플레이 장치 및 방법
KR20190079503A (ko) 얼굴 인식을 위한 얼굴 자세 등록 장치 및 방법
JP6099448B2 (ja) 画像処理用プログラム、情報処理装置、情報処理システム、および画像処理方法
WO2020059575A1 (ja) 3次元画像生成装置、3次元画像生成方法、及びプログラム
US20220413295A1 (en) Electronic device and method for controlling electronic device

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant