KR20230121516A

KR20230121516A - 객체의 영상을 획득하는 방법 및 장치

Info

Publication number: KR20230121516A
Application number: KR1020220029608A
Authority: KR
Inventors: 최명규; 배수정; 변광민; 최인호
Original assignee: 삼성전자주식회사
Priority date: 2022-02-11
Filing date: 2022-03-08
Publication date: 2023-08-18

Abstract

일 실시예에 따른 전자 장치는, 카메라, 컴퓨터로 실행 가능한 명령어들이 저장된 메모리, 및 메모리에 억세스(access)하여 명령어들을 실행하는 프로세서를 포함하고, 명령어들은, 카메라에 의해 촬영된 영상을 복수의 영역들로 분할하고, 영상에서 특징점들(feature points)을 검출함으로써 분할된 복수의 영역들 각각에 포함된 특징점의 개수를 산출하며, 산출된 결과에 기초하여 분할된 복수의 영역들 중 적어도 하나의 후보 영역을 선택하고, 사용자의 시선을 추적하여 사용자의 시선 방향에 대응하는 대상 객체(target object)를 선택하며, 대상 객체에 대한 이벤트의 발생을 감지하는 것에 기초하여, 선택된 적어도 하나의 후보 영역 내에서 캡처 영역(capture area)을 결정하고, 영상 중 결정된 캡처 영역으로부터 캡처된 부분 영상에 기초하여 대상 객체에 관한 영상을 생성하도록 구성될 수 있다. 그 밖에 다양한 실시예가 가능하다.

Description

객체의 영상을 획득하는 방법 및 장치{METHOD AND DEVICE FOR ACQUIRING AN IMAGE OF AN OBJECT}

아래의 개시의 다양한 실시예들은 객체의 영상을 획득하는 방법 및 장치에 관한 것이다.

디지털 기술의 발달과 함께 스마트 폰, PC(Personal Computer), 웨어러블 장치(wearable device)와 같이 영상을 촬영 및 재생하는 전자 장치들이 다양하게 출시되고 있다. 예를 들어, 전자 장치들은 카메라를 사용하여 영상을 촬영할 수 있다. 최근에는, 카메라를 통해 촬영된 영상으로부터 컵, 책, 모니터, 전등, 사람과 같은 객체(object)를 식별하는 기술 및 영상에서 사용자가 관심 있는 객체를 분할하는 기술이 개발되었다. 한편, 영상에서 색상, 모양, 움직임 및 질감과 같은 사용자가 관심 있는 객체의 다양한 특징 및 영상 내의 배경의 변화 때문에 사용자가 관심 있는 객체를 정확히 분할하는 데는 어려움이 따를 수 있다. 또한, 종래의 객체 분할 기술은 전자 장치에 많은 연산량을 요구할 수 있다. 따라서, 영상에서 높은 분할 성능으로 객체를 분할하면서도 객체의 분할에 소요되는 시간 및 연산량을 감소시키는 것이 필요하다.

일 실시예에 따른 전자 장치는 영상에서 사용자의 시선 방향이 지시하는 대상 객체를 선택하고, 선택된 대상 객체에 관한 영상을 획득할 수 있다.

일 실시예에 따른 전자 장치는 영상 내에서 캡처 영역을 결정하고, 영상을 결정된 캡처 영역에서 캡처하여 대상 객체에 관한 영상을 획득할 수 있다.

일 실시예에 따른 전자 장치는 영상 내에서 대상 객체에 관한 영상을 캡처하기에 최적화된 영역을 캡처 영역으로 결정할 수 있다.

일 실시예에 따른 전자 장치는 영상 내에서 캡처 영역의 위치 및/또는 크기를 변경할 수 있다.

일 실시예에 따른 전자 장치는 카메라, 컴퓨터로 실행 가능한 명령어들이 저장된 메모리, 및 상기 메모리에 억세스(access)하여 상기 명령어들을 실행하는 프로세서를 포함하고, 상기 명령어들은, 상기 카메라에 의해 촬영된 영상을 복수의 영역들로 분할하고, 상기 영상에서 특징점들(feature points)을 검출함으로써 상기 분할된 복수의 영역들 각각에 포함된 특징점의 개수를 산출하며, 상기 산출된 결과에 기초하여 상기 분할된 복수의 영역들 중 적어도 하나의 후보 영역을 선택하고, 사용자의 시선을 추적하여 상기 사용자의 시선 방향에 대응하는 대상 객체(target object)를 선택하며, 상기 대상 객체에 대한 이벤트의 발생을 감지하는 것에 기초하여, 상기 선택된 적어도 하나의 후보 영역 내에서 캡처 영역(capture area)을 결정하고, 상기 영상 중 상기 결정된 캡처 영역으로부터 캡처된 부분 영상에 기초하여 상기 대상 객체에 관한 영상을 생성하도록 구성될 수 있다.

일 실시예에 따른 프로세서로 구현되는 방법은, 카메라에 의해 촬영된 영상을 복수의 영역들로 분할하고, 상기 영상에서 특징점들(feature points)을 검출함으로써 상기 분할된 복수의 영역들 각각에 포함된 특징점의 개수를 산출하며, 상기 산출된 결과에 기초하여 상기 분할된 복수의 영역들 중 적어도 하나의 후보 영역을 선택하는 동작, 사용자의 시선을 추적하여 상기 사용자의 시선 방향에 대응하는 대상 객체(target object)를 선택하는 동작, 상기 대상 객체에 대한 이벤트 발생을 감지하는 것에 기초하여, 상기 선택된 적어도 하나의 후보 영역 내에서 캡처 영역을 결정하는 동작, 및 상기 영상 중 상기 결정된 캡처 영역으로부터 캡처된 부분 영상에 기초하여 상기 대상 객체에 관한 영상을 생성하는 동작을 포함할 수 있다.

도 1은, 다양한 실시예들에 따른, 네트워크 환경 내의 단말 장치의 블록도이다.
도 2는 일 실시예에 따른 웨어러블 증강현실(augmented reality; AR) 장치의 구조를 도시한 도면이다.
도 3은 일 실시예에 따른 웨어러블 AR 장치의 카메라 및 시선 추적 센서를 나타낸 도면이다.
도 4는 일 실시예에 따른 대상 객체에 관한 영상을 획득하는 동작을 도시한 흐름도이다.
도 5는 일 실시예에 따른 영상에서 특징점들을 검출하는 과정을 설명하는 도면이다.
도 6은 일 실시예에 따른 분할된 복수의 영역들 중 특징점의 개수에 기초하여 적어도 하나의 후보 영역을 선택하는 과정을 설명하는 도면이다.
도 7은 일 실시예에 따른 대상 객체를 선택하는 과정을 설명하는 도면이다.
도 8 내지 도 9은 일 실시예에 따른 사용자의 제스처와 관련된 이벤트 발생을 감지하는 것을 설명하는 도면이다.
도 10은 일 실시예에 따른 캡처 영역(capture area)을 결정하는 과정을 설명하는 도면이다.
도 11는 일 실시예에 따른 캡처 영역에서 노이즈 크기를 산출하는 과정을 설명하는 도면이다.
도 12은 일 실시예에 따른 캡처 영역의 크기 변경을 설명하는 도면이다.
도 13은 일 실시예에 따른 캡처 영역의 위치 변경을 설명하는 도면이다.
도 14는 일 실시예에 따른 캡처 박스 내에서 회전 가이드를 제공하는 과정을 설명하는 도면이다.
도 15은 일 실시예에 따른 캡처 영역의 위치 및 크기를 결정하는 과정을 설명하는 도면이다.
도 16a 내지 도 16b는 일 실시예에 따른 캡처 영역의 위치 및 크기를 자동으로 결정하는 과정을 설명하는 도면이다.
도 17a 내지 도 17b는 일 실시예에 따른 사용자의 제스처에 기초하여 캡처 영역의 위치 및 크기를 결정하는 과정을 설명하는 도면이다.
도 18은 일 실시예에 따른 캡처 영역으로부터 캡처된 부분 영상에 기초하여 대상 객체에 관한 영상을 생성하는 과정을 설명하는 도면이다.
도 19 내지 도 20은 일 실시예에 따른 대상 객체에 관한 영상을 획득하는 다른 방법에 대하여 설명하는 도면이다.

이하, 실시예들을 첨부된 도면들을 참조하여 상세하게 설명한다. 첨부 도면을 참조하여 설명함에 있어, 도면 부호에 관계없이 동일한 구성 요소는 동일한 참조 부호를 부여하고, 이에 대한 중복되는 설명은 생략하기로 한다.

도 1은, 다양한 실시예들에 따른, 네트워크 환경(100) 내의 단말 장치(101)의 블록도이다. 도 1을 참조하면, 네트워크 환경(100)에서 단말 장치(101)는 제1 네트워크(198)(예: 근거리 무선 통신 네트워크)를 통하여 전자 장치(102)와 통신하거나, 또는 제2 네트워크(199)(예: 원거리 무선 통신 네트워크)를 통하여 전자 장치(104) 또는 서버(108) 중 적어도 하나와 통신할 수 있다. 일실시예에 따르면, 단말 장치(101)는 서버(108)를 통하여 전자 장치(104)와 통신할 수 있다. 일실시예에 따르면, 단말 장치(101)는 프로세서(120), 메모리(130), 입력 모듈(150), 음향 출력 모듈(155), 디스플레이 모듈(160), 오디오 모듈(170), 센서 모듈(176), 인터페이스(177), 연결 단자(178), 햅틱 모듈(179), 카메라 모듈(180), 전력 관리 모듈(188), 배터리(189), 통신 모듈(190), 가입자 식별 모듈(196), 또는 안테나 모듈(197)을 포함할 수 있다. 어떤 실시예에서는, 단말 장치(101)에는, 이 구성요소들 중 적어도 하나(예: 연결 단자(178))가 생략되거나, 하나 이상의 다른 구성요소가 추가될 수 있다. 어떤 실시예에서는, 이 구성요소들 중 일부들(예: 센서 모듈(176), 카메라 모듈(180), 또는 안테나 모듈(197))은 하나의 구성요소(예: 디스플레이 모듈(160))로 통합될 수 있다.

프로세서(120)는, 예를 들면, 소프트웨어(예: 프로그램(140))를 실행하여 프로세서(120)에 연결된 단말 장치(101)의 적어도 하나의 다른 구성요소(예: 하드웨어 또는 소프트웨어 구성요소)를 제어할 수 있고, 다양한 데이터 처리 또는 연산을 수행할 수 있다. 일실시예에 따르면, 데이터 처리 또는 연산의 적어도 일부로서, 프로세서(120)는 다른 구성요소(예: 센서 모듈(176) 또는 통신 모듈(190))로부터 수신된 명령 또는 데이터를 휘발성 메모리(132)에 저장하고, 휘발성 메모리(132)에 저장된 명령 또는 데이터를 처리하고, 결과 데이터를 비휘발성 메모리(134)에 저장할 수 있다. 일실시예에 따르면, 프로세서(120)는 메인 프로세서(121)(예: 중앙 처리 장치 또는 어플리케이션 프로세서) 또는 이와는 독립적으로 또는 함께 운영 가능한 보조 프로세서(123)(예: 그래픽 처리 장치, 신경망 처리 장치(NPU: neural processing unit), 이미지 시그널 프로세서, 센서 허브 프로세서, 또는 커뮤니케이션 프로세서)를 포함할 수 있다. 예를 들어, 단말 장치(101)가 메인 프로세서(121) 및 보조 프로세서(123)를 포함하는 경우, 보조 프로세서(123)는 메인 프로세서(121)보다 저전력을 사용하거나, 지정된 기능에 특화되도록 설정될 수 있다. 보조 프로세서(123)는 메인 프로세서(121)와 별개로, 또는 그 일부로서 구현될 수 있다.

보조 프로세서(123)는, 예를 들면, 메인 프로세서(121)가 인액티브(예: 슬립) 상태에 있는 동안 메인 프로세서(121)를 대신하여, 또는 메인 프로세서(121)가 액티브(예: 어플리케이션 실행) 상태에 있는 동안 메인 프로세서(121)와 함께, 단말 장치(101)의 구성요소들 중 적어도 하나의 구성요소(예: 디스플레이 모듈(160), 센서 모듈(176), 또는 통신 모듈(190))와 관련된 기능 또는 상태들의 적어도 일부를 제어할 수 있다. 일실시예에 따르면, 보조 프로세서(123)(예: 이미지 시그널 프로세서 또는 커뮤니케이션 프로세서)는 기능적으로 관련 있는 다른 구성요소(예: 카메라 모듈(180) 또는 통신 모듈(190))의 일부로서 구현될 수 있다. 일실시예에 따르면, 보조 프로세서(123)(예: 신경망 처리 장치)는 인공지능 모델의 처리에 특화된 하드웨어 구조를 포함할 수 있다. 인공지능 모델은 기계 학습을 통해 생성될 수 있다. 이러한 학습은, 예를 들어, 인공지능 모델이 수행되는 단말 장치(101) 자체에서 수행될 수 있고, 별도의 서버(예: 서버(108))를 통해 수행될 수도 있다. 학습 알고리즘은, 예를 들어, 지도형 학습(supervised learning), 비지도형 학습(unsupervised learning), 준지도형 학습(semi-supervised learning) 또는 강화 학습(reinforcement learning)을 포함할 수 있으나, 전술한 예에 한정되지 않는다. 인공지능 모델은, 복수의 인공 신경망 레이어들을 포함할 수 있다. 인공 신경망은 심층 신경망(DNN: deep neural network), CNN(convolutional neural network), RNN(recurrent neural network), RBM(restricted boltzmann machine), DBN(deep belief network), BRDNN(bidirectional recurrent deep neural network), 심층 Q-네트워크(deep Q-networks) 또는 상기 중 둘 이상의 조합 중 하나일 수 있으나, 전술한 예에 한정되지 않는다. 인공지능 모델은 하드웨어 구조 이외에, 추가적으로 또는 대체적으로, 소프트웨어 구조를 포함할 수 있다.

메모리(130)는, 단말 장치(101)의 적어도 하나의 구성요소(예: 프로세서(120) 또는 센서 모듈(176))에 의해 사용되는 다양한 데이터를 저장할 수 있다. 데이터는, 예를 들어, 소프트웨어(예: 프로그램(140)) 및, 이와 관련된 명령에 대한 입력 데이터 또는 출력 데이터를 포함할 수 있다. 메모리(130)는, 휘발성 메모리(132) 또는 비휘발성 메모리(134)를 포함할 수 있다.

프로그램(140)은 메모리(130)에 소프트웨어로서 저장될 수 있으며, 예를 들면, 운영 체제(142), 미들 웨어(144) 또는 어플리케이션(146)을 포함할 수 있다.

입력 모듈(150)은, 단말 장치(101)의 구성요소(예: 프로세서(120))에 사용될 명령 또는 데이터를 단말 장치(101)의 외부(예: 사용자)로부터 수신할 수 있다. 입력 모듈(150)은, 예를 들면, 마이크, 마우스, 키보드, 키(예: 버튼), 또는 디지털 펜(예: 스타일러스 펜)을 포함할 수 있다.

음향 출력 모듈(155)은 음향 신호를 단말 장치(101)의 외부로 출력할 수 있다. 음향 출력 모듈(155)은, 예를 들면, 스피커 또는 리시버를 포함할 수 있다. 스피커는 멀티미디어 재생 또는 녹음 재생과 같이 일반적인 용도로 사용될 수 있다. 리시버는 착신 전화를 수신하기 위해 사용될 수 있다. 일실시예에 따르면, 리시버는 스피커와 별개로, 또는 그 일부로서 구현될 수 있다.

디스플레이 모듈(160)은 단말 장치(101)의 외부(예: 사용자)로 정보를 시각적으로 제공할 수 있다. 디스플레이 모듈(160)은, 예를 들면, 디스플레이, 홀로그램 장치, 또는 프로젝터 및 해당 장치를 제어하기 위한 제어 회로를 포함할 수 있다. 일실시예에 따르면, 디스플레이 모듈(160)은 터치를 감지하도록 설정된 터치 센서, 또는 상기 터치에 의해 발생되는 힘의 세기를 측정하도록 설정된 압력 센서를 포함할 수 있다.

오디오 모듈(170)은 소리를 전기 신호로 변환시키거나, 반대로 전기 신호를 소리로 변환시킬 수 있다. 일실시예에 따르면, 오디오 모듈(170)은, 입력 모듈(150)을 통해 소리를 획득하거나, 음향 출력 모듈(155), 또는 단말 장치(101)와 직접 또는 무선으로 연결된 외부 전자 장치(예: 전자 장치(102))(예: 스피커 또는 헤드폰)를 통해 소리를 출력할 수 있다.

센서 모듈(176)은 단말 장치(101)의 작동 상태(예: 전력 또는 온도), 또는 외부의 환경 상태(예: 사용자 상태)를 감지하고, 감지된 상태에 대응하는 전기 신호 또는 데이터 값을 생성할 수 있다. 일실시예에 따르면, 센서 모듈(176)은, 예를 들면, 제스처 센서, 자이로 센서, 기압 센서, 마그네틱 센서, 가속도 센서, 초광대역(ultra-wide band; UWB) 센서, 그립 센서, 근접 센서, 컬러 센서, IR(infrared) 센서, 생체 센서, 온도 센서, 습도 센서, 또는 조도 센서를 포함할 수 있다.

인터페이스(177)는 단말 장치(101)가 외부 전자 장치(예: 전자 장치(102))와 직접 또는 무선으로 연결되기 위해 사용될 수 있는 하나 이상의 지정된 프로토콜들을 지원할 수 있다. 일실시예에 따르면, 인터페이스(177)는, 예를 들면, HDMI(high definition multimedia interface), USB(universal serial bus) 인터페이스, SD카드 인터페이스, 또는 오디오 인터페이스를 포함할 수 있다.

연결 단자(178)는, 그를 통해서 단말 장치(101)가 외부 전자 장치(예: 전자 장치(102))와 물리적으로 연결될 수 있는 커넥터를 포함할 수 있다. 일실시예에 따르면, 연결 단자(178)는, 예를 들면, HDMI 커넥터, USB 커넥터, SD 카드 커넥터, 또는 오디오 커넥터(예: 헤드폰 커넥터)를 포함할 수 있다.

햅틱 모듈(179)은 전기적 신호를 사용자가 촉각 또는 운동 감각을 통해서 인지할 수 있는 기계적인 자극(예: 진동 또는 움직임) 또는 전기적인 자극으로 변환할 수 있다. 일실시예에 따르면, 햅틱 모듈(179)은, 예를 들면, 모터, 압전 소자, 또는 전기 자극 장치를 포함할 수 있다.

카메라 모듈(180)은 정지 영상 및 동영상을 촬영할 수 있다. 일실시예에 따르면, 카메라 모듈(180)은 하나 이상의 렌즈들, 이미지 센서들, 이미지 시그널 프로세서들, 또는 플래시들을 포함할 수 있다.

전력 관리 모듈(188)은 단말 장치(101)에 공급되는 전력을 관리할 수 있다. 일실시예에 따르면, 전력 관리 모듈(188)은, 예를 들면, PMIC(power management integrated circuit)의 적어도 일부로서 구현될 수 있다.

배터리(189)는 단말 장치(101)의 적어도 하나의 구성요소에 전력을 공급할 수 있다. 일실시예에 따르면, 배터리(189)는, 예를 들면, 재충전 불가능한 1차 전지, 재충전 가능한 2차 전지 또는 연료 전지를 포함할 수 있다.

통신 모듈(190)은 단말 장치(101)와 외부 전자 장치(예: 전자 장치(102), 전자 장치(104), 또는 서버(108)) 간의 직접(예: 유선) 통신 채널 또는 무선 통신 채널의 수립, 및 수립된 통신 채널을 통한 통신 수행을 지원할 수 있다. 통신 모듈(190)은 프로세서(120)(예: 어플리케이션 프로세서)와 독립적으로 운영되고, 직접(예: 유선) 통신 또는 무선 통신을 지원하는 하나 이상의 커뮤니케이션 프로세서를 포함할 수 있다. 일실시예에 따르면, 통신 모듈(190)은 무선 통신 모듈(192)(예: 셀룰러 통신 모듈, 근거리 무선 통신 모듈, 또는 GNSS(global navigation satellite system) 통신 모듈) 또는 유선 통신 모듈(194)(예: LAN(local area network) 통신 모듈, 또는 전력선 통신 모듈)을 포함할 수 있다. 이들 통신 모듈 중 해당하는 통신 모듈은 제1 네트워크(198)(예: 블루투스, WiFi(wireless fidelity) direct 또는 IrDA(infrared data association)와 같은 근거리 통신 네트워크) 또는 제2 네트워크(199)(예: 레거시 셀룰러 네트워크, 5G 네트워크, 차세대 통신 네트워크, 인터넷, 또는 컴퓨터 네트워크(예: LAN 또는 WAN)와 같은 원거리 통신 네트워크)를 통하여 외부의 전자 장치(104)와 통신할 수 있다. 이런 여러 종류의 통신 모듈들은 하나의 구성요소(예: 단일 칩)로 통합되거나, 또는 서로 별도의 복수의 구성요소들(예: 복수 칩들)로 구현될 수 있다. 무선 통신 모듈(192)은 가입자 식별 모듈(196)에 저장된 가입자 정보(예: 국제 모바일 가입자 식별자(IMSI))를 이용하여 제1 네트워크(198) 또는 제2 네트워크(199)와 같은 통신 네트워크 내에서 단말 장치(101)를 확인 또는 인증할 수 있다.

무선 통신 모듈(192)은 4G 네트워크 이후의 5G 네트워크 및 차세대 통신 기술, 예를 들어, NR 접속 기술(new radio access technology)을 지원할 수 있다. NR 접속 기술은 고용량 데이터의 고속 전송(eMBB(enhanced mobile broadband)), 단말 전력 최소화와 다수 단말의 접속(mMTC(massive machine type communications)), 또는 고신뢰도와 저지연(URLLC(ultra-reliable and low-latency communications))을 지원할 수 있다. 무선 통신 모듈(192)은, 예를 들어, 높은 데이터 전송률 달성을 위해, 고주파 대역(예: mmWave 대역)을 지원할 수 있다. 무선 통신 모듈(192)은 고주파 대역에서의 성능 확보를 위한 다양한 기술들, 예를 들어, 빔포밍(beamforming), 거대 배열 다중 입출력(massive MIMO(multiple-input and multiple-output)), 전차원 다중입출력(FD-MIMO: full dimensional MIMO), 어레이 안테나(array antenna), 아날로그 빔형성(analog beam-forming), 또는 대규모 안테나(large scale antenna)와 같은 기술들을 지원할 수 있다. 무선 통신 모듈(192)은 단말 장치(101), 외부 전자 장치(예: 전자 장치(104)) 또는 네트워크 시스템(예: 제2 네트워크(199))에 규정되는 다양한 요구사항을 지원할 수 있다. 일실시예에 따르면, 무선 통신 모듈(192)은 eMBB 실현을 위한 Peak data rate(예: 20Gbps 이상), mMTC 실현을 위한 손실 Coverage(예: 164dB 이하), 또는 URLLC 실현을 위한 U-plane latency(예: 다운링크(DL) 및 업링크(UL) 각각 0.5ms 이하, 또는 라운드 트립 1ms 이하)를 지원할 수 있다.

안테나 모듈(197)은 신호 또는 전력을 외부(예: 외부의 전자 장치)로 송신하거나 외부로부터 수신할 수 있다. 일실시예에 따르면, 안테나 모듈(197)은 서브스트레이트(예: PCB) 위에 형성된 도전체 또는 도전성 패턴으로 이루어진 방사체를 포함하는 안테나를 포함할 수 있다. 일실시예에 따르면, 안테나 모듈(197)은 복수의 안테나들(예: 어레이 안테나)을 포함할 수 있다. 이런 경우, 제1 네트워크(198) 또는 제2 네트워크(199)와 같은 통신 네트워크에서 사용되는 통신 방식에 적합한 적어도 하나의 안테나가, 예를 들면, 통신 모듈(190)에 의하여 상기 복수의 안테나들로부터 선택될 수 있다. 신호 또는 전력은 상기 선택된 적어도 하나의 안테나를 통하여 통신 모듈(190)과 외부의 전자 장치 간에 송신되거나 수신될 수 있다. 어떤 실시예에 따르면, 방사체 이외에 다른 부품(예: RFIC(radio frequency integrated circuit))이 추가로 안테나 모듈(197)의 일부로 형성될 수 있다.

다양한 실시예에 따르면, 안테나 모듈(197)은 mmWave 안테나 모듈을 형성할 수 있다. 일실시예에 따르면, mmWave 안테나 모듈은 인쇄 회로 기판, 상기 인쇄 회로 기판의 제1 면(예: 아래 면)에 또는 그에 인접하여 배치되고 지정된 고주파 대역(예: mmWave 대역)을 지원할 수 있는 RFIC, 및 상기 인쇄 회로 기판의 제2 면(예: 윗 면 또는 측 면)에 또는 그에 인접하여 배치되고 상기 지정된 고주파 대역의 신호를 송신 또는 수신할 수 있는 복수의 안테나들(예: 어레이 안테나)을 포함할 수 있다.

상기 구성요소들 중 적어도 일부는 주변 기기들간 통신 방식(예: 버스, GPIO(general purpose input and output), SPI(serial peripheral interface), 또는 MIPI(mobile industry processor interface))을 통해 서로 연결되고 신호(예: 명령 또는 데이터)를 상호간에 교환할 수 있다.

일실시예에 따르면, 명령 또는 데이터는 제2 네트워크(199)에 연결된 서버(108)를 통해서 단말 장치(101)와 외부의 전자 장치(104)간에 송신 또는 수신될 수 있다. 외부의 전자 장치(102, 또는 104) 각각은 단말 장치(101)와 동일한 또는 다른 종류의 장치일 수 있다. 일실시예에 따르면, 단말 장치(101)에서 실행되는 동작들의 전부 또는 일부는 외부의 전자 장치들(102, 104, 또는 108) 중 하나 이상의 외부의 전자 장치들에서 실행될 수 있다. 예를 들면, 단말 장치(101)가 어떤 기능이나 서비스를 자동으로, 또는 사용자 또는 다른 장치로부터의 요청에 반응하여 수행해야 할 경우에, 단말 장치(101)는 기능 또는 서비스를 자체적으로 실행시키는 대신에 또는 추가적으로, 하나 이상의 외부의 전자 장치들에게 그 기능 또는 그 서비스의 적어도 일부를 수행하라고 요청할 수 있다. 상기 요청을 수신한 하나 이상의 외부의 전자 장치들은 요청된 기능 또는 서비스의 적어도 일부, 또는 상기 요청과 관련된 추가 기능 또는 서비스를 실행하고, 그 실행의 결과를 단말 장치(101)로 전달할 수 있다. 단말 장치(101)는 상기 결과를, 그대로 또는 추가적으로 처리하여, 상기 요청에 대한 응답의 적어도 일부로서 제공할 수 있다. 이를 위하여, 예를 들면, 클라우드 컴퓨팅, 분산 컴퓨팅, 모바일 에지 컴퓨팅(MEC: mobile edge computing), 또는 클라이언트-서버 컴퓨팅 기술이 이용될 수 있다. 단말 장치(101)는, 예를 들어, 분산 컴퓨팅 또는 모바일 에지 컴퓨팅을 이용하여 초저지연 서비스를 제공할 수 있다. 다른 실시예에 있어서, 외부의 전자 장치(104)는 IoT(internet of things) 기기를 포함할 수 있다. 서버(108)는 기계 학습 및/또는 신경망을 이용한 지능형 서버일 수 있다. 일실시예에 따르면, 외부의 전자 장치(104) 또는 서버(108)는 제2 네트워크(199) 내에 포함될 수 있다. 단말 장치(101)는 5G 통신 기술 및 IoT 관련 기술을 기반으로 지능형 서비스(예: 스마트 홈, 스마트 시티, 스마트 카, 또는 헬스 케어)에 적용될 수 있다.

도 2는 일 실시 예에 따른 웨어러블 AR 장치의 구조를 도시한 도면이다.

도 2를 참조하면, 웨어러블 AR 장치(200)는 사용자의 안면에 착용되어, 사용자에게 증강 현실 서비스 및/또는 가상 현실 서비스와 관련된 영상을 제공할 수 있다.

일 실시 예에서, 웨어러블 AR 장치(200)는 제1 디스플레이(205), 제2 디스플레이(210), 화면 표시부(215), 입력광학부재(220), 제1 투명부재(225a), 제2 투명부재(225b), 조명부(230a, 230b), 제1 PCB(235a), 제2 PCB(235b), 제1 힌지(hinge)(240a), 제2 힌지(240b), 제1 카메라(245a, 245b), 복수의 마이크(예: 제1 마이크(250a), 제2 마이크(250b), 제3 마이크(250c)), 복수의 스피커(예: 제1 스피커(255a), 제2 스피커(255b)), 배터리(260), 제2 카메라(275a, 275b), 제3 카메라(265), 및 바이저(270a, 270b)를 포함할 수 있다.

일 실시 예에서, 디스플레이(예: 제1 디스플레이(205) 및 제2 디스플레이(210))는, 예를 들면, 액정 표시 장치(liquid crystal display, LCD), 디지털 미러 표시 장치(digital mirror device, DMD), 실리콘 액정 표시 장치(liquid crystal on silicon, LCoS), 유기 발광 다이오드(organic light emitting diode, OLED) 또는 마이크로 엘이디(micro light emitting diode, micro LED)를 포함할 수 있다. 미도시 되었으나, 디스플레이가 액정 표시 장치, 디지털 미러 표시 장치, 또는 실리콘 액정 표시 장치 중 하나로 이루어지는 경우, 웨어러블 AR 장치(200)는 디스플레이의 화면 출력 영역으로 광을 조사하는 광원을 포함할 수 있다. 다른 실시예에서, 디스플레이가 자체적으로 광을 발생시킬 수 있는 경우, 예를 들어, 유기 발광 다이오드 또는 마이크로 엘이디 중 하나로 이루어지는 경우, 웨어러블 AR 장치(200)는 별도의 광원을 포함하지 않더라도 사용자에게 양호한 품질의 가상 영상을 제공할 수 있다. 일 실시 예에서, 디스플레이가 유기 발광 다이오드 또는 마이크로 엘이디로 구현된다면 광원이 불필요하므로, 웨어러블 AR 장치(200)가 경량화될 수 있다. 이하에서는, 자체적으로 광을 발생시킬 수 있는 디스플레이는 자발광 디스플레이로 지칭되며, 자발광 디스플레이를 전제로 설명된다.

본 발명의 다양한 실시예들에 따른 디스플레이(예: 제1 디스플레이(205) 및 제2 디스플레이(210))는 적어도 하나의 마이크로 LED(micro light emitting diode)로 구성될 수 있다. 예컨대, 마이크로 LED는 자체 발광으로 적색(R, red), 녹색(G, green), 청색(B, blue)을 표현할 수 있으며, 크기가 작아(예: 100㎛ 이하), 칩 하나가 하나의 픽셀(예: R, G, 및 B 중 하나)을 구현할 수 있다. 이에 따라, 디스플레이가 마이크로 LED로 구성되는 경우, 백라이트유닛(BLU) 없이 높은 해상도를 제공할 수 있다.

이에 한정하는 것은 아니며, 하나의 픽셀은 R, G, 및 B를 포함할 수 있으며, 하나의 칩은 R, G, 및 B를 포함하는 픽셀이 복수개로 구현될 수 있다.

일 실시 예에서, 디스플레이(예: 제1 디스플레이(205) 및 제2 디스플레이(210))는 가상의 영상을 표시하기 위한 픽셀(pixel)들로 구성된 디스플레이 영역 및 픽셀들 사이에 배치되는 눈에서 반사되는 광을 수광하여 전기 에너지로 변환하고 출력하는 수광 픽셀(예: 포토 센서 픽셀(photo sensor pixel))들로 구성될 수 있다.

일 실시 예에서, 웨어러블 AR 장치(200)는 수광 픽셀들을 통해 사용자의 시선 방향(예: 눈동자 움직임)을 검출할 수 있다. 예컨대, 웨어러블 AR 장치(200)는 제1 디스플레이(205)를 구성하는 하나 이상의 수광 픽셀들 및 제2 디스플레이(210)를 구성하는 하나 이상의 수광 픽셀들을 통해 사용자의 우안에 대한 시선 방향 및 사용자의 좌안에 대한 시선 방향을 검출하고 추적할 수 있다. 웨어러블 AR 장치(200)는 하나 이상의 수광 픽셀들을 통해 검출되는 사용자의 우안 및 좌안의 시선 방향(예: 사용자의 우안 및 좌안의 눈동자가 응시하는 방향)에 따라 가상 영상의 중심의 위치를 결정할 수 있다.

일 실시 예에서, 디스플레이(예: 제1 디스플레이(205) 및 제2 디스플레이(210))로부터 방출되는 광은 렌즈(미도시) 및 웨이브가이드(waveguide)를 거쳐 사용자의 우안(right eye)에 대면하게 배치되는 제1 투명부재(225a)에 형성된 화면 표시부(215) 및 사용자의 좌안(left eye)에 대면하게 배치 제2 투명부재(225b)에 형성된 화면 표시부(215)에 도달할 수 있다. 예컨대, 디스플레이(예: 제1 디스플레이(205) 및 제2 디스플레이(210))로부터 방출되는 광은 웨이브가이드를 거쳐 입력광학부재(220)와 화면 표시부(215)에 형성된 그레이팅 영역(grating area)에 반사되어 사용자의 눈에 전달될 수 있다. 제1 투명 부재(225a) 및/또는 제2 투명 부재(225b)는 글래스 플레이트, 플라스틱 플레이트, 또는 폴리머로 형성될 수 있으며, 투명 또는 반투명하게 제작될 수 있다.

일 실시 예에서, 렌즈(미도시)는 디스플레이(예: 제1 디스플레이(205) 및 제2 디스플레이(210))의 전면에 배치될 수 있다. 렌즈(미도시)는 오목 렌즈 및/또는 볼록 렌즈를 포함할 수 있다. 예컨대, 렌즈(미도시)는 프로젝션 렌즈(projection lens) 또는 콜리메이션 렌즈(collimation lens)를 포함할 수 있다.

일 실시 예에서, 화면 표시부(215) 또는 투명 부재(예: 제1 투명 부재(225a), 제2 투명 부재(225b))는 웨이브가이드(waveguide)를 포함하는 렌즈, 반사형 렌즈를 포함할 수 있다.

일 실시 예에서, 웨이브가이드는 글래스, 플라스틱, 또는 폴리머로 제작될 수 있으며, 내부 또는 외부의 일표면에 형성된 나노 패턴, 예를 들어, 다각형 또는 곡면 형상의 그레이팅 구조(grating structure)를 포함할 수 있다. 일 실시 예에 따르면, 웨이브가이드의 일단으로 입사된 광은 나노 패턴에 의해 디스플레이 웨이브가이드 내부에서 전파되어 사용자에게 제공될 수 있다. 일 실시 예에서, 프리폼(free-form)형 프리즘으로 구성된 웨이브가이드는 입사된 광을 반사 미러를 통해 사용자에게 제공될 수 있다. 웨이브가이드는 적어도 하나의 회절 요소 예컨대, DOE(diffractive optical element), HOE(holographic optical element)) 또는 반사 요소(예: 반사 거울) 중 적어도 하나를 포함할 수 있다. 일 실시 예에서, 웨이브가이드는 웨이브가이드에 포함된 적어도 하나의 회절 요소 또는 반사 요소를 이용하여 디스플레이(205, 210)로부터 방출되는 광을 사용자의 눈으로 유도할 수 있다.

다양한 실시예들에 따라, 회절 요소는 입력 광학 부재(220)/출력 광학 부재(미도시)를 포함할 수 있다. 예컨대, 입력 광학 부재(220)는 입력 그레이팅 영역(input grating area)을 의미할 수 있으며, 출력 광학 부재(미도시)는 출력 그레이팅 영역(output grating area)을 의미할 수 있다. 입력 그레이팅 영역은 디스플레이(예: 제1 디스플레이(205) 및 제2 디스플레이(210))(예: 마이크로 LED)로부터 출력되는 광을 화면 표시부(215)의 투명 부재(예: 제1 투명 부재(250a), 제2 투명 부재(250b))로 광을 전달하기 위해 회절(또는 반사)시키는 입력단 역할을 할 수 있다. 출력 그레이팅 영역은 웨이브가이드의 투명 부재(예: 제1 투명 부재(250a), 제2 투명 부재(250b))에 전달된 광을 사용자의 눈으로 회절(또는 반사)시키는 출구 역할을 할 수 있다.

다양한 실시예들에 따라, 반사 요소는 전반사(total internal reflection, TIR)를 위한 전반사 광학 소자 또는 전반사 도파관을 포함할 수 있다. 예컨대, 전반사는 광을 유도하는 하나의 방식으로, 입력 그레이팅 영역을 통해 입력되는 광(예: 가상 영상)이 웨이브가이드의 일면(예: 특정 면)에서 100% 반사되도록 입사각을 만들어, 출력 그레이팅 영역까지 100% 전달되도록 하는 것을 의미할 수 있다.

일 실시 예에서, 디스플레이(205, 210)로부터 방출되는 광은 입력 광학 부재(220)를 통해 웨이브가이드로 광 경로가 유도될 수 있다. 웨이브가이드 내부를 이동하는 광은 출력 광학 부재를 통해 사용자 눈 방향으로 유도될 수 있다. 화면 표시부(215)는 눈 방향으로 방출되는 광에 기반하여 결정될 수 있다.

일 실시 예에서, 제1 카메라(245a, 245b)는 3DoF(3 degrees of freedom), 6DoF의 헤드 트래킹(head tracking), 핸드(hand) 검출과 트래킹(tracking), 제스처(gesture) 및/또는 공간 인식을 위해 사용되는 카메라를 포함할 수 있다. 예컨대, 제1 카메라(245a, 245b)는 헤드 및 핸드의 움직임을 검출하고, 움직임을 추적하기 위해 GS(global shutter) 카메라를 포함할 수 있다.

일례로, 제1 카메라(245a, 245b)는 헤드 트래킹과 공간 인식을 위해서 스테레오(stereo) 카메라가 적용될 수 있고, 동일 규격, 동일 성능의 카메라가 적용될 수 있다. 제1 카메라(245a, 245b)는 빠른 손동작과 손가락과 같이 미세한 움직임을 검출하고 움직임을 추적하기 위해서 성능(예: 영상끌림)이 우수한 GS 카메라가 사용될 수 있다.

다양한 실시 예에 따라, 제1 카메라(245a, 245b)는 RS(rolling shutter) 카메라가 사용될 수 있다. 제1 카메라(245a, 245b)는 6 Dof를 위한 공간 인식, 깊이(depth) 촬영을 통한 SLAM 기능을 수행할 수 있다. 제1 카메라(245a, 245b)는 사용자 제스처 인식 기능을 수행할 수 있다.

일 실시 예에서, 제2 카메라(275a, 275b)는 눈동자를 검출하고 추적할 용도로 사용될 수 있다. 제2 카메라(275a, 275b)는 ET(eye tracking)용 카메라로 지칭될 수 있다. 제2 카메라(265a)는 사용자의 시선 방향을 추적할 수 있다. 웨어러블 AR 장치(200)는 사용자의 시선 방향을 고려하여, 화면 표시부(215)에 투영되는 가상영상의 중심이 사용자의 눈동자가 응시하는 방향에 따라 위치하도록 할 수 있다.

시선 방향을 추적하기 위한 제2 카메라(275a, 275b)는 눈동자(pupil)를 검출하고 빠른 눈동자의 움직임을 추적할 수 있도록 GS 카메라가 사용될 수 있다. 제2 카메라(265a)는 좌안, 우안용으로 각각 설치될 수 있으며, 좌안용 및 우안용 제2카메라(265a)는 성능과 규격이 동일한 카메라가 사용될 수 있다.

일 실시 예에서, 제3 카메라(265)는 HR(high resolution) 또는 PV(photo video)로 지칭될 수 있으며, 고해상도의 카메라를 포함할 수 있다. 제3 카메라(265)는 AF(auto focus) 기능과 떨림 보정(OIS(optical image stabilizer))과 같은 고화질의 영상을 얻기 위한 기능들이 구비된 칼라(color) 카메라를 포함할 수 있다. 이에 한정하는 것은 아니며, 제3 카메라(265)는 GS(global shutter) 카메라 또는 RS(rolling shutter) 카메라를 포함할 수 있다.

일 실시 예에서, 적어도 하나의 센서(예: 자이로 센서, 가속도 센서, 지자기 센서, 초광대역 센서, 터치 센서, 조도 센서 및/또는 제스처 센서), 제1 카메라(245a, 265b)는 6DoF를 위한 헤드 트래킹(head tracking), 움직임 감지와 예측(pose estimation & prediction), 제스처 및/또는 공간 인식, 뎁스(depth) 촬영을 통한 슬램(slam) 기능 중 적어도 하나를 수행할 수 있다.

다른 실시예에서, 제1 카메라(245a, 245b)는 헤드 트래킹을 위한 카메라와 핸드 트래킹을 위한 카메라로 구분되어 사용될 수 있다.

일 실시 예에서, 조명부(230a, 230b)는 부착되는 위치에 따라 용도가 상이할 수 있다. 예컨대, 조명부(230a, 230b)는 프레임(frame) 및 템플(temple)을 이어주는 힌지(hinge)(예: 제1 힌지(240a), 제2 힌지(240b)) 주변이나 프레임을 연결해 주는 브릿지(bridge) 주변에 장착된 제1 카메라(245a, 245b)와 함께 부착될 수 있다. GS 카메라로 촬영하는 경우, 조명부(230a, 230b)는 주변 밝기를 보충하는 수단으로 사용될 수 있다. 예컨대, 어두운 환경이나 여러 광원의 혼입 및 반사 광 때문에 촬영하고자 하는 피사체 검출이 용이하지 않을 때, 조명부(230a, 230b)가 사용될 수 있다.

일 실시 예에서, 웨어러블 AR 장치(200)의 프레임 주변에 부착된 조명부(230a, 230b)는 제2 카메라(275a, 275b)로 동공을 촬영할 때 시선 방향(eye gaze) 검출을 용이하게 하기 위한 보조 수단으로 사용될 수 있다. 조명부(230a, 230b)가 시선 방향을 검출하기 위한 보조 수단으로 사용되는 경우 적외선 파장의 IR(infrared) LED를 포함할 수 있다.

일 실시 예에서, PCB(예: 제1 PCB(235a), 제2 PCB(235b))에는 웨어러블 AR 장치(200)의 구성요소들을 제어하는 프로세서(미도시), 메모리(미도시) 및 통신 모듈(미도시)이 포함될 수 있다. 통신 모듈은 도 1의 통신 모듈(190)과 동일하게 구성될 수 있고, 통신 모듈(190)에 대한 설명이 동일하게 적용될 수 있다. 예를 들어, 통신 모듈은 웨어러블 AR 장치(200)와 외부 전자 장치 간의 직접(예: 유선) 통신 채널 또는 무선 통신 채널의 수립, 및 수립된 통신 채널을 통한 통신 수행을 지원할 수 있다. PCB는 웨어러블 AR 장치(200)를 구성하는 구성요소들에 전기적 신호를 전달할 수 있다.

통신 모듈(미도시)은 프로세서와 독립적으로 운영되고, 직접(예: 유선) 통신 또는 무선 통신을 지원하는 하나 이상의 커뮤니케이션 프로세서를 포함할 수 있다. 일실시예에 따르면, 통신 모듈(미도시)은 무선 통신 모듈(예: 셀룰러 통신 모듈, 근거리 무선 통신 모듈, 또는 GNSS(global navigation satellite system) 통신 모듈) 또는 유선 통신 모듈(예: LAN(local area network) 통신 모듈, 또는 전력선 통신 모듈)을 포함할 수 있다. 이들 통신 모듈 중 해당하는 통신 모듈(미도시)은 블루투스, WiFi(wireless fidelity) direct 또는 IrDA(infrared data association)와 같은 근거리 통신 네트워크 또는 레거시 셀룰러 네트워크, 5G 네트워크, 차세대 통신 네트워크, 인터넷, 또는 컴퓨터 네트워크(예: LAN 또는 WAN)와 같은 원거리 통신 네트워크를 통하여 외부의 전자 장치와 통신할 수 있다. 이런 여러 종류의 통신 모듈들은 하나의 구성요소(예: 단일 칩)로 통합되거나, 또는 서로 별도의 복수의 구성요소들(예: 복수 칩들)로 구현될 수 있다.

무선 통신 모듈은 4G 네트워크 이후의 5G 네트워크 및 차세대 통신 기술, 예를 들어, NR 접속 기술(new radio access technology)을 지원할 수 있다. NR 접속 기술은 고용량 데이터의 고속 전송(eMBB(enhanced mobile broadband)), 단말 전력 최소화와 다수 단말의 접속(mMTC(massive machine type communications)), 또는 고신뢰도와 저지연(URLLC(ultra-reliable and low-latency communications))을 지원할 수 있다. 무선 통신 모듈은, 예를 들어, 높은 데이터 전송률 달성을 위해, 고주파 대역(예: mmWave 대역)을 지원할 수 있다. 무선 통신 모듈은 고주파 대역에서의 성능 확보를 위한 다양한 기술들, 예를 들어, 빔포밍(beamforming), 거대 배열 다중 입출력(massive MIMO(multiple-input and multiple-output)), 전차원 다중입출력(FD-MIMO: full dimensional MIMO), 어레이 안테나(array antenna), 아날로그 빔형성(analog beam-forming), 또는 대규모 안테나(large scale antenna)와 같은 기술들을 지원할 수 있다.

웨어러블 AR 장치(200)는 안테나 모듈(미도시)을 더 포함할 수 있다. 안테나 모듈은 신호 또는 전력을 외부(예: 외부의 전자 장치)로 송신하거나 외부로부터 수신할 수 있다. 일실시예에 따르면, 안테나 모듈은 서브스트레이트(예: 제1 PCB(235a), 제2 PCB(235b)) 위에 형성된 도전체 또는 도전성 패턴으로 이루어진 방사체를 포함하는 안테나를 포함할 수 있다. 일실시예에 따르면, 안테나 모듈은 복수의 안테나들(예: 어레이 안테나)을 포함할 수 있다.

일 실시 예에서, 복수의 마이크(예: 제1 마이크(250a), 제2 마이크(250b), 제3 마이크(250c))는 외부의 음향 신호를 전기적인 음성 데이터로 처리할 수 있다. 처리된 음성 데이터는 웨어러블 AR 장치(200)에서 수행 중인 기능(또는 실행 중인 어플리케이션)에 따라 다양하게 활용될 수 있다.

일 실시 예에서, 복수의 스피커(예: 제1 스피커(255a), 제2 스피커(255b))는 통신 모듈로부터 수신되거나 메모리에 저장된 오디오 데이터를 출력할 수 있다.

일 실시 예에서, 배터리(260)는 하나 이상 포함할 수 있으며, 웨어러블 AR 장치(200)를 구성하는 구성요소들에 전원을 공급할 수 있다.

일 실시 예에서, 바이저(270a, 270b)는 투과율에 따라 사용자의 눈으로 입사되는 외부광의 투과량을 조절할 수 있다. 바이저(270a, 270b)는 화면 표시부(215)의 앞 또는 뒤에 위치할 수 있다. 화면 표시부(215)의 앞은 웨어러블 AR 장치(200)를 착용한 사용자측과 반대 방향, 뒤는 웨어러블 AR 장치(200)를 착용한 사용자측 방향을 의미할 수 있다. 바이저(270a, 270b)는 화면 표시부(215)의 보호 및 외부광의 투과량을 조절할 수 있다.

일례로, 바이저(270a, 270b)는 인가되는 전원에 따라 색이 변경되어 투과율을 조절하는 전기변색 소자를 포함할 수 있다. 전기변색은 인가 전원에 의한 산화-환원 반응이 발생하여 색이 변경되는 현상이다. 바이저(270a, 270b)는 전기변색 소자가 색이 변경되는 것을 이용하여, 외부광의 투과율을 조절할 수 있다.

일례로, 바이저(270a, 270b)는 제어모듈 및 전기변색 소자를 포함할 수 있다. 제어모듈은 전기변색 소자를 제어하여 전기변색 소자의 투과율을 조절할 수 있다.

도 3은 일 실시 예에 따른 웨어러블 AR 장치의 카메라 및 시선 추적 센서를 나타낸 도면이다.

도 3을 참조하면, 일 실시 예에 따른 웨어러블 AR 장치(예: 도 2의 웨어러블 AR 장치(200))는 디스플레이(305, 310) (예: 도 2의 디스플레이(205, 210)), 광도파로(또는 웨이브 가이드)(315), 입력광학부재(320)(예: 도 2의 입력광학부재(220)), 출력광학부재(325), ET(eyetracking) 광도파로(또는 ET 웨이브 가이드)(330) ET 스플리터(splitter)(335), 카메라(340)(예: 제2 카메라(275a, 275b)), 시선 추적 센서(345) 및 조명부(예: 도 2의 조명부(230a, 230b))를 포함할 수 있다.

도 3을 참조하면, 웨어러블 AR 장치의 디스플레이(305, 310)에서 출력된 광은 입력광학부재(320)에 입력되어 광도파로(315)를 거쳐 출력광학부재(325)에서 사용자의 눈으로 전달됨을 확인할 수 있다.

도 3을 참조하면, 카메라(340)는 사용자의 눈 영상을 획득할 수 있다. 일례로, 사용자의 눈 영상은 하측의 ET 스플리터(335)에 입력되어 ET 광도파로(330)를 거쳐 상측의 ET 스플리터(335)로 전달될 수 있다. 카메라(340)는 상측의 ET 스플리터(335)로부터 사용자의 눈 영상을 획득할 수 있다.

일 실시 예에 따른 조명부는 사용자의 동공 영역으로 적외선 광을 출력할 수 있다. 적외선 광은 사용자의 동공에서 반사되어, 사용자의 눈 영상과 함께 ET 스플리터(335)로 전달될 수 있다. 카메라(340)가 획득하는 눈 영상은 반사된 적외선 광이 포함될 수 있다. 시선 추적 센서(345)는 사용자의 동공에서 반사되는 적외선 광의 반사광을 감지할 수 있다.

일 실시예에 따른 전자 장치(예: 도 1의 전자 장치(101))는 도 2에 도시된 웨어러블 AR 장치(200) 또는 도 3에 도시된 웨어러블 AR장치일 수 있으나, 반드시 이로 한정하는 것은 아니며, 스마트 워치(smart watch), 스마트 폰(smart phone), 태플릿 PC 과 같은 다양한 형태의 전자 장치일 수도 있다.

도 4는 일 실시예에 따른 대상 객체에 관한 영상을 획득하는 동작을 도시한 흐름도이다.

동작(410)에서 전자 장치(예: 도 1의 전자 장치(101) 또는 도 2의 웨어러블 AR 장치(200))는 카메라에 의해 촬영된 영상을 복수의 영역들로 분할하고, 영상에서 특징점들(feature points)을 검출함으로써 분할된 복수의 영역들 각각에 포함된 특징점의 개수를 산출하며, 산출된 결과에 기초하여 분할된 영역들 중 적어도 하나의 후보 영역을 선택할 수 있다. 특징점은 영상 내에서 특징이 되는 지점을 나타낼 수 있고, 특징점은 영상 간의 비교에 사용될 수 있다. 특징점은 영상의 크기(scale) 및 회전(rotation)에 영향을 받지 않는 방식으로 객체의 좌표를 나타낼 수 있고, 주변 픽셀과의 관계에 대한 밝기, 색상, 크기 중 적어도 하나의 정보를 가질 수 있다. 예를 들어, 전자 장치는 영상에서 식별되는 객체의 모서리(corner)에 대응하는 지점을 특징점으로 검출할 수 있다. 전자 장치는 분할된 영역들 중 적은 개수의 특징점을 포함하는 적어도 하나의 후보 영역을 선택할 수 있다.

동작(420)에서 전자 장치는 사용자의 시선을 추적하여 사용자의 시선 방향에 대응하는 대상 객체(target object)를 선택할 수 있다. 예를 들어, 전자 장치는 카메라(예: 도 1의 카메라 모듈(180) 또는 도 2의 제1 카메라(245a, 245b))에 의해 촬영된 영상으로부터 적어도 하나의 실제 객체(real object)를 식별할 수 있고, 식별된 적어도 하나의 실제 객체 중 하나의 실제 객체를 대상 객체로 선택할 수 있다. 다른 예를 들어, 전자 장치는 카메라에 의해 촬영된 영상에 가상 객체(virtual object)를 증강하여 새로운 영상을 생성할 수 있고, 생성된 새로운 영상에서 실제 객체 및 증강된 가상 객체 중 적어도 하나를 식별할 수 있다. 전자 장치는 식별된 실제 객체 및 증강된 가상 객체 중 적어도 하나의 객체를 대상 객체로 선택할 수도 있다. 또 다른 예를 들어, 전자 장치는 가상 객체를 포함하는 가상 영상을 생성할 수 있고, 생성된 가상 영상으로부터 적어도 하나의 가상 객체를 식별할 수 있다. 전자 장치는 식별된 적어도 하나의 가상 객체 중 하나의 가상 객체를 대상 객체로 선택할 수도 있다. 다시 말해, 전자 장치는 실제 객체 또는 가상 객체를 대상 객체로 선택할 수 있다. 이하에서는, 전자 장치가 카메라에 의해 촬영된 영상으로부터 식별된 실제 객체를 대상 객체로 선택하여 대상 객체에 관한 영상을 생성하는 것을 주로 설명하나, 이로 한정하지 않고, 전자 장치는 가상 영상으로부터 식별된 가상 객체를 대상 객체로 선택하여 대상 객체에 관한 영상을 생성할 수도 있다. 예를 들어, 전자 장치는 사용자의 머리에 착용 가능한 웨어러블(wearble) AR 장치(예: 도 2의 웨어러블 AR 장치(200))일 수 있으나, 반드시 이로 한정하는 것은 아니다.

동작(430)에서 전자 장치는 대상 객체에 대한 이벤트의 발생을 감지하는 것에 기초하여, 선택된 적어도 하나의 후보 영역 내에서 캡처 영역(capture area)을 결정할 수 있다. 캡처 영역은 영상 내에서 대상 객체를 캡처하기 위한 영역을 나타낼 수 있다. 전자 장치는 영상 내에서 대상 객체를 캡처하기에 최적화된 영역을 캡처 영역으로 설정할 수 있다. 전자 장치는 영상 내에서 캡처 영역의 위치 및/또는 크기를 다양한 방법으로 결정할 수 있으며, 이와 관련하여서는 후술한다.

동작(440)에서 전자 장치는 영상 중 결정된 캡처 영역으로부터 캡처된 부분 영상을 획득할 수 있다. 전자 장치는 획득된 부분 영상에 기초하여 대상 객체에 관한 영상을 생성할 수 있다. 예를 들어, 전자 장치는 캡처 영역으로 대상 객체가 진입하는 시점부터 부분 영상을 획득할 수 있고, 획득된 부분 영상을 후처리(postprocessing)하여 대상 객체에 관한 영상을 생성할 수 있다.

도 5은 일 실시예에 따른 영상에서 특징점들을 검출하는 과정을 설명하는 도면이다.

일 실시예에 따른 전자 장치(예: 도 1의 전자 장치(101) 또는 도 2의 웨어러블 AR 장치(200))는 카메라(예: 도 1의 카메라 모듈(180) 또는 도 2의 제1 카메라(245a, 245b))에 의해 촬영된 영상(510)을 복수의 영역들(511-1, 511-2, …, 511-3)로 분할할 수 있다. 도 5에서, 전자 장치가 영상(510)을 3×3개의 영역들로 분할하는 예시가 도시되나, 반드시 이로 한정하는 것은 아니다. 전자 장치는 영상을 a×b개의 영역들로 분할할 수 있다. 여기서, a 및 b는 1 이상의 자연수일 수 있다. 이하에서는, 설명의 편의를 위하여, 전자 장치가 영상을 3×3개의 영역들로 분할하는 것을 주로 설명한다.

전자 장치는 영상(510)에서 특징점들(feature points)을 검출할 수 있다. 전자 장치는 특징점 검출 알고리즘을 통해 특징점들을 검출할 수 있다. 도 5을 참조하면, 전자 장치는 영상(510)에서 특징점 검출 알고리즘을 통해 복수의 특징점들(530-1, 530-2, …, 530-3)을 검출할 수 있다. 예를 들어, 전자 장치는 영상(510)에서 특징점 검출 알고리즘을 통해 복수의 원들(520-1, 520-2, …, 520-3)을 검출할 수 있고, 검출된 복수의 원들(520-1, 520-2, …, 520-3) 각각의 중심(center)을 특징점들(530-1, 530-2, …, 530-3)로 검출할 수 있다.

도 6은 일 실시예에 따른 분할된 복수의 영역들 중 특징점의 개수에 기초하여 적어도 하나의 후보 영역을 선택하는 과정을 설명하는 도면이다.

일 실시예에 따른 전자 장치(예: 도 1의 전자 장치(101) 또는 도 2의 웨어러블 AR 장치(200))는 영상(610)을 복수의 영역들로 분할할 수 있다. 전자 장치는 영상(610)에서 특징점들을 검출함으로써 분할된 영역들 각각에 포함된 특징점의 개수를 산출할 수 있다. 전자 장치는 복수의 영역들에서 특징점의 개수가 적은 적어도 하나의 후보 영역(612-1, 612-2)을 선택할 수 있다.

일 실시예에 따르면, 전자 장치는 분할된 영역들 사이에서 상대적으로 적은 특징점을 포함하는 일부 분할된 영역을 후보 영역으로 선택할 수 있다. 전자 장치는 모든 분할된 영역들 중 포함하는 특징점의 개수가 가장 적은 영역을 후보 영역으로 선택할 수 있다. 다른 예를 들어, 전자 장치는 모든 분할된 영역들 각각이 포함하는 특징점의 개수의 평균 개수를 산출할 수 있고, 산출된 평균 개수 이하의 특징점을 포함하는 적어도 하나의 분할된 영역을 후보 영역으로 선택할 수 있다.

다른 일 실시예에 따르면, 전자 장치는 분할된 영역들 사이에서 절대적으로 적은 특징점을 포함하는 일부 분할된 영역을 후보 영역으로 선택할 수도 있다. 예를 들어, 전자 장치는 모든 분할된 영역들 중 임계 개수(예를 들어, 5개) 이하의 특징점을 포함하는 적어도 하나의 분할된 영역을 후보 영역으로 선택할 수 있다.

도 7은 일 실시예에 따른 대상 객체를 선택하는 과정을 설명하는 도면이다.

전자 장치는 영상(710)에서 객체들(721, 722, 723)을 식별할 수 있다. 전술한 바와 같이, 객체는 실제 객체 또는 가상 객체일 수 있다. 예를 들어, 도 7에 도시된 바와 같이, 객체(721), 객체(722), 객체(723)은 각각 컵(cup), 키보드(keyboard), 모니터(monitor)를 나타낼 수 있다.

일 실시예에 따른 전자 장치(예: 도 1의 전자 장치(101) 또는 도 2의 웨어러블 AR 장치(200))는 사용자의 시선을 추적하여 사용자의 시선 방향에 대응하는 대상 객체(target object)를 선택할 수 있다. 전자 장치는 사용자의 시선 방향을 추적하는 아이 트래킹(eye-tracking) 카메라(예: 도 2의 제2 카메라(275a, 275b)를 더 포함할 수 있다. 아이 트래킹 카메라는 사용자의 눈동자 또는 사용자의 홍채를 검출하고 추적할 수 있고, 추적 결과에 기초하여 사용자의 시선 방향을 추적할 수 있다. 전자 장치는 사용자의 시선 방향에 대응하는 객체를 대상 객체로 선택할 수 있다. 예를 들어, 전자 장치는 디스플레이(예: 도 1의 디스플레이 모듈(160)에 영상(710)을 출력할 수 있다. 전자 장치는 아이 트래킹 카메라를 통해 디스플레이에 출력된 영상(710)을 바라보는 사용자의 시선을 추적하여, 영상(710)에서 사용자의 시선 방향에 대응하는 시선 영역(730)을 검출할 수 있다. 전자 장치는 디스플레이에 출력된 영상(710)에서 식별되는 객체들(721, 722, 723) 각각이 표시되는 객체 영역을 검출할 수 있다. 전자 장치는 사용자의 시선 방향에 대응하는 시선 영역(730)의 적어도 일부와 오버랩(overlap)되는 객체 영역에 대응하는 객체(예를 들어, 객체(721))를 사용자의 시선 방향에 대응하는 대상 객체로 판단할 수 있다.

도 8 내지 도 9은 일 실시예에 따른 사용자의 제스처와 관련된 이벤트 발생을 감지하는 것을 설명하는 도면이다.

일 실시예에 따른 전자 장치(예: 도 1의 전자 장치(101) 또는 도 2의 웨어러블 AR 장치(200))는 대상 객체와 관련된 사용자의 제스처(gesture)가 검출되는 것에 기초하여 이벤트 발생을 감지할 수 있다. 전자 장치는 영상(610)에서 대상 객체와 관련된 사용자의 제스처를 검출할 수 있다. 예를 들어, 사용자의 제스처는 사용자의 손 모양 제스처를 나타낼 수 있으나, 반드시 이로 한정하는 것은 아니다. 전자 장치는 영상(810)에서 사용자의 손 모양을 분석함으로써 사용자의 손 모양 제스처를 추출할 수 있다. 보다 구체적으로, 전자 장치는 대상 객체가 표시되는 객체 영역을 둘러싸는(surround) 이벤트 감지 영역으로 진입하는 대상 객체에 대한 사용자의 제스처가 검출되고, 검출된 사용자의 제스처가 전자 장치에 미리 저장된 손 모양 제스처들 중 하나와 동일한 형태를 갖는 경우에 응답하여 이벤트 발생을 감지할 수 있다.

도 8의 예시에서, 전자 장치는 사용자의 시선 방향에 대응하는 객체(821)(예를 들어, '컵')를 대상 객체로 선택할 수 있다. 전자 장치는 대상 객체(예를 들어, 객체(821))가 표시되는 객체 영역을 둘러싸는 이벤트 감지 영역(830)을 생성할 수 있다. 이벤트 감지 영역(830)은 대상 객체(예를 들어, 객체(821))에 대응하는 영역을 포함하는 영역일 수 있다. 예를 들어, 이벤트 감지 영역은 직사각형 형태일 수 있으나, 이로 한정하는 것은 아니며, 원형과 같은 다른 형태를 가질 수도 있다. 예를 들어, 이벤트 감지 영역의 크기는 대상 객체가 표시되는 객체 영역의 크기와 비교하여 대략 2배만큼 클 수 있으나, 이벤트 감지 영역의 크기를 이로 한정하는 것은 아니다.

전자 장치는 이벤트 발생을 감지하기 이전에 검출되는 사용자의 제스처를 대상 객체와 관련된 사용자의 제스처로 판단할 수 있다. 후술하겠으나, 전자 장치는 이벤트 발생을 감지하고 캡처 영역이 결정된 이후에 검출되는 사용자의 제스처를 캡처 영역과 관련된 사용자의 제스처로 판단할 수 있다.

전자 장치는 검출된 대상 객체와 관련된 사용자의 제스처(640)가 전자 장치에 미리 저장된 손 모양 제스처들 중 하나와 동일한 형태를 갖는 경우에 응답하여 이벤트 발생을 감지할 수 있다. 전자 장치는 다양한 형태의 손 모양 제스처를 미리 저장할 수 있다. 예를 들어, 도 9에 도시된 바와 같이, 전자 장치는 다양한 손 모양 제스처들(910-1, 910-2, …, 910-n)을 미리 저장할 수 있다. 예를 들어, 전자 장치에 저장되는 손 모양 제스처들(910-1, 910-2, …, 910-n) 각각은 객체를 잡는(hold) 형태 또는 들어올리는(raise) 형태의 손 모양 제스처를 나타낼 수 있다. 전자 장치에 미리 저장되는 손 모양 제스처는 도 9에 도시된 손 모양 제스처들로 한정하지는 않는다. 전자 장치는 미리 저장된 손 모양 제스처의 형태 뿐만 아니라, 미리 저장된 손 모양 제스처의 회전에 따라 변형된 형태까지 고려하여 사용자의 제스처와 형태를 서로 비교할 수 있다. 예를 들어, 전자 장치는 미리 저장된 하나의 손 모양 제스처의 회전에 따라 변형된 형태가 사용자의 제스처와 동일한 형태를 갖는 경우에도 이벤트의 발생을 감지할 수 있다.

도 10은 일 실시예에 따른 캡처 영역(capture area)을 결정하는 과정을 설명하는 도면이다.

일 실시예에 따른 전자 장치(예: 도 1의 전자 장치(101) 또는 도 2의 웨어러블 AR 장치(200))는 이벤트 발생을 감지하는 것에 기초하여, 선택된 적어도 하나의 후보 영역 내에서 캡처 영역을 결정할 수 있다. 전자 장치는 대상 객체가 표시되는 객체 영역의 색상 정보, 영상 내에서 사용자의 선호 영역, 영상에서 검출되는 특징점들, 대상 객체가 대응하는 물체(thing)로 분류될 확률값 중 적어도 하나 또는 둘 이상의 조합에 기초하여 적어도 하나의 후보 영역 내에서 캡처 영역을 결정할 수 있다.

도 10의 예시에서, 전자 장치는 영상(1010)을 복수의 영역들로 분할할 수 있고, 분할된 복수의 영역들 중 복잡도에 기초하여 후보 영역들(1012-1, 1012-2, 1012-3)을 선택할 수 있다. 또한, 전자 장치는 영상(1010)에서 대상 객체(1020)를 선택할 수 있다. 전자 장치는 선택된 후보 영역들(1012-1, 1012-2, 1012-3) 내에서 캡처 영역(1050)의 위치 및 크기를 결정할 수 있다.

다양한 실시예들에 따르면, 전자 장치는 대상 객체(1020)가 표시되는 객체 영역의 색상 정보에 기초하여 선택된 후보 영역들(1012-1, 1012-2, 1012-3) 내에서 캡처 영역을 결정할 수 있다. 전자 장치는 영상(1010)에서 대상 객체(1020)가 표시되는 객체 영역의 색상 정보를 산출할 수 있다. 예를 들어, 전자 장치는 대상 객체(1020)가 표시되는 객체 영역을 구성하는 픽셀들의 평균 색상을 색상 정보로 산출할 수 있고, 대상 객체(1020)가 표시되는 객체 영역을 구성하는 픽셀들의 색상 히스토그램(histogram)을 색상 정보로 산출할 수도 있다. 여기서, 색상 히스토그램은 색상 별 분포를 나타낼 수 있다. 예를 들어, 전자 장치는 선택된 후보 영역들(1012-1, 1012-2, 1012-3) 내에서 일정 크기를 갖는 임의의 영역을 지정할 수 있다. 전자 장치는 지정된 영역의 색상 정보를 산출하여 대상 객체(1020)가 표시되는 객체 영역의 색상 정보와 비교할 수 있다. 전자 장치는 비교 결과에 기초하여 지정된 영역에 색상 정보에 따른 제1 스코어를 부여할 수 있다. 전자 장치는 지정된 영역의 색상 정보가 대상 객체(1020)가 표시되는 객체 영역의 색상 정보와 유사할수록 제1 스코어를 낮게 부여할 수 있고, 지정된 영역의 색상 정보가 대상 객체(1020)가 표시되는 객체 영역의 색상 정보와 비유사할수록 제1 스코어를 높게 부여할 수 있다. 예를 들어, 전자 장치는 대상 객체(1020)가 표시되는 객체 영역의 색상 정보에 기초하여 후보 영역들(1012-1, 1012-2, 1012-3) 내에서 가장 높은 색상 정보에 따른 제1 스코어를 갖는 영역을 캡처 영역으로 결정할 수 있다.

다양한 실시예들에 따르면, 전자 장치는 영상(1010) 내에서 사용자의 선호 영역에 기초하여, 선택된 후보 영역들(1012-1, 1012-2, 1012-3) 내에서 캡처 영역을 결정할 수 있다. 예를 들어, 전자 장치는 사용자로부터 영상 내에서 사용자가 대상 객체를 캡처하는데 선호하는 영역을 미리 수신할 수 있다. 예를 들어, 전자 장치는 선택된 후보 영역들(1012-1, 1012-2, 1012-3) 내에서 일정 크기를 갖는 임의의 영역을 지정할 수 있다. 전자 장치는 지정된 영역과 사용자의 선호 영역의 위치를 비교할 수 있다. 전자 장치는 비교 결과에 기초하여 지정된 영역에 사용자 선호에 따른 제2 스코어를 부여할 수 있다. 예를 들어, 전자 장치는 지정된 영역이 사용자의 선호 영역과 가까울수록 제2 스코어를 높게 부여할 수 있고, 지정된 영역이 사용자의 선호 영역과 멀어질수록 제2 스코어를 낮게 부여할 수 있다. 전자 장치는 사용자의 선호 영역에 기초하여 후보 영역들(1012-1, 1012-2, 1012-3) 내에서 가장 높은 제2 스코어를 갖는 영역을 캡처 영역으로 결정할 수 있다.

다양한 실시예들에 따르면, 전자 장치는 영상(1010)에서 검출되는 특징점들에 기초하여, 후보 영역들(1012-1, 1012-2, 1012-3) 내에서 캡처 영역을 결정할 수 있다. 예를 들어, 전자 장치는 선택된 후보 영역들(1012-1, 1012-2, 1012-3) 내에서 일정 크기를 갖는 임의의 영역을 지정할 수 있다. 전자 장치는 지정된 영역에서 검출되는 특징점들의 개수에 기초하여 지정된 영역에 특징점 개수에 따른 제3 스코어를 부여할 수 있다. 전자 장치는 지정된 영역에서 검출되는 특징점들의 개수가 많을수록 제3 스코어를 낮게 부여할 수 있고, 특정 영역에서 검출되는 특징점들의 개수가 적을수록 제3 스코어를 높게 부여할 수 있다. 예를 들어, 전자 장치는 영상에서 검출되는 특징점들에 기초하여 후보 영역들(1012-1, 1012-2, 1012-3) 내에서 가장 높은 제3 스코어를 갖는 영역을 캡처 영역으로 결정할 수 있다.

다양한 실시예들에 따르면, 전자 장치는 후보 영역들(1012-1, 1012-2, 1012-3) 내에서 지정된 영역 마다 제1 스코어, 제2 스코어, 및 제3 스코어에 기초한 최종 스코어를 산출할 수도 있다. 전자 장치는 지정된 영역에 대하여 산출된 제1 스코어, 제2 스코어, 및 제3 스코어 마다 제1 가중치, 제2 가중치, 및 제3 가중치를 적용하여 최종 스코어를 산출할 수 있다. 예를 들어, 전자 장치는 지정된 영역에 대하여, 제1 스코어에 제1 가중치를 적용하고, 제2 스코어에 제2 가중치를 적용하며, 제3 스코어에 제3 가중치를 적용한 이후에 모두 합(sum)함으로써 지정된 영역에 대한 최종 스코어를 산출할 수 있다. 전자 장치는 후보 영역들(1012-1, 1012-2, 1012-3) 내에서 가장 높은 최종 스코어를 갖는 영역을 캡처 영역으로 결정할 수도 있다.

다양한 실시예들에 따르면, 전자 장치는 대상 객체(1020)가 대응하는 물체(thing)로 분류될 확률값을 더 고려하여 선택된 후보 영역들(1012-1, 1012-2, 1012-3) 내에서 캡처 박스의 영역을 결정할 수 있다. 예를 들어, 전자 장치는 대상 객체(1020)에 대응하는 물체를 '무선 충전 케이스' 판단할 수 있다. 전자 장치는 대상 객체(1020)가 '무선 충전 케이스'로 분류될 확률값을 산출할 수 있다. 전자 장치는 대상 객체(1020)가 '무선 충전 케이스'로 분류될 확률값이 임계 확률값 보다 큰 경우에는 대상 객체(1020)에 대한 인식이 용이하다고 판단하여, 캡처 영역의 결정시 영상의 배경에 의한 영향을 작게 할 수 있다. 전자 장치는 대상 객체(1020)가 '무선 충전 케이스'로 분류될 확률값이 임계 확률값 이하인 경우에는 대상 객체(1020)에 대한 인식이 용이하지 않다고 판단하여, 캡처 영역의 결정시 영상의 배경에 의한 영향을 크게 할 수 있다. 여기서, 영상의 배경에 의한 영향이란 영상의 색상 및 영상 내의 특징점에 의한 영향을 나타낼 수 있다. 다시 말해, 전자 장치는 색상 정보에 따른 제1 스코어 및 특징점 개수에 따른 제3 스코어 각각에 대응하는 가중치를 조절할 수 있다. 예를 들어, 전자 장치는 영상의 배경에 의한 영향을 크게하는 경우에는 제1 스코어 및 제3 스코어에 대한 가중치를 증가시킬 수 있고, 배경에 의한 영향을 작게하는 경우에는 제1 스코어 및 제3 스코어에 대한 가중치를 감소시킬 수 있다. 예를 들어, 전자 장치는 대상 객체(1020)가 대응하는 물체에 대하여 정형화된 형태를 갖는 경우에는 대응하는 물체로 분류될 확률값을 높게 산출할 수 있고, 대상 객체(1020)가 대응하는 물체에 대하여 비정형화된 형태를 갖는 경우에는 대응하는 물체로 분류될 확률값을 낮게 산출할 수 있다.

다양한 실시예들에 따르면, 일 실시예에 따른 전자 장치는 이벤트 발생을 감지한 이후에 영상에서 특징점들을 재검출할 수 있다. 전자 장치는 카메라의 이동을 감지하는 것게 기초하여, 이벤트 발생을 감지한 이후에 영상에서 특징점들을 재검출함으로써 분할된 복수의 영역들 각각에 포함된 특징점의 개수를 재산출하고, 재산출된 결과에 기초하여 분할된 복수의 영역들 중 적어도 하나의 후보 영역을 재선택할 수 있다. 예를 들어, 전자 장치는 영상에서 글로벌 모션을 감지하는 것에 기초하여, 이벤트 발생을 감지한 이후에 영상에서 특징점들을 재검출하고, 복수의 영역들 각각에 포함된 특징점의 개수를 재산출하며, 후보 영역을 재선택할 수 있다. 글로벌 모션은 제1 시점의 영상 프레임으로부터 영상의 제2 시점의 영상 프레임까지 모든 객체 및 배경의 움직임을 나타낼 수 있다. 반대로, 로컬 모션은 제1 시점의 영상 프레임으로부터 제2 시점의 영상 프레임까지 특정 영역에서의 객체 또는 배경의 움직임을 나타낼 수 있다. 예를 들어, 글로벌 모션은 카메라의 이동에 의해 발생하고, 로컬 모션은 카메라의 이동과 무관하게 발생할 수 있다. 전자 장치가 영상에서 글로벌 모션을 감지하는 경우에는 이벤트 발생을 감지하기 이전 시점의 영상 프레임과 이벤트 발생을 감지한 이후 시점의 영상 프레임에서 객체들의 위치 및 배경은 서로 상이할 수 있고, 영상 내의 특징점들의 위치 및 개수는 변경될 수 있다. 따라서, 전자 장치는 이벤트 발생을 감지한 이후 시점의 영상 프레임에서 특징점들을 재검출하여 후보 영역을 재선택함으로써 영상에서의 객체들의 위치 및 배경의 변화를 반영할 수 있다.

도 11는 일 실시예에 따른 캡처 영역에서 노이즈 크기를 산출하는 과정을 설명하는 도면이다.

일 실시예에 따른 전자 장치(예: 도 1의 전자 장치(101) 또는 도 2의 웨어러블 AR 장치(200))는 영상(1110)에서 캡처 영역(1150)을 결정할 수 있다. 전자 장치는 영상(1110)의 캡처 영역(1150) 내에서 노이즈(noise)의 크기를 산출할 수 있다. 여기서, 노이즈는 캡처 영역으로 사용되기 어려운 정도를 나타낼 수 있다. 노이즈가 클수록 캡처 영역으로 사용하기에 불리한 것으로 판단할 수 있고, 노이즈가 작을수록 캡처 영역으로 사용하기에 유리한 것으로 판단할 수 있다. 전자 장치는 캡처 영역에서 검출되는 특징점의 개수, 대상 객체가 표시되는 객체 영역의 색상 정보, 및/또는 대상 객체가 대응하는 물체로 분류될 확률값에 기초하여 캡처 영역 내의 노이즈 크기를 산출할 수 있다. 전자 장치는 캡처 영역 내의 노이즈 크기가 임계 노이즈 크기 이상인 경우, 디스플레이에 경고 메시지 및 캡처 영역의 위치 이동을 가이드하는 정보 중 적어도 하나를 표시할 수 있다.

도 11의 예시에서, 전자 장치는 영상(1110)에서 결정된 캡처 영역(1150) 내에서 노이즈 크기를 산출할 수 있다. 전자 장치는 캡처 영역(1150) 내에서 산출되는 노이즈의 크기가 임계 노이즈 크기 이상인 경우, 캡처 영역(1150)이 객체 등록에 불리한 위치인 것으로 판단할 수 있다. 이러한 경우, 전자 장치는 디스플레이에 캡처 영역(1150)이 객체 등록에 불리함을 나타내는 경고 메시지(warning message) 및 캡처 영역(1150)의 위치 이동을 가이드(guide)하는 정보 중 적어도 하나를 출력할 수 있다.

도 12은 일 실시예에 따른 캡처 영역의 크기 변경을 설명하는 도면이다.

일 실시예에 따른 전자 장치(예: 도 1의 전자 장치(101) 또는 도 2의 웨어러블 AR 장치(200))는 캡처 영역의 위치 및 크기를 변경할 수 있다. 전자 장치는 대상 객체가 표시되는 객체 영역과 캡처 영역을 서로 비교할 수 있다. 전자 장치는 비교 결과에 기초하여 대상 객체가 캡처 영역을 벗어나는 것으로 판단하는 경우, 캡처 영역이 대상 객체가 표시되는 객체 영역을 포함하도록 캡처 영역의 위치 및 크기 중 적어도 하나를 변경할 수 있다. 도 12의 예시에서, 전자 장치는 영상(1210)에서 대상 객체(1221)를 선택하고 캡처 영역(1251)을 결정할 수 있다. 전자 장치는 대상 객체(1221)가 표시되는 객체 영역과 캡처 영역(1251)을 서로 비교할 수 있고, 캡처 영역(1251)이 대상 객체(1221)가 표시되는 객체 영역의 적어도 일부를 포함하지 않는 경우에는 대상 객체(1221)가 캡처 영역을 벗어나는 것으로 판단할 수 있다. 전자 장치는 캡처 영역(1251)이 대상 객체(1221)가 표시되는 객체 영역을 포함하도록 캡처 영역(1251)의 위치 및 크기 중 적어도 하나를 변경할 수 있다. 도 12에서는, 전자 장치가 캡처 영역(1251)을 대상 객체(1221)가 표시되는 객체 영역을 포함하도록 캡처 영역(1252)으로 변경하는 것을 도시한다.

도 13은 일 실시예에 따른 캡처 영역의 위치 변경을 설명하는 도면이다.

일 실시예에 따른 전자 장치(예: 도 1의 전자 장치(101) 또는 도 2의 웨어러블 AR 장치(200))는 캡처 영역의 위치를 변경할 수 있다. 전자 장치는 영상(1310)을 복수의 영역들로 분할할 수 있고, 분할된 복수의 영역들 중 후보 영역을 선택할 수 있다. 전자 장치는 선택된 후보 영역 중 캡처 영역으로 사용 가능한 경계 영역(1380)을 식별할 수 있다. 예를 들어, 전자 장치는 대상 객체가 표시되는 객체 영역의 색상 정보, 영상 내에서 사용자의 선호 영역, 영상에서 검출되는 특징점들, 대상 객체가 대응하는 물체로 분류될 확률값 중 적어도 하나 또는 둘 이상의 조합에 기초하여 후보 영역 중 캡처 영역으로 사용 가능한 영역(1380)을 식별할 수 있다. 전자 장치는 캡처 영역을 경계 영역(1380) 내에서 이동시킬 수 있다.

도 13의 예시에서, 전자 장치는 캡처 영역(1350)의 주변에 캡처 영역(1350)이 이동 가능한 방향에 관한 정보를 표시할 수 있다. 예를 들어, 전자 장치는 캡처 영역으로 사용 가능한 경계 영역(1380)에 기초하여, 캡처 영역(1350)의 주변에 캡처 영역(1350)이 상, 하, 좌, 우로 이동 가능함을 나타내는 화살표 형태의 인터페이스 객체들을 표시할 수 있다.

도 14는 일 실시예에 따른 캡처 박스 내에서 회전 가이드를 제공하는 과정을 설명하는 도면이다.

일 실시예에 따른 전자 장치(예: 도 1의 전자 장치(101) 또는 도 2의 웨어러블 AR 장치(200))는 캡처 영역에서 대상 객체의 복수의 단면들에 대한 이미지를 획득하기 위한 회전 가이드를 제공할 수 있다. 전자 장치는 대상 객체가 캡처 영역 내에 진입하는 경우, 영상(1410)을 출력하는 디스플레이에 대상 객체의 회전을 가이드하는 그래픽 객체를 표시할 수 있다. 전자 장치는 대상 객체의 회전을 감지하는 경우, 디스플레이에 캡처 영역에서 캡처된 대상 객체의 복수의 단면들에 대한 이미지들을 표시할 수 있다.

도 14의 예시에서, 전자 장치는 영상(1410)에서 캡처 영역(1450)을 결정할 수 있다. 전자 장치는 캡처 영역(1450)으로의 대상 객체(1420)가 진입하는 것을 감지할 수 있다. 전자 장치는 대상 객체(1420)가 캡처 영역(1450)으로 진입하는 경우, 대상 객체(1420)에 관한 영상 획득을 위하여 디스플레이에 대상 객체(1420)의 회전을 가이드하는 그래픽 객체를 표시할 수 있다. 예를 들어, 전자 장치는 대상 객체(1420)를 왼쪽 방향 및 오른쪽 방향으로 회전할 것을 지시하는 그래픽 객체들(1471, 1472)를 표시할 수 있다. 전자 장치는 영상(1410)에서 대상 객체(1420)의 회전을 감지하는 경우, 영상 프레임 별로 캡처 영역(1450)으로부터 대상 객체(1420)에 대한 단면 이미지를 획득할 수 있다. 전자 장치는 디스플레이에 캡처 영역(1450)으로부터 캡처된 대상 객체(1420)의 다양한 각도에서의 복수의 단면들에 대한 이미지들(1481, 1482, 1483)을 추가로 표시할 수 있다. 전자 장치는 대상 객체(1420)의 왼쪽 방향 및 오른쪽 방향으로의 회전에 따라 대상 객체(1420)의 단면에 대한 이미지가 충분히 획득되었다고 판단한 경우, 디스플레이에 대상 객체(1420)를 나머지 방향(예를 들어, 위쪽 방향 및 아래쪽 방향)으로 회전할 것을 지시하는 그래픽 객체들(1473, 1474)을 표시할 수 있다. 그리고, 전자 장치는 영상(1410)에서 대상 객체(1420)가 회전되기 이전과 동일한 각도로 배치되었다고 판단되면, 캡처 영역(1450)에서 대상 객체에 대한 이미지 획득을 종료할 수 있다.

도 15는 일 실시예에 따른 캡처 영역의 위치 및 크기를 결정하는 과정을 설명하는 도면이다.

일 실시예에 따른 전자 장치(예: 도 1의 전자 장치(101) 또는 도 2의 웨어러블 AR 장치(200))는 캡처 영역의 위치 및 크기를 대상 객체가 표시되는 객체 영역의 위치 및 크기에 기초하여 결정할 수 있다. 예를 들어, 전자 장치는 대상 객체가 표시되는 객체 영역의 크기에 기초하여 캡처 영역의 크기를 결정할 수 있다. 전자 장치는 영상에서 대상 객체가 표시되는 객체 영역의 크기가 커지는 경우에 캡처 영역의 크기도 증가시킬 수 있다. 다른 예를 들어, 전자 장치는 대상 객체가 표시되는 객체 영역의 위치에 기초하여 캡처 영역의 위치를 결정할 수도 있다. 예를 들어, 전자 장치는 영상에서 대상 객체가 표시되는 객체 영역의 위치가 변경되는 경우에 캡처 영역의 위치도 변경시킬 수 있다.

일 실시예에 따르면, 전자 장치는 영상에서 대상 객체의 이동을 감지하는 경우, 대상 객체가 표시되는 객체 영역을 트래킹(tracking)하여 캡처 영역이 트래킹된 객체 영역을 포함하도록 캡처 영역의 위치 및 크기 중 적어도 하나를 변경할 수 있다. 도 13을 참조하면, 전자 장치는 영상 프레임(1510-1)에서 대상 객체(1521)가 표시되는 객체 영역에 기초하여 캡처 영역(1551)을 결정할 수 있고, 다른 시점의 영상 프레임(1510-2)에서 대상 객체(1522)가 표시되는 객체 영역에 기초하여 캡처 영역(1552)을 결정할 수 있다.

일 실시예에 따르면, 전자 장치는 대상 객체가 표시되는 객체 영역의 형태에 기초하여 캡처 영역의 형태를 결정할 수 있다. 예를 들어, 대상 객체가 표시되는 객체 영역의 형태가 원형인 경우, 캡처 영역의 형태도 원형으로 결정할 수 있다.

도 16a 내지 도 16b는 일 실시예에 따른 캡처 영역의 위치 및 크기를 자동으로 결정하는 과정을 설명하는 도면이다.

일 실시예에 따른 전자 장치(예: 도 1의 전자 장치(101) 또는 도 2의 웨어러블 AR 장치(200))는 캡처 영역의 위치 및 크기를 자동으로 결정할 수 있다.

도 16a에서, 전자 장치는 영상 내에서 캡처 영역을 미리 지정된 위치에 미리 지정된 크기로 자동 결정할 수 있다. 예를 들어, 전자 장치는 영상에서 캡처 영역의 중심(center)과 영상의 중심(center)이 일치하도록 캡처 영역을 결정할 수 있다. 전자 장치는 영상에서 영상의 중심과 캡처 영역의 중심이 일치하면서 일정 크기를 갖는 캡처 영역을 결정할 수 있다. 도 16a에는, 제1 크기를 갖는 캡처 영역(1651), 제2 크기를 갖는 캡처 영역(1652), 또는 제3 크기의 캡처 영역(1653)이 도시된다. 여기서, 제1 크기 보다 제2 크기가 클 수 있고, 제2 크기 보다 제3 크기가 클 수 있다.

도 16b에서, 전자 장치는 영상을 복수의 영역들로 분할할 수 있고, 분할된 복수의 영역들 중 선택된 후보 영역에 기초하여 캡처 영역의 크기를 결정할 수도 있다. 전자 장치는 영상에서 선택된 후보 영역의 개수 및 선택된 후보 영역의 위치에 기초하여 캡처 영역의 크기를 결정할 수 있다. 예를 들어, 전자 장치는 선택된 후보 영역의 개수가 많을수록 캡처 영역의 크기를 증가시킬 수 있고, 인접한 후보 영역이 많을수록 캡처 영역의 크기를 증가시킬 수 있다. 도 16b에 도시된 바와 같이, 전자 장치는 영상의 복수의 영역들 중 선택된 후보 영역들(1612-1, 1612-2, 1612-3, 1612-4)의 개수가 4개이고, 선택된 후보 영역들 모두가 인접하고 있지는 않은 경우, 선택된 후보 영역들 내에서 제4 크기의 캡처 영역(1654)을 결정할 수 있다. 전자 장치는 영상에서 선택된 후보 영역들(1613-1, 1632-2, 1613-3, 1613-4, 1613-5, 1613-6, 1613-7)의 개수가 7개이고, 선택된 후보 영역들 모두가 인접하고 있는 경우, 선택된 후보 영역들 내에서 제5 크기의 캡처 영역(1655)을 결정할 수 있다. 여기서, 제4 크기 보다 제5 크기가 클 수 있다.

도 17a 내지 도 17b는 일 실시예에 따른 사용자의 제스처에 기초하여 캡처 영역의 위치 및 크기를 결정하는 과정을 설명하는 도면이다.

일 실시예에 따른 전자 장치(예: 도 1의 전자 장치(101) 또는 도 2의 웨어러블 AR 장치(200))는 사용자의 제스처에 기초하여 캡처 영역의 위치 및 크기를 결정할 수 있다. 전자 장치는 캡처 영역과 관련된 사용자의 제스처를 인식하는 경우, 인식된 사용자의 제스처에 기초하여 캡처 영역의 위치 및 크기 중 적어도 하나를 변경할 수 있다.

도 17a에서는, 전자 장치는 영상 내에서 캡처 영역의 크기를 사용자의 제스처에 기초하여 변경하는 예시를 도시한다. 전자 장치는 A 시점의 영상 프레임(1710-1)에서 캡처 영역(1751)이 결정되고, 결정된 캡처 영역(1751) 내로 진입하는 사용자의 손 모양 제스처(1740)를 인식할 수 있다. 예를 들어, 전자 장치는 캡처 영역(1751) 내로 진입하는 사용자의 손 모양 제스처(1740)의 형태가 두 손가락이 맞닿는 형태인 경우, 캡처 영역(1751)의 크기 변경을 개시할 수 있다. 예를 들어, 전자 장치는 B 시점의 영상 프레임(1710-2)에서 사용자의 두 손가락에 대응하는 지점들(1791, 1792)을 검출할 수 있다. 전자 장치는 사용자의 두 손가락에 대응하는 지점들(1791, 1792)이 캡처 영역(1752)의 양 끝점이 되도록 캡처 영역의 크기를 증가시킬 수 있다.

도 17b에서는, 전자 장치는 영상 내에서 캡처 영역의 위치를 사용자의 제스처에 기초하여 변경하는 예시를 도시한다. 전자 장치는 C 시점의 영상 프레임(1710-3)에서 캡처 영역(1753)이 결정되고, 결정된 캡처 영역(1753)의 하나의 끝점에 대응하는 영역(1793)으로 사용자의 한 손가락이 진입하는 손 모양 제스처를 인식할 수 있다. 예를 들어, 전자 장치는 D 시점의 영상 프레임(1710-4)에서 사용자의 한 손가락이 위치하는 영역(1794)이 캡처 영역(1754)의 하나의 끝점에 대응하는 영역이 되도록 캡처 영역의 위치를 변경할 수 있다. 이때, 전자 장치는 캡처 영역의 크기는 동일하게 유지시킬 수 있다.

도 18은 일 실시예에 따른 캡처 영역으로부터 캡처된 부분 영상에 기초하여 대상 객체에 관한 영상을 생성하는 과정을 설명하는 도면이다.

일 실시예에 따른 전자 장치(예: 도 1의 전자 장치(101) 또는 도 2의 웨어러블 AR 장치(200))는 영상 중 결정된 캡처 영역으로부터 캡처된 부분 영상에 기초하여 대상 객체에 관한 영상을 생성할 수 있다. 이하에서는, 영상을 구성하는 하나의 영상 프레임에 대하여, 캡처 영역으로부터 캡처된 부분 영상에 대하여 주로 설명한다.

전자 장치는 하나의 영상 프레임에서 캡처 영역으로부터 캡처된 부분 영상(1811)를 획득할 수 있다. 전자 장치는 부분 영상(1811)에서 대상 객체(1820)가 표시되는 객체 영역을 제외한 나머지 영역(1830)을 식별할 수 있다. 전자 장치는 이미지(1811)에서 나머지 영역(1830)을 제거함으로써 대상 객체(1820)가 표시되는 객체 영역만이 표시된 이미지(1812)를 획득할 수 있다. 그리고, 전자 장치는 이미지(1812)에서 대상 객체(1820)가 가려진 영역들(1841, 1842)을 식별할 수 있다. 전자 장치는 대상 객체(1820)가 가려진 영역들(1841, 1842)을 대상 객체(1820)가 표시되는 객체 영역을 사용하여 복원(restore)할 수 있고, 가려진 영역들(1841, 1842)의 복원에 따라 대상 객체(1821)에 관한 최종 영상(1813)을 생성할 수 있다.

또한, 전자 장치는 대상 객체(1820)에 대한 최종 영상(1813)에 대한 화질을 개선할 수 있다. 예를 들어, 전자 장치는 컬러라이즈(colorize), 노이즈 감소(noise reduction), 업스케일링(upscaling), 초해상화(super-resolution), 디블러링(deblurring), 저조도(low light), 그림자 중 적어도 하나의 방법을 통해 최종 이미지(1813)의 화질을 개선할 수 있다.

전자 장치는 영상에 포함된 영상 프레임 별로 대상 객체(1820)에 관한 최종 영상을 생성할 수 있다. 전자 장치는 생성한 최종 영상을 조합함으로써 대상 객체(1820)에 대한 3D 모델링을 수행할 수 있다.

도 19 내지 도 20은 일 실시예에 따른 대상 객체에 관한 영상을 획득하는 다른 방법에 대하여 설명하는 도면이다.

일 실시예에 따른 전자 장치(예: 도 1의 전자 장치(101) 또는 도 2의 웨어러블 AR 장치(200))는 대상 객체에 관한 영상을 캡처 영역으로부터 캡처된 부분 영상에 기초하여 생성하는 대신에, 대상 객체에 관한 영상을 데이터베이스로부터 수신할 수 있다. 예를 들어, 전자 장치는 데이터베이스와 통신을 수립할 수 있다.

도 19에서는 대상 객체가 표시되는 객체 영역에서 바코드를 인식하는 경우의 예시를 설명한다. 전자 장치는 캡처 영역(1950)에서 대상 객체(1920)가 표시되는 객체 영역을 식별할 수 있다. 전자 장치는 대상 객체(1920)가 표시되는 객체 영역에서 바코드(1970)를 인식할 수 있고, 인식된 바코드(1970)를 데이터베이스에 전송할 수 있다. 예를 들어, 데이터베이스는 바코드 별로 매칭하는 객체에 관한 영상을 미리 저장하고 있을 수 있다. 전자 장치는 데이터베이스로부터 바코드(1970)와 매칭하는 객체에 관한 영상을 획득할 수 있다.

도 20에서는 대상 객체가 표시되는 객체 영역에서 QR(quick response) 코드를 인식하는 경우를 설명한다. 전자 장치는 캡처 영역(2050)에서 대상 객체(2020)가 표시되는 객체 영역을 식별할 수 있다. 전자 장치는 대상 객체(2020)가 표시되는 객체 영역에서 QR 코드(2070)를 인식할 수 있고, 인식된 QR 코드(2070)를 데이터베이스로 전송할 수 있다. 예를 들어, 데이터베이스는 QR 코드와 대응하는 정보를 미리 저장하고 있을 수 있다. 전자 장치는 데이터베이스로부터 QR 코드(2070)와 매칭하는 정보를 수신할 수 있다.

일 실시예에 따른 전자 장치는 카메라, 컴퓨터로 실행 가능한 명령어들이 저장된 메모리, 및 메모리에 억세스(access)하여 명령어들을 실행하는 프로세서를 포함하고, 명령어들은, 카메라에 의해 촬영된 영상을 복수의 영역들로 분할하고, 영상에서 특징점들(feature points)을 검출함으로써 분할된 복수의 영역들 각각에 포함된 특징점의 개수를 산출하며, 산출된 결과에 기초하여 분할된 복수의 영역들 중 적어도 하나의 후보 영역을 선택하고, 사용자의 시선을 추적하여 사용자의 시선 방향에 대응하는 대상 객체(target object)를 선택하며, 대상 객체에 대한 이벤트의 발생을 감지하는 것에 기초하여, 선택된 적어도 하나의 후보 영역 내에서 캡처 영역(capture area)을 결정하고, 영상 중 결정된 캡처 영역으로부터 캡처된 부분 영상에 기초하여 대상 객체에 관한 영상을 생성하도록 구성될 수 있다.

명령어들은, 영상에서 대상 객체와 관련된 사용자의 제스처(gesture)가 검출되는 것에 기초하여 이벤트 발생을 감지하도록 더 구성될 수 있다.

명령어들은, 대상 객체가 표시되는 객체 영역을 둘러싸는(surround) 이벤트 감지 영역으로 진입하는 대상 객체와 관련된 사용자의 제스처가 검출되고, 검출된 사용자의 제스처가 전자 장치에 미리 저장된 손 모양 제스처들 중 하나와 동일한 형태를 갖는 경우에 응답하여 이벤트 발생을 감지하도록 더 구성될 수 있다.

명령어들은, 대상 객체가 표시되는 객체 영역의 색상 정보, 영상 내에서 사용자의 선호 영역, 영상에서 검출되는 특징점들, 대상 객체가 대응하는 물체(thing)로 분류될 확률값 중 적어도 하나 또는 둘 이상의 조합에 기초하여 적어도 하나의 후보 영역 내에서 캡처 영역을 결정하도록 더 구성될 수 있다.

명령어들은, 카메라의 이동을 감지하는 것에 기초하여, 이벤트 발생을 감지한 이후에 영상에서 특징점들을 재검출함으로써 분할된 복수의 영역들 각각에 포함된 특징점의 개수를 재산출하고, 재산출된 결과에 기초하여 분할된 복수의 영역들 중 적어도 하나의 후보 영역을 재선택하도록 더 구성될 수 있다.

명령어들은, 캡처 영역에서 검출되는 특징점의 개수, 대상 객체가 표시되는 객체 영역의 색상 정보, 및 대상 객체가 대응하는 물체로 분류될 확률값에 기초하여 캡처 영역 내의 노이즈(noise) 크기를 산출하고, 산출된 노이즈 크기가 임계 노이즈 크기 이상인 경우, 디스플레이에 경고 메시지 및 캡처 영역의 위치 이동을 가이드 하는 정보 중 적어도 하나를 표시하도록 더 구성될 수 있다.

명령어들은, 대상 객체가 표시되는 객체 영역과 캡처 영역을 비교하고, 비교 결과에 기초하여 대상 객체가 캡처 영역을 벗어나는 것으로 판단하는 경우, 캡처 영역이 대상 객체가 표시되는 객체 영역을 포함하도록 캡처 영역의 위치 및 크기 중 적어도 하나를 변경하도록 더 구성될 수 있다.

명령어들은, 대상 객체가 캡처 영역에 진입하는 경우, 디스플레이에 대상 객체의 회전을 가이드하는 그래픽 객체를 표시하고, 대상 객체의 회전을 감지하는 경우, 디스플레이에 캡처 영역에서 캡처된 대상 객체의 복수의 단면들에 대한 이미지들을 표시하도록 더 구성될 수 있다.

명령어들은, 영상에서 대상 객체의 이동을 감지하는 경우, 대상 객체가 표시되는 객체 영역을 트래킹(tracking)하여 캡처 영역이 트래킹된 객체 영역을 포함하도록 캡처 영역의 위치 및 크기 중 적어도 하나를 변경하도록 더 구성될 수 있다.

명령어들은, 캡처 영역에 대한 사용자의 제스처를 인식하는 경우, 인식된 사용자의 제스처에 기초하여 캡처 영역의 위치 및 크기 중 적어도 하나를 변경하도록 더 구성될 수 있다.

일 실시예예 따른 프로세서로 구현되는 방법은, 카메라에 의해 촬영된 영상을 복수의 영역들로 분할하고, 영상에서 특징점들(feature points)을 검출함으로써 분할된 복수의 영역들 각각에 포함된 특징점의 개수를 산출하며, 산출된 결과에 기초하여 분할된 복수의 영역들 중 적어도 하나의 후보 영역을 선택하는 동작, 사용자의 시선을 추적하여 사용자의 시선 방향에 대응하는 대상 객체(target object)를 선택하는 동작, 대상 객체에 대한 이벤트 발생을 감지하는 것에 기초하여, 선택된 적어도 하나의 후보 영역 내에서 캡처 영역을 결정하는 동작, 및 영상 중 결정된 캡처 영역으로부터 캡처된 부분 영상에 기초하여 대상 객체에 관한 영상을 생성하는 동작을 포함할 수 있다.

캡처 영역을 결정하는 동작은, 영상에서 대상 객체와 관련된 사용자의 제스처가 검출되는 것에 기초하여 이벤트 발생을 감지하는 동작을 포함할 수 있다.

캡처 영역을 결정하는 동작은, 대상 객체가 표시되는 객체 영역을 둘러싸는(surround) 이벤트 감지 영역으로 진입하는 대상 객체와 관련된 사용자의 제스처가 검출되고, 검출된 사용자의 제스처가 전자 장치에 미리 저장된 손 모양 제스처들 중 하나와 동일한 형태를 갖는 경우에 응답하여, 이벤트 발생을 감지하는 동작을 포함할 수 있다.

캡처 영역을 결정하는 동작은, 대상 객체가 표시되는 객체 영역의 색상 정보, 영상 내에서 사용자의 선호 영역, 영상에서 검출되는 특징점들, 대상 객체가 대응하는 물체(thing)로 분류될 확률값 중 적어도 하나 또는 둘 이상의 조합에 기초하여 적어도 하나의 후보 영역 내에서 캡처 영역을 결정하는 동작을 포함할 수 있다.

일 실시예예 따른 프로세서로 구현되는 방법은, 카메라의 이동을 감지하는 것에 기초하여, 이벤트 발생을 감지한 이후에 영상에서 특징점들을 재검출함으로써 분할된 복수의 영역들 각각에 포함된 특징점의 개수를 재산출하고, 재산출된 결과에 기초하여 분할된 복수의 영역들 중 적어도 하나의 후보 영역을 재선택하는 동작을 더 포함할 수 있다.

일 실시예예 따른 프로세서로 구현되는 방법은, 캡처 영역에서 검출되는 특징점의 개수, 대상 객체가 표시되는 객체 영역의 색상 정보, 및 대상 객체가 대응하는 물체로 분류될 확률값에 기초하여 캡처 영역 내의 노이즈(noise) 크기를 산출하는 동작, 및 산출된 노이즈 크기가 임계 노이즈 크기 이상인 경우, 디스플레이에 경고 메시지 및 캡처 영역의 위치 이동을 가이드하는 정보 중 적어도 하나를 표시하는 동작을 더 포함할 수 있다.

일 실시예예 따른 프로세서로 구현되는 방법은, 대상 객체가 표시되는 객체 영역과 캡처 영역을 비교하는 동작, 및 비교 결과에 기초하여 대상 객체가 캡처 영역을 벗어나는 것으로 판단하는 경우, 캡처 영역이 대상 객체가 표시되는 객체 영역을 포함하도록 캡처 영역의 위치 및 크기 중 적어도 하나를 변경하는 동작을 더 포함할 수 있다.

일 실시예예 따른 프로세서로 구현되는 방법은, 대상 객체가 캡처 영역에 진입하는 경우, 디스플레이에 대상 객체의 회전을 가이드하는 그래픽 객체를 표시하는 동작, 및 대상 객체의 회전을 감지하는 경우, 디스플레이에 캡처 영역에서 캡처된 대상 객체의 복수의 단면들에 대한 이미지들을 표시하는 동작을 더 포함할 수 있다.

일 실시예예 따른 프로세서로 구현되는 방법은, 영상에서 대상 객체의 이동을 감지하는 경우, 대상 객체가 표시되는 객체 영역을 트래킹(tracking)하여 트래킹된 객체 영역을 포함하도록 캡처 영역의 위치 및 크기 중 적어도 하나를 변경하는 동작을 더 포함할 수 있다.

일 실시예예 따른 프로세서로 구현되는 방법은, 캡처 영역에 대한 사용자의 제스처를 인식하는 경우, 인식된 사용자의 제스처에 기초하여 캡처 영역의 위치 및 크기 중 적어도 하나를 변경하는 동작을 더 포함할 수 있다.

Claims

전자 장치에 있어서,
카메라;
컴퓨터로 실행 가능한 명령어들이 저장된 메모리; 및
상기 메모리에 억세스(access)하여 상기 명령어들을 실행하는 프로세서
를 포함하고,
상기 명령어들은,
상기 카메라에 의해 촬영된 영상을 복수의 영역들로 분할하고, 상기 영상에서 특징점들(feature points)을 검출함으로써 상기 분할된 복수의 영역들 각각에 포함된 특징점의 개수를 산출하며, 상기 산출된 결과에 기초하여 상기 분할된 복수의 영역들 중 적어도 하나의 후보 영역을 선택하고,
사용자의 시선을 추적하여 상기 사용자의 시선 방향에 대응하는 대상 객체(target object)를 선택하며,
상기 대상 객체에 대한 이벤트의 발생을 감지하는 것에 기초하여, 상기 선택된 적어도 하나의 후보 영역 내에서 캡처 영역(capture area)을 결정하고,
상기 영상 중 상기 결정된 캡처 영역으로부터 캡처된 부분 영상에 기초하여 상기 대상 객체에 관한 영상을 생성하도록 구성된,
전자 장치.
제1항에 있어서,
상기 명령어들은,
상기 영상에서 상기 대상 객체와 관련된 상기 사용자의 제스처(gesture)가 검출되는 것에 기초하여 상기 이벤트 발생을 감지하도록 더 구성된,
전자 장치.
제2항에 있어서,
상기 명령어들은,
상기 대상 객체가 표시되는 객체 영역을 둘러싸는(surround) 이벤트 감지 영역으로 진입하는 상기 대상 객체와 관련된 상기 사용자의 제스처가 검출되고, 상기 검출된 상기 사용자의 제스처가 상기 전자 장치에 미리 저장된 손 모양 제스처들 중 하나와 동일한 형태를 갖는 경우에 응답하여 상기 이벤트 발생을 감지하도록 더 구성된,
전자 장치.
제1항에 있어서,
상기 명령어들은,
상기 대상 객체가 표시되는 객체 영역의 색상 정보, 상기 영상 내에서 상기 사용자의 선호 영역, 상기 영상에서 검출되는 특징점들, 상기 대상 객체가 대응하는 물체(thing)로 분류될 확률값 중 적어도 하나 또는 둘 이상의 조합에 기초하여 상기 적어도 하나의 후보 영역 내에서 상기 캡처 영역을 결정하도록 더 구성된,
전자 장치.
제1항에 있어서,
상기 명령어들은,
상기 카메라의 이동을 감지하는 것에 기초하여, 상기 이벤트 발생을 감지한 이후에 상기 영상에서 특징점들을 재검출함으로써 상기 분할된 복수의 영역들 각각에 포함된 특징점의 개수를 재산출하고, 상기 재산출된 결과에 기초하여 상기 분할된 복수의 영역들 중 상기 적어도 하나의 후보 영역을 재선택하도록 더 구성된,
전자 장치.
제1항에 있어서,
상기 명령어들은,
상기 캡처 영역에서 검출되는 특징점의 개수, 상기 대상 객체가 표시되는 객체 영역의 색상 정보, 및 상기 대상 객체가 대응하는 물체로 분류될 확률값에 기초하여 상기 캡처 영역 내의 노이즈(noise) 크기를 산출하고,
상기 산출된 노이즈 크기가 임계 노이즈 크기 이상인 경우, 디스플레이에 경고 메시지 및 상기 캡처 영역의 위치 이동을 가이드 하는 정보 중 적어도 하나를 표시하도록 더 구성된,
전자 장치.
제1항에 있어서,
상기 명령어들은,
상기 대상 객체가 표시되는 객체 영역과 상기 캡처 영역을 비교하고, 상기 비교 결과에 기초하여 상기 대상 객체가 상기 캡처 영역을 벗어나는 것으로 판단하는 경우, 상기 캡처 영역이 상기 대상 객체가 표시되는 객체 영역을 포함하도록 상기 캡처 영역의 위치 및 크기 중 적어도 하나를 변경하도록 더 구성된,
전자 장치.
제1항에 있어서,
상기 명령어들은,
상기 대상 객체가 상기 캡처 영역에 진입하는 경우, 디스플레이에 상기 대상 객체의 회전을 가이드하는 그래픽 객체를 표시하고,
상기 대상 객체의 회전을 감지하는 경우, 상기 디스플레이에 상기 캡처 영역에서 캡처된 상기 대상 객체의 복수의 단면들에 대한 이미지들을 표시하도록 더 구성된,
전자 장치.
제1항에 있어서,
상기 명령어들은,
상기 영상에서 상기 대상 객체의 이동을 감지하는 경우, 상기 대상 객체가 표시되는 객체 영역을 트래킹(tracking)하여 상기 캡처 영역이 상기 트래킹된 객체 영역을 포함하도록 상기 캡처 영역의 위치 및 크기 중 적어도 하나를 변경하도록 더 구성된,
전자 장치.
제1항에 있어서,
상기 명령어들은,
상기 캡처 영역과 관련된 상기 사용자의 제스처를 인식하는 경우, 상기 인식된 사용자의 제스처에 기초하여 상기 캡처 영역의 위치 및 크기 중 적어도 하나를 변경하도록 더 구성된,
전자 장치.
프로세서로 구현되는 방법에 있어서,
카메라에 의해 촬영된 영상을 복수의 영역들로 분할하고, 상기 영상에서 특징점들(feature points)을 검출함으로써 상기 분할된 복수의 영역들 각각에 포함된 특징점의 개수를 산출하며, 상기 산출된 결과에 기초하여 상기 분할된 복수의 영역들 중 적어도 하나의 후보 영역을 선택하는 동작;
사용자의 시선을 추적하여 상기 사용자의 시선 방향에 대응하는 대상 객체(target object)를 선택하는 동작;
상기 대상 객체에 대한 이벤트 발생을 감지하는 것에 기초하여, 상기 선택된 적어도 하나의 후보 영역 내에서 캡처 영역을 결정하는 동작; 및
상기 영상 중 상기 결정된 캡처 영역으로부터 캡처된 부분 영상에 기초하여 상기 대상 객체에 관한 영상을 생성하는 동작
을 포함하는 방법.
제11항에 있어서,
상기 캡처 영역을 결정하는 동작은,
상기 영상에서 상기 대상 객체와 관련된 상기 사용자의 제스처가 검출되는 것에 기초하여 상기 이벤트 발생을 감지하는 동작
을 포함하는 방법.
제12항에 있어서,
상기 캡처 영역을 결정하는 동작은,
상기 대상 객체가 표시되는 객체 영역을 둘러싸는(surround) 이벤트 감지 영역으로 진입하는 상기 대상 객체와 관련된 상기 사용자의 제스처가 검출되고, 상기 검출된 상기 사용자의 제스처가 미리 저장된 손 모양 제스처들 중 하나와 동일한 형태를 갖는 경우에 응답하여, 상기 이벤트 발생을 감지하는 동작
을 포함하는 방법.
제11항에 있어서,
상기 캡처 영역을 결정하는 동작은,
상기 대상 객체가 표시되는 객체 영역의 색상 정보, 상기 영상 내에서 상기 사용자의 선호 영역, 상기 영상에서 검출되는 특징점들, 상기 대상 객체가 대응하는 물체(thing)로 분류될 확률값 중 적어도 하나 또는 둘 이상의 조합에 기초하여 상기 적어도 하나의 후보 영역 내에서 상기 캡처 영역을 결정하는 동작
을 포함하는 방법.
제11항에 있어서,
상기 카메라의 이동을 감지하는 것에 기초하여, 상기 이벤트 발생을 감지한 이후에 상기 영상에서 특징점들을 재검출함으로써 상기 분할된 복수의 영역들 각각에 포함된 특징점의 개수를 재산출하고, 상기 재산출된 결과에 기초하여 상기 분할된 복수의 영역들 중 상기 적어도 하나의 후보 영역을 재선택하는 동작
을 더 포함하는 방법.
제11항에 있어서,
상기 캡처 영역에서 검출되는 특징점의 개수, 상기 대상 객체가 표시되는 객체 영역의 색상 정보, 및 상기 대상 객체가 대응하는 물체로 분류될 확률값에 기초하여 상기 캡처 영역 내의 노이즈(noise) 크기를 산출하는 동작; 및
상기 산출된 노이즈 크기가 임계 노이즈 크기 이상인 경우, 디스플레이에 경고 메시지 및 상기 캡처 영역의 위치 이동을 가이드하는 정보 중 적어도 하나를 표시하는 동작
을 더 포함하는 방법.
제11항에 있어서,
상기 대상 객체가 표시되는 객체 영역과 상기 캡처 영역을 비교하는 동작; 및
상기 비교 결과에 기초하여 상기 대상 객체가 상기 캡처 영역을 벗어나는 것으로 판단하는 경우, 상기 캡처 영역이 상기 대상 객체가 표시되는 객체 영역을 포함하도록 상기 캡처 영역의 위치 및 크기 중 적어도 하나를 변경하는 동작
을 더 포함하는 방법.
제11항에 있어서,
상기 대상 객체가 상기 캡처 영역에 진입하는 경우, 디스플레이에 상기 대상 객체의 회전을 가이드하는 그래픽 객체를 표시하는 동작; 및
상기 대상 객체의 회전을 감지하는 경우, 상기 디스플레이에 상기 캡처 영역에서 캡처된 상기 대상 객체의 복수의 단면들에 대한 이미지들을 표시하는 동작
을 더 포함하는 방법.
제11항에 있어서,
상기 영상에서 상기 대상 객체의 이동을 감지하는 경우, 상기 대상 객체가 표시되는 객체 영역을 트래킹(tracking)하여 상기 트래킹된 객체 영역을 포함하도록 상기 캡처 영역의 위치 및 크기 중 적어도 하나를 변경하는 동작
을 더 포함하는 방법.
제11항에 있어서,
상기 캡처 영역과 관련된 상기 사용자의 제스처를 인식하는 경우, 상기 인식된 사용자의 제스처에 기초하여 상기 캡처 영역의 위치 및 크기 중 적어도 하나를 변경하는 동작
을 더 포함하는 방법.