WO2020027442A1

WO2020027442A1 - 카메라 모듈을 통해 획득한 영상에 기반하여 정보를 저장하는 방법 및 이를 사용하는 전자 장치

Info

Publication number: WO2020027442A1
Application number: PCT/KR2019/007750
Authority: WO
Inventors: 배수정; 김소영; 안희범
Original assignee: 삼성전자 주식회사
Priority date: 2018-08-01
Filing date: 2019-06-26
Publication date: 2020-02-06
Also published as: US11449134B2; US20210311545A1; KR102592463B1; KR20200014495A

Abstract

다양한 실시 예에 따른 전자 장치에 있어서, 디스플레이; 카메라 모듈; 및 프로세서를 포함하고, 상기 프로세서는, 상기 카메라 모듈을 통하여, 특정 영역을 포함하는 제1 영상을 획득하고, 상기 제1 영상을 기반으로, 상기 제1 영상에 포함된 적어도 하나의 객체에 관한 정보를 저장하고, 상기 카메라 모듈이 상기 특정 영역의 적어도 일부 영역을 포함하는 제2 영상을 획득하는 경우, 상기 제2 영상을 기반으로, 상기 제2 영상에 포함된 적어도 하나의 객체에 관한 정보를 획득하고, 상기 디스플레이를 통해, 상기 제1 영상에 포함된 적어도 하나의 객체에 관한 정보 중 상기 제2 영상에 포함된 적어도 하나의 객체에 대응하는 정보와 일치하는 정보를 상기 제2 영상과 함께 표시하고, 및 상기 제1 영상에 포함된 적어도 하나의 객체에 관한 정보 중 상기 제2 영상에 포함된 적어도 하나의 객체에 대응하는 정보와 일치하지 않은 정보를 상기 특정 영역의 적어도 일부 영역에 대응하여 저장하도록 설정될 수 있다. 이 밖의 다른 실시 예도 가능하다.

Description

카메라 모듈을 통해 획득한 영상에 기반하여 정보를 저장하는 방법 및 이를 사용하는 전자 장치

본 발명의 다양한 실시 예는 카메라 모듈을 통해 획득한 영상에 기반하여 정보를 저장하는 방법 및 이를 사용하는 전자 장치에 관한 것이다.

전자 장치(예: 스마트 폰, 스마트 글래스 등)는 증강 현실(augmented reality, AR)을 통해 사용자에게 새로운 경험을 제공할 수 있다. 예를 들어, 전자 장치는 현실의 배경에 가상의 객체를 겹쳐서 하나의 영상으로 보여줄 수 있다.

사용자는 무엇인가를 기억하기 위해 메모를 활용할 수 있다. 예를 들어, 사용자가 직접 손으로 메모지에 기록하여 특정 공간에 붙여놓을 수 있다. 다른 예를 들어, 사용자는 전자 장치의 메모 어플리케이션을 통해 메모를 기록할 수 있다. 사용자가 메모지를 활용하는 경우에는, 외관 상 메모지들이 붙어 있는 모습이 지저분하게 보일 수 있다. 사용자가 메모 어플리케이션을 통해 영상(예: 동적 영상(moving image), 정적 영상(still image), 텍스트 등을 기록하는 경우에는 해당 메모의 특정 공간과의 관련성을 강조하기 어려운 면이 있다. 일반적인 메모 어플리케이션의 경우, 메모된 시간 순으로 나열되며, 사용자는 과거에 자신이 했던 메모를 메모 이후에 잊어버리게 되는 경우가 종종 발생할 수 있다.

또한, 상기 메모지 또는 메모 어플리케이션을 활용하는 경우, 메모의 수정 또는 갱신이 어려운 면이 있다. 메모지를 활용하는 경우에는, 메모된 내용을 수정하려면 다른 도구(예: 지우개, 수정액 등)를 사용해야 하며 수정을 하더라도 수정된 메모지가 지저분하게 보여질 수 있다. 메모 어플리케이션을 활용하는 경우에는, 메모된 내용을 일일이 삭제 버튼을 통해 지우고, 사용자가 직접 재 입력해야 하는 번거로움이 발생할 수 있다. 더욱이, 메모 어플리케이션 상에서, 메모를 계층적으로 구분하여 저장하기에는 사용자가 직접 입력해야 하는 데이터의 양이 많으므로 상당한 시간이 소요될 수 있다. 결과적으로, 전자 장치의 사용자는 특정 공간과 연관된 계층적 메모를 짧은 시간 내 쉽고 간편하게 저장하고 관리하기에는 어려움이 따를 수 있다.

다양한 실시 예에 따른 전자 장치는 디스플레이; 카메라 모듈; 및 프로세서를 포함하고, 상기 프로세서는, 상기 카메라 모듈을 통하여, 임의의 공간에 배치된 적어도 하나의 객체를 포함하는 제1 영상을 획득하고, 상기 획득된 제1 영상을 기반으로, 상기 적어도 하나의 객체에 관한 정보를 상기 임의의 공간에 대응하여 저장하고, 상기 카메라 모듈을 통하여, 상기 임의의 공간의 적어도 일부를 포함하는 제2 영상을 획득하고, 및 상기 획득된 제2 영상을 기반으로, 상기 제2 영상에 포함된 객체 중 상기 제1 영상의 상기 적어도 하나의 객체에 포함된 제1 객체의 경우, 상기 디스플레이를 통하여, 상기 제1 객체에 관한 정보를 상기 제2 영상과 함께 표시하고, 및 상기 제2 영상에 포함된 객체 중 상기 제1 영상의 상기 적어도 하나의 객체에 포함되어 있지 않은 제2 객체의 경우, 상기 제2 객체에 관한 정보를 상기 임의의 공간에 대응하여 저장하는 동작 중 적어도 하나의 동작을 수행할 수 있다.

다양한 실시 예에 따른 전자 장치의 방법은 상기 전자 장치의 카메라 모듈을 통하여, 임의의 공간에 배치된 적어도 하나의 객체를 포함하는 제1 영상을 획득하는 동작; 상기 획득된 제1 영상을 기반으로, 상기 적어도 하나의 객체에 관한 정보를 상기 임의의 공간에 대응하여 저장하는 동작; 상기 카메라 모듈을 통하여, 상기 임의의 공간의 적어도 일부를 포함하는 제2 영상을 획득하는 동작; 및 상기 획득된 제2 영상을 기반으로, 상기 제2 영상에 포함된 객체 중 상기 제1 영상의 상기 적어도 하나의 객체에 포함된 제1 객체의 경우, 상기 디스플레이를 통하여, 상기 제1 객체에 관한 정보를 상기 제2 영상과 함께 표시하는 동작; 및 상기 제2 영상에 포함된 객체 중 상기 제1 영상의 상기 적어도 하나의 객체에 포함되어 있지 않은 제2 객체의 경우, 상기 제2 객체에 관한 정보를 상기 임의의 공간에 대응하여 저장하는 동작 중 적어도 하나의 동작을 수행하는 동작을 포함할 수 있다.

본 발명의 다양한 실시 예에 따르면, 전자 장치는 사용자에게 증강 현실을 통한 메모 기능을 제공할 수 있다. 전자 장치의 사용자는 증강 현실을 통해 특정 공간과 연관된 메모를 기록할 수 있다. 해당 메모는 현실의 배경에는 실존하지 않으며, 전자 장치를 통해 사용자에게 제공될 수 있다. 이에 따라, 사용자의 주변 환경이 외관 상 보다 심플해질 수 있다. 전자 장치의 사용자는 영상 촬영, 사용자의 음성 입력, 및 사물 인터넷(internet of things) 정보 중 적어도 하나를 활용하여 계층적 메모를 짧은 시간 내 쉽고 간편하게 기록할 수 있다.

전자 장치는 촬영된 영상 자체를 단순히 저장하는데 그치지 않고, 영상에 포함된 복수의 사물들을 객체화하여 인식 및 저장할 수 있다. 이와 더불어, 전자 장치는 영상 촬영, 사용자의 음성 입력, 및 사물 인터넷 정보 중 적어도 하나를 활용하여 메모의 수정 또는 갱신을 보다 간편하게 수행할 수 있다. 예를 들어, 전자 장치는 기존 메모에 활용된 영상과 최근에 촬영된 영상을 인공지능(artificial intelligence, AI)을 통해 비교할 수 있으며, 영상의 대조만으로 기존 메모를 수정 또는 갱신할 수 있다. 이에 따라, 전자 장치의 사용자는 특정 공간과 연관된 계층적 메모를 짧은 시간 내 쉽고 간편하게 저장할 수 있다.

전자 장치의 사용자는 메모를 확인하기 위해 반드시 해당 메모 앞에 찾아간다거나, 복수의 메모 중 어떤 메모가 필요한 정보인지 뒤적일 필요 없이 직관적으로 계층적으로 분류된 메모 정보를 검색을 통해 확인할 수 있다. 사용자는 음성, 텍스트, 영상 등의 정보를 전자 장치에 입력하여 검색을 수행할 수 있다.

도 1은 본 발명의 다양한 실시 예에 따른 네트워크 환경 내의 전자 장치의 블록도이다.

도 2는 본 발명의 다양한 실시 예에 따른 스마트 홈 환경에 관한 도면이다.

도 3은 본 발명의 다양한 실시 예에 따른 메모 제공 시스템을 개략적으로 나타낸 블록도이다.

도 4는 본 발명의 다양한 실시 예에 따른 사용자가 메모를 기록하려는 특정 공간에 관한 정보를 계층적으로 분류한 예를 나타낸 도면이다.

도 5A 내지 5D는 본 발명의 다양한 실시 예에 따른 영상을 통해 메모를 계층적으로 저장하는 방법을 설명하기 위한 도면이다.

도 6은 본 발명의 다양한 실시 예에 따른 전자 장치가 사용자와의 상호 작용을 통해 메모를 생성하기 위한 방법에 관한 흐름도이다.

도 7은 본 발명의 다양한 실시 예에 따른 전자 장치가 사용자와의 상호 작용을 통해 메모를 업데이트 하기 위한 방법에 관한 흐름도이다.

도 8은 본 발명의 다양한 실시 예에 따른 전자 장치의 영상 및 센서 정보 중 적어도 하나에 기반하여 객체를 인식하는 방법을 나타내는 도면이다.

도 9A 내지 9B는 본 발명의 다양한 실시 예에 따른 전자 장치의 특정 공간에 연관된 메모를 증강 현실을 통해 저장하는 방법을 나타낸 도면이다.

도 10은 본 발명의 다양한 실시 예에 따른 전자 장치의 증강 현실을 통해 기록된 메모를 사용자에게 보여주는 방법을 나타내는 도면이다.

도 11은 본 발명의 다양한 실시 예에 따른 전자 장치의 증강 현실을 통해 메모를 확인할 수 있는 방법을 나타내는 도면이다.

도 12는 본 발명의 다양한 실시 예에 따른 전자 장치가 메모 가능 영역을 인식하고, 해당 영역에 가상의 메모 보드를 제공하는 방법에 관한 도면이다.

도 13은 본 발명의 다양한 실시 예에 따른 전자 장치를 통해 사용자 중심으로 메모를 검색하는 방법을 나타낸 도면이다.

도 1은, 다양한 실시 예들에 따른, 네트워크 환경(100) 내의 전자 장치(101)의 블록도이다.

도 1을 참조하면, 네트워크 환경(100)에서 전자 장치(101)는 제 1 네트워크(198)(예: 근거리 무선 통신 네트워크)를 통하여 전자 장치(102)와 통신하거나, 또는 제 2 네트워크(199)(예: 원거리 무선 통신 네트워크)를 통하여 전자 장치(104) 또는 서버(108)와 통신할 수 있다. 일 실시 예에 따르면, 전자 장치(101)는 서버(108)를 통하여 전자 장치(104)와 통신할 수 있다. 일 실시예에 따르면, 전자 장치(101)는 프로세서(120), 메모리(130), 입력 장치(150), 음향 출력 장치(155), 표시 장치(160), 오디오 모듈(170), 센서 모듈(176), 인터페이스(177), 햅틱 모듈(179), 카메라 모듈(180), 전력 관리 모듈(188), 배터리(189), 통신 모듈(190), 가입자 식별 모듈(196), 또는 안테나 모듈(197)을 포함할 수 있다. 어떤 실시예에 서는, 전자 장치(101)에는, 이 구성요소들 중 적어도 하나(예: 표시 장치(160) 또는 카메라 모듈(180))가 생략되거나, 하나 이상의 다른 구성 요소가 추가될 수 있다. 어떤 실시 예에서는, 이 구성요소들 중 일부들은 하나의 통합된 회로로 구현될 수 있다. 예를 들면, 센서 모듈(176)(예: 지문 센서, 홍채 센서, 또는 조도 센서)은 표시 장치(160)(예: 디스플레이)에 임베디드된 채 구현될 수 있다

프로세서(120)는, 예를 들면, 소프트웨어(예: 프로그램(140))를 실행하여 프로세서(120)에 연결된 전자 장치(101)의 적어도 하나의 다른 구성요소(예: 하드웨어 또는 소프트웨어 구성요소)을 제어할 수 있고, 다양한 데이터 처리 또는 연산을 수행할 수 있다. 일 실시 예에 따르면, 데이터 처리 또는 연산의 적어도 일부로서, 프로세서(120)는 다른 구성요소(예: 센서 모듈(176) 또는 통신 모듈(190))로부터 수신된 명령 또는 데이터를 휘발성 메모리(132)에 로드하고, 휘발성 메모리(132)에 저장된 명령 또는 데이터를 처리하고, 결과 데이터를 비 휘발성 메모리(134)에 저장할 수 있다. 일 실시 예에 따르면, 프로세서(120)는 메인 프로세서(121)(예: 중앙 처리 장치 또는 어플리케이션 프로세서), 및 이와는 독립적으로 또는 함께 운영 가능한 보조 프로세서(123)(예: 그래픽 처리 장치, 이미지 시그널 프로세서, 센서 허브 프로세서, 또는 커뮤니케이션 프로세서)를 포함할 수 있다. 추가적으로 또는 대체적으로, 보조 프로세서(123)은 메인 프로세서(121)보다 저전력을 사용하거나, 또는 지정된 기능에 특화되도록 설정될 수 있다. 보조 프로세서(123)는 메인 프로세서(121)와 별개로, 또는 그 일부로서 구현될 수 있다.

보조 프로세서(123)는, 예를 들면, 메인 프로세서(121)가 인액티브(예: 슬립) 상태에 있는 동안 메인 프로세서(121)를 대신하여, 또는 메인 프로세서(121)가 액티브(예: 어플리케이션 실행) 상태에 있는 동안 메인 프로세서(121)와 함께, 전자 장치(101)의 구성요소들 중 적어도 하나의 구성요소(예: 표시 장치(160), 센서 모듈(176), 또는 통신 모듈(190))와 관련된 기능 또는 상태들의 적어도 일부를 제어할 수 있다. 일 실시 예에 따르면, 보조 프로세서(123)(예: 이미지 시그널 프로세서 또는 커뮤니케이션 프로세서)는 기능적으로 관련 있는 다른 구성 요소(예: 카메라 모듈(180) 또는 통신 모듈(190))의 일부로서 구현될 수 있다.

메모리(130)는, 전자 장치(101)의 적어도 하나의 구성요소(예: 프로세서(120) 또는 센서모듈(176))에 의해 사용되는 다양한 데이터를 저장할 수 있다. 데이터는, 예를 들어, 소프트웨어(예: 프로그램(140)) 및, 이와 관련된 명령에 대한 입력 데이터 또는 출력 데이터를 포함할 수 있다. 메모리(130)는, 휘발성 메모리(132) 또는 비 휘발성 메모리(134)를 포함할 수 있다.

프로그램(140)은 메모리(130)에 소프트웨어로서 저장될 수 있으며, 예를 들면, 운영 체제(142), 미들 웨어(144) 또는 어플리케이션(146)을 포함할 수 있다.

입력 장치(150)는, 전자 장치(101)의 구성요소(예: 프로세서(120))에 사용될 명령 또는 데이터를 전자 장치(101)의 외부(예: 사용자)로부터 수신할 수 있다. 입력 장치(150)은, 예를 들면, 마이크, 마우스, 펜, 또는 키보드를 포함할 수 있다.

음향 출력 장치(155)는 음향 신호를 전자 장치(101)의 외부로 출력할 수 있다. 음향 출력 장치(155)는, 예를 들면, 스피커 또는 리시버를 포함할 수 있다. 스피커는 멀티미디어 재생 또는 녹음 재생과 같이 일반적인 용도로 사용될 수 있고, 리시버는 착신 전화를 수신하기 위해 사용될 수 있다. 일 실시 예에 따르면, 리시버는 스피커와 별개로, 또는 그 일부로서 구현될 수 있다.

표시 장치(160)는 전자 장치(101)의 외부(예: 사용자)로 정보를 시각적으로 제공할 수 있다. 표시 장치(160)은, 예를 들면, 디스플레이, 홀로그램 장치, 또는 프로젝터 및 해당 장치를 제어하기 위한 제어 회로를 포함할 수 있다. 일 실시 예에 따르면, 표시 장치(160)는 터치를 감지하도록 설정된 터치 회로(touch circuitry), 또는 상기 터치에 의해 발생되는 힘의 세기를 측정하도록 설정된 센서 회로(예: 압력 센서)를 포함할 수 있다.

오디오 모듈(170)은 소리를 전기 신호로 변환시키거나, 반대로 전기 신호를 소리로 변환시킬 수 있다. 일 실시 예에 따르면, 오디오 모듈(170)은, 입력 장치(150)를 통해 소리를 획득하거나, 음향 출력 장치(155), 또는 전자 장치(101)와 직접 또는 무선으로 연결된 외부 전자 장치(예: 전자 장치(102)) (예: 스피커 또는 헤드폰))를 통해 소리를 출력할 수 있다.

센서 모듈(176)은 전자 장치(101)의 작동 상태(예: 전력 또는 온도), 또는 외부의 환경 상태(예: 사용자 상태)를 감지하고, 감지된 상태에 대응하는 전기 신호 또는 데이터 값을 생성할 수 있다. 일 실시 예에 따르면, 센서 모듈(176)은, 예를 들면, 제스처 센서, 자이로 센서, 기압 센서, 마그네틱 센서, 가속도 센서, 그립 센서, 근접 센서, 컬러 센서, IR(infrared) 센서, 생체 센서, 온도 센서, 습도 센서, 또는 조도 센서를 포함할 수 있다.

인터페이스(177)는 전자 장치(101)이 외부 전자 장치(예: 전자 장치(102))와 직접 또는 무선으로 연결되기 위해 사용될 수 있는 하나 이상의 지정된 프로토콜들을 지원할 수 있다. 일 실시 예에 따르면, 인터페이스(177)는, 예를 들면, HDMI(high definition multimedia interface), USB(universal serial bus) 인터페이스, SD카드 인터페이스, 또는 오디오 인터페이스를 포함할 수 있다.

연결 단자(178)는, 그를 통해서 전자 장치(101)가 외부 전자 장치(예: 전자 장치(102))와 물리적으로 연결될 수 있는 커넥터를 포함할 수 있다. 일 실시 예에 따르면, 연결 단자(178)은, 예를 들면, HDMI 커넥터, USB 커넥터, SD 카드 커넥터, 또는 오디오 커넥터(예: 헤드폰 커넥터)를 포함할 수 있다.

햅틱 모듈(179)은 전기적 신호를 사용자가 촉각 또는 운동 감각을 통해서 인지할 수 있는 기계적인 자극(예: 진동 또는 움직임) 또는 전기적인 자극으로 변환할 수 있다. 일 실시 예에 따르면, 햅틱 모듈(179)은, 예를 들면, 모터, 압전 소자, 또는 전기 자극 장치를 포함할 수 있다.

카메라 모듈(180)은 정지 영상 및 동영상을 촬영할 수 있다. 일 실시 예에 따르면, 카메라 모듈(180)은 하나 이상의 렌즈들, 이미지 센서들, 이미지 시그널 프로세서들, 또는 플래시들을 포함할 수 있다. 카메라 모듈은 RGB, IR, TOF (time of flight) 등 각기 다른 신호를 획득하기 위한 하나 이상의 모듈 일 수 있으며, 이들의 조합 일 수 있다. 예를 들어, 카메라 모듈은 두 개의 RGB 영상을 획득하기 위한 스테레오 카메라 형태이거나 RGB와 TOF가 결합된 스테레오 카메라 일 수 있다.

전력 관리 모듈(188)은 전자 장치(101)에 공급되는 전력을 관리할 수 있다. 일 실시 예에 따르면, 전력 관리 모듈(388)은, 예를 들면, PMIC(power management integrated circuit)의 적어도 일부로서 구현될 수 있다.

배터리(189)는 전자 장치(101)의 적어도 하나의 구성 요소에 전력을 공급할 수 있다. 일 실시 예에 따르면, 배터리(189)는, 예를 들면, 재충전 불가능한 1차 전지, 재충전 가능한 2차 전지 또는 연료 전지를 포함할 수 있다.

통신 모듈(190)은 전자 장치(101)와 외부 전자 장치(예: 전자 장치(102), 전자 장치(104), 또는 서버(108))간의 직접(예: 유선) 통신 채널 또는 무선 통신 채널의 수립, 및 수립된 통신 채널을 통한 통신 수행을 지원할 수 있다. 통신 모듈(190)은 프로세서(120)(예: 어플리케이션 프로세서)와 독립적으로 운영되고, 직접(예: 유선) 통신 또는 무선 통신을 지원하는 하나 이상의 커뮤니케이션 프로세서를 포함할 수 있다. 일 실시 예에 따르면, 통신 모듈(190)은 무선 통신 모듈(192)(예: 셀룰러 통신 모듈, 근거리 무선 통신 모듈, 또는 GNSS(global navigation satellite system) 통신 모듈) 또는 유선 통신 모듈(194)(예: LAN(local area network) 통신 모듈, 또는 전력선 통신 모듈)을 포함할 수 있다. 이들 통신 모듈 중 해당하는 통신 모듈은 제 1 네트워크(198)(예: 블루투스, Wi-Fi direct 또는 IrDA(infrared data association) 같은 근거리 통신 네트워크) 또는 제 2 네트워크(199)(예: 셀룰러 네트워크, 인터넷, 또는 컴퓨터 네트워크(예: LAN 또는 WAN)와 같은 원거리 통신 네트워크)를 통하여 외부 전자 장치와 통신할 수 있다. 이런 여러 종류의 통신 모듈들은 하나의 구성 요소(예: 단일 칩)으로 통합되거나, 또는 서로 별도의 복수의 구성 요소들(예: 복수 칩들)로 구현될 수 있다. 무선 통신 모듈(192)은 가입자 식별 모듈(196)에 저장된 가입자 정보(예: 국제 모바일 가입자 식별자(IMSI))를 이용하여 제 1 네트워크(198) 또는 제 2 네트워크(199)와 같은 통신 네트워크 내에서 전자 장치(101)를 확인 및 인증할 수 있다.

안테나 모듈(197)은 신호 또는 전력을 외부(예: 외부 전자 장치)로 송신하거나 외부로부터 수신할 수 있다. 일 실시 예에 따르면, 안테나 모듈(197)은 하나 이상의 안테나들을 포함할 수 있고, 이로부터, 제 1 네트워크 198 또는 제 2 네트워크 199와 같은 통신 네트워크에서 사용되는 통신 방식에 적합한 적어도 하나의 안테나가, 예를 들면, 통신 모듈(190)에 의하여 선택될 수 있다. 신호 또는 전력은 상기 선택된 적어도 하나의 안테나를 통하여 통신 모듈(190)과 외부 전자 장치 간에 송신되거나 수신될 수 있다.

상기 구성요소들 중 적어도 일부는 주변 기기들간 통신 방식(예: 버스, GPIO(general purpose input and output), SPI(serial peripheral interface), 또는 MIPI(mobile industry processor interface))를 통해 서로 연결되고 신호(예: 명령 또는 데이터)를 상호간에 교환할 수 있다.

일 실시 예에 따르면, 명령 또는 데이터는 제 2 네트워크(199)에 연결된 서버(108)를 통해서 전자 장치(101)와 외부의 전자 장치(104)간에 송신 또는 수신될 수 있다. 전자 장치(102, 104) 각각은 전자 장치(101)와 동일한 또는 다른 종류의 장치일 수 있다. 일 실시 예에 따르면, 전자 장치(101)에서 실행되는 동작들의 전부 또는 일부는 외부 전자 장치들(102, 104, or 108) 중 하나 이상의 외부 장치들에서 실행될 수 있다. 예를 들면, 전자 장치(101)가 어떤 기능이나 서비스를 자동으로, 또는 사용자 또는 다른 장치로부터의 요청에 반응하여 수행해야 할 경우에, 전자 장치(101)는 기능 또는 서비스를 자체적으로 실행시키는 대신에 또는 추가적으로, 하나 이상의 외부 전자 장치들에게 그 기능 또는 그 서비스의 적어도 일부를 수행하라고 요청할 수 있다. 상기 요청을 수신한 하나 이상의 외부 전자 장치들은 요청된 기능 또는 서비스의 적어도 일부, 또는 상기 요청과 관련된 추가 기능 또는 서비스를 실행하고, 그 실행의 결과를 전자 장치(101)로 전달할 수 있다. 전자 장치(101)는 상기 결과를, 그대로 또는 추가적으로 처리하여, 상기 요청에 대한 응답의 적어도 일부로서 제공할 수 있다. 이를 위하여, 예를 들면, 클라우드 컴퓨팅, 분산 컴퓨팅, 또는 클라이언트-서버 컴퓨팅 기술이 이용될 수 있다.

본 문서에 개시된 다양한 실시 예들에 따른 전자 장치는 다양한 형태의 장치가 될 수 있다. 전자 장치는, 예를 들면, 휴대용 통신 장치 (예: 스마트폰), 컴퓨터 장치, 휴대용 멀티미디어 장치, 휴대용 의료 기기, 카메라, 웨어러블 장치, 또는 가전 장치를 포함할 수 있다. 본 문서의 실시 예에 따른 전자 장치는 전술한 기기들에 한정되지 않는다.

본 문서의 다양한 실시 예들 및 이에 사용된 용어들은 본 문서에 기재된 기술적 특징들을 특정한 실시 예들로 한정하려는 것이 아니며, 해당 실시예의 다양한 변경, 균등물, 또는 대체물을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 또는 관련된 구성요소에 대해서는 유사한 참조 부호가 사용될 수 있다. 아이템에 대응하는 명사의 단수 형은 관련된 문맥상 명백하게 다르게 지시하지 않는 한, 상기 아이템 한 개 또는 복수 개를 포함할 수 있다. 본 문서에서, "A 또는 B", "A 및 B 중 적어도 하나", "A 또는 B 중 적어도 하나,""A, B 또는 C," "A, B 및 C 중 적어도 하나,"및 "A, B, 또는 C 중 적어도 하나"와 같은 문구들 각각은 그 문구들 중 해당하는 문구에 함께 나열된 항목들의 모든 가능한 조합을 포함할 수 있다. "제 1", "제 2", 또는 "첫째" 또는 "둘째"와 같은 용어들은 단순히 해당 구성요소를 다른 해당 구성요소와 구분하기 위해 사용될 수 있으며, 해당 구성요소들을 다른 측면(예: 중요성 또는 순서)에서 한정하지 않는다. 어떤(예: 제 1) 구성요소가 다른(예: 제 2) 구성요소에, "기능적으로" 또는 "통신적으로"라는 용어와 함께 또는 이런 용어 없이, "커플드" 또는 "커넥티드"라고 언급된 경우, 그것은 상기 어떤 구성요소가 상기 다른 구성요소에 직접적으로(예: 유선으로), 무선으로, 또는 제 3 구성요소를 통하여 연결될 수 있다는 것을 의미한다.

본 문서에서 사용된 용어 "모듈"은 하드웨어, 소프트웨어 또는 펌웨어로 구현된 유닛을 포함할 수 있으며, 예를 들면, 로직, 논리 블록, 부품, 또는 회로 등의 용어와 상호 호환적으로 사용될 수 있다. 모듈은, 일체로 구성된 부품 또는 하나 또는 그 이상의 기능을 수행하는, 상기 부품의 최소 단위 또는 그 일부가 될 수 있다. 예를 들면, 일 실시 예에 따르면, 모듈은 ASIC(application-specific integrated circuit)의 형태로 구현될 수 있다.

본 문서의 다양한 실시 예들은 기기(machine)(예: 전자 장치(101)) 의해 읽을 수 있는 저장 매체(storage medium)(예: 내장 메모리(136) 또는 외장 메모리(138))에 저장된 하나 이상의 명령어들을 포함하는 소프트웨어(예: 프로그램(140))로서 구현될 수 있다. 예를 들면, 기기(예: 전자 장치(101))의 프로세서(예: 프로세서(120))는, 저장 매체로부터 저장된 하나 이상의 명령어들 중 적어도 하나의 명령을 호출하고, 그것을 실행할 수 있다. 이것은 기기가 상기 호출된 적어도 하나의 명령어에 따라 적어도 하나의 기능을 수행하도록 운영되는 것을 가능하게 한다. 상기 하나 이상의 명령어들은 컴파일러에 의해 생성된 코드 또는 인터프리터에 의해 실행될 수 있는 코드를 포함할 수 있다. 기기로 읽을 수 있는 저장매체 는, 비일시적(non-transitory) 저장매체의 형태로 제공될 수 있다. 여기서,'비일시적'은 저장매체가 실재(tangible)하는 장치이고, 신호(signal)(예: 전자기파)를 포함하지 않는다는 것을 의미할 뿐이며, 이 용어는 데이터가 저장매체에 반영구적으로 저장되는 경우와 임시적으로 저장되는 경우를 구분하지 않는다.

일 실시 예에 따르면, 본 문서에 개시된 다양한 실시 예들에 따른 방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 상품으로서 판매자 및 구매자 간에 거래될 수 있다. 컴퓨터 프로그램 제품은 기기로 읽을 수 있는 저장 매체(예: compact disc read only memory (CD-ROM))의 형태로 배포되거나, 또는 어플리케이션 스토어(예: 플레이 스토어TM)를 통해 또는 두 개의 사용자 장치들(예: 스마트폰들) 간에 직접, 온라인으로 배포(예: 다운로드 또는 업로드)될 수 있다. 온라인 배포의 경우에, 컴퓨터 프로그램 제품의 적어도 일부는 제조사의 서버, 어플리케이션 스토어의 서버, 또는 중계 서버의 메모리와 같은 기기로 읽을 수 있는 저장 매체에 적어도 일시 저장되거나, 임시적으로 생성될 수 있다.

다양한 실시 예들에 따르면, 상기 기술한 구성요소들의 각각의 구성요소(예: 모듈 또는 프로그램)는 단수 또는 복수의 개체를 포함할 수 있다. 다양한 실시 예들에 따르면, 전술한 해당 구성요소들 중 하나 이상의 구성요소들 또는 동작들이 생략되거나, 또는 하나 이상의 다른 구성요소들 또는 동작들이 추가될 수 있다. 대체적으로 또는 추가적으로, 복수의 구성요소들(예: 모듈 또는 프로그램)은 하나의 구성요소로 통합될 수 있다. 이런 경우, 통합된 구성요소는 상기 복수의 구성요소들 각각의 구성요소의 하나 이상의 기능들을 상기 통합 이전에 상기 복수의 구성요소들 중 해당 구성요소에 의해 수행되는 것과 동일 또는 유사하게 수행할 수 있다. 다양한 실시 예들에 따르면, 모듈, 프로그램 또는 다른 구성요소에 의해 수행되는 동작들은 순차적으로, 병렬적으로, 반복적으로, 또는 휴리스틱하게 실행되거나, 상기 동작들 중 하나 이상이 다른 순서로 실행되거나, 생략되거나, 또는 하나 이상의 다른 동작들이 추가될 수 있다.

다양한 실시 예에 따르면 도 2는 스마트 홈 환경 200을 도시한다.

다양한 실시 예에 따르면, 스마트 홈 환경은, 하나 이상의 카메라들(221, 223, 225, 227, 229, 또는 231), 하나 이상의 센서 또는 센서를 포함하는 장치들(예: 플로어 마이크(233, 235, 237, 또는 239), 안방 사물(침대 241, 스탠드 243), 주방 사물(냉장고 251, 커피 머신 253, 전등들 255), 거실 사물(TV 261, 쇼파 263, 전등 265), 현관 사물(문 271, 전등 273), 창문 275, 전자 장치 280 (예: 도 1의 전자 장치(101)), 네트워크 285 (예: 도 1의 네트워크(199)), 하나 이상의 외부 서버들 291, 295 (예: 도 1의 서버(108))를 포함할 수 있다. 예를 들어, 상기 전자 장치 280은 인공지능 스피커에 해당할 수 있다. 또는, 인공지능 스피커를 제어하거나 연동하여 동작하는 전자 장치를 포함할 수 있다.

다양한 실시 예에 따르면, 전자 장치 280은, 하나 이상의 카메라들(221~231) 중 적어도 하나를 이용해서, 사람이 어디에 위치하는지를 감지할 수 있다. 예컨대, 전자 장치 280은, 카메라 227을 통하여, 문을 통하여 집으로 들어오는 사람 또는 나가는 사람을 감지할 수 있다. 또는 전자 장치 280은, 카메라 223, 225, 229, 231을 통하여, 지정된 위치(예: 안방, 주방, 거실, 현관)에 들어오는 사람, 나가는 사람, 머무는 사람을 감지할 수 있다. 다른 실시 예에 따르면, 전자 장치 280은, 카메라 221을 통하여, 집 주변을 맴돌거나 집에 침입하는 사람을 감지할 수 있다. 또한, 전자 장치 280은, 하나 이상의 카메라들(221~231) 중 적어도 하나를 이용해서, 사용자를 식별할 수 있다. 예컨대, 전자 장치 280은, 지정된 사람(예: 거주자)인지, 또는 지정되지 않은 사람(예: 침입자 또는 손님)인지를 식별할 수 있다.

다양한 실시예에 따르면, 전자 장치 280은, 복수의 플로어 마이크들(233~239)을 통하여, 사람이 어디에 위치하는지를 감지할 수 있다. 예컨대, 전자 장치 280은, 플로어 마이크 233에서 획득되는 발자국 소리에 기반하여, 사람이 안방에 있다고 판단할 수 있다. 또한, 전자 장치 280은, 플로어 마이크 233에서 획득되는 발자국 소리의 특징(예: 강도, 패턴, 주파수 등)을 이용하여, 사전에 획득된 사람의 걸음걸이의 특징들과 비교하여, 사람을 식별할 수 있다. 예컨대, 아빠, 엄마, 아기로 구성된 가족이라 가정하면, 전자 장치 280은, 소리가 가장 크고, 걸음간의 시간 간격이 약 1~2초 내외이면, 아빠로 판단할 수 있다. 전자 장치 280은, 소리가 중간 크기이고, 걸음간의 시간 간격이 약 2~3초 내외이면 엄마로 판단할 수 있다. 전자 장치 280은, 소리가 작은 크기이고, 걸음간의 시간 간격이 약 1~2초 내외이면 아기로 판단할 수 있다. 예를 들면, 걸음간의 거리 간격, 왼발에서 오른발로 가는 특징과, 오른발에서 왼발로 가는 특징 등 다양한 특징들을 이용하여, 사람을 구별할 수 있다. 예를 들면, 학습되지 않은 발걸음 특징 또는 지정된 발걸음 특징이 획득되면, 전자 장치 280은, 침입자가 침입했을 수 있다고 판단할 수 있다.

다양한 실시 예에 따르면, 전자 장치 280은, 복수의 플로어 마이크를 이용하여, 사람의 위치를 판단할 수 있다. 예컨대, 전자 장치 280은, 플로어 마이크 233, 235, 237을 통해서 삼각 측량법을 이용하여, 플로어 마이크 233, 235, 237으로부터의 거리를 구하여, 사람의 위치를 보다 자세히 판단할 수 있다. 예컨대, 전자 장치 280은, 거실에서, 사람이 TV 261 또는 쇼파 263 중 어느 쪽에 더 가까이 위치 또는 접근하는지 판단할 수 있다. 또는, 전자 장치 280은, 주방에서, 사람이 냉장고 251 또는 커피머신 253 중 어느 쪽에 더 가까이 위치 또는 접근하는지 판단할 수 있다. 또는, 전자 장치 280은, 사람이 주방에서 안방으로, 주방에서 거실로 이동하는 방향을 판단할 수 있다. 한 실시 예에 따라, 플로어 마이크를 예시로 들었지만, 마이크는, 다양한 사물에 존재할 수 있다. 예를 들면, 천장 설치형, 조명 설치형, 가구 설치형, 가전 제품 설치형 등 다양한 곳에 존재할 수 있다.

다양한 실시 예에 따르면, 전자 장치 280은, 침대 241, 스탠드 243, 냉장고 251, 커피 머신 253, 티비 261, 쇼파 263 등 다양한 사물로부터 수신하는 정보에 기반하여, 사용자의 위치를 판단할 수 있다.

다양한 실시 예에 따르면, 침대 241 또는 소파 263은, 모션 센서, 무게 센서, 가속도 센서, 또는 커패시턴스 센서, 압력 센서 중 적어도 하나를 포함할 수 있다. 스탠드 243은 모션 센서를 포함할 수 있으며, 스탠드 243의 On/Off 정보를 제공할 수 있다. 냉장고 251은 모션 센서, 카메라, 문 열림 센서, 가속도 센서 등을 포함할 수 있으며, 문의 열림/닫힘 정보, 무엇을 넣고 빼내는지에 관한 정보 등을 제공할 수 있다. 커피 머신 253은 모션 센서를 포함할 수 있으며, 커피 머신 253의 On/Off 정보, 커피의 종류에 관한 정보, 커피의 온도에 관한 정보 등을 제공할 수 있다. 조명 255, 265, 273은, 모션 센서를 포함할 수 있으며 조명 255, 265, 273의 On/Off 정보를 제공할 수 있다. TV 261은 모션 센서, 카메라, 마이크를 포함할 수 있으며, TV 261의 On/Off 정보, 콘텐츠 이용 정보 등을 제공할 수 있다. 문 271 또는 창문 275은, 모션 센서, 가속도 센서, 문 열림 센서, 생체 정보 센서 등을 포함할 수 있으며, 열림/닫힘 정보, 객체의 출입 정보, 외부 침입 정보 등을 제공할 수 있다.

다양한 실시 예에 따르면, 하나 이상의 센서 또는 센서를 포함하는 장치들은, 무선 통신 장치를 포함할 수 있고, 사용자의 휴대 전자 장치(예: 핸드폰, 스마트 팔지 등)로부터 수신되는 무선 신호를 수신하여, 이에 대한 정보를 제공할 수 있다.

다양한 실시 예에 따르면, 전자 장치 280은, 다양한 제공된 정보를 이용하여, 사용자의 위치를 판단할 수 있고, 사용자를 식별할 수 있다. 전자 장치 280은, 다양한 제공된 정보를, 서버 291을 이용하여, 사용자의 위치를 판단할 수 있고, 사용자를 식별할 수 있다. 또한, 전자 장치 280은, 다양한 제공된 정보를, 서버 291에게 제공할 수 있다.

다양한 실시 예에 따르면, 전자 장치 280은, 현재 작동중인 전자 기기, 현재 시간, 학습된 사용자의 생활 패턴 등 추가적인 정보를 이용하여, 센서의 설정을 결정할 수 있다. 예컨대, 전자 장치 280은, 안방에 사용자가 있는데, 불은 꺼져있고, 침대의 센서를 통해서 사용자가 지정된 시간 이상 누워있다면, 사용자가 수면 중이라고 판단할 수 있다. 전자 장치 280은, 수면 설정(예: 초저녁엔 약 20분당 1회, 새벽녘엔 약 5분당 1회)으로 센서의 설정을 결정할 수 있다.

다양한 실시 예에 따르면, 전자 장치 280은, 안방에 연관된 센서들 중 센싱을 할 센서의 종류를 판단할 수 있다. 전자 장치 280은, 현재 작동중인 전자 기기, 시간과 학습된 사용자의 생활 패턴 등 추가적인 정보를 이용하여, 센싱을 할 센서의 종류를 판단할 수 있다. 예를 들면, 전자 장치 280은, 주방과 거실에도 수면 설정을 적용할 수 있다. 또한, 수면 설정 중일 때에는, 거실과 주방 등은 감시 설정으로 설정될 수 있다. 카메라와 모션 센서 중 하나만 센싱하도록 설정될 수 있다.

다양한 실시 예에 따르면, 전자 장치 280은, 사용자의 휴대 단말 또는 태블릿 또는 웨어러블 전자 장치를 포함할 수 있다. 또는 전자 장치 280은, TV, 냉장고, 셋탑 박스, 게임기 등 다양한 전자 장치에 포함될 수 있다. 또한, 설명의 편의를 위해서, 전자 장치 280이 별도로 구성된 예시를 들었지만, 전자 장치 280의 기능들은, 각각의 다양한 사물 또는 전자 장치에 각각 또는 적어도 하나에 포함될 수 있다.

다양한 실시 예에 따르면, 도 2는 스마트홈 환경에서의 전자 장치(예: 인공지능 스피커)의 동작을 예시하였지만, 이는 스마트홈에 제한되지 않고, 다양한 환경(예: 빌딩 내 또는 옥외 등)에서도 적용이 가능하다. 또한, 인공지능 스피커라 하였지만, 인공지능이라는 용어에 구속되지 않는 다양한 전자 기기를 포함할 수 있다. 또한, 도 2의 서버(291, 295)는 도 1의 108에, 네트워크(285)는 도 1의 199에 대응될 수 있다.

다양한 실시 예에 따르면, 사용자는 스마트 홈 환경에서, 메모의 생성, 검색, 출력을 위해 적어도 하나의 전자 장치와 인터랙션 할 수 있다. 사용자는 음성 입력, 그래픽 유저 인터페이스(graphic user interface, GUI)를 이용하여 전자 장치와 소통하고, 영상 정보를 얻기 위해서 스마트 홈 환경 내 위치한 전자 장치(예: 스마트 폰, 스마트 TV, 보안 카메라, 냉장고 등)의 카메라를 활용할 수 있다. 또한, 미니 로봇과 같은 전자 장치는 사용자의 동선을 보완할 수 있다. 사용자가 스마트 폰과 같은 전자 장치를 휴대하고 있지 않는 상황에서 사용자는 미니 로봇을 통해 적어도 하나의 정보를 입력 또는 획득할 수 있다. 미니 로봇과의 인터랙션은 음성 입력이 주가 될 수 있으며, 미니 로봇에 장착된 카메라를 활용하여 메모의 생성 및 업데이트에 사용할 영상 정보를 획득할 수 있다.

사용자가 생성한 정보들은 스마트 폰과 같은 전자 장치에 저장되거나 또는, 스마트 홈 환경 내의 인공지능 허브 기기(예: 인공지능 스피커)에 저장될 수도 있다. 이 경우, 해당 정보들은 인공지능 허브 기기의 보안 영역에 저장될 수 있다. 인공지능 허브 기기는 스마트 폰 및 미니 로봇의 부족한 컴퓨팅 리소스을 보완해줄 수 있으며, 음성 인식, 영상 인식에 필요한 인식 모델이 탑재되어 인식 모델을 이용한 인식 기능을 수행할 수도 있다. 인공지능 허브 기기(예: 도 2의 전자 장치 280)의 인식 결과는 스마트 폰 및 미니 로봇과 같은 스마트 홈 환경에 포함된 전자 장치에게 전송될 수 있다. 한편, 인식 모델은 외부 서버(예: 클라우드 서버, 도 2의 서버(291, 295))를 통해 업데이트 될 수 있다. 음성, 영상 인식은 외부 서버에서 인식 기능을 수행할 수도 있다. 이 경우 인식 결과는 인공지능 허브 기기를 통해 사용자 스마트기기 혹은 집안 내의 IoT 기기들에 전달 될 수 있다. 혹은 인공지능 허브 기기를 통하지 않고 사용자 스마트기기 혹은 IoT기기들에 직접 전달될 수 있다.

다양한 실시 예에 따르면, 전자 장치(101)는 메모 제공 시스템(300)을 통해 메모를 생성하고, 업데이트 하며, 검색하고, 표시할 수 있다. 예를 들어, 메모 제공 시스템(300)은 메모 생성 모듈(310), 메모 업데이트 모듈(320), 메모 표시 모듈(330), 메모 검색 모듈(340)을 포함할 수 있다.

다양한 실시 예에 따르면, 메모 생성 모듈(310)은 사용자의 음성 입력, 영상 등의 정보를 기반으로 메모를 생성할 수 있다. 여기서, 영상은 동적 영상(moving image) 또는 정적 영상(still image)를 포함할 수 있다. 예를 들어, 사용자는 메모 생성의 시작과 종료, 메모에 포함될 객체에 관한 정보 등을 음성으로 입력할 수 있다. 예를 들어, 메모 생성 모듈(310)은 영상 정보를 얻기 위해서 스마트 홈 환경 내 위치한 전자 장치(예: 스마트 폰, 스마트 TV, 보안 카메라, 냉장고 등)의 카메라를 활용할 수 있다. 메모 생성 모듈(310)은 획득한 영상에 포함된 객체를 인식하여, 객체에 관한 적어도 하나의 정보(예: 객체 영역, 객체 카테고리, 객체 이미지, 객체 계층 등)를 획득할 수 있다. 이를 통해, 메모 생성 모듈(310)은 전자 장치(101)의 사용자가 직접 메모 내용을 일일이 기록하지 않더라도 자동으로 인식된 정보에 기반하여 메모를 생성할 수 있다. 메모 생성 모듈(310)은 인식된 객체를 계층적으로 구분하여 저장할 수 있다. 예를 들어, 특정 객체가 어느 방에 위치하는지, 어느 가구에 위치하는지, 어느 상자에 위치하는지 등의 계층 정보를 포함하여 저장할 수 있다.

다양한 실시 예에 따르면, 메모 생성 모듈(310)은 증강 현실을 이용한 메모를 생성할 수 있다. 예를 들어, 메모 생성 모듈(310)은 메모 가능 영역 및 메모 가능 영역에 대응하는 메모 내용(예: 영상에서 인식된 객체)을 선택하여 증강 현실 메모를 생성할 수 있다. 선택은 순차적 또는 개별적으로 이루어질 수 있으며, 드래그 입력 또는 탭 터치 입력 등을 이용할 수 있다. 이에 대한 구체적인 내용은 도 8B를 참조할 수 있다.

다양한 실시 예에 따르면, 메모 업데이트 모듈(320)은 사용자의 음성 입력, 촬영된 영상 등의 정보를 기반으로 메모를 업데이트 할 수 있다. 예를 들어, 사용자는 메모 업데이트의 시작과 종료, 메모에 업데이트 될 객체에 관한 정보 등을 음성으로 입력할 수 있다. 예를 들어, 메모 업데이트 모듈(320)은 영상 정보를 얻기 위해서 스마트 홈 환경 내 위치한 전자 장치(예: 스마트 폰, 스마트 TV, 보안 카메라, 냉장고 등)의 카메라를 활용할 수 있다. 메모 업데이트 모듈(320)은 획득한 영상에 포함된 객체를 인식하여, 객체에 관한 적어도 하나의 정보(예: 객체 영역, 객체 카테고리, 객체 이미지, 객체 계층 등)를 획득할 수 있다. 메모 업데이트 모듈(320)은 업데이트의 대상이 되는 메모와 관련하여, 새로운 영상을 획득할 수 있다. 메모 업데이트 모듈(320)은 기 저장된 메모에 포함된 객체 정보와 새롭게 획득한 영상에 포함된 객체 정보를 비교할 수 있으며, 적어도 하나의 변경 사항들을 확인하여 저장할 수 있다. 메모 업데이트 모듈(320)은 사물 인식 기술을 통해 자동으로 객체의 영역을 추출하고, 객체의 카테고리를 인식할 수 있다. 이를 통해, 사용자는 직접 객체의 내용을 입력하고 분류하지 않더라도, 자동으로 인식된 객체 정보를 통해 메모를 업데이트할 수 있다.

다양한 실시 예에 따르면, 메모 표시 모듈(330)은 사용자에게 저장된 적어도 하나의 메모를 제공할 수 있다. 예를 들어, 적어도 하나의 메모는 사용자의 스마트 폰(예: 도 1의 전자 장치(101))에 저장되어 있을 수 있으며, 증강 현실을 통해 특정 영역에 결합되어 표시될 수 있다. 여기서, 증강 현실은 현실(reality)에 기반하여 정보를 추가(augmentation)로 제공하는 기술을 의미할 수 있다. 가령, 가상 현실(Virtual Reality)이 이미지, 주변 배경, 객체 모두를 가상의 이미지로 만들어 보여 주는 반면, 증강 현실은 추가되는 정보만 가상으로 만들어 사용자에게 제공할 수 있다. 즉, 증강 현실은 현실 세계의 실제 모습에 기반한다는 점에서 가상 현실과 상이한 면이 있다.

다른 예를 들어, 적어도 하나의 메모는 사용자의 스마트 폰이 아닌 스마트 홈 내 인공지능 허브 기기에 저장되어 있을 수 있으며, 사용자가 증강 현실 메모 기능을 활성화 시키는 경우, 인공지능 허브 기기에서 스마트 폰으로 전달되어 표시될 수 있다. 메모 표시 모듈(330)은 카메라 모듈(180)을 이용하여 획득한 영상에서 메모를 표시할 가상의 영역을 인식할 수 있다. 예를 들어, 메모 표시 모듈(330)은 카메라 모듈(180)을 이용하여 획득한 영상으로부터 깊이 맵(depth map)을 획득할 수 있으며, 깊이 맵에 기반하여 영상에 포함된 객체의 깊이 정보를 확인할 수 있다. 메모 표시 모듈(330)은 깊이 정보에 기반하여 증강 현실 메모를 표시할 면(plane) 정보를 획득할 수 있다.

메모 표시 모듈(330)은 획득한 면 정보를 메모 가능 영역으로 판단할 수 있으며, 선택된 면에 사용자의 메모에 대응하는 정보(예: 객체 이미지, 객체 이름, 객체 종류, 객체 카테고리, 객체 계층 등)를 증강 현실로 표시할 수 있다. 메모 표시 모듈(330)은 특정 영역(예: 옷장)에 표시 대상 객체가 다수가 존재하는 경우, 우선 특정 영역을 대표하는 영상을 사용자에게 제공할 수 있다. 이후, 사용자가 해당 대표 영상을 선택하는 경우, 특정 영역에 포함된 복수의 객체 정보를 상세히 표시할 수 있다. 여기서, 대표 영상은 사용자가 직접 지정한 객체에 관한 영상일 수 있으며, 최근에 변화가 감지된 객체에 관한 영상, 가장 오랫동안 배치된 객체에 관한 영상일 수도 있다.

다양한 실시 예에 따르면, 메모 검색 모듈(340)은 사용자의 음성 입력, 촬영된 영상 등의 정보를 기반으로 기 저장된 메모를 검색할 수 있다. 메모 검색 모듈(340)은 메모 제공 시스템(300)에 저장된 트리 구조를 활용하여, 검색 대상 객체의 계층 정보를 검색할 수 있다. 메모 검색 모듈(340)은 스마트 홈 환경 내 다른 사물 기기들로부터 적어도 하나의 정보(예: 위치 정보, 영상 정보 등)을 활용하여 메모를 검색할 수 있다.

다양한 실시 예에 따르면, 전자 장치(101)는 메모에 포함될 복수의 객체(예: 400 내지 432)를 계층적으로 분류하여 저장할 수 있다. 메모 내용을 계층화 하는데 소요되는 사용자의 노력을 최소화 하기 위해 영상 및 음성 입력 중 적어도 하나를 활용할 수 있다. 일 실시 예에 따르면, 계층화 시 포함 관계를 이용하여, 더 넓은 관계를 지니는 카테고리를 상위 계층으로 설정할 수 있으며, 계층도(예: 트리 구조)를 활용하여 메모 정보를 저장할 수 있다. 예를 들어, 안방(400)에는 수납장(410) 및 침대(412)가 포함될 수 있다. 수납장(410)에는 재킷(420), 블라우스(422), 가방(424) 및 수납함(426)이 포함될 수 있다. 수납함(426)은 목걸이(430) 및 귀걸이(432)를 포함할 수 있다. 계층화의 수준, 깊이 또는 레벨은 전자 장치의 인공지능에 기반한 결정 또는 사용자의 필요에 따라 상이하게 구성할 수 있다. 특정 객체에 대해 다른 객체보다 다수의 레벨로 계층화하거나, 한 두 단계로 단순하게 분류할 수도 있다. 도 4에 개시된 객체의 계층 정보는 이하 도 5A 내지 5D에서 보다 상세히 기술하도록 한다.

다양한 실시 예에 따르면, 도 5A는 메모의 계층 구조 중 제1 단계를 나타낼 수 있다. 예를 들어, 전자 장치(101)는 카메라 모듈(180)을 이용하여, 안방(400)에 관한 영상을 획득하고, 획득된 영상에 대한 영상 인식에 기반하여 '안방'을 제1 단계의 정보로 설정할 수 있다. 다른 예를 들어, 전자 장치(101)는 사용자의 메모에 관한 음성 입력을 수신하는 것에 기반하여 계층형 메모를 저장할 수 있다. 전자 장치(101)는 사용자로부터 "여기가 내 안방이야"라는 음성 입력에 기초하여 '안방'을 제1 단계로 설정할 수 있다.

다양한 실시 예에 따르면, 도 5B는 메모의 계층 구조 중 제2 단계를 나타낼 수 있다. 예를 들어, 사용자는 전자 장치(101)의 카메라 모듈(180)을 이용하여, 수납장(410)에 관한 영상을 획득하고, 획득된 영상에 대한 영상 인식에 기반하여 '수납장'을 제2 단계의 정보로 설정할 수 있다. 다른 예를 들어, 전자 장치(101)는 사용자의 메모에 관한 음성 입력을 수신하는 것에 기반하여 계층형 메모를 저장할 수 있다. 전자 장치(101)는 사용자로부터 "저기 위치한 가구는 수납장이야"라는 음성 입력에 기초하여 '수납장'을 제2 단계로 설정할 수 있다.

다양한 실시 예에 따르면, 도 5C는 메모의 계층 구조 중 제3 단계를 나타낼 수 있다. 예를 들어, 사용자는 전자 장치(101)의 카메라 모듈(180)을 이용하여, 수납장(410) 내부에 포함된 적어도 하나의 객체(예: 재킷(420), 블라우스(422), 가방(424), 수납함(426))에 관한 영상을 획득하고, 획득된 영상에 대한 영상 인식에 기반하여 '재킷', '블라우스', '가방', '수납함'을 제3 단계의 정보로 설정할 수 있다. 다른 예를 들어, 전자 장치(101)는 사용자의 메모에 관한 음성 입력을 수신하는 것에 기반하여 계층형 메모를 저장할 수 있다. 전자 장치(101)는 사용자로부터 "수납장 안에는 재킷, 블라우스, 가방, 수납함이 들어 있어"라는 음성 입력에 기초하여 '재킷', '블라우스', '가방', '수납함'을 제3 단계로 설정할 수 있다.

다양한 실시 예에 따르면, 도 5D는 메모의 계층 구조 중 제4 단계를 나타낼 수 있다. 예를 들어, 사용자는 전자 장치(101)의 카메라 모듈(180)을 이용하여, 수납함(426) 내부에 포함된 적어도 하나의 액세서리(예: 목걸이(430), 귀걸이(432))에 관한 영상을 획득하고, 획득된 영상에 대한 영상 인식에 기반하여 '목걸이', '귀걸이'를 제4 단계의 정보로 설정할 수 있다. 다른 예를 들어, 전자 장치(101)는 사용자의 메모에 관한 음성 입력을 수신하는 것에 기반하여 계층형 메모를 저장할 수 있다. 전자 장치(101)는 사용자로부터 "수납함 안에는 목걸이, 귀걸이가 들어 있어"라는 음성 입력에 기초하여 '목걸이', '귀걸이'를 제4 단계로 설정할 수 있다.

다양한 실시 예에 따르면, 상기 도 5A 내지 5D의 실시 예에서, 전자 장치(101)는 영상 및 음성 입력 중 적어도 일부를 조합하여 사용자의 의도에 부합하는 메모를 저장할 수도 있다.

다양한 실시 예에 따르면, 전자 장치(101)의 사용자는 검색 기능을 통해, 계층 구조로 저장된 메모 내의 어떤 노드(node)의 정보도 간편하게 확인할 수 있다. 또한, 계층 구조를 통해 해당 노드 뿐만 아니라, 상위 계층의 정보도 함께 획득할 수 있어, 사용자가 알 수 있는 정보의 질과 양이 훨씬 더 풍부해질 수 있다. 예를 들어, 전자 장치(101)는 사용자로부터 "귀걸이가 어디에 있는지 알려줘"라는 음성 명령을 수신할 수 있다. 전자 장치(101)는 이러한 음성 명령에 대응하여, "안방의 수납장 안에 수납함 안에 귀걸이가 있습니다"라는 응답을 사용자에게 제공할 수 있다. 전자 장치(101)의 사용자는 이러한 계층 구조를 이용하여 자신의 니즈(needs)에 따라 원하는 레벨의 정보를 추가적으로 더 획득할 수 있다. 예를 들어, 전자 장치(101)의 사용자는 메모 정보를 상위 레벨에서부터 점차 하위 레벨로 이동하면서 보다 세부적이고 체계적인 정보를 획득할 수 있다.

다양한 실시 예에 따르면, 전자 장치(101)는 610 동작에서, 사용자로부터 메모 생성에 대한 입력(예: 음성 입력, 터치 입력, 버튼 입력 등)을 수신할 수 있다. 예를 들어, 전자 장치(101)는 사용자로부터 "빅스비(bixby), 이제부터 메모를 남길 거야"라는 음성 명령을 수신할 수 있다.

다양한 실시 예에 따르면, 전자 장치(101)는 620 동작에서, 메모 생성을 위한 영상을 획득할 수 있다. 전자 장치(101)는 사용자의 메모 생성을 시작하겠다는 입력에 대응하여, 메모를 생성하기 위해 필요한 적어도 하나의 컴포넌트, 모듈 등을 활성화 할 수 있다. 예를 들어, 전자 장치(101)는 카메라 모듈, 음성 인식 모듈, 영상 인식 모듈 등을 활성화 할 수 있다.

다양한 실시 예에 따르면, 전자 장치(101)는 630 동작에서, 획득한 영상에 적어도 일부 기초하여 객체를 인식할 수 있다. 전자 장치(101)는 영상 인식 모듈을 통해, 해당 영상에 포함된 적어도 하나의 객체들을 세그먼트하고 해당 객체를 인식할 수 있다.

다양한 실시 예에 따르면, 전자 장치(101)는 630 동작에서, 카메라 모듈로부터 영상을 획득하는 것과 더불어, 기록 중인 메모에 관한 적어도 하나의 정보를 수신하여 객체를 인식할 수도 있다.

다양한 실시 예에 따르면, 기록 중인 메모에 관한 적어도 하나의 정보는 사용자의 음성 입력일 수 있다. 전자 장치(101)는 카메라 모듈로부터 획득한 영상 및 사용자의 음성 입력에 기반하여 객체를 인식할 수 있다. 예를 들어, 전자 장치(101)는 사용자로부터 "여기는 내 안방이고, 저기 보이는 건 수납장이야"라는 음성 입력을 수신할 수 있다. 전자 장치(101)의 사용자는 해당 음성 입력과 함께, 전자 장치(101)를 안방의 수납장 방향으로 향하도록 제어할 수 있다. 전자 장치(101)는 카메라 모듈(180)을 통해, 영상을 획득할 수 있으며, 획득한 영상으로부터 적어도 하나의 객체(예: 안방 및 안방에 배치된 수납장)에 대해 인식할 수 있다.

다른 예를 들어, 전자 장치(101)는 사용자로부터 "수납장 문을 열면 이런 것들이 있어"라는 음성 명령을 수신할 수 있다. 상기 음성 명령을 수신하는 것에 대응하여, 전자 장치(101)는 카메라 모듈(180)을 통해 영상을 획득할 수 있으며, 획득한 영상으로부터 수납장 내 포함된 적어도 하나의 객체를 인식할 수 있다.. 또 다른 예를 들어, 전자 장치(101)는 사용자로부터 "저 수납함은 액세서리를 보관하는 상자인데, 이런 것들이 담겨 있어"라는 음성 명령을 수신할 수 있다. 상기 음성 명령을 수신하는 것에 대응하여, 전자 장치(101)는 카메라 모듈(180)을 통해 영상을 획득할 수 있고, 획득한 영상으로부터 수납장 내 포함된 적어도 하나의 객체를 인식할 수 있으며, 인식된 적어도 하나의 객체가 액세서리에 해당한다는 것을 확인할 수 있다.

다양한 실시 예에 따르면, 기록 중인 메모에 관한 적어도 하나의 정보는 사물 인터넷 기기의 사물 정보일 수 있다. 전자 장치(101)는 스마트 홈 환경에 속해 있을 수 있으며, 스마트 홈 환경 내 포함된 적어도 하나의 사물 인터넷 기기들로부터 사물 정보를 수신할 수 있다. 전자 장치(101)는 영상이 촬영되는 위치 및 영상에 포함된 적어도 하나의 객체에 관한 정보를 수신하여, 객체를 인식할 수도 있다.

다양한 실시 예에 따르면, 전자 장치(101)는 640 동작에서, 인식된 객체의 계층 수준(level of hierarchy)을 결정할 수 있으며, 인식된 객체에 관한 정보를 결정된 계층 수준에 따라 저장할 수 있다. 전자 장치(101)는 사용자의 음성 입력, 사물 인터넷 기기의 사물 정보, 및 카메라 모듈로부터 획득한 영상 중 적어도 일부에 기초하여 안방에 위치한 수납장을 인식할 수 있다. 예를 들어, 전자 장치(101)는 안방을 제1 단계 계층(예: 방의 종류)으로, 수납장을 제2 단계 계층(예: 방에 배치된 가구)으로 결정하고, 결정된 계층에 인식된 객체에 관한 정보를 저장할 수 있다.

다른 예를 들어, 전자 장치(101)는 수납장 내 포함된 적어도 하나의 객체를 제3 단계 계층으로 저장할 수 있다. 전자 장치(101)는 수납장 내 자켓, 블라우스, 가방, 수납함을 제2 단계인 수납장 보다 하위 단계인 제3 단계로 결정할 수 있으며, 결정된 계층에 인식된 객체에 관한 정보를 저장할 수 있다. 또 다른 예를 들어, 전자 장치(101)는 수납함 내 포함된 적어도 하나의 객체를 제4 단계 계층으로 저장할 수 있다. 전자 장치(101)는 수납함 내 목걸이, 귀걸이를 제3 단계인 수납함 보다 하위 단계인 제4 단계로 결정할 수 있으며, 결정된 계층에 인식된 객체에 관한 정보를 저장할 수 있다.

다양한 실시 예에 따르면, 전자 장치(101)는 710 동작에서, 메모 업데이트에 대한 입력(예: 음성 입력, 터치 입력, 버튼 입력 등)을 수신할 수 있다. 예를 들어, 전자 장치(101)는 사용자로부터 "빅스비, 바뀐 것들이 있으면 업데이트 해줘"라는 음성 명령을 수신할 수 있다.

다양한 실시 예에 따르면, 전자 장치(101)는 720 동작에서, 메모 업데이트를 위한 영상을 획득할 수 있다. 전자 장치(101)는 사용자의 메모 업데이트를 시작하겠다는 입력에 대응하여, 메모를 업데이트 하기 위해 필요한 적어도 하나의 컴포넌트, 모듈 등을 활성화 할 수 있다. 예를 들어, 전자 장치(101)는 카메라 모듈, 음성 인식 모듈, 영상 인식 모듈 등을 활성화 할 수 있다.

다양한 실시 예에 따르면, 전자 장치(101)는 730 동작에서, 획득한 영상에 적어도 일부에 기초하여 객체를 인식할 수 있다. 전자 장치(101)는 영상 인식 모듈을 통해, 해당 영상에 포함된 적어도 하나의 객체들을 세그먼트하고 해당 객체를 인식할 수 있다.

다양한 실시 예에 따르면, 전자 장치(101)는 730 동작에서, 카메라 모듈로부터 영상을 획득하는 것과 더불어, 업데이트 중인 메모에 관한 적어도 하나의 정보를 수신하여 객체를 인식할 수도 있다.

다양한 실시 예에 따르면, 업데이트 중인 메모에 관한 적어도 하나의 정보는 사용자의 음성 입력일 수 있다. 전자 장치(101)는 카메라 모듈로부터 획득한 영상 및 사용자의 음성 입력에 기반하여 객체를 인식할 수 있다. 예를 들어, 전자 장치(101)는 사용자로부터 "안방 수납장을 열어보도록 할게"라는 음성 입력을 수신할 수 있다. 상기 음성 명령을 수신하는 것에 대응하여, 전자 장치(101)는 카메라 모듈(180)을 통해 영상을 획득할 수 있고, 획득한 영상으로부터 수납장 내 포함된 적어도 하나의 객체를 인식할 수 있다.

다양한 실시 예에 따르면, 업데이트 중인 메모에 관한 적어도 하나의 정보는 사물 인터넷 기기의 사물 정보일 수 있다. 전자 장치(101)는 스마트 홈 환경에 속해 있을 수 있으며, 스마트 홈 환경 내 포함된 적어도 하나의 사물 인터넷 기기들로부터 사물 정보를 수신할 수 있다. 전자 장치(101)는 영상이 촬영되는 위치 및 영상에 포함된 적어도 하나의 객체에 관한 정보를 수신하여, 객체를 인식할 수도 있다.

다양한 실시 예에 따르면, 전자 장치(101)는 740 동작에서, 인식된 객체의 계층 수준을 결정할 수 있다. 전자 장치(101)는 사용자의 음성 입력, 사물 인터넷 기기의 사물 정보, 및 카메라 모듈로부터 획득한 영상 중 적어도 일부에 기초하여 안방에 위치한 수납장을 인식할 수 있다. 예를 들어, 전자 장치(101)는 안방을 제1 단계 계층(예: 방의 종류)으로, 수납장을 제2 단계 계층(예: 방에 배치된 가구)으로 결정할 수 있다.

다양한 실시 예에 따르면, 전자 장치(101)는 740 동작에서, 결정된 객체의 계층 수준에 기반하여, 현재 획득한 영상에 포함된 객체가 기 저장된 메모의 계층도(예: 트리 구조)에서 어느 계층(예: 노드)에 해당하는지 확인할 수 있다. 예를 들어, 전자 장치(101)는 카메라 모듈(180)을 통해 현재 획득한 영상과 해당 노드에 대응하여 저장된 영상에 포함된 객체들을 비교하여 달라진 점을 확인할 수 있다.

다양한 실시 예에 따르면, 전자 장치(101)는 750 동작에서, 사용자에게 메모에 추가해야 될 객체 및 삭제해야 될 객체에 관한 정보를 전달할 수 있다. 예를 들어, 전자 장치(101)는 사용자에게 "가방과 수납함이 없습니다. 다른 곳에 두셨나요?"라고 문의할 수 있으며, "치마가 추가되었습니다. 업데이트 하시겠습니까?"라고도 문의할 수 있다.

다양한 실시 예에 따르면, 전자 장치(101)는 750 동작에서, 사용자의 음성 입력을 수신하여, 메모 업데이트에 필요한 피드백을 수신할 수 있다. 예를 들어, 전자 장치(101)는 가방과 수납함을 다른 곳에 두었냐는 질문에 대응하여, 사용자로부터 "응. 가방은 버렸고, 수납함은 작은방 책상으로 옮겼어"라는 응답을 수신할 수 있다. 전자 장치(101)는 사용자의 응답을 수신하는 것에 대응하여, 가방을 메모(예: 제3 단계 계층)에서 삭제할 수 있으며, 수납함은 작은방 책상에 위치하는 걸로 트리 구조를 변경하여 저장할 수 있다. 만약, 기존에 작은방과 관련된 메모 정보가 생성되지 않았다면, 전자 장치(101)는 안방과 동등한 레벨의 작은방에 관한 노드를 생성할 수 있으며, 작은방에 대한 하위 레벨로 책상을 추가할 수 있다. 마지막으로, 책상에 대한 하위 레벨로 수납함을 저장할 수 있다.

다양한 실시 예에 따르면, 전자 장치(101)는 750 동작에서, 사용자의 명시적인 요청 없이도 메모를 업데이트할 수도 있다. 예를 들어, 사용자가 카메라 모듈을 통해 다른 영역을 촬영하는 도중에 획득한 영상에 기반하여 자동으로 기 저장된 메모에 포함된 영상 정보와 비교하여 메모 업데이트를 수행할 수 있다. 또는, 스마트 홈 환경 내 위치한 사물 인터넷 기기들로부터 적어도 하나의 영상 정보를 획득할 수 있으며, 이를 인공지능 허브 기기를 통해 자동으로 메모 업데이트를 수행할 수 있다. 전자 장치(101)는 자동으로 감지된 메모의 변경 사항들을 알려줄 수 있으며, 사용자에게 해당 변경 사항들을 업데이트 하겠냐고 문의할 수 있다. 이후, 전자 장치(101)는 사용자로부터 업데이트 승인 입력을 수신하여 메모 업데이트를 완료할 수 있다. 물론, 전자 장치(101)는 사용자의 업데이트 승인 입력 없이 자동으로 메모 업데이트를 수행할 수도 있다.

다양한 실시 예에 따르면, 도 8을 참조하면, 전자 장치(101)는 사물 인식 기술을 통해 자동으로 객체(811 내지 817)의 영역을 검출하고, 객체(811 내지 817)의 카테고리(예: 가방, 재킷, 수납함, 블라우스 등)를 인식할 수 있다. 전자 장치(101)는 인식된 객체의 계층 수준(level of hierarchy)을 결정할 수 있으며, 인식된 객체에 관한 정보를 결정된 계층 수준에 따라 저장할 수 있다. 이를 통해, 전자 장치(101)의 사용자는 직접 객체의 내용을 입력하고 분류하지 않더라도, 자동으로 인식된 객체 정보(예: 카테고리, 계층 등)를 통해 메모의 저장, 업데이트, 및 검색이 간편해질 수 있다.

다양한 실시 예에 따르면, 도 9A를 참조하면, 전자 장치(101)는 카메라 모듈(180)로부터 영상을 획득할 수 있다. 전자 장치(101)는 획득한 영상에 포함된 객체들의 깊이를 측정할 수 있다. 일반적으로, 깊이 카메라(depth camera)를 사용하여 객체들의 깊이를 측정하지만, 스마트 폰과 같은 전자 장치(101)에서는 제품의 소형화를 위해 별도의 깊이 카메라를 구비하는 것이 용이하지 않을 수 있다. 전자 장치(101)는 영상 정보로부터 RGB 이미지(910)만을 추출하여, 이를 기반으로 깊이 맵(920)을 획득할 수 있다. 전자 장치(101)는 도 930을 참조하면, 획득한 깊이 맵(920)에 기반하여, 영상 정보 내 존재하는 평면(plane) 정보들(예: 931 내지 939)을 획득할 수 있다. 전자 장치(101)는 획득한 평면 정보를 이용하여, 증강 현실 메모를 붙일 수 있는 영역을 확인할 수 있다.

다양한 실시 예에 따르면, 도 9B를 참조하면, 전자 장치(101)는 도 940을 참조하면, 증강 현실 메모 어플리케이션을 실행할 수 있다. 전자 장치(101)의 디스플레이에는 메모 가능 영역(941) 및 메모 내용(943, 예: 영상 정보로부터 추출된 객체)이 표시될 수 있다. 예를 들어, 전자 장치(101)는 메모 가능 영역(941) 및 메모 내용(943)을 도 940과 같이 한 화면에 함께 표시될 수 있다. 다른 예를 들어, 전자 장치(101)는 메모 가능 영역(941) 또는 메모 내용(943)을 독자적으로 표시한 뒤, 이어지는 사용자의 입력에 따라, 표시되지 않은 나머지 항목들을 표시할 수 있다. 만약, 메모 가능 영역(941)이 먼저 표시되는 경우, 전자 장치(101)는 사용자가 메모 가능 영역(941)을 선택하는 입력에 대응하여, 해당 영역에 대응되는 메모 내용(943)을 표시할 수 있다. 만약, 메모 내용(943)이 먼저 표시되는 경우, 전자 장치(101)는 사용자가 메모 내용(943)을 선택하는 입력에 대응하여, 해당 메모 내용을 표시할 메모 가능 영역(941)을 표시할 수 있다.

전자 장치(101)는 도 950을 참조하면, 메모 가능 영역(941) 및 메모 내용(943)이 함께 표시된 상태에서, 사용자로부터 접시 및 컵(951)을 부엌 선반 영역(955)에 드래그하는 입력(953)을 수신할 수 있다. 여기서, 메모 가능 영역(941) 및 메모 내용(943)을 연결시키는 입력은 상기의 드래그 입력(953)에 국한되지는 않는다. 사용자는 탭 터치 입력을 통해 메모 내용(943)과 메모 가능 영역(941)을 매칭시킬 수 있다. 이에 따라, 전자 장치(101)는 사용자에게 부엌 선반 영역(955)에 접시 및 컵(951)이 위치한다는 증강 현실 메모를 사용자에게 제공할 수 있다.

다양한 실시 예에 따르면, 도 10을 참조하면, 전자 장치(101)는 사용자에게 적어도 하나의 증강 현실 메모를 제공할 수 있다. 전자 장치(101)는 메모 생성 모듈(310)을 통해, 객체가 위치하는 영역과 객체를 매칭시켜 증강 현실 메모를 저장하고, 이를 사용자에게 제공할 수 있다. 예를 들어, 전자 장치(101)는 겨울 옷(1011, 1019), 가을 옷(1013), 아이 옷(1015), 휴지 및 키친 타올(1017), 청소기(1020)가 증강 현실 메모가 부착된 각 영역에 위치함을 알려줄 수 있다. 전자 장치(101)는 증강 현실 메모를 특정 영역과 결합하여 저장함에 있어서, 텍스트, 이모티콘, 영상, 사운드, 또는 진동 등을 자유롭게 활용할 수 있다. 예를 들어, 전자 장치(101)는 특정 영역으로 카메라 모듈이 향하는 경우, 메모지를 표시하는 것뿐만 아니라, 기 지정된 영상이나 멜로디가 출력되도록 설정할 수도 있다.

도 11은 본 발명의 다양한 실시 예에 따른 전자 장치의 증강 현실을 통해 단계적으로 메모를 확인할 수 있는 방법을 나타내는 도면이다.

다양한 실시 예에 따르면, 도 11을 참조하면, 전자 장치(101)는 제2 단계의 증강 현실 메모(예: 문이 닫힌 상태의 수납장 영상, 또는 수납장이라는 텍스트의 메모)를 표시할 수 있다.

다양한 실시 예에 따르면, 도 1110을 참조하면, 전자 장치(101)는 사용자의 하위 단계로 진입하려는 입력(예: 수납장을 터치하거나, 수납장에 대해 확대하려는 제스처)에 대응하여, 제3 단계의 증강 현실 메모(예: 문이 열린 상태의 수납장 영상(1111 내지 1117), 또는 문이 열린 상태의 각 객체에 대한 텍스트 정보)를 표시할 수 있다.

다양한 실시 예에 따르면, 도 1120을 참조하면, 전자 장치(101)는 사용자의 하위 단계로 진입하려는 입력(예: 수납함을 터치하거나, 수납함에 대해 확대하려는 제스처)에 대응하여, 제4 단계의 증강 현실 메모(예: 뚜껑이 열린 상태의 수납함 영상(1121), 또는 뚜껑이 열린 상태의 각 객체에 대한 텍스트 정보)를 표시할 수 있다. 이를 통해, 전자 장치(101)의 사용자는 사용자가 직접 수납장 문을 열어보거나, 수납함 뚜껑을 열지 않더라도, 내부에 어떠한 객체들이 위치하는지 매우 쉽고 간편하게 확인할 수 있다.

다양한 실시 예에 따르면, 도 1210 및 1220을 참조하면, 전자 장치(101)는 메모를 표시할 가상의 영역을 인식할 수 있다. 예를 들어, 전자 장치(101)는 깊이 맵(depth map)을 획득할 수 있으며, 깊이 맵에 기반하여 배경의 깊이 정보를 확인할 수 있다. 전자 장치(101)는 깊이 정보에 기반하여 증강 현실 메모를 표시할 면(plane) 정보를 획득할 수 있다. 전자 장치(101)는 획득한 면 정보를 메모 가능 영역(1212, 1214)으로 판단할 수 있으며, 선택된 면에 가상의 메모 보드(1221, 1223)를 제공할 수 있다. 전자 장치(101)는 영상을 분석하여 획득한 객체 정보가 아니더라도, 증강 현실 메모 보드(1221, 1223)를 특정 공간과 연관시켜 저장 및 표시할 수 있다. 예를 들어, 전자 장치(101)는 메모 보드(1221)에 사용자가 해야 할 일의 목록을 표시할 수 있으며, 메모 보드(1223)에 캘린더 및 일정 정보를 표시할 수 있다. 전자 장치(101)의 사용자는 증강 현실 메모 보드를 다른 전자 장치의 사용자와 공유할 수 있다. 예를 들어, 증강 현실 메모 보드는 사용자의 설정에 의해 사용자가 기 지정한 전자 장치(예: 가족 구성원이 사용하는 전자 장치)에서만 보이도록 제어할 수 있다. 또한, 개인 정보가 담긴 증강 현실 메모 보드는 사용자의 전자 장치(101)를 통해서만 확인하도록 하여 보안성을 높일 수도 있다. 이러한, 증강 현실 메모 보드는 실제 배경에는 존재하지 않는 가상의 영상이므로, 외관 상 깔끔함 및 심플함을 유지함과 동시에, 사용자가 반드시 기억해야 할 내용들을 쉽게 확인할 수 있도록 한다는 점에서 매우 유용할 수 있다.

다양한 실시 예에 따르면, 전자 장치(101)의 사용자는 메모가 남겨진 공간으로 직접 이동하지 않더라도 사용자의 현재 위치에서 기록된 메모를 확인할 수 있다. 즉, 전자 장치(101)의 사용자는 현재 어디에 있든지, 사용자가 남긴 메모에 해당하는 객체의 위치를 사용자 관점에서 쉽게 확인할 수 있다.

다양한 실시 예에 따르면, 전자 장치(101)는 사용자로부터 청소기가 어디 있는지 확인해달라는 음성 입력을 수신할 수 있다. 예를 들어, 전자 장치(101)는 사용자로부터 "청소기 어디 있지?"라는 음성 입력을 수신할 수 있다. 전자 장치(101)는 사용자의 음성 입력에 대응하여, 메모에 저장된 청소기의 위치를 계층적으로 확인(예: 집-발코니-청소기)하여 응답을 제공할 수 있다. 예를 들어, 전자 장치(101)는 "청소기는 발코니에 있습니다" 라고 응답할 수 있다. 또한, 도 13을 참조하면, 전자 장치(101)는 집의 구조도를 활용하여 발코니에 배치된 청소기의 위치 정보(1301)를 표시할 수 있다. 여기서, 집의 구조도는 전자 장치(101)의 메모리(130)에 저장되어 있거나, 전자 장치(102, 104) 또는 서버(108)를 통해 획득할 수 있다. 만약, 사용자가 위치한 집에 해당하는 구조도를 획득할 수 없는 경우에는, 전자 장치(101)의 카메라 모듈(180) 또는 스마트 홈 환경 내 다른 사물 기기들로부터 획득한 적어도 하나의 정보를 종합하여 집의 구조도를 생성할 수 있으며, 생성된 구조도에 청소기의 위치를 표시할 수도 있다.

다양한 실시 예에 따르면, 전자 장치(101)는 외부 전자 장치(예: 미니 로봇, TV, 보안 카메라 등)의 카메라를 활용하여, 사용자가 거실에 있음에도 불구하고, 안방에 위치한 증강 현실 메모를 확인하도록 할 수 있다. 전자 장치(101)는 사용자의 입력에 대응하여, 외부 전자 장치의 카메라로부터 영상 정보를 획득할 수 있다. 전자 장치(101)는 해당 영상 내 포함된 특정 공간과 연관된 증강 현실 메모를 사용자에게 제공될 수 있다. 이를 통해, 전자 장치(101)의 사용자는 직접 움직이지 않더라도, 현실 배경과 결합된 증강 현실 메모를 확인할 수 있다. 전자 장치(101)는 외부 전자 장치의 카메라를 활용할 수 없는 경우 메모 제공 시스템(300)에 저장되어 있는 영상 정보를 활용하여 증강 현실 메모 혹은 영상 메모를 사용자에게 제공할 수 있다.

상기 적어도 하나의 객체에 관한 정보는 상기 전자 장치의 사용자로부터 수신된 음성 입력에 기반하여 획득한 정보를 포함할 수 있다.

상기 적어도 하나의 객체에 관한 정보는, 상기 적어도 하나의 객체가 배치된 공간 정보, 상기 적어도 하나의 객체의 위치 정보, 카테고리 정보, 계층 정보, 색상 정보 및 상기 적어도 하나의 객체와 관련된 사용자의 입력 정보 중 적어도 하나를 포함할 수 있다.

상기 프로세서는, 상기 획득된 제2 영상을 기반으로, 상기 제1 영상의 상기 적어도 하나의 객체 중 상기 제2 영상에 포함되지 않은 제3 객체의 경우, 상기 임의의 공간에 대응하여 기 저장된 상기 제3 객체에 관한 정보를 삭제할 수 있다.

상기 프로세서는, 상기 제2 객체에 관한 정보를 상기 임의의 공간에 대응하여 저장하거나, 또는 상기 제3 객체에 관한 정보를 상기 임의의 공간에 대응하여 삭제하는 경우, 사용자로부터 허용 여부를 확인하고, 및 상기 사용자로부터 컨펌(confirm)을 수신하는 것에 대응하여, 상기 제2 객체 또는 제3 객체에 관한 정보를 업데이트 할 수 있다.

상기 프로세서는, 상기 제2 객체에 관한 정보를 상기 임의의 공간에 대응하여 저장하거나, 또는 상기 제3 객체에 관한 정보를 상기 임의의 공간에 대응하여 삭제하는 경우, 상기 제2 객체 또는 제3 객체에 관한 정보를 업데이트 하고, 및 상기 제2 객체 또는 제3 객체에 관한 업데이트 정보를 상기 사용자에게 제공할 수 있다.

상기 프로세서는, 상기 카메라 모듈을 통하여, 상기 임의의 공간에 배치된 복수의 객체들을 인식하고, 및 상기 복수의 객체들의 계층화 정보를 생성하고, 상기 계층화 정보는 상기 복수의 객체들이 제1 계층으로 분류된 정보, 또는 상기 복수의 객체들이 상기 제1 계층 및 상기 제1 계층과 상이한 제2 계층으로 분류된 정보를 포함할 수 있다.

상기 프로세서는, 상기 카메라 모듈을 통하여, 상기 제1 계층에 대응하는 객체 및 상기 제2 계층에 해당하는 객체를 이시(異時)에 인식할 수 있다.

상기 프로세서는, 상기 디스플레이를 통하여, 상기 제1 계층에 대응하는 객체에 관한 정보를 상기 제2 영상과 함께 표시하는 중, 사용자로부터 계층 변경 입력을 수신하고, 및 상기 계층 변경 입력을 수신하는 것에 대응하여, 상기 제2 계층에 대응하는 객체에 관한 정보를 상기 제1 계층에 대응하는 객체에 관한 정보를 대신하여 표시하고, 상기 계층 변경 입력은 상기 사용자의 음성 입력, 상기 사용자의 제스처 입력, 및 상기 사용자의 상기 제1 계층에 대응하는 객체에 관한 정보와 연관된 터치 입력 중 적어도 하나를 포함할 수 있다.

상기 제1 계층 또는 제2 계층에 대응하는 객체에 관한 정보는, 상기 제1 계층 또는 제2 계층으로 분류된 적어도 하나의 객체 중 사용 빈도가 높은 객체에 관한 정보, 상기 제1 계층 또는 제2 계층으로 분류된 적어도 하나의 객체 중 검색 빈도가 높은 객체에 관한 정보, 및 상기 제1 계층 또는 제2 계층으로 분류된 적어도 하나의 객체에 관한 섬 네일(thumb nail) 정보 중 적어도 하나를 포함할 수 있다.

상기 획득된 제2 영상을 기반으로, 상기 제1 영상의 상기 적어도 하나의 객체 중 상기 제2 영상에 포함되지 않은 제3 객체의 경우, 상기 임의의 공간에 대응하여 기 저장된 상기 제3 객체에 관한 정보를 삭제하는 동작을 포함할 수 있다.

상기 제2 객체에 관한 정보를 상기 임의의 공간에 대응하여 저장하는 동작, 또는 상기 제3 객체에 관한 정보를 상기 임의의 공간에 대응하여 삭제하는 동작을 수행하는 경우, 사용자로부터 허용 여부를 확인하는 동작; 및 상기 사용자로부터 컨펌(confirm)을 수신하는 것에 대응하여, 상기 제2 객체 또는 제3 객체에 관한 정보를 업데이트 하는 동작을 포함할 수 있다.

상기 제2 객체에 관한 정보를 상기 임의의 공간에 대응하여 저장하는 동작, 또는 상기 제3 객체에 관한 정보를 상기 임의의 공간에 대응하여 삭제하는 동작을 수행하는 경우, 상기 제2 객체 또는 제3 객체에 관한 정보를 업데이트 하는 동작; 및 상기 제2 객체 또는 제3 객체에 관한 업데이트 정보를 상기 사용자에게 제공하도록 하는 동작을 포함할 수 있다.

상기 카메라 모듈을 통하여, 상기 임의의 공간에 배치된 복수의 객체들을 인식하는 동작; 및 상기 복수의 객체들의 계층화 정보를 생성하는 동작을 포함하고, 상기 계층화 정보는 상기 복수의 객체들이 제1 계층으로 분류된 정보, 또는 상기 복수의 객체들이 상기 제1 계층 및 상기 제1 계층과 상이한 제2 계층으로 분류된 정보를 포함할 수 있다.

상기 카메라 모듈을 통하여, 상기 제1 계층에 대응하는 객체 및 상기 제2 계층에 해당하는 객체를 이시(異時)에 인식하는 동작을 포함할 수 있다.

상기 디스플레이를 통하여, 상기 제1 계층에 대응하는 객체에 관한 정보를 상기 제2 영상과 함께 표시하는 중, 사용자로부터 계층 변경 입력을 수신하는 동작; 및 상기 계층 변경 입력을 수신하는 것에 대응하여, 상기 제2 계층에 대응하는 객체에 관한 정보를 상기 제1 계층에 대응하는 객체에 관한 정보를 대신하여 표시하는 동작을 포함하고, 상기 계층 변경 입력은 상기 사용자의 음성 입력, 상기 사용자의 제스처 입력, 및 상기 사용자의 상기 제1 계층에 대응하는 객체에 관한 정보와 연관된 터치 입력 중 적어도 하나를 포함할 수 있다.

Claims

전자 장치에 있어서,

디스플레이;

카메라 모듈; 및

프로세서를 포함하고, 상기 프로세서는,

상기 카메라 모듈을 통하여, 임의의 공간에 배치된 적어도 하나의 객체를 포함하는 제1 영상을 획득하고,

상기 획득된 제1 영상을 기반으로, 상기 적어도 하나의 객체에 관한 정보를 상기 임의의 공간에 대응하여 저장하고,

상기 카메라 모듈을 통하여, 상기 임의의 공간의 적어도 일부를 포함하는 제2 영상을 획득하고, 및

상기 획득된 제2 영상을 기반으로,

상기 제2 영상에 포함된 객체 중 상기 제1 영상의 상기 적어도 하나의 객체에 포함된 제1 객체의 경우, 상기 디스플레이를 통하여, 상기 제1 객체에 관한 정보를 상기 제2 영상과 함께 표시하고, 및

상기 제2 영상에 포함된 객체 중 상기 제1 영상의 상기 적어도 하나의 객체에 포함되어 있지 않은 제2 객체의 경우, 상기 제2 객체에 관한 정보를 상기 임의의 공간에 대응하여 저장하는 동작 중 적어도 하나의 동작을 수행하도록 설정된 전자 장치.
제1 항에 있어서,

상기 적어도 하나의 객체에 관한 정보는 상기 전자 장치의 사용자로부터 수신된 음성 입력에 기반하여 획득한 정보를 포함하는 전자 장치.
제1 항에 있어서,

상기 적어도 하나의 객체에 관한 정보는,

상기 적어도 하나의 객체가 배치된 공간 정보, 상기 적어도 하나의 객체의 위치 정보, 카테고리 정보, 계층 정보, 색상 정보 및 상기 적어도 하나의 객체와 관련된 사용자의 입력 정보 중 적어도 하나를 포함하는 전자 장치.
제1 항에 있어서,

상기 프로세서는,

상기 획득된 제2 영상을 기반으로,

상기 제1 영상의 상기 적어도 하나의 객체 중 상기 제2 영상에 포함되지 않은 제3 객체의 경우, 상기 임의의 공간에 대응하여 기 저장된 상기 제3 객체에 관한 정보를 삭제하도록 설정된 전자 장치.
제4 항에 있어서,

상기 프로세서는,

상기 제2 객체에 관한 정보를 상기 임의의 공간에 대응하여 저장하거나, 또는 상기 제3 객체에 관한 정보를 상기 임의의 공간에 대응하여 삭제하는 경우, 사용자로부터 허용 여부를 확인하고, 및

상기 사용자로부터 컨펌(confirm)을 수신하는 것에 대응하여, 상기 제2 객체 또는 제3 객체에 관한 정보를 업데이트 하도록 설정된 전자 장치.
제4 항에 있어서,

상기 프로세서는,

상기 제2 객체에 관한 정보를 상기 임의의 공간에 대응하여 저장하거나, 또는 상기 제3 객체에 관한 정보를 상기 임의의 공간에 대응하여 삭제하는 경우, 상기 제2 객체 또는 제3 객체에 관한 정보를 업데이트 하고, 및

상기 제2 객체 또는 제3 객체에 관한 업데이트 정보를 상기 사용자에게 제공하도록 설정된 전자 장치.
제1 항에 있어서,

상기 프로세서는,

상기 카메라 모듈을 통하여, 상기 임의의 공간에 배치된 복수의 객체들을 인식하고, 및

상기 복수의 객체들의 계층화 정보를 생성하고,

상기 계층화 정보는 상기 복수의 객체들이 제1 계층으로 분류된 정보, 또는 상기 복수의 객체들이 상기 제1 계층 및 상기 제1 계층과 상이한 제2 계층으로 분류된 정보를 포함하도록 설정된 전자 장치.
제7 항에 있어서,

상기 프로세서는,

상기 카메라 모듈을 통하여, 상기 제1 계층에 대응하는 객체 및 상기 제2 계층에 해당하는 객체를 이시(異時)에 인식하도록 설정된 전자 장치.
제8 항에 있어서,

상기 프로세서는,

상기 디스플레이를 통하여, 상기 제1 계층에 대응하는 객체에 관한 정보를 상기 제2 영상과 함께 표시하는 중, 사용자로부터 계층 변경 입력을 수신하고, 및

상기 계층 변경 입력을 수신하는 것에 대응하여, 상기 제2 계층에 대응하는 객체에 관한 정보를 상기 제1 계층에 대응하는 객체에 관한 정보를 대신하여 표시하고,

상기 계층 변경 입력은 상기 사용자의 음성 입력, 상기 사용자의 제스처 입력, 및 상기 사용자의 상기 제1 계층에 대응하는 객체에 관한 정보와 연관된 터치 입력 중 적어도 하나를 포함하도록 설정된 전자 장치.
제9 항에 있어서,

상기 제1 계층 또는 제2 계층에 대응하는 객체에 관한 정보는,

상기 제1 계층 또는 제2 계층으로 분류된 적어도 하나의 객체 중 사용 빈도가 높은 객체에 관한 정보,

상기 제1 계층 또는 제2 계층으로 분류된 적어도 하나의 객체 중 검색 빈도가 높은 객체에 관한 정보, 및

상기 제1 계층 또는 제2 계층으로 분류된 적어도 하나의 객체에 관한 섬 네일(thumb nail) 정보 중 적어도 하나를 포함하도록 설정된 전자 장치.
전자 장치의 방법에 있어서,

상기 전자 장치의 카메라 모듈을 통하여, 임의의 공간에 배치된 적어도 하나의 객체를 포함하는 제1 영상을 획득하는 동작;

상기 획득된 제1 영상을 기반으로, 상기 적어도 하나의 객체에 관한 정보를 상기 임의의 공간에 대응하여 저장하는 동작;

상기 카메라 모듈을 통하여, 상기 임의의 공간의 적어도 일부를 포함하는 제2 영상을 획득하는 동작; 및

상기 획득된 제2 영상을 기반으로,

상기 제2 영상에 포함된 객체 중 상기 제1 영상의 상기 적어도 하나의 객체에 포함된 제1 객체의 경우, 상기 디스플레이를 통하여, 상기 제1 객체에 관한 정보를 상기 제2 영상과 함께 표시하는 동작; 및

상기 제2 영상에 포함된 객체 중 상기 제1 영상의 상기 적어도 하나의 객체에 포함되어 있지 않은 제2 객체의 경우, 상기 제2 객체에 관한 정보를 상기 임의의 공간에 대응하여 저장하는 동작 중 적어도 하나의 동작을 수행하는 동작을 포함하는 전자 장치의 방법.
제11 항에 있어서,

상기 적어도 하나의 객체에 관한 정보는 상기 전자 장치의 사용자로부터 수신된 음성 입력에 기반하여 획득한 정보를 포함하는 전자 장치의 방법.
제11 항에 있어서,

상기 적어도 하나의 객체에 관한 정보는,

상기 적어도 하나의 객체가 배치된 공간 정보, 상기 적어도 하나의 객체의 위치 정보, 카테고리 정보, 계층 정보, 색상 정보 및 상기 적어도 하나의 객체와 관련된 사용자의 입력 정보 중 적어도 하나를 포함하는 전자 장치의 방법.
제11 항에 있어서,

상기 획득된 제2 영상을 기반으로,

상기 제1 영상의 상기 적어도 하나의 객체 중 상기 제2 영상에 포함되지 않은 제3 객체의 경우, 상기 임의의 공간에 대응하여 기 저장된 상기 제3 객체에 관한 정보를 삭제하는 동작을 포함하는 전자 장치의 방법.
제14 항에 있어서,

상기 제2 객체에 관한 정보를 상기 임의의 공간에 대응하여 저장하는 동작, 또는 상기 제3 객체에 관한 정보를 상기 임의의 공간에 대응하여 삭제하는 동작을 수행하는 경우, 사용자로부터 허용 여부를 확인하는 동작; 및

상기 사용자로부터 컨펌(confirm)을 수신하는 것에 대응하여, 상기 제2 객체 또는 제3 객체에 관한 정보를 업데이트 하는 동작을 포함하는 전자 장치의 방법.