WO2023219189A1

WO2023219189A1 - 깊이 맵에 기반하여 이미지를 합성하기 위한 전자 장치 및 그 방법

Info

Publication number: WO2023219189A1
Application number: PCT/KR2022/006846
Authority: WO
Inventors: 이건희; 김민재; 임종화; 김찬란
Original assignee: 주식회사 엔씨소프트
Priority date: 2022-05-12
Filing date: 2022-05-12
Publication date: 2023-11-16

Abstract

일 실시예에 따른, 전자 장치(electronic device)는, 인스트럭션들을 저장하기 위한 메모리, 및 상기 메모리와 작동적으로 결합된(operably coupled to) 적어도 하나의 프로세서를 포함할 수 있다. 상기 적어도 하나의 프로세서는, 상기 인스트럭션들이 실행될 때에, 하나 이상의 색상들에 의하여 구분되는 하나 이상의 영역들을 포함하는 제1 이미지를 식별할 수 있다. 상기 적어도 하나의 프로세서는, 상기 식별된 제1 이미지에 기반하여, 상기 제1 이미지에 포함된 상기 하나 이상의 영역들에 기반하는 적어도 하나의 깊이 맵을 획득할 수 있다. 상기 적어도 하나의 프로세서는, 상기 식별된 제1 이미지, 및 상기 적어도 하나의 깊이 맵에 기반하여, 상기 하나 이상의 영역들의 색상들에 의해 지시되는(indicated by) 하나 이상의 피사체들을 포함하는 제2 이미지를 획득할 수 있다.

Description

깊이 맵에 기반하여 이미지를 합성하기 위한 전자 장치 및 그 방법

아래의 설명들은 깊이 맵에 기반하여 이미지를 합성하기 위한 전자 장치 및 그 방법에 관한 것이다.

이미지를 합성하기 위한 전자 장치, 및 그 방법이 개발되고 있다. 전자 장치는, 사용자로부터 이미지의 합성을 위해 요구되는 정보(예, 텍스트, 및/또는 사진)를 수신할 수 있다. 수신된 정보를 이용하여, 전자 장치는 가상의 이미지를 합성할 수 있다.

전자 장치가 합성하는 이미지의 품질을, 사진과 유사한 정도로 증가시키기 위한 방안이 요구될 수 있다.

사용자에 의해 특정된 영역들을 포함하는 일 이미지(an image)로부터, 상기 영역들을 따라 배치된 적어도 하나의 피사체를 포함하는, 사진과 유사한 다른 이미지를 생성하기 위한 방안이 요구될 수 있다.

본 문서에서 이루고자 하는 기술적 과제는 상술한 기술적 과제로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.

일 실시예(an embodiment)에 따른, 전자 장치는, 인스트럭션들을 저장하기 위한 메모리, 및 상기 메모리와 작동적으로 결합된(operably coupled to) 적어도 하나의 프로세서를 포함할 수 있다. 상기 적어도 하나의 프로세서는, 상기 인스트럭션들이 실행될 때에, 하나 이상의 색상들에 의하여 구분되는 하나 이상의 영역들을 포함하는 제1 이미지를 식별할 수 있다. 상기 적어도 하나의 프로세서는, 상기 식별된 제1 이미지에 기반하여, 상기 제1 이미지에 포함된 상기 하나 이상의 영역들에 기반하는 적어도 하나의 깊이 맵을 획득할 수 있다. 상기 적어도 하나의 프로세서는, 상기 식별된 제1 이미지, 및 상기 적어도 하나의 깊이 맵에 기반하여, 상기 하나 이상의 영역들의 색상들에 의해 지시되는(indicated by) 하나 이상의 피사체들을 포함하는 제2 이미지를 획득할 수 있다.

일 실시예에 따른, 전자 장치의 방법은, 하나 이상의 색상들에 의하여 구분되는 하나 이상의 영역들을 포함하는 제1 이미지를 식별하는 동작을 포함할 수 있다. 상기 전자 장치의 방법은, 상기 식별된 제1 이미지에 기반하여, 상기 제1 이미지에 포함된 상기 하나 이상의 영역들에 기반하는 적어도 하나의 깊이 맵을 획득하는 동작을 포함할 수 있다. 상기 전자 장치의 방법은, 상기 식별된 제1 이미지, 및 상기 적어도 하나의 깊이 맵에 기반하여, 상기 하나 이상의 영역들의 색상들에 의해 지시되는 하나 이상의 피사체들을 포함하는 제2 이미지를 획득하는 동작을 포함할 수 있다.

일 실시예에 따른, 전자 장치는, 인스트럭션들을 저장하기 위한 메모리, 및 상기 메모리와 작동적으로 결합된(operably coupled to) 적어도 하나의 프로세서를 포함할 수 있다. 상기 적어도 하나의 프로세서는, 상기 인스트럭션들이 실행될 때에, 하나 이상의 피사체들의 형태, 및 위치를 지시하는 시맨틱 맵을 식별할 수 있다. 상기 적어도 하나의 프로세서는, 상기 시맨틱 맵에 기반하여, 상기 시맨틱 맵에 포함된 복수의 픽셀들의 깊이 값들을 포함하는 복수의 후보 깊이 맵들을 획득할 수 있다. 상기 적어도 하나의 프로세서는, 상기 식별된 깊이 맵, 및 상기 시맨틱 맵에 기반하여, 상기 하나 이상의 피사체들이 배치된, 하나 이상의 이미지들을 획득할 수 있다.

일 실시예에 따른, 전자 장치의 방법은, 하나 이상의 피사체들의 형태, 및 위치를 지시하는 시맨틱 맵을 식별하는 동작을 포함할 수 있다. 상기 전자 장치의 방법은, 상기 시맨틱 맵에 기반하여, 상기 시맨틱 맵에 포함된 복수의 픽셀들의 깊이 값들을 포함하는 복수의 후보 깊이 맵들을 획득하는 동작을 포함할 수 있다. 상기 전자 장치의 방법은, 상기 복수의 후보 깊이 맵들에 기반하여, 상기 시맨틱 맵에 매칭되는 깊이 맵을 식별하는 동작을 포함할 수 있다. 상기 전자 장치의 방법은, 상기 식별된 깊이 맵, 및 상기 시맨틱 맵에 기반하여, 상기 하나 이상의 피사체들이 배치된, 하나 이상의 이미지들을 획득하는 동작을 포함할 수 있다.

일 실시예에 따른, 전자 장치는, 사진과 유사한 품질을 가지는 이미지를 합성할 수 있다.

일 실시예에 따른, 전자 장치는, 사용자에 의해 특정된 영역들을 포함하는 일 이미지로부터, 상기 영역들을 따라 배치된 적어도 하나의 피사체를 포함하는, 사진과 유사한 다른 이미지를 생성할 수 있다.

본 개시에서 얻을 수 있는 효과는 상술한 효과들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.

도 1은, 일 실시예에 따른, 전자 장치가 이미지를 생성하는 동작을 설명하기 위한 예시적인 도면이다.

도 2는, 일 실시예에 따른, 전자 장치의 블록도이다.

도 3은, 일 실시예에 따른, 전자 장치가 이미지로부터 생성하는 깊이 맵을 설명하기 위한 예시적인 도면이다.

도 4는, 일 실시예에 따른, 전자 장치가 생성한 깊이 맵 내에서 깊이 값의 분포를 설명하기 위한 예시적인 도면이다.

도 5는, 일 실시예에 따른, 전자 장치가 사용자로부터 수신된 이미지, 및 상기 이미지로부터 생성된 깊이 맵에 기반하여, 하나 이상의 이미지들을 생성하는 동작을 설명하기 위한 예시적인 도면이다.

도 6은, 일 실시예에 따른, 전자 장치 내에 저장되고, 이미지를 생성하기 위한 복수의 뉴럴 네트워크들을 설명하기 위한 도면이다.

도 7은, 일 실시예에 따른, 전자 장치 내에 저장되고, 이미지를 생성하기 위한, 모델의 구조를 설명하기 위한 블록도이다.

도 8은, 일 실시예에 따른, 전자 장치 내에 저장된 뉴럴 네트워크를 설명하기 위한 도면이다.

도 9는, 일 실시예에 따른, 전자 장치 내에 저장되고, 이미지를 생성하기 위한, 모델을 트레이닝하기 위한 데이터 세트를 생성하는 동작을 설명하기 위한 도면이다.

도 10은, 일 실시예에 따른, 전자 장치의 동작을 설명하기 위한 도면이다.

도 11은, 일 실시예에 따른, 전자 장치의 동작을 설명하기 위한 도면이다.

도 12는, 일 실시예에 따른, 전자 장치의 뉴럴 네트워크를 트레이닝하는 동작을 설명하기 위한 도면이다.

이하, 본 문서의 다양한 실시예들이 첨부된 도면을 참조하여 설명된다.

본 문서의 다양한 실시 예들 및 이에 사용된 용어들은 본 문서에 기재된 기술을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 해당 실시 예의 다양한 변경, 균등물, 및/또는 대체물을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 구성요소에 대해서는 유사한 참조 부호가 사용될 수 있다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함할 수 있다. 본 문서에서, "A 또는 B", "A 및/또는 B 중 적어도 하나", "A, B 또는 C" 또는 "A, B 및/또는 C 중 적어도 하나" 등의 표현은 함께 나열된 항목들의 모든 가능한 조합을 포함할 수 있다. "제 1", "제 2", "첫째" 또는 "둘째" 등의 표현들은 해당 구성요소들을, 순서 또는 중요도에 상관없이 수식할 수 있고, 한 구성요소를 다른 구성요소와 구분하기 위해 사용될 뿐 해당 구성요소들을 한정하지 않는다. 어떤(예: 제1) 구성요소가 다른(예: 제2) 구성요소에 "(기능적으로 또는 통신적으로) 연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 상기 어떤 구성요소가 상기 다른 구성요소에 직접적으로 연결되거나, 다른 구성요소(예: 제3 구성요소)를 통하여 연결될 수 있다.

본 문서에서 사용된 용어 "모듈"은 하드웨어, 소프트웨어 또는 펌웨어로 구성된 유닛을 포함하며, 예를 들면, 로직, 논리 블록, 부품, 또는 회로 등의 용어와 상호 호환적으로 사용될 수 있다. 모듈은, 일체로 구성된 부품 또는 하나 또는 그 이상의 기능을 수행하는 최소 단위 또는 그 일부가 될 수 있다. 예를 들면, 모듈은 ASIC(application-specific integrated circuit)으로 구성될 수 있다.

도 1은, 일 실시예에 따른, 전자 장치(101)가 이미지를 생성하는 동작을 설명하기 위한 예시적인 도면이다. 일 실시예에 따른, 전자 장치(101)는 데스크톱(101-1), 및/또는 랩톱(101-2)과 같은 개인용 컴퓨터(Personal Computer, PC)를 포함할 수 있다. 일 실시예에 따른, 전자 장치(101)는 단말(101-3)과 같이, 스마트폰(smartphone), 스마트패드(smartpad), 및/또는 태블릿 PC(Personal Computer)를 포함할 수 있다. 일 실시예에 따른, 전자 장치(101)의 폼 팩터는, 도 1의 예시들에 제한되지 않으며, 예를 들어, 스마트워치(smartwatch) 및 HMD(Head-Mounted Device)와 같은 스마트액세서리를 포함할 수 있다. 일 실시예에 다른, 전자 장치(101) 내에 포함된 하나 이상의 하드웨어들이, 도 2를 참고하여 설명된다.

일 실시예에 따른, 전자 장치(101)는, 제1 이미지(110)에 기반하여 제2 이미지(120)를 생성할 수 있다. 전자 장치(101)는 사용자로부터 제1 이미지(110)를 획득할 수 있다. 예를 들어, 전자 장치(101)는 사용자에게 제1 이미지(110)를 수신하기 위한 UI(User Interface)를 표시할 수 있다. 상기 UI를 통하여, 전자 장치(101)는 상기 제1 이미지(110)를 획득할 수 있다. 전자 장치(101)에 의하여 수신되는 제1 이미지(110)는, 입력 이미지, 세그먼테이션 맵(segmentation map), 및/또는 시맨틱 맵(semantic map)으로 참조될 수 있다. 전자 장치(101)에 의하여 생성된 제2 이미지(120)는, 출력 이미지, 가상 이미지, 및/또는 가상 사진으로 참조될 수 있다.

도 1은, 일 실시예에 따른, 전자 장치(101)에 의하여 사용자로부터 수신된, 제1 이미지(110)의 일 예를 도시한다. 제1 이미지(110)는, 하나 이상의 색상들에 의하여 구분되는 하나 이상의 영역들(예, 영역들(112, 114, 116, 118))을 포함할 수 있다. 예를 들어, 영역들(112, 114, 116, 118)은 상이한 색상들로 채워질(filled) 수 있다. 예를 들어, 제1 이미지(110)는 색상으로 채워진 하나 이상의 영역들(예, 영역들(112, 114, 116, 118))에 기반하여 제1 이미지(110)로부터 합성될 다른 이미지(예, 제2 이미지(120)) 내 하나 이상의 피사체들을 지시하는 시맨틱 맵을 포함할 수 있다.

일 실시예에서, 시맨틱 맵은, 상기 시맨틱 맵에 대응하는 이미지의 의미론적 정보(semantic information)를 포함할 수 있다. 상기 의미론적 정보는, 상기 이미지 내에 캡쳐된 피사체의 타입, 카테고리, 위치, 및/또는 크기를 나타내는 정보를 포함할 수 있다. 예를 들어, 시맨틱 맵은, 이미지 내 픽셀들 각각에 대응하고, 위치, 및/또는 색상에 기반하여 상기 의미론적 정보를 나타내는, 복수의 픽셀들을 포함할 수 있다. 시맨틱 맵 내에서, 특정 색상을 가지는 픽셀들의 그룹이, 상기 특정 색상에 대응하는 타입의 피사체가, 상기 이미지 내에서 캡쳐된 위치, 및/또는 크기를 나타낼 수 있다. 예를 들어, 영역들(112, 114, 116, 118)은, 상기 특정 색상을 가지는 픽셀들의 상기 그룹의 일 예일 수 있다.

도 1을 참고하면, 시맨틱 맵의 일 예인 제1 이미지(110)는, 영역들(112, 114, 116, 118)의 크기, 및/또는 색상에 기반하여, 상기 제1 이미지(110)로부터 합성될 다른 이미지 내에 포함될 하나 이상의 피사체들의 크기, 및/또는 카테고리를 나타낼 수 있다. 예를 들어, 영역(112)은, 저지대(lowland)를 나타내는 제1 색상(예, 녹색)으로 채워질 수 있다. 예를 들어, 영역(114)은, 산을 나타내는 제2 색상(예, 갈색)으로 채워질 수 있다. 예를 들어, 영역(116)은, 하늘을 나타내는 제3 색상(예, 청색)으로 채워질 수 있다. 예를 들어, 영역(118)은, 구름을 나타내는 제4 색상(예, 흰색)으로 채워질 수 있다. 상기 제1 색상 내지 상기 제4 색상은, RGB, CMYK, 및/또는 YCbCr과 같은 색 공간에 기반하는 일 차원 벡터에 의하여 지시될(indicated by) 수 있다. 영역들(112, 114, 116, 118)이 상이한 색상들(예, 상기 제1 색상 내지 상기 제4 색상)로 구분되기 때문에, 영역들(112, 114, 116, 118)을 포함하는 제1 이미지(110)는, 상기 제1 색상 내지 상기 제4 색상을 제외한 다른 색상을 포함하지 않을 수 있다.

일 실시예에 따른, 전자 장치(101)는 제1 이미지(110)로부터, 제2 이미지(120)의 생성을 위한 정보를 획득할 수 있다. 상기 정보는, 제1 이미지(110)의 영역들(112, 114, 116, 118)에 기반하여 배치될 하나 이상의 피사체들로 원근감(perpective)을 제공하기 위한 정보일 수 있다. 상기 정보는, 깊이 맵으로 참조될 수 있다. 깊이 맵은, 시맨틱 맵(예, 제1 이미지(110)) 내 픽셀들 각각에 대응하고, 시맨틱 맵 내 픽셀들 각각의 원근감을 나타내는 수치 값들(numeric values)을 가지는, 복수의 픽셀들을 포함할 수 있다. 상기 수치 값들은, 깊이 값들(depth values)로 참조될 수 있다. 일 실시예에 따른, 전자 장치(101)가 제1 이미지(110)로부터 획득하는 깊이 맵은, 도 3 내지 도 4를 참고하여 설명된다.

일 실시예에 따른, 전자 장치(101)가 제1 이미지(110)에 기반하여 획득하는 제2 이미지(120)는, 상기 제1 이미지(110)의 영역들(112, 114, 116, 118)에 기반하여 배치되는 하나 이상의 피사체들을 포함할 수 있다. 도 1을 참고하면, 전자 장치(101)는 제1 이미지(110)의 영역(112)에 대응하는 제2 이미지(120)의 일부분 내에 저지대를, 제1 이미지(110)의 영역(114)에 대응하는 제2 이미지(120)의 일부분 내에 하나 이상의 산들을, 제1 이미지(110)의 영역(116)에 대응하는 제2 이미지(120)의 일부분 내에 하늘을, 제1 이미지(110)의 영역(118)에 대응하는 제2 이미지(120)의 일부분 내에 구름을 표시할 수 있다. 일 실시예에 따른, 전자 장치(101)는 제1 이미지(110)로부터 획득된 깊이 맵에 기반하여, 제2 이미지(120) 내에 포함된 하나 이상의 피사체들의 원근감을 조절할 수 있다. 예를 들어, 전자 장치(101)는, 제1 이미지(110)의 영역(114)에 대응하는 제2 이미지(120)의 일부분 내에 배치된 하나 이상의 산들이 상기 깊이 맵에 기반하는 원근감을 갖도록, 제2 이미지(120)를 생성할 수 있다. 예를 들어, 전자 장치(101)는 제1 이미지(110)의 영역(112)에 대응하는 제2 이미지(120)의 일부분 내에 배치된 저지대가 상기 깊이 맵에 기반하는 원근감을 갖도록, 제2 이미지(120)를 생성할 수 있다. 일 실시예에 따른, 전자 장치(101)가 제1 이미지(110), 및 상기 깊이 맵에 기반하여, 제2 이미지(120)를 생성하는 동작이, 도 5 내지 도 6을 참고하여 설명된다.

상술한 바와 같이, 일 실시예에 따른, 전자 장치(101)는 제1 이미지(110)에 의하여 표현되지 않은 정보(예, 제2 색상으로 채워진 영역(114) 내에 배치될 산의 지형(terrain)(예, 능선(ridge)), 또는 제1 색상으로 채워진 영역(112) 내에 배치될 저지대의 원근감)를 추론할 수 있다. 추론된 정보에 기반하여, 전자 장치(101)는 상기 제1 이미지(110)로부터 현실적인(realistic) 제2 이미지(120)를 생성할 수 있다. 이하에서는, 도 2를 참고하여, 제1 이미지(110)로부터 제2 이미지(120)를 생성하기 위하여 도 1의 전자 장치(101) 내에 포함된, 하나 이상의 하드웨어들이 설명된다.

도 2는, 일 실시예에 따른, 전자 장치(101)의 블록도이다. 도 2의 전자 장치(101)는, 도 1의 전자 장치(101)의 일 예일 수 있다. 도 2를 참고하면, 일 실시예에 따른, 전자 장치(101)는, 프로세서(220), 메모리(230), 디스플레이(240), 또는 통신 회로(250) 중 적어도 하나를 포함할 수 있다. 프로세서(220), 메모리(230), 디스플레이(240), 및 통신 회로(250)는 통신 버스(a communication bus)(210)와 같은 전자 소자(electronical component)에 의해 서로 전기적으로 및/또는 작동적으로 연결될 수 있다(electronically and/or operably coupled with each other). 상이한 블록들에 기반하여 도시되었으나, 실시예가 이에 제한되는 것은 아니며, 도 2에 도시된 하드웨어 컴포넌트 중 일부분(예, 프로세서(220), 메모리(230) 및 통신 회로(250)의 적어도 일부분)이 SoC(System on a Chip)와 같이 단일 집적 회로(Single Integrated Circuit)에 포함될 수 있다. 전자 장치(101)에 포함된 하드웨어 컴포넌트의 타입 및/또는 개수는 도 2에 도시된 바에 제한되지 않는다. 예를 들어, 전자 장치(101)는 도 2에 도시된 하드웨어 컴포넌트 중 일부만 포함할 수 있다.

일 실시예에 따른, 전자 장치(101)의 프로세서(220)는 하나 이상의 인스트럭션들에 기반하여 데이터를 처리하기 위한 하드웨어 컴포넌트를 포함할 수 있다. 데이터를 처리하기 위한 하드웨어 컴포넌트는, 예를 들어, ALU(Arithmetic and Logic Unit), FPU(Floating Point Unit), FPGA(Field Programmable Gate Array), CPU(Central Processing Unit), 및/또는 AP(Application Processor)를 포함할 수 있다. 프로세서(220)의 개수는 하나 이상일 수 있다. 예를 들어, 프로세서(220)는 듀얼 코어(dual core), 쿼드 코어(quad core) 또는 헥사 코어(hexa core)와 같은 멀티-코어 프로세서의 구조를 가질 수 있다.

일 실시예에 따른, 전자 장치(101)의 메모리(230)는 프로세서(220)에 입력 및/또는 출력되는 데이터 및/또는 인스트럭션을 저장하기 위한 하드웨어 컴포넌트를 포함할 수 있다. 메모리(230)는, 예를 들어, RAM(Random-Access Memory)와 같은 휘발성 메모리(Volatile Memory) 및/또는 ROM(Read-Only Memory)와 같은 비휘발성 메모리(Non-Volatile Memory)를 포함할 수 있다. 휘발성 메모리는, 예를 들어, DRAM(Dynamic RAM), SRAM(Static RAM), Cache RAM, PSRAM (Pseudo SRAM) 중 적어도 하나를 포함할 수 있다. 비휘발성 메모리는, 예를 들어, PROM(Programmable ROM), EPROM (Erasable PROM), EEPROM (Electrically Erasable PROM), 플래시 메모리, 하드디스크, 컴팩트 디스크, eMMC(Embedded Multi Media Card) 중 적어도 하나를 포함할 수 있다.

예를 들어, 메모리(230) 내에서, 프로세서(220)가 데이터에 수행할 연산, 및/또는 동작을 나타내는 하나 이상의 인스트럭션들이 저장될 수 있다. 하나 이상의 인스트럭션들의 집합은, 펌웨어, 운영 체제, 프로세스, 루틴, 서브-루틴 및/또는 어플리케이션으로 참조될 수 있다. 예를 들어, 전자 장치(101), 및/또는 프로세서(220)는, 운영체제, 펌웨어, 드라이버, 및/또는 어플리케이션 형태로 배포된 복수의 인스트럭션의 집합(set of a plurality of instructions)이 실행될 시에, 도 10 내지 도 12의 동작들 중 적어도 하나를 수행할 수 있다. 이하에서, 어플리케이션이 전자 장치(101)에 설치되었다는 것은, 어플리케이션의 형태로 제공된 하나 이상의 인스트럭션들이 전자 장치(101)의 메모리(230) 내에 저장된 것을 의미할 수 있다. 어플리케이션이 전자 장치(101)에 설치되었다는 것은, 상기 하나 이상의 어플리케이션들이 전자 장치(101)의 프로세서(220)에 의해 실행 가능한(executable) 포맷(예, 전자 장치(101)의 운영 체제에 의해 지정된 확장자를 가지는 파일)으로 저장된 것을 의미할 수 있다.

일 실시예에 따른, 전자 장치(101)의 디스플레이(240)는 사용자에게 시각화된 정보(예를 들어, 도 1의 제1 이미지(110), 및/또는 제2 이미지(120))를 출력할 수 있다. 예를 들어, 디스플레이(240)는, GPU(Graphic Processing Unit)와 같은 컨트롤러에 의해 제어되어, 사용자에게 시각화된 정보(visualized information)를 출력할 수 있다. 디스플레이(240)는 FPD(Flat Panel Display) 및/또는 전자 종이(electronic paper)를 포함할 수 있다. 상기 FPD는 LCD(Liquid Crystal Display), PDP(Plasma Display Panel) 및/또는 하나 이상의 LED(Light Emitting Diode)를 포함할 수 있다. 상기 LED는 OLED(Organic LED)를 포함할 수 있다.

일 실시예에 따른, 전자 장치(101)의 통신 회로(250)는, 전자 장치(101) 및 외부 전자 장치 사이의 전기 신호의 송신 및/또는 수신을 지원하기 위한 하드웨어 컴포넌트를 포함할 수 있다. 통신 회로(250)는, 예를 들어, 모뎀(MODEM), 안테나, O/E(Optic/Electronic) 변환기 중 적어도 하나를 포함할 수 있다. 통신 회로(280)는, 이더넷(ethernet), LAN(Local Area Network), WAN(Wide Area Network), WiFi(Wireless Fidelity), Bluetooth, BLE(Bluetooth Low Energy), ZigBee, LTE(Long Term Evolution), 5G NR(New Radio)와 같은 다양한 타입의 프로토콜에 기반하여 전기 신호의 송신 및/또는 수신을 지원할 수 있다. 통신 회로(250)를 이용하여, 전자 장치(101)는 외부 전자 장치로부터 도 1의 제1 이미지(110)를 수신하거나, 또는 외부 전자 장치로 도 1의 제2 이미지(120)를 송신할 수 있다.

상술한 바와 같이, 일 실시예에 따른, 전자 장치(101)는 이미지의 수신, 합성, 및/또는 표시를 위한 하나 이상의 하드웨어들을 포함할 수 있다. 전자 장치(101)는 상기 하나 이상의 하드웨어들에 기반하여 실행되는 소프트웨어를 이용하여, 상기 이미지의 합성을 수행할 수 있다. 상기 이미지의 합성을 위하여, 전자 장치(101)는 뉴럴 네트워크(neural network)와 같은 인공 지능에 기반하는 소프트웨어를 실행할 수 있다. 전자 장치(101)가 실행하는 상기 인공 지능에 기반하는 상기 소프트웨어의 개념적인 구조(conceptual structure)가, 도 6 내지 도 8을 참고하여 설명된다.

이하에서는, 도 3을 참고하여, 도 2의 전자 장치(101)가 도 1의 제1 이미지(110)와 같은 시맨틱 맵으로부터 깊이 맵을 획득하는 동작이 설명된다.

도 3은, 일 실시예에 따른, 전자 장치가 이미지(예, 제1 이미지(110))로부터 생성하는 깊이 맵(예, 깊이 맵들(310, 320, 330))을 설명하기 위한 예시적인 도면이다. 도 3의 전자 장치는 도 1 내지 도 2의 전자 장치(101)의 일 예일 수 있다. 예를 들어, 도 3의 제1 이미지(110)는 도 1의 제1 이미지(110)를 포함할 수 있다.

도 3을 참고하면, 일 실시예에 따른, 전자 장치에 의하여 사용자로부터 수신된, 제1 이미지(110)의 일 예가 도시된다. 도 1을 참고하여 상술된 바와 같이, 제1 이미지(110) 내 상이한 색상들로 구분된 하나 이상의 영역들(예, 영역들(112, 114, 116, 118))을 이용하여, 전자 장치는 제1 이미지(110)에 기반하여 합성될 다른 이미지(예, 도 1의 제2 이미지(120)) 내에 포함될 하나 이상의 피사체들을 식별할 수 있다. 전자 장치는 제1 이미지(110)의 일 영역 내에서, 상이한 깊이 값들의 분포를 가지는, 하나 이상의 깊이 맵들(예, 깊이 맵들(310, 320, 330))을 획득할 수 있다. 상기 하나 이상의 깊이 맵들은, 전자 장치가 제1 이미지(110)로부터 상기 다른 이미지를 합성하는 동안, 상기 다른 이미지로 원근감을 제공하기 위해 이용될 수 있다.

도 3을 참고하면, 일 실시예에 따른, 전자 장치는 제1 이미지(110)로부터, 사용자에 의해 선택 가능한 복수의 깊이 맵들(310, 320, 330)을 획득할 수 있다. 전자 장치는 시맨틱 맵인 제1 이미지(110)의 픽셀들 각각으로 깊이 값들을 할당하여(by assigning), 깊이 맵들(310, 320, 330)을 획득할 수 있다. 전자 장치가 제1 이미지(110)로부터 3 개의 깊이 맵들(310, 320, 330)을 획득하는 일 실시예가 도시되지만, 실시예가 이에 제한되는 것은 아니다. 일 실시예에 따른, 전자 장치가 제1 이미지(110)로부터 획득하는 깊이 맵의 개수는 1 이상일 수 있다. 일 실시예에 따른, 전자 장치가 제1 이미지(110)로부터 깊이 맵을 획득하기 위하여 실행하는 뉴럴 네트워크의 예시적인 구조가, 도 7 내지 도 8을 참고하여 설명된다. 일 실시예에 따른, 전자 장치는, 제1 이미지(110)와 관련된 사용자의 의도를 식별하기 위하여, 복수의 깊이 맵들(310, 320, 330)에 기반하는 선택 가능한 옵션들을, 상기 사용자에게 제공할 수 있다.

예를 들어, 전자 장치는 디스플레이(예, 도 2의 디스플레이(240)) 내에, 깊이 맵들(310, 320, 330) 중 적어도 하나를 표시할 수 있다. 전자 장치는, 깊이 맵들(310, 320, 330) 중 하나의 깊이 맵을 선택하기 위한 하나 이상의 시각적 객체들(예, 라디오 버튼)을 표시할 수 있다. 전자 장치는 상기 하나 이상의 시각적 객체들에 대한 입력에 기반하여, 깊이 맵들(310, 320, 330) 중 하나의 깊이 맵을 선택할 수 있다. 선택된 깊이 맵, 및 제1 이미지(110)를 이용하여, 전자 장치는 가상 현실에 기반하는 제2 이미지(예, 도 1의 제2 이미지(120))를 합성할 수 있다. 상기 예시 내에서, 전자 장치는 사용자에 의해 선택된 상기 깊이 맵에 기반하여, 사용자의 의도를 반영하는 상기 제2 이미지를 합성할 수 있다.

예를 들어, 전자 장치로부터 사용자로 제공되고, 복수의 깊이 맵들(310, 320, 330)에 기반하는 선택 가능한 옵션들은, 복수의 깊이 맵들(310, 320, 330) 중 적어도 하나를 편집 가능한 옵션을 포함할 수 있다. 전자 장치는, 깊이 맵들(310, 320, 330) 중 적어도 하나를 편집 가능한 UI, 및/또는 화면을 표시할 수 있다. 전자 장치는 상기 UI 내에서, 적어도 하나의 깊이 맵의 픽셀들에 할당된 깊이 값들을, 상이한 색상들에 기반하여 표시할 수 있다. 일 실시예에 따른, 전자 장치는 상기 UI 내에서 상기 색상들을 조절하는 입력에 기반하여, 적어도 하나의 깊이 맵을 변경할 수 있다.

상술한 바와 같이, 일 실시예에 따른, 전자 장치는 제1 이미지(110)에 기반하여, 제1 이미지(110)에 포함된 하나 이상의 영역들(예, 영역들(112, 114, 116, 118))에 기반하는 적어도 하나의 깊이 맵(예, 깊이 맵들(310, 320, 330))을 획득할 수 있다. 상기 적어도 하나의 깊이 맵은, 상기 제1 이미지(110)로부터 합성될 제2 이미지의 원근감을 나타낼 수 있다. 전자 장치가 복수의 깊이 맵들을 획득하는 일 실시예 내에서, 상기 전자 장치는 상기 복수의 깊이 맵들을 선택, 및/또는 변경 가능한 옵션을, 사용자에게 제공할 수 있다.

이하에서는, 도 4를 참고하여, 전자 장치가 제1 이미지(110)로부터 획득한 깊이 맵에 포함된 깊이 값들의 분포가 설명된다.

도 4는, 일 실시예에 따른, 전자 장치가 생성한 깊이 맵 내에서 깊이 값의 분포를 설명하기 위한 예시적인 도면이다. 도 4의 전자 장치는 도 1 내지 도 2의 전자 장치(101)의 일 예일 수 있다. 도 4의 깊이 맵들(310, 320)은 도 3의 깊이 맵들(310, 320)에 대응할 수 있다.

도 4를 참고하면, 일 실시예에 따른, 전자 장치가 도 1의 제1 이미지(110)로부터 획득한 깊이 맵들(310, 320) 내 깊이 값들의 분포를 설명하기 위한 그래프들(410, 420)이 도시된다. 깊이 맵들(310, 320)은, 도 3을 참고하여 상술된 전자 장치의 동작에 기반하여 획득될 수 있다. 도 4를 참고하면, 도트들의 밀도에 기반하여 깊이 맵들(310, 320)의 깊이 값들의 분포가 도시된다. 도트들의 밀도는, 깊이 값에 반비례할 수 있다. 예를 들어, 도트들의 밀도가 증가될 수록, 길이 값은 감소될 수 있다.

도 4를 참고하면, 깊이 맵들(310, 320)에서 일치된 좌표를 가지는, A 지점, 및 B 지점이 도시된다. 그래프들(410, 420) 각각은, 깊이 맵들(310, 320)의 A 지점, 및 B 지점을 연결하는 라인 상에 포함된 픽셀들에 할당된 깊이 값들의 분포를 나타낼 수 있다. 그래프들(410, 420)의 X 축은, A 지점으로부터의 거리를 나타낼 수 있다. 그래프들(410, 420)의 Y 축은, 깊이 값의 크기를 상대적으로 나타낼 수 있다. 예를 들어, 깊이 값의 크기는, 상기 제1 이미지(110)로부터 합성될 제2 이미지(예, 도 1의 제2 이미지(120)) 내 피사체, 및 상기 제2 이미지가 캡쳐된 가상의 위치 사이의 거리를 나타낼 수 있다.

도 4를 참고하면, A 지점, 및 B 지점을 연결하는 라인(이하, A-B 라인)은, 제1 이미지(110)의 영역(114) 내에 포함될 수 있다. 예를 들어, 상기 라인에 대응하는 제1 이미지(110) 내 픽셀들은, 제2 색상(예, 갈색)일 수 있다. 일 실시예에 따른, 전자 장치는 제1 이미지(110)의 영역들(112, 114, 116, 118) 각각에 할당된 색상들에 의해 지시되는, 영역들(112, 114, 116, 118) 각각의 피사체들의 타입에 기반하여, 깊이 맵들(310, 320) 각각에 포함된 깊이 값들을 조절할 수 있다. 예를 들어, 산을 나타내는 상기 제2 색상으로 채워진 제1 이미지(110)의 영역(114)에 대응하는 깊이 맵들(310, 320)의 부분 내에서, 상기 산의 지형(terrain), 및/또는 능선을 표현하기 위하여, 전자 장치는 깊이 값들의 분포를 조절할 수 있다.

도 4의 일 예를 참고하면, 일 실시예에 따른, 전자 장치는 제1 이미지(110)의 영역(114) 내에 포함된, 깊이 맵(310)의 A-B 라인 사이의 깊이 값들을 조절하여, 산의 능선을 표현할 수 있다. 예를 들어, 깊이 맵(310)의 A-B 라인 내 C 지점, 및 D 지점 각각에서, 전자 장치는 깊이 값들의 불연속에 기반하여, 산의 능선을 나타낼 수 있다. 전자 장치는 깊이 맵(310)의 A 지점 내지 C 지점 사이의 깊이 값들을, 연속적인 값들로 할당하여, 단일 산을 나타낼 수 있다. 전자 장치는 깊이 맵(310)의 D 지점 내지 B 지점 사이의 깊이 값들을, A 지점 내지 D 지점 사이의 깊이 값들 보다 작게 할당할 수 있다.

도 4를 참고하면, 일 실시예에 따른, 전자 장치는 깊이 맵(310)과 상이한 깊이 맵(320)을 이용하여, 제1 이미지(110)의 원근감을, 깊이 맵(310)에 기반하는 원근감과 다르게 제공할 수 있다. 예를 들어, 그래프(420)를 참고하면, 깊이 맵(320)의 A-B 라인 사이의 깊이 값들의 분포는, 그래프(410)에 의하여 나타나는 깊이 맵(310)의 A-B 라인 사이의 깊이 값들의 분포와 다를 수 있다. 상기 예시 내에서, 깊이 맵(320)의 A 지점 내지 E 지점 사이의 깊이 값들이, E 지점 내지 B 지점 사이의 깊이 값들 보다 작게 할당될 수 있다. 전자 장치가 깊이 맵(320), 및 제1 이미지(110)에 기반하여 제2 이미지를 합성하는 경우, A 지점 내지 E 지점을 포함하는 산이, 상기 제2 이미지 내에서, F 지점 내지 B 지점을 포함하는 다른 산 보다 가깝게 표시될 수 있다.

상술한 바와 같이, 일 실시예에 따른, 전자 장치는 하나의 시맨틱 맵(예, 제1 이미지(110))로부터 하나 이상의 깊이 맵들(예, 도 3의 깊이 맵들(310, 320, 330))을 획득할 수 있다. 상기 하나 이상의 깊이 맵들은, 상이한 깊이 값들의 분포를 가질 수 있다. 전자 장치가 복수의 깊이 맵들을, 하나의 시맨틱 맵으로부터 획득하는 일 실시예에서, 상기 전자 장치는 상기 복수의 깊이 맵들을, 이미지를 합성하기 위한 후보 깊이 맵으로써(as a candidate depth map) 사용자에게 제공할 수 있다. 깊이 맵에 기반하여, 전자 장치는 시맨틱 맵, 및 깊이 맵 중 시맨틱 맵을 이용하여 합성된 이미지 보다 개선된 원근감을 가지는 이미지(an image)를 합성할 수 있다. 전자 장치는 시맨틱 맵, 및 깊이 맵을 동시에 이용하여, 시맨틱 맵, 및 깊이 맵 중 깊이 맵을 이용하여 합성된 이미지 보다 사용자에 의도에 부합하는 피사체를 가지는 이미지(an image)를 합성할 수 있다. 깊이 맵의 상이한 세그먼트들은, 전자 장치에 의해 합성되는 이미지(예, 출력 이미지)의 상이한 세그먼트들에 일대일로 매핑되기 때문에, 전자 장치는 사용자의 직관적인 깊이 맵의 편집, 및 편집된 깊이 맵에 기반하는 이미지의 합성을 지원할 수 있다.

이하에서는, 도 5를 참고하여, 일 실시예에 따른, 전자 장치가 제1 이미지(110)로부터, 도 1의 제2 이미지(120)와 같이 하나 이상의 이미지들을 합성하는 동작이 설명된다.

도 5는, 일 실시예에 따른, 전자 장치가 사용자로부터 수신된 이미지, 및 상기 이미지로부터 생성된 깊이 맵에 기반하여, 하나 이상의 이미지들을 생성하는 동작을 설명하기 위한 예시적인 도면이다. 도 5의 전자 장치는 도 1 내지 도 2의 전자 장치(101)의 일 예일 수 있다. 도 5의 깊이 맵(310)은, 도 3 내지 도 4의 깊이 맵(310)에 대응할 수 있다. 도 5의 제1 이미지(110)는, 도 1 및/또는 도 3 내지 도 4의 제1 이미지(110)에 대응할 수 있다.

일 실시예에 따른, 전자 장치는, 입력 이미지인 제1 이미지(110), 및 상기 제1 이미지(110)에 대응하는 하나의(single) 깊이 맵(예, 도 3 내지 도 6의 깊이 맵(310))으로부터, 하나 이상의 출력 이미지들을 획득할 수 있다. 이하에서는, 전자 장치가 사용자로부터 제1 이미지(110)에 대응하는 복수의 깊이 맵들(예, 도 3의 깊이 맵들(310, 320, 330)) 중 깊이 맵(310)을 선택하는 입력에 응답하여, 하나 이상의 출력 이미지들을 획득하는 동작이 설명된다. 그러나, 실시예가 이에 제한되지 않는다. 예를 들어, 전자 장치는 사용자로부터 수신된 복수의 깊이 맵들에 기반하여, 상기 복수의 깊이 맵들 각각에 대응하는 하나 이상의 출력 이미지들을 획득할 수 있다.

도 5는, 일 실시예에 따른, 전자 장치가 깊이 맵(310)으로부터 획득하는 상기 하나 이상의 출력 이미지들의 일 예로, 제1 출력 이미지(510), 및 제2 출력 이미지(520)를 도시한다. 일 실시예에 따른, 전자 장치는 상기 하나 이상의 출력 이미지들 내에서, 제1 이미지(110)에 의해 나타나는 하나 이상의 피사체들을, 깊이 맵(310)에 기반하는 원근감에 기반하여, 표시할 수 있다. 전자 장치가 제1 출력 이미지(510), 및 제2 출력 이미지(520)를 합성하는 일 실시예에서, 저지대가 제1 이미지(110)의 영역(112)에 대응하는 제1 출력 이미지(510), 및 제2 출력 이미지(520)의 각 부분들에 배치되고, 하나 이상의 산들이 제1 이미지(110)의 영역(114)에 대응하는 제1 출력 이미지(510), 및 제2 출력 이미지(520)의 각 부분들에 배치되고, 하늘이 제1 이미지(110)의 영역(116)에 대응하는 제1 출력 이미지(510), 및 제2 출력 이미지(520)의 각 부분들에 배치되고, 구름이 제1 이미지(110)의 영역(118)에 대응하는 제1 출력 이미지(510), 및 제2 출력 이미지(520)의 각 부분들에 배치될 수 있다.

도 5를 참고하면, 일 실시예에 따른, 전자 장치는 제1 출력 이미지(510), 및 제2 출력 이미지(520)를, 상이한 스타일들에 기반하여 생성할 수 있다. 스타일은, 제1 이미지(110)에 의하여 지시되는 타입 내에 포함된 피사체의 상이한 조합에 따라, 출력 이미지에 따라 다르게 조절될 수 있다. 예를 들어, 상기 스타일은, 출력 이미지의 분위기(mood), 및/또는 화풍에 기반하여 구분될 수 있다. 도 5를 참고하면, 제1 이미지(110)의 영역(116)에 대응하는 제1 출력 이미지(510)의 부분, 및 제2 출력 이미지(520)의 부분 각각은, 하늘과 같은 일 타입 내에서 상이한 피사체들(예, 낮 하늘, 및 밤 하늘)을 포함할 수 있다. 도 5를 참고하면, 제1 이미지(110)의 영역(112)에 대응하는 제1 출력 이미지(510)의 부분, 및 제2 출력 이미지(520)의 부분 각각은, 저지대와 같은 일 타입 내에서 상이한 피사체들을 포함할 수 있다. 예를 들어, 제1 이미지(110)의 영역(112)에 대응하는 제1 출력 이미지(510)의 부분은, 호수를 포함하지 않는 저지대를 나타낼 수 있다. 예를 들어, 제1 이미지(110)의 영역(112)에 대응하는 및 제2 출력 이미지(520)의 부분은, 호수, 및 나무를 포함하는 다른 저지대를 나타낼 수 있다. 예를 들어, 제1 이미지(110)의 영역(114)에 대응하는 제1 출력 이미지(510)의 부분은, 나무로 채워진 복수의 산들을 포함할 수 있다. 예를 들어, 제1 이미지(110)의 영역(114)에 대응하는 제2 출력 이미지(520)의 부분은, 눈이 덮인 바위 산들을 포함할 수 있다.

일 실시예에 따른, 전자 장치는 깊이 맵(310)에 기반하여, 제1 이미지(110)의 영역들(112, 114, 116, 118) 각각에 대응하는 제1 출력 이미지(510), 및 제2 출력 이미지(520)의 상이한 부분들 내에서, 및/또는 상기 부분들 사이의 경계에서, 원근감을 추가할 수 있다. 도 5를 참고하면, 제1 이미지(110)의 저지대를 나타내는 색상으로 채워진 영역(112)에 대응하는 제1 출력 이미지(510)의 부분 내에서, 저지대를 나타내는 피사체들(예, 풀들)이, 깊이 맵(310) 내에서 제1 이미지(110)의 영역(112)에 대응하는 부분의 깊이 값들을 따라 상이한 크기, 상이한 형태, 및/또는 상이한 색상을 따라 표시될 수 있다. 도 5를 참고하면, 제1 이미지(110)의 하나 이상의 산들을 나타내는 색상으로 채워진 영역(114)에 대응하는 제1 출력 이미지(510)의 부분 내에서, 복수의 산들이, 깊이 맵(310) 내에서 제1 이미지(110)의 영역(114)에 대응하는 부분의 깊이 값들에 기반하는 하나 이상의 능선들을 가질 수 있다. 제1 이미지(110)의 영역(114)에 대응하는 제1 출력 이미지(510)의 부분, 및 제2 출력 이미지(520)의 부분 내에서, 일 실시예에 따른, 전자 장치는 깊이 맵(310)의 깊이 값들에 의해 지시되는 능선들에 기반하여, 복수의 산들을 표시할 수 있다.

일 실시예에 따른, 전자 장치는 제1 출력 이미지(510), 및 제2 출력 이미지(520)를, 사용자에게 표시할 수 있다. 예를 들어, 전자 장치는 디스플레이(예, 도 2의 디스플레이(240)) 내에, 시맨틱 맵인 제1 이미지(110)로부터 출력 이미지를 합성한 결과인, 제1 출력 이미지(510), 또는 제2 출력 이미지(520) 중 적어도 하나를 표시할 수 있다. 예를 들어, 전자 장치는 통신 회로(예, 도 2의 통신 회로(250))를 이용하여 외부 전자 장치로, 제1 출력 이미지(510), 또는 제2 출력 이미지(520) 중 적어도 하나를 송신할 수 있다. 제1 출력 이미지(510), 또는 제2 출력 이미지(520) 중 적어도 하나는, JPEG(Joint Photographic Experts Group)와 같이 이미지를 나타내기 위한 포맷에 기반하여, 전자 장치의 메모리(예, 도 2의 메모리(230)) 내에 저장될 수 있다.

일 실시예에 따른, 전자 장치는 제1 출력 이미지(510), 또는 제2 출력 이미지(520) 중 적어도 하나를, 깊이 맵(310)에 기반하여, 입체적으로 표시할 수 있다. 전자 장치는 HMD(Head-Mounted Device)와 같이, 사용자의 눈들 각각으로, 양안 시차(binocular disparity)를 가지는 이미지(예, 제1 출력 이미지(510), 또는 제2 출력 이미지(520) 중 하나의 출력 이미지)를 표시할 수 있다. 상기 양안 시차는, 전자 장치가 제1 출력 이미지(510), 또는 제2 출력 이미지(520) 중 하나의 출력 이미지를 표시하는 일 실시예에서, 깊이 맵(310)에 기반하여 상기 사용자에게 제공될 수 있다. 예를 들어, 시맨틱 맵인 제1 이미지(110)로부터 획득된 깊이 맵(310)이, 제1 출력 이미지(510), 또는 제2 출력 이미지(520) 중 적어도 하나와 함께, 전자 장치 내에 저장될 수 있다.

상술한 바와 같이, 일 실시예에 따른, 전자 장치는 사용자로부터 수신되고, 단색(solid color)의 영역들(112, 114, 116, 118)을 가지는 제1 이미지(110)로부터, 상기 영역들(112, 114, 116, 118) 각각의 색상에 의해 지시되는 하나 이상의 피사체들을 포함하고, 제1 이미지(110)로부터 획득된 적어도 하나의 깊이 맵(예, 깊이 맵(310))에 의해 지시되는 원근감을 가지는 하나 이상의 출력 이미지들(예, 제1 출력 이미지(510), 및 제2 출력 이미지(520))을 획득할 수 있다. 전자 장치가 깊이 맵(310)과 독립적으로 제1 이미지(110)로부터 다른 이미지(예, 이미지(530))를 합성하는 경우, 제1 이미지(110)의 영역들(112, 114, 116, 118) 각각에 배치된 하나 이상의 피사체들에 원근감을 추가하는 것이 제한될 수 있다. 예를 들어, 제1 이미지(110)의 영역(112)에 대응하는 제1 출력 이미지(510)의 부분의 풀들이, 깊이 맵(310)에 기반하는 상이한 크기들을 가지는 반면에, 영역(112)에 대응하는 이미지(530)의 부분의 풀들은, 일치된 크기를 가질 수 있다. 일 실시예에 따른, 전자 장치는 사용자로부터 수신된 입력 이미지(예, 제1 이미지(110))에 대응하는 적어도 하나의 깊이 맵을 추가적으로 획득하여, 획득된 적어도 하나의 깊이 맵에 따른 원근감을 가지는 하나 이상의 출력 이미지들을 획득할 수 있다. 상기 원근감을 가지는 하나 이상의 출력 이미지들에 기반하여, 전자 장치는 보다 현실적인 이미지(예, 풍경 이미지(landscape image))의 합성을 지원할 수 있다.

이하에서는, 도 6을 참고하여, 일 실시예에 따른, 전자 장치가 제1 이미지(110)와 같은 입력 이미지로부터 출력 이미지(예, 제1 출력 이미지(510), 및/또는 제2 출력 이미지(520))를 합성하기 위해 이용하는 뉴럴 네트워크, 및 상기 뉴럴 네트워크에 기반하는 모델이 설명된다.

도 6은, 일 실시예에 따른, 전자 장치 내에 저장되고, 이미지를 생성하기 위한 복수의 뉴럴 네트워크들을 설명하기 위한 도면이다. 도 6의 전자 장치는 도 1 내지 도 2의 전자 장치(101)의 일 예일 수 있다. 도 6의 제1 이미지(110)는 도 1, 및/또는 도 3 내지 도 5의 제1 이미지(110)에 대응할 수 있다. 도 6의 깊이 맵들(310, 320, 330)은, 도 3의 깊이 맵들(310, 320, 330) 각각에 대응할 수 있다. 도 6의 제1 출력 이미지(510), 및 제2 출력 이미지(520)는, 도 5의 제1 출력 이미지(510), 및 제2 출력 이미지(520) 각각에 대응할 수 있다.

도 6은 일 실시예에 따른 전자 장치에서 실행되고, 입력 이미지(예, 제1 이미지(110))로부터 출력 이미지(예, 제1 출력 이미지(510), 및/또는 제2 출력 이미지(520))를 획득하기 위한 하나 이상의 프로세스들을 설명하기 위한 도면이다. 도 6을 참고하면, 일 실시예에 따른 전자 장치에서 실행되는 하나 이상의 프로세스들에 포함된 기능 및/또는 서브-루틴이, 기능 및/또는 서브-루틴 사이에서 전달되는 정보에 따라 구분되어 도시된다. 일 실시예에 따른 전자 장치는 메모리(예, 도 2의 메모리(230)) 내에 저장된 하나 이상의 인스트럭션들에 기반하여, 도 6에 블록으로 구분된 하나 이상의 프로세스들을 실행할 수 있다. 일 실시예에서, 상기 프로세스들은, 예를 들어, 백그라운드 프로세스(background process)및/또는 데몬(daemon)과 같이 사용자에게 보여지는 제1 상태와 구별되는 제2 상태에서 실행될 수 있다.

도 6을 참고하면, 일 실시예에 따른, 전자 장치는 깊이 맵 생성기(610)의 실행에 기반하여, 제1 이미지(110)로부터 하나 이상의 깊이 맵들(예, 깊이 맵들(310, 320, 330))을 획득할 수 있다. 깊이 맵 생성기(610)는, 하나 이상의 색상들에 의하여 구분되는 복수의 영역들을 포함하는 입력 이미지(예, 제1 이미지(110)), 및 하나 이상의 난수들(random numbers)의 집합(Z1)에 기반하여, 하나 이상의 깊이 맵들을 생성하기 위한 뉴럴 네트워크를 실행하기 위한, 전자 장치의 일 프로세스(a process)(또는 일 파이프라인(a pilpeline))일 수 있다. 하나 이상의 난수들은, 수열의 규칙과 독립적으로 선택될 수 있다. 상기 하나 이상의 난수들은, 밀리초로 나타낸 타임스탬프에 기반하여 무작위로 선택된 의사 난수를 포함할 수 있다. 집합(Z1)에 포함된 상기 난수들은, 전자 장치가 깊이 맵 생성기(610)를 실행하는 동안, 깊이 맵 생성기(610)에 의하여 획득되는 깊이 맵들의 다양성(diversity)을 증가시키기 위하여, 제1 이미지(110)와 함께 깊이 맵 생성기(610)로 입력될 수 있다. 예를 들어, 집합(Z1)에 포함된 난수들의 개수는, 전자 장치가 깊이 맵 생성기(610)를 이용하여 획득한 깊이 맵들의 개수(예, 깊이 맵들(310, 320, 330)의 개수인 3 개)에 매칭될 수 있다. 깊이 맵 생성기(610)는, 시맨틱-깊이 변환 부(Semantic-to-Depth Translation unit)으로 참조될 수 있다.

도 6을 참고하면, 일 실시예에 따른, 전자 장치는 출력 이미지 생성기(620)의 실행에 기반하여, 제1 이미지(110), 및 적어도 하나의 깊이 맵으로부터, 하나 이상의 출력 이미지(예, 제1 출력 이미지(510), 및 제2 출력 이미지(520))를 획득할 수 있다. 출력 이미지 생성기(620)는, 깊이 맵 생성기(610)에 의하여 획득된 깊이 맵들 중 하나의 깊이 맵(a depth map), 상기 깊이 맵 생성기(610)에 입력된 제1 이미지(110), 및 하나 이상의 난수들의 집합(Z2)에 기반하여, 하나 이상의 출력 이미지들을 합성하기 위한 뉴럴 네트워크를 실행하기 위한, 전자 장치의 일 프로세스(또는 일 파이프라인)일 수 있다. 집합(Z2)에 포함된 상기 난수들은, 전자 장치가 출력 이미지 생성기(620)를 실행하는 동안, 출력 이미지 생성기(620)에 의해 합성되는 출력 이미지들의 다양성, 및/또는 스타일을 조절하기 위하여, 제1 이미지(110), 및 적어도 하나의 깊이 맵과 함께, 출력 이미지 생성기(620)로 입력될 수 있다. 예를 들어, 집합(Z2)에 포함된 난수들의 개수는, 전자 장치가 출력 이미지 생성기(620)를 이용하여 획득한 출력 이미지들의 개수(예, 제1 출력 이미지(510), 및 제2 출력 이미지(520)의 개수인 2 개)에 매칭될 수 있다. 출력 이미지 생성기(620)는, 시맨틱 및 깊이-이미지 변환 부(Sematic and Depth-to-Image Translation unit)으로 참조될 수 있다.

상술한 바와 같이, 일 실시예에 따른, 전자 장치는, 깊이 맵 생성기(610), 및 출력 이미지 생성기(620)의 직렬 연결에 기반하여, 제1 이미지(110)와 같은 입력 이미지로부터 하나 이상의 출력 이미지들(예, 제1 출력 이미지(510), 및 제2 출력 이미지(520))을 획득할 수 있다. 상기 직렬 연결은, 2-페이즈 추론 파이프라인(2-phase inference pipeline)으로 참조될 수 있다. 전자 장치는 깊이 맵 생성기(610)를 이용하여, 상기 직렬 연결에 기반하여 출력 이미지를 합성하는 동안, 깊이 맵들의 옵션을, 사용자에게 제공할 수 있다. 상기 사용자는 상기 깊이 맵들 중 어느 하나를 선택, 및/또는 편집하여, 입력 이미지로부터 획득하고자 하는 출력 이미지에 추가될 원근감을 조절할 수 있다. 전자 장치가 상기 사용자에 의해 선택, 및/또는 편집된 특정 깊이 맵에 기반하여 출력 이미지를 합성하기 때문에, 전자 장치는 사용자의 의도에 부합하는 출력 이미지를 합성할 수 있다.

이하에서는, 도 7을 참고하여, 도 6의 깊이 맵 생성기(610), 및 출력 이미지 생성기(620)에 공통된 구조가 설명된다.

도 7은, 일 실시예에 따른, 전자 장치 내에 저장되고, 이미지를 생성하기 위한, 모델(700)의 구조를 설명하기 위한 블록도이다. 도 7의 전자 장치는 도 1 내지 도 2의 전자 장치(101)의 일 예일 수 있다. 도 7의 모델(700)은, 도 6의 깊이 맵 생성기(610), 및 출력 이미지 생성기(620)에 공통적으로 포함되고, 소프트웨어로 구현된(software implemented) 알고리즘을 설명하기 위한 예시적인 블록도이다.

도 7을 참고하면, 일 실시예에 따른, 전자 장치가 입력 이미지(예, 도 1의 제1 이미지(110))로부터, 하나 이상의 출력 이미지들(예, 도 1의 제2 이미지(120))을 생성하기 위해 이용하는 모델(700)은 StyleGAN 모델에 적어도 기반하는 구조를 가질 수 있다. 일 실시예에서, 모델(700)은, 상기 styleGAN 모델에 기반하여, 하나 이상의 깊이 맵들을 생성하기 위하여 변경된 구조를 가질 수 있다. 일 실시예에서, 모델(700)은, 상기 styleGAN 모델에 기반하여, 시맨틱 맵(예, 상기 입력 이미지), 및/또는 깊이 맵으로부터 상기 출력 이미지를 생성하기 위하여 변경된 구조를 가질 수 있다.

도 7을 참고하면, 모델(700)은, 적어도 하나의 이미지(714), 및 하나 이상의 난수들(712)을 수신하는 조건 준비 모듈(Condition Preparation Module)(710), 상기 조건 준비 모듈(710)에 기반하여 생성된 정보(예, 특징 맵, 특징 정보, 특징 벡터, 및/또는 레이턴트(latent) 맵)를 수신하는 조건 합성 모듈(Condition Fusion Module)(730), 및 상기 조건 합성 모듈(730)로부터 획득된 정보, 및 노이즈와 같은 난수들(744)을 수신하는 이미지 합성 모듈(Image Synthesis Module)(740)을 포함할 수 있다. 모델(700)이 조건 준비 모듈(710)을 포함하기 때문에, 전자 장치는 난수들(712)에 기반하고, 이미지 합성 모듈(740)에 의하여 출력되는 적어도 하나의 이미지의 다양성을 변경할 수 있다. 예를 들어, 난수들(712)은, 도 6의 난수들의 집합들(Z1, Z2)의 원소들일 수 있다.

일 실시예에 따른, 전자 장치는, 모델(700)의 조건 준비 모듈(710)의 매핑 네트워크(716)에 기반하여, 난수들(712)에 기반하는 레이턴트 맵들(718)을 획득할 수 있다. 레이턴트 맵들(718)은, 랜덤 레이턴트 맵(random latent map)으로 참조될 수 있다. 레이턴트 맵들(718)은, 난수들(712)이 매핑 네트워크(716) 내 복수의 레이어들을 따라 전파되는 동안, 상기 매핑 네트워크(716)로부터 출력되는 복수의 수치 값들을 포함할 수 있다. 레이턴트 맵들(718)은, 매핑 네트워크(716)의 채널 수, 폭, 및 너비의 3차원 정보일 수 있다. 상기 폭, 및/또는 상기 너비는, 모델(700)에 기반하여 합성될 출력 이미지의 폭, 및/또는 너비일 수 있다. 상기 채널 수는, 모델(700)의 구현에 따라 상이한 수치 값을 가질 수 있다. 레이턴트 맵들(718)의 개수는, 조건 준비 모듈(710)에 의하여 수신되는 난수들(712)의 개수에 매칭될 수 있다.

일 실시예에 따른, 전자 장치는, 모델(700)의 조건 준비 모듈(710)에 기반하여, 적어도 하나의 이미지(714)의 리사이즈(예, 블록들(720, 724)로 나타내고, 블록들(720, 724) 마다 상이하게 정의된 크기), 및 콘볼루션(예, 블록들(722, 726)로 나타낸 콘볼루션 연산)을 수행할 수 있다. 도 7을 참고하면, 블록들(720, 722)의 연결에 기반하여, 적어도 하나의 이미지(714)가 제1 크기로 조절된 이후, 콘볼루션 연산될 수 있다. 도 7을 참고하면, 블록들(724, 726)의 연결에 기반하여, 적어도 하나의 이미지(714)가 상기 제1 크기와 상이한 제2 크기로 조절된 이후, 콘볼루션 연산될 수 있다. 일 실시예에 따른, 전자 장치는, 모델(700) 내에서 상이한 크기들에 대응하는 콘볼루션 연산(예, 블록들(722, 726)로 나타낸 콘볼루션 연산)에 기반하여, 복수의 조건 레이턴트 코드들(728)을 획득할 수 있다.

일 실시예에 따른, 전자 장치가 조건 준비 모듈(710)로부터 획득하는 복수의 조건 레이턴트 코드들(728)은, 콘볼루션 연산의 결과(예, 조건 맵)가 채널 단위(channel-wise) 내에서 결합된 정보를 포함할 수 있다. 조건 레이턴트 코드들(728)은, 레이턴트 맵들(718)과 유사하게, 채널 수, 폭, 및 너비에 기반하는 3차원 정보일 수 있다. 조건 레이턴트 코드들(728)의 상기 채널 수, 상기 폭, 및 상기 너비는 조건 레이턴트 코드들(728) 마다 독립적으로 설정될 수 있다. 일 실시예에서, 조건 레이턴트 코드들(728)의 상기 폭, 및 상기 너비는, 모델(700)에 의하여 합성될 출력 이미지의 폭, 및 너비에 매칭될 수 있다.

일 실시예에 따른, 전자 장치는 모델(700) 내 조건 합성 모듈(730)을 이용하여, 난수들(712)에 기반하여 획득된 레이턴트 맵들(718), 및 조건 레이턴트 코드들(728)에 대한 합성을 수행할 수 있다. 상기 합성은, 콘볼루션 연산, 및 업샘플링 연산에 기반하여, 이미지 합성 모듈(740) 내 특징에 매칭되도록 수행될 수 있다. 도 7을 참고하면, w₁ ⁺, 및 w₂ ⁺는, 중간 합성 맵(intermediate fusion map)으로 참조될 수 있다. 상기 중간 합성 맵은, 전자 장치가 조건 합성 모듈(730)에 기반하여 상기 합성을 수행한 결과를 포함할 수 있다. 일 실시예에 따른, 전자 장치는, 콘볼루션 연산으로 구분되는, 조건 합성 모듈(730)의 특정 레이어(예, i + 1 번째 레이어)로, i 번째 중간 합성 맵(w_i ⁺)을 입력할 수 있다. 이미지 합성 모듈(740)의 각 레이어로, 노이즈와 같은 난수들(744)이 입력될 수 있다. 이미지 합성 모듈(740) 내에서의 연쇄적인(serial) 콘볼루션 연산은, 모델(700)에 입력되는 적어도 하나의 이미지(714)의 크기에 도달할 때까지 연쇄적으로 수행될 수 있다.

일 실시예에 따른, 전자 장치는 모델(700) 내 이미지 합성 모듈(740)을 이용하여, 조건 합성 모듈(730)의 각 레이어의 중간 합성 맵(예, i 번째 레이어의 중간 합성 맵 w_i ⁺)의 아핀 변형(affine transform)을 획득할 수 있다. 전자 장치는 이미지 합성 모듈(740)로, 지정된 수치 값(742)(예, 상수(constant number))을 입력할 수 있다. 지정된 수치 값(742)은, styleGAN 모델에서 이미지의 합성을 위해 설정될 수 있다. 전자 장치는 난수들(744)을 이용하여 픽셀 당 노이즈를, 추가할 수 있다. 난수들(744)은, 모델(700)에 의해 합성되는 이미지의 다양성을 증가시키기 위하여, 모델(700)로 입력될 수 있다. 일 실시예에 따른, 전자 장치는 적대적 학습에 기반하여 모델(700)을 트레이닝할 수 있다. 일 실시예에 따른, 전자 장치가 모델(700)을 트레이닝 하는 동작은, 도 9를 참고하여 설명된다.

도 6의 깊이 맵 생성기(610), 및 출력 이미지 생성기(620) 각각은, 도 7의 모델(700)을 포함할 수 있다. 예를 들어, 도 6의 깊이 맵 생성기(610)는, 도 7의 조건 준비 모듈(710)을 통해, 하나 이상의 난수들(예, 도 6의 난수들의 집합(Z1)의 원소들), 및 시맨틱 맵(예, 도 1의 제1 이미지(110))을 수신할 수 있다. 예를 들어, 전자 장치는, 도 6의 깊이 맵 생성기(610)를 실행하는 동안, 도 7을 참고하여 상술된 동작에 기반하여, 시맨틱 맵으로부터 하나 이상의 난수들에 대응하는 하나 이상의 깊이 맵들을 획득할 수 있다. 예를 들어, 전자 장치는 이미지 합성 모듈(740)의 상기 아핀 변형에 기반하여, 복수의 깊이 맵들을 획득할 수 있다.

예를 들어, 도 6의 출력 이미지 생성기(620)는, 도 7의 적어도 하나의 이미지(714)를 수신하기 위한 조건 준비 모듈(710)을 이용하여, 사용자에 의해 선택된 일 깊이 맵, 및 시맨틱 맵을 획득할 수 있다. 상기 깊이 맵, 시맨틱 맵, 및 하나 이상의 난수들(예, 도 6의 난수들의 집합(Z2)의 원소들)을 이용하여, 전자 장치는 하나 이상의 출력 이미지들을 합성할 수 있다. 전자 장치가 상기 출력 이미지들을 합성하는 것은, 도 6의 출력 이미지 생성기(620) 내에 포함된 이미지 합성 모듈(740)에 기반하여 수행될 수 있다.

상술한 바와 같이, 일 실시예에 따른, 전자 장치는, 콘볼루션 연산에 기반하는 뉴럴 네트워크를 이용하여, 고화질의 출력 이미지(예, 1024 Х 1024의 크기를 가지는 출력 이미지)를 획득할 수 있다. 이하에서는, 도 8을 참고하여, 일 실시예에 따른, 블록들(722, 726)과 같이, 콘볼루션 연산에 기반하는 뉴럴 네트워크가 설명된다.

도 8은, 일 실시예에 따른, 전자 장치 내에 저장된 뉴럴 네트워크(810)를 설명하기 위한 도면이다. 도 8의 전자 장치는, 도 1 내지 도 2의 전자 장치(101)를 포함할 수 있다. 도 8은 일 실시예에 따른 전자 장치가 메모리 내에 저장된 파라미터들의 집합으로부터 획득하는 뉴럴 네트워크(810)를 설명하기 위한 예시적인 도면이다. 도 8의 뉴럴 네트워크(810)는 도 7의 모델(700) 내에 포함될 수 있다. 예를 들어, 도 7의 모델(700)은, 메모리(예, 도 1 내지 도 2의 메모리(120)) 내에 저장된 복수의 파라미터들의 집합에 기반하여 나타내어지는 뉴럴 네트워크를 포함할 수 있다. 도 8을 참고하면, 도 7의 모델(700)의 콘볼루션 연산을 수행하기 위한 뉴럴 네트워크의 뉴런들이, 복수의 레이어들을 따라 구분될 수 있다. 상기 뉴런들은, 특정 레이어에 포함된 특정 노드 및 상기 특정 레이어와 상이한 다른 레이어에 포함된 다른 노드 사이를 연결하는 연결선, 및/또는 상기 연결선에 할당된 가중치로 나타내어질 수 있다. 예를 들어, 뉴럴 네트워크(810)는 입력 레이어(820), 히든 레이어들(830) 및 출력 레이어(840)를 포함할 수 있다. 히든 레이어들(830)의 개수는 실시예에 따라 다를 수 있다.

도 8을 참고하면, 입력 레이어(820)는 입력 데이터를 나타내는 벡터(예, 입력 레이어(820)에 포함된 노드들의 개수에 대응하는 원소들(elements)을 가지는 벡터)를 수신할 수 있다. 입력 데이터에 기반하여, 입력 레이어(820) 내 노드들 각각에서 발생된 신호들은, 입력 레이어(820)로부터 히든 레이어들(830)로 송신될 수 있다. 출력 레이어(840)는, 히든 레이어들(830) 중 일 히든 레이어(예, 히든 레이어들(830)의 시퀀스 내에서 마지막 히든 레이어)로부터 수신된 하나 이상의 신호들에 기반하여, 뉴럴 네트워크(810)의 출력 데이터를 생성할 수 있다. 상기 출력 데이터는, 예를 들어, 출력 레이어(840)에 포함된 노드들 각각에 매핑된 원소들을 가지는 벡터를 포함할 수 있다.

도 8을 참고하면, 히든 레이어들(830)이 입력 레이어(820) 및 출력 레이어(840) 사이에 위치할 수 있다. 입력 레이어(820)의 노드들을 통해 수신된 수치 값들은, 히든 레이어들(830)의 연쇄적인 연결을 따라 전파되는 동안, 히든 레이어들(830) 사이에 할당된 가중치에 기반하여 변경될 수 있다. 예를 들어, 입력 레이어(820)를 통해 수신된 입력 데이터가, 입력 레이어(820)로부터 히든 레이어들(830)을 따라 순차적으로 전파됨에 따라(propagating), 상기 입력 데이터가 서로 다른 레이어들의 노드들을 연결하는 가중치에 기반하여 점진적으로 변경될 수 있다.

상술한 바와 같이, 뉴럴 네트워크(810)의 레이어들(예, 입력 레이어(820), 히든 레이어들(830) 및 출력 레이어(840)) 각각은 복수의 노드들을 포함할 수 있다. 히든 레이어들(830) 사이의 연결은 CNN(convolutional neural network)에서의 콘볼루션 필터(convolution filter)와 관련될 수 있다.

상이한 레이어들 사이에서 노드들이 연결되는 구조는, 도 8의 일 예에 제한되지 않는다. 일 실시예에서, 하나 이상의 히든 레이어들(830)은 출력 값이 현재 시간의 히든 레이어에 다시 입력되는 리커런트 뉴럴 네트워크(recurrent neural network; RNN)에 기반하는 레이어일 수 있다. 일 실시예에서, LSTM(Long Short-Term Memory)에 기반하여, 뉴럴 네트워크(810)의 노드들의 값들 중 적어도 하나가 버려지거나, 상대적으로 긴 기간 동안 유지되거나, 또는 상대적으로 짧은 시간 동안 유지될 수 있다. 일 실시예에 따른, 전자 장치의 뉴럴 네트워크(810)는 상대적으로 증가된 개수의 히든 레이어들(830)을 포함하여, 딥 뉴럴 네트워크(deep neural network)를 형성할 수 있다. 딥 뉴럴 네트워크를 트레이닝하는 것을 딥 러닝(deep learning)이라 한다. 히든 레이어들(830)에 포함된 노드는 히든 노드로 참조될 수 있다.

입력 레이어(820) 및 히든 레이어들(830)에 포함된 노드들은 가중치를 가지는 연결선(예, 상기 가중치를 포함하는 2차원 매트릭스로 나타나는 콘볼루션 필터)을 통해 서로 연결될 수 있고, 히든 레이어 및 출력 레이어에 포함된 노드들도 가중치를 가지는 연결선을 통해 서로 연결될 수 있다. 뉴럴 네트워크(810)를 튜닝 및/또는 트레이닝하는 것은, 뉴럴 네트워크(810)의 레이어들(예, 입력 레이어(820), 히든 레이어들(830), 및 출력 레이어(840)) 각각에 포함된 노드들 사이의 가중치들을 변경하는 것을 의미할 수 있다. 뉴럴 네트워크(810)의 튜닝은, 예를 들어, 지도 학습(supervised learning) 및/또는 비지도 학습(unsupervised learning)에 기반하여 수행될 수 있다.

이하에서는, 도 9를 참고하여, 일 실시예에 따른 전자 장치가 뉴럴 네트워크(810)를 포함하는 모델(예, 도 7의 모델(700))을 튜닝하는 동작이 설명된다.

도 9는, 일 실시예에 따른, 전자 장치 내에 저장되고, 이미지를 생성하기 위한, 모델을 트레이닝하기 위한 데이터 세트를 생성하는 동작을 설명하기 위한 도면이다. 도 9의 전자 장치는 도 1 내지 도 2의 전자 장치(101)의 일 예일 수 있다. 도 9의 모델은, 도 7의 모델(700)을 포함할 수 있다.

도 9를 참고하면, 일 실시예에 따른, 전자 장치는, 이미지(915)로부터, 이미지(915)의 깊이 값들의 분포를 나타내는 깊이 맵(935), 및 이미지(915) 내 하나 이상의 피사체들의 위치, 크기, 및/또는 형태를 나타내기 위한 시맨틱 맵(925)을 획득할 수 있다. 상기 이미지(915)는, 풍경 사진과 같은 사진을 포함할 수 있다. 상기 이미지(915)는, 배경 데이터베이스(910) 내에 저장될 수 있다. 상기 깊이 맵(935)은, 깊이 맵 데이터베이스(930) 내에 저장될 수 있다. 상기 시맨틱 맵(925)은, 시맨틱 맵 데이터베이스(920) 내에 저장될 수 있다. 예를 들어, 전자 장치는 배경 데이터베이스(910) 내에 저장된 복수의 이미지들(예, 이미지(915)), 시맨틱 맵 데이터베이스(920) 내에 저장된 복수의 시맨틱 맵들(예, 시맨틱 맵(925)), 및 깊이 맵 데이터베이스(930) 내에 저장된 복수의 깊이 맵들(예, 깊이 맵(935))의 조합에 기반하여, 시맨틱 맵으로부터 출력 이미지를 합성하기 위한 모델(예, 도 7의 모델(700))을 트레이닝할 수 있다.

예를 들어, 도 7의 모델(700)의 구조를 가지는 도 6의 깊이 맵 생성기(610)는, 시맨틱 맵 데이터베이스(920) 내에 저장된 복수의 시맨틱 맵들, 및 깊이 맵 데이터베이스(930) 내에 저장된 복수의 깊이 맵들의 쌍에 기반하여 트레이닝될 수 있다. 예를 들어, 도 7의 모델(700)의 구조를 가지는 도 6의 출력 이미지 생성기(620)는, 배경 데이터베이스(910), 시맨틱 맵 데이터베이스(920), 및 깊이 맵 데이터베이스(930) 각각에 저장된 이미지(예, 이미지(915)), 시맨틱 맵(예, 시맨틱 맵(925)), 및 깊이 맵(예, 깊이 맵(935))의 조합에 기반하여 트레이닝될 수 있다.

일 실시예에 따른, 전자 장치는 상기 모델을, 적대적 학습에 기반하여 트레이닝할 수 있다. 예를 들어, 전자 장치는 상기 모델과 상이한 모델에 기반하여, 상기 모델에 의하여 합성된 이미지, 및 배경 데이터베이스(910) 내에 저장된 이미지 사이의 유사도를 측정할 수 있다. 상기 측정된 유사도에 기반하여, 전자 장치는 상기 모델을 트레이닝할 수 있다. 전자 장치는 적대적 손실(adversarial loss), 지각 손실(perceptual loss), 도메인 가이드 손실(domain-guided loss), 재구성 손실(reconstruction loss), 또는 정규화(Regularization) 중 적어도 하나에 기반하여, 상기 모델, 및 상기 상이한 모델에 기반하는 적대적 학습을 수행할 수 있다.

상술한 바와 같이, 일 실시예에 따른, 전자 장치는 사진과 같은 이미지(915)로부터 추론된 깊이 맵(935), 및 시맨틱 맵(925)에 의하여 트레이닝된 뉴럴 네트워크에 기반하여, 상기 시맨틱 맵(925)과 상이한 다른 시맨틱 맵(예, 시맨틱 맵 데이터베이스(920) 내에 저장되지 않은 일 시맨틱 맵)으로부터 출력 이미지를 합성할 수 있다. 상기 합성된 출력 이미지는, 배경 데이터베이스(910) 내에 저장된 이미지(915)와 유사한 해상도를 가질 수 있다. 상기 합성된 출력 이미지는, 이미지(915)와 유사한 이미지 품질, 및/또는 깊이 정확성을 가질 수 있다.

도 10은, 일 실시예에 따른, 전자 장치의 동작을 설명하기 위한 도면이다. 도 10의 전자 장치는 도 1 내지 도 2의 전자 장치(101)를 포함할 수 있다. 도 10의 동작들 중 적어도 하나는 도 1 내지 도 2의 전자 장치(101), 및/또는 도 2의 프로세서(220)에 의해 수행될 수 있다.

도 10을 참고하면, 동작(1010)에서, 일 실시예에 따른, 전자 장치는, 하나 이상의 색상들에 의하여 구분되는 하나 이상의 영역들을 포함하는 제1 이미지(예, 도 1의 제1 이미지(110))를 식별할 수 있다. 상기 제1 이미지는, 상기 하나 이상의 영역들의 형태, 또는 상기 하나 이상의 영역들에 채워진 상기 하나 이상의 색상들 중 적어도 하나에 기반하여, 상기 하나 이상의 피사체들을 나타내기 위한 시맨틱 맵일 수 있다. 예를 들어, 시맨틱 맵은, 상이한 색상들이 채워진 복수의 영역들을 포함할 수 있다. 상기 예시 내에서, 상기 상이한 색상들은, 상기 하나 이상의 피사체들의 타입을 나타낼 수 있다. 상기 예시 내에서, 상기 복수의 영역들의 형태는, 상기 하나 이상의 피사체들의 상기 형태, 및 상기 위치를 나타낼 수 있다.

도 10을 참고하면, 동작(1020)에서, 일 실시예에 따른, 전자 장치는, 제1 이미지에 포함된 하나 이상의 영역들에 기반하는 적어도 하나의 깊이 맵을 획득할 수 있다. 예를 들어, 전자 장치는 도 6의 깊이 맵 생성기(610)에 기반하여, 상기 적어도 하나의 깊이 맵을 획득할 수 있다. 도 6의 깊이 맵 생성기(610)는, 도 7의 모델(700)의 구조를 가질 수 있다. 일 실시예에서, 전자 장치는 복수의 후보 깊이 맵들을 획득할 수 있다. 상기 복수의 후보 깊이 맵들은, 복수의 난수들에 기반하여 깊이 값들의 상이한 분포를 가질 수 있다. 전자 장치에 의해 획득된 적어도 하나의 깊이 맵은, 동작(1010)의 제1 이미지의 영역 내에서 상이한 깊이 값들을 가질 수 있다. 예를 들어, 제1 이미지의 단색으로 채워진 특정 영역의 제1 픽셀에 할당된 깊이 값, 및 상기 특정 영역의 제2 픽셀에 할당된 깊이 값이 서로 다를 수 있다.

일 실시예에 따른, 전자 장치는, 상기 복수의 후보 깊이 맵들 중 어느 하나를 선택하거나, 또는 적어도 하나를 편집하는 입력을 수신할 수 있다. 상기 입력에 응답하여, 전자 장치는 하나의 깊이 맵을 결정할 수 있다. 상기 결정된 깊이 맵에 기반하여, 전자 장치는 동작(1030)을 수행할 수 있다.

도 10을 참고하면, 동작(1030)에서, 일 실시예에 따른, 전자 장치는, 식별된 제1 이미지, 및 상기 적어도 하나의 깊이 맵에 기반하여, 하나 이상의 피사체들을 포함하는 제2 이미지를 획득할 수 있다. 상기 적어도 하나의 깊이 맵은, 상기 결정된 깊이 맵을 포함할 수 있다. 상기 제2 이미지는, 동작(1010)의 제1 이미지로부터 합성된 출력 이미지(예, 도 1의 제2 이미지(120))를 포함할 수 있다. 예를 들어, 제1 이미지가 복수의 색상들에 의하여 구분되는 복수의 영역들을 포함하는 경우, 전자 장치는 상기 복수의 색상들 각각에 매칭되는 상이한 타입들을 가지는, 복수의 피사체들을 포함하는 제2 이미지를 획득할 수 있다.

일 실시예에 따른, 전자 장치는 하나 이상의 난수들, 상기 제1 이미지, 상기 적어도 하나의 깊이 맵에 기반하여, 하나 이상의 제2 이미지들을 획득할 수 있다. 예를 들어, 전자 장치는 도 6의 출력 이미지 생성기(620)에 기반하여, 상기 하나 이상의 제2 이미지들을 획득할 수 있다. 도 6의 출력 이미지 생성기(620)는 도 7의 모델(700)의 구조를 가질 수 있다. 전자 장치는 상기 하나 이상의 제2 이미지들을, 디스플레이(예, 도 2의 디스플레이(240)) 내에 표시할 수 있다. 전자 장치는 상기 하나 이상의 제2 이미지들을, 메모리(230) 내에 저장할 수 있다. 전자 장치는 상기 하나 이상의 제2 이미지들을, 동작(1130)의 상기 식별된 깊이 맵과 함께 저장할 수 있다.

도 11은, 일 실시예에 따른, 전자 장치의 동작을 설명하기 위한 도면이다. 도 11의 전자 장치는 도 1 내지 도 2의 전자 장치(101)를 포함할 수 있다. 도 11의 동작들 중 적어도 하나는 도 1 내지 도 2의 전자 장치(101), 및/또는 도 2의 프로세서(220)에 의해 수행될 수 있다.

도 11을 참고하면, 동작(1110)에서, 일 실시예에 따른, 전자 장치는, 하나 이상의 피사체들의 형태, 및 위치를 지시하는 시맨틱 맵을 식별할 수 있다. 상기 시맨틱 맵은, 도 1의 제1 이미지(110)를 포함할 수 있다. 도 10의 동작(1010)과 유사하게, 전자 장치는 도 11의 동작(1110)을 수행할 수 있다. 상기 시맨틱 맵 내 픽셀들의 색상이 상기 하나 이상의 피사체들의 타입을 나타내고, 상기 색상에 의해 구분되는 영역의 형태, 및 위치가 상기 하나 이상의 피사체들의 형태, 및 위치를 나타낼 수 있다.

도 11을 참고하면, 동작(1120)에서, 일 실시예에 따른, 전자 장치는, 시맨틱 맵에 포함된 복수의 픽셀들의 깊이 값들을 포함하는 복수의 후보 깊이 맵들을 획득할 수 있다. 전자 장치는 제1 뉴럴 네트워크를 이용하여, 동작(1110)의 시맨틱 맵으로부터 상기 복수의 후보 깊이 맵들을 획득할 수 있다. 상기 제1 뉴럴 네트워크는, 도 8의 뉴럴 네트워크(810)의 구조를 가질 수 있다. 상기 제1 뉴럴 네트워크는, 도 7의 모델(700) 내에 포함될 수 있다. 상기 제1 뉴럴 네트워크는 도 6의 깊이 맵 생성기(610)의 적어도 일부로 포함될 수 있다.

도 11을 참고하면, 동작(1130)에서, 일 실시예에 따른, 전자 장치는, 복수의 후보 깊이 맵들에 기반하여, 시맨틱 맵에 매칭되는 깊이 맵을 식별할 수 있다. 예를 들어, 전자 장치는 상기 복수의 후보 깊이 맵들 각각에 대응하는 위한 옵션들을, 사용자에게 제공할 수 있다. 전자 장치는 상기 옵션들 중 어느 하나를 선택하기 위한 입력을, 상기 사용자로부터 수신할 수 있다. 상기 입력에 응답하여, 전자 장치는, 동작(1110)의 시맨틱 맵에 매칭되는 깊이 맵을 식별할 수 있다. 예를 들어, 전자 장치는 상기 복수의 후보 깊이 맵들 중 적어도 하나를 편집하기 위한 화면을, 사용자에게 제공할 수 있다. 상기 사용자에 의해 편집된 일 깊이 맵을, 전자 장치는 동작(1110)의 시맨틱 맵에 매칭되는 깊이 맵으로 결정할 수 있다.

도 11을 참고하면, 동작(1140)에서, 일 실시예에 따른, 전자 장치는, 식별된 깊이 맵, 및 상기 시맨틱 맵에 기반하여, 상기 하나 이상의 피사체들이 배치된, 하나 이상의 이미지들을 획득할 수 있다. 전자 장치는 제2 뉴럴 네트워크를 이용하여, 동작(1140)의 상기 하나 이상의 이미지들을 획득할 수 있다. 상기 제2 뉴럴 네트워크는, 도 8의 뉴럴 네트워크(810)의 구조를 가질 수 있다. 상기 제2 뉴럴 네트워크는, 도 7의 모델(700) 내에 포함될 수 있다. 상기 제2 뉴럴 네트워크는, 도 6의 출력 이미지 생성기(620)의 적어도 일부로 포함될 수 있다.

도 12는, 일 실시예에 따른, 전자 장치의 뉴럴 네트워크를 트레이닝하는 동작을 설명하기 위한 도면이다. 도 12의 전자 장치는 도 1 내지 도 2의 전자 장치(101)를 포함할 수 있다. 도 12의 동작들 중 적어도 하나는 도 1 내지 도 2의 전자 장치(101), 및/또는 도 2의 프로세서(220)에 의해 수행될 수 있다.

도 12를 참고하면, 동작(1210)에서, 일 실시예에 따른, 전자 장치는, 데이터베이스로부터 이미지를 식별할 수 있다. 동작(1210)의 데이터베이스는 도 9의 배경 데이터베이스(910)를 포함할 수 있다. 동작(1210)의 이미지는, 도 9의 이미지(915)를 포함할 수 있다. 예를 들어, 전자 장치는 풍경 사진과 같은 복수의 사진들을, 상기 데이터베이스로부터 식별할 수 있다.

도 12를 참고하면, 동작(1220)에서, 일 실시예에 따른, 전자 장치는, 식별된 이미지 내 하나 이상의 피사체들의 위치, 및 형태를 나타내는 시맨틱 맵을 획득할 수 있다. 예를 들어, 전자 장치는, 뉴럴 네트워크에 기반하여 동작(1210)의 이미지의 픽셀들 각각에 캡쳐된 피사체의 타입을 식별할 수 있다. 전자 장치는, 동작(1210)의 이미지의 상기 픽셀들을, 상기 식별된 타입에 대응하는 색상으로 대체하여, 상기 시맨틱 맵을 획득할 수 있다. 예를 들어, 시맨틱 맵 내에서, 이미지의 픽셀들 각각에 캡쳐된 피사체의 타입이, 색상으로 지시될 수 있다. 동작(1220)의 시맨틱 맵은, 동작(1210)의 데이터베이스와 상이한 다른 데이터베이스(예, 도 9의 시맨틱 맵 데이터베이스(920)) 내에, 동작(1210)의 이미지의 쌍으로(as a pair of) 저장될 수 있다.

도 12를 참고하면, 동작(1230)에서, 일 실시예에 따른, 전자 장치는, 획득된 이미지 내 픽셀들 각각의 깊이를 나타내는 깊이 맵을 획득할 수 있다. 예를 들어, 전자 장치는 동작(1220)의 뉴럴 네트워크와 상이한 다른 뉴럴 네트워크에 기반하여, 동작(1210)의 이미지의 픽셀들 각각에 캡쳐된 피사체, 및 상기 이미지를 캡쳐한 카메라 사이의 거리를 식별할 수 있다. 전자 장치는 동작(1220)의 이미지의 상기 픽셀들을, 그레이 스케일(gray scale)과 같이, 단일 축의 수치 값을 나타내기 위한 색상으로 대체하여, 상기 깊이 맵을 획득할 수 있다. 동작(1230)의 깊이 맵은, 동작들(1210, 1220)의 데이터베이스들과 상이한 또 다른 데이터베이스(예, 도 9의 깊이 맵 데이터베이스(930)) 내에, 동작(1210)의 이미지, 및 동작(1220)의 시맨틱 맵의 쌍으로 저장될 수 있다.

도 12의 동작들(1220, 1230)의 순서는, 도 12 내 순서에 제한되지 않는다. 예를 들어, 동작들(1220, 1230)은, 전자 장치에 의해 동시에 수행되거나, 또는 도 12의 동작들(1220, 1230)의 순서와 상이한 순서를 따라 수행될 수 있다.

도 12를 참고하면, 동작(1240)에서, 일 실시예에 따른, 전자 장치는, 깊이 맵, 및 시맨틱 맵의 쌍(pair)을 이용하여, 시맨틱 맵으로부터 깊이 맵을 획득하기 위한 제1 뉴럴 네트워크를 트레이닝할 수 있다. 도 12를 참고하면, 동작(1250)에서, 일 실시예에 따른, 전자 장치는, 깊이 맵, 시맨틱 맵, 및 이미지 사이의 관계에 기반하여, 깊이 맵, 및 시맨틱 맵으로부터 이미지를 합성하기 위한 제2 뉴럴 네트워크를 트레이닝할 수 있다. 상기 제1 뉴럴 네트워크 내지 상기 제2 뉴럴 네트워크는, 도 8의 뉴럴 네트워크(810)의 구조를 가질 수 있고, 도 7의 모델(700)의 일부로 포함될 수 있다. 상기 제1 뉴럴 네트워크는, 도 6의 깊이 맵 생성기(610) 내에 포함될 수 있다. 상기 제2 뉴럴 네트워크는, 도 6의 출력 이미지 생성기(620) 내에 포함될 수 있다. 도 12의 동작들(1240, 1250)의 순서는, 도 12 내 순서에 제한되지 않는다. 예를 들어, 동작들(1240, 1250)은, 전자 장치에 의해 동시에 수행되거나, 또는 도 12의 동작들(1240, 1250)의 순서와 상이한 순서를 따라 수행될 수 있다.

상술한 바와 같이, 일 실시예에 따른, 전자 장치는 시맨틱 맵으로부터 현실적인 이미지를 합성하기 위하여, 상기 시맨틱 맵으로부터 하나 이상의 깊이 맵들을 획득할 수 있다. 상기 하나 이상의 깊이 맵들은, 전자 장치에 의해 합성될 상기 이미지로 원근감을 추가하기 위해 이용될 수 있다. 전자 장치는 트레이닝된 뉴럴 네트워크들이 연쇄적으로 연결된 구조에 기반하여, 상기 하나 이상의 깊이 맵들과 관련된 입력을 수신할 수 있다. 상기 입력에 응답하여, 전자 장치는 상기 입력을 수행한 사용자의 의도에 기반하는 이미지를 합성할 수 있다.

상술한 바와 같은, 일 실시예에 따른, 전자 장치(electronic device)는, 인스트럭션들을 저장하기 위한 메모리, 및 상기 메모리와 작동적으로 결합된(operably coupled to) 적어도 하나의 프로세서를 포함할 수 있다. 상기 적어도 하나의 프로세서는, 상기 인스트럭션들이 실행될 때에, 하나 이상의 색상들에 의하여 구분되는 하나 이상의 영역들을 포함하는 제1 이미지를 식별할 수 있다. 상기 적어도 하나의 프로세서는, 상기 식별된 제1 이미지에 기반하여, 상기 제1 이미지에 포함된 상기 하나 이상의 영역들에 기반하는 적어도 하나의 깊이 맵을 획득할 수 있다. 상기 적어도 하나의 프로세서는, 상기 식별된 제1 이미지, 및 상기 적어도 하나의 깊이 맵에 기반하여, 상기 하나 이상의 영역들의 색상들에 의해 지시되는(indicated by) 하나 이상의 피사체들을 포함하는 제2 이미지를 획득할 수 있다.

예를 들어, 상기 적어도 하나의 깊이 맵은, 상기 하나 이상의 영역들 중 제1 영역 내 제1 픽셀에 할당된(assigned) 제1 깊이 값을 포함할 수 있다. 상기 적어도 하나의 깊이 맵은, 상기 제1 픽셀과 상이한, 상기 제1 영역 내 제2 픽셀에 할당되고, 상기 제1 깊이 값과 상이한 제2 깊이 값을 포함할 수 있다.

예를 들어, 상기 적어도 하나의 프로세서는, 상기 인스트럭션들이 실행될 시에, 복수의 색상들에 의하여 구분되는 복수의 영역들을 포함하는 상기 제1 이미지를 획득할 수 있다. 상기 적어도 하나의 프로세서는, 상기 적어도 하나의 깊이 맵에 기반하여, 상기 복수의 색상들 각각에 매칭되는 상이한 타입들을 가지는, 복수의 피사체들을 포함하는 상기 제2 이미지를 획득할 수 있다.

예를 들어, 상기 적어도 하나의 프로세서는, 상기 인스트럭션들이 실행될 시에, 상기 식별된 제1 이미지에 기반하여, 복수의 깊이 맵들을 획득할 수 있다. 상기 적어도 하나의 프로세서는, 상기 복수의 깊이 맵들 중 하나의 깊이 맵을 선택하는 입력에 응답하여, 상기 선택된 깊이 맵, 및 상기 제1 이미지에 기반하여, 상기 제2 이미지를 획득할 수 있다.

예를 들어, 상기 전자 장치는, 디스플레이를 더 포함할 수 있다. 상기 적어도 하나의 프로세서는, 상기 인스트럭션들이 실행될 시에, 상기 적어도 하나의 깊이 맵의 획득에 응답하여, 상기 디스플레이 내에, 상기 적어도 하나의 깊이 맵에 포함된 적어도 하나의 깊이 값을 조절하기 위한 화면을 표시할 수 있다.

예를 들어, 상기 적어도 하나의 프로세서는, 상기 인스트럭션들이 실행될 시에, 상기 메모리 내에 저장된 복수의 파라미터들에 의해 지시되는 뉴럴 네트워크로, 상기 제1 이미지, 및 적어도 하나의 난수(random number)를 입력하여, 상기 적어도 하나의 깊이 맵을 획득할 수 있다.

예를 들어, 상기 적어도 하나의 프로세서는, 상기 인스트럭션들이 실행될 시에, 상기 메모리 내에 저장된 복수의 파라미터들에 의해 지시되는 뉴럴 네트워크로, 상기 적어도 하나의 깊이 맵, 상기 제1 이미지, 및 적어도 하나의 난수를 입력하여, 상기 제2 이미지를 획득할 수 있다.

예를 들어, 상기 제1 이미지는, 상기 하나 이상의 영역들의 형태, 또는 상기 하나 이상의 영역들에 채워진(filled) 상기 하나 이상의 색상들 중 적어도 하나에 기반하여, 상기 하나 이상의 피사체들을 나타내기 위한 시맨틱 맵(semantic map)일 수 있다.

예를 들어, 상기 제2 이미지는, 상기 적어도 하나의 깊이 맵에 의해 지시되는 지형을 포함할 수 있다.

예를 들어, 상기 적어도 하나의 프로세서는, 상기 인스트럭션들이 실행될 시에, 상기 제1 이미지에 기반하여, 상기 하나 이상의 영역들 내에서의 깊이 분포를 나타내는, 상기 적어도 하나의 깊이 맵을 획득할 수 있다. 상기 적어도 하나의 프로세서는, 상기 깊이 분포에 기반하여 배치된 상기 하나 이상의 피사체들을 포함하는 상기 제2 이미지를 획득할 수 있다.

상술한 바와 같은, 일 실시예에 따른, 전자 장치의 방법은, 하나 이상의 피사체들의 형태, 및 위치를 지시하는 시맨틱 맵을 식별하는 동작을 포함할 수 있다. 상기 전자 장치의 방법은, 상기 시맨틱 맵에 기반하여, 상기 시맨틱 맵에 포함된 복수의 픽셀들의 깊이 값들을 포함하는 복수의 후보 깊이 맵들을 획득하는 동작을 포함할 수 있다. 상기 전자 장치의 방법은, 상기 복수의 후보 깊이 맵들에 기반하여, 상기 시맨틱 맵에 매칭되는 깊이 맵을 식별하는 동작을 포함할 수 있다. 상기 전자 장치의 방법은, 상기 식별된 깊이 맵, 및 상기 시맨틱 맵에 기반하여, 상기 하나 이상의 피사체들이 배치된, 하나 이상의 이미지들을 획득하는 동작을 포함할 수 있다.

예를 들어, 상기 시맨틱 맵은, 상이한 색상들이 채워진 복수의 영역들을 포함할 수 있다. 상기 상이한 색상들은, 상기 하나 이상의 피사체들의 타입을 나타내고, 상기 복수의 영역들의 형태는, 상기 하나 이상의 피사체들의 상기 형태, 및 상기 위치를 나타낼 수 있다.

예를 들어, 상기 복수의 후보 깊이 맵들을 획득하는 동작은, 상기 시맨틱 맵, 및 적어도 하나의 수치 값(numeric value)을 수신하는 뉴럴 네트워크를 이용하여, 상기 복수의 영역들 중 제1 영역 내 깊이 분포를 포함하는, 상기 복수의 후보 깊이 맵들을 획득하는 동작을 포함할 수 있다.

예를 들어, 상기 깊이 맵을 식별하는 동작은, 상기 복수의 후보 깊이 맵들을 상기 전자 장치의 디스플레이 내에 표시하는 동작을 포함할 수 있다. 상기 깊이 맵을 식별하는 동작은, 상기 복수의 후보 깊이 맵들 중 어느 하나를 선택하는 입력을 수신하는 동작을 포함할 수 있다. 상기 깊이 맵을 식별하는 동작은, 상기 입력에 의해 선택된 깊이 맵을, 상기 시맨틱 맵에 매칭되는 깊이 맵으로 식별하는 동작을 포함할 수 있다.

예를 들어, 상기 하나 이상의 이미지들을 획득하는 동작은, 상기 식별된 깊이 맵, 및 하나 이상의 난수들을 수신하는 뉴럴 네트워크를 이용하여, 상기 하나 이상의 이미지들을 획득하는 동작을 포함할 수 있다. 상기 하나 이상의 이미지들의 개수는, 상기 하나 이상의 난수들의 개수에 매칭될 수 있다.

상술한 바와 같은, 전자 장치의 방법은, 하나 이상의 색상들에 의하여 구분되는 하나 이상의 영역들을 포함하는 제1 이미지를 식별하는 동작을 포함할 수 있다. 상기 전자 장치의 방법은, 상기 식별된 제1 이미지에 기반하여, 상기 제1 이미지에 포함된 상기 하나 이상의 영역들에 기반하는 적어도 하나의 깊이 맵을 획득하는 동작을 포함할 수 있다. 상기 전자 장치의 방법은, 상기 식별된 제1 이미지, 및 상기 적어도 하나의 깊이 맵에 기반하여, 상기 하나 이상의 영역들의 색상들에 의해 지시되는 하나 이상의 피사체들을 포함하는 제2 이미지를 획득하는 동작을 포함할 수 있다.

예를 들어, 상기 적어도 하나의 깊이 맵은, 상기 하나 이상의 영역들 중 제1 영역 내 제1 픽셀에 할당된 제1 깊이 값, 및 상기 제1 픽셀과 상이한, 상기 제1 영역 내 제2 픽셀에 할당되고, 상기 제1 깊이 값과 상이한 제2 깊이 값을 포함할 수 있다.

예를 들어, 상기 제2 이미지를 획득하는 동작은, 복수의 색상들에 의하여 구분되는 복수의 영역들을 포함하는 상기 제1 이미지, 및 상기 적어도 하나의 깊이 맵에 기반하여, 상기 복수의 색상들 각각에 매칭되는 상이한 타입들을 가지는, 복수의 피사체들을 포함하는 상기 제2 이미지를 획득하는 동작을 포함할 수 있다.

예를 들어, 상기 적어도 하나의 깊이 맵을 획득하는 동작은, 상기 식별된 제1 이미지에 기반하여, 복수의 깊이 맵들을 획득하는 동작을 포함할 수 있다. 상기 제2 이미지를 획득하는 동작은, 상기 복수의 깊이 맵들 중 하나의 깊이 맵을 선택하는 입력에 응답하여, 상기 선택된 깊이 맵, 및 상기 제1 이미지에 기반하여, 상기 제2 이미지를 획득하는 동작을 포함할 수 있다.

예를 들어, 상기 적어도 하나의 깊이 맵을 획득하는 동작은, 상기 적어도 하나의 깊이 맵의 획득에 응답하여, 상기 전자 장치의 디스플레이 내에, 상기 적어도 하나의 깊이 맵에 포함된 적어도 하나의 깊이 값을 조절하기 위한 화면을 표시하는 동작을 포함할 수 있다.

상술한 바와 같은, 일 실시예에 따른, 전자 장치는, 인스트럭션들을 저장하기 위한 메모리, 및 상기 메모리와 작동적으로 결합된(operably coupled to) 적어도 하나의 프로세서를 포함할 수 있다. 상기 적어도 하나의 프로세서는, 상기 인스트럭션들이 실행될 때에, 하나 이상의 피사체들의 형태, 및 위치를 지시하는 시맨틱 맵을 식별할 수 있다. 상기 적어도 하나의 프로세서는, 상기 시맨틱 맵에 기반하여, 상기 시맨틱 맵에 포함된 복수의 픽셀들의 깊이 값들을 포함하는 복수의 후보 깊이 맵들을 획득할 수 있다. 상기 적어도 하나의 프로세서는, 상기 식별된 깊이 맵, 및 상기 시맨틱 맵에 기반하여, 상기 하나 이상의 피사체들이 배치된, 하나 이상의 이미지들을 획득할 수 있다.

이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 어플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.

소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 컴퓨터 저장 매체 또는 장치에 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.

실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 이때, 매체는 컴퓨터로 실행 가능한 프로그램을 계속 저장하거나, 실행 또는 다운로드를 위해 임시 저장하는 것일 수도 있다. 또한, 매체는 단일 또는 수 개의 하드웨어가 결합된 형태의 다양한 기록수단 또는 저장수단일 수 있는데, 어떤 컴퓨터 시스템에 직접 접속되는 매체에 한정되지 않고, 네트워크 상에 분산 존재하는 것일 수도 있다. 매체의 예시로는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM 및 DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical medium), 및 ROM, RAM, 플래시 메모리 등을 포함하여 프로그램 명령어가 저장되도록 구성된 것이 있을 수 있다. 또한, 다른 매체의 예시로, 어플리케이션을 유통하는 앱 스토어나 기타 다양한 소프트웨어를 공급 내지 유통하는 사이트, 서버 등에서 관리하는 기록매체 내지 저장매체도 들 수 있다.

이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.

그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims

전자 장치(electronic device)에 있어서,

인스트럭션들을 저장하기 위한 메모리; 및

상기 메모리와 작동적으로 결합된(operably coupled to) 적어도 하나의 프로세서를 포함하고,

상기 적어도 하나의 프로세서는, 상기 인스트럭션들이 실행될 때에,

하나 이상의 색상들에 의하여 구분되는 하나 이상의 영역들을 포함하는 제1 이미지를 식별하고;

상기 식별된 제1 이미지에 기반하여, 상기 제1 이미지에 포함된 상기 하나 이상의 영역들에 기반하는 적어도 하나의 깊이 맵을 획득하고; 및

상기 식별된 제1 이미지, 및 상기 적어도 하나의 깊이 맵에 기반하여, 상기 하나 이상의 영역들의 색상들에 의해 지시되는(indicated by) 하나 이상의 피사체들을 포함하는 제2 이미지를 획득하는, 전자 장치.
제1항에 있어서,

상기 적어도 하나의 깊이 맵은,

상기 하나 이상의 영역들 중 제1 영역 내 제1 픽셀에 할당된(assigned) 제1 깊이 값, 및 상기 제1 픽셀과 상이한, 상기 제1 영역 내 제2 픽셀에 할당되고, 상기 제1 깊이 값과 상이한 제2 깊이 값을 포함하는, 전자 장치.
제1항에 있어서,

상기 적어도 하나의 프로세서는, 상기 인스트럭션들이 실행될 시에,

복수의 색상들에 의하여 구분되는 복수의 영역들을 포함하는 상기 제1 이미지, 및 상기 적어도 하나의 깊이 맵에 기반하여, 상기 복수의 색상들 각각에 매칭되는 상이한 타입들을 가지는, 복수의 피사체들을 포함하는 상기 제2 이미지를 획득하는, 전자 장치.
제1항에 있어서,

상기 적어도 하나의 프로세서는, 상기 인스트럭션들이 실행될 시에,

상기 식별된 제1 이미지에 기반하여, 복수의 깊이 맵들을 획득하고;

상기 복수의 깊이 맵들 중 하나의 깊이 맵을 선택하는 입력에 응답하여, 상기 선택된 깊이 맵, 및 상기 제1 이미지에 기반하여, 상기 제2 이미지를 획득하는, 전자 장치.
제1항에 있어서,

디스플레이를 더 포함하고,

상기 적어도 하나의 프로세서는, 상기 인스트럭션들이 실행될 시에,

상기 적어도 하나의 깊이 맵의 획득에 응답하여, 상기 디스플레이 내에, 상기 적어도 하나의 깊이 맵에 포함된 적어도 하나의 깊이 값을 조절하기 위한 화면을 표시하는, 전자 장치.
제1항에 있어서,

상기 적어도 하나의 프로세서는, 상기 인스트럭션들이 실행될 시에,

상기 메모리 내에 저장된 복수의 파라미터들에 의해 지시되는 뉴럴 네트워크로, 상기 제1 이미지, 및 적어도 하나의 난수(random number)를 입력하여, 상기 적어도 하나의 깊이 맵을 획득하는, 전자 장치.
제1항에 있어서,

상기 적어도 하나의 프로세서는, 상기 인스트럭션들이 실행될 시에,

상기 메모리 내에 저장된 복수의 파라미터들에 의해 지시되는 뉴럴 네트워크로, 상기 적어도 하나의 깊이 맵, 상기 제1 이미지, 및 적어도 하나의 난수를 입력하여, 상기 제2 이미지를 획득하는, 전자 장치.
제1항에 있어서,

상기 제1 이미지는,

상기 하나 이상의 영역들의 형태, 또는 상기 하나 이상의 영역들에 채워진(filled) 상기 하나 이상의 색상들 중 적어도 하나에 기반하여, 상기 하나 이상의 피사체들을 나타내기 위한 시맨틱 맵(semantic map)인, 전자 장치.
제1항에 있어서,

상기 제2 이미지는,

상기 적어도 하나의 깊이 맵에 의해 지시되는 지형을 포함하는, 전자 장치.
제1항에 있어서,

상기 적어도 하나의 프로세서는, 상기 인스트럭션들이 실행될 시에,

상기 제1 이미지에 기반하여, 상기 하나 이상의 영역들 내에서의 깊이 분포를 나타내는, 상기 적어도 하나의 깊이 맵을 획득하고,

상기 깊이 분포에 기반하여 배치된 상기 하나 이상의 피사체들을 포함하는 상기 제2 이미지를 획득하는, 전자 장치.
전자 장치의 방법에 있어서,

하나 이상의 피사체들의 형태, 및 위치를 지시하는 시맨틱 맵을 식별하는 동작;

상기 시맨틱 맵에 기반하여, 상기 시맨틱 맵에 포함된 복수의 픽셀들의 깊이 값들을 포함하는 복수의 후보 깊이 맵들을 획득하는 동작;

상기 복수의 후보 깊이 맵들에 기반하여, 상기 시맨틱 맵에 매칭되는 깊이 맵을 식별하는 동작; 및

상기 식별된 깊이 맵, 및 상기 시맨틱 맵에 기반하여, 상기 하나 이상의 피사체들이 배치된, 하나 이상의 이미지들을 획득하는 동작을 포함하는, 방법.
제11항에 있어서,

상기 시맨틱 맵은,

상이한 색상들이 채워진 복수의 영역들을 포함하고,

상기 상이한 색상들은, 상기 하나 이상의 피사체들의 타입을 나타내고, 상기 복수의 영역들의 형태는, 상기 하나 이상의 피사체들의 상기 형태, 및 상기 위치를 나타내는, 방법.
제12항에 있어서,

상기 복수의 후보 깊이 맵들을 획득하는 동작은,

상기 시맨틱 맵, 및 적어도 하나의 수치 값(numeric value)을 수신하는 뉴럴 네트워크를 이용하여, 상기 복수의 영역들 중 제1 영역 내 깊이 분포를 포함하는, 상기 복수의 후보 깊이 맵들을 획득하는 동작을 포함하는, 방법.
제11항에 있어서,

상기 깊이 맵을 식별하는 동작은,

상기 복수의 후보 깊이 맵들을 상기 전자 장치의 디스플레이 내에 표시하는 동작;

상기 복수의 후보 깊이 맵들 중 어느 하나를 선택하는 입력을 수신하는 동작; 및

상기 입력에 의해 선택된 깊이 맵을, 상기 시맨틱 맵에 매칭되는 깊이 맵으로 식별하는 동작을 포함하는, 방법.
제11항에 있어서,

상기 하나 이상의 이미지들을 획득하는 동작은,

상기 식별된 깊이 맵, 및 하나 이상의 난수들을 수신하는 뉴럴 네트워크를 이용하여, 상기 하나 이상의 이미지들을 획득하는 동작을 포함하고,

상기 하나 이상의 이미지들의 개수는, 상기 하나 이상의 난수들의 개수에 매칭되는, 방법.
전자 장치의 방법에 있어서,

하나 이상의 색상들에 의하여 구분되는 하나 이상의 영역들을 포함하는 제1 이미지를 식별하는 동작;

상기 식별된 제1 이미지에 기반하여, 상기 제1 이미지에 포함된 상기 하나 이상의 영역들에 기반하는 적어도 하나의 깊이 맵을 획득하는 동작; 및

상기 식별된 제1 이미지, 및 상기 적어도 하나의 깊이 맵에 기반하여, 상기 하나 이상의 영역들의 색상들에 의해 지시되는 하나 이상의 피사체들을 포함하는 제2 이미지를 획득하는 동작을 포함하는, 방법.
제16항에 있어서,

상기 적어도 하나의 깊이 맵은,

상기 하나 이상의 영역들 중 제1 영역 내 제1 픽셀에 할당된 제1 깊이 값, 및 상기 제1 픽셀과 상이한, 상기 제1 영역 내 제2 픽셀에 할당되고, 상기 제1 깊이 값과 상이한 제2 깊이 값을 포함하는, 방법.
제16항에 있어서,

상기 제2 이미지를 획득하는 동작은,

복수의 색상들에 의하여 구분되는 복수의 영역들을 포함하는 상기 제1 이미지, 및 상기 적어도 하나의 깊이 맵에 기반하여, 상기 복수의 색상들 각각에 매칭되는 상이한 타입들을 가지는, 복수의 피사체들을 포함하는 상기 제2 이미지를 획득하는 동작을 포함하는, 방법.
제16항에 있어서,

상기 적어도 하나의 깊이 맵을 획득하는 동작은,

상기 식별된 제1 이미지에 기반하여, 복수의 깊이 맵들을 획득하는 동작을 포함하고,

상기 제2 이미지를 획득하는 동작은,

상기 복수의 깊이 맵들 중 하나의 깊이 맵을 선택하는 입력에 응답하여, 상기 선택된 깊이 맵, 및 상기 제1 이미지에 기반하여, 상기 제2 이미지를 획득하는 동작을 포함하는, 방법.
제16항에 있어서,

상기 적어도 하나의 깊이 맵을 획득하는 동작은,

상기 적어도 하나의 깊이 맵의 획득에 응답하여, 상기 전자 장치의 디스플레이 내에, 상기 적어도 하나의 깊이 맵에 포함된 적어도 하나의 깊이 값을 조절하기 위한 화면을 표시하는 동작을 포함하는, 방법.