WO2019177181A1

WO2019177181A1 - 뉴럴 네트워크를 이용하여 상황을 인지하는 증강 현실 제공 장치, 제공 방법 및 상기 방법을 실행하기 위하여 매체에 저장된 컴퓨터 프로그램

Info

Publication number: WO2019177181A1
Application number: PCT/KR2018/002868
Authority: WO
Inventors: 최상조; 박희철; 노형준
Original assignee: 라인플러스(주)
Priority date: 2018-03-12
Filing date: 2018-03-12
Publication date: 2019-09-19
Also published as: US11501500B2; KR102423903B1; JP7295132B2; KR20220106855A; JP2021520535A; US20200410770A1; KR20200108484A

Abstract

본 실시예에 따르면, 프로세서에 의해 영상을 획득하는 단계; 상기 프로세서에 의해, 상기 영상을 분석하여 상기 영상에 포함된 평면에 가상 오브젝트를 배치시키도록 상기 영상을 렌더링하는 단계; 상기 영상에 포함된 현재 프레임을 이전 프레임과 비교함으로써, 상기 현재 프레임의 장면 전환 여부를 결정하고, 상기 현재 프레임의 장면 전환 여부를 고려하여 상기 영상에 대한 상황 인지 처리 여부를 결정하는 단계; 상기 상황 인지 처리 여부가 참으로 결정된 경우, 뉴럴 네트워크를 이용하여 상기 영상 및/또는 센서부로부터 수신된 센싱 값을 분석하여 하나 이상의 상황 정보를 산출하는 단계; 및 상기 상황 정보를 적용한 추가 컨텐츠를 생성하고, 상기 추가 컨텐츠를 제공하는 단계;를 포함하는 뉴럴 네트워크를 이용하여 상황을 인지하는 증강 현실 제공 방법이 개시된다.

Description

뉴럴 네트워크를 이용하여 상황을 인지하는 증강 현실 제공 장치, 제공 방법 및 상기 방법을 실행하기 위하여 매체에 저장된 컴퓨터 프로그램

본 발명의 명세서에 따르면, 뉴럴 네트워크를 이용하여 상황을 인지하는 증강 현실 제공 장치, 제공 방법 및 상기 방법을 실행하기 위하여 매체에 저장된 컴퓨터 프로그램에 관한 것이다.

증강현실(Augmented Reality, AR)은 가상현실(Virtual Reality)의 한 분야로 실제 환경에 가상 사물이나 정보를 합성하여 원래의 환경에 존재하는 사물처럼 보이도록 하는 컴퓨터 그래픽 기법이다. 현실세계에 실시간으로 부가정보를 갖는 가상세계를 합쳐 하나의 영상으로 보여주므로 혼합현실(Mixed Reality, MR)이라고도 한다.

증강 현실을 구현하기 위해서, 촬영 영상의 각 프레임에 가상 오브젝트를 추가하는 과정은 영상의 매 프레임 마다 실시되어야 하기 때문에 촬영 영상의 해상도, 프레임 레이트 등에 따라서 다소 많은 프로세서의 처리 능력이 필요하다. 프로세서의 처리 능력을 제한적으로 포함하는 모바일 컴퓨팅 장치의 경우, 가상 오브젝트의 렌더링 과정 및 뉴럴 네트워크를 이용하여 상황 정보를 산출하는 과정을 동시에 수행하기 어려운 문제가 있을 수 있다.

본 발명의 실시예들은 제한된 성능의 컴퓨팅 디바이스에서 이미지 센서를 통해 획득된 영상에 증강 현실을 제공하면서, 뉴럴 네트워크를 이용하여 실시간으로 영상을 분석하고, 분석 결과를 반영한 영상을 제공할 수 있다.

본 발명의 실시예들에 따른 뉴럴 네트워크를 이용하여 상황을 인지하는 증강 현실 제공 방법은 프로세서에 의해 영상을 획득하는 단계; 상기 프로세서에 의해, 상기 영상을 분석하여 상기 영상에 포함된 평면에 가상 오브젝트를 배치시키도록 상기 영상을 렌더링하는 단계; 상기 영상에 포함된 현재 프레임을 이전 프레임과 비교함으로써, 상기 현재 프레임의 장면 전환 여부를 결정하는 것을 포함하는 판단 기준에 기초하여 상기 영상에 대한 상황 인지 처리 여부를 결정하는 단계; 상기 상황 인지 처리 여부가 참으로 결정된 경우, 뉴럴 네트워크를 이용하여 상기 영상 및/또는 센서부로부터 수신된 센싱 값을 분석하여 하나 이상의 상황 정보를 산출하는 단계; 및 상기 상황 정보를 적용한 추가 컨텐츠를 생성하고, 상기 추가 컨텐츠를 제공하는 단계;를 포함할 수 있다.

상기 영상에 대한 상황 인지 처리 여부를 결정하는 단계에서, 상기 판단기준은 상기 프로세서의 처리 능력이 임계 값을 초과하는지 여부를 결정하는 것을 더 포함할 수 있다.

상기 영상에 대한 상황 인지 처리 여부를 결정하는 단계에서, 상기 판단기준은 상기 영상의 출력 프레임 레이트가 평균 프레임 레이트 미만에 해당하는 지 여부를 결정하는 것을 더 포함할 수 있다.

상기 장면 전환 여부를 결정하는 것은, 상기 현재 프레임의 픽셀들을 컬러값에 따라 분포시킨 분포도를 산출하고, 상기 분포도를 상기 이전 프레임의 분포도와 비교함으로서, 장면 전환 여부를 결정할 수 있다.

상기 장면 전환 여부를 결정하는 것은, 상기 현재 프레임에서 검출한 엣지 정보를 이용하여 상기 엣지 정보를 종합하여 물체의 색상 및 형태를 추출하고, 상기 물체의 색상 및 형태를 이용하여 장면 전환 여부를 결정할 수 있다.

상기 상황 정보를 산출하는 단계는 입력된 사용자 입력에 대응하여 산출하는 상황 정보의 종류를 상기 사용자 입력에 따라 한정하여 획득할 수 있다.

상기 영상은 카메라에 의해 촬영되거나, 다른 애플리케이션에 의해 생성되어 출력되는 화상 데이터일 수 있다.

상기 추가 컨텐츠를 제공하는 단계는 상기 상황 정보를 포함하는 컨텐츠를 제공하거나, 상기 상황 정보를 활용한 대화 형식의 음성 발화 컨텐츠를 생성하여 상기 가상 오브젝트를 통해 제공할 수 있다.

상기 하나 이상의 상황 정보들을 산출하는 단계는 각 상황 정보에 대한 매칭 확률을 더 포함하는 확률맵의 형태로 산출하고, 각 상황 정보에 대한 매칭 확률을 기초로 상기 하나 이상의 상황 정보를 순위화하여 전달할 수 있다.

본 발명의 실시예들에 따른 하나 이상의 프로세서에 의해 실행할 수 있는 명령어를 포함하는 메모리; 및 상기 메모리에 결합되고 명령어들을 실행 가능한 하나 이상의 프로세서를 포함하는 영상 처리 장치에 있어서, 상기 메모리는 영상을 획득하고, 상기 영상을 분석하여 상기 영상에 포함된 평면에 가상 오브젝트를 배치시키도록 상기 영상을 렌더링하는 렌더링 모듈; 상기 영상에 포함된 현재 프레임을 이전 프레임과 비교함으로써, 상기 현재 프레임의 장면 전환 여부를 결정하는 것을 포함하는 판단 기준에 기초하여 상기 영상에 대한 상황 인지 처리 여부를 결정하는 판단 모듈; 상기 상황 인지 처리 여부가 참으로 결정된 경우, 뉴럴 네트워크를 이용하여 상기 영상 및/또는 센서부로부터 수신된 센싱 값을 분석하여 하나 이상의 상황 정보를 산출하는 상황 인지 모듈; 및 상기 상황 정보를 적용한 추가 컨텐츠를 생성하고, 상기 추가 컨텐츠를 제공하는 편집 모듈을 포함할 수 있다.

상기 판단 기준은 상기 프로세서의 처리 능력이 임계 값을 초과하는지 여부를 결정하는 것을 더 포함할 수 있다.

상기 판단기준은 상기 영상의 출력 프레임 레이트가 평균 프레임 레이트 미만에 해당하는지 여부를 결정하는 것을 더 포함할 수 있다.

상기 상황 인지 모듈은 입력된 사용자 입력에 대응하여 산출하는 상황 정보의 종류를 상기 사용자 입력에 따라 한정하여 획득할 수 있다.

상기 편집 모듈은 상기 상황 정보를 포함하는 컨텐츠를 제공하거나, 상기 상황 정보를 활용한 대화 형식의 음성 발화 컨텐츠를 생성하여 상기 가상 오브젝트를 통해 제공할 수 있다.

상기 상황 인지 모듈은 각 상황 정보에 대한 매칭 확률을 더 포함하는 확률맵의 형태로 산출하고, 각 상황 정보에 대한 매칭 확률을 기초로 상기 하나 이상의 상황 정보를 순위화하여 전달할 수 있다.

본 발명의 실시예에 따른 컴퓨터 프로그램은 컴퓨터를 이용하여 본 발명의 실시예에 따른 방법 중 어느 하나의 방법을 실행시키기 위하여 매체에 저장될 수 있다.

이 외에도, 본 발명을 구현하기 위한 다른 방법, 다른 시스템 및 상기 방법을 실행하기 위한 컴퓨터 프로그램을 기록하는 컴퓨터 판독 가능한 기록 매체가 더 제공된다.

전술한 것 외의 다른 측면, 특징, 이점이 이하의 도면, 특허청구범위 및 발명의 상세한 설명으로부터 명확해 질 것이다.

본 발명의 실시예들에 따른, 제한된 성능의 단말기에서 증강 현실과 딥러닝 기반의 영상 처리를 동시에 수행하는 방법 및 상기 방법을 실행하기 위해서 매체에 저장된 컴퓨터 프로그램은 뉴럴 네트워크를 기반으로 영상 처리의 수행 간격 또는 빈도를 조절함으로써, 컴퓨팅 디바이스의 컴퓨팅 리소스 부족으로 인한 화면 출력 지연을 방지하고, 컴퓨팅 디바이스의 전원 소모를 낮출 수 있다.

또한, 본 발명의 실시예들에 따른, 제한된 성능의 단말기에서 증강 현실과 뉴럴 네트워크 기반의 영상 처리를 동시에 수행하는 방법 및 상기 방법을 실행하기 위해서 매체에 저장된 컴퓨터 프로그램은 증강 현실을 제공하는 쓰레드에 컴퓨팅 리소스를 우선적으로 할당함으로써, 컴퓨팅 디바이스의 컴퓨팅 리소스 부족으로 인한 화면 출력 지연을 방지할 수 있다.

도 1은 본 발명의 실시예들에 따른 시스템의 구조를 나타내는 도면이다.

도 2는 본 발명의 실시예들에 따른 뉴럴 네트워크를 이용하여 상황을 인지하는 증강 현실 애플리케이션의 구조를 나타내는 블록도이다.

도 3은 본 발명의 실시예에 따른 뉴럴 네트워크를 이용하여 상황을 인지하는 증강 현실 제공 방법의 흐름도이다.

도 4는 렌더링 모듈의 동작을 설명하기 위한 흐름도이다.

도 5는 판단 모듈의 동작을 설명하기 위한 흐름도이다.

도 6은 제한된 프로세서에 의해 복수의 모듈들이 처리되는 과정을 설명하기 위한 도면이다.

도 7 내지 도 9는 판단 모듈에 의해서 현재 프레임 및 이전 프레임을 비교하는 동작을 설명하기 위한 도면이다.

도 10a 내지 도 10d는 상황 인지 모듈을 통해 획득된 상황 정보를 활용하는 실시예들을 설명하는 도면들이다.

본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시예를 가질 수 있는바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 본 발명의 효과 및 특징, 그리고 그것들을 달성하는 방법은 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 다양한 형태로 구현될 수 있다.

여기서, 뉴럴 네트워크(neural network)는, 통계학적 기계 학습의 결과를 이용하여, 이미지 내 다양한 속성들을 추출하여 이용함으로써, 이미지 내의 객체들을 식별 및/또는 판단하는 알고리즘 집합일 수 있다. 뉴럴 네트워크는, 뉴럴 네트워크에 입력된 이미지 내에 포함된 다양한 속성들을 추상화함으로써, 이미지 내의 객체들을 식별할 수 있다. 이 경우, 이미지 내 속성들을 추상화한다는 것은, 이미지로부터 속성들을 검출하여, 검출된 속성들 중에서 핵심 속성을 판단하는 것일 수 있다.

본 명세서에 개시된 증강현실 제공 장치들은 하드웨어 또는 소프트웨어와 하드웨어의 조합으로 구현될 수 있다. 예를 들어, 그들은 운영 체제 커널(operating system kernel)로, 별도의 사용자 프로세스로, 네트워크 애플리케이션들 내로 한정된 라이브러리 패키지로, 특수하게 구성된 기계 상에서, 또는 네트워크 인터페이스 카드 상에서 구현될 수 있다. 특정 실시예에서, 본 명세서에 개시된 기술들은 운영 체제와 같은 소프트웨어로 또는 운영 체제 상에서 구동하는 애플리케이션으로 구현될 수 있다.

본 명세서에 개시된 증강현실 제공 실시예(들) 중 적어도 일부 실시예(들)의 소프트웨어/하드웨어 하이브리드 구현예(들)가 메모리에 저장된 컴퓨터 프로그램에 의해 선택적으로 활성화되거나 재구성된 프로그래밍가능 기계 상에서 구현될 수 있다. 그러한 네트워크 디바이스들은 상이한 유형들의 네트워크 통신 프로토콜들을 활용하도록 구성될 수 있거나 설계될 수 있는 다수의 네트워크 인터페이스들을 가질 수 있다. 이들 기계들 중 일부를 위한 일반적인 아키텍처는 본 명세서에 개시된 설명들로부터 나타날 수 있다. 구체적인 실시예들에 따르면, 본 명세서에 개시된 다양한 증강현실 제공 실시예들의 특징들 및/또는 기능들 중 적어도 일부는 최종 사용자 컴퓨터 시스템, 컴퓨터, 네트워크 서버 또는 서버 시스템, 모바일 컴퓨팅 디바이스(예컨대, 개인용 디지털 어시스턴트, 모바일 전화기, 스마트폰, 랩톱, 태블릿 컴퓨터, 또는 기타 등등), 소비자 전자 디바이스, 음악 플레이어, 또는 임의의 기타 적합한 전자 디바이스, 라우터, 스위치, 또는 기타 등등, 또는 이들의 임의의 조합과 같은 하나 이상의 범용 네트워크 호스트 기계들 상에서 구현될 수 있다. 적어도 일부 실시예들에서, 본 명세서에 개시된 다양한 증강현실 제공 실시예들의 특징들 및/또는 기능들 중 적어도 일부는 하나 이상의 가상화된 컴퓨팅 환경들(예컨대, 네트워크 컴퓨팅 클라우드들, 또는 기타 등등)에서 구현될 수 있다.

이제, 도 2를 참조하면, 본 명세서에 개시된 증강현실 제공 특징들 및/또는 기능들 중 적어도 일부를 구현하는 데 적합한 컴퓨팅 디바이스(100)를 묘사한 블록 다이어그램이 도시되어 있다. 컴퓨팅 디바이스(100)는 예를 들어 최종 사용자 컴퓨터 시스템, 네트워크 서버 또는 서버 시스템, 모바일 컴퓨팅 디바이스(예컨대, 스마트폰, 랩톱, 태블릿 컴퓨터, 또는 기타 등등), 소비자 전자 디바이스, 음악 플레이어, 또는 임의의 기타 적합한 전자 디바이스, 또는 이들의 임의의 조합 또는 일부일 수 있다. 컴퓨팅 디바이스(100)는, 무선이든 유선이든, 그러한 통신을 위한 공지 프로토콜들을 이용하여, 인터넷과 같은 통신 네트워크를 통해, 클라이언트들 및/또는 서버들과 같은 다른 컴퓨팅 디바이스들과 통신하도록 구성될 수 있다.

일 실시예에서, 컴퓨팅 디바이스(100)는 중앙 프로세싱 유닛(CPU)(110), 메모리(130), 입출력 장치(140), 카메라(150)을 포함한다. 적절한 소프트웨어 또는 펌웨어의 제어 하에서 작용할 때, CPU(110)는 특수하게 구성된 컴퓨팅 디바이스 또는 기계의 기능들과 연관된 특정 기능들을 구현할 책임이 있을 수 있다. 예를 들어, 적어도 하나의 실시예에서, 사용자의 단말기(100)는 CPU(110), 메모리(130), 입출력 장치(I/O, 140), 및 카메라(150)을 활용하는 전자 장치로서 기능하도록 구성되거나 설계될 수 있다. 적어도 하나의 실시예에서, CPU(110)는 예를 들어 운영 체제 및 임의의 적절한 애플리케이션 소프트웨어, 드라이버들 등을 포함할 수 있는, 소프트웨어 모듈들/컴포넌트들의 제어 하에서 증강 현실의 가상 오브젝트의 렌더링, 뉴럴 네트워크를 기반한 상황 인지, 및 기능들 및/또는 동작들 중 하나 이상을 수행하게 할 수 있다.

CPU(110)는 예를 들어 퀄컴(Qualccom) 또는 인텔(Intel) 계열의 마이크로프로세서들 또는 MIPS 계열의 마이크로프로세서들로부터의 프로세서와 같은, 하나 이상의 프로세서(들)(110)를 포함할 수 있다. 또한, CPU(110)는 그래픽 처리를 위한 프로세서인 GPU를 포함할 수 있다. 일부 실시예들에서, 프로세서(들)(110)는 컴퓨팅 디바이스(100)의 동작들을 제어하기 위해 특수하게 설계된 하드웨어(예컨대, ASIC(application-specific integrated circuit), EEPROM(electrically erasable programmable read-only memory), FPGA(field-programmable gate array) 등)를 포함할 수 있다. 특정 실시예에서, 메모리(130)(예컨대, 비휘발성 RAM 및/또는 ROM)는 또한 CPU(110)의 일부분을 형성한다. 그러나, 메모리가 시스템에 커플링될 수 있는 많은 상이한 방식들이 있다. 메모리 블록(130)은 예를 들어 데이터의 캐싱 및/또는 저장, 명령어들의 프로그래밍 등과 같은 다양한 목적들을 위해 사용될 수 있다. 도 1에서는 CPU(110)가 하나로 도시되어 있지만, 이에 한정되지 않고 하나 이상의 CPU(110)가 구비될 수 있다.

본 명세서에 사용되는 바와 같이, 용어 "프로세서"는 단지 당업계에서 프로세서로 지칭되는 이들 집적 회로들로 한정되는 것이 아니라, 광범위하게 마이크로컨트롤러, 마이크로컴퓨터, 프로그래밍 가능한 로직 제어기, ASIC, 및 임의의 기타 프로그래밍가능 회로를 지칭한다.

일 실시예에서, 인터페이스들(160)은 인터페이스 카드들로서 제공된다. 대체로, 이들은 컴퓨팅 네트워크를 통해 데이터 패킷들의 전송 및 수신을 제어하며, 때때로 컴퓨팅 디바이스(100)와 함께 사용되는 다른 주변기기들을 지원한다. 제공될 수 있는 인터페이스들 중에는 이더넷 인터페이스들, 프레임 릴레이(frame relay) 인터페이스들, 케이블 인터페이스들, DSL 인터페이스들, 토큰 링 인터페이스들 등이 있다. 추가로, 예를 들어 USB(universal serial bus), 시리얼(Serial), 이더넷, 파이어와이어, PCI, 패러렐, 무선 주파수(RF), 블루투스TM, 근거리장 통신(예컨대, 근거리 자기장을 이용함), 802.11(WiFi), 프레임 릴레이, TCP/IP, ISDN, 고속 이더넷 인터페이스, 기가비트 이더넷 인터페이스, ATM(asynchronous transfer mode) 인터페이스, HSSI(high-speed serial interface) 인터페이스, POS(Point of Sale) 인터페이스, FDDI(fiber data distributed interface) 등과 같은 다양한 유형의 인터페이스들이 제공될 수 있다. 일반적으로, 그러한 인터페이스들(160)은 적절한 매체와의 통신에 적절한 포트들을 포함할 수 있다. 일부 경우들에 있어서, 그들은 또한 독립 프로세서를 포함할 수 있고, 일부 경우들에 있어서 휘발성 및/또는 비휘발성 메모리(예컨대, RAM)를 포함할 수 있다.

도 1에 도시된 시스템은 본 명세서에 기술된 본 발명의 기술들을 구현하기 위해 컴퓨팅 디바이스(100)에 대한 하나의 특정 아키텍처를 예시하지만, 그것이 결코 본 명세서에 기술된 특징들 및 기술들 중 적어도 일부가 구현될 수 있게 되는 유일한 디바이스 아키텍처인 것은 아니다. 예를 들어, 하나 또는 임의의 다수의 프로세서들(110)을 갖는 아키텍처들이 사용될 수 있으며, 그러한 프로세서들(110)은 단일 디바이스에 존재할 수 있거나 또는 임의의 다수의 디바이스들 중에 분산될 수 있다. 일 실시예에서, 프로세서(110)는 라우팅 연산들뿐만 아니라 통신들을 다룬다. 다양한 실시예들에서, 상이한 유형들의 상황 정보 생성 특징들 및/또는 기능들이 클라이언트 디바이스(예컨대, 클라이언트 소프트웨어를 구동시키는 개인용 스마트폰) 및 서버 시스템(들)(예컨대, 하기에 더 상세히 기술되는 서버 시스템)을 포함하는 상황 정보 생성 시스템에서 구현될 수 있다.

네트워크 디바이스 구성과는 무관하게, 본 발명의 시스템은 데이터, 범용 네트워크 동작들을 위한 프로그램 명령어들, 및/또는 본 명세서에 기술된 상황 정보 생성 기술들의 기능에 관한 기타 정보를 저장하도록 구성된 (예를 들어, 메모리 블록(65)과 같은) 하나 이상의 메모리들 또는 메모리 모듈들을 채용할 수 있다. 프로그램 명령어들은 예를 들어 운영 체제 및/또는 하나 이상의 애플리케이션들의 동작을 제어할 수 있다. 메모리 또는 메모리들은 또한 데이터 구조들, 광고 정보, 사용자 클릭 및 인가(impression) 정보, 및/또는 본 명세서에 기술된 기타 특정 비-프로그램 정보를 저장하도록 구성될 수 있다.

그러한 정보 및 프로그램 명령어들이 본 명세서에 설명된 시스템들/방법들을 구현하기 위해 채용될 수 있기 때문에, 적어도 일부 네트워크 디바이스 실시예들은, 예를 들어 본 명세서에 기술된 다양한 동작들을 수행하기 위해 프로그램 명령어들, 상태 정보 등을 저장하도록 구성될 수 있거나 설계될 수 있는 비일시적 기계 판독가능 저장 매체를 포함할 수 있다. 그러한 비일시적 기계 판독가능 저장 매체들의 예들은 하드 디스크, 플로피 디스크, 및 자기 테이프와 같은 자기 매체; CD-ROM 디스크와 같은 광학 매체; 플롭티컬 디스크(floptical disk)와 같은 자기-광학 매체, 및 ROM, 플래시 메모리, 멤리스터 메모리(memristor memory), RAM 등과 같이 프로그램 명령어들을 저장하도록 그리고 수행하도록 특정적으로 구성된 하드웨어 디바이스들을 포함하지만, 이들로 제한되지 않는다. 프로그램 명령어들의 예들은, 예컨대 컴파일러에 의해 생성된 기계 코드, 및 해석기를 사용하여 컴퓨터에 의해 실행될 수 있는 상위 레벨 코드를 포함한 파일들 양측 모두를 포함한다.

도 2는 본 발명의 실시예들에 따른 뉴럴 네트워크를 이용하여 상황을 인지하는 증강 현실 애플리케이션(200)의 구조를 나타내는 블록도이다. 증강 현실 애플리케이션(200)은 컴퓨팅 디바이스(100)의 메모리(130)에 포함되고 프로세서(110)의 제어에 의해서 수행될 수 있다. 증강 현실 애플리케이션(200)은 카메라에 의해 촬영되는 영상에 오브젝트를 중첩하여 실시간으로 표시하는 증강 현실을 제공할 수 있다. 상세히, 일 실시예에 따라 제공되는 증강 현실은 컴퓨팅 장치(100) 주변에 실제로 존재하는 평면을 인식하고 인식된 평면의 속성을 결정하여 이에 따른 가상의 오브젝트를 카메라에 의해 촬영되는 영상과 함께 실시간으로 표시할 수 있다. 증강 현실 애플리케이션(200)은 하드웨어 또는 소프트웨어 적으로 구현될 수 있다. 증강 현실 애플리케이션(200)에 포함되는 구성요소들의 일부는 하드웨어 적으로 또는 소프트웨어 적으로 각각 구현될 수 있다.

도 2에 도시된 바와 같이, 증강 현실 애플리케이션(200)은 렌더링 모듈(210), 판단 모듈(220), 상황 인지 모듈(230), 편집 모듈(240), 출력 제어 모듈(250)을 포함할 수 있다. 증강 현실 애플리케이션(200)은 카메라를 통해 촬영된 영상, 마이크를 통해 입력된 음성, 센서부를 통해 획득된 센싱 값 등을 수신할 수 있다. 이때, 증강 현실 애플리케이션(200)은 음성 인식 기술을 이용하여 마이크를 통해 입력된 음성을 텍스트로 변환할 수 있다. 증강 현실 애플리케이션(200)은 비전 인식 기술을 사용해서 촬영된 영상을 분석할 수 있다. 비전 인식 기술을 이용하여 영상 내에 포함되는 공간의 종류, 3차원 모델, 사물의 종류와 위치, 얼굴의 위치와 특징점, 특징 벡터 등이 도출될 수 있다. 증강 현실 애플리케이션(200)은 GPS 모듈을 통해 획득된 위치 정보를 이용하여 현재 위치 정보를 도출할 수 있다. 증강 현실 애플리케이션(200)은 음성, 영상, 센싱 값을 종합적으로 고려하여 사용자의 환경에 대한 상황 정보를 획득할 수 있다.

렌더링 모듈(210)은 입력된 영상, 이미지들에 증강 현실을 적용하는 기능을 수행한다. 렌더링 모듈(210)은 영상에 가상 오브젝트를 렌더링할 수 있다. 렌더링 모듈(210)은 센서부(거리 센서, 방향 센서 등)로부터 전방의 복수 포인트들까지의 거리들을 각각 획득할 수 있다. 렌더링 모듈(210)은 전방에 평면이 존재하는 경우 평면 상의 복수의 포인트까지의 각각의 거리 및 방향을 획득하고, 상기 복수의 포인트들을 포함하는 평면 정보, 예컨대 평면을 정의할 수 있는 정보로써 평면 방정식, 평면 벡터 등을 획득할 수 있다. 이때, 센서부(120)는 적외선 센서일 수 있으며 적외선을 발산하고 반사된 적외선을 수광하여 포인트까지의 거리를 측정할 수 있다. 또한, 센서부(120)는 초음파 센서일 수 있으며, 초음파를 발산한 후 반사된 초음파를 수신하여 초음파가 반사된 지점까지의 거리를 측정할 수 있다. 센서부(120)는 가속도 센서, 각속도 센서, 지자계 센서 또는 이들 중 적어도 둘의 조합일 수 있다. 센서부(120)는 중력 방향을 인식하여 중력 방향을 기준으로 단말이 향하는 방향을 측정할 수 있다.

렌더링 모듈(210)은 카메라에 촬영된 영상 및 센서부를 통해 획득된 평면 정보를 이용하여 영상에 가상 오브젝트를 렌더링할 수 있다. 가상 오브젝트는 시각 또는 청각으로 인식되도록 구현된 오브젝트이며 이미지, 텍스트, 사운드 등과 같이 형식에 제한이 없다. 가상 오브젝트는 획득된 평면에 배치되어 표현될 수 있다. 가상 오브젝트는 사용자의 음성 입력 또는 터치 입력에 의해 호출될 수 있다. 렌더링 모듈(210)은 사용자의 음성 및 터치 입력에 의해 정해진 추가적인 가상 오브젝트를 생성하여 렌더링할 수 있다. 렌더링 모듈(210)은 영상의 프레임 레이트에 따라 매 프레임에 하나 이상의 가상 오브젝트를 생성하여 렌더링할 수 있다. 렌더링 모듈(210)은 컴퓨팅 디바이스의 하나 이상의 프로세서 중 하나에 의해 수행되므로, 렌더링 모듈(210)의 처리 속도 즉 렌더링되어 입출력 장치를 통해 표시되는 속도는 프로세서의 처리 능력에 좌우될 수 있다. 예를 들어, 프로세서의 처리 능력이 증가하면, 렌더링 모듈(210)의 처리 속도는 증가된 프로세서의 처리 능력의 일정 비율 만큼 증가하고, 프로세서의 처리 능력이 감소하면, 렌더링 모듈(210)의 처리 속도는 감소된 프로세서의 처리 능력의 일정 비율 만큼 감소한다. 다른 실시예에서, 렌더링 모듈(210)의 처리 속도는 컴퓨팅 디바이스(100)의 현재 작업 중인 쓰레드에 의존하여 증가 또는 감소될 수 있다. 예를 들어, 현재 작업 중인 하나 이상의 쓰레드에 할당된 프로세서의 처리 능력을 제외한 나머지 처리 능력을 이용하여 렌더링 모듈(210)은 동작할 수 있다.

판단 모듈(220)은 증강 현실이 적용된 영상에 상황 인지 모듈의 실행 여부, 즉 실행 시점을 결정하는 기능을 수행할 수 있다. 판단 모듈(220)은 렌더링 모듈(210)과의 동시 실행에 따른 프로세서의 처리 능력의 부족으로 인한 영상의 출력 지연을 방지하기 위해서, 상황 인지 모듈의 실행 여부를 결정할 수 있다. 이를 통해, 상황 인지 모듈의 실행 빈도는 감소할 수 있다. 판단 모듈(220)은 입력된 데이터 즉, 영상, 입력된 음성, 위치 정보 등을 이용하여 상황 인지 모듈의 실행 여부를 판단할 수 있다. 판단 모듈(220)은 입력된 데이터를 이용하여 입력된 데이터의 처리에 사용될 프로세서의 처리 능력을 추론하고, 프로세서의 처리 능력 내에서, 상황 인지 모듈의 실행으로 인한 처리 속도 지연이 없는 상황인지 여부를 판단할 수 있다. 판단 모듈(220)은 입력된 데이터의 처리에 사용될 프로세서의 처리 능력을 이용하여, 상황 인지 모듈의 실행 여부를 판단할 수 있다.

판단 모듈(220)은 입력된 데이터를 이용하여 획득된 영상의 장면 전환 여부 등을 포함하는 판단 기준에 기초하여, 상황 인지 모듈의 실행 여부를 결정할 수 있다. 판단 기준은 현재 프레임 및 현재 프레임에 시간상으로 이전에 획득된 프레임(이하, 이전 프레임이라 함)을 비교함으로써, 현재 프레임에 상황 인지 모듈을 적용할지 여부를 결정할 수 있다. 판단 모듈(220)은 장면 전환 여부를 판단하기 위해서, 현재 프레임 및 이전 프레임 간의 비교 과정을 이용할 수 있다.

구체적인 비교 과정을 설명하면, 판단 모듈(220)은 현재 프레임의 제1 히스토그램 및 이전 프레임의 제2 히스토그램을 각각 산출하고, 산출된 제1 및 제2 히스토그램을 비교함으로써, 장면 전환 여부를 판단할 수 있다. 이때, 히스토그램은 영상의 현재 프레임의 픽셀들을 컬러값에 따라 분포시킨 분포도 일 수 있다. 구체적으로, 현재 프레임 내의 제1 컬러값을 가지는 픽셀수가 이전 프레임 내의 제 1 컬러값을 가지는 픽셀수에 비해서 특정 비율(예를 들어 50%) 이하로 매우 적거나 특정 비율(150%) 이상으로 매우 큰 경우, 현재 프레임 내에 장면 전환이 발생했다고 판단할 수 있다. 현재 프레임의 제1 히스토그램을 통해 제1 범위 내에 있는 픽셀수 및 제2 히스토그램을 통해 제2 범위 내에 있는 픽셀수를 비교함으로써, 현재 프레임이 이전 프레임과 다른 장면을 가진다고 판단할 수 있다.

판단 모듈(220)은 영상의 현재 프레임에서 검출되는 물체의 색상 및 형태를 이용하여 장면 전환 여부를 판단할 수 있다. 구체적으로, 판단 모듈(220)은 현재 프레임 내의 엣지 정보를 획득하고, 엣지 정보를 종합하여 물체의 색상 정보 및 형태 정보를 추출할 수 있다. 현재 프레임 내의 물체에 대한 정보가 이전 프레임 내의 물체에 대한 정보와 동일하지 않은 경우, 장면 전환이 발생했다고 판단할 수 있다. 프레임들에 존재하는 물체들 간의 대응 여부는 SIFT 알고리즘을 이용하여 결정될 수 있다. SIFT 알고리즘을 이용하여 각 물체의 크기, 위치, 방향이 변해도 변하지 않는 정보를 산출할 수 있다. 장면 전환 여부 등을 포함하는 판단 기준은 영상의 분석 결과 및 컴퓨팅 디바이스의 센서부를 통해 획득된 방향 정보, 모션 정보를 이용하여 결정할 수 있다. 컴퓨팅 디바이스의 방향 정보 및 모션 정보를 이용하여 컴퓨팅 디바이스의 방향을 3차원적으로 예측하고 이를 통해 장면 전환 발생 여부를 결정할 수 있다. 예를 들어, 컴퓨팅 디바이스의 방향 정보 또는 모션 정보가 이전에 획득된 방향 정보 또는 모션 정보와 기 설정된 임계값 이상으로 차이가 난 경우, 물리적으로 컴퓨팅 디바이스의 방향 또는 위치가 변경된 것으로 판단하고, 판단 결과를 기초로 장면 전환 발생 여부를 결정할 수 있다.

판단 모듈(220)은 장면 전환이 발생했다고 판단한 경우, 상황 인지 처리 여부를 참으로 결정하고, 상황 인지 모듈을 통해 영상의 상황 정보를 산출할 것을 요청할 수 있다.

다른 실시예에서, 판단 모듈(220)은 프로세서의 처리 능력을 고려하여 상황 인지 처리 여부를 판단할 수 있다. 판단 모듈(220)은 프로세서의 처리 능력 및 총 능력치에서의 처리 능력을 뺀 잔여 능력을 모니터링하여 실행되는 쓰레드, 프로그램 등에 의해 사용되는 프로세서의 처리 능력이 기 설정된 임계 값을 초과하는 경우 즉, 프로세서의 잔여 능력이 상황 인지 모듈을 실행시키기에 충분치 않다고 판단하고, 상황 인지 처리 여부를 거짓(FALSE)로 결정할 수 있다. 판단 모듈(220)은 영상 출력 속도 즉 영상 출력의 프레임 레이트를 고려하여 상황 인지 처리 여부를 다시 판단할 수 있다. 영상 출력 속도가 지연되지 않고 정상적으로 처리된다는 것은 프로세서 또는 메모리에 과부하가 걸리지 않음을 의미할 수 있다. 예를 들어, 영상 출력의 프레임 레이트가 평균 프레임 레이트 보다 낮게 감지된다는 것은 컴퓨팅 디바이스에 과부하가 발생됨을 의미할 수 있고, 이런 경우, 판단 모듈(220)은 상황 인지 처리 여부를 거짓(FALSE)로 판단할 수 있다.

상기의 기재와 같이 판단 모듈(220)은 입력 데이터, 영상의 장면 전환 여부, 프로세서의 성능, 처리 능력, 출력 데이터 즉 영상 출력 속도를 종합하여 상황 인지 모듈(230)의 실행 여부, 즉 상황 인지 처리 여부를 결정하는 기능을 수행하고, 선택된 일부 시점에만 상황 인지 모듈(230)을 실행할 수 있다. 구체적으로 판단 모듈(220)은 상황 인지 처리 여부가 참인 경우, 현재 프레임 및 상황 정보를 요청하는 신호를 상황 인지 모듈에 전달하고, 그에 대한 응답을 수신할 수 있다. 판단 모듈(220)은 상황 인지 처리 여부가 거짓인 경우에는 상황 정보를 획득하는 과정을 수행하지 않을 수 있다. 판단 모듈은 상황 인지 처리 여부가 거짓인 경우 상황 인지 모듈(230)의 호출 등을 수행하지 않는다. 판단 모듈(220)의 요청에 의해 상황 인지 모듈(230)은 하나 이상의 프로세서에 의해 렌더링 모듈(210)과 함께 실행될 수 있다. 이때, 컴퓨팅 디바이스의 운영체제(OS)는 상황 인지 모듈(230) 및 렌더링 모듈(210)의 실행을 위한 적절한 스케쥴링을 수행할 수 있다. 잔여 능력은 컴퓨팅 디바이스에서 실행 중인 프로그램들에 할당되는 처리 능력을 제외하고 사용 또는 할당되지 않은 처리 능력을 말할 수 있다.

상황 인지 모듈(230)은 판단 모듈(220)에 의해 실행되며, 뉴럴 네트워크를 이용하여 프레임 및/또는 센싱 값을 분석하고, 분석된 결과를 이용하여 상황 정보를 산출하고, 상황 정보를 판단 모듈(220)에 전달할 수 있다. 상황 인지 모듈(230)은 입력 데이터인 프레임 및/또는 센싱 값에 포함된 하나 이상의 인자들을 분류하는 과정을 거쳐서 상황 정보라는 출력 데이터를 산출할 수 있다. 이때, 입력 데이터인 프레임 및/또는 센싱 값에 포함된 하나 이상의 인자들 및 출력 데이터인 상황 정보가 셋트로 학습되는 과정을 거칠 수 있다. 입력 데이터인 프레임 및/또는 센싱 값에 포함된 하나 이상의 인자들을 분류하는 것은 학습되는 과정에 입력된 입력 데이터에 포함된 하나 이상의 인자들 및 출력 데이터 사이의 연결을 이용할 수 있다. 이때, 입력 데이터는 출력 데이터의 추론으로 향하기 위한 히든 데이터와 연결될 수 있다. 여기서, 히든 데이터는 입력 또는 출력에 포함되지 않지만, 분류 과정에서 이용되는 인자, 또는 데이터를 말한다. 학습된 입력 데이터, 히든 데이터, 출력 데이터 중 적어도 2개의 사이의 연결을 이용하여 입력 데이터와 대응되는 출력 데이터가 산출될 수 있다. 본 실시예에 따른 입력 데이터는 프레임, 센싱 값, 사운드 데이터 등과 같이 다양한 종류일 수 있다. 본 실시예에 따른 출력 데이터는 하나 이상의 속성 정보를 포함하는 상황 정보가 될 수 있으며, 입력 데이터 및/또는 사용자에 의해 요청되는 데이터에 따라서 달라질 수 있다.

상황 인지 모듈(230)에서 이용하는 뉴럴 네트워크는 외부의 서버에 의해 사전 훈련되어 생성될 수 있으며, 상황 인지를 요청하는 입력 데이터 및 출력 데이터를 통해서 계속적으로 훈련되어 업데이트 될 수 있다. 입력되는 데이터의 양이 증가할수록 뉴럴 네트워크를 이용하여 획득된 상황 정보의 정확도는 높아질 수 있다. 또한, 뉴럴 네트워크에 포함된 입력 데이터, 히든 데이터, 출력 데이터 중 적어도 2개 사이의 연결 관계는 비선형적일 수 있다. 예를 들어, 제1 데이터 및 제2 데이터 사이의 제1 연결은 0 또는 1이 아닌 0.3와 같이 설정될 수 있다. 제1 데이터 및 제3 데이터 사이의 제2 연결이 0.7로 설정되어 제1 데이터는 3 대 7의 비율로 제2 데이터 또는 제3 데이터로 분류될 수 있다.

상황 인지 모듈(230)은 판단 모듈(220)에 의해 호출되어 실행되며 뉴럴 네트워크(neural network)를 기반으로 속성 정보 별로 처리하고, 영상에 포함된 프레임 및 마이크를 통해 입력된 사운드 데이터에 대응되는 하나 이상의 상황 정보를 산출하여 제공할 수 있다. 상황 인지 모듈(230)은 증강 현실 애플리케이션의 내부에 포함되거나, 다른 애플리케이션, 운영체제에 포함될 수도 있고, 외부의 장치에 포함될 수도 있다. 판단 모듈(220)은 네트워크를 통해 상황 인지 모듈(230)과 데이터를 송수신할 수 있다.

여기서, 상황 정보는 컴퓨팅 디바이스의 주변에 발생되는 다양한 속성 정보를 포함할 수 있다. 예를 들어 상황 정보는 주변 장소에 대한 정보(이름, 위치, 가는 경로 등), 컴퓨팅 디바이스를 통해 인식되는 사물에 대한 정보(명칭, 상품 명, 상세 정보 등), 컴퓨팅 디바이스를 통해 인식되는 인물에 대한 정보(나이, 감정, 닮은 꼴 등)의 정보를 포함할 수 있다. 본 발명의 실시예들에 따르면, 상황 정보는 뉴럴 네트워크를 이용하여 촬영된 영상, 센싱 값, 사운드 데이터 중 적어도 하나로부터 획득될 수 있다.

편집 모듈(240)은 뉴럴 네트워크를 이용하여 현재 프레임의 상황 정보를 적용한 추가 컨텐츠를 생성할 수 있다. 추가 컨텐츠는 사용자에 의해 설정된 캐릭터, 장소, 건축물, 이펙트 등의 그래픽 데이터일 수 있다. 추가 컨텐츠의 구체적인 예는 도 10a, 도 10b, 도 10c, 도 10d를 통해 설명하겠다.

출력 제어 모듈(250)은 렌더링 모듈(210) 및 편집 모듈(240)을 통해 수신된 화상 데이터를 출력하도록 제어한다.

본 발명의 실시예에 따르면, 증강 현실 애플리케이션은 제한된 컴퓨팅 성능 하에서, 영상에 그래픽 데이터를 추가하는 증강 현실을 제공하면서 입력된 영상, 센싱 값, 사운드 데이터와 대응되는 상황 정보를 생성할 수 있다. 증강 현실 애플리케이션은 상황 정보의 생성 빈도수를 조절함으로써, 제한된 컴퓨팅 성능에 따른 과부하를 방지할 수 있다. 증강 현실 애플리케이션은 통신망이 단절된 상태에서도 외부 리소스의 사용 없이도 입력 데이터와 대응되는 상황 정보를 산출할 수 있다.

S110에서는 증강 현실 애플리케이션은 영상을 획득한다. 여기서 영상은 실시간으로 카메라에 의해 촬영된 것일 수 있다. 또한, 영상은 다른 애플리케이션에 의해 생성된 다양한 프레임 셋 일 수 있다.

S120에서는 증강 현실 애플리케이션은 영상에 가상 오브젝트를 렌더링할 수 있다. 본 단계의 구체적인 동작은 도 4에서 설명하겠다. S130에서는 증강 현실 애플리케이션은 영상을 다운 샘플링할 수 있다. 증강 현실 애플리케이션은 영상을 복수의 스케일로 변환시킬 수 있다. 복수의 스케일로 변환된 영상은 이하, 스케일 공간일 수 있다. S140에서는 증강 현실 애플리케이션은 다운 샘플링된 영상에 장면 전환 여부 등을 판단한다. S140의 동작은 판단 모듈의 동작과 동일하므로 상세한 설명을 생략한다. S150에서는 영상에 장면 전환이 검출되는 경우, 증강 현실 애플리케이션은 상황 인지 모듈로 입력 데이터의 상황 정보를 요청할 수 있다. S160에서는 증강 현실 애플리케이션은 수신한 상황 정보를 이용하여 영상을 편집할 수 있다. 증강 현실 애플리케이션은 상황 정보를 이용하여 시각적 데이터를 추가적으로 제공할 수 있다. 증강 현실 애플리케이션은 수신한 상황 정보의 종류에 따라서 영상의 편집 방법은 달라질 수 있다. 영상의 편집 방법은 도 10a 내지 도 10d에 대한 설명에서 하겠다.

도 4는 렌더링 모듈의 동작을 설명하기 위한 흐름도이다.

도 4를 참조하면, 단계 S121에서 렌더링 모듈은 복수의 포인트에 대한 거리를 이용하여 복수의 포인트를 포함하는 평면에 대한 평면 정보를 산출한다. 렌더링 모듈은 복수의 포인트에 대한 방향 및 거리를 이용하여 복수의 포인트를 포함하는 평면에 대한 평면 정보를 산출할 수 있다.

단계 S122에서 렌더링 모듈은 센서부에 의해 측정된 단말의 방향 정보 및, 단계 S121에서 획득된 평면 정보를 이용하여, 평면의 노말 벡터를 획득한다. 렌더링 모듈은 방향 센서에 의해 측정된 단말의 방향 정보를 획득하고, 앞서 획득한 평면 정보와 단말의 방향 정보를 이용하여, 평면의 노말 벡터를 획득한다. 상세히, 렌더링 모듈은 평면 정보의 기준 방향을 단말의 방향(또는 단말에 설치된 거리 센서가 향하는 방향)에서 방향 센서의 기준 방향으로 변환한다. 상세히, 렌더링 모듈은 단말의 방향을 기준으로 획득된 평면의 방향 정보를 방향 센서에 의해 측정된 단말의 방향 정보(가속도 센서에 의해 인식되는 중력 방향을 기준으로 함)만큼 이동시킴으로써, 최종적으로 중력 방향을 기준으로 하는 평면의 방향 정보를 획득한다. 이와 같이 획득된 중력방향 기준 평면의 방향 정보는 평면의 노말 벡터라고 볼 수 있다.

단계 S123에서 렌더링 모듈은 평면의 노말 벡터를 고려하여 가상 오브젝트의 파라미터를 결정한다. 렌더링 모듈은 평면의 노말 벡터를 고려하여, 평면에 표시할 가상 오브젝트의 파라미터를 결정한다. 오브젝트는 복수의 파라미터를 포함할 수 있다. 파라미터는 예컨대, 가상 오브젝트의 색상, 기울기, 카테고리, 종류, 방향 및 오브젝트에 적용되는 애니메이션일 수 있다. 예를 들어, 렌더링 모듈은 평면의 노말 벡터의 방향에 대응하도록 가상 오브젝트의 기울기를 설정할 수 있다.

렌더링 모듈은 평면의 노말 벡터를 고려하여, 평면의 속성을 구분할 수 있다. 또한 렌더링 모듈은 평면의 속성을 고려하여 가상 오브젝트의 파라미터를 결정할 수 있다. 평면의 속성은 예컨대 평면의 종류로써, 바닥, 벽, 천장으로 구분될 수 있다. 렌더링 모듈은 평면이 바닥인지, 벽인지, 천장인지에 따라 오브젝트의 파라미터를 달리 결정할 수 있다. 예를 들어, 렌더링 모듈은 평면이 벽인 경우 평면을 뚫고나오는 경로로 오브젝트가 이동하도록, 애니메이션 파라미터를 설정할 수 있다. 렌더링 모듈은 평면이 바닥인 경우 바닥 위에서 바닥과 평행하게 이동하는 애니메이션 파라미터를 설정할 수 있다.

렌더링 모듈은 평면의 노말 벡터에 따라 결정된 평면의 속성과 평면의 방향 정보(단말의 방향을 기준으로 하는)를 각각 고려하여 가상 오브젝트의 파라미터를 결정할 수 있다. 예를 들어, 렌더링 모듈은 평면의 속성에 따라 오브젝트의 제1 파라미터를 결정하고, 평면의 노말 벡터에 따라 가상 오브젝트의 제2 파라미터를 결정할 수 있다. 예를 들어, 렌더링 모듈은 평면의 속성에 따라 오브젝트의 색상을 결정하고, 평면의 방향에 따라 가상 오브젝트의 기울기를 결정할 수 있다. 오브젝트가 아이콘인 경우, 렌더링 모듈은 평면의 종류에 따라 아이콘의 색상을 다르게 결정하고, 평면의 방향에 따라 아이콘의 기울기를 결정할 수 있다. 기울기는 3차원의 아이콘 표시 정보를 2차원으로 렌더링하여 표시하기 위한 기울기이거나, 아이콘의 가로/세로 표시 비율일 수 있다.

단계 S123에서 렌더링 모듈은 연결된 입출력 장치를 통해 오브젝트를 표시한다. 렌더링 모듈은 카메라에 의해 촬영된 영상에서 평면을 추출하고 평면에 가상 오브젝트를 배치시킨다. 가상 오브젝트의 표시 방향은 3차원의 가구 표시 정보를 2차원으로 렌더링하여 표시하기 위한 것일 수 있으나 이에 한정하지 않고, 2차원의 가구 표시 정보를 회전 및/또는 스케일링하여 표시하기 위한 것일 수 있다. 가상 오브젝트의 파라미터가 애니메이션을 포함하는 경우, 렌더링 모듈은 애니메이션을 적용하여 가상 오브젝트를 표시한다. 예를 들어, “벽” 속성의 평면에 대해 벽을 뚫고 나오는 애니메이션이 설정된 가상 오브젝트를 표시하는 경우, 렌더링 모듈은 오브젝트에 대하여 불투명한 가상 레이어를 평면에 겹쳐 표시하고, 가상 오브젝트를 가상 레이어 뒤에서 앞으로 이동시켜 표시함으로써, 가상 오브젝트가 평면을 뚫고 나오는 듯한 애니메이션을 표시한다. 가상 레이어는 가상 오브젝트 외의 다른 표시에 대하여서는 투명하게 설정될 수 있다.

일 실시예에 따르면, 렌더링 모듈은 “천장”속성의 평면에 대해 해, 달, 별의 이미지를 표시하는 가상 오브젝트를 설정할 수 있다. 일 실시예에 따르면 렌더링 모듈은 복수의 평면 사이를 이동하는 가상 오브젝트를 설정할 수 있다. 예를 들어, “천장” 속성의 평면에서 “바닥” 속성의 평면을 향하여 이동하는 물방울 오브젝트를 설정할 수 있다. 물방울 오브젝트는, “바닥”속성의 평면에 도달하면 해당 평면과 동일한 방향으로 흩어지는 애니메이션을 포함할 수 있다.

도 5는 판단 모듈의 동작을 설명하기 위한 흐름도이다.

판단 모듈(220)은 상황 인지 모듈을 이용하여 상황 정보를 획득하는 시점을 판단하는 기능을 수행한다. 판단 모듈을 통해, 본 발명의 실시예에 따른 영상 처리 방법은 촬영 영상에 가상 오브젝트를 추가하고 촬영 영상의 상황 정보에 따른 추가 컨텐츠를 동시에 제공하는데 있어서, 프로세서의 처리 능력을 효율적으로 관리할 수 있다.

도 5를 참조하면, 단계 S141에서 판단 모듈(220)은 영상에 포함된 프레임 셋트 중 현재 프레임을 선택한다. 판단 모듈(220)은 현재 프레임을 이전 프레임과 비교함으로써 현재 프레임의 장면 전환 발생 여부를 결정할 수 있다. 현재 프레임의 컬러값 분포인 히스토그램을 이용하여 컬러값에 따른 픽셀수가 이전 프레임의 해당 컬러값에 따른 픽셀수에 비해서 기설정된 기준 비율 이상의 차이가 나타나는 경우, 현재 프레임에 장면 전환 발생 여부를 참으로 결정할 수 있다. 판단 모듈(220)은 현재 프레임의 출현 객체의 형태 및 색상을 추출하고, 현재 프레임의 출현 객체 및 이전 프레임의 출현 객체 사이의 동일성 여부를 판단하고, 출현 객체들이 동일한 경우, 현재 프레임에 장면 전환 발생 여부를 참으로 결정할 수 있다.

상기의 설명과 같이, 판단 모듈(220)은 상황 인지 모듈의 실행 빈도를 낮춰 제한된 프로세서의 처리 능력을 이용하여 본 실시예에 따른 증강 현실 컨텐츠의 구현 및 출력이 원활히 이루어지도록 할 수 있다.

도 6(a)를 통해 하나의 모듈이 프로세서에 의해 처리되고 입출력되는 과정을 설명할 수 있다. 제 1 모듈(module 1)은 프로세서에 의해 제 1 시간(t1) 동안에 실행되고, 실행된 결과가 제2 시간(t2) 동안에 입출력되고, 다시 프로세서에 의해 제3 시간(t3) 동안 실행되고, 실행된 결과가 제4 시간(t4) 동안 입출력 된다.

도 6(b)를 통해 렌더링 모듈(module 1) 및 상황 인지 모듈(module 2)를 동시에 실행하는 과정을 설명하겠다. 각 모듈은 프로세서에 의해 처리되고 입출력 장치에 의해 출력되는 과정을 교차하여 수행할 수 있다. 도 6(b)에 도시된 바와 같이, 각 모듈의 입출력은 프로세서의 처리 능력을 사용하지 않을 수 있다. 렌더링 모듈 (module 1)이 프로세서에 의해 처리되는 시간 이후에 프로세서는 상황 인지 모듈 (module 2)이 처리될 수 있다. 이후, 렌더링 모듈의 입출력 시간이 지난 이후에 프로세서는 렌더링 모듈(module 1)을 처리하게 된다. 이때, 렌더링 모듈(module 1)의 처리는 상황 인지 모듈(module 2)의 실행을 위해서 tB 시간 만큼 지연될 수 있다. 이런 경우, 판단 모듈(220)은 렌더링 모듈(module 1)이 입출력 되고 있는 시점에 상황 인지 모듈 (module 2)의 실행 여부를 판단하고 판단 결과 실행이 필요한 경우에만 상황 인지 모듈 (module 2)를 실행시킬 수 있다. 판단 모듈의 판단에 따라 상황 인지 모듈 (module 2)의 실행을 하지 않는 경우, 렌더링 모듈 (module 1)의 실행은 지체되지 않을 수 있다.

판단 모듈(220)은 상황 인지 모듈의 실행이 지연되거나 또는 상황 인지 모듈의 처리로 인해 렌더링 모듈의 실행이 지체되는 것을 방지할 수 있다. 판단 모듈(220)은 상황 인지 모듈의 실행이 필요한 시점인지를 판단함으로써, 제한된 컴퓨팅 디바이스의 성능으로 인해 실행되어야 하는 모듈들의 처리가 지연되는 것을 방지할 수 있다.

촬영된 영상은 일정 시간 구간으로 제1 프레임 셋(SET1) 및 제2 프레임 셋(SET2)로 분류될 수 있다. 판단 모듈(220)은 제1 프레임 셋(SET1)의 제1 프레임(f1)을 임의로 선택하고 제2 프레임 셋(SET2)의 제2 프레임(f2)를 임의로 선택할 수 있다. 판단 모듈(220)은 제1 프레임(f1)의 픽셀들을 컬러값을 기준으로 분포도(H1)를 만든다. 제1 분포도(H1)는 제1 프레임(f1)의 픽셀들을 컬러값에 따라서 카운팅하여, 컬러값 별로 픽셀수를 그래프로 나타낸 것이다. 제2 분포도(H2) 역시 동일한 방식으로 생성된다. 도 7에 도시된 바와 같이 컬러값이 달라지더라도 제1 분포도(H1) 및 제2 분포도(H2)의 분포 형태를 비교하여 일치하거나 10% 내에서 유사한 경우에는 장면 전환이 없다고 판단할 수 있다.

도 8에 도시된 바와 같이 판단 모듈(220)은 처리해야 하는 데이터의 양을 줄이기 위해서 프레임의 일 영역을 추출하여 비교할 수 있다. 판단 모듈(220)은 제1 프레임(f1)의 일 영역 및 제2 프레임(f2)의 일 영역을 비교함으로써, 제1 프레임 및 제2 프레임 사이의 장면 전환 여부를 결정할 수 있다.

도 9에 도시된 바와 같이 판단 모듈(220)은 제1 프레임의 엣지를 추출하고 제2 프레임의 엣지를 추출하고 프레임들로부터 추출한 엣지들을 비교함으로써, 제1 프레임 및 제2 프레임 사이의 장면 전환 여부를 결정할 수 있다. 판단 모듈(220)은 제1 프레임의 엣지로부터 출현 물체의 모양인 직사각형(edge 1)을 획득하고 제2 프레임의 엣지로부터 출현 물체의 모양인 원기둥(edge 2)을 획득하고 프레임들의 출현 물체들의 모양들을 비교함으로써, 제1 프레임 및 제2 프레임 사이의 장면 전환 여부를 결정할 수 있다. 즉 판단 모듈(220)은 제1 프레임 및 제2 프레임 간에 장면이 전환되었다고 판단할 수 있다.

도 10a에 도시된 바와 같이 증강 현실 애플리케이션은 입출력 장치를 통해 제공되는 영상에 증강 현실을 렌더링할 수 있다. 특히, 증강 현실 애플리케이션은 촬영되는 영상에 존재하는 평면을 인식하고 평면에 가상 오브젝트를 배치시킬 수 있다. 증강 현실 애플리케이션은 획득된 평면을 가상 오브젝트(obj 2)로 생성하여 렌더링하고, 상기 평면에 캐릭터인 가상 오브젝트(obj 1)를 배치시킬 수 있다. 이때 가상 오브젝트(obj 1)는 기 설정된 명령 신호에 응답하여 생성될 수 있다. 예를 들어, 기설정된 명령 신호인 ‘나와라’를 음성 또는 텍스트의 형태로 입력 받게 되면, 가상 오브젝트(obj1)가 렌더링 될 수 있다.

도 10b에 도시된 바와 같이 증강 현실 애플리케이션은 영상에 존재하는 사람 얼굴에 대해서 나이, 감정, 닮은 꼴 정보를 상황 정보로 획득하여 제공할 수 있다. 증강 현실 애플리케이션은 비전 인식 기술을 사용하여 촬영된 영상 내에 사람 얼굴이 있는지를 판단할 수 있다. 촬영된 영상 내에 사람 얼굴이 감지된 경우, 사람 얼굴 영역(a2, a3)들은 사각형으로 오버랩 될 수 있다. 증강 현실 애플리케이션은 사람 얼굴의 감지에 응답하여 가상 오브젝트와의 상호 작용을 만들 수 있다. 예를 들어, 사람 얼굴의 감지에 응답하여 가상 오브젝트는‘몇 살로 보여?(a4)’, ‘기분이 어떤지 궁금해(a5)’, ‘누굴 닮은 것 같지 않아?(a6)’ 등과 같은 추가 컨텐츠를 음성으로 제공할 수 있다. 증강 현실 애플리케이션은 추가 컨텐츠들에 대한 선택 입력에 따라 상황 인지 모듈을 호출하고 상황 정보를 수신 받을 수 있다. a4에 대한 선택 입력에 따라 증강 현실 애플리케이션은 상황 인지 모듈을 통해 산출된 사람의 나이를 확률 맵으로 획득할 수 있다. 증강 현실 애플리케이션은 확률 맵에 포함된 나이 및 나이에 대한 확률값을 텍스트 또는 가상 오브젝트의 음성으로 출력할 수 있다. 기분 정보 또는 닮은 꼴 정보 역시 상황 인지 모듈을 통해 획득될 수 있다.

증강 현실 애플리케이션은 상황 인지 모듈을 통해 획득된 상황 정보를 기초로 영상에 포함된 사물의 명칭(a7)을 텍스트, 이미지, 음성 등의 형식으로 제공할 수 있다.

도 10d에 도시된 바와 같이, 증강 현실 애플리케이션은 상황 인지 모듈을 통해 획득된 상황 정보를 기반으로 사용자와 대화를 할 수 있다. 증강 현실 애플리케이션은 자장면이라는 상황 정보을 이용하여 가상 오브젝트는 ‘자장면!! 맛있겠다.’와 같은 대화(a8)를 생성할 수 있다. 상황 정보에 포함된 장소, 사물 등을 이용하여 대화가 이루어질 수 있다.

그 외에 지역, 위치 등과 같은 상황 정보가 인식된 경우, 가상 오브젝트는 지역, 위치 등에 대한 대화를 발화시킬 수 있다.

증강 현실 애플리케이션은 영상으로부터 사람의 얼굴을 학습함으로써, 1회 이상 감지된 사람 얼굴이 감지된 경우, 이와 같은 상황 정보를 반영하여‘반가워요. 자주 마주치네요.’와 같은 대화를 제공할 수 있다.

촬영된 영상에 장애물이 출현하는 등의 상황 정보가 산출된 경우, 가상 오브젝트가 놀라운 표정을 나타내도록 생성할 수 있다.

증강 현실 애플리케이션에 의해서 제공되는 가상 오브젝트는 특정 기능을 가지도록 설정될 수 있다.

예를 들어, 사용자에 의해 가상 오브젝트는 사용자의 명령에 따른 출력을 제공하는‘비서’로 설정될 수 있다. 증강 현실 애플리케이션은 영상을 통해 획득된 비전 분석 정보와 위치 정보, 날씨 정보와 같은 현실 메타 정보를 기초로 필요 정보를 생성하여 ‘비서’로 설정된 가상 오브젝트를 통해 제공할 수 있다.

증강 현실 애플리케이션은 사용자에 의해 설정된 게임 캐릭터를 가상 오브젝트로 증강할 수 있다. 게임 캐릭터인 가상 오브젝트는 기 설정된 게임 캐릭터의 나이, 성별, 취미, 성향 등에 따라서 행동하도록 구현될 수 있다. 예를 들어, 촬영된 영상으로부터‘카페’가 출력된 경우, 가상 오브젝트는 출력인 ‘카페’를 반영하여 게임 상에서의 성향에 따라 좋아하는 음료인 ‘커피’를 주문해 달라는 음성을 발화하도록 구현될 수 있다.

증강 현실 애플리케이션은 사용자에 의해 설정된 펫을 가상 오브젝트로 증강할 수 있다. 강아지 등과 같은 펫으로 설정된 가상 오브젝트는 펫의 특성에 따라 촬영된 영상에 포함된 ‘공’, ‘간식’ 등에 반응하도록 구현될 수 있다.

가상 오브젝트는 타 애플리케이션과의 연계를 통해서 촬영된 영상을 통해 획득된 상황 정보에 따라 다양한 대화를 발생시킬 수 있다. 예를 들어, 가상 오브젝트는 길 안내 애플리케이션과 연계 하여 길 안내 영상을 통해 획득된 상황 정보에 따라 대화를 제공할 수 있다. 가상 오브젝트는 길 안내 영상에 있는 건물, 길 등에 대한 정보를 음성 발화로 제공할 수 있다. 가상 오브젝트는 길 안내 애플리케이션에 의해 제공되는 음성과는 차별되는 대화 형식의 음성 발화가 제공되며 동승한 친구, 가족 등의 역할을 수행하며, 운전자에게 친근한 대화를 전달하는 역할을 수행할 수 있다.

증강 현실 애플리케이션은 실시간으로 촬영된 영상을 이용하여 상황 정보를 획득하고, 상황 정보(방의 구조, 벽지 색상, 크기, 기존 가구의 배치 등)를 고려하여 인테리어를 추천할 수 있다. 예를 들어, 증강 현실 애플리케이션은 어울리는 가구, 화분, 액세서리 등을 추천할 수 있다.

이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 어플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.

소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.

실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.

이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.

그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims

프로세서에 의해 영상을 획득하는 단계;

상기 프로세서에 의해, 상기 영상을 분석하여 상기 영상에 포함된 평면에 가상 오브젝트를 배치시키도록 상기 영상을 렌더링하는 단계;

상기 영상에 포함된 현재 프레임을 이전 프레임과 비교함으로써, 상기 현재 프레임의 장면 전환 여부를 결정하는 것을 포함하는 판단 기준에 기초하여 상기 영상에 대한 상황 인지 처리 여부를 결정하는 단계;

상기 상황 인지 처리 여부가 참으로 결정된 경우, 뉴럴 네트워크를 이용하여 상기 영상 및/또는 센서부로부터 수신된 센싱 값을 분석하여 하나 이상의 상황 정보를 산출하는 단계; 및

상기 상황 정보를 적용한 추가 컨텐츠를 생성하고, 상기 추가 컨텐츠를 제공하는 단계;를 포함하는 뉴럴 네트워크를 이용하여 상황을 인지하는 증강 현실 제공 방법.
제1항에 있어서,

상기 영상에 대한 상황 인지 처리 여부를 결정하는 단계에서, 상기 판단기준은

상기 프로세서의 처리 능력이 임계 값을 초과하는지 여부를 결정하는 것을 더 포함하는, 뉴럴 네트워크를 이용하여 상황을 인지하는 증강 현실 제공 방법.
제1항에 있어서,

상기 영상에 대한 상황 인지 처리 여부를 결정하는 단계에서, 상기 판단기준은

상기 영상의 출력 프레임 레이트가 평균 프레임 레이트 미만에 해당하는 지 여부를 결정하는 것을 더 포함하는, 뉴럴 네트워크를 이용하여 상황을 인지하는 증강 현실 제공 방법.
제1항에 있어서,

상기 장면 전환 여부를 결정하는 것은,

상기 현재 프레임의 픽셀들을 컬러값에 따라 분포시킨 분포도를 산출하고, 상기 분포도를 상기 이전 프레임의 분포도와 비교함으로서, 장면 전환 여부를 결정하는, 뉴럴 네트워크를 이용하여 상황을 인지하는 증강 현실 제공 방법.
제1항에 있어서,

상기 장면 전환 여부를 결정하는 것은,

상기 현재 프레임에서 검출한 엣지 정보를 이용하여 상기 엣지 정보를 종합하여 물체의 색상 및 형태를 추출하고, 상기 물체의 색상 및 형태를 이용하여 장면 전환 여부를 결정하는, 뉴럴 네트워크를 이용하여 상황을 인지하는 증강 현실 제공 방법.
제1항에 있어서,

상기 상황 정보를 산출하는 단계는

입력된 사용자 입력에 대응하여 산출하는 상황 정보의 종류를 상기 사용자 입력에 따라 한정하여 획득하는, 뉴럴 네트워크를 이용하여 상황을 인지하는 증강 현실 제공 방법.
제1항에 있어서,

상기 영상은

카메라에 의해 촬영되거나, 다른 애플리케이션에 의해 생성되어 출력되는 화상 데이터인, 뉴럴 네트워크를 이용하여 상황을 인지하는 증강 현실 제공 방법.
제1항에 있어서,

상기 추가 컨텐츠를 제공하는 단계는 상기 상황 정보를 포함하는 컨텐츠를 제공하거나, 상기 상황 정보를 활용한 대화 형식의 음성 발화 컨텐츠를 생성하여 상기 가상 오브젝트를 통해 제공하는, 뉴럴 네트워크를 이용하여 상황을 인지하는 증강 현실 제공 방법.
제1항에 있어서,

상기 하나 이상의 상황 정보들을 산출하는 단계는

각 상황 정보에 대한 매칭 확률을 더 포함하는 확률맵의 형태로 산출하고, 각 상황 정보에 대한 매칭 확률을 기초로 상기 하나 이상의 상황 정보를 순위화하여 전달하는, 뉴럴 네트워크를 이용하여 상황을 인지하는 증강 현실 제공 방법.
하나 이상의 프로세서에 의해 실행할 수 있는 명령어를 포함하는 메모리; 및 상기 메모리에 결합되고 명령어들을 실행 가능한 하나 이상의 프로세서를 포함하는 영상 처리 장치에 있어서,

상기 메모리는

영상을 획득하고, 상기 영상을 분석하여 상기 영상에 포함된 평면에 가상 오브젝트를 배치시키도록 상기 영상을 렌더링하는 렌더링 모듈;

상기 영상에 포함된 현재 프레임을 이전 프레임과 비교함으로써, 상기 현재 프레임의 장면 전환 여부를 결정하는 것을 포함하는 판단 기준에 기초하여 상기 영상에 대한 상황 인지 처리 여부를 결정하는 판단 모듈;

상기 상황 인지 처리 여부가 참으로 결정된 경우, 뉴럴 네트워크를 이용하여 상기 영상 및/또는 센서부로부터 수신된 센싱 값을 분석하여 하나 이상의 상황 정보를 산출하는 상황 인지 모듈; 및

상기 상황 정보를 적용한 추가 컨텐츠를 생성하고, 상기 추가 컨텐츠를 제공하는 편집 모듈을 포함하는 뉴럴 네트워크를 이용하여 상황을 인지하는 증강 현실 제공 장치.
제10항에 있어서,

상기 판단 기준은

상기 프로세서의 처리 능력이 임계 값을 초과하는지 여부를 결정하는 것을 더 포함하는, 뉴럴 네트워크를 이용하여 상황을 인지하는 증강 현실 제공 장치.
제10항에 있어서,

상기 판단기준은

상기 영상의 출력 프레임 레이트가 평균 프레임 레이트 미만에 해당하는지 여부를 결정하는 것을 더 포함하는, 뉴럴 네트워크를 이용하여 상황을 인지하는 증강 현실 제공 장치.
제10항에 있어서,

상기 장면 전환 여부를 결정하는 것은,

상기 현재 프레임의 픽셀들을 컬러값에 따라 분포시킨 분포도를 산출하고, 상기 분포도를 상기 이전 프레임의 분포도와 비교함으로서, 장면 전환 여부를 결정하는, 뉴럴 네트워크를 이용하여 상황을 인지하는 증강 현실 제공 장치.
제10항에 있어서,

상기 장면 전환 여부를 결정하는 것은,

상기 현재 프레임에서 검출한 엣지 정보를 이용하여 상기 엣지 정보를 종합하여 물체의 색상 및 형태를 추출하고, 상기 물체의 색상 및 형태를 이용하여 장면 전환 여부를 결정하는, 뉴럴 네트워크를 이용하여 상황을 인지하는 증강 현실 제공 장치.
제1항에 있어서,

상기 상황 인지 모듈은

입력된 사용자 입력에 대응하여 산출하는 상황 정보의 종류를 상기 사용자 입력에 따라 한정하여 획득하는, 뉴럴 네트워크를 이용하여 상황을 인지하는 증강 현실 제공 장치.
제10항에 있어서,

상기 영상은

카메라에 의해 촬영되거나, 다른 애플리케이션에 의해 생성되어 출력되는 화상 데이터인, 뉴럴 네트워크를 이용하여 상황을 인지하는 증강 현실 제공 장치.
제10항에 있어서,

상기 편집 모듈은

상기 상황 정보를 포함하는 컨텐츠를 제공하거나, 상기 상황 정보를 활용한 대화 형식의 음성 발화 컨텐츠를 생성하여 상기 가상 오브젝트를 통해 제공하는, 뉴럴 네트워크를 이용하여 상황을 인지하는 증강 현실 제공 장치.
제1항에 있어서,

상기 상황 인지 모듈은

각 상황 정보에 대한 매칭 확률을 더 포함하는 확률맵의 형태로 산출하고, 각 상황 정보에 대한 매칭 확률을 기초로 상기 하나 이상의 상황 정보를 순위화하여 전달하는, 뉴럴 네트워크를 이용하여 상황을 인지하는 증강 현실 제공 장치.
컴퓨터를 이용하여 제1항 내지 제9항 중 어느 한 항의 방법을 실행시키기 위하여 컴퓨터 판독 가능한 저장 매체에 저장된 컴퓨터 프로그램.