WO2024106567A1

WO2024106567A1 - 증강콘텐츠 변환을 위한 영상처리 시스템

Info

Publication number: WO2024106567A1
Application number: PCT/KR2022/018179
Authority: WO
Inventors: 동윤건
Original assignee: 주식회사 딥파인
Priority date: 2022-11-14
Filing date: 2022-11-17
Publication date: 2024-05-23
Also published as: KR102710968B1; KR20240070209A

Abstract

본 발명은 증강콘텐츠 변환을 위한 영상처리 시스템에 관한 것으로, 본 발명의 일실시예는 통신망을 통해 상호 통신하는 스마트 디바이스 및 영상처리서버를 포함하되, 상기 스마트 디바이스는, 사용자의 안면에 착용되어 상기 영상처리서버로 사용자가 바라보는 물체를 촬영한 실물영상과, 사용자의 음성 및/또는 제스처에 따른 콘텐츠 저작명령을 송신하고, 상기 영상처리서버는, 상기 스마트 디바이스로부터 상기 실물영상 및/또는 상기 콘텐츠 저작명령을 수신하여 상기 실물영상 및 상기 콘텐츠 저작명령을 분석하고, 상기 실물영상 및/또는 상기 콘텐츠 저작명령에 대응하는 증강현실 컨텐츠를 상기 스마트 디바이스에게 제공하는 것을 특징으로 하는, 증강콘텐츠 변환을 위한 영상처리 시스템을 제공한다.

Description

증강콘텐츠 변환을 위한 영상처리 시스템

본 발명은 증강콘텐츠 변환을 위한 영상처리 시스템에 관한 것으로, 더욱 상세하게는 음성인식 및 정보 가시화를 위한 증강콘텐츠 변환을 위한 영상처리 시스템에 관한 것이다.

최근 소셜 네트워크 서비스(SNS)가 유행하면서 참신하고 독특한 동영상들이 다양하게 제작되고 있다. 이러한 동영상 중에는 특수효과를 부가하거나 캐릭터를 이용한 3D 형태의 콘텐츠로 제작되는 경우도 존재한다.

그러나, 이러한 특수효과를 부과하거나 3D 콘텐츠를 제작하는 방식은 사용자의 많은 시간적 혹은 재정적 투자를 요구하는 방식으로 일반인이 쉽게 이용하기 어려운 방식이다. 또한, 모션캡처 데이터를 생성하기 위해서는 별도의 촬영장비가 필요한데, 이러한 장비는 고가이므로 일반인이 사용하기에는 재정적 어려움이 존재한다. 또한, 제작한 동영상을 편집하더라도 고가의 편집툴이 필요하고, 고도의 기술이 요구된다.

따라서, 전문적인 장비와 기술이 부족한 일반인들에게는 특수효과를 부가하거나 3D 콘텐츠 형태의 동영상 등을 제작하기에 많은 어려움이 존재하여 콘텐츠 제작을 어렵게 만들고 있다.

본 발명이 해결하고자 하는 기술적 과제는 2D 콘텐츠에 대한 자동 3D 변환 기술을 통해 3D 콘텐츠 생성에 필요한 리소스를 최소화하고, 3D콘텐츠 제작 전문가가 아닌 비전문가도 쉽게 3D 콘텐츠를 제작할 수 있는 증강콘텐츠 변환을 위한 영상처리 시스템을 제공하는 것이다.

본 발명이 이루고자 하는 기술적 과제는 이상에서 언급한 기술적 과제로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.

상기 기술적 과제를 달성하기 위하여, 본 발명의 일실시예는 통신망을 통해 상호 통신하는 스마트 디바이스 및 영상처리서버를 포함하되, 상기 스마트 디바이스는, 사용자의 안면에 착용되어 상기 영상처리서버로 사용자가 바라보는 물체를 촬영한 실물영상과, 사용자의 음성 및/또는 제스처에 따른 콘텐츠 저작명령을 송신하고, 상기 영상처리서버는, 상기 스마트 디바이스로부터 상기 실물영상 및/또는 상기 콘텐츠 저작명령을 수신하여 상기 실물영상 및 상기 콘텐츠 저작명령을 분석하고, 상기 실물영상 및/또는 상기 콘텐츠 저작명령에 대응하는 증강현실 컨텐츠를 상기 스마트 디바이스에게 제공하는 것을 특징으로 하는, 증강콘텐츠 변환을 위한 영상처리 시스템을 제공한다.

본 발명의 실시예에 있어서, 상기 영상처리서버는, 상기 스마트 디바이스와 데이터를 송수신하는 서버 통신부; 상기 사용자 디바이스에 2D 콘텐츠 저작도구를 제공하는 2D 콘텐츠 저작부; 상기 2D 콘텐츠 저작부에서 저작된2D 콘텐츠를 분석하여 상기 2D 콘텐츠의 고유 데이터를 추출 및/또는 생성하는 콘텐츠 분석부; 상기 콘텐츠 분석부에서 추출 및/또는 생성된 고유 데이터를 묶어 콘텐츠 데이터 세트를 생성하는 데이터 관리부; 2D 콘텐츠에 대한 3차원 좌표를 자동으로 생성하여 2D 콘텐츠를 3D 콘텐츠로 변환하는 3D 콘텐츠 변환부를 포함할 수 있다.

본 발명의 실시예에 있어서, 상기 2D 콘텐츠 저작부는, 상기 2D 콘텐츠 저작도구를 통해 텍스트 및/또는 이미지를 포함하는 미디어 및/또는 도형을 생성, 조작 및 편집 중 적어도 하나를 수행하여 2D 콘텐츠를 저작할 수 있다.

본 발명의 실시예에 있어서, 상기 2D 콘텐츠 저작도구는, 저작된 2D 콘텐츠의 고유 속성 값을 등록 및/또는 편집하되, 상기 2D 콘텐츠의 고유 속성 값은, 객체 속성, 텍스트의 폰트 사이즈(font size), 컬러(color), 패밀리, 미디어 URL, 미디어 유형, 미디어 분야, 미디어 해상도, 미디어 크기, 버튼, 객체의 레이어 구분, 객체의 깊이(depth)값 중 적어도 하나를 포함할 수 있다.

본 발명의 실시예에 있어서, 상기 콘텐츠 분석부는, 기 설정된 이미지 인식 모델을 이용하여 상기 2D 콘텐츠 내 객체를 인식하고, 객체의 주요 포인트를 분석하여 2차원 좌표로 추출 및/또는 생성할 수 있다.

본 발명의 실시예에 있어서, 상기 3D 콘텐츠 변환부는, 상기 2D 콘텐츠의 XY좌표에 Z좌표를 자동으로 생성하여 상기 2D 콘텐츠를 상기 3D 콘텐츠로 변환하되, 상기 2D 콘텐츠의 모든 객체에 대해 일괄적으로 Z좌표가 0값이 되도록 설정한 후 객체의 속성 및/또는 레이어별로 Z좌표를 설정된 단위로 증가시켜 3D 콘텐츠로 변환할 수 있다.

본 발명의 실시예에 있어서, 상기 3D 콘텐츠 변환부는, 상기 2D 콘텐츠의 XY좌표에 Z좌표를 자동으로 생성하여 상기 2D 콘텐츠를 상기 3D 콘텐츠로 변환하되, 2D 콘텐츠의 고유 속성 값에서 객체별로 미리 인덱싱된 깊이값을 반영하여 Z좌표를 자동 생성하고, 자동 생성된 Z값으로 2D 콘텐츠를 3D 콘텐츠로 변환할 수 있다.

본 발명의 실시예에 있어서, 상기 스마트 디바이스는, 사용자의 안면에 착용되는 프레임 및 렌즈로 이루어져 상기 프레임에 장착되며 기 설정된 좌표영역이 표시되도록 설정된 디스플레이부를 포함하는 글래스모듈; 상기 프레임에 설치되어 사용자의 시선 및/또는 이동에 따라 사용자가 바라보는 물체를 실시간으로 촬영하여 상기 실물영상을 생성하는 카메라 모듈; 상기 프레임에 적어도 하나가 설치되어 사용자의 음성 및/또는 제스처를 입력 처리하는 콘텐츠저작명령모듈; 상기 프레임에 설치되어 상기 영상처리서버와 통신하는 글래스통신모듈; 및 상기 글래스통신모듈을 통해 수신한 영상신호를 상기 글래스모듈의 디스플레이부에 표시되도록 처리하는 글래스제어모듈을 포함할 수 있다.

본 발명의 실시예에 있어서, 상기 글래스제어모듈은, 상기 영상처리서버로부터 수신한 3D 콘텐츠가 상기 글래스모듈에서 표시되도록 상기 3D 콘텐츠를 신호처리하여 상기 글래스모듈로 제공하는 영상처리부; 상기 콘텐츠저작명령모듈로부터 수신한 콘텐츠 저작명령을 신호처리하여 상기 글래스통신모듈을 통해 상기 영상처리서버로 제공하는 저작명령처리부; 및 상기 콘텐츠저작명령모듈을 통해 사용자의 콘텐츠 저작명령이 입력되면, 입력된 콘텐츠 저작명령을 신호처리하도록 상기 저작명령처리부를 제어하거나, 상기 영상처리부를 통해 3D 콘텐츠를 영상신호로 신호처리하여 상기 글래스모듈로 표시하도록 상기 영상처리부를 제어하는 메인제어부를 포함할 수 있다.

본 발명의 실시예에 따르면, 2D 콘텐츠에 대한 자동 3D 변환 기술을 통해 3D 콘텐츠 생성에 필요한 리소스를 최소화하고, 3D콘텐츠 제작 전문가가 아닌 비전문가도 쉽게 3D 콘텐츠를 제작할 수 있다.

본 발명의 효과는 상기한 효과로 한정되는 것은 아니며, 본 발명의 상세한 설명 또는 특허청구범위에 기재된 발명의 구성으로부터 추론 가능한 모든 효과를 포함하는 것으로 이해되어야 한다.

도 1은 본 발명의 일 실시예에 따른 영상처리 시스템의 구성을 나타내는 도면이다.

도 2는 도 1의 스마트 디바이스의 외형 및 구성을 예시적으로 나타내는 도면이다.

도 3은 도 1의 스마트 디바이스의 세부 구성을 예시적으로 나타내는 도면이다.

도 4는 도 1의 영상처리서버의 세부 구성을 예시적으로 나타내는 도면이다.

도 5는 본 발명의 일 실시예에 따른 영상처리 시스템에서 생성된 2D 콘텐츠를 예시적으로 나타내는 도면이다.

도 6는 본 발명의 일 실시예에 따른 영상처리 시스템에서 생성된 3D 콘텐츠를 예시적으로 나타내는 도면이다.

이하에서는 첨부한 도면을 참조하여 본 발명을 설명하기로 한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며, 따라서 여기에서 설명하는 실시예로 한정되는 것은 아니다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.

명세서 전체에서, 어떤 부분이 다른 부분과 "연결(접속, 접촉, 결합)"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 부재를 사이에 두고 "간접적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 구비할 수 있다는 것을 의미한다.

본 명세서에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

또한, 본 명세서에서 사용되는 "부" 또는 “모듈”이라는 용어는 소프트웨어, FPGA 또는 ASIC과 같은 하드웨어 구성요소를 의미하며, "부" 또는 “모듈”은 어떤 역할들을 수행한다. 그렇지만 "부" 또는 “모듈”은 소프트웨어 또는 하드웨어에 한정되는 의미는 아니다. "부" 또는 “모듈”은 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 "부" 또는 “모듈”은 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로 코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 및 변수들을 포함한다. 구성요소들과 "부" 또는 “모듈”들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 "부" 또는 “모듈”들로 결합되거나 추가적인 구성요소들과 "부" 또는 “모듈”들로 더 분리될 수 있다.

이하 첨부된 도면을 참고하여 본 발명의 실시예를 상세히 설명하기로 한다.

도 1은 본 발명의 일 실시예에 따른 영상처리 시스템의 구성을 나타내는 도면이고, 도 2는 도 1의 스마트 디바이스의 외형 및 구성을 예시적으로 나타내는 도면이고, 도 3은 도 1의 스마트 디바이스의 세부 구성을 예시적으로 나타내는 도면이고, 도 4는 도 1의 영상처리서버의 세부 구성을 예시적으로 나타내는 도면이고, 도 5는 본 발명의 일 실시예에 따른 영상처리 시스템에서 생성된 2D 콘텐츠를 예시적으로 나타내는 도면이며, 도 6는 본 발명의 일 실시예에 따른 영상처리 시스템에서 생성된 3D 콘텐츠를 예시적으로 나타내는 도면이다.

도 1 내지 도 6을 참조하면, 본 발명의 일 실시예에 따른 영상처리 시스템(10)은 통신망(20)을 통해 상호 통신하는 스마트 디바이스(100) 및 영상처리서버(200)를 포함할 수 있다.

상기 스마트 디바이스(100)는 상기 영상처리서버(200)와 통신망(20)으로 연결되고, 사용자의 신체에 착용되어 상기 영상처리서버(200)로 사용자가 바라보는 물체를 촬영한 영상을 실시간으로 제공할 수 있다. 이를 위하여, 본 발명의 일 실시예에 따른 상기 스마트 디바이스(100)는 글래스모듈(110), 카메라모듈(120), 콘텐츠저작명령모듈(130), 글래스통신모듈(140) 및 글래스제어모듈(150)을 포함할 수 있다.

도 2를 더 참조하면, 상기 글래스모듈(110)은 사용자의 안면에 착용할 수 있도록 안경 형태의 형상으로 형성될 수 있다. 이를 위하여, 상기 글래스모듈(110)은 사용자의 안면에 착용되는 프레임(112) 및 렌즈로 이루어져 상기 프레임(112)에 장착되며 기 설정된 좌표영역이 표시되도록 설정된 디스플레이부(114)를 포함할 수 있다.

여기서, 상기 글래스모듈(110)은 상기 카메라모듈(120), 상기 콘텐츠저작명령모듈(130), 상기 글래스통신모듈(140) 및 상기 글래스제어모듈(150)을 상기 프레임(112)에 내장할 수 있다.

상기 카메라모듈(120)은 상기 프레임(112)의 일측에 설치되어 사용자의 시선 및/또는 이동에 따라 사용자가 바라보는 물체를 실시간으로 촬영하여 실물영상을 생성할 수 있다.

상기 콘텐츠저작명령모듈(130)은 상기 프레임(112)의 일측에 적어도 하나가 설치되어 사용자의 음성 및/또는 제스처를 입력 처리할 수 있다. 예를 들면, 상기 콘텐츠저작명령모듈(130)은 마이크 및/또는 광학센서를 포함하며, 상기 글래스모듈(110)을 착용한 사용자의 발화로부터 음성을 감지하거나, 사용자의 (핸드) 제스처를 감지하거나, 사용자가 사용하는 드로잉 장치의 궤적을 감지할 수 있다. 또한, 상기 콘텐츠저작명령모듈(130)은 상기 카메라모듈(120)을 통해 촬영된 사용자의 (핸드) 제스처 또는 드로잉 장치의 궤적을 콘텐츠 저작명령으로 입력 처리할 수 있다.

상기 글래스통신모듈(140)은 상기 프레임(112)의 일측에 설치되어 상기 영상처리서버(200)와 무선 통신할 수 있다. 이러한 상기 글래스통신모듈(140)은 상기 영상처리서버(200)의 통신 프로토콜(protocol)에 따라서 유선/무선을 통한 광역/근거리 네트워크나 로컬 접속 방식으로 상기 영상처리서버(200)에 접속할 수 있다.

상기 글래스제어모듈(150)은 상기 글래스통신모듈(140)을 통해 수신한 영상신호를 상기 글래스모듈(110)의 디스플레이부(114)에 표시되도록 처리하고, 상기 음성에 대응하여 기 설정된 동작을 수행하도록 처리할 수 있다. 이를 위하여, 상기 글래스제어모듈(150)은 도 3에 도시된 바와 같이 영상처리부(152), 저작명령처리부(154), 메인제어부(156)를 포함할 수 있다.

상기 영상처리부(152)는 상기 영상처리서버(200)로부터 수신한 3D 콘텐츠가 상기 글래스모듈(110)에서 표시되도록 상기 3D 콘텐츠를 신호처리하여 상기 글래스모듈(110)로 제공할 수 있다. 여기서, 상기 영상처리부(152)는 수신된 3D 콘텐츠에 포함된 영상신호에 대해 다양한 영상처리 프로세스를 수행할 수 있다. 또한, 상기 영상처리부(152)는 이러한 프로세스를 수행한 영상신호를 상기 글래스모듈(110)의 디스플레이부(114)을 통해 출력시킬 수 있다. 이를 통해, 상기 영상처리부(152)는 상기 디스플레이부(114)에 해당 영상신호에 기초하는 영상을 표시되게 만들 수 있다. 예를 들면, 상기 영상처리부(152)는 수신한 3D 콘텐츠로부터 해당 3D 콘텐츠에 대응하는 영상, 음성 및 부가데이터 중 적어도 하나를 추출하고, 기 설정된 해상도로 조정하여 상기 글래스모듈(110)을 통해 출력시킬 수 있다.

상기 영상처리부(152)가 수행하는 영상처리 프로세스의 종류는 한정되지 않으며, 예를 들면 영상데이터의 영상 포맷에 대응하는 디코딩(decoding), 인터레이스(interlace) 방식의 영상데이터를 프로그레시브(progressive) 방식으로 변환하는 디인터레이싱(de-interlacing), 영상데이터를 기 설정된 해상도로 조정하는 스케일링(scaling), 영상 화질 개선을 위한 노이즈 감소(noise reduction), 디테일 강화(detail enhancement), 프레임 리프레시 레이트(frame refresh rate) 변환 등을 포함할 수 있다.

상기 저작명령처리부(154)는 상기 콘텐츠저작명령모듈(130)로부터 수신한 콘텐츠 저작명령을 신호처리하여 상기 글래스통신모듈(140)을 통해 상기 영상처리서버(200)로 음성명령을 제공할 수 있다.

구체적으로, 상기 저작명령처리부(154)는 상기 콘텐츠저작명령모듈(130)에 입력되는 음성, 제스처 및/또는 드로잉 장치의 궤적에 대한 저작명령처리 프로세스를 수행할 수 있다. 여기서, 상기 저작명령처리부(154)는 상기 콘텐츠저작명령모듈(130)에 음성 및/또는 제스처가 입력되면, 입력된 음성 및/또는 제스처가 사용자에 의한 것인지 아니면 기타 요인에 의하여 발생한 것인지 여부를 판단할 수 있다. 그러나, 이러한 판단 방법은 다양한 구조가 적용될 수 있으므로 입력된 음성 및/또는 제스처가 사람의 목소리에 대응하는 파장 및/또는 주파수 대역에 해당하는지 판단하거나, 또는 사전에 지정된 사용자의 음성의 프로파일에 해당하는지 판단하거나, 또는 미리 지정된 패턴에 따라 사용자의 신체가 움직이는 것인지를 판단하는 등의 방법을 사용할 수 있다. 또한, 상기 저작명령처리부(154)는 상기 콘텐츠저작명령모듈(130)에 드로잉 장치의 궤적이 입력되면, 입력된 궤적이 기 설정된 드로잉 장치에 의해 생성된 궤적인지 판단할 수 있다.

상기 메인제어부(156)는 상기 콘텐츠저작명령모듈(130)을 통해 사용자의 콘텐츠 저작명령이 입력되면, 입력된 콘텐츠 저작명령을 신호처리하도록 상기 저작명령처리부(154)를 제어할 수 있다. 또한, 상기 메인제어부(156)는 상기 영상처리부(152)를 통해 3D 콘텐츠를 영상신호로 신호처리하여 상기 글래스모듈(110)로 표시하도록 상기 영상처리부(152)를 제어할 수 있다.

상기와 같은, 상기 글래스제어모듈(150)은 이러한 여러 기능을 통합시킨 SOC(system-on-chip), 또는 이러한 각 프로세스를 독자적으로 수행할 수 있는 개별적인 구성들이 인쇄회로기판 상에 장착됨으로써 영상처리보드(미도시)로 구현되어 상기 글래스모듈(110)에 내장될 수 있다.

다만, 상기와 같은, 상기 스마트 디바이스(100)는 글래스 형태로 구현되는 것뿐만 아니라, 스마트폰, 테블릿, 핸드헬드PC 등의 형태로 구현될 수도 있다.

상기 영상처리서버(200)는 상기 스마트 디바이스(100)와 통신망(20)으로 연결되고 상기 스마트 디바이스(100)로부터 상기 실물영상 및/또는 상기 콘텐츠 저작명령을 수신하여 상기 실물영상 및/또는 상기 콘텐츠 저작명령을 분석하고, 상기 실물영상 및/또는 상기 콘텐츠 저작명령에 대응하는 2D 콘텐츠 및/또는 3D 콘텐츠를 상기 스마트 디바이스(100)에게 제공할 수 있다.

이를 위하여, 상기 영상처리서버(200)는 서버 통신부(210), 2D 콘텐츠 저작부(220), 콘텐츠 분석부(230), 데이터 관리부(240), 및 3D 콘텐츠 변환부(250)를 포함할 수 있다.

상기 서버 통신부(210)는 상기 스마트 디바이스(100)와 데이터를 송수신할 수 있다. 여기서, 상기 서버 통신부(210)는 상기 스마트 디바이스(100)로부터 상기 실물영상 및/또는 상기 콘텐츠 저작명령을 수신하고, 상기 콘텐츠 저작명령에 대응하여 저작된 2D 콘텐츠와, 상기 2D 콘텐츠가 변환된 3D 콘텐츠를 선택적으로 상기 스마트 디바이스(100)에게 송수신할 수 있다.

여기서, 상기 서버 통신부(210)는 상기 스마트 디바이스(100)로부터 2D 콘텐츠 저작을 위한 명령을 수신하고, 3D 콘텐츠를 영상신호로 송신할 수 있다. 이러한, 상기 서버 통신부(210)는 LAN(Local Area Network), WAN(Wide Area Network), CDMA(Code Division Multiple Access), WCDMA(Wideband Code Division Multiple Access), GSM(Global System for Mobile Communications), LTE(Long Term Evolution), EPC(Evolved Packet Core) 등의 통신 방식을 사용할 수 있어, 어느 하나의 통신 방식에 한정되지 아니한다.

상기 2D 콘텐츠 저작부(220)는 상기 스마트 디바이스(100)에 2D 콘텐츠 저작도구를 제공할 수 있다. 이때, 상기 2D 콘텐츠 저작부(220)는 2D 콘텐츠 저작도구를 통해 텍스트 및/또는 이미지를 포함하는 미디어 및/또는 도형을 생성, 조작 및 편집 중 적어도 하나를 수행하여 2D 콘텐츠를 저작할 수 있다.

여기서, 상기 콘텐츠 저작도구는 스마트 디바이스(100)를 통해 입력된 사용자의 콘텐츠 저작명령을 전달받아 2D 콘텐츠를 저작하는 2D 콘텐츠 저작용 템플릿(슬라이드)을 포함할 수 있다. 예를 들면, 상기 2D 콘텐츠 저작부(220)는 PPT, PDF, HTML, 및 저작 어플리케이션 중 적어도 하나를 이용하여 스마트 디바이스(100)로 2D 콘텐츠 저작용 템플릿을 제공할 수 있다.

또한, 상기 콘텐츠 저작도구는 저작된 2D 콘텐츠의 고유 속성 값을 등록 및/또는 편집할 수 있다. 이때, 2D 콘텐츠의 고유 속성 값은 객체 속성, 텍스트의 폰트 사이즈(font size), 컬러(color), 패밀리, 미디어 URL, 미디어 유형, 미디어 분야, 미디어 해상도, 미디어 크기, 버튼, 객체의 레이어 구분, 객체의 깊이(depth)값 중 적어도 하나를 포함할 수 있다.

상기 콘텐츠 분석부(230)는 상기 2D 콘텐츠 저작부(220)에서 저작된 상기 2D 콘텐츠를 분석하여 상기 2D 콘텐츠의 고유 데이터를 추출 및/또는 생성할 수 있다. 여기서, 상기 콘텐츠 분석부(230)는 상기 2D 콘텐츠의 고유 속성 및/또는 2차원 좌표를 고유 데이터로 추출할 수 있다. 이때, 상기 콘텐츠 분석부(230)는 상기 2D 콘텐츠로부터 객체를 분석하여 객체의 고유 속성 및/또는 객체의 2차원 좌표(XY좌표)를 고유 데이터로 추출하며, 추출한 고유 데이터를 상기 데이터 관리부(240)로 제공할 수 있다.

예를 들면, 상기 콘텐츠 분석부(230)는 기 설정된 이미지 인식 모델을 이용하여 상기 2D 콘텐츠 내 객체를 인식하고, 객체의 주요 포인트를 분석하여 2차원 좌표(XY좌표)로 추출 및/또는 생성할 수 있다. 이때, 상기 콘텐츠 분석부(230)는 객체가 어떤 위치에 정합해야 하는지 판단할 때 필요하여 2차원 좌표를 추출 및/또는 생성하되, 객체의 주요 포인트에 대한 X좌표를 우선적으로 추출 및/또는 생성할 수 있다.

여기서, 상기 이미지 인식 모델은 형체 인식을 위한 이미지 분석 인공지능 프로그램으로 설정될 수 있으며, 상품 인식을 위한 1,2차원 바코드 데이터를 자동으로 생성하는 테스트 이미지 자동생성, 이미지 증식 기법을 포함하여 이미지 해상도 변경에 따른 패딩 자동 처리하는 데이터 아규먼트(data argument), 트레이닝 이미지의 해상도를 변경하였을 때 발생되는 바운딩 박스의 위치변화를 보정하기 위한 알고리즘을 도입하는 해상도 변경, 상품 및 형상 인식을 하기 위해 촬영된 이미지의 업스케일링을 위한 트레이닝 데이터를 자동 분류하는 이미지 복원을 위한 데이터셋 분리, (오브젝트 디텍션, OCR, 바코드 또는 QR코드, 객체 추적 등을) 시뮬레이션하는 인식처리, 객체 담지, 세그먼테이션 키포인트 탐지 등의 컴퓨터 비전 분야의 테스크(task) 목적으로 만들어진 코코 데이터셋(COCO dataset) 등의 항목을 지원할 수 있다. 예를 들면, 상기 이미지 인식 모델은 상기 데이터 아규먼트가 적용된 이미지 데이터셋 약 1만장 기준으로 약 94% 이상의 정확도를 확보할 수 있다.

상기 데이터 관리부(240)는 상기 콘텐츠 분석부(230)에서 추출 및/또는 생성된 고유 데이터를 묶어 콘텐츠 데이터 세트를 생성할 수 있다. 또한, 상기 데이터 관리부(240)는 상기 콘텐츠 데이터 세트를 시트(sheet) 및/또는 파일(file) 형태로 저장할 수 있다. 예를 들면, 상기 데이터 관리부(240)는 2D 콘텐츠의 고유 속성 값과, 2D 콘텐츠의 2차원 좌표를 묶어서 콘텐츠 데이터 세트를 생성할 수 있다.

상기 3D 콘텐츠 변환부(250)는 2D 콘텐츠에 대한 3차원 좌표를 자동으로 생성하여 2D 콘텐츠를 3D 콘텐츠로 변환할 수 있다. 즉, 상기 3D 콘텐츠 변환부(250)는 2D 콘텐츠의 XY좌표에 Z좌표를 자동으로 생성하여 2D 콘텐츠를 3D 콘텐츠로 변환할 수 있다. 이러한 상기 3D 콘텐츠 변환부(250)는 3D 공간을 기반으로 2D 콘텐츠에 입체감을 부여할 수 있다.

일 실시예에 따르면, 상기 3D 콘텐츠 변환부(250)는 2D 콘텐츠의 모든 객체에 대해 일괄적으로 Z좌표가 0값이 되도록 설정한 후 객체의 속성 및/또는 레이어별로 Z좌표를 설정된 단위로 증가시켜 3D 콘텐츠로 변환할 수 있다. 예를 들면, 상기 3D 콘텐츠 변환부(250)는 단순 평면적인 2D 콘텐츠를 일단 3D화하고, 3D화된 콘텐츠에서 개별 객체들을 속성 및/또는 레이어별로 Z좌표를 1씩 순차적으로 증가시켜 입체감을 갖는 3D 콘텐츠로 변환할 수 있다.

다른 실시예에 따르면, 상기 3D 콘텐츠 변환부(250)는 2D 콘텐츠의 고유 속성 값에서 객체별로 미리 인덱싱된 깊이값을 반영하여 Z좌표를 자동 생성하고, 자동 생성된 Z값으로 2D 콘텐츠를 3D 콘텐츠로 변환할 수 있다. 예를 들면, 상기 3D 콘텐츠 변환부(250)는 사용자가 상기 콘텐츠 저작도구를 통해 등록 및/또는 편집한 고유 속성 값으로부터 미리 객체별로 인덱싱된 깊이값을 확인하고, 확인된 깊이값에 대응하는 Z좌표를 자동으로 생성할 수 있다.

또 다른 실시예에 따르면, 상기 3D 콘텐츠 변환부(250)는 외부 데이터 서버로부터 객체의 속성별 인덱싱 데이터를 제공받아 Z좌표를 자동 생성하고, 자동 생성된 Z값으로 2D 콘텐츠를 3D 콘텐츠로 변환할 수 있다. 예를 들면, 상기 3D 콘텐츠 변환부(250)는 외부 데이터 서버로부터 Human 3.6M Dataset 등의 데이터셋을 인덱싱 데이터로 제공받으며, 제공받은 인덱싱 데이터를 기반으로 2D 콘텐츠의 객체들 Z좌표를 자동 생성할 수 있다.

한편, 상기 영상처리서버(200)는 상기 실물영상에 대응하여 상기 3D 콘텐츠를 정합시키는 콘텐츠 정합부(260)를 더 포함할 수 있다.

상기 콘텐츠 정합부(260)는 상기 실물영상에 상기 3D 콘텐츠를 정합시키기 위하여 상기 실물영상을 분석하고, 분석 결과를 반영하여 3D 콘텐츠의 3차원 좌표를 공간 좌표로 변환하며, 상기 서버 통신부(210)를 통해 공간 좌표로 변환된 3D 콘텐츠를 상기 스마트 디바이스(100)로 제공할 수 있다.

여기서, 상기 콘텐츠 정합부(260)는 객체가 포함된 상기 실물영상에서 3차원 공간 상의 길이, 너비, 및 깊이 중 적어도 하나를 측정할 수 있고, 측정된 길이, 너비 및 깊이 중 적어도 하나를 반영하여 3D 콘텐츠의 3차원 좌표를 공간 좌표로 변환할 수 있다.

구체적으로, 상기 콘텐츠 정합부(260)는 길이, 너비 및 깊이 중 적어도 하나의 보정을 위하여 기 설정된 호모그래피(homography) 행렬을 이용하여 3차원 좌표를 공간 좌표로 변환할 수 있다. 참고로, 호모그래피는 한 평면을 다른 평면에 투영시켰을 때 투영된 대응점들 사이에 일정하게 성립되는 변환 관계를 의미할 수 있다. 이러한 상기 콘텐츠 정합부(260)는 기 설정된 호모그래피 행렬을 이용하여 상기 실물영상에 있는 포인트의 3차원 좌표를 이미지 좌표와 매칭시킬 수 있다. 이를 통해, 상기 콘텐츠 정합부(260)는 상기 실물영상에서 3차원 공간 상의 길이, 너비, 및 깊이 중 적어도 하나를 측정할 수 있다.

또한, 상기 콘텐츠 정합부(260)는 상기 실물영상에 있는 공간 폭과 객체의 단면을 분석하여 공간을 감지하고, 감지된 공간에 대응하도록 3D 콘텐츠의 3차원 좌표를 공간 좌표로 변환할 수 있다.

또한, 본 발명의 실시예에 따르면, 2D 콘텐츠(이미지)의 속성을 추출하여 3차원으로 설정된 공간에 투영할 수 있다.

전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.

본 발명의 범위는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

Claims

통신망을 통해 상호 통신하는 스마트 디바이스 및 영상처리서버를 포함하되,

상기 스마트 디바이스는,

사용자의 안면에 착용되어 상기 영상처리서버로 사용자가 바라보는 물체를 촬영한 실물영상과, 사용자의 음성 및/또는 제스처에 따른 콘텐츠 저작명령을 송신하고,

상기 영상처리서버는,

상기 스마트 디바이스로부터 상기 실물영상 및/또는 상기 콘텐츠 저작명령을 수신하여 상기 실물영상 및 상기 콘텐츠 저작명령을 분석하고, 상기 실물영상 및/또는 상기 콘텐츠 저작명령에 대응하는 증강현실 컨텐츠를 상기 스마트 디바이스에게 제공하는 것을 특징으로 하는, 증강콘텐츠 변환을 위한 영상처리 시스템.
제1항에 있어서,

상기 영상처리서버는,

상기 스마트 디바이스와 데이터를 송수신하는 서버 통신부;

상기 사용자 디바이스에 2D 콘텐츠 저작도구를 제공하는 2D 콘텐츠 저작부;

상기 2D 콘텐츠 저작부에서 저작된2D 콘텐츠를 분석하여 상기 2D 콘텐츠의 고유 데이터를 추출 및/또는 생성하는 콘텐츠 분석부;

상기 콘텐츠 분석부에서 추출 및/또는 생성된 고유 데이터를 묶어 콘텐츠 데이터 세트를 생성하는 데이터 관리부;

2D 콘텐츠에 대한 3차원 좌표를 자동으로 생성하여 2D 콘텐츠를 3D 콘텐츠로 변환하는 3D 콘텐츠 변환부;

를 포함하는 것을 특징으로 하는, 증강콘텐츠 변환을 위한 영상처리 시스템.
제2항에 있어서,

상기 2D 콘텐츠 저작부는,

상기 2D 콘텐츠 저작도구를 통해 텍스트 및/또는 이미지를 포함하는 미디어 및/또는 도형을 생성, 조작 및 편집 중 적어도 하나를 수행하여 2D 콘텐츠를 저작하는 것을 특징으로 하는, 증강콘텐츠 변환을 위한 영상처리 시스템.
제3항에 있어서,

상기 2D 콘텐츠 저작도구는,

저작된 2D 콘텐츠의 고유 속성 값을 등록 및/또는 편집하되,

상기 2D 콘텐츠의 고유 속성 값은,

객체 속성, 텍스트의 폰트 사이즈(font size), 컬러(color), 패밀리, 미디어 URL, 미디어 유형, 미디어 분야, 미디어 해상도, 미디어 크기, 버튼, 객체의 레이어 구분, 객체의 깊이(depth)값 중 적어도 하나를 포함하는 것을 특징으로 하는, 증강콘텐츠 변환을 위한 영상처리 시스템.
제2항에 있어서,

상기 콘텐츠 분석부는,

기 설정된 이미지 인식 모델을 이용하여 상기 2D 콘텐츠 내 객체를 인식하고, 객체의 주요 포인트를 분석하여 2차원 좌표로 추출 및/또는 생성하는 것을 특징으로 하는, 증강콘텐츠 변환을 위한 영상처리 시스템.
제2항에 있어서,

상기 3D 콘텐츠 변환부는,

상기 2D 콘텐츠의 XY좌표에 Z좌표를 자동으로 생성하여 상기 2D 콘텐츠를 상기 3D 콘텐츠로 변환하되,

상기 2D 콘텐츠의 모든 객체에 대해 일괄적으로 Z좌표가 0값이 되도록 설정한 후 객체의 속성 및/또는 레이어별로 Z좌표를 설정된 단위로 증가시켜 3D 콘텐츠로 변환하는 것을 특징으로 하는, 증강콘텐츠 변환을 위한 영상처리 시스템.
제2항에 있어서,

상기 3D 콘텐츠 변환부는,

상기 2D 콘텐츠의 XY좌표에 Z좌표를 자동으로 생성하여 상기 2D 콘텐츠를 상기 3D 콘텐츠로 변환하되,

2D 콘텐츠의 고유 속성 값에서 객체별로 미리 인덱싱된 깊이값을 반영하여 Z좌표를 자동 생성하고, 자동 생성된 Z값으로 2D 콘텐츠를 3D 콘텐츠로 변환하는 것을 특징으로 하는, 증강콘텐츠 변환을 위한 영상처리 시스템.
제1항에 있어서,

상기 스마트 디바이스는,

사용자의 안면에 착용되는 프레임 및 렌즈로 이루어져 상기 프레임에 장착되며 기 설정된 좌표영역이 표시되도록 설정된 디스플레이부를 포함하는 글래스모듈;

상기 프레임에 설치되어 사용자의 시선 및/또는 이동에 따라 사용자가 바라보는 물체를 실시간으로 촬영하여 상기 실물영상을 생성하는 카메라 모듈;

상기 프레임에 적어도 하나가 설치되어 사용자의 음성 및/또는 제스처를 입력 처리하는 콘텐츠저작명령모듈;

상기 프레임에 설치되어 상기 영상처리서버와 통신하는 글래스통신모듈; 및

상기 글래스통신모듈을 통해 수신한 영상신호를 상기 글래스모듈의 디스플레이부에 표시되도록 처리하는 글래스제어모듈;

을 포함하는 것을 특징으로 하는, 증강콘텐츠 변환을 위한 영상처리 시스템.
제8항에 있어서,

상기 글래스제어모듈은,

상기 영상처리서버로부터 수신한 3D 콘텐츠가 상기 글래스모듈에서 표시되도록 상기 3D 콘텐츠를 신호처리하여 상기 글래스모듈로 제공하는 영상처리부;

상기 콘텐츠저작명령모듈로부터 수신한 콘텐츠 저작명령을 신호처리하여 상기 글래스통신모듈을 통해 상기 영상처리서버로 제공하는 저작명령처리부; 및

상기 콘텐츠저작명령모듈을 통해 사용자의 콘텐츠 저작명령이 입력되면, 입력된 콘텐츠 저작명령을 신호처리하도록 상기 저작명령처리부를 제어하거나, 상기 영상처리부를 통해 3D 콘텐츠를 영상신호로 신호처리하여 상기 글래스모듈로 표시하도록 상기 영상처리부를 제어하는 메인제어부;

를 포함하는 것을 특징으로 하는, 증강콘텐츠 변환을 위한 영상처리 시스템.