KR101540113B1

KR101540113B1 - 실감 영상을 위한 영상 데이터를 생성하는 방법, 장치 및 이 방법을 실행하기 위한 컴퓨터 판독 가능한 기록 매체

Info

Publication number: KR101540113B1
Application number: KR1020140074449A
Authority: KR
Inventors: 이중재; 남상훈; 유범재
Original assignee: 재단법인 실감교류인체감응솔루션연구단
Priority date: 2014-06-18
Filing date: 2014-06-18
Publication date: 2015-07-30

Abstract

실감 영상을 위한 영상 데이터를 생성하는 방법 및 장치가 개시되어 있다. 실감 영상을 위한 영상 데이터를 생성하는 방법은 송신 실감 영상 처리 장치가 캘리브레이션된 복수의 카메라를 기반으로 실감 영상을 위한 제1 영상 데이터를 생성하고, 제1 영상 데이터를 수신 실감 영상 처리 장치로 전송하는 단계, 송신 실감 영상 처리 장치가 제1 영상 데이터에 대한 응답으로 수신 실감 영상 처리 장치로부터 관심 영역에 대한 정보를 수신하는 단계와 송신 실감 영상 처리 장치가 관심 영역에 대한 정보를 기반으로 관심 영역에 대응되는 영상 데이터를 상기 관심 영역 이외의 영역에 대응되는 영상 데이터보다 더 낮은 압축률로 압축한 제2 영상 데이터를 생성하여 수신 실감 영상 처리 장치로 전송하는 단계를 포함할 수 있다.

Description

실감 영상을 위한 영상 데이터를 생성하는 방법, 장치 및 이 방법을 실행하기 위한 컴퓨터 판독 가능한 기록 매체{METHOD, APPARATUS FOR GERNERATING IMAGE DATA FOT REALISTIC-IMAGE AND COMPUTER-READABLE RECORDING MEDIUM FOR EXECUTING THE METHOD}

본 발명은 영상 데이터 생성에 관한 것으로서 보다 상세하게는 실감 영상을 위한 영상 데이터를 생성하는 방법, 장치 및 이 방법을 실행하기 위한 컴퓨터 판독 가능한 기록 매체에 관한 것이다.

무선 통신 기술의 발전으로 인한 휴대 전화의 진화에 따라 휴대 전화의 데이터 전송률이 점점 증가하고 있다. 데이터 전송률의 증가에 따라 기존의 음성 통화 중심의 서비스의 한계를 뛰어넘은 화상 통신과 같은 다양한 멀티미디어 서비스가 사용자에게 제공될 수 있다.

멀티미디어 컨텐츠의 송신 및 수신을 필요로 하는 영상 회의, 영상 전화 및 영상 응답 서비스 등을 지원하기 위해 고성능의 영상 부호화에 관한 연구가 매우 활발하게 진행되고 있다.

제한된 자원을 가진 유무선 네트워크 환경에서 실시간으로 멀티미디어 데이터를 송신 및/또는 수신하기 위해서는 멀티미디어 데이터의 효과적인 전송 방법에 관한 연구들이 필요하다. 특히, 멀티미디어 데이터가 좋지 않은 채널 상태의 무선 채널을 통해 전송되는 경우, 화질 저하, 프레임의 손실, 지연 발생 등의 수신 화면의 품질 저하 현상이 발생할 수 있다. 사용자에게 효과적인 고품질 비디오 서비스를 제공하기 위해서는 전송 채널 특성에 맞게 멀티미디어 데이터를 부호화하는 비디오 인코더가 동작할 수 있다. 예를 들어, 비디오 인코더는 채널 상황에 따라 전송 비트율을 제어하거나, 영상에서 중요한 영역과 중요하지 않은 영역에 대한 데이터 압축율을 변화시켜 전송 비트율을 제어할 수 있다.

이뿐만 아니라, 최근 3차원 입체 영상을 기반으로 한 서비스가 증가하고, 사용자의 입체감, 몰입감, 현실감이 제공되는 방송용 컨텐츠에 대한 수요가 증가하고 있다. 즉, 유무선 네트워크 환경에서 송신 및/또는 수신되는 멀티미디어 데이터는 2D(dimension) 영상뿐만 아니라 3D 영상으로 확장되고 있다. 따라서, 유무선 네트워크 환경의 전송 자원을 효과적으로 활용하여 증가되고 있는 멀티미디어 데이터를 효과적으로 전송하기 위한 방법이 필요하다.

특허출원번호 제10-2008-0013223[명칭: 영상통화시 영상데이터의 인식 및 변화 시스템, 서버, 방법]

본 발명의 목적은 실감 영상을 위한 영상 데이터를 생성하는 방법을 제공하는 것이다.

본 발명의 다른 목적은 실감 영상을 위한 영상 데이터를 생성하는 장치를 제공하는 것이다.

상술한 본 발명의 목적을 달성하기 위한 본 발명의 일 측면에 따른 실감 영상을 위한 영상 데이터를 생성하는 방법은 송신 실감 영상 처리 장치가 캘리브레이션된 복수의 카메라를 기반으로 상기 실감 영상을 위한 제1 영상 데이터를 생성하고, 상기 제1 영상 데이터를 수신 실감 영상 처리 장치로 전송하는 단계와 상기 송신 실감 영상 처리 장치가 상기 제1 영상 데이터에 대한 응답으로 상기 수신 실감 영상 처리 장치로부터 관심 영역에 대한 정보를 수신하는 단계와 상기 송신 실감 영상 처리 장치가 상기 관심 영역에 대한 정보를 기반으로 상기 관심 영역에 대응되는 영상 데이터를 상대적으로 더 낮은 압축률로 압축한 제2 영상 데이터를 생성하여 상기 수신 실감 영상 처리 장치로 전송하는 단계를 포함할 수 있다. 실감 영상을 위한 영상 데이터를 생성하는 방법은 상기 송신 실감 영상 처리 장치가 상기 복수의 카메라에 대한 상기 캘리브레이션을 수행하는 단계를 더 포함하되, 상기 캘리브레이션을 수행하는 단계는 상기 송신 실감 영상 처리 장치가 상기 복수의 카메라 각각에 대한 화각을 설정하는 단계, 상기 송신 실감 영상 처리 장치가 상기 복수의 카메라 각각의 촬상 영상에서 특징점을 추출하는 단계와 상기 송신 실감 영상 처리 장치가 상기 특징점을 매칭하여 상기 캘리브레이션을 위한 매개 변수를 결정하는 단계를 포함할 수 있되, 상기 화각은 상기 복수의 카메라 각각의 상기 촬상 영상에 객체가 포함되었는지 여부 및 상기 촬상 영상의 중심 영역에 상기 객체가 위치하였는지 여부를 기반으로 설정될 수 있다. 상기 송신 실감 영상 처리 장치가 상기 복수의 카메라 각각의 촬상 영상에서 특징점을 추출하는 단계는 상기 송신 실감 영상 처리 장치가 상기 촬상 영상에서 배경과 상기 객체를 분리하는 단계와 상기 송신 실감 영상 처리 장치가 상기 촬상 영상에서 분리된 상기 객체의 이미지와 상기 객체에 대한 템플릿을 비교하여 상기 객체의 이미지에서 상기 특징점을 추출하는 단계를 포함할 수 있다. 상기 실감 영상을 위한 제1 영상 데이터를 생성하는 단계는 상기 송신 실감 영상 처리 장치가 상기 복수의 카메라 각각에 의해 촬상된 복수의 촬상 영상 각각에서 객체의 특징점을 추출하는 단계, 상기 송신 실감 영상 처리 장치가 상기 특징점 간의 상관 관계를 추출하는 단계와 상기 송신 실감 영상 처리 장치가 상기 상관 관계를 기반으로 상기 촬상 영상 각각을 스티칭하여 상기 제1 영상 데이터를 생성하는 단계를 포함할 수 있다. 상기 관심 영역에 대한 정보는 상기 제1 영상 데이터를 기반으로 출력된 출력 영상을 제공받는 상기 수신 실감 영상 처리 장치의 사용자의 머리 위치 정보를 기반으로 결정된 제1 관심 영역에 대한 정보 및 상기 사용자의 시선 위치 정보를 기반으로 결정되는 제2 관심 영역에 대한 정보를 포함할 수 있되, 상기 제2 관심 영역은 상기 제1 관심 영역에 포함되고, 상기 송신 실감 영상 처리 장치는 상기 제1 관심 영역에 대해 제1 양자화 계수로 양자화를 수행하고, 상기 제2 관심 영역에 대해 제2 양자화 계수로 양자화를 수행하고, 상기 제1 양자화 계수는 상기 제2 양자화 계수보다 클 수 있다.

상술한 본 발명의 다른 목적을 달성하기 위한 본 발명의 일 측면에 따른 실감 영상을 위한 영상 데이터를 생성하는 실감 영상 처리 장치에 있어서, 상기 실감 영상 처리 장치는 프로세서를 포함하고, 상기 프로세서는 캘리브레이션된 복수의 카메라를 기반으로 상기 실감 영상을 위한 제1 영상 데이터를 생성하고, 상기 제1 영상 데이터를 수신 실감 영상 처리 장치로 전송하고, 상기 제1 영상 데이터에 대한 응답으로 상기 수신 실감 영상 처리 장치로부터 관심 영역에 대한 정보를 수신하고, 상기 관심 영역에 대한 정보를 기반으로 상기 관심 영역에 대응되는 영상 데이터를 상대적으로 더 낮은 압축률로 압축한 제2 영상 데이터를 생성하여 상기 수신 실감 영상 처리 장치로 전송하도록 구현될 수 있다. 상기 프로세서는 상기 복수의 카메라에 대한 상기 캘리브레이션을 수행하도록 구현될 수 있되, 상기 프로세서는 상기 캘리브레이션을 위해 상기 복수의 카메라 각각에 대한 화각을 설정하고, 상기 복수의 카메라 각각의 촬상 영상에서 특징점을 추출하고, 상기 특징점을 매칭하여 상기 캘리브레이션을 위한 매개 변수를 결정하도록 구현되고, 상기 화각은 상기 복수의 카메라 각각의 상기 촬상 영상에 객체가 포함되었는지 여부 및 상기 촬상 영상의 중심 영역에 상기 객체가 위치하였는지 여부를 기반으로 설정될 수 있다. 상기 프로세서는 상기 촬상 영상에서 배경과 상기 객체를 분리하고, 상기 촬상 영상에서 분리된 상기 객체의 이미지와 상기 객체에 대한 템플릿을 비교하여 상기 객체의 이미지에서 상기 특징점을 추출하도록 구현될 수 있다. 상기 프로세서는 상기 복수의 카메라 각각에 의해 촬상된 복수의 촬상 영상 각각에서 객체의 특징점을 추출하고, 상기 특징점 간의 상관 관계를 추출하고, 상기 상관 관계를 기반으로 상기 촬상 영상 각각을 스티칭하여 상기 제1 영상 데이터를 생성하도록 구현될 수 있다. 상기 관심 영역에 대한 정보는 상기 제1 영상 데이터를 기반으로 출력된 출력 영상을 제공받는 상기 수신 실감 영상 처리 장치의 사용자의 머리 위치 정보를 기반으로 결정된 제1 관심 영역에 대한 정보 및 상기 사용자의 시선 위치 정보를 기반으로 결정되는 제2 관심 영역에 대한 정보를 포함하되, 상기 제2 관심 영역은 상기 제1 관심 영역에 포함될 수 있고, 상기 프로세서는 상기 제1 관심 영역에 대해 제1 양자화 계수로 양자화를 수행하고, 상기 제2 관심 영역에 대해 제2 양자화 계수로 양자화를 수행하도록 구현될 수 있되, 상기 제1 양자화 계수는 상기 제2 양자화 계수보다 클 수 있다.

상술한 바와 같이 본 발명의 실시예에 따른 실감 영상을 위한 영상 데이터를 생성하는 방법 및 장치를 사용하는 경우, 실감 영상 처리 장치에 구현된 복수의 카메라에 대한 캘리브레이션을 정확하게 수행하여 객체를 촬상할 수 있다. 또한, 실감 영상 처리 장치는 복수의 카메라에 의해 촬상된 촬상 영상을 기반으로 실감 영상을 생성하여 전달할 수 있다. 이뿐만 아니라 실감 영상 처리 장치는 사용자의 시선을 추적하여 사용자가 출력 영상에서 관심을 가지고 있는 관심 영역에 대한 분석을 할 수 있다. 실감 영상 처리 장치는 분석된 관심 영역에 정보를 출력 영상을 제공하는 다른 실감 영상 처리 장치로 전달하여 관심 영역에 대한 선명한 영상을 획득할 수 있다.

도 1은 본 발명에 따른 영상 데이터를 전송하는 방법을 나타낸 개념도이다.
도 2는 본 발명의 실시예에 따른 복수의 카메라 켈리브레이션 방법을 나타낸 개념도이다.
도 3은 본 발명의 실시예에 따른 복수의 카메라에 대한 화각을 설정하는 방법을 나타낸 개념도이다.
도 4는 본 발명의 실시예에 따른 촬상 영상에서 특징점을 추출하는 방법을 나타낸 개념도이다.
도 5는 본 발명의 실시예에 따른 실감 영상을 생성하는 방법을 나타낸 개념도이다.
도 6은 본 발명의 실시예에 따른 관심 영역을 추출하는 방법을 나타낸 개념도이다.
도 7은 본 발명의 실시예에 따른 실감 영상 처리 장치의 영상 데이터 생성 방법을 나타낸 순서도이다.
도 8은 본 발명의 실시예에 따른 실감 영상 처리 장치를 나타낸 개념도이다.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.

제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.

어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어"있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어"있다거나 "직접 접속되어"있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.

본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시예를 보다 상세하게 설명하고자 한다. 이하, 도면상의 동일한 구성 요소에 대해서는 동일한 참조 부호를 사용하고 동일한 구성 요소에 대해서 중복된 설명은 생략한다.

영상 통화, 영상 회의 등과 같은 서비스를 위해서 멀티미디어 컨텐츠의 송신 및/또는 수신이 필요하다. 멀티미디어 컨텐츠의 송신 및/또는 수신시 제한된 네트워크 자원 상에서 효율적으로 멀티미디어 컨텐츠를 포함하는 영상 데이터를 전송하기 위한 방법이 필요하다. 이하, 본 발명의 실시예에서는 원격 사용자 간에 영상 데이터를 전송하는 방법에 대해 개시한다.

도 1은 본 발명에 따른 영상 데이터를 전송하는 방법을 나타낸 개념도이다.

도 1을 참조하면, 제1 실감 영상 처리 장치(110)와 제2 실감 영상 처리 장치(120)간에 영상 데이터가 송신 및/또는 수신될 수 있다. 제1 실감 영상 처리 장치(110)와 제2 실감 영상 처리 장치(120) 간에 전송되는 영상 데이터는 각각의 실감 영상 처리 장치에 구현된 복수의 카메라를 기반으로 생성될 수 있다. 제1 실감 영상 처리 장치(110)는 복수의 카메라를 기반으로 영상 데이터(실감 영상을 위한 데이터를 포함하며, 가령, 광 각에 대응하는 영상 데이터 또는 3D 입체 영상 데이터 등)를 생성할 수 있다. 제1 실감 영상 처리 장치(110)에 의해 생성된 영상 데이터는 제2 실감 영상 처리 장치(120)로 전송될 수 있다. 제1 실감 영상 처리 장치(110)의 제1 사용자와 제2 실감 영상 처리 장치(120)의 제2 사용자가 화상 통화를 수행한다고 가정하는 경우, 제1 사용자에 대한 영상 데이터 및 제2 사용자에 대한 영상 데이터가 제1 실감 영상 처리 장치(110)와 제2 실감 영상 처리 장치(120) 사이에서 송신 및/또는 수신될 수 있다.

실시간으로 실감 영상 처리 장치 간에 전송되는 영상 데이터는 데이터의 양이 많다. 따라서, 영상 데이터를 전송하기 위한 많은 네트워크 전송 자원이 필요할 수 있다.

본 발명의 실시예에 따른 실감 영상을 위한 영상 데이터 전송 방법에서는 영상데이터를 수신하는 다른 사용자의 관심 영역(150)을 고려하여 영상 데이터를 부호화할 수 있다. 관심 영역(150)은 영상 데이터를 수신하여 실감 영상 처리 장치에 디스플레이되는 출력 영상 중 사용자의 시점이 집중되는 특정 영역일 수 있다.

제1 사용자와 제2 사용자가 영상 통화를 수행하는 경우를 가정할 수 있다. 제1 사용자는 제1 실감 영상 처리 장치(110)를 통해 제2 실감 영상 처리 장치(120)로부터 수신한 영상 데이터를 기반으로 디스플레이되는 출력 영상 중 특정한 영역을 집중하여 응시할 수 있다. 예를 들어, 제1 사용자는 제1 실감 영상 처리 장치(110) 상의 출력 영상 중 제2 사용자의 얼굴에 해당하는 부분에 대응되는 영상을 집중하여 응시할 수 있다. 이러한 경우, 제1 사용자의 관심 영역(150)은 제2 사용자의 얼굴에 해당하는 부분에 대응되는 영역일 수 있다.

제1 사용자의 관심 영역(150)은 제1 사용자의 머리 자세, 제1 사용자의 시선을 기반으로 판단될 수 있다. 출력 영상에서 제1 사용자의 관심 영역(150)을 추출하는 방법은 아래에서 구체적으로 개시한다.

본 발명의 실시예에 따르면, 관심 영역(150)이 결정된 경우, 관심 영역(150)에 대응되는 영상 데이터과 관심 영역을 제외한 부분에 대응되는 영상 데이터는 서로 다른 방법으로 부호화될 수 있다. 예를 들어, 관심 영역(150)에 대응되는 영상 데이터에 대한 압축률은 낮게 설정하고, 관심 영역(150)을 제외한 부분에 대응되는 영상 데이터의 압축률은 높게 설정할 수 있다. 이러한 경우, 사용자는 관심 영역(150)에 대응되는 영상의 부분을 고화질로 제공받을 수 있다.

도 2는 본 발명의 실시예에 따른 복수의 카메라의 켈리브레이션 방법을 나타낸 개념도이다.

본 발명의 실시예에 따르면 실감 영상 처리 장치로부터 생성되는 실감 영상은 복수의 카메라(200)를 기반으로 생성될 수 있다.

예를 들어, 실감 영상 처리 장치는 복수의 카메라(200)에 의해 획득된 영상(250)들을 스티칭(stitching)하여 더 넓은 화각(field of view)을 가지는 파노라마 영상으로 생성할 수도 있다. 또는 실감 영상 처리 장치는 복수의 카메라(200)에 의해 획득된 영상(250)을 기반으로 깊이 정보를 획득하고 획득된 깊이 영상을 사용하여 3D 영상을 생성할 수 있다.

복수의 카메라(200)를 기반으로 한 영상 촬영을 위해서는 복수의 카메라(200) 각각에 대한 공간적인 위치를 파악하기 위한 캘리브레이션(calibration) 절차가 수행될 수 있다.

서로 상대적으로 고정되어 있는 복수의 카메라(200) 각각에 대한 캘리브레이션 절차를 통해 변환 행렬이 결정될 수 있다. 결정된 변환 행렬을 기반으로 복수의 카메라(200) 각각을 기준으로 하는 좌표계가 하나의 영상 좌표계로 통합되어 사용될 수 있다.

복수의 카메라(200)에 대한 캘리브레이션은 복수의 카메라(200)의 화각을 결정하고, 복수의 카메라(200) 각각에 의해 촬상된 영상(250) 각각에서 특징점을 결정하고, 결정된 특징점 각각을 매칭하여 대응쌍을 생성하는 방법을 통해 수행될 수 있다. 대응쌍을 기반으로 변환 행렬이 결정될 수 있는데, 변환 행렬은 캘리브레이션을 위한 매개 변수를 포함할 수 있다.

복수의 카메라(200)가 방사형으로 배치되는 경우, 가장 넓은 화각을 획득할 수 있다. 하지만, 이웃하게 배치된 카메라끼리 겹치는 화각이 작을수록 공통적으로 검출되는 특징점의 수가 적어질 수 있다. 즉, 이웃하게 배치된 카메라끼리 겹치는 화각이 작을수록 두 카메라 각각의 촬상 영상 사이의 대응쌍의 수가 줄어들고, 캘리브레이션의 정확도가 떨어질 수 있다. 본 발명의 실시예에 따르면, 복수의 카메라(200) 간의 화각은 영상 서비스의 목적 또는 어플리케이션에 따라 조정될 수 있다. 예를 들어, 일대일 화상 통화와 같은 경우, 이웃하게 배치된 카메라 간의 겹치는 화각이 작게 설정될 수 있다. 반대로 화상 회의와 같은 경우, 이웃하게 배치된 카메라 간의 겹치는 화각이 일대일 화상 통화 보다 상대적으로 넓게 설정될 수 있다. 실감 영상 처리 장치는 사용자의 설정에 따라 화각을 조절할 수도 있으나, 전체 영상의 객체와 배경을 구분한 후 객체를 추적하여 복수의 카메라(200) 간의 화각을 조절할 수도 있다.

또한, 본 발명의 실시예에 따르면 복수의 카메라(200)의 촬상 영상(250)에서 특징점은 영상 서비스의 목적 또는 어플리케이션에 따라 조정될 수 있다. 예를 들어, 일대일 화상 통화와 같은 경우, 사람의 얼굴에 해당하는 부분에 대한 특징점을 기반으로 복수의 카메라(200)에 대한 캘리브레이션이 수행될 수 있다. 또 다른 예를 들어, 화상 회의와 같은 경우, 복수의 사람의 얼굴 및 칠판과 같은 특정 객체에 해당하는 부분에 대한 특징점을 기반으로 복수의 카메라에 대한 캘리브레이션이 수행될 수 있다.

이하, 복수의 카메라(200)에 대한 캘리브레이션 과정 중 복수의 카메라(200)에 대한 화각을 설정하는 방법 및 복수의 카메라의 촬상 영상(250)에서 특징점을 추출하는 방법에 대해 구체적으로 개시한다.

도 3은 본 발명의 실시예에 따른 복수의 카메라에 대한 화각을 설정하는 방법을 나타낸 순서도이다.

도 3에서는 실감 영상 처리 장치에 포함되는 복수의 카메라(300)가 화각 내에 객체가 존재하는지 여부를 판단하고, 복수의 카메라(300)가 분석된 객체를 기준으로 화각을 설정하는 방법이 개시된다. 도 3에서는 설명의 편의상 3개의 카메라에 대한 화각이 설정되는 방법에 대해 개시한다.

도 3을 참조하면, 복수의 카메라(제1 카메라, 제2 카메라 및 제3 카메라)(300) 각각은 객체를 탐색할 수 있다.

서비스되는 어플리케이션에 따라 실감 영상 처리 장치는 복수의 카메라(300)의 현재 화각 내에 객체가 존재하는지 여부를 탐색할 수 있다. 예를 들어, 영상 통화가 수행되는 경우, 실감 영상 처리 장치는 복수의 카메라(300)의 현재 화각 내에 사람(구체적으로는 사람의 얼굴)이 객체로서 존재하는지 여부를 탐색할 수 있다.

복수의 카메라(300) 각각의 화각 내에 객체가 존재하는지 여부는 다양한 방법을 기반으로 판단될 수 있다.

실감 영상 처리 장치에는 사람의 얼굴에 대한 템플릿이 저장되어 있을 수 있다. 실감 영상 처리 장치는 저장된 사람의 얼굴에 대한 템플릿을 기준으로 복수의 카메라에 의해 촬상되는 촬상 영상에 객체(예를 들어, 사람)가 존재하는지 여부를 탐색할 수 있다. 사람의 얼굴에 대한 템플릿은 일반적인 사람의 얼굴 형상에 대한 템플릿일 수도 있고 특정인의 얼굴에 대한 템플릿일 수도 있다. 서비스되는 어플리케이션의 목적이 다른 경우, 실감 영상 처리 장치에서 탐색되는 객체가 변할 수 있다.

실감 영상 처리 장치는 복수의 카메라(300) 각각에서 객체가 탐색되도록 복수의 카메라(300) 각각의 화각을 변경시킬 수 있다.

또한, 실감 영상 처리 장치는 객체를 촬상 영상(350)의 중앙에 위치시키기 위해 복수의 카메라(300) 각각의 화각을 변경시킬 수 있다.

이러한 방법을 사용함으로써 객체의 위치에 따라 복수의 카메라(300)에 대한 화각이 변경될 수 있다. 변경된 복수의 카메라(300)의 화각을 기준으로 복수의 카메라(300)에 대한 특징점을 추출함으로써 정확한 캘리브레이션이 수행될 수 있다.

도 4는 본 발명의 실시예에 따른 촬상 영상에서 특징점을 추출하는 방법을 나타낸 개념도이다.

도 4에서는 실감 영상 처리 장치에 포함되는 복수의 카메라에 의해 촬상된 촬상 영상에서 객체의 특징점(400)을 추출하는 방법에 대해 개시한다. 도 4에서는 설명의 편의상 3개의 카메라의 촬상 영상을 기준으로 설명한다. 도 4를 참조하면, 복수의 카메라(제1 카메라, 제2 카메라 및 제3 카메라) 각각은 촬상 영상에서 객체의 특징점(400)을 추출할 수 있다.

예를 들어, 영상 통화가 수행되는 경우, 복수의 카메라 각각은 촬상 영상에서 사람(구체적으로는 사람의 얼굴)의 얼굴에 대한 특징점(400)을 추출할 수 있다. 예를 들어, 사람의 얼굴에 대한 특징점(400)은 눈, 코, 입과 같은 얼굴의 특정 부위에 대응될 수 있다. 특징점들(400)은 영상에서 고주파 영역(high-frequency region)에 해당하는 화소값(pixel value)의 변화가 큰 부분에서 추출될 수 있다. 촬상 영상에서 얼굴에 대한 특징점(400)을 추출하기 위해 촬상 영상에서 얼굴과 배경이 분리될 수 있다. 배경과 얼굴의 외곽 정보를 분리하기 위해 에지 탐색이 사용될 수도 있다.

실감 영상 처리 장치에는 사람의 얼굴에 대한 템플릿이 저장되어 있을 수 있고, 저장된 사람의 얼굴에 대한 템플릿을 기준으로 촬상 영상에서 사람의 얼굴의 특징점(400)이 추출될 수 있다. 즉, 실감 영상 처리 장치는 템플릿 영상과 촬상 영상을 비교하여 촬상 영상에서 객체의 특징점(400)을 추출할 수 있다. 서비스되는 어플리케이션의 목적이 다른 경우, 실감 영상 처리 장치에서 추출되는 객체의 특징점(400)은 달라질 수 있다. 예를 들어, 화상 회의를 수행하는 경우, 객체는 칠판, 영상 스크린 등 일 수 있다. 이러한 경우, 다양한 객체에 대한 특징점(400)이 추출될 수 있다. 이러한 방식으로 추출된 특징점은 복수의 카메라에 대한 캘리브레이션(450)을 위해 사용될 수 있다.

추출된 특징점은 복수의 카메라에 대한 캘리브레이션뿐만 아니라, 실감 영상(예를 들어, 파노라마 영상)을 생성하기 위해서도 사용될 수 있다.

도 5는 본 발명의 실시예에 따른 실감 영상을 생성하는 방법을 나타낸 개념도이다.

도 5에서는 복수의 카메라(제1 카메라, 제2 카메라 및 제3 카메라)의 촬상 영상이 특징점을 기준으로 스티칭되어 실감 영상을 생성하는 방법에 대해 개시한다.

도 5를 참조하면, 제1 카메라에 의해 촬상된 제1 촬상 영상(510)과 제2 카메라에 의해 촬상된 제2 촬상 영상(520) 및 제3 카메라에 의해 촬상된 제3 촬상 영상(530)은 객체의 특징점을 기준으로 연결되어 실감 영상을 생성할 수 있다.

제1 영상에 포함된 객체의 제1 특징점, 제2 영상에 포함된 객체의 제2 특징점, 제3 영상에 포함된 제3 특징점은 서로 대응될 수 있다. 복수의 영상에서 대응되는 특징점은 서로 연결될 수 있고, 특징점 간의 연결을 기반으로 실감 영상(550)이 생성될 수 있다. 실감 영상(550)은 3D 영상 또는 다각도에서 객체를 볼 수 있도록 구현된 영상일 수도 있다.

예를 들어, 실감 영상(550)은 다각도에서 객체를 촬상한 파노라마 영상 데이터일 수 있다.

실감 영상(550)은 제1 카메라에 의한 객체의 촬상각인 제1 각도, 제2 카메라에 의한 객체의 촬상각인 제2 각도, 제3 카메라에 의한 객체의 촬상각인 제3 각도의 범위 내에 위치한 객체의 이미지의 집합일 수 있다.

객체의 특징점은 제1 각도 내지 제3 각도에서 촬상된 각각의 촬상 영상(제1 촬상 영상(510), 제2 촬상 영상(520), 제3 촬상 영상(530))에 포함된 객체의 영상 데이터를 보정하여 디스플레이하기 위해 사용될 수 있다. 예를 들어, 복수의 촬상 영상 각각에서 추출된 객체의 특징점 간의 거리가 동일하도록 영상 데이터를 보정할 수 있다. 이러한 보정을 통해 제1 각도 내지 제3 각도에서 촬상된 객체가 크기의 차이 없이 자연스럽게 화면 상에서 디스플레이될 수 있다. 즉, 복수의 촬상 영상 각각에서 추출된 객체의 특징점 간의 상관 관계(540)를 기반으로 실감 영상(550)에서 객체의 영상 데이터에 대한 보정을 수행할 수 있다.

또한 복수의 촬상 영상(510, 520, 530) 각각에서 추출된 객체의 특징점 간의 상관 관계를 기반으로 실제 촬상각 외의 촬상각(예를 들어, 제1 각도와 제2 각도의 사이각)에서 정면으로 바라본 객체의 이미지가 생성될 수 있다. 예를 들어, 제1 각도와 제2 각도의 사이각에 대응되는 객체의 이미지는 제1 촬상 영상(510)과 제2 촬상 영상(520)을 기반으로 보간되어 생성될 수 있다. 제1 촬상 영상(510)과 제2 촬상 영상(520)을 기반으로 한 보간이 수행되는 경우, 제1 촬상 영상(510)에서 추출된 객체의 특징점과 제2 촬상 영상(520)에서 추출된 객체의 특징점 간의 상관 관계가 고려될 수 있다. 즉, 이러한 보간 방법을 사용함으로써 제1 각도, 제2 각도에서 물체를 바라본 촬상 영상뿐만 아니라 제1 각도와 제2 각도의 사이에 해당하는 각도에서 객체를 정면으로 바라본 추정 영상이 실감 영상으로서 생성될 수 있다.

영상 데이터를 송신하는 실감 영상 처리 장치는 특징점 간의 상관 관계 정보(540)를 기반으로 보정된 영상 데이터를 송신할 수도 있으나, 보정과 같은 영상 처리 과정이 영상 데이터를 수신하는 실감 영상 처리 장치에서도 수행될 수 있다.

영상 데이터를 송신하는 실감 영상 처리 장치는 특징점 간의 상관 관계 정보(540)만을 영상 데이터를 수신하는 실감 영상 처리 장치로 전송할 수 있다. 영상 데이터를 수신하는 실감 영상 처리 장치는 수신한 특징점 간의 상관 관계 정보(540)를 기반으로 제1 각도 내지 제3 각도 범위에 대한 객체의 이미지 정보를 출력 영상으로써 생성하여 화면에 디스플레이할 수 있다.

또 다른 예로, 실감 영상(550)은 깊이 정보를 포함하는 3D 영상일 수도 있다. 예를 들어, 실감 영상(550)은 제1 카메라에 의해 촬상된 제1 촬상 영상, 제2 카메라에 의해 촬상된 제2 촬상 영상, 제3 카메라에 의해 촬상된 제3 촬상 영상을 기반으로 객체에 대한 깊이 정보가 결정될 수 있다. 결정된 객체에 대한 깊이 정보는 실감 영상(550)을 생성하기 위해 사용될 수 있다.

영상 데이터를 송신하는 실감 영상 처리 장치는 깊이 정보를 영상 데이터를 수신하는 실감 영상 처리 장치로 전송할 수 있다. 영상 데이터를 수신하는 실감 영상 처리 장치는 깊이 정보를 기반으로 생성된 3D 영상을 출력 영상으로써 생성하여 화면에 디스플레이할 수 있다.

도 6은 본 발명의 실시예에 따른 관심 영역을 추출하는 방법을 나타낸 개념도이다.

도 6에서는 출력 영상에서 사용자의 관심 영역을 추출하는 방법에 대해 구체적으로 개시한다. 전술한 바와 같이 관심 영역은 출력 영상(600) 중 사용자의 시점이 집중되는 영역일 수 있다.

도 6을 참조하면, 사용자는 관심 영역을 추출하기 위해 사용자의 시선에 대한 추적을 수행할 수 있다. 시선 추적은 다양한 방법으로 수행될 수 있다.

시선 추적을 위해 실감 영상 처리 장치에 설치된 카메라를 기반으로 사용자의 안구에서 눈동자의 방향을 추적할 수 있다. 예를 들어, 사용자의 눈으로 빛이 비춰지는 경우, 복수개의 반사광이 생길 수 있다. 구체적으로 사람의 안구는 각막의 겉면, 안쪽면, 수정체 등 여러 겹의 렌즈가 겹쳐져 있는 형상을 가진다. 빛이 눈으로 비춰지는 경우, 이러한 안구의 형상은 복수개의 반사광을 생성할 수 있다. 센서는 생성된 복수개의 반사광의 움직임을 분석하여 안구의 움직임을 분석할 수 있다.

안구의 움직임을 통해 현재 출력 영상(600) 중 사용자의 시점이 집중되는 영역에 대한 정보를 회득할 수 있다. 일정 기간 동안 추적된 사용자의 시점 정보를 기반으로 출력 영상(600)에서 관심 영역(620, 640)을 추출할 수 있다.

관심 영역(620, 640)을 추출함에 있어서 시선 분석뿐만 아니라 사용자의 머리의 위치가 추가적으로 고려될 수 있다.

예를 들어, 사용자의 머리의 정면 위치가 우선적으로 분석되고 사용자 머리의 정면 위치에 해당하는 범위에서 사용자의 시점이 분석될 수 있다. 예를 들어, 사용자 머리의 정면 위치가 제1 위치인 경우, 제1 위치에 해당하는 출력 영상(600)에서 제1 관심 영역(620)이 추출될 수 있다. 다음으로 사용자의 시점을 분석하여 제1 관심 영역(620)에 포함되는 제2 관심 영역(640)이 추출될 수 있다. 즉, 제1 관심 영역(620)은 제2 관심 영역(640)보다 넓은 범위일 수 있다.

추출된 관심 영역에 대한 정보는 서로 상대방의 사용자 단말로 전송될 수 있다. 추출된 관심 영역에 대한 정보를 수신한 사용자 단말은 추출된 관심 영역에 대한 정보를 기반으로 영상 데이터의 부호화를 수행할 수 있다. 본 발명의 실시예에 따르면, 양자화 관련 정보(예를 들어, 양자화 계수(quantization factor, Q-factor))를 조절하여 영상 부호화시 관심 영역과 관심 영역이 아닌 영역에 대해 서로 다른 양자화를 수행할 수 있다.

예를 들어, 사용자 단말은 관심 영역에 해당하는 부분에 대한 양자화 계수를 관심 영역에 해당하지 않는 부분보다 상대적으로 낮은 값으로 설정할 수 있다. 양자화 계수가 상대적으로 낮은 값으로 설정되는 경우, 관심 영역에 해당하는 부분의 영상의 질은 상대적으로 향상될 수 있고, 비트율은 상대적으로 증가할 수 있다. 즉, 관심 영역에 대응되는 영상 데이터에 대해 양자화로 인한 손실을 줄일 수 있다. 반대로 사용자 단말은 관심 영역에 해당하지 않는 부분에 대한 양자화 계수를 관심 영역에 해당하는 부분보다 상대적으로 높은 값으로 설정할 수 있다. 양자화 계수가 상대적으로 높은 값으로 설정되는 경우, 관심 영역에 해당하지 않는 부분의 영상의 질은 상대적으로 저하되고 비트율은 상대적으로 감소할 수 있다. 즉, 관심 영역에 해당하지 않는 부분에 대응되는 영상 데이터에 대한 양자화로 인한 손실은 감수할 수 있다. 이러한 방식을 사용하는 경우, 관심 영역에 해당하는 영상 데이터에 대한 압축률은 낮아지고, 관심 영역에 해당하는 영상 데이터에 대한 압축률은 높아질 수 있다.

일반적인 예로, 제2 관심 영역(640)에 대한 양자화 계수를 제2 관심 영역(640) 이외의 영역에 대한 양자화 계수보다 낮게 설정할 수도 있으나, 반드시 이에 한정되는 것은 아니다. 가령, 제2 관심 영역(640)을 기준으로 영역을 구분하지 않고, 제1 관심 영역(620)을 기준으로 영역을 구분함으로써, 제1 관심 영역(620)에 대한 양자화 계수를 제1 관심 영역(620) 이외의 영역에 대한 양자화 계수보다 낮게 설정할 수도 있을 것이다. 또 다른 예로서, 이와 같이 양자화 계수를 2분화하지 않고 3분화할 수도 있을 것이다. 3분화의 구체적인 예로, 제1 관심 영역(620)에 대한 정보, 제2 관심 영역(640)에 대한 정보를 기반으로 양자화를 수행할 수 있다. 즉, 제1 관심 영역(620)에 대해 제1 양자화 계수를 적용하고, 제2 관심 영역(640)에 대해 제2 양자화 계수를 적용하고, 관심 영역을 제외한 영역에 대해 제3 양자화 계수를 적용할 수 있다. 제2 양자화 계수, 제1 양자화 계수, 제3 양자화 계수의 순서로 양자화 계수의 크기가 상대적으로 증가할 수 있다.

또 다른 방법으로 사용자 단말은 관심 영역에 대응되는 영상 데이터를 전송시 낮은 레벨의 변조 방법 및 낮은 코딩 효율을 사용할 수 있다. 반대로 사용자 단말은 관심 영역에 해당하지 않는 부분에 대응되는 영상 데이터를 전송시 높은 레벨의 변조 방법 및 높은 코딩 효율을 사용할 수 있다. 이러한 방식을 사용하는 경우, 마찬가지로 관심 영역에 해당하는 영상 데이터에 대한 압축률은 낮아지고, 관심 영역에 해당하는 영상 데이터에 대한 압축률은 높아질 수 있다.

도 7은 본 발명의 실시예에 따른 실감 영상 처리 장치의 영상 데이터 생성 방법을 나타낸 순서도이다.

도 7에서 송신 실감 영상 처리 장치는 영상 데이터를 전송하는 실감 영상 처리 장치, 수신 실감 영상 처리 장치는 영상 데이터를 수신하는 실감 영상 처리 장치를 지시할 수 있다.

도 7을 참조하면, 송신 실감 영상 처리 장치는 복수의 카메라에 대한 캘리브레이션을 수행한다(단계 S710).

복수의 카메라에 대한 캘리브레이션은 복수의 카메라 각각에 대한 화각을 설정하고, 복수의 카메라 각각에 의해 촬상된 영상 각각에서 특징점을 결정하는 방법을 통해 수행될 수 있다. 송신 실감 영상 처리 장치는 결정된 특징점 각각을 매칭하여 대응쌍을 생성하고 생성된 대응쌍을 기반으로 변환 행렬을 결정할 수 있다. 변환 행렬은 캘리브레이션을 위한 매개 변수를 포함할 수 있다.

송신 실감 영상 처리 장치는 복수의 카메라에서 촬상된 영상을 기반으로 실감 영상을 생성한다(단계 S720).

실감 영상은 다각도에서 객체를 촬상한 영상 데이터일 수 있다. 예를 들어, 실감 영상은 제1 카메라에 의한 객체의 촬상각인 제1 각도, 제2 카메라에 의한 객체의 촬상각인 제2 각도, 제3 카메라에 의한 객체의 촬상각인 제3 각도의 범위 내에 위치한 객체의 이미지의 집합일 수 있다.

또 다른 예로, 실감 영상은 깊이 정보를 포함하는 3D 영상일 수도 있다. 예를 들어, 실감 영상은 제1 카메라에 의해 촬상된 제1 촬상 영상, 제2 카메라에 의해 촬상된 제2 촬상 영상, 제3 카메라에 의해 촬상된 제3 촬상 영상을 기반으로 객체에 대한 깊이 정보가 결정될 수 있다. 결정된 객체에 대한 깊이 정보는 실감 영상을 생성하기 위해 사용될 수 있다.

송신 실감 영상 처리 장치는 영상 데이터를 수신 실감 영상 처리 장치로 전송한다(단계 S730).

영상 데이터는 실감 영상을 수신 실감 영상 처리 장치에서 디스플레이하기 위한 영상 데이터일 수 있다. 영상 데이터는 복수의 카메라에 의해 생성된 촬상 영상에 대한 정보뿐만 아니라, 복수의 촬상 영상 각각에서 추출된 객체의 특징점 간의 상관 관계에 대한 정보 및/또는 깊이 정보 등을 포함할 수 있다.

송신 실감 영상 처리 장치는 수신 실감 영상 처리 장치로부터 관심 영역에 대한 정보를 수신한다(단계 S740).

수신 실감 영상 처리 장치는 전술한 도 6에 개시된 방법을 기반으로 사용자의 머리의 위치 및/또는 사용자의 시선 위치를 분석하여 관심 영역에 대한 정보를 생성할 수 있다. 수신 실감 영상 처리 장치는 관심 영역에 대한 정보를 송신 실감 영상 처리 장치로 전송할 수 있다.

송신 실감 영상 처리 장치는 수신한 관심 영역에 대한 정보를 기반으로 영상 데이터를 부호화한다(단계 S750).

예를 들어 송신 실감 영상 처리 장치는 관심 영역에 해당하는 부분에 대한 양자화 계수를 상대적으로 낮게 설정하여 관심 영역에 대응되는 영상 데이터에 대한 양자화 손실을 줄일 수 있다. 반대로 사용자 단말은 관심 영역에 해당하지 않는 부분에 대한 양자화 계수를 상대적으로 높게 설정할 수 있다. 즉, 사용자 단말은 관심 영역에 해당하지 않는 부분에 대응되는 영상 데이터에 대한 양자화 손실은 감수할 수 있다. 이러한 방식을 사용하는 경우, 관심 영역에 해당하는 영상 데이터에 대한 압축률은 낮아지고, 관심 영역에 해당하는 영상 데이터에 대한 압축률은 높아질 수 있다.

도 8은 본 발명의 실시예에 따른 실감 영상 처리 장치를 나타낸 개념도이다.

도 8을 참조하면, 실감 영상 처리 장치는 영상 촬상부(800), 캘리브레이션 수행부(810), 실감 영상 생성부(820), 영상 부호화부(830), 영상 복호화부(840), 관심 영역 설정부(850), 통신부(860), 프로세서(870)를 포함할 수 있다.

영상 촬상부(800)는 복수의 카메라로 구현될 수 있다. 복수의 카메라는 객체를 촬상할 수 있다.

캘리브레이션 수행부(810)는 영상 촬상부에 포함된 복수의 카메라 각각에 대한 화각을 설정하고, 복수의 카메라 각각에 의해 촬상된 영상 각각에서 특징점을 결정하여 캘리브레이션을 수행할 수 있다.

실감 영상 생성부(820)는 복수의 카메라 각각에서 촬상된 영상을 기반으로 실감 영상을 생성하기 위해 구현될 수 있다. 실감 영상은 다각도에서 객체를 촬영한 영상, 깊이 정보를 포함하는 3D 영상일 수 있다.

영상 부호화부(830)는 실감 영상을 부호화하여 다른 실감 영상 처리 장치에 전송하기 위한 영상 데이터를 생성하기 위해 구현될 수 있다. 영상 부호화부(830)는 수신측의 사용자 단말로부터 수신한 관심 영역에 대한 정보를 기반으로 영상 데이터를 부호화할 수 있다.

영상 복호화부(840)는 다른 실감 영상 처리 장치로부터 영상 데이터를 수신하고 복호화하기 위해 구현될 수 있다. 영상 복호화부(840)를 기반으로 복호화된 영상 데이터는 실감 영상 처리 장치의 디스플레이를 통해 출력될 수 있다.

관심 영역 설정부(850)는 출력 영상에서 사용자의 관심 영역을 추출하기 위해 구현될 수 있다. 관심 영역 설정부(850)는 사용자 머리의 위치, 사용자의 시선 위치를 분석하여 출력 영상 중 관심 영역에 대한 정보를 추출하여 관심 영역에 대한 정보를 생성할 수 있다. 생성된 관심 영역에 대한 정보는 출력 영상을 송신한 다른 실감 영상 처리 장치로 전송될 수 있다.

통신부(860)는 실감 영상 처리 장치의 영상 데이터, 관심 영역에 대한 정보 등을 다른 실감 영상 처리 장치로 전송하고, 다른 실감 영상 처리 장치의 영상 데이터, 관심 영역에 대한 정보를 전송하기 위해 구현될 수 있다.

프로세서(870)는 영상 촬상부(800), 캘리브레이션 수행부(810), 실감 영상 생성부(820), 영상 부호화부(830), 영상 복호화부(840), 관심 영역 설정부(850), 통신부(860)의 동작을 제어하기 위해 구현될 수 있다.

이상 설명된 본 발명에 따른 실시예들은 다양한 컴퓨터 구성요소를 통하여 수행될 수 있는 프로그램 명령어의 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 컴퓨터 판독 가능한 기록 매체에 기록되는 프로그램 명령어는 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 ROM, RAM, 플래시 메모리 등과 같은 프로그램 명령어를 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령어의 예에는, 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 상기 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.

이상에서 본 발명이 구체적인 구성요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나, 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명이 상기 실시예들에 한정되는 것은 아니며, 본 발명이 속하는 기술분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형을 꾀할 수 있다.

따라서, 본 발명의 사상은 상기 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등하게 또는 등가적으로 변형된 모든 것들은 본 발명의 사상의 범주에 속한다고 할 것이다.

600: 촬상 영상 610: 제1 관심 영역
620: 제2 관심 영역 800: 영상 촬상부
810: 캘리브레이션 수행부 820: 실감 영상 생성부
830: 영상 부호화부 840: 영상 복호화부
850: 관심 영역 설정부 860: 통신부
870: 프로세서

Claims

실감 영상을 위한 영상 데이터를 생성하는 방법에 있어서,
송신 실감 영상 처리 장치가 복수의 카메라에 대한 캘리브레이션을 수행하는 단계;
상기 송신 실감 영상 처리 장치가 캘리브레이션된 상기 복수의 카메라를 기반으로 상기 실감 영상을 위한 제1 영상 데이터를 생성하고, 상기 제1 영상 데이터를 수신 실감 영상 처리 장치로 전송하는 단계;
상기 송신 실감 영상 처리 장치가 상기 제1 영상 데이터에 대한 응답으로 상기 수신 실감 영상 처리 장치로부터 관심 영역에 대한 정보를 수신하는 단계; 및
상기 송신 실감 영상 처리 장치가 상기 관심 영역에 대한 정보를 기반으로 상기 관심 영역에 대응되는 영상 데이터를 상기 관심 영역 이외의 영역에 대응되는 영상 데이터보다 더 낮은 압축률로 압축한 제2 영상 데이터를 생성하여 상기 수신 실감 영상 처리 장치로 전송하는 단계를 포함하되,
상기 캘리브레이션을 수행하는 단계는,
상기 송신 실감 영상 처리 장치가 상기 복수의 카메라 각각에 대한 화각을 설정하는 단계;
상기 송신 실감 영상 처리 장치가 상기 복수의 카메라 각각의 촬상 영상에서 특징점을 추출하는 단계; 및
상기 송신 실감 영상 처리 장치가 상기 특징점을 매칭하여 상기 캘리브레이션을 위한 매개 변수를 결정하는 단계를 포함하되,
상기 화각은 상기 복수의 카메라 각각의 상기 촬상 영상에 객체가 포함되었는지 여부 및 상기 촬상 영상의 중심 영역에 상기 객체가 위치하였는지 여부를 기반으로 설정되는 것을 특징으로 하는 실감 영상을 위한 영상 데이터를 생성하는 방법.
삭제
제1항에 있어서,
상기 송신 실감 영상 처리 장치가 상기 복수의 카메라 각각의 촬상 영상에서 특징점을 추출하는 단계는,
상기 송신 실감 영상 처리 장치가 상기 촬상 영상에서 배경과 상기 객체를 분리하는 단계; 및
상기 송신 실감 영상 처리 장치가 상기 촬상 영상에서 분리된 상기 객체의 이미지와 상기 객체에 대한 템플릿을 비교하여 상기 객체의 이미지에서 상기 특징점을 추출하는 단계를 포함하는 것을 특징으로 하는 실감 영상을 위한 영상 데이터를 생성하는 방법.
제1항에 있어서,
상기 실감 영상을 위한 제1 영상 데이터를 생성하는 단계는,
상기 송신 실감 영상 처리 장치가 상기 복수의 카메라 각각에 의해 촬상된 복수의 촬상 영상 각각에서 객체의 특징점을 추출하는 단계;
상기 송신 실감 영상 처리 장치가 상기 특징점 간의 상관 관계를 추출하는 단계; 및
상기 송신 실감 영상 처리 장치가 상기 상관 관계를 기반으로 상기 촬상 영상 각각을 스티칭하여 상기 제1 영상 데이터를 생성하는 단계를 포함하는 것을 특징으로 하는 실감 영상을 위한 영상 데이터를 생성하는 방법.
제1항에 있어서,
상기 관심 영역에 대한 정보는 상기 제1 영상 데이터를 기반으로 출력된 출력 영상을 제공받는 상기 수신 실감 영상 처리 장치의 사용자의 머리 위치 정보를 기반으로 결정된 제1 관심 영역에 대한 정보 및 상기 사용자의 시선 위치 정보를 기반으로 결정되는 제2 관심 영역에 대한 정보를 포함하되,
상기 송신 실감 영상 처리 장치는 상기 제1 관심 영역에 대해 제1 양자화 계수로 양자화를 수행하고, 상기 제2 관심 영역에 대해 제2 양자화 계수로 양자화를 수행하고,
상기 제1 양자화 계수는 상기 제2 양자화 계수보다 큰 것을 특징으로 하는 실감 영상을 위한 영상 데이터를 생성하는 방법.
실감 영상을 위한 영상 데이터를 생성하는 실감 영상 처리 장치에 있어서, 상기 실감 영상 처리 장치는 프로세서를 포함하고,
상기 프로세서는,
복수의 카메라에 대한 캘리브레이션을 수행하도록 구현되고,
상기 캘리브레이션된 복수의 카메라를 기반으로 상기 실감 영상을 위한 제1 영상 데이터를 생성하고, 상기 제1 영상 데이터를 수신 실감 영상 처리 장치로 전송하고,
상기 제1 영상 데이터에 대한 응답으로 상기 수신 실감 영상 처리 장치로부터 관심 영역에 대한 정보를 수신하고,
상기 관심 영역에 대한 정보를 기반으로 상기 관심 영역에 대응되는 영상 데이터를 상기 관심 영역 이외의 영역에 대응되는 영상 데이터보다 더 낮은 압축률로 압축한 제2 영상 데이터를 생성하여 상기 수신 실감 영상 처리 장치로 전송하도록 구현되되,
상기 캘리브레이션을 위해 상기 복수의 카메라 각각에 대한 화각을 설정하고, 상기 복수의 카메라 각각의 촬상 영상에서 특징점을 추출하고, 상기 특징점을 매칭하여 상기 캘리브레이션을 위한 매개 변수를 결정하도록 구현되고,
상기 화각은 상기 복수의 카메라 각각의 상기 촬상 영상에 객체가 포함되었는지 여부 및 상기 촬상 영상의 중심 영역에 상기 객체가 위치하였는지 여부를 기반으로 설정되는 것을 특징으로 하는 실감 영상 처리 장치.
삭제
제6항에 있어서,
상기 프로세서는 상기 촬상 영상에서 배경과 상기 객체를 분리하고,
상기 촬상 영상에서 분리된 상기 객체의 이미지와 상기 객체에 대한 템플릿을 비교하여 상기 객체의 이미지에서 상기 특징점을 추출하도록 구현되는 것을 특징으로 하는 실감 영상 처리 장치.
제6항에 있어서,
상기 프로세서는,
상기 복수의 카메라 각각에 의해 촬상된 복수의 촬상 영상 각각에서 객체의 특징점을 추출하고,
상기 특징점 간의 상관 관계를 추출하고,
상기 상관 관계를 기반으로 상기 촬상 영상 각각을 스티칭하여 상기 제1 영상 데이터를 생성하도록 구현되는 것을 특징으로 하는 실감 영상 처리 장치.
제6항에 있어서,
상기 관심 영역에 대한 정보는 상기 제1 영상 데이터를 기반으로 출력된 출력 영상을 제공받는 상기 수신 실감 영상 처리 장치의 사용자의 머리 위치 정보를 기반으로 결정된 제1 관심 영역에 대한 정보 및 상기 사용자의 시선 위치 정보를 기반으로 결정되는 제2 관심 영역에 대한 정보를 포함하되,
상기 프로세서는,
상기 제1 관심 영역에 대해 제1 양자화 계수로 양자화를 수행하고, 상기 제2 관심 영역에 대해 제2 양자화 계수로 양자화를 수행하도록 하되,
상기 제1 양자화 계수는 상기 제2 양자화 계수보다 큰 것을 특징으로 하는 실감 영상 처리 장치.
제1항 및 제3항 내지 제5항 중 어느 한 항에 따른 방법을 실행하기 위한 컴퓨터 프로그램을 기록한 컴퓨터로 판독 가능한 기록 매체.