KR20190128992A - 정보 처리장치, 정보 처리방법, 및 기억매체 - Google Patents

정보 처리장치, 정보 처리방법, 및 기억매체 Download PDF

Info

Publication number
KR20190128992A
KR20190128992A KR1020190046447A KR20190046447A KR20190128992A KR 20190128992 A KR20190128992 A KR 20190128992A KR 1020190046447 A KR1020190046447 A KR 1020190046447A KR 20190046447 A KR20190046447 A KR 20190046447A KR 20190128992 A KR20190128992 A KR 20190128992A
Authority
KR
South Korea
Prior art keywords
information
virtual
viewpoint
imaging
virtual viewpoint
Prior art date
Application number
KR1020190046447A
Other languages
English (en)
Inventor
유리 요시무라
Original Assignee
캐논 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 캐논 가부시끼가이샤 filed Critical 캐논 가부시끼가이샤
Publication of KR20190128992A publication Critical patent/KR20190128992A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/111Transformation of image signals corresponding to virtual viewpoints, e.g. spatial image interpolation
    • H04N13/117Transformation of image signals corresponding to virtual viewpoints, e.g. spatial image interpolation the virtual viewpoint locations being selected by the viewers or determined by viewer tracking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/255Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/167Synchronising or controlling image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/189Recording image signals; Reproducing recorded image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • H04N23/611Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/90Arrangement of cameras or camera modules, e.g. multiple cameras in TV studios or sports stadiums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/204Image signal generators using stereoscopic image cameras
    • H04N13/243Image signal generators using stereoscopic image cameras using three or more 2D image sensors

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Processing Or Creating Images (AREA)
  • Image Generation (AREA)
  • User Interface Of Digital Computer (AREA)
  • Image Analysis (AREA)
  • Studio Devices (AREA)

Abstract

정보 처리장치는, 복수의 촬상장치에 의해 복수의 방향에서 촬상함으로써 얻어지는 복수의 촬상 화상에 근거하여 생성되는 가상 시점 화상에 대응하는 가상 시점에 관한 시점 정보를 취득하도록 구성된 취득부와, 상기 복수의 촬상 화상의 적어도 어느 것에 포함되고 상기 취득부에 의해 취득되는 상기 시점 정보에 근거하여 특정되는 가상 시점에 대응하는 시야 내에 포함되는 오브젝트를 검출하도록 구성된 검출부와, 상기 취득부에 의해 취득되는 상기 시점 정보에 근거하여 특정되는 복수의 가상 시점에 관련된 상기 검출부의 검출 결과에 근거하여, 시야가 동일한 오브젝트를 포함하는 가상 시점의 수와 관련된 정보를 출력하도록 구성된 출력부를 구비한다.

Description

정보 처리장치, 정보 처리방법, 및 기억매체{INFORMATION PROCESSING APPARATUS, INFORMATION PROCESSING METHOD, AND STORAGE MEDIUM}
본 개시내용은, 복수의 촬상장치에 의해 취득되는 복수의 촬상 화상에 근거하여 생성되는 가상 시점 화상에 관한 것이다.
복수의 촬상장치(카메라)를 다른 위치에 설치해서 다시점에서 동기 촬상을 행하고, 해당 동기 촬상에 의해 얻어진 복수의 화상을 사용하여, 촬상장치의 설치 위치로부터 촬상한 화상 뿐만 아니라, 시점을 임의로 변경가능한 가상 시점 화상을 생성하는 기술이 있다. 가상 시점 화상은, 서버 등의 화상처리부가 복수의 촬상장치에 의해 촬상된 화상을 집약하고, 3차원 모델을 생성하고, 렌더링 처리를 실시함으로써 생성된다. 그후, 생성된 가상 시점 화상은 열람을 위해 유저 단말에 전송된다.
예를 들면, 스포츠 경기를 촬상하여 얻어진 화상으로부터, 유저에 의해 설정된 시점에 대응한 가상 시점 화상을 생성함으로써, 유저는, 자신이 원하는 시점에서 시합을 관전할 수 있다. 일본국 특개 2014-215828호 공보에는, 유저가 지정한 가상 시점을 다른 유저와 공유함으로써 유저가 다른 유저와 일체감을 느끼면서 가상 시점 화상을 시청할 수 있는 기술이 개시되어 있다. 일본국 특개 2014-215828호 공보에는, 수많은 유저에 의해 지정되어 있는 가상 시점을 특정(결정)하는 정보를 표시하는 기술이 더 개시되어 있다.
예를 들면, 스포츠 경기를 촬상하여 얻어진 화상으로부터 생성되는 가상 시점 화상에 있어서, 유저가 높은 주목도를 갖는 주목 대상의 씬이나 오브젝트(예를 들면, 선수)를 특정할 수 있으면, 많은 유저가 만족하는 하이라이트 화상의 작성 등의 다양한 용도에 가상 시점 화상을 이용할 수 있다. 그렇지만, 일본국 특개 2014-215828호 공보에 기재된 기술에 의해, 어떤 시점에 있어서 많은 유저에 의해 지정되어 있는 가상 시점을 특정하는 정보가 얻어져도, 그 정보로부터 주목 대상의 씬이나 오브젝트를 특정하는 것은 용이하지 않다. 가상 시점 화상에 관련되는 시청 대상이 스포츠 경기인 경우 뿐만 아니라, 콘서트 등의 다른 이벤트를 가상 시점 화상에 관한 시청 대상으로 할 경우에도 유사한 과제가 생길 수 있다.
본 개시내용의 한 개 이상의 측면에 따르면, 정보 처리장치는, 복수의 촬상장치에 의해 복수의 방향에서 촬상함으로써 얻어지는 복수의 촬상 화상에 근거하여 생성되는 가상 시점 화상에 대응하는 가상 시점에 관한 시점 정보를 취득하도록 구성된 취득부와, 상기 복수의 촬상 화상의 적어도 어느 것에 포함되고 상기 취득부에 의해 취득되는 상기 시점 정보에 근거하여 특정되는 가상 시점에 대응하는 시야 내에 포함되는 오브젝트를 검출하도록 구성된 검출부와, 상기 취득부에 의해 취득되는 상기 시점 정보에 근거하여 특정되는 복수의 가상 시점에 관련된 상기 검출부의 검출 결과에 근거하여, 시야가 동일한 오브젝트를 포함하는 가상 시점의 수와 관련된 정보를 출력하도록 구성된 출력부를 구비한다.
본 발명의 또 다른 특징은 (첨부도면을 참조하여 주어지는) 이하의 실시형태의 상세한 설명으로부터 명백해질 것이다.
도 1은 본 개시내용의 한개 이상의 측면에 따른 화상처리 시스템의 구성 예를 도시한 도면이다.
도 2는 본 개시내용의 한개 이상의 측면에 따른 복수의 가상 카메라가 설정된 예를 나타낸 사시도다.
도 3은 본 개시내용의 한개 이상의 측면에 따른 복수의 가상 카메라가 설정된 예를 나타낸 부감도다.
도 4는 본 개시내용의 한개 이상의 측면에 따른 정보 처리장치를 사용하여 가상 카메라 정보의 해석 및 제시 정보의 생성에 관한 처리에 대해 설명하기 위한 흐름도다.
도 5는 본 개시내용의 한개 이상의 측면에 따른 가상 카메라 정보의 해석 결과의 제시 예를 도시한 도면이다.
도 6은 본 개시내용의 한개 이상의 측면에 따른 복수의 가상 카메라가 설정된 예를 나타낸 사시도다.
도 7은 복수의 가상 카메라가 설정된 예를 나타낸 부감도다.
도 8은 본 개시내용의 한개 이상의 측면에 따른 정보 처리장치를 사용하여 가상 카메라 정보의 해석 및 제시 정보의 생성에 관한 처리에 대해 설명하기 위한 흐름도다.
도 9는 본 개시내용의 한개 이상의 측면에 따른 가상 카메라 정보의 해석 결과의 예를 나타낸 도면이다.
도 10a 및 도 10b는 본 개시내용의 한개 이상의 측면에 따른 가상 카메라 정보의 해석 결과의 제시 예를 각각 도시한 도면이다.
도 11은 본 개시내용의 한개 이상의 측면에 따른 정보 처리장치를 사용하여 하이라이트 화상의 생성에 관한 처리에 대해 설명하기 위한 흐름도다.
도 12는 본 개시내용의 한개 이상의 측면에 따른 정보 처리장치의 하드웨어 구성 예를 도시한 도면이다.
이하, 도면을 참조해서 본 개시내용의 실시형태를 상세하게 설명한다. 단, 본 개시내용은 이 실시형태에 한정되는 것은 아니고, 청구범위에 기재된 본 개시내용의 요지의 범위 내에 있어서, 다양한 변형 및 변경이 가능하다.
[화상처리 시스템의 구성]
도 1은, 본 개시내용의 실시형태에 따른 화상처리 시스템(100)의 전체 구성 도다. 화상처리 시스템(100)은, 복수의 촬상장치에 의한 촬상을 통해 얻어진 화상과 지정된 가상 시점에 근거하여, 지정된 가상 시점으로부터의 시야를 표시하는 가상 시점 화상을 생성하는 시스템이다. 본 실시형태에 따른 가상 시점 화상은, 자유 시점 영상으로도 불린다. 그러나, 가상 시점 화상은, 유저가 자유롭게(임의로) 지정한 시점에 대응하는 화상에 한정되지 않는다. 가상 시점 화상의 예로는, 복수의 후보로부터 유저가 선택한 시점에 대응하는 화상도 포함한다. 본 실시형태에서는, 가상 시점의 지정이 유저 조작에 의해 행해질 경우를 중심으로 설명한다. 이와 달리, 가상 시점의 지정이 화상해석의 결과에 근거하여 화상처리 시스템(100)에 의해 자동으로 행해져도 된다. 본 실시형태에서는, 가상 시점 화상이 동화상일 경우를 중심으로 설명한다. 이와 달리, 화상처리 시스템(100)에 의해 처리되는 가상 시점 화상은 정지 화상이어도 된다.
화상처리 시스템(100)은, 복수 시점 화상 유지부(1)(이후, "화상 유지부(1))", 피사체 정보 유지부(2)(이후, "정보 유지부(2)"), 정보 처리장치(3) 및 유저 단말(4a 내지 4z)에 의해 구성된다. 도 1에서는, 일례로서 26세트의 유저 단말(4a 내지 4z)이 정보 처리장치(3)에 접속된다. 그러나, 정보 처리장치(3)에 접속되는 유저 단말의 수는 이것에 한정되지 않는다. 이후, 특별한 설명이 없는 경우에는, 26세트의 유저 단말(4a 내지 4z)은 구별하지 않고 "유저 단말(4)"로 기재한다. 마찬가지로, 특별한 설명이 없는 경우에는, 각 유저 단말(4) 내부의 기능부도 구별하지 않고, "단말 통신부(401)", "화상 표시부(402)", "가상 카메라 패스(path) 지시부(403)"(이후, "패스 지시부(403)"), "유저 정보 발신부(404)"로 기재한다.
화상 유지부(1)는, 촬상 대상 영역을 복수의 촬상장치를 사용한 복수의 다른 방향에서 촬상함으로써 얻어지는 화상(복수 시점 화상)을 유지한다. 촬상 대상 영역에는, 예를 들면, 가수, 연주자, 연기자와 무대 장치, 또는 스포츠의 경우에는 선수와 볼의 소정의 오브젝트(전경 오브젝트)가 포함된다. 복수의 촬상장치는 촬상 대상 영역을 둘러싸도록 설치되어서 동기 촬상을 행한다. 즉, 복수의 촬상장치에 의해 취득되는 복수의 촬상 화상의 적어도 어느 것에는, 촬상 대상 영역 내의 소정의 오브젝트가 포함된다. 화상 유지부(1)가 유지하는 화상은, 복수의 촬상 화상 그 자체이거나, 복수의 촬상 화상에 화상처리를 행해서 얻어지는 화상이어도 된다.
정보 유지부(2)는, 촬상 대상에 관한 정보를 유지한다. 구체적으로는, 정보 유지부(2)는, 콘서트홀의 스테이지, 경기장의 필드, 또는 관객석 등, 가상 시점 화상 내에 있어서의 배경이 되는 물체(배경 오브젝트)의 3차원 모델 정보(이후, "배경 모델")가 유지된다. 정보 유지부(2)는, 전경 오브젝트의 개체 식별이나 자세 인식에 필요한 특징 정보를 포함하는, 자연상태에서의 각 전경 오브젝트 3차원 모델 정보와, 가상 시점을 설정가능한 범위를 나타내는 3차원 공간정보를 더 유지한다. 전술한 자연상태는, 전경 오브젝트의 표면을 가장 보기 쉬운 상태를 가리킨다. 예를 들면, 전경 오브젝트가 사람이면, 자연상태는 사람의 사지를 펼친 서 있는 자세일 수 있다. 더구나, 정보 유지부(2)는, 촬상 대상에 관련된 씬에 관한 정보, 예를 들면, 연주의 개시와 무대 회전, 또는 솔로 파트와 액션 등의 예정된 이벤트나, 킥오프와 하프타임에 관한 타임 스케줄 정보를 유지한다. 정보 유지부(2)는 상기한 정보의 모두를 유지할 필요는 없으며, 상기한 정보의 적어도 어느 것을 유지하고 있으면 된다.
정보 처리장치(3)는, 가상 시점 화상 생성부(301)(이후, "화상 생성부(301)"), 가상 카메라 패스 산출부(302)(이후, "패스 산출부(302)"), 및 가상 카메라 정보 해석부(303)(이후, "해석부(303)")를 가지고 있다. 더구나, 정보 처리장치(3)는, 제시 정보 생성부(304)(이후, "정보 생성부(304)"), 정보 표시부(305), 유저 정보 관리부(306)(이후, "정보 관리부(306)") 및 장치 통신부(307)를 더 가지고 있다.
화상 생성부(301)는, 화상 유지부(1)로부터 취득한 복수 시점 화상을 기초로, 전경 오브젝트(들)의 3차원 모델 정보(이후, "전경 모델")를 생성한다. 그리고 화상 생성부(301)는, 생성한 전경 모델과, 정보 유지부(2)로부터 취득한 배경 모델에 대하여, 패스 산출부(302)로부터 취득한 가상 카메라 패스에 따른 텍스처 화상에 대해 매핑을 행한다. 그후, 화상 생성부(301)는, 렌더링을 행함으로써, 가상 시점 화상을 생성한다. 생성되는 가상 시점 화상은, 가상 카메라 패스에 대응하며, 장치 통신부(307)를 거쳐 유저 단말(4)에 송신된다. 이 생성 과정에서, 화상 생성부(301)는, 정보 유지부(2)가 유지하는 전경 오브젝트의 특징 정보를 참조하여, 전경 오브젝트를 식별하고, 전경 모델과 전경 오브젝트의 개체 식별 ID(이후, "전경 오브젝트 ID")을 관련시킨다. 이와 달리, 화상처리 시스템(100)의 유저가, 생성된 전경 모델을 육안으로 식별하고, 수동으로 전경 오브젝트 ID를 전경 모델과 관련시켜도 된다. 화상 생성부(301)는, 전경 오브젝트의 특징 정보를 기초로, 가상 시점 화상에 포함되는 전경 요소에 관한 피사체 요소 정보를 생성한다. 전경 요소는, 어떤 전경 오브젝트에 포함되는 요소(부위)를 가리킨다. 예를 들면, 전경 오브젝트가 인물이면, 전경 요소는 그 인물의 부위인 얼굴 전방면, 얼굴 배면, 동체 전방면, 등, 오른팔이다, 그리고 피사체 요소 정보는, 작성되는 가상 시점 화상에 포함되는(가상 카메라에 피사되는) 전경 요소의 ID(이후, "전경 요소 ID"), 위치 및 방향을 나타내는 정보를 가진다. 화상 생성부(301)는 이 전경 오브젝트 ID 및 피사체 요소 정보를 해석부(303)에 전달한다.
패스 산출부(302)는, 각 유저 단말(4)의 패스 지시부(403)에 대한 유저 조작에 따른 지시 정보나, 해석부(303)로부터 취득한 정보에 근거하여, 시간적으로 연속하는 가상 카메라 정보(시점 정보)를 취득한다. 그리고 패스 산출부(302)는, 생성해야 할 가상 시점 화상에 대응하는 가상 카메라의 이동 경로인 가상 카메라 패스를 설정한다. 가상 카메라 정보에는, 각 가상 카메라(각 가상 시점)의 위치 및 방향이 포함된다. 가상 카메라 정보는, 가상 카메라의 화각과 초점위치에 관한 정보를 더 포함하여도 된다. 그리고, 각 가상 카메라 정보에는, 촬상 씬 중의 어떤 순간에 대응하는 정보인지 특정할 수 있도록, 복수 시점 화상에 할당된 프레임 번호 및 타임 코드와 관련된 시간 정보가 포함되어 있다. 패스 산출부(302)는, 가상 카메라 정보의 산출시에, 정보 유지부(2)로부터 얻은 3차원 공간정보를 참조하여, 가상 시점을 설정가능한 범위내에 가상 카메라 패스를 설정한다.
해석부(303)는, 화상 생성부(301)로부터 받은 전경 오브젝트 ID 및 피사체 요소 정보와, 패스 산출부(302)로부터 받은 가상 카메라 정보를 기초로, 가상 카메라 패스를 지정하는 유저의 주목 대상을 해석한다. 주목 대상의 예로는, 복수의 유저가 주목한 것으로 추정되는 전경 오브젝트와, 복수의 유저의 가상 카메라의 시선이 집중하는 씬이 포함된다.
정보 생성부(304)는, 해석부(303)의 해석 결과에 근거한 정보를 생성한다. 정보 생성부(304)에 의해 생성되는 정보의 예로는, 해석 결과를 유저가 직관적으로 파악할 수 있도록 해석 결과를 가시화한 그래픽 데이터 및 텍스트 데이터를 들 수 있다. 또는, 정보 생성부(304)에 의해 생성되는 정보는, 예를 들면, 많은 유저의 가상 카메라의 시선이 집중한 씬을 픽업하여 얻어진 화상 등, 많은 유저를 만족시키는 편집을 거쳐 얻어진 하이라이트 화상이어도 된다. 해석부(303)에 의한 해석, 및 정보 생성부(304)에 의한 정보 생성에 대해서는 나중에 상세히 설명한다.
정보 표시부(305)는, 화상처리 시스템(100)의 제어에 관한 다양한 정보, 유저 단말(4)로부터 수신한 정보, 및 정보 생성부(304)에 의해 생성된 제시 정보를 표시한다. 정보 생성부(304)에 의해 생성된 제시 정보는, 정보 처리장치(3)의 기억부나 외부의 장치에 출력되거나, 나중에 가공되고 있는 제시 정보에 의해 얻어진 정보가 유저에게 제시되어도 된다. 정보 처리장치(3)는, 정보 생성부(304)에 의해 생성한 정보의 적어도 일부를, 정보 표시부(305)를 거쳐 화상을 표시하지 않고, 스피커(미도시)를 거쳐 소리를 재생함으로써, 유저에게 제시해도 된다.
정보 관리부(306)는, 각 유저 단말(4)을 조작하는 유저에 관한 유저 ID 등의 유저 정보를, 유저 단말(4)의 유저 정보 발신부(404)로부터 단말 통신부(401) 및 장치 통신부(307)를 거쳐 수취하고, 이 유저 정보를 유지한다. 정보 관리부(306)는, 정보 처리장치(3)와 유저 단말(4) 사이에서 송수신되는 화상과 카메라 패스 정보 등의 각종 정보를, 정보 처리장치(3) 내에서 행해지는 다양한 처리 중에도 해당 정보와 유저 ID 사이의 관련이 유지되도록 관리한다. 이에 따라, 복수의 유저 단말(4)에 대하여 각각 다른 처리의 실행, 및 다른 정보의 통신을 실현할 수 있다.
장치 통신부(307)는, 정보 처리장치(3)와 유저 단말(4) 사이에서 네트워크(미도시)를 거쳐 교환되는, 화상, 음성 및 텍스트 데이터와, 가상 시점 화상을 생성할 때에 유저 단말(4)로부터 보내지는 가상 카메라 패스의 지시 등의 지시 정보를 송수신한다. 장치 통신부(307)는, 이들 정보의 송수신에 관련되는 통신 상대(들)를, 정보 관리부(306)로부터의 지시에 따라서 결정한다.
각각의 유저 단말(4)은, 단말 통신부(401), 화상 표시부(402), 패스 지시부(403) 및 유저 정보 발신부(404)를 가진다. 단말 통신부(401)는, 정보 처리장치(3)의 장치 통신부(307)와의 사이에서, 전술한 바와 같이 다양한 정보의 송수신을 행한다. 화상 표시부(402)는, 정보 처리장치(3)로부터 취득한 가상 시점 화상과 제시 정보를 표시한다.
패스 지시부(403)는, 유저의 가상 카메라 패스를 지정하는 조작을 접수하고, 조작에 근거한 지시 정보를, 단말 통신부(401) 및 장치 통신부(307)를 거쳐 정보 처리장치(3)의 패스 산출부(302)에 건네준다. 여기에서, 유저는, 반드시 가상 카메라 정보의 전체를, 유저가 시청하고 싶은 가상 시점 화상의 전체 기간에 대하여 엄밀하게 지시할 필요가 없을 수도 있다. 예를 들면, 유저가 특정한 가수나 선수에게 주목한 가상 시점 화상을 시청하고 싶거나, 유저가 볼의 주위의 일정 범위의 화상을 시청하고 싶거나, 유저가 보다 주목해야 할 이벤트가 발생하고 있는 장소의 화상을 유저가 시청하고 싶은 상황에서의 다양한 관점에 근거하여 지시를 입력하는 것도 가능하다. 이들 지시 중에서 어느 것이 입력되었을 경우, 패스 지시부(403)는 지시 정보를 송신하고, 정보 처리장치(3)의 패스 산출부(302)는 지시에 근거한 가상 카메라 정보를 생성한다. 이와 달리, 패스 지시부(403)는 자동적으로 가상 카메라 패스를 지정하고, 지정에 따른 지시 정보를 송신해도 된다. 유저 정보 발신부(404)는, 단말 통신부(401)로부터 장치 통신부(307)를 향해서 송신되는 정보에 대하여, 유저 ID 등의 유저 정보를 부여한다.
화상처리 시스템(100)의 구성은 도 1에 나타낸 것에 한정되지 않는다. 예를 들면, 화상 유지부(1)나 정보 유지부(2)가 정보 처리장치(3)의 내부에 포함되어 있어도 된다. 또한, 화상 생성부(301)나 정보 표시부(305)가 정보 처리장치(3) 이와의 장치 내부에 포함되어 있어도 된다.
다음에, 정보 처리장치(3)의 하드웨어 구성에 대해서, 도 12를 참조하여 설명한다. 정보 처리장치(3)는, 중앙처리장치(CPU)(1101), 판독 전용 메모리(ROM)(1102), 랜덤 액세스 메모리(RAM)(1103), 보조 기억장치(1104), 표시부(1105), 조작부(1106), 통신 인터페이스(I/F)(1107), 및 버스(1108)를 가진다.
CPU(1101)은, ROM(1102)이나 RAM(1103)에 격납되어 있는 컴퓨터 프로그램과 데이터를 사용해서 정보 처리장치(3)의 전체를 제어한다. 이와 달리, 정보 처리장치(3)는, CPU(1101)과는 다른 한개 또는 복수의 전용의 하드웨어 장치를 가지고, 한개 또는 복수의 전용의 하드웨어 장치가 CPU(1101)의 처리의 적어도 일부를 실행해도 된다. 전용의 하드웨어 장치의 예로서는, 주문형집적회로(ASIC), 필드 프로그래머블 게이트 어레이(FPGA), 및 디지털 신호 처리기(DSP) 등이 있다. ROM(1102)은, 변경을 필요로 하지 않는 프로그램과 파라미터를 격납한다. RAM(1103)은, 보조 기억장치(1104)로부터 공급되는 프로그램 및 데이터, 및 통신 I/F(1107)를 거쳐 외부에서 공급되는 데이터를 일시 기억한다. 보조 기억장치(1104)는, 예를 들면, 하드디스크 드라이브로 구성되고, 화상 데이터, 음성 데이터 및 가상 카메라 패스 정보 등의 다양한 데이터를 기억한다.
표시부(1105)는, 예를 들면, 액정 디스플레이나 발광 다이오드(LED)로 구성되고, 유저가 정보 처리장치(3)를 조작하기 위한 그래픽 유저 인터페이스(GUI)를 표시한다. 조작부(1106)는, 예를 들면, 키보드, 마우스 및 터치패널로 구성된다. 조작부(1106)는 유저의 조작을 받아서 각종의 지시를 CPU(1101)에 입력한다. 통신 I/F(1107)는, 각 유저 단말(4) 등의 외부의 장치와의 통신에 사용된다. 예를 들면, 정보 처리장치(3)가 외부의 장치와 유선으로 접속될 경우에는, 통신용의 케이블이 통신 I/F(1107)에 접속된다. 정보 처리장치(3)가 외부의 장치와 무선통신하는 기능을 가질 경우, 통신 I/F(1107)는 안테나를 구비한다. 버스(1108)는, 정보 처리장치(3)의 구성요소들을 연결하여 정보를 전달한다.
본 실시형태에서는, 표시부(1105)와 조작부(1106)가 정보 처리장치(3)의 내부에 설치된다. 이와 달리, 정보 처리장치(3)는 표시부(1105)와 조작부(1106)의 적어도 한쪽을 구비하지 않아도 된다. 이와 달리, 표시부(1105)와 조작부(1106)의 적어도 한쪽이 정보 처리장치(3)의 외부에 다른 장치로서 설치되고, CPU(1101)이, 표시부(1105)를 제어하는 표시 제어부, 또는 조작부(1106)를 제어하는 조작 제어부로서 동작해도 된다.
[주목 오브젝트의 해석]
이하에서는, 정보 처리장치(3)가 해석부(303)에게 가상 카메라 정보를 해석하게 하고, 정보 생성부(304)에게 해석 결과에 근거한 제시 정보를 생성하게 하는 처리에 대해서, 구체적인 예를 사용하여 설명한다.
도 2는, 촬상중의 어떤 시점 T에서, 4명의 유저(유저 ID는 u이고, u=1 내지 4)가 대응하는 유저 단말(4)을 사용하여 개별로 지정한 가상 카메라 C1 내지 C4(Cu, u=1 내지 4)의 시야를 도시한 것이다. 도 3은 도 2의 평면의 개략도다. 에어리어 A는, 촬상 대상 영역 중 가상 카메라 정보의 해석의 대상이 되는 해석 대상 영역이다. 에어리어 A는, 예를 들면 촬상 대상 등의 스테이지로부터 퍼포먼스가 행해지는 범위의 높이를 갖는 3차원 공간이다. 해석 대상 영역은, 정보 처리장치(3)에 대한 유저 조작에 근거하여 설정되거나, 해석부(303)에 의해 가상 카메라 정보에 근거하여 설정되어도 된다. 에어리어 B는 가상 카메라 Cu를 설정가능한 범위다. 도 2 및 도 3은 가수나 댄서 등의 전경 오브젝트 P 내지 X를 나타낸다. 여기에서는, 전경 오브젝트 P 내지 X의 전경 오브젝트 ID를 도 3과 동일한 부호인 P 내지 X로 한다.
도 4를 참조하여, 도 2 및 도 3의 예에 도시되는 것 같이 가상 카메라 정보에 대한 해석 및 제시 정보 생성에 관한 처리에 대해 설명한다. 도 4에 나타내는 처리는, 가상 카메라 정보의 해석 또는 제시 정보의 생성을 행하기 위한 지시가 정보 처리장치(3)에 입력된 타이밍에서 개시된다. 이 지시는, 정보 처리장치(3)에 대한 유저 조작에 의해 행해지거나, 유저 단말(들)(4)로부터 입력되어도 된다. 단 도 4에 나타내는 처리의 개시 타이밍은 이것에 한정되지 않는다. 도 4에 나타내는 처리는, CPU(1101)이 ROM(1102)에 격납된 프로그램을 RAM(1103)에 전개해서 이 프로그램을 실행함으로써 실현된다. 도 4에 나타내는 처리의 적어도 일부를, CPU(1101)과는 다른 한개 또는 복수의 전용의 하드웨어 장치에 의해 실현해도 된다. (나중에 설명하는) 도 8의 흐름도에 나타내는 처리에 대해서도 마찬가지이다.
우선, 스텝 S1000에서는, 도 4의 처리에 사용하는 각종의 파라미터를 초기화한다. 구체적으로는, 해석의 대상이 되는 가상 카메라의 수(umax)와, 해석의 대상이 되는 촬상 기간(Tmax)을 설정하고, 해석 대상의 가상 카메라 Cu의 한개를 선택(u=1)하고, 대상인 촬상 기간의 개시 시점을 지정(T=0)한다. 해석 대상인 가상 카메라 Cu와 해석 대상인 기간은, 유저의 조작에 근거하여 결정되거나, 자동으로 결정되어도 된다. 예를 들면, 가상 카메라 Cu에 대해서는, 해석이 행해질 때 정보 처리장치(3)에 접속되어 있는 유저 단말(4)에 의해 지정된 가상 카메라의 전체를 해석 대상으로 결정하거나, 과거에 정보 처리장치(3)에 접속되어 있었던 유저 단말(4)에 의해 지정된 가상 카메라를 해석 대상으로 결정해도 된다. 정보 처리장치(3)는, 정보 관리부(306)에 의해 관리되고 있는 정보에 근거하여, 특정한 속성을 갖는 유저(들)에 대응하는 가상 카메라를 해석 대상으로 결정해도 된다.
스텝 S1001에서는, 해석부(303)는, 선택된 가상 카메라 Cu의 지정된 시점 T에 있어서의 시야에 포함되는 전경 오브젝트에 대한 전경 오브젝트 ID 및 피사체 요소 정보를, 화상 생성부(301)로부터 취득한다. 스텝 S1002에서는, 해석부(303)는, 해당 피사체 요소 정보에 대응하는 전경 요소(가상 카메라 Cu의 시야에 포함되는 전경 요소)에 부여된 피사체 카운트 수 N(스텝 S1000에 있어서의 초기값은 제로)에 1을 더한다. 가상 카메라 Cu의 시야에 어떤 전경 오브젝트가 포함되는지를 판정하기 위해, 화상 생성부(301)가 가상 카메라 Cu에 따른 가상 시점 화상을 생성할 때에 행해진 판정 결과를 사용할 수 있다. 단, 가상 카메라 Cu의 시야에 포함되는 전경 오브젝트의 검출 방법은 이것에 한정하지 않는다, 이와 달리, 해석부(303)가, 복수 시점 화상에 근거하여 취득되는 한 개 이상의 전경 오브젝트에 관한 위치 정보와, 패스 산출부(302)에 의해 취득되는 가상 카메라 정보에 근거하여 판정을 행해도 된다. 이와 달리, 해석부(303)가, 화상 생성부(301)에 의해 생성되고 해당 가상 카메라 Cu에 대응하는 가상 시점 화상을 해석함으로써, 그 가상 시점 화상에 포함되는 오브젝트, 즉 해당 가상 카메라 Cu의 시야에 포함되는 오브젝트를 판정해도 된다.
스텝 S1003에서는, 해석부(303)가, 해석의 대상이 되는 모든 가상 카메라 Cu에 대해서 스텝 S1001과 스텝 S1002의 처리를 행했는지(u=umax인지)를 판정한다. 미처리의 가상 카메라 Cu가 있을 경우에는(스텝 S1003에서 NO) 스텝 S1004로 처리를 진행한다. 스텝 S1004에서, 다른 가상 카메라 Cu를 선택하고(u=u+1), 스텝 S1001로 처리가 되돌아간다. 이렇게 하여, 스텝 S1001 및 S1002에 있어서의 상기한 피사체 카운트가, 해석 대상의 모든 가상 카메라 Cu에 대해서 실행된다.
스텝 S1005에서는, 해석부(303)는, 해석의 대상이 되는 촬상 기간 전체에 대해서 스텝 S1001 내지 스텝 S1004의 처리를 행했는지(T=Tmax인지)를 판정한다. 미처리의 시점 T가 있을 경우에는(스텝 S1005에서 NO), 스텝 S1006으로 처리를 진행한다. 스텝 S1006에서, 다음의 시점 T를 지정하고(T=T+ΔT), 스텝 S1001로 처리가 되돌아간다. 이렇게 하여, 스텝 S1001 내지 S1004에 있어서의 상기한 피사체 카운트가 해석 대상의 촬상 기간 전체에 대해서 실행된다.
스텝 S1001 내지 S1006에 의한 처리의 결과, 각 전경 요소에 대해서, 해당 전경 요소를 시야에 포함하는 가상 카메라 Cu의 수 및 그 시간 T에 비례한 피사체 카운트 수 N이 얻어진다. 스텝 S1007에서는, 얻어진 피사체 카운트 수 N에 대하여 비중(relative importance) D가 곱해진다. 이 비중 D는 각 전경 요소의 중요도를 나타내는 것이며, 미리 임의로 정해진다. 예를 들면, 전경 오브젝트가 사람일 경우에, 얼굴에 전경 요소(신체 부위)가 더 가까울수록 비중 D가 커지도록 비중 D가 결정되어도 된다. 스텝 S1008에서는, 해석부(303)는, 각 전경 오브젝트에 대해서, 그 전경 오브젝트에 포함되는 복수의 전경 요소의 가중 카운트 수 N×D를 합산한다. 이 합산 결과 ΣND가, 해당 전경 오브젝트의 주목도를 표시하는 피사체 포인트 M이 된다.
이어서, 스텝 S1009에서는, 정보 생성부(304)는, 피사체 카운트 수에 대응한 각 전경 요소의 표시 방법을 결정한다. 구체적으로는, 칼라 히트 맵(color heat map)의 방식으로, 가장 피사체 카운트 수 N이 큰 전경 요소에 대해 적색, 중간의 피사체 카운트 수 N에 대해 오렌지색, 황색 및 녹색, 가장 피사체 카운트 수 N이 작은 전경 요소에 대해 청색의 순서로, 미리 결정된 단계 나눔 룰에 따라, 전경 요소의 표시색을 결정한다. 단, 전경 요소의 표시 방법은 이것에 한정하지 않는다. 이 표시 방법은, 피사체 카운트 수 N이 일정한 수 이상 다른 전경 요소를 식별을 가능하게 하는 표시 방법이면 된다. 예를 들면, 피사체 카운트 수 N=0인 전경 요소는 무색으로 하거나, 각 피사체 카운트 수의 대소를 단일 색상의 농담이나 텍스처의 차이로 표현해도 된다. 또한, 전체 전경 요소의 표시색의 결정 결과에 대하여, 색의 경계가 매끄러워지도록, 전경 요소 사이의 경계선을 제거하는 경계처리를 행해도 된다. 또한, 각 전경 요소의 근방에 피사체 카운트 수 N을 그대로 수치로서 표시하여도 된다. 이들 복수의 표현 방법을 조합해도 된다.
스텝 S1010에서, 정보 생성부(304)는 피사체 랭킹 정보를 생성한다. 우선, 정보 생성부(304)는, 정보 유지부(2)로부터 얻은 전경 오브젝트의 자연상태 모델에, 스텝 S1009에서 결정한 각 표시색을 적용한다. 이 착색시에는, 전경 오브젝트의 본래의 색 및 디자인과 전경 오브젝트의 상세 형상의 시인성이 유지되도록, 자연상태 모델이 반투명 형상으로 다층으로 착색되어도 된다. 그리고 정보 생성부(304)는, 이 착색된 전경 오브젝트 모델을, 전술한 피사체 포인트 M에 따른 랭킹 순서로, 랭킹을 나타내는 텍스트 및 그래픽과 함께 표시하기 위한 화상을 생성한다. 생성된 화상은 정보 표시부(305)에 표시된다. 이때 표시되는 화상의 일례를 도 5에 나타낸다.
도 5에서는, 도면의 사정상, 색의 농담으로 피사체 카운트 수 N의 대소를 표현하고, 표시의 경계를 매끄럽게 보정하고 있다. 그러나, 상기한 바와 같이 다양한 베리에이션이 적용가능하다. 전경 오브젝트 모델은 3차원 모델이므로, 오브젝트의 방향을 자유롭게 변경 가능하게 해도 된다. 도 5에서는 전경 오브젝트의 자연상태 모델이 표시되어 있지만, 임의의 순간의 전경 오브젝트 모델, 예를 들면, 전경 오브젝트의 피사체 카운트 수 N이 가장 크게 변동한 순간의 전경 오브젝트 모델이 도 5와 같은 방법을 사용하여 표시되어도 된다. 이와 같은 표시에 따르면, 표시를 본 유저가, 어떤 전경 오브젝트에 주목했는지 뿐만 아니라, 어떤 씬의 전경 오브젝트에 주목했는지를 용이하게 파악할 수 있다. 또한, 정보 생성부(304)에 의해 생성되어 유저에게 제시되는 정보는, 복수의 가상 카메라 각각의 시야에 포함되는 오브젝트의 판정 결과에 따른 정보를 포함하면 되고, 도 5와 같은 랭킹 표시에 한정되지 않는다. 예를 들면, 촬상 기간 내의 특정 씬의 가상 시점 화상에 있어서의 각 전경 오브젝트를 피사체 카운트 수 N에 따라 착색한 화상이 표시되어도 된다. 이와 달리, 가상 시점 화상 위에 피사체 카운트 수 N에 따른 수치가 표시되어도 된다. 전술한 다양한 제시 정보의 예는, 동일한 오브젝트를 시야에 포함하는 가상 카메라 Cu의 수에 근거한다. 이에 따라 유저가 각 오브젝트의 주목도를 용이하게 파악할 수 있게 된다. 단, 본 개시내용은 이것에 한정되지 않는다. 이와 달리, 소정의 오브젝트가 복수의 가상 카메라 중 어느 것의 시야에 포함되었는지 아닌지를 단순히 나타내는 정보가 제시되어도 된다.
이상이, 가상 카메라 정보의 해석 및 정보의 제시에 관한 플로우다. 즉, 이상이, 어떤 요소에 보다 많은 가상 카메라가 향하는지와 어떤 전경 오브젝트가 이 요소를 포함하는지를 결정함으로써 유저의 주목 대상을 해석하고, 해석 결과를 가시화하는 플로우다.
상기한 설명에서는, 각 전경 요소가 어떤 순간에 어떤 가상 카메라의 시야에 포함되면, 일률적으로 피사체 카운트 수에 1을 더한다. 그러나, 카운트의 방법은 이것에 한정되지 않는다. 해석부(303)는, 가상 카메라 정보에 근거하여 특정되는(결정되는) 가상 카메라의 위치 및 방향에 따른 시야 내의 범위에 포함되는 오브젝트를 판정해서 카운트를 행하면 된다. 이 가상 카메라의 시야 내의 범위는, 가상 카메라의 시야에 대응하는 범위(그 가상 카메라에 대응하는 가상 시점 화상의 범위)에 한정되지 않는다. 예를 들면, 가상 카메라의 시야 중 시야의 중심에 가까운 소정 범위 등, 가상 카메라의 시야에 대응하는 범위의 일부분에 포함되는 오브젝트의 피사체 카운트에 값을 가산하고, 그 소정 범위의 외측에 포함되는 오브젝트의 피사체 카운트에는 값을 가산하지 않아도 된다. 이와 달리, 전경 요소의 위치와 방향에 근거하여, 피사체 카운트 수 N에 더하는 값을 1 이외로 해도 된다. 예를 들면, 가상 카메라의 방향이 전경 요소의 정면에 가까울수록, 즉 가상 카메라의 방향 벡터와 전경 요소의 방향 벡터가 직면할수록, 더해지는 값이 커지도록, 해당 전경 요소의 피사체 카운트 수 N에 값을 더해도 된다. 이와 달리, 전경 요소의 위치가 가상 카메라에 가까울수록 값이 커지도록, 해당 전경 요소의 피사체 카운트 수 N에 값을 더해도 된다. 이와 달리, 전경 요소의 위치가 가상 카메라 시야의 중앙에 가까울수록, 혹은 전경 요소의 위치가 가상 카메라의 초점이 맞고 있는 위치에 가까울수록, 값이 더 커지도록, 해당 전경 요소의 피사체 카운트 수 N에 값을 더해도 된다. 또한, 유저가 구체적인 가상 카메라 정보를 지시하는 것이 아니고, 특정한 전경 오브젝트에 주목한 가상 시점 화상을 유저가 시청하고 싶다는 것을 나타내는 지시를 내릴 경우에는, 해당 전경 오브젝트의 피사체 카운트 수 N에는 특히 큰 값을 더해도 된다. 이에 따라, 특정한 전경 오브젝트를 시청하고 싶다고 하는 명확한 유저의 의도를 해석 결과에 반영할 수 있다. 이상, 몇개의 피사체 카운트 수 N의 가산 룰을 설명하였지만, 본 개시내용은 이것들에 한정되는 것은 아니다. 이와 달리, 복수의 가산 룰을 조합해도 된다.
상기한 설명에서는, 전경 오브젝트의 부위마다(전경 요소마다) 피사체 카운트 수 N를 계산하고, 부위마다의 주목도를 알 수 있도록 정보를 표시한다. 그러나, 본 개시내용은 이것에 한정되지 않는다. 이와 달리, 전경 오브젝트의 전체가, 해당 전경 오브젝트의 피사체 포인트 M에 근거하여 균일하게 착색되어도 된다. 이와 달리, 착색은 행하지 않고, 간단히 각 전경 오브젝트의 피사체 포인트 M과 이 피사체 포인트 M에 근거한 정보를 텍스트로 표시해도 된다. 각각의 전경 요소가 착색되지 않는 경우에는, 도 4에 나타낸 처리에 있어서의 피사체 카운트 수 N을 전경 오브젝트마다 계산해도 된다. 예를 들면, 촬상 대상 영역에 인물이 포함될 경우에, 그 인물의 각 부위가 가상 카메라의 시야에 포함되는지 아닌지를 판정해서 카운트를 행하는 것 대신에, 그 인물이 가상 카메라의 시야에 포함되는지 아닌지를 판정하여 카운트를 행해도 된다. 이렇게 오브젝트마다 카운트를 행하면, 전경 요소마다 카운트를 행하는 경우에 비해 처리량을 저감할 수 있다. 정보 처리장치(3)는, 전술한 다양한 표시 방법을, 유저에 의해 내려지고 정보 처리장치(3)에 입력되는 지시나 해당 유저의 속성에 따라 전환해도 된다.
[주목 씬의 해석]
상기한 설명에서는, 많은 유저에 의해 주목받은 오브젝트를 해석에 의해 특정(결정)하고, 주목 오브젝트를 식별 가능하게 하는 정보를 제시하는 예에 대해 설명했다. 이에 대하여, 이하에서는, 많은 가상 카메라의 시선이 어떤 범위에 집중한 시간, 즉 많은 유저에 의해 주목받은 씬을 해석에 의해 특정(결정)하고, 주목 씬을 식별 가능하게 하는 정보를 제시하는 예에 대해 설명한다. 이하의 설명에 있어서, 전술한 주목 오브젝트의 해석에 관한 처리 플로우와 유사한 처리와 대상은 같은 부호를 사용하여 표시하고, 설명을 생략한다.
도6은, 촬상중의 어떤 시점 T에서 4명의 유저(유저 ID는 u, u=1 내지 4)가 각각 유저 단말(4)을 사용하여 개별로 지정한 가상 카메라 C1 내지 C4(Cu, u=1 내지 4)의 시야를 도시한 것이다. 도 7은 도 6의 평면 개략도다. 도 6 및 도 7은, 도 2 및 도 3과의 차이로서, 도 6 및 도 7에 있어서 해석 대상 영역인 에어리어 A가 3차원 좌표계 XYZ에서 3방향으로 소정의 수의 블록으로 분할되어 있다. 이하에서, 분할 블록은, 이 에어리어 A가 분할된 블록을 가리킨다. 분할 블록의 사이즈 및 수는, 정보 처리장치(3)에 미리 설정되어 있지만, 유저 조작에 근거하여 설정되어도 된다.
도 8을 참조하여, 도 6 및 도 7의 예에 도시되는 것 같은 가상 카메라 정보의 해석 및 제시 정보 생성에 관련한 처리 플로우에 대해서 설명한다. 도 8에 나타내는 처리의 개시 타이밍은 도 4와 유사하다, 이하에서는 도 4과의 차이를 중심으로 설명한다.
우선 스텝 S2000에서는, 도 8의 처리에 사용하는 각종의 파라미터를 초기화한다. 스텝 S2001에서는, 해석부(303)는, 가상 카메라 Cu의 시야에 포함되는 전경 오브젝트의 전경 요소에 관한 피사체 요소 정보를, 화상 생성부(301)로부터 취득한다. 스텝 S2002에서는, 해석부(303)는, 해당 피사체 요소 정보에 대응하는 전경 요소(가상 카메라 Cu의 시야에 포함되는 전경 요소)의 적어도 일부를 포함하는 분할 블록이 존재하는지를 판정한다. 해당하는 분할 블록이 존재할 경우에는(스텝 S2002에서 YES), 스텝 S2003에 있어서, 해석부(303)는, 해당 분할 블록에 부여되어 있는 시간 T에 있어서의 피사체 카운트 수 N'(T)(스텝 S2000에 있어서의 초기값은 제로)에 1을 더한다. 스텝 S2002에 있어서 해당하는 분할 블록이 존재하지 않을 경우에는(스텝 S2002에서 NO), 스텝 S2003의 처리를 행하지 않고 스텝 S2004로 처리를 진행한다.
스텝 S2004 내지 S2005의 플로우를 거쳐, 상기한 피사체 카운트가 해석의 대상이 되는 모든 가상 카메라 Cu에 대해서 실행된다. 그 결과, 각 분할 블록에 대해서, 해당 분할 블록을 시야에 포함하는 가상 카메라 Cu의 수에 따른 피사체 카운트 수 N'(T)이 얻어진다. 도 9는, 어떤 시점 T에 있어서의 각 분할 블록의 피사체 카운트 수 N'(T)의 예를 나타낸 것이다. 도 9는, 간략을 위해 도 7과 유사한 평면 개략도로 카운트 수를 나타내고 있지만, 실제로는, 도 6에 나타낸 것과 같은 3차원 공간의 각 분할 블록에 대하여 피사체 카운트가 실행된다. 그리고, 스텝 S2006 및 S2007을 거쳐, 이러한 각각의 분할 블록에 대한 피사체 카운트가 해석 대상이 되는 촬상 기간(T=0 내지 Tmax)에 포함되는 각 시점 T에 대해서 실행된다.
스텝 S2008에서는, 정보 생성부(304)가, 해석부(303)에 의해 산출된 각 시점 T에 있어서의 각 블록의 피사체 카운트 수 N'(T)으로부터, 각 시점 T에 있어서의 피사체 카운트 수 N'(T)의 최대값인 최대 카운트 수 N'max(T)을 특정한다. 즉 최대 카운트 수 N'max(T)은, 시점 T에 있어서 가장 많은 가상 카메라 Cu의 시점이 집중되는 분할 블록의 피사체 카운트 수 N'(T)다. 그리고 정보 생성부(304)는, 최대 카운트 수 N'max(T)를, 가로축이 시간 T인 그래프 위에 플롯한 정보를 생성한다. 이때, 정보 생성부(304)는, 시간축에, 촬상중에 일어난 슛이나 골 등의 이벤트나, 정보 유지부(2)로부터 취득한 킥오프와 하프타임 등의 타임 스케줄을 부가시켜도 된다. 생성된 화상은 정보 표시부(305)에 표시된다. 표시되는 화상의 예를 도 10a에 나타낸다.
도 10a에서는, 산출된 최대 카운트 수 N'max(T)와, 최대 카운트 수 N'max(T)의 임계값을 나타내는 선과, 이벤트의 발생 시점에 관한 정보가 표시되어 있다. 각 이벤트의 발생 시점에 관한 정보는 촬상후에 수동으로 입력되거나, 촬상에 의해 취득된 화상으로부터 자동으로 판정되는 씬에 의해 작성되어도 된다. 이와 달리, 최대 카운트 수 N'max(T)의 임계값도, 유저 조작에 의해 수동으로 설정되거나, 자동으로 설정되어도 된다. 예를 들면, 대상인 촬상 기간 전체에 있어서의 최대 카운트 수 N'max(T)의 평균값에 근거하여 임계값이 설정되어도 된다. 또한, 정보 생성부(304)에 의해 생성되는 정보는, 각 시점의 최대 카운트 수 N'max(T)를 평활선이 연결하는 도 10a의 예에 한정되지 않고, 복수의 가상 카메라의 시야 내의 범위에 포함되는 주목 영역이 존재하는 시점 또는 기간에 관한 정보이어도 된다. 예를 들면, 정보 생성부(304)에 의해 생성되는 정보는, 점 그래프나 막대 그래프의 형식이어도 되고, 각 시점의 주목도를 나타내는 수치를 텍스트로 표시하는 형식이어도 된다. 다른 에로서, 일정 폭을 갖는 시간축 바를 칼라 히트 맵의 방식으로 착색함으로써 주목도의 대소를 표현하거나, 착색과 전술한 다른 표현을 조합해도 된다.
정보 생성부(304)에 의해 생성되는 정보는, 모든 시점에서 최대 카운트 수 N'max(T)를 나타낼 필요가 없어도 된다. 예를 들면, 정보 생성부(304)에 의해 생성되는 정보는, 최대 카운트 수 N'max(T)가 임계값을 초과하고 있는 시점이나 기간, 혹은 최대 카운트 수 N'max(T)가 임계값을 밑돌고 있는 시점이나 기간 등, 촬상 기간 내의 1 이상의 시점 또는 기간을 나타내는 정보를 포함하고 있으면 된다. 다른 예를 들면, 정보 생성부(304)에 의해 생성되는 정보는, 최대 카운트 수 N'max(T)가 가장 커진 시점이나, 최대 카운트 수 N'max(T)가 가장 작아지는 시점을 나타내도 된다. 또한, 촬상 기간 내의 특정 씬의 가상 시점 화상 내에, 해당 씬이 주목도가 높은지 아닌지(최대 카운트 수 N'max(T)가 임계값을 초과하고 있는지 아닌지)를 나타내는 정보나, 최대 카운트 수 N'max(T)에 따른 수치가 표시되어도 된다.
이상이, 가상 카메라 정보의 해석 및 정보의 제시에 관련되는 플로우다. 즉, 어떤 요소에 보다 많은 가상 카메라가 향하는지와 어떤 전경 오브젝트가 이 요소를 포함하는지의 판정을 통해 유저의 주목 대상을 해석하고, 해석 결과를 가시화하는 플로우다.
주목 오브젝트의 해석에 관한 설명에서 전술한 것과 마찬가지로, 해석부(303)는, 가상 카메라의 시야 전체에 한정되지 않고 가상 카메라의 위치 및 방향에 따른 범위에 포함되는 오브젝트를 판정해서 카운트를 행하면 된다. 각 카운트에 가산되는 값은 일률적이지 않아도 된다. 도 8을 참조하는 상기한 설명에서는, 가상 카메라의 시야에 포함되는 전경 요소를 특정(결정)하고, 특정된 전경 요소에 근거하여 각 분할 블록에 대해 피사체 카운트를 행하였다. 그러나, 전경 요소마다가 아니고 전경 오브젝트마다 카운트를 행해도 된다. 즉, 가상 카메라의 시야에 포함되는 전경 오브젝트를 특정(결정)하고, 해당 전경 오브젝트의 적어도 일부를 포함하는 분할 블록의 피사체 카운트 수에 값을 가산해도 된다.
해석부(303)는, 전경 오브젝트의 위치에 상관없이, 간단히, 각 가상 카메라의 시야에 포함되는 분할 블록의 피사체 카운트 수를 가산해도 된다. 즉, 해석부(303)는, 복수의 촬상장치의 촬상범위의 적어도 어느 것에 포함되는 영역 중, 복수의 가상 카메라 각각의 시야에 포함되는 영역에 대해 판정을 행해서 카운트를 행해도 된다. 정보 생성부(304)는, 해석부(303)의 판정 결과에 근거하여, 촬상 기간 내에 포함되고 시야가 중복하는 가상 카메라의 수에 근거해서 결정되는 1 이상의 시점을 나타내는 정보를 생성해도 된다. 이 방법에 따르면, 예를 들면, 동일한 영역이 임계값 이상의 수 가상 카메라의 시야에 포함되는 시점을 나타내는 정보, 즉 많은 가상 카메라의 시선이 같은 주목 영역에 집중한 시점을 나타내는 정보를 생성할 수 있다. 이 방법에서는, 전경 오브젝트의 위치를 판정하지 않아도 된다. 이 때문에, 적은 처리량으로 정보의 생성을 할 수 있다. 상기한 임계값은, 예를 들어, 유저 조작에 근거하여 정보 처리장치(3)에 미리 설정된 값이거나, 해석부(303)의 판정 결과에 근거해서 결정되는 값, 예를 들면, 촬상 기간에 있어서의 시야가 중복하는 카메라의 수의 평균값에 근거한 값이어도 된다. 판정 결과에 근거한 임계값의 자동 결정에 의해, 피사체 판정의 대상인 가상 카메라의 수가 변화되었을 경우에 임계값을 수동으로 설정하는 수고를 삭감할 수 있다.
한편, 도 8을 참조하여 설명한 것 같이, 소정의 오브젝트에 대응하는 분할 블록에 대해 피사체 카운트를 행하는 방법을 사용하면, 정보 생성부(304)가, 복수의 촬상장치의 시선이 같은 오브젝트에 집중한 시점을 나타내는 정보를 생성할 수 있다. 그 때문에, 전경 오브젝트가 존재하지 않고 특별히 주목받지 않고 있는 영역이, 우연히 많은 가상 카메라의 시야에 들어간 시점을, 주목 씬으로서 특정(결정)해 버리는 일이 적어진다. 따라서, 보다 실제의 주목도에 일치하는 정보를 제시할 수 있다.
[하이라이트 화상 생성]
이상의 설명에서는, 가상 카메라를 지정하는 복수의 유저가 더 주목하는 대상인 오브젝트나 씬을 특정(결정)하고, 해당 주목 대상을 식별 가능하게 하는 정보를 제시하는 예에 대해 설명했다. 단, 주목 대상을 특정한 결과의 이용 방법은, 전술한 정보의 제시에 한정되지 않는다. 이하에서는, 주목 대상을 특정한 결과를 사용해서 하이라이트 화상을 생성하는 예에 대해 설명한다.
도 11을 참조하여, 정보 처리장치(3)를 사용한 하이라이트 화상의 생성에 관한 처리에 대해 설명한다. 도 11에 나타내는 처리는, 도 8에 나타내는 처리의 종료후, 하이라이트 화상을 생성하기 위한 지시가 정보 처리장치(3)에 입력된 시점에서 개시된다. 이 지시는, 정보 처리장치(3)에 대한 유저 조작에 의해 행해지거나, 유저 단말(4)로부터 지시가 입력되어도 된다. 단, 도 11에 나타내는 처리의 개시 타이밍은 이것에 한정되지 않는다.
스텝 S3000에서는, 해석부(303)가, 도 8의 처리에 있어서 생성되는 정보, 예를 들면, 산출된 최대 카운트 수 N'max(T)에 근거하여 촬상이 행해진 기간 중 하이라이트 화상의 생성 대상이 되는 기간을 결정한다. 구체적으로는, 해석부(303)는, 최대 카운트 수 N'max(T)가 임계값 N'th를 초과하고 있는 기간을 특정한다. 그후, 해석부(303)는, 특정한 기간을 하이라이트 화상의 생성 대상 기간으로 설정한다. 이때, 소정의 시간폭 이상 계속해서 N'th<N'max(T)가 되는 기간만을 생성 대상으로 해도 된다. 이와 달리, N'th<N'max(T)가 계속되는 기간이 짧아도, N'max(T)이 매우 큰 시점을 이 기간이 포함하는 경우에는, 이 시점의 전후의 소정 시간을 포함하는 기간을 생성 대상으로 결정해도 된다. 이와 달리, 하이라이트 화상의 각 씬의 시작과 끝이 자연스럽게 되도록, 적절히 N'th<N'max(T)이 얻어지는 시점 T도 생성 대상에 포함시켜도 된다. 도 10b는, 도 10a에 나타낸 것과 같은 최대 카운트 수 N'max(T)가 얻어진 경우에 하이라이트 화상의 생성 대상이 되는 기간의 예를 나타낸다. 도 10b에 있어서, 사선부가 생성 대상으로서 특정된 기간을 나타내고 있다.
스텝 S3001에 있어서, 화상 생성부(301)는, 촬상 기간 내의 부분 기간인 하이라이트 화상의 생성 대상 기간에 대응하는 가상 시점 화상을 생성한다. 구체적으로는, 해석부(303)가, 스텝 S3000에서 결정된 생성 대상 기간 내의 각 시점에 있어서, 피사체 카운트 수 N'(T)이 큰 분할 블록의 위치(임계값 이상의 수의 가상 카메라의 시야에 포함되는 위치)를 나타내는 정보를 생성한다. 그후, 해석부(303)는 생성된 정보를 패스 산출부(302)에 전달한다. 그리고 패스 산출부(302)는, 이 블록의 위치를 시야에 포함하는 새로운 가상 카메라 패스를 산출하고, 화상 생성부(301)는, 해당 산출된 가상 카메라 패스에 대응하는 가상 시점 화상을 생성한다. 스텝 S3001에 있어서 생성되는 하이라이트 화상용의 가상 시점 화상에 대응하는 가상 카메라 패스의 설정 방법은 이것에 한정되지 않는다. 예를 들면, 패스 산출부(302)는, 전술한 주목 오브젝트의 해석 결과를 사용하여, 생성 대상 기간에 있어서 가장 피사체 카운트 수 N이 컸던 전경 요소, 또는 피사체 포인트 M이 가장 컸던 전경 오브젝트를 정면에서 촬상하기 위한 가상 카메라 패스를 설정해도 된다. 이와 달리, 패스 산출부(302)는, 과거에 유저 단말(4)에 의해 지정된 가상 카메라 패스로부터, 생성 대상 기간에 대응하는 부분을 추출하고, 추출된 부분을 하이라이트 화상 생성용의 가상 카메라 패스로서 사용해도 된다. 이 경우에, 패스 산출부(302)는, 과거에 지정된 가상 카메라 패스 중, 하이라이트 화상의 생성 대상 기간에 있어서 주목 오브젝트를 시야에 포함하는 가상 카메라 패스를 선택해서 이 선택된 가상 카메라 패스를 사용해도 된다. 하이라이트 화상 생성용의 가상 카메라 패스로서, 미리 설정된 가상 카메라 패스가 사용되어도 된다.
스텝 S3002에서는, 정보 생성부(304)가, 스텝 S3000에서 화상 생성부(301)에 의해 생성된 가상 시점 화상을 수신하고, 해당 가상 시점 화상에 관한 부대 정보를 생성한다. 부대 정보는, 예를 들면, 하이라이트 화상의 생성 대상 기간에 대응하는 이벤트. 가상 시점 화상에 포함되는 전경 오브젝트의 명칭, 타임 스케줄, 및 씬이나 오브젝트의 주목도를 나타낸다. 단, 부가되는 정보는 이것에 한정되지 않는다. 그리고 정보 생성부(304)는, 가상 시점 화상에 이들 부대 정보를 조합하여 얻어진 하이라이트 화상을 생성한다. 가상 시점 화상과 조합되는 특정한 부대 정보는, 정보 처리장치(3)에 의해 자동으로 결정되거나, 정보 처리장치(3)에 대해 행해진 유저 조작에 근거하여 결정되어도 된다. 정보 생성부(304)는, 생성된 하이라이트 화상을 유저 조작에 따라 편집해도 된다. 생성 및 편집된 하이라이트 화상은 정보 표시부(305)에 표시된다. 생성 및 편집된 하이라이트 화상은 유저 단말(4)에 송신되어도 된다.
이상이, 하이라이트 화상의 생성에 관한 플로우다. 이상과 같이 하여, 많은 유저에게 주목받은 씬을 포함하는 하이라이트 화상을 유저가 큰 수고를 들이지 않고 용이하게 생성할 수 있다. 상기한 설명에서는, 주목 대상이 되는 씬이나 오브젝트의 특정(결정)과, 하이라이트 화상의 생성의 양쪽을, 정보 처리장치(3)가 행한다. 단, 본 개시내용은 이것에 한정되지 않는다. 이와 달리, 정보 처리장치(3)는 주목 씬이나 주목 오브젝트에 관한 정보를 외부의 장치에 출력하고, 해당 정보를 취득한 다른 장치가 하이라이트 화상을 생성해도 된다. 상기한 설명에서는, 정보 처리장치(3)가, 도 8에 나타내는 처리에 의해 주목 씬의 판정 결과에 근거하여, 그 주목 씬을 포함하는 하이라이트 화상의 생성을 행한다. 단, 본 개시내용은 이것에 한정되지 않는다. 이와 달리, 정보 처리장치(3)는, 도 4에 나타내는 처리에 의한 주목 오브젝트 판정 결과에 근거하여, 그 주목 오브젝트를 포함하는 하이라이트 화상의 생성을 행해도 된다.
본실시형태에서는, 전경 요소나 분할 블록마다, 가상 카메라의 지정에 근거한 유저의 주목도를 해석할 경우를 중심으로 설명했다. 이와 달리, 해석부(303)은, 이들 해석을 조합해도 된다. 예를 들면, 각 전경 오브젝트의 피사체 포인트 M을 미소 시간마다 산출하고, 피사체 포인트 M의 경시적 변화를 도 10a에 나타내는 정보와 중첩하여 제시함으로써, 주목 씬과 주목 오브젝트의 상관 관계를 용이하게 파악할 수 있는 정보를 제시한다.
정보 생성부(304)는, 제시 정보의 생성시에, 정보 관리부(306)로부터 얻어지는 유저 정보를 기초로 유저를 카테고라이즈하고, 이 유저 카테고리에 근거하여 제시 정보를 생성해도 된다. 유저 카테고리의 예로서는, 나이, 성별, 출신지, 현재 거주 에어리어, 특정 스포츠의 경험값과 응원팀, 및 가상 카메라 조작 경험값 등의 다양한 카테고리를 포함한다. 예를 들어, 유저 카테고리에 근거한 제시 정보로서 유저 카테고리별의 주목도를 표시할 경우에는, 카테고리마다의 표시를 전환할 수 있도록 하여도 된다. 전체 카테고리의 주목도를 동시에 표시하면서, 색 코딩(color-coding)이나 텍스처의 차이에 의해 카테고리마다의 주목도를 식별할 수 있도록 하여도 된다. 또는, 유저 카테고리 명칭 그 자체를 주목도와 함께 텍스트로 표시해도 된다.
본실시형태에서는, 정보 처리장치(3)가, 복수의 유저에 대응하는 복수의 가상 카메라 패스를 사용해서 주목 대상을 판정한다. 즉, 주목 대상을 판정하기 위해서 사용되는 가상 카메라 정보에 근거하여 특정(결정)되는 복수의 가상 시점에는, 복수의 유저에 대응하는 복수의 가상 시점이 포함되고, 또한, 복수의 다른 시점에 대응하는 복수의 가상 시점이 포함된다. 단, 본 개시내용은 이것에 한정되지 않는다. 이와 달리, 정보 처리장치(3)는, 단일의 유저에 대응하는 가상 카메라 패스에 근거하여, 그 유저가 긴 시간 주목하고 있었던 오브젝트나 영역을 판정해도 된다. 이와 달리, 정보 처리장치(3)는, 어떤 단일시점에서의 복수의 유저에 대응하는 복수의 가상 시점에 근거하여, 이 시점에 있어서 많은 유저가 주목하고 있었던 오브젝트나 영역을 판정해도 된다.
이상에서 설명한 것과 같이, 본 실시형태에 따른 정보 처리장치(3)는, 복수의 촬상장치에 의해 취득되는 복수의 촬상 화상에 근거하여 생성되는 가상 시점 화상에 대응하는 가상 카메라에 관한 가상 카메라 정보를 취득한다. 정보 처리장치(3)는, 해당 복수의 촬상 화상의 적어도 어느 것에 포함되고 가상 카메라 정보에 근거하여 특정(결정)되는 가상 카메라의 시야 내의 범위에 포함되는 오브젝트를 판정한다. 정보 처리장치(3)는, 복수의 가상 카메라 정보에 의해 특정(결정)되는 복수의 가상 카메라에 관한 해당 판정의 결과에 근거한 정보를 제시한다. 상기와 같은 구성에 따르면, 가상 시점 화상에 관한 가상 카메라를 지정하는 유저의 주목 대상을 용이하게 특정(결정)할 수 있게 된다.
상기한 실시형태에 따르면, 가상 시점 화상에 관한 가상 시점을 지정하는 유저의 주목 대상을 용이하게 특정(결정)할 수 있게 된다.
기타 실시형태
본 발명의 실시형태는, 본 발명의 전술한 실시형태(들)의 1개 이상의 기능을 수행하기 위해 기억매체('비일시적인 컴퓨터 판독가능한 기억매체'로서 더 상세히 언급해도 된다)에 기록된 컴퓨터 실행가능한 명령(예를 들어, 1개 이상의 프로그램)을 판독하여 실행하거나 및/또는 전술한 실시예(들)의 1개 이상의 기능을 수행하는 1개 이상의 회로(예를 들어, 주문형 반도체 회로(ASIC)를 포함하는 시스템 또는 장치의 컴퓨터나, 예를 들면, 전술한 실시형태(들)의 1개 이상의 기능을 수행하기 위해 기억매체로부터 컴퓨터 실행가능한 명령을 판독하여 실행함으로써, 시스템 또는 장치의 컴퓨터에 의해 수행되는 방법에 의해 구현될 수도 있다. 컴퓨터는, 1개 이상의 중앙처리장치(CPU), 마이크로 처리장치(MPU) 또는 기타 회로를 구비하고, 별개의 컴퓨터들의 네트워크 또는 별개의 컴퓨터 프로세서들을 구비해도 된다. 컴퓨터 실행가능한 명령은, 예를 들어, 기억매체의 네트워크로부터 컴퓨터로 주어져도 된다. 기록매체는, 예를 들면, 1개 이상의 하드디스크, 랜덤 액세스 메모리(RAM), 판독 전용 메모리(ROM), 분산 컴퓨팅 시스템의 스토리지, 광 디스크(콤팩트 디스크(CD), 디지털 다기능 디스크(DVD), 또는 블루레이 디스크(BD)TM 등), 플래시 메모리소자, 메모리 카드 등을 구비해도 된다.
본 발명은, 상기한 실시형태의 1개 이상의 기능을 실현하는 프로그램을, 네트워크 또는 기억매체를 개입하여 시스템 혹은 장치에 공급하고, 그 시스템 혹은 장치의 컴퓨터에 있어서 1개 이상의 프로세서가 프로그램을 읽어 실행하는 처리에서도 실행가능하다. 또한, 1개 이상의 기능을 실현하는 회로(예를 들어, ASIC)에 의해서도 실행가능하다.
예시적인 실시형태들을 참조하여 본 발명을 설명하였지만, 본 발명이 이러한 실시형태에 한정되지 않는다는 것은 자명하다. 이하의 청구범위의 보호범위는 가장 넓게 해석되어 모든 변형, 동등물 구조 및 기능을 포괄하여야 한다.

Claims (20)

  1. 복수의 촬상장치에 의해 복수의 방향에서 촬상함으로써 얻어지는 복수의 촬상 화상에 근거하여 생성되는 가상 시점 화상에 대응하는 가상 시점에 관한 시점 정보를 취득하도록 구성된 취득부와,
    상기 복수의 촬상 화상의 적어도 어느 것에 포함되고 상기 취득부에 의해 취득되는 상기 시점 정보에 근거하여 특정되는 가상 시점에 대응하는 시야 내에 포함되는 오브젝트를 검출하도록 구성된 검출부와,
    상기 취득부에 의해 취득되는 상기 시점 정보에 근거하여 특정되는 복수의 가상 시점에 관련된 상기 검출부의 검출 결과에 근거하여, 시야가 동일한 오브젝트를 포함하는 가상 시점의 수와 관련된 정보를 출력하도록 구성된 출력부를 구비한 정보 처리장치.
  2. 제 1항에 있어서,
    상기 검출부는, 상기 복수의 촬상 화상의 적어도 어느 것에 포함되는 한개 이상의 소정의 오브젝트의 위치 정보와, 상기 취득부에 의해 취득되는 상기 시점 정보에 근거하여, 가상 시점의 시야 내의 오브젝트를 검출하는 정보 처리장치.
  3. 제 1항에 있어서,
    상기 검출부는, 상기 취득부에 의해 취득되는 상기 시점 정보에 근거하여 특정되는 가상 시점에 대응하는 가상 시점 화상에 근거하여, 가상 시점의 시야 내의 오브젝트를 검출하는 정보 처리장치.
  4. 제 1항에 있어서,
    상기 검출부에 의한 검출 대상이 되는 오브젝트는 인물 또는 인물의 부위인 정보 처리장치.
  5. 제 1항에 있어서,
    상기 검출부는, 상기 시점 정보에 의해 특정되는 가상 시점에 해당하는 시야에 대응하는 범위 내의 소정의 일부분에 위치하는 오브젝트를 검출하는 정보 처리장치.
  6. 제 1항에 있어서,
    상기 출력부는, 복수의 유저에 대응하고 동일한 시점에 대응하는 복수의 가상 시점 중, 상기 동일한 오브젝트를 시야 내에 포함하는 가상 시점의 수와 관련된 상기 정보를 출력하는 정보 처리장치.
  7. 제 1항에 있어서,
    상기 출력부는, 복수의 다른 시점에 대응하는 복수의 가상 시점 중, 상기 동일한 오브젝트를 시야 내에 포함하는 가상 시점의 수와 관련된 상기 정보를 출력하는 정보 처리장치.
  8. 복수의 촬상장치에 의해 복수의 방향에서 촬상함으로써 얻어지는 복수의 촬상 화상에 근거하여 생성되는 가상 시점 화상에 대응하는 가상 시점에 관한 시점 정보를 취득하도록 구성된 취득부와,
    상기 복수의 촬상장치의 촬상범위의 적어도 어느 것에 포함되고 상기 취득부에 의해 취득되는 상기 시점 정보에 근거하여 특정되는 가상 시점에 대응하는 시야 내에 포함되는 영역을 검출하도록 구성된 검출부와,
    상기 취득부에 의해 취득되는 상기 시점 정보에 근거하여 특정되는 복수의 가상 시점에 관련된 상기 검출부의 검출 결과에 근거하여, 복수의 가상 시점에 대응하는 복수의 시야에 포함되는 주목 영역이 존재하는 한개 이상의 시점 또는 기간으로서, 상기 복수의 촬상장치의 촬상 기간 내에 있는 상기 한개 이상의 시점 또는 기간을 나타내는 정보를 출력하도록 구성된 출력부를 구비한 정보 처리장치.
  9. 제 8항에 있어서,
    상기 출력부로부터 출력되는 상기 정보는, 상기 복수의 촬상장치의 촬상범위의 적어도 어느 것에 포함되는 동일한 주목 영역이 임계값 이상인 수의 가상 시점의 시야에 포함되는 시점 또는 기간을 특정하는 정보를 포함하는 정보 처리장치.
  10. 제 9항에 있어서,
    상기 임계값은, 미리 정해진 값, 또는 상기 검출부의 검출 결과에 근거해서 결정되는 값인 정보 처리장치.
  11. 제 8항에 있어서,
    상기 출력부로부터 출력되는 상기 정보에 근거하여, 상기 촬상 기간 내에 포함되고 상기 정보에 근거하여 특정되는 부분 기간에 대응하는 가상 시점 화상을 생성하도록 구성된 화상 생성부를 더 구비한 정보 처리장치.
  12. 제 9항에 있어서,
    상기 출력부로부터 출력되는 상기 정보에 근거하여, 상기 촬상 기간 내에 포함되고 상기 정보에 근거하여 특정되는 부분 기간에 대응하는 가상 시점 화상으로서, 상기 임계값 이상의 수의 가상 시점의 시야에 포함되는 영역의 화상을 포함하는 가상 시점 화상을 생성하도록 구성된 화상 생성부를 더 구비한 정보 처리장치.
  13. 제 8항에 있어서,
    상기 출력부는, 상기 주목 영역이 존재하는 시점 또는 기간과, 이 시점 또는 기간에 대응하는 이벤트를 나타내는 정보를 출력하는 정보 처리장치.
  14. 제 8항에 있어서,
    상기 검출부는, 상기 시점 정보에 근거하여 특정되는 가상 시점에 해당하는 시야에 대응하는 범위 내의 소정의 일부분에 포함되는 영역을 검출하는 정보 처리장치.
  15. 제 8항에 있어서,
    상기 출력부는, 복수의 유저에 대응하고 동일한 시점에 대응하는 복수의 가상 시점에 대응하는 복수의 시야에 포함되는 주목 영역이 존재하는 시점 또는 기간에 관한 정보를 출력하는 정보 처리장치.
  16. 제 8항에 있어서,
    상기 출력부는, 복수의 다른 시점에 대응하는 복수의 가상 시점에 해당하는 복수의 시야에 포함되는 주목 영역이 존재하는 시점 또는 기간에 관한 정보를 출력하는 정보 처리장치.
  17. 복수의 촬상장치에 의해 복수의 방향에서 촬상함으로써 얻어지는 복수의 촬상 화상에 근거하여 생성되는 가상 시점 화상에 대응하는 가상 시점에 관한 시점 정보를 취득하는 단계와,
    상기 복수의 촬상 화상의 적어도 어느 것에 포함되고 취득된 상기 시점 정보에 근거하여 특정되는 가상 시점에 대응하는 시야 내에 포함된 오브젝트를 검출하는 단계와,
    취득된 상기 시점 정보에 근거하여 특정되는 복수의 가상 시점에 관련된 검출 결과에 근거하여, 시야가 동일한 오브젝트를 포함하는 가상 시점의 수와 관련된 정보를 출력하는 단계를 포함하는 정보 처리방법.
  18. 복수의 촬상장치에 의해 복수의 방향에서 촬상함으로써 얻어지는 복수의 촬상 화상에 근거하여 생성되는 가상 시점 화상에 대응하는 가상 시점에 관한 시점 정보를 취득하는 단계와,
    상기 복수의 촬상장치의 촬상범위의 적어도 어느 것에 포함되고 취득된 상기 시점 정보에 근거하여 특정되는 가상 시점에 대응하는 시야 내에 포함되는 영역을 검출하는 단계와,
    취득된 상기 시점 정보에 근거하여 특정되는 복수의 가상 시점에 관련된 검출 결과에 근거하여, 복수의 가상 시점에 대응하는 복수의 시야에 포함되는 주목 영역이 존재하는 한개 이상의 시점 또는 기간으로서, 상기 복수의 촬상장치의 촬상 기간 내에 있는 상기 한개 이상의 시점 또는 기간을 나타내는 정보를 출력하는 단계를 포함하는 정보 처리방법.
  19. 컴퓨터에,
    복수의 촬상장치에 의해 복수의 방향에서 촬상함으로써 얻어지는 복수의 촬상 화상에 근거하여 생성되는 가상 시점 화상에 대응하는 가상 시점에 관한 시점 정보를 취득하는 단계와,
    상기 복수의 촬상 화상의 적어도 어느 것에 포함되고 취득된 상기 시점 정보에 근거하여 특정되는 가상 시점에 대응하는 시야 내에 포함된 오브젝트를 검출하는 단계와,
    취득된 상기 시점 정보에 근거하여 특정되는 복수의 가상 시점에 관련된 검출 결과에 근거하여, 시야가 동일한 오브젝트를 포함하는 가상 시점의 수와 관련된 정보를 출력하는 단계를 포함하는 정보 처리방법을 실행하게 하는 프로그램을 기억한 비일시적인 기억매체.
  20. 컴퓨터에,
    복수의 촬상장치에 의해 복수의 방향에서 촬상함으로써 얻어지는 복수의 촬상 화상에 근거하여 생성되는 가상 시점 화상에 대응하는 가상 시점에 관한 시점 정보를 취득하는 단계와,
    상기 복수의 촬상장치의 촬상범위의 적어도 어느 것에 포함되고 취득된 상기 시점 정보에 근거하여 특정되는 가상 시점에 대응하는 시야 내에 포함되는 영역을 검출하는 단계와,
    취득된 상기 시점 정보에 근거하여 특정되는 복수의 가상 시점에 관련된 검출 결과에 근거하여, 복수의 가상 시점에 대응하는 복수의 시야에 포함되는 주목 영역이 존재하는 한개 이상의 시점 또는 기간으로서, 상기 복수의 촬상장치의 촬상 기간 내에 있는 상기 한개 이상의 시점 또는 기간을 나타내는 정보를 출력하는 단계를 포함하는 정보 처리방법을 실행하게 하는 프로그램을 기억한 비일시적인 기억매체.
KR1020190046447A 2018-05-09 2019-04-22 정보 처리장치, 정보 처리방법, 및 기억매체 KR20190128992A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018090314A JP2019197340A (ja) 2018-05-09 2018-05-09 情報処理装置、情報処理方法、及び、プログラム
JPJP-P-2018-090314 2018-05-09

Publications (1)

Publication Number Publication Date
KR20190128992A true KR20190128992A (ko) 2019-11-19

Family

ID=68463422

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190046447A KR20190128992A (ko) 2018-05-09 2019-04-22 정보 처리장치, 정보 처리방법, 및 기억매체

Country Status (3)

Country Link
US (2) US20190349560A1 (ko)
JP (2) JP2019197340A (ko)
KR (1) KR20190128992A (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10600245B1 (en) * 2014-05-28 2020-03-24 Lucasfilm Entertainment Company Ltd. Navigating a virtual environment of a media content item
JP7159057B2 (ja) * 2017-02-10 2022-10-24 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 自由視点映像生成方法及び自由視点映像生成システム
US20230063215A1 (en) * 2020-01-23 2023-03-02 Sony Group Corporation Information processing apparatus, information processing method, and program

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5645450B2 (ja) * 2010-04-16 2014-12-24 キヤノン株式会社 画像処理装置および方法
JP6021541B2 (ja) 2012-09-13 2016-11-09 キヤノン株式会社 画像処理装置及び方法
JP5861684B2 (ja) 2013-09-27 2016-02-16 ブラザー工業株式会社 情報処理装置、及びプログラム
WO2016194441A1 (ja) * 2015-06-02 2016-12-08 株式会社電通 立体広告枠決定システム、ユーザ端末および立体広告枠決定コンピュータ
JP6615723B2 (ja) * 2016-09-07 2019-12-04 株式会社ソニー・インタラクティブエンタテインメント 情報処理装置および対象物認識方法
WO2018079260A1 (ja) * 2016-10-25 2018-05-03 ソニー株式会社 画像処理装置および画像処理方法
JP6922369B2 (ja) * 2017-04-14 2021-08-18 富士通株式会社 視点選択支援プログラム、視点選択支援方法及び視点選択支援装置
JP6481734B2 (ja) * 2017-10-18 2019-03-13 カシオ計算機株式会社 撮影システム、撮影方法及びプログラム
US20190259198A1 (en) * 2018-02-21 2019-08-22 Tsunami VR, Inc. Systems and methods for generating visual representations of a virtual object for display by user devices

Also Published As

Publication number Publication date
JP7422468B2 (ja) 2024-01-26
US20190349560A1 (en) 2019-11-14
JP2022105590A (ja) 2022-07-14
US20220264067A1 (en) 2022-08-18
JP2019197340A (ja) 2019-11-14

Similar Documents

Publication Publication Date Title
US10917622B2 (en) Information processing apparatus, display control method, and storage medium
US9202112B1 (en) Monitoring device, monitoring system, and monitoring method
EP3451681A1 (en) Information processing device, control method of information processing device, and program
CN108304063B (zh) 信息处理装置、信息处理方法和计算机可读介质
JP5634111B2 (ja) 映像編集装置、映像編集方法及びプログラム
JP7422468B2 (ja) 情報処理装置、情報処理方法、及び、プログラム
US11250633B2 (en) Image processing apparatus, display method, and non-transitory computer-readable storage medium, for displaying a virtual viewpoint image including an object at different points in time
US20200053336A1 (en) Information processing apparatus, information processing method, and storage medium
CN112105983B (zh) 增强的视觉能力
US20190155465A1 (en) Augmented media
KR20170138800A (ko) 멀티 스티커를 이용한 영상 생성 방법 및 장치
US11106949B2 (en) Action classification based on manipulated object movement
CN111527495B (zh) 用于应用视频观看行为的方法和装置
JP2021043752A (ja) 情報表示装置、情報表示方法及び情報表示システム
JP5776471B2 (ja) 画像表示システム
CN108140401A (zh) 访问视频片段
US11501577B2 (en) Information processing apparatus, information processing method, and storage medium for determining a contact between objects
JP5850188B2 (ja) 画像表示システム
US9767564B2 (en) Monitoring of object impressions and viewing patterns
US20210217223A1 (en) Heat map presentation device and heat map presentation program
JP2020135290A (ja) 画像生成装置、画像生成方法、画像生成システム、及びプログラム
RU2725682C1 (ru) Устройство обработки информации, способ обработки информации и носитель данных
Löwe et al. Gaze visualization for immersive video
US20240037843A1 (en) Image processing apparatus, image processing system, image processing method, and storage medium
WO2023233650A1 (en) Pose analyzing apparatus, pose analyzing method, and non-transitory computer-readable storage medium

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E601 Decision to refuse application