WO2020149146A1 - 画像処理装置、画像処理方法、及び、プログラム - Google Patents

画像処理装置、画像処理方法、及び、プログラム Download PDF

Info

Publication number
WO2020149146A1
WO2020149146A1 PCT/JP2019/051424 JP2019051424W WO2020149146A1 WO 2020149146 A1 WO2020149146 A1 WO 2020149146A1 JP 2019051424 W JP2019051424 W JP 2019051424W WO 2020149146 A1 WO2020149146 A1 WO 2020149146A1
Authority
WO
WIPO (PCT)
Prior art keywords
image
strobe
frame
reproduction
reproduction control
Prior art date
Application number
PCT/JP2019/051424
Other languages
English (en)
French (fr)
Inventor
小川 浩司
Original Assignee
ソニー株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニー株式会社 filed Critical ソニー株式会社
Priority to US17/309,982 priority Critical patent/US20210400255A1/en
Priority to CN201980088666.8A priority patent/CN113316804A/zh
Publication of WO2020149146A1 publication Critical patent/WO2020149146A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • H04N13/349Multi-view displays for displaying three or more geometrical viewpoints without viewer tracking
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01BMEASURING LENGTH, THICKNESS OR SIMILAR LINEAR DIMENSIONS; MEASURING ANGLES; MEASURING AREAS; MEASURING IRREGULARITIES OF SURFACES OR CONTOURS
    • G01B11/00Measuring arrangements characterised by the use of optical techniques
    • G01B11/24Measuring arrangements characterised by the use of optical techniques for measuring contours or curvatures
    • G01B11/245Measuring arrangements characterised by the use of optical techniques for measuring contours or curvatures using a plurality of fixed, simultaneously operating transducers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/10Geometric effects
    • G06T15/20Perspective computation
    • G06T15/205Image-based rendering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/50Lighting effects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/111Transformation of image signals corresponding to virtual viewpoints, e.g. spatial image interpolation
    • H04N13/117Transformation of image signals corresponding to virtual viewpoints, e.g. spatial image interpolation the virtual viewpoint locations being selected by the viewers or determined by viewer tracking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/204Image signal generators using stereoscopic image cameras
    • H04N13/243Image signal generators using stereoscopic image cameras using three or more 2D image sensors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/275Image signal generators from 3D object models, e.g. computer-generated stereoscopic image signals
    • H04N13/279Image signal generators from 3D object models, e.g. computer-generated stereoscopic image signals the virtual viewpoint locations being selected by the viewers or determined by tracking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • H04N13/332Displays for viewing with the aid of special glasses or head-mounted displays [HMD]
    • H04N13/344Displays for viewing with the aid of special glasses or head-mounted displays [HMD] with head-mounted left-right displays

Definitions

  • the present technology relates to an image processing device, an image processing method, and a program, and in particular, for example, an image processing device, an image processing method, and a program that enable easy reproduction and editing of free viewpoint data.
  • a method for generating a stroboscopic image showing a subject (image) photographed at a plurality of times for example, see Patent Document 1. Since the subject at a plurality of times is shown in the strobe image, the movement and trajectory of the subject can be easily grasped.
  • the present technology has been made in view of such a situation, and makes it possible to easily perform the reproduction and editing work of free viewpoint data.
  • the image processing device or the program of the present technology allows a 3D model of an object at a plurality of times generated from a plurality of viewpoint images captured from a plurality of viewpoints to be viewed from a virtual viewpoint of a strobe model in which a 3D space is arranged.
  • An image processing apparatus including a reproduction control unit that generates reproduction control information that controls reproduction of free viewpoint data generated from the plurality of viewpoint images according to an operation on the 3D strobe image, or such an image processing apparatus Is a program for operating a computer as.
  • the image processing method of the present technology is a 3D strobe image in which a 3D model of an object at a plurality of times generated from a plurality of viewpoint images captured from a plurality of viewpoints is arranged in a three-dimensional space from a virtual viewpoint.
  • an image processing method including generating reproduction control information for controlling reproduction of free viewpoint data generated from the plurality of viewpoint images in accordance with an operation for.
  • a strobe model in which 3D models of objects at a plurality of times generated from a plurality of viewpoint images captured from a plurality of viewpoints are arranged in a three-dimensional space
  • Reproduction control information for controlling reproduction of free viewpoint data generated from the plurality of viewpoint images is generated according to an operation on the 3D strobe image viewed from the virtual viewpoint.
  • image processing device and the display device may be independent devices, or may be internal blocks forming one device.
  • the program can be provided by transmitting it via a transmission medium or by recording it on a recording medium.
  • FIG. 3 is a block diagram showing a configuration example of a content server 12.
  • FIG. 3 is a block diagram showing a configuration example of a reproduction/editing device 13.
  • FIG. 9 is a flowchart illustrating an example of processing performed by the content server 12.
  • 9 is a flowchart illustrating an example of processing performed by the reproduction/editing device 13. It is a figure which shows the example of an unnatural 3D strobe image. It is a figure which shows the example of a natural 3D strobe image. It is a figure which shows the example of the frame of the viewpoint image of a strobe area.
  • FIG. 8 is a diagram showing an example of generation of a strobe model using frames at times t1 to t9 as strobe sections. It is a figure which shows the example of a display of the 3D strobe image produced
  • FIG. 20 is a block diagram illustrating a configuration example of an embodiment of a computer to which the present technology is applied.
  • FIG. 1 is a block diagram showing a configuration example of an embodiment of an image processing system to which the present technology is applied.
  • an image viewed when an object that is a subject in a three-dimensional space is viewed from a predetermined viewpoint, that is, an object is viewed from a predetermined viewpoint.
  • a 2D image obtained by projecting a viewing volume in a three-dimensional space represented by free viewpoint data is generated and displayed on a projection plane perpendicular to the viewing direction when viewed.
  • This 2D image can be called a free viewpoint image because the viewpoint can be freely determined and generated.
  • the viewpoint (including the line-of-sight direction) required for generating the free viewpoint image can be virtually set regardless of the actual viewpoint of the user, and thus such viewpoint is also referred to as a virtual viewpoint.
  • free-viewpoint video content has a degree of freedom in the time direction as well as a virtual viewpoint, that is, a virtual camera that captures free-viewpoint data (3D space represented by). It has the flexibility of the shooting position and shooting posture (shooting direction).
  • the shooting position of the virtual camera can be represented by, for example, the coordinates of the xyz coordinate system as the world coordinate system, and the shooting posture of the virtual camera can be represented by the rotation angle around each axis of the world coordinate system.
  • the virtual camera shooting position can be moved in the x-axis, y-axis, and z-axis directions, and the virtual camera shooting position can be rotated about the x-axis, y-axis, and z-axis.
  • the free viewpoint image generated by projecting the free viewpoint data (viewing volume in the three-dimensional space represented by) onto the projection surface for the virtual viewpoint is as if the virtual viewpoint is a virtual viewpoint.
  • projecting the free viewpoint data onto the projection surface for the virtual viewpoint is equivalent to capturing the free viewpoint data with the virtual camera from the virtual viewpoint. That is, generating free viewpoint images by projecting free viewpoint data onto a projection surface for a virtual viewpoint can be likened to capturing free viewpoint data with a virtual camera arranged at the virtual viewpoint. .. Therefore, in the present embodiment, the generation of the free viewpoint image will be described as appropriate by taking an example of capturing the free viewpoint data with a virtual camera.
  • a virtual camera that captures free viewpoint data is also referred to as a virtual camera.
  • the image processing system in FIG. 1 includes a photographing device 11, a content server 12, and a reproduction/editing device 13.
  • the image capturing device 11 is composed of at least a plurality of cameras and captures an object from a plurality of viewpoints.
  • a plurality of cameras forming the image capturing apparatus 11 are arranged so as to surround the object, and each camera shoots the object from the viewpoint as the position where the camera is arranged.
  • the photographing device 11 can be provided with a plurality of distance measuring devices in addition to a plurality of cameras.
  • the distance measuring device can be arranged at the same position (viewpoint) as the camera, or can be arranged at a position different from the camera.
  • the distance measuring device measures the distance from the position (viewpoint) where the distance measuring device is arranged to the object, and generates a depth image which is a 2D image having a depth which is information regarding the distance as a pixel value.
  • the depth image is supplied from the photographing device 11 to the content server 12.
  • the distance measuring device is not provided in the photographing device 11, the distance to the object is measured by the triangulation principle using the viewpoint images of two viewpoints out of the viewpoint images of the plurality of viewpoints. , Depth images can be generated.
  • the content server 12 is, for example, a web server or a server on the cloud.
  • the content server 12 generates moving image content of free viewpoint data by using viewpoint images of a plurality of viewpoints supplied from the photographing device 11, for example. Furthermore, the content server 12 uses the free viewpoint data to create a 3D model of the same object (subject) in a plurality of frames (time) of the viewpoint image in the 3D space (3D model) captured by the imaging device 11. Generates a strobe model in which is placed. In response to a request from the reproduction/editing device 13, the content server 12 transmits the moving image content of free viewpoint data and the strobe model to the reproduction/editing device 13.
  • the playback/editing device 13 is, for example, a client such as a PC (Personal Computer), a TV (television receiver), or a mobile terminal such as a smartphone.
  • the playback/editing device 13 requests the content server 12 for the moving image content of the free viewpoint data and the strobe model, and acquires it. Further, the reproduction/editing device 13 generates reproduction control information for controlling the reproduction of the moving image content of the free viewpoint data according to the user's operation on the 3D strobe image of the strobe model viewed from the virtual viewpoint. Then, the reproduction editing device 13 reproduces or edits the moving image content of the free viewpoint data according to the reproduction control information.
  • the content server 12 and the playback/editing device 13 can be configured as separate devices as shown in FIG. 1, or the whole can be configured as one device (for example, a PC (Personal Computer) or the like). It can also be configured.
  • a PC Personal Computer
  • FIG. 2 is a block diagram showing a configuration example of the content server 12 of FIG.
  • the content server 12 includes a free viewpoint data generation unit 21, a flash model generation unit 22, a storage unit 23, and a communication unit 24.
  • the free viewpoint data generation unit 21 generates free viewpoint data in frame units from viewpoint images and depth images of a plurality of viewpoints from the image capturing apparatus 11, thereby generating moving image content of free viewpoint data.
  • free viewpoint data means a wide range of 3D image data (3D data) that can generate a free viewpoint image.
  • 3D data for example, a set of viewpoint images and depth images from a plurality of viewpoints from the photographing device 11 can be directly adopted.
  • 3D data having a 3D shape model that is information of a three-dimensional shape and color information, or a set of 2D images and depth images of a plurality of viewpoints should be adopted. You can
  • the free viewpoint data generation unit 21 When a set of viewpoint images and depth images from a plurality of viewpoints from the photographing device 11 is adopted as the free viewpoint data, the free viewpoint data generation unit 21 generates viewpoint images and depth images from a plurality of viewpoints from the photographing device 11. Is used as it is as free viewpoint data.
  • the free viewpoint data generation unit 21 uses visual point hulls and the like to model by using viewpoint images of a plurality of viewpoints from the photographing device 11. By doing so, a 3D shape model of the object shown in the viewpoint image is generated, and it is used as free viewpoint data together with the viewpoint images of a plurality of viewpoints that are textures.
  • the free viewpoint data generation unit 21 uses the depth images of the plurality of viewpoints from the photographing device 11 for photographing. A depth image of the viewpoint of the viewpoint image from the device 11 can be generated.
  • the free viewpoint data generation unit 21 may generate the 3D data including the 3D shape model and the color information as described above, for example.
  • a set of a 2D image and a depth image generated from the plurality of viewpoints (the same viewpoint as the camera that configures the imaging device 11 or different viewpoints) is generated as free viewpoint data. To do.
  • the free viewpoint data generation unit 21 generates moving image content of free viewpoint data as described above, and supplies it to the strobe model generation unit 22 and the storage unit 23.
  • the amount of free viewpoint data can be reduced by adopting a set of 2D images and depth images of a plurality of viewpoints as compared to 3D data having a 3D shape model.
  • a technique for generating and transmitting a set of 2D images and depth images of a plurality of viewpoints as free viewpoint data is described in International Publication 2017/082076 previously proposed by the applicant.
  • a set of 2D images of multiple viewpoints and depth images as free viewpoint data is, for example, 2D images such as MVCD (Multiview and depth depth video coding), AVC (Advanced Video Coding), and HEVC (High Efficiency Video Coding). It can be encoded according to the target encoding method.
  • VI model View Independent
  • VD model View Dependent
  • a VD model is, for example, 3D data in which information about a three-dimensional shape such as a 3D shape model and information about an image serving as a texture are separated.
  • colors are added by mapping a texture image on the 3D shape model (texture mapping).
  • the VD model it is possible to represent the degree of reflection on the surface of the object that differs depending on the (virtual) viewpoint.
  • the VD model is called ViewDependent because its appearance depends on the viewpoint.
  • the VI model is, for example, 3D data in which polygons and points as constituent elements of information about a three-dimensional shape have color information.
  • the VI model includes, for example, a set of a colored point cloud, a 3D shape model, and a UV map as color information of the 3D shape model.
  • the colors of polygons and points are observed from any (virtual) viewpoint.
  • the VI model is called View Independent because its appearance does not depend on the viewpoint.
  • the strobe model generation unit 22 uses the free viewpoint data from the free viewpoint data generation unit 21 to create a 3D space (a 3D model) of the viewpoint image in the same object in a plurality of frames (at different times).
  • a strobe model in which a 3D model, which is free viewpoint data, is arranged is generated.
  • the strobe model generation unit 22 selects a frame to be used for generating a strobe model (hereinafter, also referred to as a generation frame) from the frames in the strobe section, which is the section of the frame for which the strobe model is to be generated. Further, the strobe model generation unit 22 sets one or more objects among the objects reflected in the generation frame as an object (hereinafter, also referred to as a target object) on which the 3D model is arranged in the strobe model. Then, the strobe model generation unit 22 generates a strobe model in which the 3D model of the target object shown in the generation frame is arranged, and supplies the strobe model to the storage unit 23.
  • a generation frame which is the section of the frame for which the strobe model is to be generated.
  • the strobe model generation unit 22 can set, for example, all the moving objects shown in the generation frame as target objects. Further, in the strobe model generation unit 22, for example, an object designated by the user of the reproduction editing apparatus 13 among the moving objects shown in the generation frame can be set as the target object.
  • the storage unit 23 stores the moving image content of the free viewpoint data from the free viewpoint data generation unit 21 and the strobe model from the strobe model generation unit 22.
  • the communication unit 24 communicates with the playback/editing device 13. That is, for example, the communication unit 24 transmits the moving image content of the free viewpoint data or the strobe model stored in the storage unit 23 to the reproduction/editing device 13 in response to a request from the reproduction/editing device 13.
  • the free viewpoint data generation unit 21 and the strobe model generation unit 22 can be provided in the playback/editing device 13.
  • FIG. 3 is a block diagram showing a configuration example of the reproduction/editing apparatus 13 of FIG.
  • the playback/editing device 13 includes a communication unit 31, a storage unit 32, a free viewpoint image generation unit 33, a display unit 34, a virtual viewpoint setting unit 35, an operation unit 36, a playback control unit 37, and a storage unit 38.
  • the communication unit 31 communicates with the content server 12. That is, the communication unit 31 transmits a request for moving image content of free viewpoint data or a strobe model, for example, in response to an operation of the operation unit 36. In response to the request, the communication unit 31 receives the moving image content of the free viewpoint data and the strobe model transmitted from the content server 12, and supplies the moving image content and the strobe model to the storage unit 32.
  • the storage unit 32 stores the moving image content of the free viewpoint data from the communication unit 31 and the strobe model.
  • the free viewpoint image generation unit 33 views the 2D image (the position of the virtual viewpoint as viewed from the virtual viewpoint supplied from the virtual viewpoint setting unit 35 of the free viewpoint data (three-dimensional space represented by) stored in the storage unit 32.
  • 2D image obtained by shooting with a virtual camera (including a set of 2D image for the left eye and 2D image for the right eye) and the like are generated (rendering) as a free viewpoint image (data thereof), and the display unit 34 Supply to.
  • the free viewpoint image generation unit 33 also generates a 3D strobe image (3D CG (Computer Graphics)) that is a 2D image of the strobe model stored in the storage unit 32 from the virtual viewpoint from the virtual viewpoint setting unit 35. It is generated as a free viewpoint image and supplied to the display unit 34.
  • 3D CG Computer Graphics
  • the strobe image is an image showing one or more identical objects (images) taken at a plurality of times.
  • a strobe image in which an object appears in a 2D image is also referred to as a 2D strobe image
  • a 2D image in which a 3D model of an object is seen that is, a 2D image in which the strobe model is viewed from a predetermined viewpoint is also referred to as a 3D strobe image.
  • the free viewpoint image generation unit 33 generates a 3D strobe image.
  • the display unit 34 displays the 3D strobe image from the free viewpoint image generation unit 33 and other free viewpoint images.
  • the display unit 34 can be configured by, for example, a 2D head mounted display, a 2D monitor, a 3D head mounted display, a 3D monitor, or the like.
  • a 3D head-mounted display or monitor is, for example, a display device that realizes stereoscopic viewing by displaying a 2D image for the left eye and a 2D image for the right eye.
  • the virtual viewpoint setting unit 35 sets a virtual viewpoint at the time of shooting the strobe model with the virtual camera, and supplies it to the free viewpoint image generation unit 33.
  • the virtual viewpoint can be set, for example, according to a user operation.
  • the user's operation includes the user's operation (the position and posture) and the gesture in addition to the operation of the operation unit 36.
  • the user's state can be detected by the head mounted display, for example, when the display unit 34 is configured by the head mounted display.
  • the operation unit 36 is operated by the user and supplies operation information according to the user's operation to necessary blocks.
  • the operation unit 36 can be configured integrally with the display unit 34, for example, by a touch panel or the like.
  • the operation unit 36 can also be configured as a mouse, a controller, or the like that is separate from the display unit 34.
  • the reproduction control unit 37 controls the reproduction of the moving image content of the free viewpoint data stored in the storage unit 32 according to the user's operation (such as the operation unit 36) on the 3D strobe image displayed on the display unit 34. Reproduction control information is generated. Further, the reproduction control unit 37 controls the reproduction of the moving image content of the free viewpoint data stored in the storage unit 32 according to the reproduction control information.
  • the control of the reproduction of the moving image content of the free viewpoint data includes the control of the position (frame) to start the reproduction, the control (setting) of the virtual viewpoint when the free viewpoint image generation unit 33 generates the free viewpoint image, and the like. Be done.
  • the reproduction control information includes, for example, a timeline scenario and a shooting scenario.
  • the timeline scenario is information representing a reproduction procedure for reproducing moving image content of free viewpoint data.
  • the shooting scenario is information indicating a virtual viewpoint when viewing the free viewpoint data, that is, information indicating a shooting position and a shooting posture of a virtual camera that shoots the free viewpoint data (further, a camera parameter such as a zoom ratio).
  • the storage unit 38 stores files of timeline scenarios and shooting scenarios as reproduction control information generated by the reproduction control unit 37.
  • the playback/editing device 13 may have at least a function of communicating with the outside, a function of displaying an image, and a function of receiving a user operation.
  • other functions for example, functions realized by the free viewpoint image generation unit 33, the virtual viewpoint setting unit 35, and the reproduction control unit 37 can be provided in, for example, a server on the cloud.
  • FIG. 4 is a flowchart illustrating an example of processing performed by the content server 12 of FIG.
  • step S11 the content server 12 obtains viewpoint images (and depth images) of a plurality of viewpoints captured by the image capturing apparatus 11 in frame units.
  • the content server 12 supplies viewpoint images of a plurality of viewpoints to the free viewpoint data generation unit 21, and the processing proceeds from step S11 to step S12.
  • the viewpoint images of a plurality of viewpoints captured by the image capturing device 11 can be transmitted from the reproducing/editing device 13 to the content server 12 via the reproducing/editing device 13.
  • step S12 the free viewpoint data generation unit 21 generates free viewpoint data in frame units using viewpoint images of a plurality of viewpoints and supplies the free viewpoint data to the strobe model generation unit 22 and the storage unit 23.
  • the storage unit 23 stores the moving image content (moving image content of free viewpoint data) configured by the free viewpoint data in frame units from the free viewpoint data generating unit 21. Then, the process proceeds from step S12 to step S13.
  • step S13 the strobe model generation unit 22 uses the free viewpoint data from the free viewpoint data generation unit 21 to generate a strobe model.
  • the strobe model generation unit 22 sets a strobe section which is a section of a frame for which a strobe model is to be generated. For example, the entire section of the moving image content of the free viewpoint data, the section from the scene change to immediately before the next scene change, the section designated by the reproduction/editing device 13 according to the user's operation, and the like are set as the strobe section. ..
  • the strobe model generation unit 22 sets the target object for arranging the 3D model in the strobe model from the objects shown in the viewpoint image. For example, all the objects appearing in the frame of the strobe section, the objects designated by the reproduction editing device 13 according to the user's operation, and the like are set as the target objects.
  • the strobe model generation unit 22 selects a frame used for generating a strobe model (hereinafter, also referred to as a generation frame) from the frames in the strobe section.
  • a generation frame a frame used for generating a strobe model
  • the strobe model generation unit 22 can select some frames from the frames in the strobe section as generation frames and generate a strobe model using the generation frames (3D model of the object reflected in).
  • the strobe model generation unit 22 can select, as a generation frame, a frame in which the interference degree of the 3D model is equal to or less than a threshold value from the frames in the strobe section, for example. That is, the strobe model generation unit 22 calculates the degree of interference that represents the degree of overlap between the 3D models in a state where the 3D model of the target object reflected in the frame of the strobe section is arranged in the three-dimensional space.
  • the degree of interference is calculated, for example, as 100% when the 3D models of arbitrary two frames completely overlap in a three-dimensional space and 0% when they do not overlap at all.
  • the strobe model generation unit 22 selects a frame whose degree of interference is equal to or less than a predetermined threshold as a generation frame.
  • a frame in which the degree of interference of the 3D model is less than or equal to a threshold is selected as a generation frame, and a strobe model in which the 3D model of the target object reflected in the generation frame is arranged is generated.
  • a frame in the strobe section can be simply selected as a generation frame for every predetermined number of frames. Further, in the generation frame selection, all frames in the strobe section can be selected as generation frames.
  • the strobe model generation unit 22 uses the free viewpoint data from the free viewpoint data generation unit 21 when the 3D model of the target object reflected in a plurality of generation frames selected from the frames of the strobe section is captured. Generates a strobe model placed in the background (3D model) as the 3D space of.
  • the strobe model generation unit 22 stores the strobe model of the moving image content of the free viewpoint data from the free viewpoint data generation unit 21, that is, the strobe model generated using the free viewpoint data from the free viewpoint data generation unit 21, in the storage unit. 23.
  • the storage unit 23 stores the strobe model from the strobe model generation unit 22, and the process proceeds from step S13 to step S14.
  • step S14 the communication unit 24 transmits the moving image content of the free viewpoint data stored in the storage unit 23 and the strobe model to the playback/editing apparatus 13 in response to a request from the playback/editing apparatus 13, The process ends.
  • FIG. 5 is a flowchart illustrating an example of processing performed by the playback/editing device 13 of FIG.
  • step S31 the communication unit 31 requests the moving image content of the free viewpoint data and the strobe model to the content server 12 according to the user's operation, for example, and the process proceeds to step S32.
  • step S32 the communication unit 31 waits for the moving image content of the free viewpoint data and the strobe model to be transmitted from the content server 12, and then receives the moving image content of the free viewpoint data and the strobe model. ..
  • the communication unit 31 supplies the moving image content of the free viewpoint data from the content server 12 and the strobe model to the storage unit 32 for storage, and the process proceeds from step S32 to step S33.
  • step S33 the free viewpoint image generating unit 33 renders the strobe model stored in the storage unit 32 into a free viewpoint image as a 3D strobe image viewed from the virtual viewpoint supplied from the virtual viewpoint setting unit 35. To generate. Then, the free viewpoint image generation unit 33 supplies the 3D strobe image to the display unit 34, and the processing proceeds from step S33 to step S34.
  • step S34 the display unit 34 displays the 3D strobe image from the free viewpoint image generation unit 33, and the process proceeds to step S35.
  • step S35 the reproduction control unit 37 serves as reproduction control information for controlling the reproduction of the moving image content of the free viewpoint data stored in the storage unit 32 according to the user's operation on the strobe model displayed on the display unit 34. Generate a timeline scenario and a shooting scenario.
  • the reproduction control unit 37 supplies the reproduction control information to the storage unit 38 for storage, and the process proceeds from step S35 to step S36.
  • step S36 the reproduction control unit 37 waits, for example, for the user to perform a confirming operation for confirming the reproduction control information stored in the storage unit 38, and according to the timeline scenario as the reproduction control information, The moving image content of the free viewpoint data stored in the storage unit 32 is edited, and the process proceeds to step S37.
  • step S37 the reproduction control unit 37 waits, for example, for the user to perform a reproduction operation requesting reproduction of the moving image content of the edited free viewpoint data, and then displays the reproduction control information stored in the storage unit 38 as the reproduction control information.
  • the reproduction of the moving image content of the edited free viewpoint data stored in the storage unit 32 is controlled according to the shooting scenario, and the process ends.
  • the reproduction control unit 37 determines the virtual viewpoint, that is, the shooting position and the shooting posture of the virtual camera that shoots the free viewpoint data, according to the shooting scenario. It is set and supplied to the free viewpoint image generation unit 33. Further, the reproduction control unit 37 controls the free viewpoint image generation unit 33 to render a free viewpoint image of the edited free viewpoint data stored in the storage unit 32 viewed from a virtual viewpoint set according to the shooting scenario. To generate. Then, the reproduction control unit 37 controls the free viewpoint image generation unit 33 to supply the free viewpoint image from the free viewpoint image generation unit 33 to the display unit 34 and display it.
  • the moving image content of free viewpoint data is edited here according to the timeline scenario as the reproduction control information
  • editing of the moving image content of free viewpoint data is not essential. For example, if the designated section is simply played back repeatedly, it is sufficient to play from the start frame to the end frame of the designated section without editing the moving image content of the free viewpoint data.
  • FIG. 6 is a diagram showing an example of an unnatural 3D strobe image.
  • FIG. 6 shows a 3D strobe image generated from a strobe model generated by using five of the viewpoint image frames in which a ball as an object is rolling from the front side to the back side as a generation frame. An example is shown.
  • the 3D model of the ball reflected in the generated frame of 5 frames is arranged (rendering) so that the 3D model that is later in time has priority. Therefore, the 3D model (of the ball) that is later in time is located so as to hide the 3D model that is closer to the front in time, although it is located in the back. As a result, the 3D strobe image in FIG. 6 is an unnatural image.
  • FIG. 7 is a diagram showing an example of a natural 3D strobe image.
  • FIG. 7 shows a 3D strobe image generated from a strobe model generated by using five of the viewpoint image frames in which a ball as an object is rolling from the front side to the back side as a generation frame. An example is shown.
  • the 3D model of the ball reflected in the generated frame of 5 frames is arranged so that the 3D model on the front side has priority. Therefore, the 3D model on the front side is arranged so as to hide the 3D model on the back side, that is, the 3D model on the front side is preferentially displayed. As a result, the free viewpoint image is a natural image.
  • the free viewpoint image generation unit 33 generates a 3D strobe image in which the 3D model of the object on the front side is preferentially reflected as described above by using the depth (depth) of the 3D model of each object arranged in the strobe model. Yes (shoot with a virtual camera).
  • FIG. 8 is a diagram showing an example of a frame of a viewpoint image in a strobe section.
  • FIG. 8 nine frames from time t1 to t9 are the viewpoint image frames in the strobe section. In the frames from time t1 to t9, the ball as an object is rolling from left to right. In FIG. 8, a frame of a viewpoint image of a certain one viewpoint is illustrated in order to avoid complication of the drawing.
  • FIG. 9 is a diagram showing an example of generation of a strobe model using frames at times t1 to t9 as strobe sections.
  • the frames at times t1, t3, t5, t7, and t9 are selected as the generation frames, and are set as generation frames for viewpoint images of a plurality of viewpoints.
  • a 3D model of the ball as an object reflected in the frames at times t1, t3, t5, t7, and t9 is generated.
  • a strobe model in which the 3D model of the ball reflected in the frames at times t1, t3, t5, t7, and t9 as the generation frame is arranged is generated.
  • FIG. 10 is a diagram showing an example of display of a 3D strobe image generated by photographing a strobe model with a virtual camera.
  • a 3D strobe image it is possible to generate and display a frame in which a 3D model of a ball as an object appears in the frames at times t1, t3, t5, t7, and t9. Further, as the 3D strobe image, from the strobe model of FIG. 9, a frame showing a 3D model of a ball as an object reflected in the frame at time t1, and a frame showing a 3D model of a ball reflected as an object in the frames at times t1 and t3.
  • a frame in which the 3D model of the ball as an object appears in the frames at times t1, t3, and t5 a frame in which the 3D model of the ball as an object in the frames at times t1, t3, t5, and t7 appears
  • the shooting position of the virtual camera that shoots the strobe model is not changed, but the shooting position of the virtual camera can be changed according to the camera work.
  • a strobe model in which a 3D model of a ball as an object reflected in the frames at times t1, t3, t5, t7, and t9 is arranged can be photographed by the virtual camera while changing the photographing position.
  • the viewpoint for viewing the strobe model is changed, and a 3D strobe image with a different camera angle is displayed.
  • FIG. 11 is a diagram illustrating an example of a user operation when searching a predetermined scene (frame) for free viewpoint data.
  • the scene search only needs to be performed in the time (time series) direction.
  • a scene search performed in the time direction is also called a time search.
  • the free viewpoint data exists in a certain frame (time) because the virtual viewpoint when viewing the free viewpoint data can be freely set. Even an object such as a person or an object is not necessarily reflected in the free viewpoint image when the free viewpoint data is viewed from the virtual viewpoint.
  • the free viewpoint image when the video content of the free viewpoint data is the video content of a soccer match, when performing a time search for the scene of the player who has shot the shot, the free viewpoint image may be In FIG. 11, the object as the player who shot at the moment of shooting may be hidden by another player as another object and may not be seen. In this case, the user needs to perform an operation of changing the virtual viewpoint as shown in FIG. 11, and search the free viewpoint image for the position of the virtual viewpoint at which the player who shot the shot can be seen at the moment of the shot. ..
  • the search for the position of the virtual viewpoint is also referred to as a spatial search.
  • the free viewpoint image after the spatial search is not the desired scene, that is, if the scene is slightly deviated from the moment of shooting, the user needs to repeat the time search and the spatial search.
  • the user when searching a desired scene in which a desired object appears in the free viewpoint data, the user can find a desired scene in which the desired object appears by (operation of) temporal search and spatial search. It is necessary to repeat until.
  • the object to be reproduced or edited is free viewpoint data
  • the free viewpoint image in which the free viewpoint data is viewed from the virtual viewpoint is displayed, and the user can search for a desired scene while looking at the free viewpoint image. Then, it takes a lot of time and effort for searching, and the burden on the user becomes heavy.
  • a GUI such as a slide bar for performing a time search and a GUI for performing a space search. Further, in some cases, it may be necessary to display multiple frames side by side to search for a momentary scene.
  • a 3D strobe image is adopted as a UI for work such as searching for a desired scene, which allows a user required to search for a desired scene or to play back or edit free-viewpoint video content. To reduce the work load and reduce the space required for playing and editing free-viewpoint video content.
  • FIG. 12 is a diagram illustrating an example of moving image content of free viewpoint data.
  • FIG. 12 shows an example of a free viewpoint image in which the free viewpoint data is viewed from a predetermined virtual viewpoint, that is, a free viewpoint image (an image obtained by rendering the free viewpoint image obtained by shooting the free viewpoint data with a virtual camera). ..
  • the moving image content of the free viewpoint data in FIG. 12 is composed of 10 frames with time codes t1 to t10 as time information, and is data of a ball moving from left to right as two objects X and Y. including. Furthermore, the moving image content of the free viewpoint data in FIG. 12 includes only one type of background A data as background data.
  • the frame with the time code t#i is also called the frame t#i.
  • FIG. 13 is a diagram showing an example of a strobe model generated using the moving image content of the free viewpoint data of FIG.
  • all 10 frame sections of the moving image content of the free viewpoint data of FIG. 12 are set as strobe sections, and odd-numbered frames t1, t3, t5, t7, t9 of the strobe sections are generated frames. Is selected as. Then, all of the two objects X and Y appearing in the generated frame are set as the target objects, and the 3D models of the target objects X and Y of the frames t1, t3, t5, t7, and t9 are set in the three-dimensional space as the background. The arranged strobe model is generated.
  • the free viewpoint image of the strobe model viewed from the virtual viewpoint is a 3D strobe image, and the virtual viewpoint when viewing the strobe model can be changed according to the user's operation.
  • the 3D model of the objects X and Y of each generated frame includes the information that a general 3D model has such as position information in a three-dimensional space, It has a time code t#i as time information given in the moving image content of the original free viewpoint data.
  • the balloon in which the time code t#i is described and the balloon in which the objects X and Y are described are balloons for making the diagram easy to understand, and are not elements that configure the strobe model. The same applies to the balloons in the following figures.
  • FIG. 14 is a diagram illustrating a first example of a user operation performed on a 3D strobe image using the 3D strobe image obtained by viewing the strobe model of FIG. 13 from a virtual viewpoint as a UI.
  • the user uses the 3D strobe image displayed on the display unit 34 as a UI, and performs various operations on the 3D strobe image serving as the UI to perform the operation related to the reproduction and editing of the free viewpoint data moving image content (hereinafter , And playback editing work).
  • the user can easily search for a desired scene (desired object) by looking at the 3D strobe image. Furthermore, the user selects a desired object (including a frame of free viewpoint data in which the desired object is reflected) displayed in the 3D strobe image, and assigns a desired process to the desired object (frame in which the desired object is reflected). Thus, the reproduction/editing work can be easily performed.
  • FIG. 14 shows that when the frame in which a desired object (scene) is reflected is, for example, the frame t5 in which the object X is reflected, the frame t5 is set as the reproduction start position (reproduction start frame) and the moving image content of the free viewpoint data is displayed. The reproduction edit work at the time of reproduction is shown.
  • the user changes the virtual viewpoint when looking at the strobe model so that the object X appearing in the frame t5 appears in the 3D strobe image, if necessary. Then, the user selects, for example, by pressing the object X/Y reflected in the frame t5 as the desired object in the 3D strobe image (operation o11).
  • the object X/Y means the object X or Y.
  • the object X/Y reflected in the frame t#i will be referred to as the object X/Y-t#i as appropriate.
  • selection of the object X/Y displayed in the 3D strobe image can be performed by pressing the object X/Y, tapping, double-clicking, or other operations.
  • the reproduction control unit 37 represents a process of allocating to the display unit 34, via the free viewpoint image generation unit 33, the object selected by pressing and the frame in which the object appears.
  • the processing menu of FIG. 14 has buttons representing processing start, end, delete, and jump.
  • the process start is a process for starting the reproduction of the frame
  • the process end is a process for ending the reproduction of the frame.
  • the process delete is a process for deleting a frame
  • the process jump is a process for jumping the reproduction of a frame.
  • the user can assign the processing corresponding to that button to the frame in which the object X/Y selected by pressing is displayed.
  • the reproduction control unit 37 causes the frame t5 to assign the process start to the timeline scenario ( TS1) is generated.
  • Timeline scenario (TS1) indicates that playback of video content of free viewpoint data starts from frame t5.
  • the reproduction control unit 37 starts the reproduction from the frame t5 when reproducing the moving image content of the free viewpoint data according to the timeline scenario (TS1). Alternatively, the reproduction control unit 37 sets the moving image content of the free viewpoint data of FIG. 12 having the frames t1 to t10 as the first frame and the last frame as the frame t10 according to the timeline scenario (TS1). The video content of the free-viewpoint data to be a frame is edited, and the video content of the free-viewpoint data after the editing is reproduced.
  • the reproduction control unit 37 generates a timeline scenario as reproduction control information for starting reproduction from the frame in which the object selected in the 3D strobe image appears, and the free viewpoint is generated according to the reproduction control information. Data reproduction can be controlled.
  • the 3D strobe image can be prepared only for starting playback, such as chapter playback in the DVD menu. In this case, the reproduction can be started from the frame t#i by simply selecting the object at the specific time t#i in the 3D strobe image.
  • FIG. 15 is a diagram illustrating a second example of a user operation performed on a 3D strobe image of the strobe model of FIG. 13 viewed from a virtual viewpoint as a UI.
  • a frame t1 in which the object X appears is set as a reproduction start position, and the moving image content of the free viewpoint data is reproduced up to the frame t3, then jumps to the frame t7, and is reproduced up to the frame t9.
  • the user changes the virtual viewpoint when looking at the strobe model so that the object X reflected in the frames t1, t3, t5, t7, and t9 is reflected in the 3D strobe image, if necessary. Then, the user selects, for example, by pressing the object X/Y-t1 in the 3D strobe image (operation o21). As described with reference to FIG. 14, since the processing menu and the OK button are displayed in response to the pressing of the object X/Y-t1, the user selects the button representing the processing start of the processing menu, and in the frame t1, Assign process start.
  • the user selects, for example, by pressing the object X/Y-t3 in the 3D strobe image (operation o22). Since the processing menu and the OK button are displayed in response to the pressing of the object X/Y-t3, the user selects the button (FIG. 14) representing the processing jump in the processing menu and assigns the processing jump to the frame t3. .. The user selects the object X/Y-t7 by dragging so as to trace from the object X/Y-t3 to the object X/Y-t7 after selecting the button representing the process jump. As a result, the process jump for jumping the reproduction to the frame t7 is assigned to the frame t3.
  • the user selects, for example, by pressing the object X/Y-t9 in the 3D strobe image (operation o23). Since the processing menu and the OK button are displayed in response to the pressing of the object X/Y-t9, the user selects the button (FIG. 14) representing the processing end of the processing menu and assigns the processing end to the frame t9. ..
  • the reproduction control unit 37 generates a timeline scenario (TS2) indicating that processing is assigned to a frame as follows.
  • the timeline scenario (TS2) relates to the playback (play) of the moving image content of free viewpoint data, starting playback from frame t1, jumping to frame t7 after playing frame t3, and playing at frame t9. Indicates to end.
  • the reproduction control unit 37 When reproducing the moving image content of the free viewpoint data according to the timeline scenario (TS2), the reproduction control unit 37 starts the reproduction from the frame t1, and after the reproduction of the frame t3, changes the reproduction (position) to the frame t7. Jump to continue playback. Then, the reproduction control unit 37 ends the reproduction at the frame t9.
  • the playback control unit 37 edits the moving image content of the free viewpoint data of FIG. 12 into the moving image content of the free viewpoint data of frames t1 to t3 and frames t7 to t9 according to the timeline scenario (TS2), and Play the video content of the free viewpoint data after editing.
  • the reproduction control unit 37 starts the reproduction from the frame in which the object selected in the 3D strobe image appears, and ends the reproduction in the frame in which another object selected in the 3D strobe image appears.
  • a timeline scenario as information can be generated.
  • the reproduction control unit 37 generates a timeline scenario as reproduction control information for jumping reproduction from a frame in which an object selected in the 3D strobe image appears to a frame in which another object selected in the 3D strobe image appears. can do.
  • FIG. 16 is a diagram illustrating a third example of user operations performed on the 3D strobe image using the 3D strobe image of the strobe model of FIG. 13 viewed from a virtual viewpoint as a UI.
  • FIG. 16 shows a reproduction/editing operation in the case of cutting out from frame t5 to frame t10 in which the object X is reflected, for example.
  • the user changes the virtual viewpoint when looking at the strobe model so that the object X reflected in the frames t1, t3, t5, t7, and t9 is reflected in the 3D strobe image, if necessary. Then, the user, in the 3D strobe image, for example, by pressing the object X/Y-t1, further pressing the object X/Y-t3, the object X/Y-t1 and the object X/Y-t3 Select (operation o31). As described in FIG. 14, the processing menu and the OK button are displayed in response to the pressing of the object X/Y-t1 or the object X/Y-t3, so that the user can press the object X/Y-t3 after pressing the object X/Y-t3. A button indicating the process delete is selected from the displayed process menu, and the process delete is assigned to the frames t1 to t3.
  • the reproduction control unit 37 generates a timeline scenario (TS3) indicating that processing is assigned to the frame as follows.
  • the timeline scenario (TS3) is related to editing (edit) of moving image content of free viewpoint data, starting at frame t1 and ending at frame t4 (deleting frames and playing the remaining frames). It means that.
  • t4 is the end frame where the frame is deleted.
  • the end frame for deleting the frame it is possible to adopt the frame of the object which the user presses the second time among the objects shown in the 3D strobe image.
  • the user in the 3D strobe image, for example, when pressing the object X / Y-t1, further when pressing the object X / Y-t3, with the frame t1 as the start point and the frame t3 as the end point, the frame A timeline scenario that represents the deletion of the is generated.
  • the reproduction control unit 37 reproduces only the frames t5 to t10 that are not the target of deletion when reproducing the moving image content of the free viewpoint data according to the timeline scenario (TS3).
  • the reproduction control unit 37 edits the moving image content of the free viewpoint data of FIG. 12 according to the timeline scenario (TS3), and reproduces the edited moving image content of the free viewpoint data.
  • the reproduction control unit 37 sets the timeline scenario as reproduction control information for deleting from the frame in which the object selected in the 3D strobe image appears to the frame in which another object selected in the 3D strobe image appears. Can be generated. Further, the reproduction of the free viewpoint data can be controlled according to the reproduction control information.
  • FIG. 17 is a diagram illustrating a fourth example of user operations performed on the 3D strobe image using the 3D strobe image of the strobe model of FIG. 13 viewed from a virtual viewpoint as a UI.
  • FIG. 17 shows the reproduction/editing work when setting the shooting position and shooting posture (virtual viewpoint) of the virtual camera.
  • the moving image content of the free viewpoint data in FIG. 12 having frames t1 to t10 is set to have the frame t5 as the first frame and the frame t10 as the last frame in accordance with the timeline scenario (TS1).
  • the free-viewpoint image from the virtual viewpoint of the strobe model created by editing frames t5, t7, and t9 of the free-viewpoint video content after editing the edited free-viewpoint video content Has become.
  • the 3D strobe image corresponding to the strobe model generated using the moving image content of the edited free viewpoint data edited according to the timeline scenario is displayed as the UI on the display unit. 34 can be displayed.
  • Generation of a strobe model using moving image content of edited free viewpoint data edited according to a timeline scenario can be performed by the playback/editing apparatus 13 or the playback/editing apparatus 13 requests the content server 12 to generate the strobe model. Then, the content server 12 can also perform the processing.
  • the user changes the virtual viewpoint when looking at the strobe model so that the necessary object is reflected in the 3D strobe image, if necessary. Then, the user selects an object appearing in a frame (time) in which the state (shooting position and shooting posture) of the virtual camera is to be set in the 3D strobe image (operation o41). Furthermore, the user inputs the position and orientation of the virtual camera that captures the free viewpoint data of the frame after the frame in which the object selected immediately before appears in the 3D strobe image, as the capturing position and the capturing orientation (operations o42 and o43). .. The position of the virtual camera can be input, for example, by the user designating the position on the 3D strobe image.
  • the posture of the virtual camera can be input, for example, by the user designating an object on the 3D strobe image.
  • the posture of the virtual camera is the photographing posture in which the photographing direction is the direction from the position of the virtual camera toward the object designated by the user.
  • the OK button When the position and orientation of the virtual camera is entered, the OK button will be displayed.
  • the playback control unit 37 inputs the time code as the time information of the frame in which the object selected by the user appears in the 3D strobe image and the user input the selected time code.
  • a shooting scenario in which a set of shooting position and shooting posture is registered is generated.
  • Selection of objects and input of shooting position and shooting posture can be repeated.
  • the user inputs the time code of the frame in which the object selected by the user appears for the number of times of the repetition.
  • a shooting scenario in which a set of shooting position and shooting posture is registered is generated.
  • FIG. 18 is a diagram showing an example of a shooting scenario.
  • a set of the time code of the frame in which the object selected by the user in the 3D strobe image appears in the shooting scenario and the shooting position and the shooting posture input by the user after the selection of the object is registered. To be done.
  • a set of a time code t5, a position (x1, y1, z1) indicating a shooting position, and an object X indicating a shooting direction, a time code t7, and a position (x1, y1,z1) and a set of an object X representing the shooting direction, and a set of a time code t9, a position (x2,y2,z12) representing the shooting position, and an object Y representing the shooting direction are registered.
  • the set of the time code t5, the position (x1, y1, z1) indicating the shooting position, and the object X indicating the shooting direction is the position (x1, y1, z1) as the shooting position for the time code t5 and later.
  • the virtual camera captures the free viewpoint data from the image capturing position (x1, y1, z1) as the image capturing orientation that is the orientation (direction) toward the object X.
  • the position (x1, y1, z1) indicating the shooting position, and the object X indicating the shooting direction the position (x1, y1, z1) is set as the shooting position for the time code t7 and later.
  • the virtual camera captures the free viewpoint data from the shooting position (x1, y1, z1) with the attitude toward the object X as the shooting attitude.
  • the set of the time code t9 and the position (x2, y2, z2) representing the shooting position, and the object Y representing the shooting direction is the position (x2, y2, z2) as the shooting position for the time code t9 and later.
  • the virtual camera captures the free viewpoint data from the image capturing position (x2, y2, z2) as the image capturing position.
  • the shooting positions (x1, y1, z1) are set for the frames t5 to t8. From, a free viewpoint image obtained by shooting the free viewpoint data is generated by the virtual camera in the shooting attitude toward the object X. Further, in the free-viewpoint image generation unit 33, for the frames t9 and t10, a free-viewpoint image obtained by shooting the free-viewpoint data is generated by the virtual camera in the shooting attitude toward the object Y from the shooting position (x2, y2, z2). To be done.
  • FIG. 19 is a diagram illustrating an example of the process jump.
  • FIG. 19 is a diagram showing an example of a process jump different from that in FIG.
  • FIG. 15 the reproduction/editing work in the case where the reproduction jumps from the frame t3 of the free viewpoint data of the same moving image content to the frame t7 by allocating the process jump to the frame t3 of the free viewpoint data is explained. Can be jumped from a frame of free viewpoint data of a certain moving image content A to a frame of free viewpoint data of a moving image content B different from the moving image content A.
  • the user operates the operation unit 36 to display the 3D strobe image of the moving image content A (3D strobe image generated from the free viewpoint data of the moving image content A) and the 3D strobe image of the moving image content B. It is displayed on the display unit 34.
  • the user selects, for example, by pressing the object X/Y-t5 in the 3D strobe image of the moving image content A.
  • the processing menu and the OK button are displayed according to the pressing of the object X/Y-t5. Therefore, the user selects the button representing the processing jump of the processing menu to The process jump is assigned to the frame t5 of the free viewpoint data.
  • the user drags so as to trace from the object X/Y-t5 to the object Z-t5' shown in the 3D strobe image of the video content B, and selects the object Z-t5'. To do.
  • the process jump for jumping the reproduction to the frame t5' of the free viewpoint data of the moving image content B is assigned to the frame t5 of the free viewpoint data of the moving image content A.
  • the OK button is pressed, a timeline scenario in which it is registered to jump from the frame t5 of the free viewpoint data of the moving image content A to the frame t5' of the free viewpoint data of the moving image content B is generated.
  • reproduction is performed according to such a timeline scenario, when reproduction of free viewpoint data of the video content A is performed up to frame t3, reproduction (position) jumps to frame t5′ of free viewpoint data of video content B. To be done.
  • the reproduction control unit 37 reproduces from a frame in which an object selected in a 3D strobe image of a predetermined moving image content appears to a frame in which another object selected in a 3D strobe image of another moving image content appears. It is possible to generate a timeline scenario as reproduction control information for jumping. Furthermore, it is possible to control the reproduction of the free viewpoint data (including combining a plurality of moving image contents) according to the reproduction control information.
  • playback/editing work for example, playback/editing work to which processes other than the processes start, end, delete, and jump are assigned.
  • FIG. 20 is a diagram illustrating an example of a reproduction/editing work to which a processing link is assigned.
  • processing link is a process of associating various data with an object (frame in which it appears).
  • Audio data, CG material, subtitles, etc. can be adopted as the data related to the object.
  • the processing link can be assigned to the object by, for example, dragging an icon representing data associated with the object onto the object to which the processing link is assigned in the 3D strobe image. For example, if you drag an icon that represents data associated with an object onto the object to which you want to assign a process link, an OK button is displayed. When the OK button is pressed, a timeline scenario in which information about the set of the object to which the processing link is assigned and the data related to the object is registered is generated according to the drag performed so far. ..
  • the reproduction control unit 37 can generate a timeline scenario as reproduction control information that associates predetermined data with the object selected in the 3D strobe image. Further, the reproduction of the free viewpoint data can be controlled according to the reproduction control information.
  • FIG. 21 is a diagram illustrating an example of a reproduction/editing work to which effect processing is assigned.
  • An object can be assigned an effect process that is applied to the 3D model of that object.
  • the reproduction control unit 37 causes the free viewpoint image to be displayed.
  • the effect menu and the OK button are displayed on the display unit 34 via the generation unit 33.
  • the effect menu has buttons representing effect processing such as mosaic, ⁇ blend, and monochrome.
  • Mosaic is an effect process for applying a mosaic to an object
  • ⁇ -blending is an effect process for performing an ⁇ -blending on the object.
  • Monochrome is an effect process that makes the texture of an object black and white.
  • the user selects, for example, by pressing a desired object in the 3D strobe image, and further selects a button representing a desired effect process to be applied to the desired effect in the effect menu. After that, when the user presses the OK button, the timeline scenario in which the application of the desired effect processing to the desired object is registered is generated.
  • the desired effect processing is applied to the free viewpoint data (3D model) of the desired object, and the freedom of the desired object after the desired effect processing is applied.
  • a free viewpoint image is generated using the viewpoint data.
  • the reproduction control unit 37 generates the timeline scenario as the reproduction control information for applying the effect processing to the object selected in the 3D strobe image, and reproduces the free viewpoint data according to the reproduction control information. Can be controlled.
  • the playback/editing device 13 generates playback control information in response to an operation on a 3D strobe image, and controls playback of moving image content of free viewpoint data according to the playback control information.
  • the user can perform various playback/editing operations by manipulating the 3D strobe image.
  • the series of processes described above can be performed by hardware or software.
  • a program forming the software is installed in a general-purpose computer or the like.
  • FIG. 22 is a block diagram showing a configuration example of an embodiment of a computer in which a program for executing the series of processes described above is installed.
  • the program can be recorded in advance in a hard disk 905 or a ROM 903 as a recording medium built in the computer.
  • the program can be stored (recorded) in the removable recording medium 911 driven by the drive 909.
  • Such removable recording medium 911 can be provided as so-called package software.
  • examples of the removable recording medium 911 include a flexible disk, a CD-ROM (Compact Disc Read Only Memory), an MO (Magneto Optical) disc, a DVD (Digital Versatile Disc), a magnetic disc, and a semiconductor memory.
  • the program can be installed in the computer from the removable recording medium 911 as described above, or downloaded to the computer via a communication network or a broadcasting network and installed in the built-in hard disk 905. That is, for example, the program is wirelessly transferred from a download site to a computer via an artificial satellite for digital satellite broadcasting, or wired to a computer via a network such as a LAN (Local Area Network) or the Internet. be able to.
  • a network such as a LAN (Local Area Network) or the Internet.
  • the computer has a built-in CPU (Central Processing Unit) 902, and an input/output interface 910 is connected to the CPU 902 via a bus 901.
  • CPU Central Processing Unit
  • the CPU 902 executes the program stored in the ROM (Read Only Memory) 903 according to the instruction input by the user operating the input unit 907 or the like via the input/output interface 910. .. Alternatively, the CPU 902 loads a program stored in the hard disk 905 into a RAM (Random Access Memory) 904 and executes it.
  • ROM Read Only Memory
  • RAM Random Access Memory
  • the CPU 902 performs the processing according to the above-described flowchart or the processing performed by the configuration of the block diagram described above. Then, the CPU 902 outputs the processing result, for example, from the output unit 906 via the input/output interface 910 or transmitted from the communication unit 908, and further recorded on the hard disk 905, as necessary.
  • the input unit 907 is composed of a keyboard, a mouse, a microphone, and the like.
  • the output unit 906 includes an LCD (Liquid Crystal Display), a speaker, and the like.
  • the processing performed by the computer according to the program does not necessarily have to be performed in time series in the order described as the flowchart. That is, the processing performed by the computer according to the program also includes processing that is executed in parallel or individually (for example, parallel processing or object processing).
  • the program may be processed by one computer (processor) or may be processed by a plurality of computers in a distributed manner. Further, the program may be transferred to a remote computer and executed.
  • the system means a set of a plurality of constituent elements (devices, modules (parts), etc.), and it does not matter whether or not all constituent elements are in the same housing. Therefore, a plurality of devices housed in separate housings and connected via a network, and one device housing a plurality of modules in one housing are all systems. ..
  • the present technology can have a configuration of cloud computing in which one function is shared by a plurality of devices via a network and is jointly processed.
  • each step described in the above-mentioned flowchart can be executed by one device or shared by a plurality of devices.
  • one step includes a plurality of processes
  • the plurality of processes included in the one step can be executed by one device or shared by a plurality of devices.
  • a 3D model of an object at a plurality of times generated from a plurality of viewpoint images captured from a plurality of viewpoints is a strobe model arranged in a three-dimensional space.
  • An image processing apparatus including a reproduction control unit that generates reproduction control information that controls reproduction of free viewpoint data generated from the viewpoint image.
  • the reproduction control unit further controls reproduction of the free viewpoint data according to the reproduction control information.
  • the reproduction control unit generates the reproduction control information for starting reproduction from a frame in which an object selected in the 3D strobe image appears.
  • the reproduction control unit starts the reproduction from a frame in which the object selected in the 3D strobe image appears, and ends the reproduction in a frame in which another object selected in the 3D strobe image appears.
  • the image processing device according to any one of ⁇ 1> to ⁇ 3>, which is generated.
  • the reproduction control unit generates the reproduction control information that deletes from a frame in which an object selected in the 3D strobe image appears to a frame in which another object selected in the 3D strobe image appears ⁇ 1> to ⁇ 4>
  • the image processing device according to any one of 4>.
  • the reproduction control unit generates the reproduction control information for jumping reproduction from a frame showing an object selected in the 3D strobe image to a frame showing another object selected in the 3D strobe image ⁇ 1>
  • the image processing apparatus according to any one of ⁇ 1> to ⁇ 5>.
  • the reproduction control unit jumps reproduction from a frame in which an object selected in the 3D strobe image of a predetermined moving image content appears to a frame in which another object selected in the 3D strobe image of another moving image content appears.
  • the image processing device according to ⁇ 6>, which generates the reproduction control information.
  • a 3D model of an object at a plurality of times generated from a plurality of viewpoint images captured from a plurality of viewpoints is a strobe model arranged in a three-dimensional space.
  • An image processing method including generating reproduction control information for controlling reproduction of free viewpoint data generated from the viewpoint image.
  • a 3D model of an object at a plurality of times generated from a plurality of viewpoint images captured from a plurality of viewpoints is a strobe model arranged in a three-dimensional space.
  • 11 shooting device 12 content server, 13 playback editing device, 21 free viewpoint data generation unit, 22 strobe model generation unit, 23 storage unit, 24, 31 communication unit, 32 storage unit, 33 free viewpoint image generation unit, 34 display unit , 35 virtual viewpoint setting part, 36 operating part, 37 playback control part, 38 storage part, 901 bus, 902 CPU, 903 ROM, 904 RAM, 905 hard disk, 906 output part, 907 input part, 908 communication part, 909 drive, 910 input/output interface, 911 removable recording medium

Abstract

本技術は、自由視点データの再生編集作業を、容易に行うことができるようにする画像処理装置、画像処理方法、及び、プログラムに関する。 複数の視点から撮影された複数の視点画像から生成される複数の時刻のオブジェクトの3Dモデルが3次元空間に配置されたストロボモデルを仮想視点から見た3Dストロボ画像に対する操作に応じて、複数の視点画像から生成される自由視点データの再生を制御する再生制御情報が生成される。本技術は、例えば、自由視点データの再生や編集等に適用することができる。

Description

画像処理装置、画像処理方法、及び、プログラム
 本技術は、画像処理装置、画像処理方法、及び、プログラムに関し、特に、例えば、自由視点データの再生編集作業を、容易に行うことができるようにする画像処理装置、画像処理方法、及び、プログラムに関する。
 複数の時刻に撮影された被写体(像)が映るストロボ画像を生成する方法が提案されている(例えば、特許文献1を参照)。ストロボ画像には、複数の時刻の被写体が映るので、被写体の動きや軌跡を、容易に把握することができる。
特開2007-259477号公報
 近年、仮想視点から3次元空間を見たときの見え方が再現された自由視点画像を生成することができる自由視点データついて、再生や編集に関する再生編集作業を、容易に行うことの要請が高まっている。
 本技術は、このような状況に鑑みてなされたものであり、自由視点データの再生編集作業を、容易に行うことができるようにするものである。
 本技術の画像処理装置、又は、プログラムは、複数の視点から撮影された複数の視点画像から生成される複数の時刻のオブジェクトの3Dモデルが3次元空間に配置されたストロボモデルを仮想視点から見た3Dストロボ画像に対する操作に応じて、前記複数の視点画像から生成される自由視点データの再生を制御する再生制御情報を生成する再生制御部を備える画像処理装置、又は、そのような画像処理装置としてコンピュータを機能させるためのプログラムである。
 本技術の画像処理方法は、複数の視点から撮影された複数の視点画像から生成される複数の時刻のオブジェクトの3Dモデルが3次元空間に配置されたストロボモデルを仮想視点から見た3Dストロボ画像に対する操作に応じて、前記複数の視点画像から生成される自由視点データの再生を制御する再生制御情報を生成することを含む画像処理方法である。
 本技術の画像処理装置、画像処理方法、及び、プログラムにおいては、複数の視点から撮影された複数の視点画像から生成される複数の時刻のオブジェクトの3Dモデルが3次元空間に配置されたストロボモデルを仮想視点から見た3Dストロボ画像に対する操作に応じて、前記複数の視点画像から生成される自由視点データの再生を制御する再生制御情報が生成される。
 なお、画像処理装置や表示装置は、独立した装置であっても良いし、1つの装置を構成している内部ブロックであっても良い。
 また、プログラムは、伝送媒体を介して伝送することにより、又は、記録媒体に記録して、提供することができる。
本技術を適用した画像処理システムの一実施の形態の構成例を示すブロック図である。 コンテンツサーバ12の構成例を示すブロック図である。 再生編集装置13の構成例を示すブロック図である。 コンテンツサーバ12が行う処理の例を説明するフローチャートである。 再生編集装置13が行う処理の例を説明するフローチャートである。 不自然な3Dストロボ画像の例を示す図である。 自然な3Dストロボ画像の例を示す図である。 ストロボ区間の視点画像のフレームの例を示す図である。 ストロボ区間としての時刻t1ないしt9のフレームを用いたストロボモデルの生成の例を示す図である。 仮想カメラによるストロボモデルの撮影により生成される3Dストロボ画像の表示の例を示す図である。 自由視点データについて、所定のシーン(フレーム)をサーチするときのユーザの操作の例を説明する図である。 自由視点データの動画コンテンツの例を説明する図である。 自由視点データの動画コンテンツを用いて生成されるストロボモデルの例を示す図である。 3Dストロボ画像に対して行われるユーザの操作の第1の例を説明する図である。 3Dストロボ画像に対して行われるユーザの操作の第2の例を説明する図である。 3Dストロボ画像に対して行われるユーザの操作の第3の例を説明する図である。 3Dストロボ画像に対して行われるユーザの操作の第4の例を説明する図である。 撮影シナリオの例を示す図である。 処理jumpの例を説明する図である。 処理linkを割り当てる再生編集作業の例を説明する図である。 エフェクト処理を割り当てる再生編集作業の例を説明する図である。 本技術を適用したコンピュータの一実施の形態の構成例を示すブロック図である。
 <本技術を適用した画像処理システムの一実施の形態>
 図1は、本技術を適用した画像処理システムの一実施の形態の構成例を示すブロック図である。
 図1の画像処理システムでは、実写の画像から生成された自由視点データを用いて、所定の視点から3次元空間の被写体であるオブジェクトを見たときに見える画像、すなわち、所定の視点からオブジェクトを見たときの視線方向に垂直な投影面に、自由視点データにより表現される3次元空間内のビューイングボリュームを投影して得られる2D画像が生成されて表示される。この2D画像は、視点を自由に決めて生成することができるので、自由視点画像と呼ぶことができる。自由視点画像の生成にあたって必要となる視点(視線方向を含む)は、ユーザの実際の視点に関係なく仮想的に設定することができるので、かかる視点を、仮想視点ともいう。
 自由視点データの動画コンテンツは、2D画像の動画コンテンツと同様に、時間方向の自由度を有する他に、仮想視点、すなわち、自由視点データ(によって表現される3次元空間)を撮影する仮想カメラの撮影位置及び撮影姿勢(撮影方向)の自由度を有する。仮想カメラの撮影位置は、例えば、ワールド座標系としてのxyz座標系の座標等で表すことができ、仮想カメラの撮影姿勢は、ワールド座標系の各軸回りの回転角等で表すことができる。仮想カメラの撮影位置については、x軸、y軸、及び、z軸の方向への移動が可能であり、仮想カメラの撮影姿勢については、x軸、y軸、及び、z軸回りの回転が可能であるから、仮想カメラの撮影位置及び撮影姿勢には、6DoF(Degree of Freedom)の自由度がある。したがって、自由視点データについては、時間方向の1の自由度と、仮想カメラの撮影位置及び撮影姿勢(仮想視点)の6の自由度との、合計で7の自由度がある。ここで、仮想視点に対する投影面に、自由視点データ(により表現される3次元空間内のビューイングボリューム)を投影することにより生成される自由視点画像としては、あたかも、仮想視点から、仮想的なカメラで、自由視点データの撮影を行ったかのような2D画像を得ることができる。したがって、仮想視点に対する投影面に、自由視点データを投影することは、仮想視点から、仮想的なカメラで、自由視点データを撮影することに相当する、ということができる。すなわち、仮想視点に対する投影面に、自由視点データを投影して、自由視点画像を生成することは、仮想視点に配置された仮想的なカメラで、自由視点データを撮影することに例えることができる。そこで、本実施の形態では、自由視点画像の生成を、仮想的なカメラでの自由視点データの撮影に例えて、適宜、説明を行う。また、自由視点データを撮影する仮想的なカメラを、仮想カメラともいう。
 図1の画像処理システムは、撮影装置11、コンテンツサーバ12、及び、再生編集装置13を有する。
 撮影装置11は、少なくとも複数のカメラで構成され、複数の視点から、オブジェクトの撮影を行う。例えば、撮影装置11を構成する複数のカメラは、オブジェクトを囲むように配置され、各カメラは、そのカメラが配置された位置としての視点から、オブジェクトを撮影する。各カメラにより、そのカメラの位置から撮影された2D(Dimensional)画像、すなわち、複数の視点から撮影された2D画像である複数の視点の視点画像(の動画)は、フレーム単位で、撮影装置11からコンテンツサーバ12に供給される。
 ここで、撮影装置11には、複数のカメラの他、複数の測距装置を設けることができる。測距装置は、カメラと同一の位置(視点)に配置することもできるし、カメラと異なる位置に配置することもできる。測距装置は、その測距装置が配置された位置(視点)から、オブジェクトまでの距離を測定し、その距離に関する情報であるデプスを画素値とする2D画像であるデプス画像を生成する。デプス画像は、撮影装置11からコンテンツサーバ12に供給される。
 なお、撮影装置11に、測距装置が設けられていない場合には、複数の視点の視点画像のうちの2視点の視点画像を用いて、三角測量の原理により、オブジェクトまでの距離を測定し、デプス画像を生成することができる。
 コンテンツサーバ12は、例えば、webサーバやクラウド上のサーバである。コンテンツサーバ12は、例えば、撮影装置11から供給される複数の視点の視点画像等を用いて、自由視点データの動画コンテンツを生成する。さらに、コンテンツサーバ12は、自由視点データを用いて、撮影装置11で撮影された3次元空間(の3Dモデル)に、視点画像の複数のフレーム(時刻)の同一のオブジェクト(被写体)の3Dモデルが配置されたストロボモデルを生成する。コンテンツサーバ12は、再生編集装置13からの要求に応じて、自由視点データの動画コンテンツや、ストロボモデルを、再生編集装置13に送信する。
 再生編集装置13は、例えば、PC(Personal Computer)や、TV(テレビジョン受像機)、スマートフォン等の携帯端末等のクライアントである。再生編集装置13は、コンテンツサーバ12に対して、自由視点データの動画コンテンツや、ストロボモデルを要求して取得する。また、再生編集装置13は、ストロボモデルを仮想視点から見た3Dストロボ画像に対するユーザの操作に応じて、自由視点データの動画コンテンツの再生を制御する再生制御情報を生成する。そして、再生編集装置13は、再生制御情報に応じて、自由視点データの動画コンテンツの再生や編集を行う。
 なお、コンテンツサーバ12及び再生編集装置13は、図1に示したように、それぞれを別個の装置として構成することもできるし、全体を1個の装置(例えば、PC(Personal Computer)等)として構成することもできる。
<コンテンツサーバ12の構成例>
 図2は、図1のコンテンツサーバ12の構成例を示すブロック図である。
 コンテンツサーバ12は、自由視点データ生成部21、ストロボモデル生成部22、記憶部23、及び、通信部24を有する。
 自由視点データ生成部21は、撮影装置11からの複数の視点の視点画像とデプス画像とから、自由視点データを、フレーム単位で生成することにより、自由視点データの動画コンテンツを生成する。
 ここでは、自由視点データとは、広く、自由視点画像を生成することができる3D画像のデータ(3Dデータ)を意味する。自由視点データとしては、例えば、撮影装置11からの複数の視点の視点画像とデプス画像とのセットを、そのまま採用することができる。また、自由視点データとしては、その他、例えば、3次元の形状の情報である3D形状モデルと色の情報とを有する3Dデータや、複数の視点の2D画像とデプス画像とのセットを採用することができる。
 自由視点データとして、撮影装置11からの複数の視点の視点画像とデプス画像とのセットを採用する場合、自由視点データ生成部21は、撮影装置11からの複数の視点の視点画像とデプス画像とのセットを、そのまま、自由視点データとする。
 自由視点データとして、3D形状モデルと色の情報とを有する3Dデータを採用する場合、自由視点データ生成部21は、撮影装置11からの複数の視点の視点画像を用いて、Visual Hull等によりモデリングを行って、視点画像に映るオブジェクトの3D形状モデル等を生成し、テクスチャとなる複数の視点の視点画像とともに、自由視点データとする。なお、撮影装置11からのデプス画像の視点が、撮影装置11からの視点画像の視点と異なる場合、自由視点データ生成部21は、撮影装置11からの複数の視点のデプス画像を用いて、撮影装置11からの視点画像の視点のデプス画像を生成することができる。
 自由視点データとして、複数の視点の2D画像とデプス画像とのセットを採用する場合、自由視点データ生成部21は、例えば、上述したように、3D形状モデルと色の情報とを有する3Dデータを生成し、その3Dデータを、複数の視点(撮影装置11を構成するカメラと同一の視点でも良いし、異なる視点でも良い)から見た2D画像とデプス画像とのセットを、自由視点データとして生成する。
 自由視点データ生成部21は、以上のようにして、自由視点データの動画コンテンツを生成し、ストロボモデル生成部22、及び、記憶部23に供給する。
 なお、自由視点データとしては、3D形状モデルを有する3Dデータよりも、複数の視点の2D画像とデプス画像とのセットを採用することにより、自由視点データのデータ量を少なくすることができる。自由視点データとして、複数の視点の2D画像とデプス画像とのセットを生成して伝送する技術については、本出願人が先に提案した国際公開2017/082076号に記載されている。自由視点データとしての複数の視点の2D画像とデプス画像とのセットは、例えば、MVCD(Multiview and depth video coding)や、AVC(Advanced Video Coding)、HEVC(High Efficiency Video Coding)等の2D画像を対象とする符号化方式により符号化することができる。
 ここで、自由視点データ(の表現形式)には、View Independentと呼ばれる3Dモデル(以下、VIモデルともいう)と、View Dependentと呼ばれる3Dモデル(以下、VDモデルともいう)とがある。
 VDモデルは、例えば、3D形状モデル等の3次元の形状に関する情報と、テクスチャとなる画像の情報とが別になっている3Dデータである。VDモデルでは、3D形状モデルに、テクスチャとなる画像がマッピング(テクスチャマッピング)されることにより、色が付される。VDモデルによれば、(仮想)視点によって異なるオブジェクトの表面の反射の具合等を表現することができる。VDモデルは、見えが視点に依存するので、View Dependentと呼ばれる。
 VIモデルは、例えば、3次元の形状に関する情報の構成要素としてのポリゴンや点が、色の情報を有している3Dデータ等である。VIモデルとしては、例えば、色付きのポイントクラウドや、3D形状モデルと、3D形状モデルの色の情報としてのUVマップとのセットがある。VIモデルによれば、どの(仮想)視点から見ても、ポリゴンや点が有する色が観測される。VIモデルは、見えが視点に依存しないので、View Independentと呼ばれる。
 ストロボモデル生成部22は、自由視点データ生成部21からの自由視点データを用い、視点画像に映る3次元空間(の3Dモデル)に、視点画像の複数のフレーム(異なる時刻)の同一のオブジェクトの自由視点データである3Dモデルが配置されたストロボモデルを生成する。
 すなわち、ストロボモデル生成部22は、ストロボモデルを生成する対象のフレームの区間であるストロボ区間のフレームから、ストロボモデルの生成に用いるフレーム(以下、生成フレームともいう)を選択する。さらに、ストロボモデル生成部22は、生成フレームに映るオブジェクトのうちの1以上のオブジェクトを、ストロボモデルに3Dモデルを配置する対象のオブジェクト(以下、対象オブジェクトともいう)に設定する。そして、ストロボモデル生成部22は、生成フレームに映る対象オブジェクトの3Dモデルが配置されたストロボモデルを生成し、記憶部23に供給する。
 なお、ストロボモデル生成部22では、例えば、生成フレームに映る、動いているオブジェクトのすべてを、対象オブジェクトに設定することができる。また、ストロボモデル生成部22では、例えば、生成フレームに映る、動いているオブジェクトのうちの、再生編集装置13のユーザによって指定されたオブジェクトを、対象オブジェクトに設定することができる。
 記憶部23は、自由視点データ生成部21からの自由視点データの動画コンテンツや、ストロボモデル生成部22からのストロボモデルを記憶する。
 通信部24は、再生編集装置13との間で通信を行う。すなわち、通信部24は、例えば、再生編集装置13からの要求に応じて、記憶部23に記憶された自由視点データの動画コンテンツやストロボモデルを、再生編集装置13に送信する。
 なお、自由視点データ生成部21やストロボモデル生成部22は、再生編集装置13に設けることができる。
 <再生編集装置13の構成例>
 図3は、図1の再生編集装置13の構成例を示すブロック図である。
 再生編集装置13は、通信部31、記憶部32、自由視点画像生成部33、表示部34、仮想視点設定部35、操作部36、再生制御部37、及び、記憶部38を有する。
 通信部31は、コンテンツサーバ12との間で通信を行う。すなわち、通信部31は、例えば、操作部36の操作に応じて、自由視点データの動画コンテンツやストロボモデルの要求を送信する。また、通信部31は、その要求に応じて、コンテンツサーバ12から送信されてくる自由視点データの動画コンテンツやストロボモデルを受信し、記憶部32に供給する。
 記憶部32は、通信部31からの自由視点データの動画コンテンツやストロボモデルを記憶する。
 自由視点画像生成部33は、記憶部32に記憶された自由視点データ(によって表現される3次元空間)を、仮想視点設定部35から供給される仮想視点から見た2D画像(仮想視点に位置する仮想カメラで撮影することにより得られる2D画像)(左目用の2D画像及び右目用の2D画像のセットを含む)等を、自由視点画像(のデータ)として生成(レンダリング)し、表示部34に供給する。
 また、自由視点画像生成部33は、記憶部32に記憶されたストロボモデルを仮想視点設定部35からの仮想視点から見た2D画像である3Dストロボ画像(3DのCG(Computer Graphics))を、自由視点画像として生成し、表示部34に供給する。
 ここで、ストロボ画像とは、複数の時刻に撮影された1つ以上の同一のオブジェクト(像)が映る画像である。2D画像に映るオブジェクトが映るストロボ画像を、2Dストロボ画像ともいい、オブジェクトの3Dモデルが映る2D画像、すなわち、ストロボモデルを所定の視点から見た2D画像を、3Dストロボ画像ともいう。自由視点画像生成部33では、3Dストロボ画像が生成される。
 表示部34は、自由視点画像生成部33からの3Dストロボ画像その他の自由視点画像等を表示する。
 表示部34は、例えば、2Dのヘッドマウントディスプレイや、2Dのモニタ、3Dのヘッドマウントディスプレイ、3Dのモニタ等で構成することができる。3Dのヘッドマウントディスプレイやモニタは、例えば、左目用の2D画像及び右目用の2D画像を表示することにより立体視を実現する表示装置である。
 仮想視点設定部35は、仮想カメラによりストロボモデルを撮影するときの仮想視点を設定し、自由視点画像生成部33に供給する。仮想視点は、例えば、ユーザの操作に応じて設定することができる。ユーザの操作には、ユーザによる操作部36の操作の他、ユーザの状態(位置及び姿勢)やジェスチャが含まれる。ユーザの状態は、例えば、表示部34がヘッドマウントディスプレイで構成される場合には、そのヘッドマウントディスプレイにおいて検出することができる。
 操作部36は、ユーザによって操作され、ユーザの操作に応じた操作情報を、必要なブロックに供給する。なお、操作部36は、例えば、タッチパネル等によって、表示部34と一体的に構成することができる。また、操作部36は、表示部34とは別個のマウスやコントローラ等として構成することもできる。
 再生制御部37は、表示部34に表示された3Dストロボ画像に対する、ユーザの(操作部36等の)操作に応じて、記憶部32に記憶された自由視点データの動画コンテンツの再生を制御する再生制御情報を生成する。また、再生制御部37は、再生制御情報に応じて、記憶部32に記憶された自由視点データの動画コンテンツの再生を制御する。自由視点データの動画コンテンツの再生の制御には、再生を開始する位置(フレーム)の制御や、自由視点画像生成部33で自由視点画像を生成するときの仮想視点の制御(設定)等が含まれる。
 再生制御情報としては、例えば、タイムラインシナリオと撮影シナリオとがある。タイムラインシナリオは、自由視点データの動画コンテンツを再生する再生手順を表す情報である。撮影シナリオは、自由視点データを見るときの仮想視点を表す情報、すなわち、自由視点データを撮影する仮想カメラの撮影位置及び撮影姿勢(さらには、ズーム率等のカメラパラメータ)を表す情報である。
 記憶部38は、再生制御部37が生成する再生制御情報としてのタイムラインシナリオや撮影シナリオのファイルを記憶する。
 なお、再生編集装置13は、外部との通信を行う機能、画像を表示する機能、及び、ユーザの操作を受け付ける機能を、少なくとも有していればよい。図3において、その他の機能、例えば、自由視点画像生成部33や、仮想視点設定部35、及び、再生制御部37によって実現される機能は、例えば、クラウド上のサーバに設けることができる。
 <コンテンツサーバ12の処理>
 図4は、図2のコンテンツサーバ12が行う処理の例を説明するフローチャートである。
 ステップS11において、コンテンツサーバ12は、撮影装置11で撮影された複数の視点の視点画像(及びデプス画像)をフレーム単位で得る。コンテンツサーバ12は、複数の視点の視点画像を、自由視点データ生成部21に供給し、処理は、ステップS11からステップS12に進む。なお、撮影装置11で撮影された複数の視点の視点画像は、再生編集装置13を経て、再生編集装置13からコンテンツサーバ12に送信することができる。
 ステップS12では、自由視点データ生成部21は、複数の視点の視点画像等を用いて、自由視点データを、フレーム単位で生成し、ストロボモデル生成部22、及び、記憶部23に供給する。記憶部23は、自由視点データ生成部21からのフレーム単位の自由視点データで構成される動画コンテンツ(自由視点データの動画コンテンツ)を記憶する。その後、処理は、ステップS12からステップS13に進む。
 ステップS13では、ストロボモデル生成部22は、自由視点データ生成部21からの自由視点データを用い、ストロボモデルを生成する。
 すなわち、ストロボモデル生成部22は、ストロボモデルを生成する対象のフレームの区間であるストロボ区間を設定する。例えば、自由視点データの動画コンテンツの全区間や、シーンチェンジから次のシーンチェンジの直前までの区間、ユーザの操作に応じて再生編集装置13から指定される区間等が、ストロボ区間に設定される。
 また、ストロボモデル生成部22は、視点画像に映るオブジェクトから、ストロボモデルに3Dモデルを配置する対象の対象オブジェクトを設定する。例えば、ストロボ区間のフレームに映るオブジェクトのすべてや、ユーザの操作に応じて再生編集装置13から指定されるオブジェクト等が、対象オブジェクトに設定される。
 さらに、ストロボモデル生成部22は、ストロボ区間のフレームから、ストロボモデルの生成に用いるフレーム(以下、生成フレームともいう)を選択する。
 ここで、ストロボ区間の全フレームを生成フレームとして、ストロボモデルの生成に用いると、ストロボモデルには、ストロボ区間のフレーム数と同一の数の、同一のオブジェクトの3Dモデルが重なって配置され、3Dストロボ画像が見にくい画像となることがある。
 そこで、ストロボモデル生成部22は、ストロボ区間のフレームから、幾つかのフレームを生成フレームとして選択し、その生成フレーム(に映るオブジェクトの3Dモデル)を用いて、ストロボモデルを生成することができる。
 ストロボモデル生成部22は、例えば、ストロボ区間のフレームから、3Dモデルの干渉度が閾値以下となるフレームを、生成フレームとして選択することができる。すなわち、ストロボモデル生成部22は、ストロボ区間のフレームに映る対象オブジェクトの3Dモデルを、3次元空間に配置した状態での、3Dモデルどうしの重なり具合を表す干渉度を算出する。干渉度は、例えば、3次元空間において、任意の2フレームの3Dモデルが完全に重なる場合を100%とするとともに、まったく重ならない場合を0%として算出される。そして、ストロボモデル生成部22は、干渉度が所定の閾値以下のフレームを、生成フレームとして選択する。以上のように、ストロボ区間のフレームから、3Dモデルの干渉度が閾値以下となるフレームを、生成フレームとして選択し、その生成フレームに映る対象オブジェクトの3Dモデルが配置されたストロボモデルを生成することにより、ストロボモデルにおいて、3Dモデルが重なって配置され、3Dストロボ画像が見にくい画像となることを抑制することができる。
 なお、生成フレームの選択では、その他、例えば、単純に、ストロボ区間のフレームを、所定のフレーム数ごとに、生成フレームとして選択することができる。また、生成フレームの選択では、ストロボ区間のフレームすべてを、生成フレームとして選択することができる。
 ストロボモデル生成部22は、自由視点データ生成部21からの自由視点データを用い、ストロボ区間のフレームから選択された複数の生成フレームに映る対象オブジェクトの3Dモデルが、その対象オブジェクトが撮影されたときの3次元空間としての背景(の3Dモデル)に配置されたストロボモデルを生成する。
 ストロボモデル生成部22は、自由視点データ生成部21からの自由視点データの動画コンテンツのストロボモデル、すなわち、自由視点データ生成部21からの自由視点データを用いて生成されたストロボモデルを、記憶部23に供給する。記憶部23は、ストロボモデル生成部22からのストロボモデルを記憶し、処理は、ステップS13からステップS14に進む。
 ステップS14では、通信部24は、例えば、再生編集装置13からの要求に応じて、記憶部23に記憶された自由視点データの動画コンテンツ、及び、ストロボモデルを、再生編集装置13に送信し、処理は終了する。
 <再生編集装置13の処理>
 図5は、図3の再生編集装置13が行う処理の例を説明するフローチャートである。
 ステップS31において、通信部31は、例えば、ユーザの操作に応じて、自由視点データの動画コンテンツ、及び、ストロボモデルを、コンテンツサーバ12に要求し、処理は、ステップS32に進む。
 ステップS32では、通信部31は、コンテンツサーバ12から、自由視点データの動画コンテンツ、及び、ストロボモデルが送信されてくるのを待って、その自由視点データの動画コンテンツ、及び、ストロボモデルを受信する。通信部31は、コンテンツサーバ12からの自由視点データの動画コンテンツ、及び、ストロボモデルを、記憶部32に供給して記憶させ、処理は、ステップS32からステップS33に進む。
 ステップS33では、自由視点画像生成部33は、記憶部32に記憶されたストロボモデルを、仮想視点設定部35から供給される仮想視点から見た3Dストロボ画像としての自由視点画像をレンダリングすることにより生成する。そして、自由視点画像生成部33は、3Dストロボ画像を、表示部34に供給して、処理は、ステップS33からステップS34に進む。
 ステップS34では、表示部34は、自由視点画像生成部33からの3Dストロボ画像を表示し、処理は、ステップS35に進む。
 ステップS35では、再生制御部37は、表示部34に表示されたストロボモデルに対するユーザの操作に応じて、記憶部32に記憶された自由視点データの動画コンテンツの再生を制御する再生制御情報としてのタイムラインシナリオ及び撮影シナリオを生成する。再生制御部37は、再生制御情報を、記憶部38に供給して記憶させ、処理は、ステップS35からステップS36に進む。
 ステップS36では、再生制御部37は、例えば、ユーザが、記憶部38に記憶された再生制御情報を確定する確定操作を行うのを待って、その再生制御情報としてのタイムラインシナリオに応じて、記憶部32に記憶された自由視点データの動画コンテンツを編集し、処理は、ステップS37に進む。
 ステップS37では、再生制御部37は、例えば、ユーザが、編集後の自由視点データの動画コンテンツの再生を要求する再生操作を行うのを待って、記憶部38に記憶された再生制御情報としての撮影シナリオに応じて、記憶部32に記憶された編集後の自由視点データの動画コンテンツの再生を制御し、処理は終了する。
 撮影シナリオに応じた、自由視点データの動画コンテンツの再生の制御では、再生制御部37は、撮影シナリオに応じて、仮想視点、すなわち、自由視点データを撮影する仮想カメラの撮影位置及び撮影姿勢を設定し、自由視点画像生成部33に供給する。さらに、再生制御部37は、自由視点画像生成部33を制御し、記憶部32に記憶された編集後の自由視点データを撮影シナリオに応じて設定された仮想視点から見た自由視点画像をレンダリングさせることにより生成させる。そして、再生制御部37は、自由視点画像生成部33を制御し、自由視点画像を、自由視点画像生成部33から表示部34に供給させて表示させる。なお、ここでは、再生制御情報としてのタイムラインシナリオに応じて、自由視点データの動画コンテンツを編集することとしたが、自由視点データの動画コンテンツの編集は必須ではない。例えば、単純に、指定区間をリピート再生するだけであれば、自由視点データの動画コンテンツの編集なしに、指定区間の開始フレームから終了フレーム間までを再生するだけで良い。
 <3Dストロボ画像の生成>
 図6は、不自然な3Dストロボ画像の例を示す図である。
 図6は、手前側から奥側にオブジェクトとしてのボールが転がっている様子を撮影した視点画像のフレームのうちの5フレームを生成フレームとして用いて生成されたストロボモデルから生成された3Dストロボ画像の例を示している。
 図6では、5フレームの生成フレームに映るボールの3Dモデルが、時間的に後の3Dモデルを優先するように配置(レンダリング)されている。そのため、時間的に後の(ボールの)3Dモデルが、奥側に位置するのにもかかわらず、時間的に前の手前側の3Dモデルを隠すように配置されている。その結果、図6の3Dストロボ画像は、不自然な画像になっている。
 図7は、自然な3Dストロボ画像の例を示す図である。
 図7は、手前側から奥側にオブジェクトとしてのボールが転がっている様子を撮影した視点画像のフレームのうちの5フレームを生成フレームとして用いて生成されたストロボモデルから生成された3Dストロボ画像の例を示している。
 図7では、5フレームの生成フレームに映るボールの3Dモデルが、手前側の3Dモデルを優先するように配置されている。そのため、手前側の3Dモデルが奥側の3Dモデルを隠すように、すなわち、手前側の3Dモデルが優先的に映るように配置されている。その結果、自由視点画像は、自然な画像になっている。
 自由視点画像生成部33は、ストロボモデルに配置された各オブジェクトの3Dモデルのデプス(奥行)を用いて、以上のような、手前側のオブジェクトの3Dモデルが優先的に映る3Dストロボ画像を生成する(仮想カメラにより撮影する)。
 図8は、ストロボ区間の視点画像のフレームの例を示す図である。
 図8では、時刻t1ないしt9の9フレームが、ストロボ区間の視点画像のフレームになっている。時刻t1ないしt9のフレームには、オブジェクトとしてのボールが左から右に転がっていく様子が映っている。図8では、図が煩雑になるのを避けるため、ある1視点の視点画像のフレームを図示してある。
 図9は、ストロボ区間としての時刻t1ないしt9のフレームを用いたストロボモデルの生成の例を示す図である。
 図9では、ストロボ区間としての時刻t1ないしt9のフレームのうちの、時刻t1,t3,t5,t7、及び、t9のフレームが生成フレームに選択され、複数の視点の視点画像の生成フレームとしての時刻t1,t3,t5,t7、及び、t9のフレームに映るオブジェクトとしてのボールの3Dモデルが生成される。そして、生成フレームとしての時刻t1,t3,t5,t7、及び、t9のフレームに映るボールの3Dモデルが配置されたストロボモデルが生成される。
 図10は、仮想カメラによるストロボモデルの撮影により生成される3Dストロボ画像の表示の例を示す図である。
 3Dストロボ画像としては、時刻t1,t3,t5,t7、及び、t9のフレームに映るオブジェクトとしてのボールの3Dモデルが映るフレームを生成して表示することができる。また、3Dストロボ画像としては、図9のストロボモデルから、時刻t1のフレームに映るオブジェクトとしてのボールの3Dモデルが映るフレーム、時刻t1及びt3のフレームに映るオブジェクトとしてのボールの3Dモデルが映るフレーム、時刻t1,t3、及び、t5のフレームに映るオブジェクトとしてのボールの3Dモデルが映るフレーム、時刻t1,t3,t5、及び、t7のフレームに映るオブジェクトとしてのボールの3Dモデルが映るフレーム、並びに、時刻t1,t3,t5,t7、及び、t9のフレームに映るオブジェクトとしてのボールの3Dモデルが映るフレームを生成し、順次表示することができる。
 図10の3Dストロボ画像では、ストロボモデルを撮影する仮想カメラの撮影位置が変更されていないが、仮想カメラの撮影位置は、カメラワークに応じて変更することができる。例えば、時刻t1,t3,t5,t7、及び、t9のフレームに映るオブジェクトとしてのボールの3Dモデルが配置されたストロボモデルを、撮影位置を変更しながら、仮想カメラで撮影することができる。撮影位置が変更される場合には、ストロボモデルを見る視点が変更され、カメラアングルが変化する3Dストロボ画像が表示される。
 <自由視点データについての、所定のシーンのサーチ>
 図11は、自由視点データについて、所定のシーン(フレーム)をサーチするときのユーザの操作の例を説明する図である。
 画像(動画)の再生や編集においては、例えば、再生開始位置や、再生終了位置、編集対象となるシーン等の特定のシーンを、効率的にサーチすることが要求される。
 再生や編集の対象が2D画像(動画)である場合、シーンのサーチは、時間(時系列)方向に行うだけで済む。ここで、時間方向に行うシーンのサーチを、時間サーチともいう。
 一方、再生や編集の対象が自由視点データ(動画)である場合、自由視点データは、その自由視点データを見るときの仮想視点を自由に設定することができるため、あるフレーム(時刻)に存在する人物や物等のオブジェクトであっても、仮想視点から自由視点データを見たときの自由視点画像に映っているとは限らない。
 例えば、自由視点データの動画コンテンツがサッカーの試合を撮影した動画コンテンツである場合に、シュートをした選手の、そのシュートの瞬間のシーンを時間サーチするときには、仮想視点の位置によっては、自由視点画像において、図11に示すように、シュートの瞬間の、シュートをした選手としてのオブジェクトが、他のオブジェクトとしての他の選手に隠れて見えないことがある。この場合、ユーザは、図11に示すように、仮想視点を変更する操作を行い、自由視点画像において、シュートの瞬間の、シュートをした選手が見えるような仮想視点の位置をサーチする必要がある。ここで、仮想視点の位置のサーチを、空間サーチともいう。
 空間サーチ後の自由視点画像が所望のシーンでない場合、すなわち、例えば、シュートの瞬間から僅かに時間がずれているシーンである場合、ユーザは、時間サーチ及び空間サーチを繰り返す必要がある。
 以上のように、自由視点データについて、所望のオブジェクトが映る所望のシーンをサーチする場合、ユーザは、時間サーチ及び空間サーチ(の操作)を、所望のオブジェクトが映る所望のシーンを見つけることができるまで、繰り返し行う必要がある。
 したがって、再生や編集の対象が自由視点データである場合に、仮想視点から自由視点データを見た自由視点画像を表示し、ユーザが、その自由視点画像を見ながら、所望のシーンをサーチするのでは、サーチの作業の手間がかかり、ユーザの負担が大になる。
 また、サーチの作業にあたっては、時間サーチを行うためのスライドバー等のGUIや、空間サーチを行うためのGUIを表示する必要がある。さらに、場合によっては、瞬間のシーンをサーチするために、複数のフレームを並べて表示する必要があることがある。
 したがって、所望のシーンのサーチには、時間サーチ及び空間サーチを行うためのGUIや、自由視点画像の複数のフレームを表示する広いスペースが必要となる。
 そこで、本技術では、所望のシーンのサーチ等の作業のためのUIとして、3Dストロボ画像を採用し、これにより、所望のシーンのサーチその他の自由視点データの動画コンテンツに対する再生や編集に要するユーザの作業の負担の軽減や、自由視点データの動画コンテンツに対する再生や編集に要するスペースの省スペース化を実現する。
 <自由視点データの動画コンテンツの例>
 図12は、自由視点データの動画コンテンツの例を説明する図である。
 図12は、所定の仮想視点から自由視点データを見た自由視点画像、すなわち、仮想カメラで、自由視点データを撮影することにより得られる自由視点画像(をレンダリングした画像)の例を示している。
 図12の自由視点データの動画コンテンツは、時刻情報としての、例えば、タイムコードt1ないしt10が付された10フレームで構成され、2つのオブジェクトX及びYとしての左から右に移動するボールのデータを含む。さらに、図12の自由視点データの動画コンテンツは、背景のデータとして、1種類の背景Aのみのデータを含む。
 以下、図12の自由視点データの動画コンテンツを少なくとも対象として行われるコンテンツサーバ12及び再生編集装置13の処理について説明する。
 なお、タイムコードt#iが付されたフレームを、フレームt#iともいう。
 <ストロボモデルの例>
 図13は、図12の自由視点データの動画コンテンツを用いて生成されるストロボモデルの例を示す図である。
 図13では、図12の自由視点データの動画コンテンツの全10フレームの区間が、ストロボ区間に設定され、そのストロボ区間のうちの奇数番目のフレームt1,t3,t5,t7,t9が、生成フレームとして選択される。そして、生成フレームに映る2つのオブジェクトX及びYの全部が、対象オブジェクトに設定され、フレームt1,t3,t5,t7,t9それぞれの対象オブジェクトX及びYの3Dモデルが背景としての3次元空間に配置されたストロボモデルが生成される。
 仮想視点からストロボモデルを見た自由視点画像が、3Dストロボ画像であり、ストロボモデルを見るときの仮想視点は、ユーザの操作に応じて変更することができる。
 ストロボモデルにおいて、各生成フレーム(タイムコードt1,t3,t5,t7,t9)のオブジェクトX及びYの3Dモデルは、3次元空間内の位置情報等の一般的な3Dモデルが有する情報の他、元の自由視点データの動画コンテンツにおいて付与されている時刻情報としてのタイムコードt#iを有する。
 なお、図13において、タイムコードt#iが記載された吹き出し、並びに、オブジェクトX及びYが記載された吹き出しは、図を分かりやすくするための吹き出しであり、ストロボモデルを構成する要素ではない。吹き出しについては、以降の図においても同様である。
 <3Dストロボ画像に対して行われるユーザの操作の第1の例>
 図14は、図13のストロボモデルを仮想視点から見た3Dストロボ画像をUIとして、その3Dストロボ画像に対して行われるユーザの操作の第1の例を説明する図である。
 ユーザは、表示部34に表示される3Dストロボ画像をUIとして、そのUIとしての3Dストロボ画像に対して、各種の操作を行うことで、自由視点データの動画コンテンツに対する再生や編集に関する作業(以下、再生編集作業ともいう)を行うことができる。
 例えば、3Dストロボ画像には、複数の生成フレームに映るオブジェクトが映るので、ユーザは、3Dストロボ画像を見ることにより、所望のシーン(所望のオブジェクト)を容易にサーチすることができる。さらに、ユーザは、3Dストロボ画像に映る所望のオブジェクト(所望のオブジェクトが映る自由視点データのフレームを含む)を選択し、その所望のオブジェクト(が映るフレーム)に対して、所望の処理を割り当てることにより、容易に、再生編集作業を行うことができる。
 図14は、所望のオブジェクト(シーン)が映るフレームが、例えば、オブジェクトXが映るフレームt5である場合に、そのフレームt5を、再生開始位置(再生開始フレーム)として、自由視点データの動画コンテンツを再生するときの再生編集作業を示している。
 ユーザは、必要に応じて、3Dストロボ画像において、フレームt5に映るオブジェクトXが映るように、ストロボモデルを見るときの仮想視点を変更する。そして、ユーザは、3Dストロボ画像において、例えば、所望のオブジェクトとしてのフレームt5に映るオブジェクトX/Yを押圧することにより選択する(操作o11)。ここで、オブジェクトX/Yとは、オブジェクトX又はYを意味する。フレームt#iに映るオブジェクトX/Yを、以下、適宜、オブジェクトX/Y-t#iのように記載する。
 なお、3Dストロボ画像に映るオブジェクトX/Yの選択は、そのオブジェクトX/Yの押圧の他、タップやダブルクリックその他の操作によって行うことができる。
 オブジェクトX/Yが押圧されると、再生制御部37は、自由視点画像生成部33を介して、表示部34に、押圧により選択されたオブジェクトやそのオブジェクトが映るフレームに対して割り当てる処理を表す処理メニュー及びOKボタンを表示させる。図14の処理メニューは、処理start,end,delete,jumpを表すボタンを有する。処理startは、フレームの再生を開始する処理であり、処理endは、フレームの再生を終了する処理である。処理deleteは、フレームを削除する処理であり、処理jumpは、フレームの再生をジャンプする処理である。
 ユーザは、処理メニューのボタンを選択することにより、そのボタンに対応する処理を、押圧により選択したオブジェクトX/Yが映るフレームに対して割り当てることができる。
 例えば、ユーザが、処理メニューの処理startを表すボタンを選択し、その後、OKボタンを押圧すると(操作o12)、再生制御部37は、フレームt5に、処理startを割り当てることを表すタイムラインシナリオ(TS1)を生成する。
 <play>
 t5:start
                         ・・・(TS1)
 タイムラインシナリオ(TS1)は、自由視点データの動画コンテンツの再生(play)に関し、フレームt5から再生を開始することを表す。
 再生制御部37は、タイムラインシナリオ(TS1)に応じて、自由視点データの動画コンテンツを再生する場合、フレームt5から再生を開始させる。又は、再生制御部37は、タイムラインシナリオ(TS1)に応じて、フレームt1ないしt10を有する図12の自由視点データの動画コンテンツを、フレームt5を先頭のフレームとするとともに、フレームt10を最後のフレームとする自由視点データの動画コンテンツに編集し、その編集後の自由視点データの動画コンテンツを再生させる。
 以上のように、再生制御部37では、3Dストロボ画像において選択されたオブジェクトが映るフレームから、再生を開始する再生制御情報としてのタイムラインシナリオを生成し、その再生制御情報に応じて、自由視点データの再生を制御することができる。なお、3Dストロボ画像は、DVDメニューにあるチャプター再生のように、再生開始専用のために準備しておくことができる。この場合、3Dストロボ画像において、特定時刻t#iのオブジェクトを選択するだけで、フレームt#iから再生を開始することができる。
 <3Dストロボ画像に対して行われるユーザの操作の第2の例>
 図15は、図13のストロボモデルを仮想視点から見た3Dストロボ画像をUIとして、その3Dストロボ画像に対して行われるユーザの操作の第2の例を説明する図である。
 図15は、例えば、オブジェクトXが映るフレームt1を、再生開始位置として、自由視点データの動画コンテンツを、フレームt3まで再生し、その後、フレームt7にジャンプして、フレームt9まで再生する場合の再生編集作業を示している。
 ユーザは、必要に応じて、3Dストロボ画像において、フレームt1,t3,t5,t7,t9に映るオブジェクトXが映るように、ストロボモデルを見るときの仮想視点を変更する。そして、ユーザは、3Dストロボ画像において、例えば、オブジェクトX/Y-t1を押圧することにより選択する(操作o21)。図14で説明したように、オブジェクトX/Y-t1の押圧に応じて、処理メニュー及びOKボタンが表示されるので、ユーザは、処理メニューの処理startを表すボタンを選択し、フレームt1に、処理startを割り当てる。
 その後、ユーザは、3Dストロボ画像において、例えば、オブジェクトX/Y-t3を押圧することにより選択する(操作o22)。オブジェクトX/Y-t3の押圧に応じて、処理メニュー及びOKボタンが表示されるので、ユーザは、処理メニューの処理jumpを表すボタン(図14)を選択し、フレームt3に、処理jumpを割り当てる。ユーザは、処理jumpを表すボタンの選択後に、オブジェクトX/Y-t3からオブジェクトX/Y-t7までなぞるように、ドラッグを行い、オブジェクトX/Y-t7を選択する。これにより、フレームt3に対して、再生をフレームt7にジャンプする処理jumpが割り当てられる。
 その後、ユーザは、3Dストロボ画像において、例えば、オブジェクトX/Y-t9を押圧することにより選択する(操作o23)。オブジェクトX/Y-t9の押圧に応じて、処理メニュー及びOKボタンが表示されるので、ユーザは、処理メニューの処理endを表すボタン(図14)を選択し、フレームt9に、処理endを割り当てる。
 そして、ユーザは、OKボタンを押圧する(操作o24)。この場合、再生制御部37は、以下のように、フレームに、処理を割り当てることを表すタイムラインシナリオ(TS2)を生成する。
 <play>
 t1:start
 t3:jump-t7
 t9:end
                         ・・・(TS2)
 タイムラインシナリオ(TS2)は、自由視点データの動画コンテンツの再生(play)に関し、フレームt1から再生を開始すること、フレームt3の再生後に、フレームt7にジャンプすること、及び、フレームt9で再生を終了することを表す。
 再生制御部37は、タイムラインシナリオ(TS2)に応じて、自由視点データの動画コンテンツを再生する場合、フレームt1から再生を開始させ、フレームt3の再生後に、再生(位置)を、フレームt7にジャンプさせて再生を続行させる。そして、再生制御部37は、フレームt9で再生を終了させる。又は、再生制御部37は、タイムラインシナリオ(TS2)に応じて、図12の自由視点データの動画コンテンツを、フレームt1ないしt3及びフレームt7ないしt9の自由視点データの動画コンテンツに編集し、その編集後の自由視点データの動画コンテンツを再生させる。
 以上のように、再生制御部37では、3Dストロボ画像において選択されたオブジェクトが映るフレームから、再生を開始し、3Dストロボ画像において選択された他のオブジェクトが映るフレームで、再生を終了する再生制御情報としてのタイムラインシナリオを生成することができる。
 また、再生制御部37では、3Dストロボ画像において選択されたオブジェクトが映るフレームから、3Dストロボ画像において選択された他のオブジェクトが映るフレームに、再生をジャンプする再生制御情報としてのタイムラインシナリオを生成することができる。
 さらに、上述のような再生制御情報に応じて、自由視点データの再生を制御することができる。
 <3Dストロボ画像に対して行われるユーザの操作の第3の例>
 図16は、図13のストロボモデルを仮想視点から見た3Dストロボ画像をUIとして、その3Dストロボ画像に対して行われるユーザの操作の第3の例を説明する図である。
 図16は、例えば、オブジェクトXが映るフレームt5からフレームt10までを切り出す場合の再生編集作業を示している。
 ユーザは、必要に応じて、3Dストロボ画像において、フレームt1,t3,t5,t7,t9に映るオブジェクトXが映るように、ストロボモデルを見るときの仮想視点を変更する。そして、ユーザは、3Dストロボ画像において、例えば、オブジェクトX/Y-t1を押圧し、さらに、オブジェクトX/Y-t3を押圧することにより、オブジェクトX/Y-t1及びオブジェクトX/Y-t3を選択する(操作o31)。図14で説明したように、オブジェクトX/Y-t1やオブジェクトX/Y-t3の押圧に応じて、処理メニュー及びOKボタンが表示されるので、ユーザは、オブジェクトX/Y-t3の押圧後に表示される処理メニューの処理deleteを表すボタンを選択し、フレームt1ないしt3に、処理deleteを割り当てる。
 そして、ユーザは、OKボタンを押圧する(操作o32)。この場合、再生制御部37は、以下のように、フレームに、処理を割り当てることを表すタイムラインシナリオ(TS3)を生成する。
 <edit>
 t1:delete_start
 t4:delete_end
                         ・・・(TS3)
 タイムラインシナリオ(TS3)は、自由視点データの動画コンテンツの編集(edit)に関し、フレームt1を始点とするとともにフレームt4を終点として、フレームの削除を(行って、残りのフレームの再生を)行うことを表す。
 ここで、タイムラインシナリオ(TS3)では、3Dストロボ画像に映るオブジェクトのうちの、ユーザが2回目に押圧したオブジェクトX/Y-t3の次のオブジェクトX/Y-t5のフレームt5の直前のフレームt4を、フレームの削除を行う終点のフレームとしている。但し、フレームの削除を行う終点のフレームとしては、3Dストロボ画像に映るオブジェクトのうちの、ユーザが2回目に押圧したオブジェクトのフレームを採用することができる。この場合、ユーザが、3Dストロボ画像において、例えば、オブジェクトX/Y-t1を押圧し、さらに、オブジェクトX/Y-t3を押圧したときには、フレームt1を始点とするとともにフレームt3を終点として、フレームの削除を行うことを表すタイムラインシナリオが生成される。
 再生制御部37は、タイムラインシナリオ(TS3)に応じて、自由視点データの動画コンテンツを再生する場合、削除の対象となっていないフレームt5ないしt10だけを再生させる。又は、再生制御部37では、タイムラインシナリオ(TS3)に応じて、図12の自由視点データの動画コンテンツを編集し、その編集後の自由視点データの動画コンテンツを再生させる。
 タイムラインシナリオ(TS3)に応じて、自由視点データの動画コンテンツを再生する場合も、タイムラインシナリオ(TS3)に応じて、自由視点データの動画コンテンツを編集し、その編集後の自由視点データの動画コンテンツを再生する場合も、フレームt5ないしt10だけが再生される。したがって、タイムラインシナリオ(TS3)に応じて、自由視点データの動画コンテンツを再生することと、タイムラインシナリオ(TS3)に応じて、自由視点データの動画コンテンツを編集し、その編集後の自由視点データの動画コンテンツを再生することとは、等価(均等)であるとみなすことができる。
 以上のように、再生制御部37では、3Dストロボ画像において選択されたオブジェクトが映るフレームから、3Dストロボ画像において選択された他のオブジェクトが映るフレームまでを削除する再生制御情報としてのタイムラインシナリオを生成することができる。さらに、その再生制御情報に応じて、自由視点データの再生を制御することができる。
 <3Dストロボ画像に対して行われるユーザの操作の第4の例>
 図17は、図13のストロボモデルを仮想視点から見た3Dストロボ画像をUIとして、その3Dストロボ画像に対して行われるユーザの操作の第4の例を説明する図である。
 図17は、仮想カメラの撮影位置及び撮影姿勢(仮想視点)を設定する場合の再生編集作業を示している。
 図17において、3Dストロボ画像は、タイムラインシナリオ(TS1)に応じて、フレームt1ないしt10を有する図12の自由視点データの動画コンテンツを、フレームt5を先頭のフレームとするとともに、フレームt10を最後のフレームとする自由視点データの動画コンテンツに編集した、その編集後の自由視点データの動画コンテンツのフレームt5,t7,t9を生成フレームとして生成されたストロボモデルを仮想視点から見た自由視点画像になっている。
 再生編集装置13では、以上のように、タイムラインシナリオに応じて編集された編集後の自由視点データの動画コンテンツを用いて生成されたストロボモデルに対応する3Dストロボ画像を、UIとして、表示部34に表示することができる。
 タイムラインシナリオに応じて編集された編集後の自由視点データの動画コンテンツを用いてのストロボモデルの生成は、再生編集装置13で行うこともできるし、再生編集装置13からコンテンツサーバ12に依頼して、コンテンツサーバ12に行わせることもできる。
 ユーザは、必要に応じて、3Dストロボ画像において、必要なオブジェクトが映るように、ストロボモデルを見るときの仮想視点を変更する。そして、ユーザは、3Dストロボ画像において、仮想カメラの状態(撮影位置及び撮影姿勢)を設定したいフレーム(時刻)に映るオブジェクトを選択する(操作o41)。さらに、ユーザは、3Dストロボ画像において、直前に選択したオブジェクトが映るフレーム以降のフレームの自由視点データを撮影する仮想カメラの位置及び姿勢を、撮影位置及び撮影姿勢として入力する(操作o42及びo43)。仮想カメラの位置の入力は、例えば、ユーザが3Dストロボ画像上の位置を指定することにより行うことができる。仮想カメラの姿勢の入力は、例えば、ユーザが3Dストロボ画像上のオブジェクトを指定することにより行うことができる。この場合、仮想カメラの位置から、ユーザが指定したオブジェクトに向かう方向を撮影方向とする仮想カメラの姿勢が、撮影姿勢となる。
 仮想カメラの位置及び姿勢が入力されると、OKボタンが表示される。ユーザが、OKボタンを押圧すると(操作o44)、再生制御部37は、3Dストロボ画像においてユーザが選択したオブジェクトが映るフレームの時刻情報としてのタイムコードと、そのオブジェクトの選択後に、ユーザが入力した撮影位置及び撮影姿勢とのセットを登録した撮影シナリオを生成する。
 オブジェクトの選択、並びに、撮影位置及び撮影姿勢の入力は、繰り返し行うことができる。オブジェクトの選択、並びに、撮影位置及び撮影姿勢の入力が、繰り返し行われ、OKボタンが押圧された場合、その繰り返しの回数だけ、ユーザが選択したオブジェクトが映るフレームのタイムコードと、ユーザが入力した撮影位置及び撮影姿勢とのセットが登録された撮影シナリオが生成される。
 図18は、撮影シナリオの例を示す図である。
 図17で説明したように、撮影シナリオには、3Dストロボ画像においてユーザが選択したオブジェクトが映るフレームのタイムコードと、そのオブジェクトの選択後に、ユーザが入力した撮影位置及び撮影姿勢とのセットが登録される。
 図18の撮影シナリオでは、タイムコードt5と、撮影位置を表す位置(x1,y1,z1)、及び、撮影方向を表すオブジェクトXとのセット、タイムコードt7と、撮影位置を表す位置(x1,y1,z1)、及び、撮影方向を表すオブジェクトXとのセット、並びに、タイムコードt9と、撮影位置を表す位置(x2,y2,z12、及び、撮影方向を表すオブジェクトYとのセットが登録されている。
 タイムコードt5と、撮影位置を表す位置(x1,y1,z1)、及び、撮影方向を表すオブジェクトXとのセットは、タイムコードt5以降については、位置(x1,y1,z1)を撮影位置とするとともに、その撮影位置(x1,y1,z1)から、オブジェクトXに向かう姿勢(方向)を撮影姿勢として、仮想カメラで、自由視点データを撮影することを表す。
 タイムコードt7と、撮影位置を表す位置(x1,y1,z1)、及び、撮影方向を表すオブジェクトXとのセットは、タイムコードt7以降については、位置(x1,y1,z1)を撮影位置とするとともに、その撮影位置(x1,y1,z1)から、オブジェクトXに向かう姿勢を撮影姿勢として、仮想カメラで、自由視点データを撮影することを表す。
 タイムコードt9と、撮影位置を表す位置(x2,y2,z2)、及び、撮影方向を表すオブジェクトYとのセットは、タイムコードt9以降については、位置(x2,y2,z2)を撮影位置とするとともに、その撮影位置(x2,y2,z2)から、オブジェクトYに向かう姿勢を撮影姿勢として、仮想カメラで、自由視点データを撮影することを表す。
 図18の撮影シナリオに応じた自由視点データの動画コンテンツの再生の制御によれば、自由視点画像生成部33(図3)において、フレームt5ないしt8については、撮影位置(x1,y1,z1)から、オブジェクトXに向かう撮影姿勢の仮想カメラで、自由視点データを撮影した自由視点画像が生成される。さらに、自由視点画像生成部33では、フレームt9及びt10については、撮影位置(x2,y2,z2)から、オブジェクトYに向かう撮影姿勢の仮想カメラで、自由視点データを撮影した自由視点画像が生成される。
 <処理jump>
 図19は、処理jumpの例を説明する図である。
 図19は、図15とは異なる処理jumpの例を示す図である。
 図15では、ある自由視点データのフレームt3に、処理jumpを割り当てることにより、同一の動画コンテンツの自由視点データのフレームt3からフレームt7に再生をジャンプする場合の再生編集作業を説明したが、再生のジャンプは、ある動画コンテンツAの自由視点データのフレームから、動画コンテンツAとは異なる動画コンテンツBの自由視点データのフレームに行うことができる。
 この場合、ユーザは、操作部36を操作することにより、動画コンテンツAの3Dストロボ画像(動画コンテンツAの自由視点データから生成された3Dストロボ画像)と、動画コンテンツBの3Dストロボ画像とを、表示部34に表示させる。
 ユーザは、例えば、動画コンテンツAの3Dストロボ画像において、オブジェクトX/Y-t5を押圧することにより選択する。オブジェクトX/Y-t5の押圧に応じて、図14で説明したように、処理メニュー及びOKボタンが表示されるので、ユーザは、処理メニューの処理jumpを表すボタンを選択し、動画コンテンツAの自由視点データのフレームt5に、処理jumpを割り当てる。ユーザは、処理jumpを表すボタンの選択後に、オブジェクトX/Y-t5から、動画コンテンツBの3Dストロボ画像に映るオブジェクトZ-t5’までなぞるように、ドラッグを行い、オブジェクトZ-t5’を選択する。これにより、動画コンテンツAの自由視点データのフレームt5に対して、再生を、動画コンテンツBの自由視点データのフレームt5’にジャンプする処理jumpが割り当てられる。その後、OKボタンが押圧されると、動画コンテンツAの自由視点データのフレームt5から、動画コンテンツBの自由視点データのフレームt5’にジャンプすることが登録されたタイムラインシナリオが生成される。
 かかるタイムラインシナリオに応じて再生が行われる場合、動画コンテンツAの自由視点データの再生が、フレームt3まで行われると、再生(位置)は、動画コンテンツBの自由視点データのフレームt5’にジャンプされる。
 以上のように、再生制御部37では、所定の動画コンテンツの3Dストロボ画像において選択されたオブジェクトが映るフレームから、他の動画コンテンツの3Dストロボ画像において選択された他のオブジェクトが映るフレームに、再生をジャンプする再生制御情報としてのタイムラインシナリオを生成することができる。さらに、その再生制御情報に応じて、自由視点データの再生を制御すること(複数の動画コンテンツの結合を含む)ができる。
 以下、その他の再生編集作業、例えば、処理start,end,delete,jump以外の処理を割り当てる再生編集作業について説明する。
 <その他の再生編集作業>
 図20は、処理linkを割り当てる再生編集作業の例を説明する図である。
 オブジェクト(が映るフレーム)に割り当てる処理としては、図14で説明した処理start,end,delete,jumpの他、例えば、処理linkを採用することができる。処理linkは、オブジェクト(が映るフレーム)に、各種のデータを関係づける処理である。
 オブジェクトに関係づけるデータとしては、オーディオ素材や、CG素材、字幕等を採用することができる。オブジェクトへの処理linkの割り当ては、例えば、3Dストロボ画像において、オブジェクトに関係づけるデータを表すアイコンを、処理linkを割り当てるオブジェクト上にドラッグすること等によって行うことができる。例えば、オブジェクトに関係づけるデータを表すアイコンを、処理linkを割り当てるオブジェクト上にドラッグすると、OKボタンが表示される。OKボタンが押圧されると、それまでに行われたドラッグに応じて、処理linkが割り当てられたオブジェクトと、そのオブジェクトに関係づけるデータとのセットに関する情報が登録されたタイムラインシナリオが生成される。
 かかるタイムラインシナリオに応じて再生が行われる場合、処理linkが割り当てられたオブジェクト(が映るフレーム)の再生時に、そのオブジェクトに関係づけられたデータも再生される。
 以上のように、再生制御部37では、3Dストロボ画像において選択されたオブジェクトに所定のデータを関係づける再生制御情報としてのタイムラインシナリオを生成することができる。さらに、その再生制御情報に応じて、自由視点データの再生を制御することができる。
 図21は、エフェクト処理を割り当てる再生編集作業の例を説明する図である。
 オブジェクトには、そのオブジェクトの3Dモデルに適用するエフェクト処理を割り当てることができる。例えば、表示部34に3Dストロボ画像が表示されている状態で、オブジェクト(の3Dモデル)にエフェクト処理を適用するように、操作部36が操作されると、再生制御部37は、自由視点画像生成部33を介して、表示部34に、エフェクトメニュー及びOKボタンを表示させる。エフェクトメニューは、モザイクや、αブレンド、モノクロ等のエフェクト処理を表すボタンを有する。モザイクは、オブジェクトにモザイクをかけるエフェクト処理であり、αブレンドは、オブジェクトのαブレンディングを行うエフェクト処理である。モノクロは、オブジェクトのテクスチャを白黒にするエフェクト処理である。
 ユーザは、3Dストロボ画像において、例えば、所望のオブジェクトを押圧することにより選択し、さらに、エフェクトメニューにおいて、所望のエフェクトに適用する所望のエフェクト処理を表すボタンを選択する。その後、ユーザがOKボタンを押圧すると、所望のオブジェクトに所望のエフェクト処理を適用することが登録されたタイムラインシナリオが生成される。
 かかるタイムラインシナリオに応じて再生が行われる場合、所望のオブジェクトの自由視点データ(3Dモデル)には、所望のエフェクト処理が適用され、所望のエフェクト処理が適用された後の所望のオブジェクトの自由視点データを用いて、自由視点画像が生成される。
 以上のように、再生制御部37では、3Dストロボ画像において選択されたオブジェクトにエフェクト処理を適用する再生制御情報としてのタイムラインシナリオを生成し、その再生制御情報に応じて、自由視点データの再生を制御することができる。
 以上説明したように、再生編集装置13では、3Dストロボ画像に対する操作に応じて、再生制御情報を生成し、その再生制御情報に応じて、自由視点データの動画コンテンツの再生を制御するので、ユーザは、容易に、再生編集作業を行うことができる。例えば、ユーザは、時間サーチと空間サーチとを繰り返し行わずに、所望のオブジェクトが映る所望のシーンを、容易にサーチすることができる。
 さらに、ユーザは、3Dストロボ画像に対する操作によって、様々な再生編集作業を行うことができる。
 また、再生編集作業にあたって、3Dストロボ画像の他に、時間サーチや空間サーチのためのGUIを設ける必要がなく、さらに、自由視点画像の複数のフレームを並べて表示する必要もないので、再生編集作業に必要なスペース(表示画面)の省スペース化を実現することができる。その結果、例えば、スマートフォン等の携帯端末のようなサイズの小さい表示画面を用いる場合であっても、容易に、再生編集作業を行うことができる。
 <本技術を適用したコンピュータの説明>
 次に、上述した一連の処理は、ハードウェアにより行うこともできるし、ソフトウェアにより行うこともできる。一連の処理をソフトウェアによって行う場合には、そのソフトウェアを構成するプログラムが、汎用のコンピュータ等にインストールされる。
 図22は、上述した一連の処理を実行するプログラムがインストールされるコンピュータの一実施の形態の構成例を示すブロック図である。
 プログラムは、コンピュータに内蔵されている記録媒体としてのハードディスク905やROM903に予め記録しておくことができる。
 あるいはまた、プログラムは、ドライブ909によって駆動されるリムーバブル記録媒体911に格納(記録)しておくことができる。このようなリムーバブル記録媒体911は、いわゆるパッケージソフトウエアとして提供することができる。ここで、リムーバブル記録媒体911としては、例えば、フレキシブルディスク、CD-ROM(Compact Disc Read Only Memory),MO(Magneto Optical)ディスク,DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリ等がある。
 なお、プログラムは、上述したようなリムーバブル記録媒体911からコンピュータにインストールする他、通信網や放送網を介して、コンピュータにダウンロードし、内蔵するハードディスク905にインストールすることができる。すなわち、プログラムは、例えば、ダウンロードサイトから、ディジタル衛星放送用の人工衛星を介して、コンピュータに無線で転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送することができる。
 コンピュータは、CPU(Central Processing Unit)902を内蔵しており、CPU902には、バス901を介して、入出力インタフェース910が接続されている。
 CPU902は、入出力インタフェース910を介して、ユーザによって、入力部907が操作等されることにより指令が入力されると、それに従って、ROM(Read Only Memory)903に格納されているプログラムを実行する。あるいは、CPU902は、ハードディスク905に格納されたプログラムを、RAM(Random Access Memory)904にロードして実行する。
 これにより、CPU902は、上述したフローチャートにしたがった処理、あるいは上述したブロック図の構成により行われる処理を行う。そして、CPU902は、その処理結果を、必要に応じて、例えば、入出力インタフェース910を介して、出力部906から出力、あるいは、通信部908から送信、さらには、ハードディスク905に記録等させる。
 なお、入力部907は、キーボードや、マウス、マイク等で構成される。また、出力部906は、LCD(Liquid Crystal Display)やスピーカ等で構成される。
 ここで、本明細書において、コンピュータがプログラムに従って行う処理は、必ずしもフローチャートとして記載された順序に沿って時系列に行われる必要はない。すなわち、コンピュータがプログラムに従って行う処理は、並列的あるいは個別に実行される処理(例えば、並列処理あるいはオブジェクトによる処理)も含む。
 また、プログラムは、1のコンピュータ(プロセッサ)により処理されるものであっても良いし、複数のコンピュータによって分散処理されるものであっても良い。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであっても良い。
 さらに、本明細書において、システムとは、複数の構成要素(装置、モジュール(部品)等)の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、1つの筐体の中に複数のモジュールが収納されている1つの装置は、いずれも、システムである。
 なお、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
 例えば、本技術は、1つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
 また、上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。
 さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
 また、本明細書に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。
 なお、本技術は、以下の構成をとることができる。
 <1>
 複数の視点から撮影された複数の視点画像から生成される複数の時刻のオブジェクトの3Dモデルが3次元空間に配置されたストロボモデルを仮想視点から見た3Dストロボ画像に対する操作に応じて、前記複数の視点画像から生成される自由視点データの再生を制御する再生制御情報を生成する再生制御部を備える
 画像処理装置。
 <2>
 前記再生制御部は、さらに、前記再生制御情報に応じて、前記自由視点データの再生を制御する
 <1>に記載の画像処理装置。
 <3>
 前記再生制御部は、前記3Dストロボ画像において選択されたオブジェクトが映るフレームから、再生を開始する前記再生制御情報を生成する
 <1>又は<2>に記載の画像処理装置。
 <4>
 前記再生制御部は、前記3Dストロボ画像において選択されたオブジェクトが映るフレームから、再生を開始し、前記3Dストロボ画像において選択された他のオブジェクトが映るフレームで、再生を終了する前記再生制御情報を生成する
 <1>ないし<3>のいずれかに記載の画像処理装置。
 <5>
 前記再生制御部は、前記3Dストロボ画像において選択されたオブジェクトが映るフレームから、前記3Dストロボ画像において選択された他のオブジェクトが映るフレームまでを削除する前記再生制御情報を生成する
 <1>ないし<4>のいずれかに記載の画像処理装置。
 <6>
 前記再生制御部は、前記3Dストロボ画像において選択されたオブジェクトが映るフレームから、前記3Dストロボ画像において選択された他のオブジェクトが映るフレームに、再生をジャンプする前記再生制御情報を生成する
 <1>ないし<5>のいずれかに記載の画像処理装置。
 <7>
 前記再生制御部は、所定の動画コンテンツの前記3Dストロボ画像において選択されたオブジェクトが映るフレームから、他の動画コンテンツの前記3Dストロボ画像において選択された他のオブジェクトが映るフレームに、再生をジャンプする前記再生制御情報を生成する
 <6>に記載の画像処理装置。
 <8>
 前記再生制御部は、前記3Dストロボ画像において選択されたオブジェクトに所定のデータを関係づける前記再生制御情報を生成する
 <1>ないし<7>のいずれかに記載の画像処理装置。
 <9>
 前記再生制御部は、前記3Dストロボ画像において選択されたオブジェクトにエフェクト処理を適用する前記再生制御情報を生成する
 <1>ないし<8>のいずれかに記載の画像処理装置。
 <10>
 複数の視点から撮影された複数の視点画像から生成される複数の時刻のオブジェクトの3Dモデルが3次元空間に配置されたストロボモデルを仮想視点から見た3Dストロボ画像に対する操作に応じて、前記複数の視点画像から生成される自由視点データの再生を制御する再生制御情報を生成する
 ことを含む画像処理方法。
 <11>
 複数の視点から撮影された複数の視点画像から生成される複数の時刻のオブジェクトの3Dモデルが3次元空間に配置されたストロボモデルを仮想視点から見た3Dストロボ画像に対する操作に応じて、前記複数の視点画像から生成される自由視点データの再生を制御する再生制御情報を生成する再生制御部
 として、コンピュータを機能させるためのプログラム。
 11 撮影装置, 12 コンテンツサーバ, 13 再生編集装置, 21 自由視点データ生成部, 22 ストロボモデル生成部, 23 記憶部, 24,31 通信部, 32 記憶部, 33 自由視点画像生成部, 34 表示部, 35 仮想視点設定部, 36 操作部, 37 再生制御部, 38 記憶部, 901 バス, 902 CPU, 903 ROM, 904 RAM, 905 ハードディスク, 906 出力部, 907 入力部, 908 通信部, 909 ドライブ, 910 入出力インタフェース, 911 リムーバブル記録媒体

Claims (11)

  1.  複数の視点から撮影された複数の視点画像から生成される複数の時刻のオブジェクトの3Dモデルが3次元空間に配置されたストロボモデルを仮想視点から見た3Dストロボ画像に対する操作に応じて、前記複数の視点画像から生成される自由視点データの再生を制御する再生制御情報を生成する再生制御部を備える
     画像処理装置。
  2.  前記再生制御部は、さらに、前記再生制御情報に応じて、前記自由視点データの再生を制御する
     請求項1に記載の画像処理装置。
  3.  前記再生制御部は、前記3Dストロボ画像において選択されたオブジェクトが映るフレームから、再生を開始する前記再生制御情報を生成する
     請求項1に記載の画像処理装置。
  4.  前記再生制御部は、前記3Dストロボ画像において選択されたオブジェクトが映るフレームから、再生を開始し、前記3Dストロボ画像において選択された他のオブジェクトが映るフレームで、再生を終了する前記再生制御情報を生成する
     請求項1に記載の画像処理装置。
  5.  前記再生制御部は、前記3Dストロボ画像において選択されたオブジェクトが映るフレームから、前記3Dストロボ画像において選択された他のオブジェクトが映るフレームまでを削除する前記再生制御情報を生成する
     請求項1に記載の画像処理装置。
  6.  前記再生制御部は、前記3Dストロボ画像において選択されたオブジェクトが映るフレームから、前記3Dストロボ画像において選択された他のオブジェクトが映るフレームに、再生をジャンプする前記再生制御情報を生成する
     請求項1に記載の画像処理装置。
  7.  前記再生制御部は、所定の動画コンテンツの前記3Dストロボ画像において選択されたオブジェクトが映るフレームから、他の動画コンテンツの前記3Dストロボ画像において選択された他のオブジェクトが映るフレームに、再生をジャンプする前記再生制御情報を生成する
     請求項6に記載の画像処理装置。
  8.  前記再生制御部は、前記3Dストロボ画像において選択されたオブジェクトに所定のデータを関係づける前記再生制御情報を生成する
     請求項1に記載の画像処理装置。
  9.  前記再生制御部は、前記3Dストロボ画像において選択されたオブジェクトにエフェクト処理を適用する前記再生制御情報を生成する
     請求項1に記載の画像処理装置。
  10.  複数の視点から撮影された複数の視点画像から生成される複数の時刻のオブジェクトの3Dモデルが3次元空間に配置されたストロボモデルを仮想視点から見た3Dストロボ画像に対する操作に応じて、前記複数の視点画像から生成される自由視点データの再生を制御する再生制御情報を生成する
     ことを含む画像処理方法。
  11.  複数の視点から撮影された複数の視点画像から生成される複数の時刻のオブジェクトの3Dモデルが3次元空間に配置されたストロボモデルを仮想視点から見た3Dストロボ画像に対する操作に応じて、前記複数の視点画像から生成される自由視点データの再生を制御する再生制御情報を生成する再生制御部
     として、コンピュータを機能させるためのプログラム。
PCT/JP2019/051424 2019-01-16 2019-12-27 画像処理装置、画像処理方法、及び、プログラム WO2020149146A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
US17/309,982 US20210400255A1 (en) 2019-01-16 2019-12-27 Image processing apparatus, image processing method, and program
CN201980088666.8A CN113316804A (zh) 2019-01-16 2019-12-27 图像处理装置、图像处理方法和程序

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019005011A JP2022047548A (ja) 2019-01-16 2019-01-16 画像処理装置、画像処理方法、及び、プログラム
JP2019-005011 2019-01-16

Publications (1)

Publication Number Publication Date
WO2020149146A1 true WO2020149146A1 (ja) 2020-07-23

Family

ID=71613821

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/051424 WO2020149146A1 (ja) 2019-01-16 2019-12-27 画像処理装置、画像処理方法、及び、プログラム

Country Status (4)

Country Link
US (1) US20210400255A1 (ja)
JP (1) JP2022047548A (ja)
CN (1) CN113316804A (ja)
WO (1) WO2020149146A1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006195525A (ja) * 2005-01-11 2006-07-27 Nippon Hoso Kyokai <Nhk> 映像オブジェクト軌跡付加装置及び映像オブジェクト軌跡付加プログラム
JP2015187797A (ja) * 2014-03-27 2015-10-29 シャープ株式会社 画像データ生成装置および画像データ再生装置
JP2016219968A (ja) * 2015-05-19 2016-12-22 日本放送協会 多視点映像表現装置及びそのプログラム
JP2018055644A (ja) * 2016-09-30 2018-04-05 キヤノン株式会社 画像処理装置及びその制御方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4245699B2 (ja) * 1998-09-16 2009-03-25 オリンパス株式会社 撮像装置
JP3715576B2 (ja) * 2002-02-12 2005-11-09 富士写真フイルム株式会社 画像処理装置
JP2007259477A (ja) * 2002-09-30 2007-10-04 Toshiba Corp 画像合成方法、画像合成装置、画像合成プログラム
US20090231269A1 (en) * 2005-06-16 2009-09-17 Hiromu Ueshima Input device, simulated experience method and entertainment system
JP5119636B2 (ja) * 2006-09-27 2013-01-16 ソニー株式会社 表示装置、表示方法
JP5181948B2 (ja) * 2008-09-09 2013-04-10 カシオ計算機株式会社 画像処理装置、画像処理方法、及びプログラム
JP5168097B2 (ja) * 2008-11-13 2013-03-21 ソニー株式会社 撮像装置、画像処理装置、撮像装置の制御方法およびプログラム
JP4735742B2 (ja) * 2008-12-18 2011-07-27 カシオ計算機株式会社 撮像装置、ストロボ画像生成方法、および、プログラム
JP2010200360A (ja) * 2010-04-26 2010-09-09 Casio Computer Co Ltd 撮像装置、ストロボ画像生成方法、および、プログラム
KR101019847B1 (ko) * 2010-06-29 2011-03-04 (주) 골프존 운동하는 볼에 대한 센싱처리장치, 센싱처리방법 및 이를 이용한 가상 골프 시뮬레이션 장치
JP2012209872A (ja) * 2011-03-30 2012-10-25 Fujifilm Corp 3d画像生成方法、3d画像生成プログラム、及び3d画像生成装置
US10546424B2 (en) * 2015-04-15 2020-01-28 Google Llc Layered content delivery for virtual and augmented reality experiences
JP6931268B2 (ja) * 2015-06-08 2021-09-01 キヤノン株式会社 画像処理装置および画像処理方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006195525A (ja) * 2005-01-11 2006-07-27 Nippon Hoso Kyokai <Nhk> 映像オブジェクト軌跡付加装置及び映像オブジェクト軌跡付加プログラム
JP2015187797A (ja) * 2014-03-27 2015-10-29 シャープ株式会社 画像データ生成装置および画像データ再生装置
JP2016219968A (ja) * 2015-05-19 2016-12-22 日本放送協会 多視点映像表現装置及びそのプログラム
JP2018055644A (ja) * 2016-09-30 2018-04-05 キヤノン株式会社 画像処理装置及びその制御方法

Also Published As

Publication number Publication date
JP2022047548A (ja) 2022-03-25
CN113316804A (zh) 2021-08-27
US20210400255A1 (en) 2021-12-23

Similar Documents

Publication Publication Date Title
US10565802B2 (en) Collaborative multi-modal mixed-reality system and methods leveraging reconfigurable tangible user interfaces for the production of immersive, cinematic, and interactive content
US9781356B1 (en) Panoramic video viewer
KR102215166B1 (ko) 제공장치, 제공방법 및 컴퓨터 프로그램
WO2020213426A1 (ja) 画像処理装置、画像処理方法、及び、プログラム
JP5734964B2 (ja) ステレオスコープシネマ用のビューア中心ユーザインタフェース
KR101791778B1 (ko) 게임 플레이 동영상에 광고 컨텐츠를 추가 적용하여 제공하는 서비스 방법
US9959905B1 (en) Methods and systems for 360-degree video post-production
US11956408B2 (en) Information processing system, information processing method, and storage medium
JP2014021570A (ja) 動画像生成装置
WO2020166376A1 (ja) 画像処理装置、画像処理方法、及び、プログラム
KR102257132B1 (ko) 몰입형 비디오 컨텐츠를 생성 및 렌더링하기 위한 방법들, 시스템들 및 매체들
JPWO2019123509A1 (ja) 端末装置、システム、プログラム及び方法
KR20170013704A (ko) 프로젝터 투사 환경하에서의 사용자 시점을 고려한 가상공간 구현 방법 및 시스템
US10554948B2 (en) Methods and systems for 360-degree video post-production
CN110730340B (zh) 基于镜头变换的虚拟观众席展示方法、系统及存储介质
US20220036644A1 (en) Image processing apparatus, image processing method, and program
US20230353717A1 (en) Image processing system, image processing method, and storage medium
JP6572368B2 (ja) 生成装置および生成方法、プログラム
US10032447B1 (en) System and method for manipulating audio data in view of corresponding visual data
WO2020149146A1 (ja) 画像処理装置、画像処理方法、及び、プログラム
US20230136597A1 (en) Ingesting 3d objects from a virtual environment for 2d data representation
CN116962745A (zh) 视频图像的混画方法、装置及直播系统
US20170287521A1 (en) Methods, circuits, devices, systems and associated computer executable code for composing composite content
JP7123222B1 (ja) 表示制御装置、表示制御方法および表示制御プログラム
JP7204843B2 (ja) 送信装置および送信方法、プログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19910136

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19910136

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP