WO2018173791A1 - 画像処理装置および方法、並びにプログラム - Google Patents

画像処理装置および方法、並びにプログラム Download PDF

Info

Publication number
WO2018173791A1
WO2018173791A1 PCT/JP2018/009147 JP2018009147W WO2018173791A1 WO 2018173791 A1 WO2018173791 A1 WO 2018173791A1 JP 2018009147 W JP2018009147 W JP 2018009147W WO 2018173791 A1 WO2018173791 A1 WO 2018173791A1
Authority
WO
WIPO (PCT)
Prior art keywords
image
unit
presentation
immersive
omnidirectional image
Prior art date
Application number
PCT/JP2018/009147
Other languages
English (en)
French (fr)
Inventor
敏 井原
田中 健司
コディ ポウルトニー
Original Assignee
ソニー株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニー株式会社 filed Critical ソニー株式会社
Priority to EP18772584.1A priority Critical patent/EP3605300A4/en
Priority to US16/494,094 priority patent/US11070724B2/en
Priority to CN201880017780.7A priority patent/CN110402426A/zh
Priority to JP2019507536A priority patent/JP7196834B2/ja
Publication of WO2018173791A1 publication Critical patent/WO2018173791A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/04815Interaction with a metaphor-based environment or interaction object displayed as three-dimensional, e.g. changing the user viewpoint with respect to the environment or object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/698Control of cameras or camera modules for achieving an enlarged field of view, e.g. panoramic image capture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/03Arrangements for converting the position or the displacement of a member into a coded form
    • G06F3/033Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor
    • G06F3/0346Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor with detection of the device orientation or free movement in a 3D space, e.g. 3D mice, 6-DOF [six degrees of freedom] pointers using gyroscopes, accelerometers or tilt-sensors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04845Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range for image manipulation, e.g. dragging, rotation, expansion or change of colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04847Interaction techniques to control parameter settings, e.g. interaction with sliders or dials
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/0486Drag-and-drop
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/93Regeneration of the television signal or of selected parts thereof

Definitions

  • the present technology relates to an image processing apparatus, method, and program, and more particularly, to an image processing apparatus, method, and program that can be more easily edited.
  • an omnidirectional image that is a 360-degree omnidirectional image is known (see, for example, Patent Document 1).
  • omnidirectional images there is an omnidirectional image that is an image in all directions in 360 degrees, that is, in the horizontal direction and the vertical direction.
  • the user can view the contents of the omnidirectional image by using a head mounted display or the like using VR (Virtual Reality) technology.
  • VR Virtual Reality
  • the omnidirectional image is generated by stitching together a plurality of wide angle images obtained by photographing with a plurality of cameras. Then, editing is performed on the omnidirectional image obtained by the stitching process, and the final omnidirectional image content is generated.
  • the editor performs editing work by displaying a two-dimensional spherical image in an equirectangular (Equirectangular) format obtained by equirectangular projection on the display. Thereafter, the editor actually displays the omnidirectional image obtained by editing on the head mounted display and confirms the editing content and the like.
  • equirectangular equirectangular
  • the editor removes the head-mounted display from his / her head, and further displays an equirectangular two-dimensional spherical image on the display. It will be displayed and edited.
  • This technology has been made in view of such a situation, and makes it possible to perform editing more easily.
  • An image processing apparatus includes an operation detection unit that detects an operation input by the operation unit, and a part or all of the omnidirectional image in which the image of the operation unit is superimposed on an immersive presentation device.
  • a display control unit that controls display of the presentation image so that the operation input is reflected when the operation input is detected, and the operation detection unit includes: The coordinates of the position indicated by the pointer of the operation unit in the omnidirectional image are detected.
  • An image processing method detects an operation input from an operation unit, and outputs a part or all of a spherical image on which an image of the operation unit is superimposed as a presentation image to an immersive presentation device. And when the operation input is detected, the display of the presentation image is controlled so that the operation input is reflected, and the operation input is detected by a pointer of the operation unit. Detecting the coordinates of the position indicated in the omnidirectional image.
  • a program detects an operation input from an operation unit, and outputs a part or all of the omnidirectional image on which the image of the operation unit is superimposed as a presentation image to an immersive presentation device. And displaying the displayed image so that the operation input is reflected when the operation input is detected, and the operation input is detected by a pointer of the operation unit
  • a computer is caused to execute a process including a step of detecting coordinates of a position indicated in the spherical image.
  • a part of the omnidirectional image in which the operation input by the operation unit is detected and the image of the operation unit is superimposed on the immersive presentation device Alternatively, all are output and displayed as a presentation image, and when an operation input is detected, the display of the presentation image is controlled so that the operation input is reflected.
  • the operation input is detected by detecting the coordinates of the position indicated by the pointer of the operation unit in the omnidirectional image.
  • the image processing apparatus may be an independent apparatus or an internal block constituting one apparatus.
  • the program can be provided by being transmitted through a transmission medium or by being recorded on a recording medium.
  • editing can be performed more easily.
  • the present technology relates to editing and authoring of VR content, particularly a omnidirectional image, and a technology for editing a omnidirectional image obtained by stitch processing to generate a so-called complete content called a complete package.
  • the omnidirectional image may be a still image or a moving image, but the description will be continued below assuming that the omnidirectional image is a moving image.
  • FIG. 1 is a diagram illustrating a configuration example of an embodiment of an editing system to which the present technology is applied.
  • the editing system shown in FIG. 1 has an immersive presentation device 11, a display 12, an input device 13, an immersive operation unit 14, and an image processing device 15.
  • the user wears the immersive presentation device 11 on the head and operates the input device 13 and the immersive operation unit 14 while checking the omnidirectional image presented (displayed) by the immersive presentation device 11 in real time. Edit the spherical image.
  • a display 12 is arranged so that the state can be confirmed. That is, a screen related to editing of the omnidirectional image is appropriately displayed on the display 12, and a user other than the editor can confirm the state of editing by viewing the display on the display 12. it can.
  • the immersive presentation device 11 is composed of, for example, a head-mounted display, and displays the omnidirectional image supplied from the image processing device 15.
  • the immersive presentation device 11 is a head-mounted display that can be mounted on the user's head will be described as an example. It may be anything.
  • an immersive display that surrounds the user such as a CAVE type display composed of a plurality of planar display units or a display composed of a curved surface display unit such as a dome shape, can be adopted. It is.
  • the display unit of the immersive presentation device 11 may be a translucent transmissive display unit or a non-transmissive display unit.
  • the immersive presentation device 11 has a photographing unit 21, and the photographing unit 21 captures an image in front of the immersive presentation device 11.
  • a photographed image obtained by photographing by the photographing unit 21 is an image including, as a subject, a portion in front of the user wearing the immersive presentation device 11, particularly the user's hand with the input device 13.
  • the immersive presentation device 11 supplies the image processing unit 21 with the captured image obtained by the photographing unit 21 and the position and orientation information indicating the position and orientation of the immersive presentation device 11 in the three-dimensional space, that is, the real space.
  • the display 12 is composed of, for example, a liquid crystal display device, and appropriately displays an image supplied from the image processing device 15.
  • the input device 13 includes, for example, a keyboard, a mouse, a pen tablet, and the like, and supplies a signal corresponding to an operation of a user who is an editor to the image processing device 15.
  • the immersive operation unit 14 includes, for example, a dedicated controller for reproducing and editing a spherical image, a controller for a game device, a pen-type input device such as a pen of a pen tablet, and the like.
  • a dedicated controller as the immersion operation unit 14 is provided with buttons, a touch pad, and the like. It is also possible to use the user's own hand as the immersion operation unit 14.
  • the immersion operation unit 14 receives an operation by the user who is an editor and supplies a signal corresponding to the operation to the image processing device 15.
  • the image processing device 15 controls the entire editing system.
  • the image processing apparatus 15 includes a position / orientation detection unit 31, an operation detection unit 32, a holding unit 33, an edit reflection processing unit 34, a renderer unit 35, and a communication unit 36.
  • At least a part of the position / orientation detection unit 31 to communication unit 36 edits or previews the omnidirectional image, and can edit the omnidirectional image obtained by editing and output the editing software in a desired format. It is realized by.
  • the position / orientation detection unit 31 detects the position and orientation of the immersive operation unit 14 in the three-dimensional space, that is, the real space, and obtains position / orientation information indicating the detection result as the operation detection unit 32, the edit reflection processing unit 34, and This is supplied to the renderer unit 35.
  • the immersive operation unit 14 when the immersive operation unit 14 is a dedicated controller, the immersive operation unit 14 includes a plurality of sensors, and a detection unit (not shown) receives the output from each sensor of the immersive operation unit 14 and performs an immersive operation. The position and orientation of the unit 14 are detected. In such a case, the position and orientation detection unit 31 detects the position and orientation of the immersive operation unit 14 by acquiring information indicating the position and orientation of the immersive operation unit 14 from the detection unit.
  • the position and orientation of the user's hand or pen-type input device as the immersion operation unit 14 may be detected using, for example, a plurality of cameras included in the position / orientation detection unit 31.
  • the position and orientation detection unit 31 may detect the position and orientation of the user's hand as the immersion operation unit 14 based on the output of a sensor attached to the user's hand.
  • the operation detection unit 32 detects a user's operation input based on the signal supplied from the input device 13 or the immersion operation unit 14 and the position / orientation information supplied from the position / orientation detection unit 31.
  • the operation detection unit 32 supplies operation detection information indicating the detection result of the operation input by the user to the edit reflection processing unit 34.
  • the holding unit 33 holds an omnidirectional image to be edited, and supplies the held omnidirectional image to the edit reflection processing unit 34 or the omnidirectional sphere supplied from the edit reflection processing unit 34. Hold images.
  • the omnidirectional image held in the holding unit 33 is converted into a 3D model such as a two-dimensional omnidirectional image in an equirectangular (Equirectangular) format, such as an inner surface of a sphere or an inner surface of a cube. It is an image obtained by mapping.
  • a 3D model such as a two-dimensional omnidirectional image in an equirectangular (Equirectangular) format, such as an inner surface of a sphere or an inner surface of a cube. It is an image obtained by mapping.
  • the omnidirectional image held in the holding unit 33 can be a stereoscopic 3D image including a left-eye image and a right-eye image having parallax, that is, a 3D stereoscopic image. .
  • the edit reflection processing unit 34 reads out the omnidirectional image from the holding unit 33 and performs editing processing according to the operation detection information supplied from the operation detection unit 32 on the read out omnidirectional image.
  • the edited omnidirectional image is supplied to the renderer unit 35.
  • the edit reflection processing unit 34 generates an immersive operation unit model image imitating the immersive operation unit 14 based on the position / orientation information supplied from the position / orientation detection unit 31, and supplies it to the renderer unit 35.
  • the immersive operation unit model image is an image of the immersive operation unit 14 generated by the 3D model, that is, an image of the model of the immersive operation unit 14, and the model of the immersive operation unit 14 represented by the immersive operation unit model image is:
  • the posture is the same as the actual immersion operation unit 14.
  • the edit reflection processing unit 34 edits and reproduces the omnidirectional image based on the operation detection information supplied from the operation detection unit 32 and the captured image supplied from the immersive presentation device 11 via the communication unit 36.
  • a UI (User Interface) image for performing is generated and supplied to the renderer unit 35.
  • a part of the UI image is also supplied from the edit reflection processing unit 34 to the display 12 as necessary and displayed on the display 12.
  • the renderer unit 35 performs rendering processing based on the position / orientation information supplied from the immersive presentation device 11 and the position / orientation information supplied from the position / orientation detection unit 31 via the communication unit 36.
  • the renderer unit 35 presents based on the position and orientation information of the immersive presentation device 11 and the immersive operation unit 14, and the omnidirectional image, the immersive operation unit model image, and the UI image supplied from the edit reflection processing unit 34.
  • a presentation omnidirectional image which is an image for use, is generated.
  • the renderer unit 35 superimposes the immersive operation unit model image or UI image at an appropriate position on the omnidirectional image based on the position and orientation information of the immersive presentation device 11 and the immersive operation unit 14. Generate an omnidirectional image.
  • the omnidirectional image for presentation is not limited to an image obtained by superimposing an immersive operation unit model image or a UI image on the omnidirectional image, but an immersive operation unit model for an image of a partial area of the omnidirectional image. It may be an image obtained by superimposing an image or UI image. In other words, an image of a part or all of the omnidirectional image on which the immersion operation unit model image or the UI image is superimposed can be used as the presentation omnidirectional image.
  • the renderer unit 35 converts the omnidirectional image for presentation into image data in a format that can be handled by the immersive presentation device 11, such as image data in an equirectangular format, if necessary, and is obtained as a result.
  • the presented omnidirectional image is supplied to the communication unit 36.
  • the communication unit 36 communicates with the immersive presentation device 11 by wire or wireless.
  • the communication unit 36 outputs the presentation omnidirectional image supplied from the renderer unit 35 to the immersive presentation device 11, supplies the position and orientation information supplied from the immersive presentation device 11 to the renderer unit 35,
  • the captured image supplied from the presentation device 11 is supplied to the edit reflection processing unit 34.
  • the communication unit 36 can output the omnidirectional image for presentation to another immersive presentation device different from the immersive presentation device 21.
  • the same omnidirectional image for presentation that the communication unit 36 outputs to the immersive presentation device 11 is also output to the immersive presentation device worn by a user different from the editor, those users And the editor can see the same spherical image for presentation at the same time.
  • the omnidirectional image for presentation output from the renderer unit 35 is supplied to the immersive presentation device 11 via the communication unit 36 and displayed.
  • a presentation omnidirectional image in which the operation input is immediately reflected (in real time) is output from the renderer unit 35.
  • the renderer unit 35 outputs (supplies) the presentation omnidirectional image to the immersive presentation device 11 and displays the omnidirectional image for presentation, thereby displaying the omnidirectional image for presentation on the immersive presentation device 11. It can be said that it functions as a part.
  • the edit reflection processing unit 34 functions as an image processing unit that generates a spherical image, a UI image, and an immersion operation unit model image in which operations related to editing by the user are reflected in real time.
  • the user (editor) wearing the immersive presentation device 11 performs all the basic operations such as previewing and editing the omnidirectional image without removing the immersive presentation device 11 from the head. Be able to.
  • the user in a state where the user wears the immersive presentation device 11 and reproduces the presentation omnidirectional image, when the user moves his / her head, the direction of the user's head in the presentation omnidirectional image is changed. This area is presented to the user. Therefore, the user can feel as if he is in the space displayed by the omnidirectional image for presentation.
  • the omnidirectional image for presentation in addition to the omnidirectional image that is the content itself to be edited, the above-described immersive operation unit model image and the UI image are superimposed and displayed.
  • a see-through window in which a part of a captured image is cut out a menu image including menu items for playback and editing of the omnidirectional image, and a window for reproducing and editing the omnidirectional image
  • the auxiliary window displayed on the display 12 is also displayed on the omnidirectional image for presentation.
  • a dedicated controller or a pen-type input device may be used as the immersion operation unit 14.
  • the user may perform various operations by holding the dedicated controller CT11 as the immersive operation unit 14 by hand, or as shown by arrow A12,
  • the pen-type input device PN11 as the unit 14 may be held by hand to perform various operations.
  • the position and orientation detection unit 31 tracks the position and orientation of the controller CT11.
  • an image imitating the controller CT11 is displayed as the immersion operation unit model image.
  • the model of the controller CT11 represented by the immersive operation unit model image is displayed in exactly the same position and orientation as the actual controller CT11.
  • a position where the model of the controller CT11 displayed as an immersive operation unit model image as viewed from the user in a state where the user wears the immersive presentation device 11 is referred to as a model presentation position.
  • the immersion operation unit model image is presented to the user as if the model of the controller CT11 is present at the model presentation position.
  • the user can see the actual controller CT11 at the model presentation position.
  • the immersive operation unit model image of the controller CT11 is displayed in the exact same position as the actual controller CT11 at the same position as the actual controller CT11, so that the user can easily and intuitively enter the immersive operation unit. 14 can be performed. As a result, editing and the like can be performed more easily.
  • the edit reflection processing unit 34 generates an immersion operation unit model image based on the detection result of the position and orientation of the controller CT11 obtained by the position and orientation detection unit 31. Also, in the renderer unit 35, referring to the position and orientation information of the controller CT11 supplied from the position and orientation detection unit 31, the immersion operation unit model image of the controller CT11 corresponds to the actual controller CT11 on the omnidirectional image. Can be superimposed on the position. In other words, the renderer unit 35 can display the immersion operation unit model image at a position determined by the position and orientation information of the controller CT11 on the omnidirectional image.
  • a linear pointer is displayed from the model of the controller CT11 represented by the immersive operation unit model image on the presentation omnidirectional image.
  • the pointer moves with the model of the controller CT11 on the presentation omnidirectional image. Therefore, by moving the controller CT11, the user moves the controller CT11 arbitrarily on the omnidirectional image for presentation. Can be pointed to. For this reason, for example, the user designates a desired position on the omnidirectional image with the pointer, and operates the button of the actual controller CT11 in a state where the desired position is designated. Operation input such as applying effects to the area can be performed.
  • the user can perform operations related to reproduction and editing of the omnidirectional image by designating a UI button such as a menu image on the omnidirectional image with a pointer and instructing execution.
  • a UI button such as a menu image on the omnidirectional image with a pointer and instructing execution.
  • the operation detection unit 32 refers to the position and orientation information of the actual controller CT11, the position where the pointer and the omnidirectional image for presentation intersect, that is, on the omnidirectional image for presentation designated by the pointer.
  • the position can be specified.
  • the model of the input device PN11 is displayed at the same position as the actual input device PN11 in the same posture as the input device PN11 as an immersion operation unit model image.
  • the user can not only perform a desired operation input by operating the pen tablet as the input device 13 by the input device PN11, but also move the input device PN11 to display the omnidirectional sphere based on the model of the input device PN11.
  • An arbitrary position on the image can also be designated.
  • the user can perform operations related to reproduction and editing of the omnidirectional image by designating a UI button such as a menu image on the omnidirectional image for presentation by the model of the input device PN11.
  • a UI button such as a menu image on the omnidirectional image for presentation by the model of the input device PN11.
  • the user can designate an arbitrary position on the omnidirectional image by the model of the input device PN11 and can perform an operation input such as applying an effect to an area including the position.
  • the operation detection unit 32 refers to the position and orientation information of the input device PN11, so that the position on the space designated by the input device PN11, that is, the position on the presentation omnidirectional image. Can be specified.
  • the immersive operation unit model image can be displayed in the same manner as the input device PN11, and an arbitrary position on the omnidirectional image for presentation can be designated. .
  • the position and orientation of a mouse and a keyboard are also tracked, and the mouse and keyboard models are displayed as an immersive operation unit model image on the omnidirectional image for presentation. Good. Even in this case, the mouse and keyboard models are displayed in the same position as the mouse and keyboard as the actual immersion operation unit 14.
  • the immersive operation unit model image as described above is self-projected graphics that projects the actual immersive operation unit 14 at the same position on the omnidirectional image for presentation in the same posture.
  • the user when the user wears the immersive presentation device 11 on the head, the user basically cannot visually check the input device 13 such as a mouse, a keyboard, and a pen tablet at hand.
  • the input device 13 When the input device 13 is not visible to the user as described above, it is inconvenient because the input device 13 must be found or operated by hand when editing the omnidirectional image.
  • a see-through window is displayed superimposed on the omnidirectional image so that the user can check the area at hand including the input device 13 even when the user wears the immersive presentation device 11. .
  • a see-through window is an image generated by the edit reflection processing unit 34 cutting out a specific area of a captured image obtained by the imaging unit 21.
  • the area cut out as a see-through window on the captured image is a predetermined area in the vicinity of the user, for example, an area that is a part of the user's hand when the user is facing the front. Therefore, it can be said that the see-through window is an image including the input device 13 at hand of the user as a subject. Note that the photographed image may be used as a see-through window as it is.
  • a see-through window shown in FIG. 3 is displayed on the omnidirectional image for presentation.
  • the mouse ID 11 and the keyboard ID 12 as the input devices 13 existing in the real space and the both hands of the user who operates these input devices 13 are displayed in the see-through window SW11. Has been.
  • each subject in the see-through window SW11 is displayed at the same position as that of the subject in the real space when viewed from the user.
  • a position where the mouse ID 11 displayed on the see-through window SW11 as viewed from the user in a state where the user wears the immersive presentation device 11 is referred to as a model presentation position. If the user removes the immersive presentation device 11 from such a state, the user can see the actual mouse ID 11 at the model presentation position.
  • the user can operate his / her hand, the mouse ID 11 and the keyboard ID 12 at hand, while confirming the immersive presentation device 11.
  • the usability of the editing system can be improved. That is, it is possible to perform editing and the like more easily.
  • the renderer unit 35 refers to the position and orientation information of the immersive presentation device 11 supplied from the communication unit 36, and superimposes the see-through window SW11 on a corresponding position in the field of view of the actual photographing unit 21 on the omnidirectional image. Can be displayed. That is, in the renderer unit 35, the image of the see-through window SW11 is superimposed at a position on the omnidirectional image determined by the position and orientation of the immersive presentation device 11.
  • the position of the see-through window SW11 on the omnidirectional image for presentation moves in accordance with the movement of the head, and the user always moves his / her hand by the see-through window SW11. Can be confirmed.
  • the subject desired to see such as mouse ID 11 and keyboard ID 12 can be displayed on the see-through window SW 11.
  • the pen tablet ID 21 as the input device 13 existing in the real space in the see-through window SW12, the user's own hand, and the immersive operation held in the hand A pen-type input device PN21 as the unit 14 is displayed. Therefore, the user can perform an input operation to the pen tablet ID 21 with the input device PN21 while looking at the see-through window SW12.
  • the see-through window as described above is a self-projecting portion of the user's field of view that would be visible if the user did not wear the immersive presentation device 11 at the same position on the omnidirectional image for presentation. Projection graphics.
  • the user can easily operate the input device 13 and perform operations such as editing even when the immersive presentation device 11 is attached.
  • the user when the user uses his / her hand as the immersion operation unit 14, the user can move his / her hand and specify an arbitrary position (region) on the omnidirectional image for presentation.
  • a menu image MN11 such as a playback controller linked to the user's hand is displayed near the model HD11 of the user's hand displayed as an immersive operation part model image in the omnidirectional image for presentation as shown in FIG. If displayed, operability can be improved.
  • buttons for instructing operations related to reproduction and editing of the omnidirectional image such as reproduction of the omnidirectional image as a content and stop of reproduction, are provided.
  • the menu image MN11 is displayed at a predetermined position with respect to the hand model HD11.
  • the menu image MN11 is also moved in accordance with the movement of the hand. Moving. That is, the relative positional relationship between the hand model HD11 and the menu image MN11 is always the same.
  • the user can perform operations related to reproduction and editing of the omnidirectional image by moving the hand opposite to the hand corresponding to the hand model HD11 and operating the button on the menu image MN11.
  • the menu image MN 11 corresponds to the actual user's hand on the omnidirectional image by referring to the position / posture information of the user's hand as the immersion operation unit 14 supplied from the position / orientation detection unit 31. It can be displayed superimposed on the vicinity of the position.
  • the model of the user's hand and the menu image displayed in the vicinity thereof are self-projected graphics that project the actual immersion operation unit 14 and the virtual menu image onto the omnidirectional image for presentation. .
  • the user can easily perform operations such as editing by operating the menu image even when the immersive presentation device 11 is attached.
  • the auxiliary window is an auxiliary screen that is displayed on the omnidirectional image for presentation and allows the user to play and edit the omnidirectional image while wearing the immersive presentation device 11.
  • FIG. 5 is a diagram showing an example of an auxiliary window which is one of UI images.
  • the auxiliary window WD11 is mainly provided with a media bin area WR11, a timeline area WR12, an image display area WR13, and a reproduction system button display area WR14.
  • the media bin area WR11 is an area where thumbnail images of omnidirectional images to be edited imported by the edit reflection processing unit 34, that is, thumbnail images of material clips are displayed side by side.
  • the user can arrange the material clips corresponding to the designated thumbnail image side by side on the timeline in the timeline area WR12 by designating the thumbnail image displayed in the media bin area WR11.
  • Time memories also display time memories, and thumbnail images of clip materials corresponding to those times are displayed in the time portions indicated by the memories.
  • a cursor CR11 indicating the time to be processed is displayed so as to be superimposed on the timeline.
  • an image (frame) at the time indicated by the cursor CR11 is displayed in the image display area WR13.
  • an equirectangular two-dimensional image is displayed as a material clip (omnidirectional image).
  • the material clip being edited is displayed not only in the image display area WR13 in the auxiliary window WD11 on the omnidirectional image for presentation but also as an omnidirectional image constituting the omnidirectional image for presentation.
  • the material clip displayed as the omnidirectional image constituting the omnidirectional image for presentation is an image obtained by mapping an equirectangular image in a 3D model.
  • buttons for instructing playback, playback stop, fast forward, and fast reverse of the material clip being edited are displayed.
  • the user can play back and confirm the material clip being edited by operating the playback button, or stop playback at a desired position (time).
  • a tool box for designating an editing tool in a predetermined format such as a pull-down format is displayed.
  • the user can display the toolbox and specify the desired editing tool, specify the In and Out points, add effects, specify the front point of the omnidirectional image, insert text data such as titles, etc.
  • Various editing operations can be performed.
  • accompanying information is added to the omnidirectional image as a material clip, and the front point of the omnidirectional image can be set by the accompanying information.
  • the front point is the whole sky displayed in the front direction when viewed from the user wearing the immersive presentation device 11 when the immersive presentation device 11 starts displaying the omnidirectional image (material clip). This is the position on the sphere image.
  • accompanying information is added in advance to each material clip, and in the state before editing the material clip, the front point indicated by the accompanying information is the front point at the time of shooting.
  • the user can change the front point indicated by the accompanying information to a desired position by editing the accompanying information of each material clip using an editing tool or the like.
  • the designation of the position as the front point when editing the accompanying information may be performed by designating a position on the material clip (omnidirectional image) displayed in the image display area WR13 in the auxiliary window WD11. It may be performed by directly specifying a position on the omnidirectional image for presentation displayed on the immersive presentation device 11.
  • the in and out points of the material clip can be designated.
  • the user specifies the time to be the In point and the time to be the Out point of each material clip arranged on the timeline by the editing tool.
  • the edit reflection processing unit 34 cuts out the section from the In point to the Out point of the material clip for each material clip on the timeline, and connects the cut out sections of the material clips to one whole sky. Sphere image.
  • the transition effect is applied to the joint between the material clips, that is, the portion of the boundary position, for example, by a process such as dissolve, so that the image transitions from the material clip to the next material clip without a sense of incongruity.
  • the user designates a desired area of the material clip (omnidirectional image), and effects processing is performed on the designated area by an editing tool, or a title or the like is added to the designated area. It can also be inserted. For example, white balance adjustment and brightness adjustment can be performed as effect processing, noise reduction processing, and soft filter processing can be performed.
  • the area to be effected and the insertion position of the title may be specified by specifying an area on the material clip (omnidirectional image) displayed in the image display area WR13 in the auxiliary window WD11. Alternatively, it may be performed by directly specifying a region on the omnidirectional image for presentation displayed on the immersive presentation device 11.
  • the auxiliary window WD11 as described above is displayed not only on the omnidirectional image for presentation but also on the display 12.
  • the example in which the auxiliary window WD11 is displayed has been described here, only a part of the auxiliary window WD11 is displayed, for example, only the timeline is displayed on the omnidirectional image for presentation or the display 12. You may do it.
  • auxiliary window WD11 may be always displayed in the same position at the same position as viewed from the user wearing the immersive presentation device 11, or always in the same position in the omnidirectional image for presentation. May be displayed.
  • the auxiliary window WD11 is always displayed in the same position at the same position as viewed from the user wearing the immersive presentation device 11. In other words, it is assumed that the position and posture of the auxiliary window WD11 are fixed with respect to the immersive presentation device 11.
  • the auxiliary window WD11 is always displayed at the same position and in the same position as viewed from the user on the presentation omnidirectional image. Become. That is, even if the user moves the head, the relative positional relationship between the user and the auxiliary window WD11 does not change.
  • the auxiliary window WD11 is determined in advance at a predetermined position as viewed from the user on the omnidirectional image. Can be displayed in a superimposed manner.
  • the image of the auxiliary window WD11 is superimposed at a position on the omnidirectional image determined by the position and orientation of the immersive presentation device 11.
  • the renderer unit 35 causes the auxiliary window WD11 to be omnidirectional regardless of the direction of the user's head.
  • the image is superimposed and displayed at a predetermined position on the image in a predetermined posture.
  • the auxiliary window WD11 is fixedly displayed at a predetermined position in the world coordinate system with a predetermined position in the real space as the origin.
  • the display position of the auxiliary window WD11 viewed from the user changes according to the movement of the head. That is, the relative positional relationship between the user and the auxiliary window WD11 changes according to the movement of the user's head.
  • the user can move the position of the auxiliary window WD11 on the presentation omnidirectional image or change the size of the auxiliary window WD11 by operating the immersion operation unit 14 or the like. Also good.
  • the user moves the controller CT11 to move the model of the controller CT11 on the omnidirectional image for presentation, and sets the auxiliary window WD11 with the pointer extending from the model.
  • the state in which the auxiliary window WD11 is designated by the pointer is, for example, a state in which the pointer is at a position intersecting the auxiliary window WD11 and a predetermined button of the controller CT11 is pressed.
  • the user moves the display position of the auxiliary window WD11 or enlarges or reduces the auxiliary window WD11 by performing a drag operation by moving the controller CT11 while the auxiliary window WD11 is designated by the pointer. .
  • the user moves the auxiliary window WD11 by moving the controller CT11 that designates the auxiliary window WD11 with the pointer.
  • the movement destination position of the pointer is set as the movement destination position of the auxiliary window WD11.
  • the user enlarges or reduces the auxiliary window WD11 by moving the two controllers CT11 closer to or away from the state where the auxiliary window WD11 is designated by each of the two controllers CT11.
  • the auxiliary window WD11 is displayed in a curved state so as to have a concave curved surface shape when viewed from the user.
  • the user may be able to adjust the degree of bending of the auxiliary window WD11, that is, the degree of bending of the concave curved surface by operating the immersing operation unit 14 or the like.
  • the user operates the immersive operation unit 14 or the input device 13 to specify, for example, about 10 material clips (global images) in order, and instruct the reproduction of those material clips to display each material clip. Preview.
  • the operation detection unit 32 performs an operation to instruct the reproduction of the specified material clip according to the signal supplied from the immersion operation unit 14 or the input device 13 and the position / orientation information supplied from the position / orientation detection unit 31. Detection information is generated and supplied to the edit reflection processing unit 34.
  • the edit reflection processing unit 34 supplies the designated material clip to the renderer unit 35 in accordance with the operation detection information from the operation detection unit 32.
  • the renderer unit 35 supplies the presentation omnidirectional image having the material clip supplied from the edit reflection processing unit 34 as an omnidirectional image to the immersive presentation device 11 via the communication unit 36 and causes the immersive presentation device 11 to reproduce the omnidirectional image.
  • the user When the material clips are played and the preview of the material clips is completed, the user operates the immersive operation unit 14 or the input device 13 to specify a desired material clip and instructs the import of the specified material clip. .
  • the operation detection unit 32 generates operation detection information indicating that the material clip is imported in accordance with a user operation, and supplies the operation detection information to the edit reflection processing unit 34.
  • the edit reflection processing unit 34 imports the specified material clip according to the operation detection information from the operation detection unit 32.
  • the edit reflection processing unit 34 converts the material clip from image data in an equirectangular format to image data in a format obtained by mapping the image data to a 3D model as needed, and holds the material clip. It supplies to the part 33 and makes it hold
  • thumbnail images of the material clips are displayed side by side in the media bin area WR11 in the auxiliary window WD11 displayed on the immersive presentation device 11 or the display 12.
  • the user arranges each material clip on the timeline in the timeline area WR12 by operating the immersive operation unit 14 or the input device 13 to designate a thumbnail image in the media bin area WR11.
  • the edit reflection processing unit 34 displays the thumbnail image of the specified material clip on the timeline according to the operation detection information supplied from the operation detection unit 32, that is, the auxiliary window WD11 in which the user operation is reflected. Are generated and supplied to the renderer 35 and the display 12.
  • the renderer unit 35 generates an omnidirectional image for presentation by superimposing the image of the auxiliary window WD11 supplied from the edit reflection processing unit 34 on the omnidirectional image, and the obtained omnidirectional image is displayed on the communication unit. It is supplied to the immersive presentation device 11 via 36 and displayed.
  • the frame at the time indicated by the cursor CR11 of the material clip is displayed on the immersive presentation device 11 as the frame being edited. That is, the auxiliary window WD11 and other UI images superimposed on the frame of the material clip being edited as the omnidirectional image are displayed on the immersive presentation device 11 as the omnidirectional image for presentation.
  • the user operates the immersive operation unit 14 and the input device 13 to designate the in point and the out point for each material clip arranged in the timeline, and then instructs the omnidirectional image to add narration.
  • the operation detection unit 32 detects the user's operation based on the signal from the immersion operation unit 14 or the input device 13 and the position / orientation information supplied from the position / orientation detection unit 31, and an operation indicating the detection result.
  • the detection information is supplied to the edit reflection processing unit 34.
  • the edit reflection processing unit 34 cuts out and connects sections from the In point to the Out point of each material clip in accordance with the operation detection information supplied from the operation detection unit 32, that is, a portion where these material clips are connected, that is, Perform processing such as dissolve on the boundary. Further, the edit reflection processing unit 34 adds audio data of the designated narration to one omnidirectional image composed of the connected material clips.
  • the user operates the immersion operation unit 14 or the input device 13 to designate a front point for each material clip or insert a title at a desired position of the material clip.
  • the user operates the immersive operation unit 14 or the like and designates the position on the presentation omnidirectional image displayed on the immersive presentation device 11 as the title insertion position, the user intuitively inserts the title. You can specify the title size and insertion position.
  • the operation detection unit 32 detects a user operation based on the signals from the immersion operation unit 14 and the input device 13 and the position and orientation information supplied from the position and orientation detection unit 31. Then, operation detection information indicating the detection result is supplied to the edit reflection processing unit 34.
  • the edit reflection processing unit 34 edits the accompanying information of the material clip so that the front point of each material clip becomes a position designated by the user, Insert titles into clips.
  • the editing operation by the user is reflected in real time on the material clip (global image) being edited, and the material clip on which the editing operation is reflected is transferred from the editing reflection processing unit 34 to the renderer unit 35. Supplied with.
  • the renderer unit 35 performs rendering processing on the material clip (omnidirectional image) after the editing operation is reflected, generates a omnidirectional image for presentation, and displays it on the immersive presentation device 11. Therefore, the user can immediately confirm the material clip reflecting his / her editing operation while wearing the immersive presentation device 11.
  • the user When the user's editing work is completed and a final omnidirectional image is obtained, the user operates the immersive operation unit 14 or the input device 13 to reproduce the omnidirectional image obtained by editing. To preview the spherical image.
  • the operation detection unit 32 instructs the reproduction of the omnidirectional image according to the signal supplied from the immersion operation unit 14 or the input device 13 and the position and orientation information supplied from the position and orientation detection unit 31. Operation detection information is generated and supplied to the edit reflection processing unit 34.
  • the edit reflection processing unit 34 supplies the omnidirectional image obtained by editing to the renderer unit 35 in accordance with the operation detection information from the operation detection unit 32.
  • the renderer unit 35 performs a rendering process based on the omnidirectional image supplied from the edit reflection processing unit 34, and the obtained omnidirectional image for presentation is sent to the immersive presentation device 11 via the communication unit 36. Supply and regenerate.
  • the user When the user reproduces and confirms the omnidirectional image obtained by editing with the immersive presentation device 11, the user operates the immersive operation unit 14 or the input device 13 to instruct saving of the omnidirectional image. Then, the renderer unit 35 converts the omnidirectional image obtained by editing into image data in an appropriate format such as equirectangular image data (for example, an mp4 file) in accordance with a user operation, Output or record the obtained omnidirectional image.
  • an appropriate format such as equirectangular image data (for example, an mp4 file)
  • the user can easily perform all operations from the preview of the material clip to the preview of the edited and completed celestial sphere image while wearing the immersive presentation device 11.
  • the omnidirectional image is displayed on the immersive presentation device 11, that is, the celestial image at the time of playback is actually displayed.
  • the operation can be performed while checking each part of the omnidirectional image. Therefore, it is possible to more easily perform editing work as intended.
  • step S ⁇ b> 11 the position / orientation detection unit 31 detects the position and orientation of the immersion operation unit 14 and supplies position / orientation information indicating the detection result to the operation detection unit 32, the edit reflection processing unit 34, and the renderer unit 35. .
  • the communication unit 36 acquires the position / orientation information and the captured image of the immersive presentation device 11 from the immersive presentation device 11, supplies the position / orientation information to the renderer unit 35, and supplies the captured image to the edit reflection processing unit 34. .
  • step S ⁇ b> 12 the operation detection unit 32 receives an operation input from the user based on the position and orientation information supplied from the position and orientation detection unit 31, the signal supplied from the input device 13, and the signal supplied from the immersion operation unit 14. Operation detection information indicating the detection result is supplied to the edit reflection processing unit 34.
  • the operation detection unit 32 displays the detection result.
  • the operation detection information shown is generated and supplied to the edit reflection processing unit 34.
  • step S13 the edit reflection processing unit 34 determines whether editing is instructed by the user based on the operation detection information supplied from the operation detection unit 32.
  • step S13 when the operation detection information indicates an operation related to editing such as title insertion, front point designation, effect addition, in point and out point designation, it is determined that editing has been instructed.
  • step S14 the edit reflection processing unit 34 performs an editing process according to an operation input related to editing indicated by the operation detection information supplied from the operation detection unit 32.
  • the edit reflection processing unit 34 reads out the omnidirectional image held in the holding unit 33, inserts a title into the omnidirectional image, edits incidental information of the omnidirectional image, Processing such as applying effects to the celestial sphere image is performed as editing processing.
  • the edit reflection processing unit 34 supplies the omnidirectional image obtained by the editing process to the renderer unit 35, and the process proceeds to step S15.
  • step S13 when it is determined in step S13 that editing has not been instructed, the process of step S14 is not performed, and the process proceeds to step S15.
  • step S14 If it is determined that the process of step S14 has been performed or that editing has not been instructed in step S13, the edit reflection processing unit 34 generates a UI image in step S15.
  • step S15 for example, the above-described see-through window image, auxiliary window image, menu image, and the like are generated as UI images.
  • the edit reflection processing unit 34 cuts out a part of the captured image supplied from the communication unit 36 to generate a see-through window image, or the auxiliary window in which the user's operation is reflected based on the operation detection information. Or generate an image.
  • step S16 the edit reflection processing unit 34 generates an immersive operation unit model image based on the position and orientation information supplied from the position and orientation detection unit 31.
  • the edit reflection processing unit 34 supplies the UI image and the immersive operation unit model image generated in the processing of step S15 and step S16 to the renderer unit 35. Further, the auxiliary window as the UI image generated in step S15 is also supplied from the edit reflection processing unit 34 to the display 12, and the auxiliary window is displayed on the display 12.
  • step S ⁇ b> 17 the renderer unit 35 performs rendering processing based on the position and orientation information of the immersive presentation device 11 supplied from the communication unit 36 and the position and orientation information of the immersive operation unit 14 supplied from the position and orientation detection unit 31. .
  • the renderer unit 35 immerses the immersive operation unit model image and UI image at appropriate positions of the omnidirectional image supplied from the edit reflection processing unit 34 based on the position and orientation information of the immersive presentation device 11 and the immersive operation unit 14. Are superimposed to generate a presentation spherical image.
  • the renderer unit 35 appropriately converts the omnidirectional image for presentation into image data in a format that can be handled by the immersive presentation device 11 and supplies the image data to the communication unit 36.
  • step S18 the communication unit 36 outputs the omnidirectional image for presentation supplied from the renderer unit 35 to the immersive presentation device 11.
  • the immersive presentation device 11 displays the omnidirectional image for presentation supplied from the communication unit 36.
  • the renderer unit 35 supplies the omnidirectional image for presentation to the immersive presentation device 11 via the communication unit 36 and displays the omnidirectional image for presentation.
  • the renderer unit 35 displays a presentation omnidirectional image in which the operation input related to the editing is reflected in real time. The display on the immersive presentation device 11 is controlled.
  • the user wearing the immersive presentation device 11 confirms the omnidirectional image being edited with the immersive presentation device 11,
  • the input device 13 can be operated to perform editing work.
  • the communication unit 36 may output the omnidirectional image for presentation to another immersive presentation device different from the immersive presentation device 11. That is, the same presentation omnidirectional image may be simultaneously output to the immersive presentation device 11 and other immersive presentation devices. By doing in this way, the same omnidirectional image for presentation can be simultaneously viewed on a plurality of immersive presentation devices including the immersive presentation device 11.
  • step S19 the image processing apparatus 15 determines whether to end the process. For example, in step S19, when the end of editing is instructed by the user, it is determined to end the process.
  • step S19 If it is determined in step S19 that the process is not yet finished, the process returns to step S11, and the above-described process is repeated.
  • step S19 if it is determined in step S19 that the process is to be terminated, the content editing process is terminated.
  • the omnidirectional image obtained by editing is appropriately stored or output to an external device.
  • the editing system superimposes the UI image or the immersive operation unit model image on the omnidirectional image according to the user's operation to generate the omnidirectional image for presentation and displays it on the immersive presentation device 11. .
  • the user can perform an editing operation more easily while confirming the omnidirectional image while wearing the immersive presentation device 11.
  • FIG. 7 shows an example of a screen displayed on the immersive presentation device 11.
  • the omnidirectional image for presentation is displayed on the entire screen.
  • the controller CT11 is displayed as an immersive operation part model image at the lower center of the screen.
  • the immersive operation unit model image of the controller CT11 displayed on the screen is described as an immersive operation unit model image CT11.
  • the pointer 101 protrudes from the tip of the immersion operation unit model image CT11.
  • the pointer 101 is a picture similar to a laser pointer, and is displayed as a straight line of a predetermined color.
  • the tip of the pointer 101 points to a character 102 such as “demo”.
  • This character 102 is a character superimposed (overlaid) on the omnidirectional image for presentation.
  • a character will be described as an example, but a mark or the like may be used.
  • the character 102 is an example of an image superimposed on the presentation omnidirectional image.
  • the character 102 is displayed at the position P1 on the left side in the figure at time T1.
  • the tip of the immersive operation part model image CT11 faces the position P1, and the pointer 101 from the immersive operation part model image CT11 is pointing to the character 102.
  • the user operates a button on the controller CT11 (for example, the button 122 shown in FIG. 9) to move the controller CT11 in the right direction.
  • the character 102 is captured (dragged) and moved to the position P2.
  • the user can move the character 102 to a desired position in the omnidirectional image for presentation by performing a so-called drag and drop operation using the controller CT11.
  • the character 102 Since the user can perform such an operation while wearing the immersive presentation device 11, and can perform the operation while viewing the omnidirectional image for presentation presented by the immersive presentation device 11, for example, the character 102 is displayed in the background. It is possible to easily move from a position where it is difficult to see to a position where it is easy to see.
  • the user can perform an operation of changing the character 102 to a desired size while viewing the omnidirectional image for presentation.
  • the character 102 is displayed in a predetermined size.
  • the user wants to enlarge the character 102, the user performs an operation to expand the controller CT11, thereby 102 can be enlarged.
  • an immersion operation unit model image CT11L representing the controller CT11 (referred to as controller CT11L) held in the user's left hand and an immersion operation representing the controller CT11 (referred to as controller CT11R) held in the user's right hand.
  • controller CT11L an immersion operation unit model image CT11L representing the controller CT11
  • controller CT11R an immersion operation representing the controller CT11 held in the user's right hand.
  • the partial model image CT11R is displayed superimposed on the presentation omnidirectional image.
  • the character 102 is enlarged by performing an operation for expanding the controller CT11L and the controller CT11L to the left and right.
  • the character 102 is reduced.
  • the size change such as enlargement or reduction of the character 102 can be performed by a simple operation such as expanding or narrowing the two controllers CT11 to the left and right.
  • the size of the character 102 can be changed in the omnidirectional image for presentation, a desired size can be obtained while confirming the size on the omnidirectional image actually presented. can do.
  • controller CT11 capable of performing such an operation will be described.
  • the controller CT11 includes a touch pad 121, a button 122, and a button 123 as shown in FIG.
  • the touch pad 121 is a flat sensor, and is configured to perform the same operation as that of a mouse pointer by tracing or tapping the finger with the finger.
  • a predetermined process is assigned to the button 122 and the button 123, and when pressed, an instruction for the assigned operation can be issued.
  • the button 122 is operated when the character 102 superimposed on the omnidirectional image is selected (dragged).
  • controller CT11 shown in FIG. 9 is an example, and does not indicate a limitation.
  • the controller CT11 shown in FIG. 9 is provided with two buttons 122 and 123, a plurality of buttons may be further provided, such as a side surface and a back surface of the controller CT11, as shown in FIG. It may be provided in other parts.
  • the controller CT11 is equipped with the immersive presentation device 11 and is operated while viewing an image presented by the immersive presentation device 11. In other words, the user does not perform an operation while directly viewing the controller CT11. It is preferable that the controller CT11 has a simple configuration that allows operation without direct visual recognition.
  • the touch pad 121 is a device that can be easily operated even when the position is not relatively accurately confirmed, such as tracing with a finger or tapping, and a plurality of operations are assigned to the touch pad 121. By doing so, it becomes possible to issue an operation instruction easily.
  • the touch pad 121 is divided into five.
  • the upper part of the touch pad 121 is an area 121A
  • the right part of the touch pad 121 is an area 121B
  • the lower part of the touch pad 121 is an area 121C
  • the upper part of the touch pad 121 is an area 121D
  • the central part of the touch pad 121 is an area 121E.
  • tapping the area 121A it is possible to instruct to add or move a marker.
  • tapping the area 121B it is possible to instruct movement to the previous clip, and by tapping the area 121C.
  • the playback can be instructed to stop, tapping the area 121D can instruct to move to the next clip, and the area 121E can be instructed to play or pause. .
  • Such an operation is a simple operation that can be performed without directly viewing the controller CT11.
  • Such an operation is assigned to the touch pad 121 of the controller CT11 by dividing the area. This allocation may be provided with a mechanism that can be set (customized) by the user.
  • buttons 122 and 123 and the touch pad 121 may be used to issue a new operation instruction. For example, when the area 121A of the touch pad 121 is operated while pressing the button 122, an instruction to delete the attached marker is issued, and the area 121B of the touch pad 121 is operated while pressing the button 122. In such a case, an instruction may be assigned such that an instruction to fast-forward at 3 times speed is issued.
  • a guidance display may be displayed as shown in FIG.
  • marks related to the reproduction of content are displayed in positions corresponding to the respective regions 121 ⁇ / b> A to 121 ⁇ / b> E in a circle that is a replica of the shape of the touch pad 121.
  • a pause mark is displayed at a position corresponding to the area 121A
  • a mark for moving to the next mark is displayed at a position corresponding to the area 121B
  • a position corresponding to the area 121C is displayed.
  • a playback stop mark is displayed, a mark for moving to the previous mark (chapter) is displayed at a position corresponding to the area 121D, and a playback mark is displayed at a position corresponding to the area 121E.
  • Such a guidance display 151 may be always displayed, or may be displayed when the touch pad 121 is touched, for example. Further, for example, when the button 122 is operated while being displayed, the guidance in the guidance display 151 may be changed.
  • the guidance display 151 shown in FIG. 11 displays a mark related to content reproduction.
  • the mark may be switched to a mark related to content editing.
  • the mode switching such as the reproduction mode and the editing mode may be performed by operating the button 122, and guidance corresponding to the mode may be displayed on the guidance display 151.
  • a menu screen may be displayed when an operation unit to which an operation for displaying a menu of the touch pad 121, the button 122, or the button 123 is operated.
  • a menu 171 is displayed on the right side of the immersion operation unit model image CT11L representing the controller CT11L.
  • “item A”, “item B”, and “item C” are displayed as the menu 171.
  • the user can select a desired item from the items A, B, and C displayed on the menu 171 using the controller CT11R. For example, when the user wants to select item B, the user aligns the tip of the pointer 101 coming out from the tip of the controller CT11R (the immersion operation unit model image CT11R) with the item B.
  • the item B may be selected simply by combining, or the item B may be selected by operating the button 122 or the button 123 after the combination.
  • a submenu 172 is displayed on the right side of the menu 171.
  • more detailed selection items selected in the menu 171 are displayed.
  • “item a”, “item b”, and “item c” are displayed.
  • the operation for the user to select a desired item from the items in the submenu 172 is performed in the same manner as the operation for selecting a desired item from the items in the menu 171.
  • the menu 171 and the submenu 172 have a relationship arranged in the horizontal direction. Items in the menu 171 are arranged in the vertical direction, and items in the submenu 172 are also arranged in the vertical direction. As described above, the direction in which the menu is expanded (in this case, the horizontal direction) and the direction in which the items in the menu are arranged (in this case, the vertical direction) are different directions.
  • the controller CT 11 R (the tip) is sequentially moved in the horizontal direction.
  • the menu 171 is moved to the sub-menu 172, and there is a high possibility that the item to be selected will be excessively moved and other items will be selected by mistake.
  • the controller CT11 is also used for an operation of displaying or hiding the see-through window SW11 (FIG. 3).
  • an operation for instructing the display for example, when the button 123 is a button for instructing the display of the see-through window SW11, when the button 123 is operated, for presentation
  • a see-through window SW11 is displayed on the omnidirectional image. For example, as shown in FIG. 13, the see-through window SW11 is displayed at a predetermined position in the omnidirectional image for presentation.
  • the user can operate the keyboard and mouse while looking at the see-through window SW11.
  • the see-through window SW11 may be closed.
  • editing can be performed more easily while checking the omnidirectional image. Further, it is possible to provide a controller and a user interface suitable for editing while checking such a spherical image.
  • the processing of the flowcharts shown in FIGS. 14 and 15 is executed by receiving an operation from the immersing operation unit 14, determining the operation content by the operation detection unit 32, and processing by the edit reflection processing unit 34. .
  • step S101 the intersection position between the pointer and the omnidirectional image for presentation is detected. For example, when the omnidirectional image for presentation as shown in FIG. 7 is displayed, since the pointer 101 from the controller CT11 points to the position P1 at time T1, the coordinates of the position P1 are detected. Is done.
  • step S102 the intersection of spherical coordinates is converted into coordinates in equirectangular projection (hereinafter referred to as equirectangular coordinates).
  • the spherical coordinate is the coordinate in the omnidirectional image for presentation, in other words, the coordinate in the 360-degree image.
  • the equirectangular projection is a kind of map projection method, and since the parallels and meridians intersect at right angles and at equal intervals, it is also called a grid projection or square projection, and equirectangular coordinates are Coordinates in projection.
  • the coordinate conversion in step S102 is a process of converting three-dimensional coordinates into two-dimensional coordinates. Therefore, if such a process of converting three dimensions into two dimensions is performed, another conversion may be performed. In addition, it is not always necessary to perform processing by converting three-dimensional coordinates into two-dimensional coordinates, and it is also possible to configure so that processing is performed with three-dimensional coordinates.
  • the user can perform an editing operation by displaying a two-dimensional spherical image in an equirectangular (Equirectangular) format obtained by equirectangular projection on the display 12.
  • equirectangular equirectangular
  • step S102 when processing can be performed using conventional software as software for editing omnidirectional images, coordinates that can be handled by the software can be obtained by converting spherical coordinates to equirectangular coordinates. Can do. Therefore, as described above, when software that can be processed using three-dimensional coordinates is used, the processing in step S102 can be omitted and the processing can be continued using spherical coordinates.
  • step S101 and step S102 the coordinates of the position pointed to by the pointer at that time are obtained.
  • the controller CT11 is used and the pointer 101 is emitted, the position pointed to by the pointer 101 is always grasped.
  • step S103 the coordinates of the overlay are overwritten.
  • the character 102 is overlaid, the coordinates of the character 102 are obtained, and the coordinates of the character 102 are overwritten on the obtained coordinates. Is done.
  • the coordinates of the overlaid ones can also be converted from spherical coordinates to equirectangular coordinates and overwritten with the transformed equirectangular coordinates.
  • the position pointed to by the pointer 101 and the position of the overlaid object are managed in real time.
  • step S141 it is determined whether or not the button 122 of the controller CT11 has been operated.
  • the standby state is maintained until it is determined that the button 122 has been operated (the state where the real-time updater process is performed is maintained by executing the process of the flowchart shown in FIG. 14).
  • the process proceeds to step S142.
  • step S142 the intersection position of the pointer and the omnidirectional image is detected.
  • step S143 the intersection of the spherical coordinates is converted into equirectangular coordinates.
  • the processing in step S142 and step S143 is performed in the same manner as the processing in step S101 and step S102 in the flowchart shown in FIG.
  • step S144 it is determined whether there is an overlay.
  • the coordinates of the overlaid object for example, the character 102, are updated at predetermined intervals in the process of step S103 in FIG.
  • the determination process of step S144 is performed by determining whether or not the coordinates of the position pointed to by the pointer 101 obtained in the processes up to step S143 coincide with the coordinates of the managed overlay.
  • step S144 If it is determined in step S144 that there is no overlay, the process returns to step S141, and the subsequent processes are repeated. Even if it is determined that no button is overlaid because the button is operated, the process to be executed is executed by operating the button.
  • step S144 determines whether or not the button operation is maintained.
  • step S145 the determination process in step S145 is repeated until it is determined in step S145 that the button operation is maintained.
  • step S145 if it is determined that the operation of the button is not maintained, in other words, if it is determined that the user has released the button and dropped the character 102, in other words, the user has reached the desired position. If it is determined that the character 102 has been moved, the process proceeds to step S146.
  • step S146 the position indicated by the pointer when the button operation is finished and the intersection position of the omnidirectional image are detected.
  • step S147 the intersection of the spherical coordinates is converted into equirectangular coordinates.
  • the processing of step S146 and step S147 is performed basically in the same manner as the processing of step S142 and step S143. At this time, the character 102 is moved to the position desired by the user, that is, the position P2 in FIG.
  • step S148 the coordinates of the target overlay are overwritten. That is, in this case, the coordinates of the character 102 are rewritten to the coordinates of the movement destination. In this way, the positions (coordinates) of the overlaid characters and marks are managed.
  • the immersive operation unit model image obtained by copying the controller CT11 in the real space is displayed on the omnidirectional image for presentation in the virtual space, and the pointer from the controller CT11 indicates the position in the omnidirectional image for presentation.
  • an operation from the user is accepted and processed.
  • the above-described series of processing can be executed by hardware or can be executed by software.
  • a program constituting the software is installed in the computer.
  • the computer includes, for example, a general-purpose computer capable of executing various functions by installing a computer incorporated in dedicated hardware and various programs.
  • FIG. 16 is a block diagram showing an example of the hardware configuration of a computer that executes the above-described series of processes using a program.
  • a CPU Central Processing Unit
  • ROM Read Only Memory
  • RAM Random Access Memory
  • An input / output interface 505 is further connected to the bus 504.
  • An input unit 506, an output unit 507, a recording unit 508, a communication unit 509, and a drive 510 are connected to the input / output interface 505.
  • the input unit 506 includes a keyboard, a mouse, a microphone, a photographing element, and the like.
  • the output unit 507 includes a display, a speaker, and the like.
  • the recording unit 508 includes a hard disk, a nonvolatile memory, and the like.
  • the communication unit 509 includes a network interface or the like.
  • the drive 510 drives a removable recording medium 511 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory.
  • the CPU 501 loads the program recorded in the recording unit 508 to the RAM 503 via the input / output interface 505 and the bus 504 and executes the program, for example. Is performed.
  • the program executed by the computer (CPU 501) can be provided by being recorded in a removable recording medium 511 as a package medium or the like, for example.
  • the program can be provided via a wired or wireless transmission medium such as a local area network, the Internet, or digital satellite broadcasting.
  • the program can be installed in the recording unit 508 via the input / output interface 505 by attaching the removable recording medium 511 to the drive 510. Further, the program can be received by the communication unit 509 via a wired or wireless transmission medium and installed in the recording unit 508. In addition, the program can be installed in advance in the ROM 502 or the recording unit 508.
  • the program executed by the computer may be a program that is processed in time series in the order described in this specification, or in parallel or at a necessary timing such as when a call is made. It may be a program for processing.
  • the present technology can take a cloud computing configuration in which one function is shared by a plurality of devices via a network and is jointly processed.
  • each step described in the above flowchart can be executed by one device or can be shared by a plurality of devices.
  • the plurality of processes included in the one step can be executed by being shared by a plurality of apparatuses in addition to being executed by one apparatus.
  • This technique can also be set as the following structures.
  • An operation detection unit for detecting an operation input by the operation unit;
  • the immersive presentation device outputs and displays a part or all of the omnidirectional image on which the image of the operation unit is superimposed as a presentation image, and the operation input is reflected when the operation input is detected.
  • a display control unit for controlling the display of the presented image
  • the operation detection unit is an image processing device that detects coordinates of a position indicated by a pointer of the operation unit in the omnidirectional image.
  • the display control unit controls display of the presentation image so that the dragged image is displayed at a position where the dragged image is dropped;
  • the operation detection unit detects that the two operation units have spread in the left-right direction, detects that the enlargement of the image has been instructed, and detects that the two operation units have narrowed in the left-right direction
  • the image processing apparatus according to any one of (1) to (5), wherein the operation unit includes a touch pad, and the touch pad is divided into a plurality of areas, and a predetermined operation is assigned to each area. . (7) When the operation unit is operated and a menu is displayed, the menu is expanded in the horizontal direction, and the items in the menu are arranged in the vertical direction. (1) to (6) The image processing apparatus described. (8) Detects operation input from the operation unit, The immersive presentation device outputs and displays a part or all of the omnidirectional image on which the image of the operation unit is superimposed as a presentation image, and the operation input is reflected when the operation input is detected.
  • Controlling the display of the presented image as The detection of the operation input includes an image processing method including a step of detecting coordinates of a position indicated by a pointer of the operation unit in the omnidirectional image. (9) Detects operation input from the operation unit, The immersive presentation device outputs and displays a part or all of the omnidirectional image on which the image of the operation unit is superimposed as a presentation image, and the operation input is reflected when the operation input is detected. Controlling the display of the presented image as The detection of the operation input includes a step of detecting a coordinate of a position indicated by a pointer of the operation unit in the omnidirectional image.
  • immersive presentation device 12 display, 13 input device, 14 immersive operation part, 15 image processing device, 32 operation detection part, 33 holding part, 34 edit reflection processing part, 35 renderer part, 36 communication part, 121 touch pad, 122 , 123 button

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Processing Or Creating Images (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本技術は、より簡単に編集を行うことができるようにする画像処理装置および方法、並びにプログラムに関する。 操作部による操作入力を検出する操作検出部と、没入提示デバイスに対して、操作部の画像が重畳された全天球画像の一部または全部を提示画像として出力して表示させるとともに、操作入力が検出された場合、操作入力が反映されるように提示画像の表示を制御する表示制御部とを備え、操作検出部は、操作部のポインタが全天球画像内で指し示す位置の座標を検出する。本技術は、全天球画像を編集する編集システムに適用することができる。

Description

画像処理装置および方法、並びにプログラム
 本技術は、画像処理装置および方法、並びにプログラムに関し、特に、より簡単に編集を行うことができるようにした画像処理装置および方法、並びにプログラムに関する。
 従来、360度の全方位の画像である全方位画像が知られている(例えば、特許文献1参照)。そのような全方位画像のなかには360度の各方向、すなわち水平方向と垂直方向の全方位の画像である全天球画像がある。ユーザはVR(Virtual Reality)技術を利用したヘッドマウントディスプレイ等を用いることで全天球画像のコンテンツを視聴することが可能である。
 また、全天球画像は、複数のカメラで撮影することで得られた複数の広角画像をステッチ処理により繋ぎ合わせることで生成される。そして、ステッチ処理により得られた全天球画像に対して編集が行われ、最終的な全天球画像のコンテンツが生成される。
特開2003-143579号公報
 しかしながら、全天球画像の編集を行うことは容易ではなかった。
 すなわち、編集者は、正距円筒図法により得られる正距円筒(Equirectangular)形式の2次元の全天球画像をディスプレイに表示させて編集作業を行う。その後、編集者は編集により得られた全天球画像を実際にヘッドマウントディスプレイで表示させて編集内容等を確認する。
 このとき、編集内容の修正や更なる編集が必要である場合には、編集者はヘッドマウントディスプレイを自身の頭部から外して、さらにディスプレイに正距円筒形式の2次元の全天球画像を表示させ、編集作業を行うことになる。
 このように全天球画像の編集時には、編集者は、編集後の全天球画像を確認するたびにヘッドマウントディスプレイを着脱しなければならず面倒であった。
 本技術は、このような状況に鑑みてなされたものであり、より簡単に編集を行うことができるようにするものである。
 本技術の一側面の画像処理装置は、操作部による操作入力を検出する操作検出部と、没入提示デバイスに対して、前記操作部の画像が重畳された全天球画像の一部または全部を提示画像として出力して表示させるとともに、前記操作入力が検出された場合、前記操作入力が反映されるように前記提示画像の表示を制御する表示制御部とを備え、前記操作検出部は、前記操作部のポインタが前記全天球画像内で指し示す位置の座標を検出する。
 本技術の一側面の画像処理方法は、操作部による操作入力を検出し、没入提示デバイスに対して、前記操作部の画像が重畳された全天球画像の一部または全部を提示画像として出力して表示させるとともに、前記操作入力が検出された場合、前記操作入力が反映されるように前記提示画像の表示を制御するステップを含み、前記操作入力の検出は、前記操作部のポインタが前記全天球画像内で指し示す位置の座標を検出するステップを含む。
 本技術の一側面のプログラムは、操作部による操作入力を検出し、没入提示デバイスに対して、前記操作部の画像が重畳された全天球画像の一部または全部を提示画像として出力して表示させるとともに、前記操作入力が検出された場合、前記操作入力が反映されるように前記提示画像の表示を制御するステップを含み、前記操作入力の検出は、前記操作部のポインタが前記全天球画像内で指し示す位置の座標を検出するステップを含む処理をコンピュータに実行させる。
 本技術の一側面の画像処理装置、画像処理方法、並びにプログラムにおいては、操作部による操作入力が検出され、没入提示デバイスに対して、操作部の画像が重畳された全天球画像の一部または全部が提示画像として出力されて表示されるとともに、操作入力が検出された場合、操作入力が反映されるように提示画像の表示が制御される。操作入力の検出は、操作部のポインタが全天球画像内で指し示す位置の座標が検出される。
 なお、画像処理装置は、独立した装置であっても良いし、1つの装置を構成している内部ブロックであっても良い。
 また、プログラムは、伝送媒体を介して伝送することにより、または、記録媒体に記録して、提供することができる。
 本技術の一側面によれば、より簡単に編集を行うことができる。
 なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載された何れかの効果であってもよい。
編集システムの構成例を示す図である。 没入操作部モデル画像について説明する図である。 シースルーウィンドウについて説明する図である。 メニュー画像について説明する図である。 補助ウィンドウの例を示す図である。 コンテンツ編集処理を説明するフローチャートである。 編集例について説明するための図である。 編集例について説明するための図である。 コントローラの構成について説明するための図である。 コントローラ上の領域について説明するための図である。 案内表示について説明するための図である。 メニューの表示について説明するための図である。 シースルーウィンドウの表示例を示す図である。 リアルタイムアップデートに関する処理について説明するためのフローチャートである。 移動に関する処理について説明するためのフローチャートである。 コンピュータの構成例を示す図である。
 以下、図面を参照して、本技術を適用した実施の形態について説明する。
〈第1の実施の形態〉
〈編集システムの構成例〉
 本技術は、VRコンテンツ、特に全天球画像の編集やオーサリングに関し、ステッチ処理により得られた全天球画像を編集して、いわゆる完全パッケージと呼ばれる完成したコンテンツを生成する技術に関する。なお、全天球画像は、静止画像でも動画像でもよいが、以下では全天球画像が動画像であるものとして説明を続ける。
 図1は、本技術を適用した編集システムの一実施の形態の構成例を示す図である。
 図1に示す編集システムは、没入提示デバイス11、ディスプレイ12、入力デバイス13、没入操作部14、および画像処理装置15を有している。
 この編集システムでは、ユーザは没入提示デバイス11を頭部に装着し、没入提示デバイス11により提示(表示)された全天球画像をリアルタイムで確認しながら入力デバイス13や没入操作部14を操作して全天球画像の編集を行う。
 このとき、例えば編集者となるユーザは没入提示デバイス11を頭部に装着して全天球画像をプレビューしたり編集したりするが、編集者ではない他のユーザも全天球画像の編集の様子を確認することができるようにディスプレイ12が配置されている。すなわち、ディスプレイ12には、適宜、全天球画像の編集に関する画面が表示されるようになされており、編集者以外のユーザはディスプレイ12の表示を見ることで、編集の様子を確認することができる。
 没入提示デバイス11は、例えばヘッドマウントディスプレイ等からなり、画像処理装置15から供給された全天球画像を表示する。
 なお、以下では没入提示デバイス11がユーザの頭部に装着可能なヘッドマウントディスプレイである場合を例として説明するが、没入提示デバイス11は全天球画像を再生可能なものであれば、どのようなものであってもよい。
 例えば没入提示デバイス11として、複数の平面形状の表示部から構成されるCAVE型ディスプレイや、ドーム形状などの曲面形状の表示部から構成されるディスプレイなど、ユーザを取り囲む没入ディスプレイを採用することも可能である。その他、没入提示デバイス11の表示部は半透明な透過型の表示部であってもよいし、非透過型の表示部であってもよい。
 没入提示デバイス11は撮影部21を有しており、撮影部21は没入提示デバイス11の前方の画像を撮影する。撮影部21による撮影によって得られる撮影画像は、没入提示デバイス11を装着しているユーザの前方、特に入力デバイス13があるユーザの手元の部分を被写体として含む画像となっている。
 没入提示デバイス11は、撮影部21で得られた撮影画像と、没入提示デバイス11の3次元空間上、すなわち実空間上の位置および姿勢を示す位置姿勢情報とを画像処理装置15に供給する。
 ディスプレイ12は、例えば液晶表示デバイスなどからなり、適宜、画像処理装置15から供給された画像を表示する。
 入力デバイス13は、例えばキーボードやマウス、ペンタブレット等からなり、編集者となるユーザの操作に応じた信号を画像処理装置15に供給する。
 没入操作部14は、例えば全天球画像の再生や編集のための専用のコントローラ、ゲーム機器のコントローラ、ペンタブレットのペン等のペン型の入力デバイスなどからなる。例えば没入操作部14としての専用のコントローラには、ボタンやタッチパッドなどが設けられている。また、ユーザ自身の手を没入操作部14として用いることも可能である。
 没入操作部14は、編集者となるユーザによる操作を受けて、その操作に応じた信号を画像処理装置15に供給する。
 画像処理装置15は、編集システム全体を制御する。画像処理装置15は、位置姿勢検出部31、操作検出部32、保持部33、編集反映処理部34、レンダラ部35、および通信部36を有している。
 これらの位置姿勢検出部31乃至通信部36の少なくとも一部は、全天球画像を編集したりプレビューしたりして、編集により得られた全天球画像を所望の形式で出力可能な編集ソフトウェアにより実現される。
 位置姿勢検出部31は、没入操作部14の3次元空間上、すなわち実空間上の位置および姿勢を検出し、その検出結果を示す位置姿勢情報を操作検出部32、編集反映処理部34、およびレンダラ部35に供給する。
 例えば没入操作部14が専用のコントローラである場合、没入操作部14には複数のセンサが内蔵されており、図示せぬ検出ユニットが没入操作部14の各センサからの出力を受信して没入操作部14の位置および姿勢を検出する。このような場合には、位置姿勢検出部31は、検出ユニットから没入操作部14の位置および姿勢を示す情報を取得することで、没入操作部14の位置および姿勢を検出する。
 その他、例えば位置姿勢検出部31が有する複数のカメラ等を利用して、没入操作部14としてのユーザの手やペン型の入力デバイスの位置および姿勢を検出してもよい。さらに、例えば位置姿勢検出部31がユーザの手に取り付けられたセンサの出力等に基づいて没入操作部14としてのユーザの手の位置および姿勢を検出するようにしてもよい。
 操作検出部32は、入力デバイス13や没入操作部14から供給された信号と、位置姿勢検出部31から供給された位置姿勢情報とに基づいてユーザの操作入力を検出する。操作検出部32は、ユーザによる操作入力の検出結果を示す操作検出情報を編集反映処理部34に供給する。
 保持部33は、編集対象となる全天球画像を保持しており、保持している全天球画像を編集反映処理部34に供給したり、編集反映処理部34から供給された全天球画像を保持したりする。
 ここで、保持部33に保持されている全天球画像は、例えば正距円筒(Equirectangular)形式の2次元の全天球画像を球の内側の面や立方体の内側の面など、3Dモデルにマッピングすることにより得られた画像である。
 なお、保持部33に保持される全天球画像は、互いに視差を有する左眼用の画像と右眼用の画像とからなるステレオスコピック3Dの画像、つまり3Dの立体画像とすることができる。
 編集反映処理部34は、保持部33から全天球画像を読み出すとともに、読み出した全天球画像に対して操作検出部32から供給された操作検出情報に応じた編集処理を行い、その結果得られた編集後の全天球画像をレンダラ部35に供給する。
 また、編集反映処理部34は、位置姿勢検出部31から供給された位置姿勢情報に基づいて没入操作部14を模した没入操作部モデル画像を生成し、レンダラ部35に供給する。
 例えば没入操作部モデル画像は、3Dモデルにより生成された没入操作部14の画像、つまり没入操作部14のモデルの画像であり、没入操作部モデル画像により表される没入操作部14のモデルは、実際の没入操作部14と同じ姿勢となっている。
 さらに編集反映処理部34は、操作検出部32から供給された操作検出情報や、通信部36を介して没入提示デバイス11から供給された撮影画像に基づいて、全天球画像の編集や再生を行うためのUI(User Interface)画像を生成し、レンダラ部35に供給する。
 UI画像の一部は、必要に応じて編集反映処理部34からディスプレイ12にも供給され、ディスプレイ12により表示される。
 レンダラ部35は、通信部36を介して没入提示デバイス11から供給された位置姿勢情報、および位置姿勢検出部31から供給された位置姿勢情報に基づいてレンダリング処理を行う。
 すなわち、レンダラ部35は、没入提示デバイス11および没入操作部14の位置姿勢情報と、編集反映処理部34から供給された全天球画像、没入操作部モデル画像、およびUI画像とに基づいて提示用の画像である提示用全天球画像を生成する。
 レンダリング処理では、レンダラ部35は没入提示デバイス11や没入操作部14の位置姿勢情報に基づいて、全天球画像上の適切な位置に没入操作部モデル画像やUI画像を重畳することで提示用全天球画像を生成する。
 なお、提示用全天球画像は、全天球画像に没入操作部モデル画像やUI画像を重畳して得られる画像に限らず、全天球画像の一部の領域の画像に没入操作部モデル画像やUI画像を重畳して得られる画像とされてもよい。換言すれば、没入操作部モデル画像やUI画像が重畳された全天球画像の一部または全部の領域の画像を提示用全天球画像とすることができる。
 また、レンダラ部35は必要に応じて提示用全天球画像を、例えば正距円筒形式の画像データなど、没入提示デバイス11で取り扱うことが可能な形式の画像データに変換し、その結果得られた提示用全天球画像を通信部36に供給する。
 通信部36は有線または無線により没入提示デバイス11と通信する。例えば通信部36は、レンダラ部35から供給された提示用全天球画像を没入提示デバイス11に出力したり、没入提示デバイス11から供給された位置姿勢情報をレンダラ部35に供給したり、没入提示デバイス11から供給された撮影画像を編集反映処理部34に供給したりする。
 また、通信部36は、没入提示デバイス21とは異なる他の没入提示デバイスにも提示用全天球画像を出力することが可能である。
 例えば没入提示デバイス11を装着している編集者であるユーザと同じ場所またはそのユーザとは離れた場所に、編集者とは異なる1または複数のユーザがおり、それらのユーザも没入提示デバイスを装着しているとする。
 この場合、通信部36が没入提示デバイス11に対して出力する提示用全天球画像と同じものを、編集者とは異なるユーザが装着している没入提示デバイスにも出力すれば、それらのユーザと編集者とは同じ提示用全天球画像を同時に見ることができる。
 図1に示す編集システムでは、レンダラ部35から出力された提示用全天球画像は、通信部36を介して没入提示デバイス11へと供給されて表示される。また、ユーザによる全天球画像の編集に関する操作入力が行われると、その操作入力が直ちに(リアルタイムに)反映された提示用全天球画像がレンダラ部35から出力される。
 したがって、レンダラ部35は、没入提示デバイス11に対して提示用全天球画像を出力(供給)して表示させることで、没入提示デバイス11における提示用全天球画像の表示を制御する表示制御部として機能するということができる。
 また、編集反映処理部34は、ユーザによる編集に関する操作がリアルタイムで反映された全天球画像や、UI画像、没入操作部モデル画像を生成する画像処理部として機能するということができる。
〈没入操作部モデル画像とUI画像の表示について〉
 以上において説明した編集システムでは、没入提示デバイス11を装着したユーザ(編集者)が、没入提示デバイス11を頭部から外すことなく全天球画像のプレビューや編集などの基本的な作業を全て行うことができるようになっている。
 例えばユーザが没入提示デバイス11を装着して提示用全天球画像を再生している状態では、ユーザが自身の頭部を動かすと、提示用全天球画像におけるユーザの頭部の方向に応じた領域がユーザに対して提示された状態となる。したがって、ユーザはあたかも提示用全天球画像により表示される空間の中にいるかのように感じることができる。
 提示用全天球画像には、編集対象となるコンテンツ自体である全天球画像に加えて、上述した没入操作部モデル画像と、UI画像とが重畳表示されている。
 また、例えばUI画像として、撮影画像の一部を切り出したシースルーウィンドウ、全天球画像の再生や編集のためのメニュー項目からなるメニュー画像、全天球画像の再生や編集を行うためのウィンドウ(画面)であり、ディスプレイ12にも表示される補助ウィンドウが提示用全天球画像に表示される。
 ここで、没入操作部モデル画像、シースルーウィンドウ、メニュー画像、および補助ウィンドウについて説明する。
 まず、没入操作部モデル画像について説明する。
 例えば、図2に示すように没入操作部14として専用のコントローラやペン型の入力デバイスが用いられることがある。
 すなわち、図2の矢印A11に示すように、ユーザが没入操作部14としての専用のコントローラCT11を手で持って各種の操作を行うこともあれば、矢印A12に示すように、ユーザが没入操作部14としてのペン型の入力デバイスPN11を手で持って各種の操作を行うこともある。
 例えば矢印A11に示すように、ユーザがコントローラCT11を没入操作部14として用いる場合、画像処理装置15では、位置姿勢検出部31によりコントローラCT11の位置および姿勢がトラッキングされる。
 そして、提示用全天球画像上では、没入操作部モデル画像として、コントローラCT11を模した画像が表示される。
 このとき、没入操作部モデル画像により表されるコントローラCT11のモデルは、実際のコントローラCT11と全く同じ位置および姿勢で表示される。
 すなわち、ユーザが没入提示デバイス11を装着している状態で、ユーザから見て没入操作部モデル画像として表示されているコントローラCT11のモデルがある位置を、モデル提示位置と呼ぶこととする。この例ではユーザにはモデル提示位置にコントローラCT11のモデルがあるかのように没入操作部モデル画像が提示されている。
 このような状態から、ユーザが没入提示デバイス11を外したとすると、ユーザにはモデル提示位置に実際のコントローラCT11が見える状態となっている。
 このように実際のコントローラCT11の位置と全く同じ位置に、実際のコントローラCT11の姿勢と全く同じ姿勢でコントローラCT11の没入操作部モデル画像を表示させることで、ユーザは簡単かつ直感的に没入操作部14による操作を行うことができる。その結果、より簡単に編集等の作業を行うことができる。
 編集反映処理部34では、位置姿勢検出部31で得られたコントローラCT11の位置および姿勢の検出結果に基づいて、没入操作部モデル画像が生成される。また、レンダラ部35では、位置姿勢検出部31から供給されるコントローラCT11の位置姿勢情報を参照すれば、コントローラCT11の没入操作部モデル画像を、全天球画像上における実際のコントローラCT11に対応する位置に重畳することができる。換言すれば、レンダラ部35は、全天球画像上におけるコントローラCT11の位置姿勢情報により定まる位置に、没入操作部モデル画像を表示させることができる。
 例えば、没入操作部14としてコントローラCT11を用いる場合、提示用全天球画像上では、没入操作部モデル画像により表されるコントローラCT11のモデルから直線状のポインタが表示される。
 このポインタは、ユーザが実際のコントローラCT11を動かすと、提示用全天球画像上においてコントローラCT11のモデルとともに動くので、ユーザはコントローラCT11を動かすことで、ポインタにより提示用全天球画像上の任意の位置を指し示すことができる。そのため、例えばユーザはポインタにより全天球画像上の所望の位置を指定し、その所望の位置が指定された状態で実際のコントローラCT11のボタンを操作するなどして、全天球画像の指定した領域にエフェクトを施すなどの操作入力を行うことができる。
 その他、例えばユーザはポインタにより全天球画像上のメニュー画像等のUIのボタンを指定して実行を指示するなどし、全天球画像の再生や編集に関する操作を行うこともできる。
 なお、操作検出部32では、実際のコントローラCT11の位置姿勢情報を参照すれば、ポインタと提示用全天球画像とが交差する位置、すなわちポインタにより指定されている提示用全天球画像上の位置を特定することができる。
 また、図2の矢印A12に示すように、没入操作部14として入力デバイスPN11が用いられる場合にも、コントローラCT11における場合と同様に入力デバイスPN11の位置および姿勢がトラッキングされる。
 そして、提示用全天球画像上では、実際の入力デバイスPN11と同じ位置に、入力デバイスPN11と同じ姿勢で、没入操作部モデル画像として入力デバイスPN11のモデルが表示される。
 この場合、ユーザは入力デバイスPN11により入力デバイス13としてのペンタブレットを操作して所望の操作入力を行うことができるだけでなく、入力デバイスPN11を動かすことで入力デバイスPN11のモデルにより提示用全天球画像上の任意の位置を指定することもできる。
 したがって、例えばユーザは、入力デバイスPN11のモデルにより提示用全天球画像上のメニュー画像等のUIのボタンを指定するなどし、全天球画像の再生や編集に関する操作を行うこともできる。同様に、ユーザは入力デバイスPN11のモデルにより全天球画像上の任意の位置を指定し、その位置を含む領域にエフェクトを施す等の操作入力を行うこともできる。
 操作検出部32では、コントローラCT11における場合と同様に、入力デバイスPN11の位置姿勢情報を参照することで、入力デバイスPN11により指定されている空間上の位置、すなわち提示用全天球画像上の位置を特定することができる。
 また、没入操作部14としてユーザ自身の手を用いる場合にも、入力デバイスPN11と同様にして没入操作部モデル画像を表示させ、提示用全天球画像上の任意の位置を指定することができる。
 その他、没入操作部14の例としてマウスやキーボードなどについても位置および姿勢をトラッキングし、提示用全天球画像上にそれらのマウスやキーボードのモデルを没入操作部モデル画像として表示させるようにしてもよい。この場合においてもマウスやキーボードのモデルは、実際の没入操作部14としてのマウスやキーボードと同じ位置に同じ姿勢で表示される。
 以上のような没入操作部モデル画像は、実際の没入操作部14を、提示用全天球画像上の同じ位置に同じ姿勢で投影する自己投影グラフィックスである。
 次に、編集反映処理部34で生成されるUI画像の1つであるシースルーウィンドウについて説明する。
 例えばユーザが没入提示デバイス11を頭部に装着した状態では、基本的にはユーザは、自身の手元にあるマウスやキーボード、ペンタブレットといった入力デバイス13を目視で確認することができない。このように入力デバイス13がユーザに見えない状態では、全天球画像の編集等を行う際に、手探りで入力デバイス13を見つけたり操作したりしなければならず、不便である。
 そこで、編集システムでは、ユーザが没入提示デバイス11を装着した状態でも入力デバイス13を含む自身の手元の領域を確認することができるように、シースルーウィンドウが全天球画像に重畳されて表示される。
 例えばシースルーウィンドウは、撮影部21で得られた撮影画像の特定の領域を編集反映処理部34が切り出すことで生成される画像である。撮影画像上におけるシースルーウィンドウとして切り出される領域は、予め定められたユーザ近傍の領域であり、例えばユーザが大よそ正面を向いている状態でユーザの手元の部分となる領域などとされる。したがって、シースルーウィンドウは、被写体としてユーザの手元にある入力デバイス13が含まれている画像であるということができる。なお、撮影画像がそのままシースルーウィンドウとされてもよい。
 具体的な例として、例えば提示用全天球画像上には、図3に示すシースルーウィンドウが表示される。
 すなわち、図3の矢印A21に示す例では、シースルーウィンドウSW11内には実空間上に存在する入力デバイス13としてのマウスID11およびキーボードID12と、それらの入力デバイス13を操作するユーザの両手とが表示されている。
 ここで、シースルーウィンドウSW11内の各被写体は、ユーザから見て実空間上のそれらの被写体の位置と同じ位置に表示されている。
 例えばユーザが没入提示デバイス11を装着している状態で、ユーザから見てシースルーウィンドウSW11上に表示されているマウスID11がある位置を、モデル提示位置と呼ぶこととする。このような状態から、ユーザが没入提示デバイス11を外したとすると、ユーザにはモデル提示位置に実際のマウスID11が見える状態となっている。
 このようにシースルーウィンドウSW11では、実際の位置と全く同じ位置に撮影部21の視野の一部により見えているもの、特にユーザの手元にあるものが表示される。
 したがって、ユーザは自分の手や、手元にあるマウスID11、キーボードID12などを、没入提示デバイス11を装着した状態で確認しながら操作することができる。これにより、編集システムの使い勝手を向上させることができる。すなわち、より簡単に編集等の作業を行うことができる。
 なお、レンダラ部35では、通信部36から供給される没入提示デバイス11の位置姿勢情報を参照すれば、シースルーウィンドウSW11を全天球画像上における実際の撮影部21の視野の対応する位置に重畳表示させることができる。すなわち、レンダラ部35では、没入提示デバイス11の位置および姿勢により定まる全天球画像上の位置にシースルーウィンドウSW11の画像が重畳される。
 したがって、例えばユーザが頭部を動かせば、その頭部の動きに合わせて提示用全天球画像上におけるシースルーウィンドウSW11の位置も移動することになり、ユーザは常に自身の手元をシースルーウィンドウSW11により確認することができる。
 特に、ユーザが自身の頭部の向きを適切に調整することで、マウスID11やキーボードID12など、自分の見たい被写体がシースルーウィンドウSW11上で表示されるようにすることができる。
 また、例えば図3の矢印A22に示す例では、シースルーウィンドウSW12内には実空間上に存在する入力デバイス13としてのペンタブレットID21と、ユーザ自身の手と、その手に保持している没入操作部14としてのペン型の入力デバイスPN21とが表示されている。したがって、ユーザはシースルーウィンドウSW12を見ながら入力デバイスPN21によりペンタブレットID21への入力操作を行うことができる。
 以上のようなシースルーウィンドウは、ユーザが没入提示デバイス11を装着していなければ見えているであろうユーザの視野の一部の領域を、提示用全天球画像上の同じ位置に投影する自己投影グラフィックスである。
 提示用全天球画像上にシースルーウィンドウを表示させることで、ユーザは没入提示デバイス11を装着した状態でも容易に入力デバイス13を操作して編集等の作業を行うことができる。
 続いて、編集反映処理部34で生成されるUI画像の1つであるメニュー画像について説明する。
 例えばユーザが自身の手を没入操作部14として用いる場合、ユーザは自身の手を動かして提示用全天球画像上の任意の位置(領域)を指定することができる。
 この場合、例えば図4に示すように提示用全天球画像における没入操作部モデル画像として表示されているユーザの手のモデルHD11近傍に、ユーザの手にリンクした再生コントローラ等のメニュー画像MN11を表示させれば操作性を向上させることができる。
 この例では、例えばメニュー画像MN11上には、コンテンツである全天球画像の再生や再生停止など、全天球画像の再生や編集に関する操作を指示するためのボタンが設けられている。
 また、メニュー画像MN11は、手のモデルHD11に対して予め定められた位置に表示されるようになされており、ユーザが自身の手を移動させると、その手の移動に合わせてメニュー画像MN11も移動する。すなわち、手のモデルHD11とメニュー画像MN11との相対的な位置関係は常に同じとなっている。ユーザは、手のモデルHD11に対応する手とは反対の手を動かしてメニュー画像MN11上のボタンを操作することで、全天球画像の再生や編集に関する操作を行うことができる。
 レンダラ部35では、位置姿勢検出部31から供給される没入操作部14としてのユーザの手の位置姿勢情報を参照すれば、メニュー画像MN11を全天球画像上における実際のユーザの手に対応する位置近傍に重畳表示させることができる。
 以上のようなユーザの手のモデルとその近傍に表示されるメニュー画像は、実際の没入操作部14と仮想的なメニュー画像を、提示用全天球画像上に投影する自己投影グラフィックスである。提示用全天球画像上にメニュー画像を表示させることで、ユーザは没入提示デバイス11を装着した状態でも容易にメニュー画像に対する操作により編集等の作業を行うことができる。
 さらに、編集反映処理部34で生成されるUI画像の1つである補助ウィンドウについて説明する。
 補助ウィンドウは、提示用全天球画像上に表示される、ユーザが没入提示デバイス11を装着したままの状態で全天球画像の再生や編集を行うための補助画面である。
 図5は、UI画像の1つである補助ウィンドウの一例について示す図である。
 この例では、補助ウィンドウWD11には主にメディアビン領域WR11、タイムライン領域WR12、画像表示領域WR13、および再生系ボタン表示領域WR14が設けられている。
 例えばメディアビン領域WR11は、編集反映処理部34によりインポートされた編集対象となる全天球画像のサムネイル画像、つまり素材クリップのサムネイル画像が並べられて表示される領域である。
 ユーザは、メディアビン領域WR11内に表示されているサムネイル画像を指定することで、指定したサムネイル画像に対応する素材クリップをタイムライン領域WR12内のタイムライン上に並べて配置することができる。
 タイムライン領域WR12には、メディアビン領域WR11上で指定されたクリップ素材のサムネイル画像が時系列に並べられるタイムラインが表示されている。タイムラインには時刻のメモリも表示されており、メモリにより示される時刻の部分には、それらの時刻に対応するクリップ素材のサムネイル画像が表示されている。
 また、タイムライン領域WR12ではタイムラインに重畳されて、処理対象とされている時刻を示すカーソルCR11も表示されている。編集中の素材クリップ(全天球画像)のうち、カーソルCR11により示される時刻の画像(フレーム)が画像表示領域WR13内に表示される。
 なお、画像表示領域WR13では、素材クリップ(全天球画像)として正距円筒形式の2次元の画像が表示されている。編集中の素材クリップは、提示用全天球画像上の補助ウィンドウWD11における画像表示領域WR13に表示されるだけでなく、提示用全天球画像を構成する全天球画像としても表示される。この場合、提示用全天球画像を構成する全天球画像として表示される素材クリップは、正距円筒形式の画像を3Dモデルにマッピングして得られる画像である。
 再生系ボタン表示領域WR14には、編集中の素材クリップの再生や再生停止、早送り、早戻しなどを指示するためのボタン(以下、再生系ボタンとも称する)が表示されている。ユーザは再生系ボタンを操作することにより、編集中の素材クリップを再生して確認したり、所望の位置(時刻)で再生を停止させたりすることができる。
 さらに、矢印A41に示す部分のボタンを操作すると、例えばプルダウン形式などの所定の形式で編集ツールを指定するためのツールボックスが表示される。
 ユーザは、ツールボックスを表示させて所望の編集ツールを指定するなどして、イン点やアウト点の指定、エフェクトの付加、全天球画像の正面点の指定、タイトル等のテキストデータの挿入など、各種の編集作業を行うことができる。
 具体的には、例えば素材クリップとしての全天球画像には付随情報が付加されており、付随情報により全天球画像の正面点を設定できるようになされている。
 ここで、正面点とは没入提示デバイス11で全天球画像(素材クリップ)の表示を開始させるときに、没入提示デバイス11を装着しているユーザから見て正面の方向に表示される全天球画像上の位置である。
 例えば各素材クリップには予め付随情報が付加されており、素材クリップの編集前の状態では付随情報により示される正面点は撮影時の正面点となっている。素材クリップの編集時には、ユーザは編集ツール等を利用して各素材クリップの付随情報を編集することで、付随情報により示される正面点を所望の位置に変更することができる。
 例えば付随情報編集時における正面点とする位置の指定は、補助ウィンドウWD11における画像表示領域WR13に表示された素材クリップ(全天球画像)上の位置を指定することにより行われてもよいし、没入提示デバイス11に表示された提示用全天球画像上の位置を直接指定することにより行われてもよい。
 なお、ここでは素材クリップの付随情報の例として正面点を編集できる例について説明したが、その他、付随情報として他のどのような情報を編集できるようにしてもよい。
 また、補助ウィンドウWD11では素材クリップのイン点とアウト点を指定することができるようになされている。例えば、ユーザが編集ツールによりタイムライン上に並べられた各素材クリップのイン点とする時刻とアウト点とする時刻とを指定したとする。
 この場合、編集反映処理部34ではタイムライン上の各素材クリップについて素材クリップのイン点からアウト点までの区間が切り出され、それらの素材クリップの切り出された区間が繋ぎ合わせられて1つの全天球画像とされる。このとき素材クリップ同士の繋ぎ目、つまり境界位置の部分には、例えばディゾルブなどの処理によりトランジション効果が施されて、素材クリップから次の素材クリップへと違和感なく映像が遷移するようになされる。
 さらに、補助ウィンドウWD11では、例えばユーザが素材クリップ(全天球画像)の所望の領域を指定して、その指定した領域に対して編集ツールによりエフェクト処理を施したり、指定した領域にタイトル等を挿入したりすることもできる。例えばエフェクト処理としてホワイトバランス調整や明るさ調整を行ったり、ノイズ低減処理を行ったり、ソフトフィルタ処理を行ったりすることができる。
 なお、エフェクトを施す対象となる領域やタイトルの挿入位置の指定は、補助ウィンドウWD11における画像表示領域WR13に表示された素材クリップ(全天球画像)上の領域を指定することにより行われてもよいし、没入提示デバイス11に表示された提示用全天球画像上の領域を直接指定することにより行われてもよい。
 編集システムでは、以上のような補助ウィンドウWD11が提示用全天球画像上だけでなく、ディスプレイ12上にも表示される。なお、ここでは補助ウィンドウWD11が表示される例について説明したが、例えば提示用全天球画像上やディスプレイ12上にタイムラインのみが表示されるなど、補助ウィンドウWD11の一部のみが表示されるようにしてもよい。
 また、補助ウィンドウWD11は、没入提示デバイス11を装着しているユーザから見て常に同じ位置に同じ姿勢で表示されるようにしてもよいし、常に提示用全天球画像における同じ位置に同じ姿勢で表示されるようにしてもよい。
 例えば補助ウィンドウWD11が没入提示デバイス11を装着しているユーザから見て常に同じ位置に同じ姿勢で表示されるとする。換言すれば、補助ウィンドウWD11の位置および姿勢が没入提示デバイス11に対して固定されているとする。
 そのような場合、没入提示デバイス11を装着したユーザが頭部を動かしても、提示用全天球画像上では、ユーザから見て常に同じ位置に同じ姿勢で補助ウィンドウWD11が表示された状態となる。すなわち、ユーザが頭部を動かしてもユーザと補助ウィンドウWD11との相対的な位置関係は変化しない。
 この例では、レンダラ部35では通信部36から供給される没入提示デバイス11の位置姿勢情報を参照すれば、補助ウィンドウWD11を全天球画像上におけるユーザから見て予め定められた位置に予め定められた姿勢で重畳表示させることができる。換言すれば、レンダラ部35では、没入提示デバイス11の位置および姿勢により定まる全天球画像上の位置に補助ウィンドウWD11の画像が重畳される。
 これに対して、補助ウィンドウWD11が常に提示用全天球画像上の同じ位置に同じ姿勢で表示される場合、レンダラ部35ではユーザの頭部の方向によらず、補助ウィンドウWD11が全天球画像上における予め定められた位置に予め定められた姿勢で重畳表示される。換言すれば、補助ウィンドウWD11は実空間上の所定位置を原点とする世界座標系の予め定められた位置に固定されて表示された状態となる。
 したがって、この場合、没入提示デバイス11を装着したユーザが頭部を動かすと、その頭部の動きに応じてユーザから見た補助ウィンドウWD11の表示位置が変化することになる。つまり、ユーザの頭部の動きに応じて、ユーザと補助ウィンドウWD11との相対的な位置関係が変化することになる。
 なお、ユーザは没入操作部14を操作するなどして、提示用全天球画像上における補助ウィンドウWD11の位置を移動させたり、補助ウィンドウWD11の大きさを変化させたりすることができるようにしてもよい。
 具体的には、例えばユーザが没入操作部14として図2に示したコントローラCT11を操作しているものとする。
 この場合、例えばユーザは、コントローラCT11を動かすことによって、提示用全天球画像上でコントローラCT11のモデルを動かして、そのモデルから延びるポインタにより補助ウィンドウWD11を指定した状態とする。
 一例としてポインタにより補助ウィンドウWD11が指定されている状態とは、例えばポインタが補助ウィンドウWD11と交差する位置にあり、かつコントローラCT11の所定のボタンが押されている状態などとされる。
 ユーザはポインタにより補助ウィンドウWD11が指定された状態で、さらにコントローラCT11を動かすことでドラッグ操作を行う等して、補助ウィンドウWD11の表示位置を移動させたり、補助ウィンドウWD11を拡大または縮小させたりする。
 すなわち、例えばユーザは、ポインタにより補助ウィンドウWD11を指定している方のコントローラCT11を動かすことで補助ウィンドウWD11を移動させる。このとき、ポインタの移動先の位置が、補助ウィンドウWD11の移動先の位置とされる。
 また、例えばユーザは2つのコントローラCT11のそれぞれにより補助ウィンドウWD11が指定されている状態から、それらの2つのコントローラCT11を近づけたり遠ざけたりすることで、補助ウィンドウWD11を拡大させたり縮小させたりする。
 さらに、例えば提示用全天球画像上において、補助ウィンドウWD11がユーザから見て凹曲面の形状となるように湾曲された状態で表示されるとする。この場合、ユーザは没入操作部14を操作するなどして、補助ウィンドウWD11の曲がり具合、すなわち凹曲面の形状の湾曲度合いを調整することができるようにしてもよい。
〈編集作業の例について〉
 続いて、ユーザにより行われる全天球画像の編集作業の例、すなわち編集システムの具体的な利用シーンの例について説明する。
 ここでは、一例として複数の素材クリップを繋ぎ合わせて5分程度のドキュメンタリー映像を製作するケースについて説明する。
 まず、ユーザは没入操作部14や入力デバイス13を操作して、例えば10個程度の素材クリップ(全天球画像)を順番に指定するとともに、それらの素材クリップの再生を指示し、各素材クリップをプレビューする。
 この場合、操作検出部32は、没入操作部14や入力デバイス13から供給された信号および位置姿勢検出部31から供給された位置姿勢情報に応じて、指定された素材クリップの再生を指示する操作検出情報を生成し、編集反映処理部34に供給する。
 編集反映処理部34は、操作検出部32からの操作検出情報に応じて、指定された素材クリップをレンダラ部35に供給する。また、レンダラ部35は、編集反映処理部34から供給された素材クリップを全天球画像とする提示用全天球画像を通信部36を介して没入提示デバイス11に供給し、再生させる。
 素材クリップが再生されて、それらの素材クリップのプレビューが終了すると、ユーザは没入操作部14や入力デバイス13を操作して所望の素材クリップを指定し、それらの指定した素材クリップのインポートを指示する。
 すると、操作検出部32は、ユーザの操作に応じて素材クリップをインポートする旨の操作検出情報を生成し、編集反映処理部34に供給する。
 編集反映処理部34は、操作検出部32からの操作検出情報に応じて、指定された素材クリップをインポートする。素材クリップのインポート時には、編集反映処理部34は必要に応じて素材クリップを、正距円筒形式の画像データから、その画像データを3Dモデルにマッピングして得られる形式の画像データに変換して保持部33に供給し、保持させる。
 このようにして素材クリップがインポートされると、没入提示デバイス11やディスプレイ12に表示されている補助ウィンドウWD11では、それらの素材クリップのサムネイル画像がメディアビン領域WR11に並べられて表示される。
 ユーザは、没入操作部14や入力デバイス13を操作してメディアビン領域WR11内のサムネイル画像を指定する等して、各素材クリップをタイムライン領域WR12内のタイムライン上に並べる。
 編集反映処理部34は、操作検出部32から供給された操作検出情報に応じて、タイムライン上に指定された素材クリップのサムネイル画像が表示された、すなわちユーザの操作が反映された補助ウィンドウWD11の画像を生成し、レンダラ部35およびディスプレイ12に供給する。
 レンダラ部35は、編集反映処理部34から供給された補助ウィンドウWD11の画像を全天球画像に重畳して提示用全天球画像を生成し、得られた提示用全天球画像を通信部36を介して没入提示デバイス11に供給して表示させる。
 例えばタイムライン上に指定された素材クリップのサムネイル画像が並べられると、素材クリップのカーソルCR11により示される時刻のフレームが編集中のフレームとして没入提示デバイス11に表示された状態となる。つまり、全天球画像としての編集中の素材クリップのフレーム上に補助ウィンドウWD11や他のUI画像が重畳されたものが提示用全天球画像として没入提示デバイス11に表示された状態となる。
 ユーザは没入操作部14や入力デバイス13を操作して、タイムラインに並べられた各素材クリップについてイン点とアウト点を指定した後、全天球画像にナレーションの付加を指示する。すると、操作検出部32は、没入操作部14や入力デバイス13からの信号と、位置姿勢検出部31から供給された位置姿勢情報とに基づいてユーザの操作を検出し、その検出結果を示す操作検出情報を編集反映処理部34に供給する。
 編集反映処理部34は、操作検出部32から供給された操作検出情報に応じて、各素材クリップのイン点からアウト点までの区間を切り出して繋ぎ合わせ、それらの素材クリップの繋ぎ合わせる部分、つまり境界部分に対してディゾルブなどの処理を施す。また、編集反映処理部34は、それらの繋ぎ合わせた素材クリップからなる1つの全天球画像に対して指定されたナレーションの音声データを付加する。
 さらに、ユーザは没入操作部14や入力デバイス13を操作して、各素材クリップについて正面点を指定したり、素材クリップの所望の位置にタイトルを挿入したりする。タイトルの挿入時には、ユーザが没入操作部14等を操作して没入提示デバイス11に表示されている提示用全天球画像上の位置をタイトルの挿入位置として指定すれば、ユーザは直感的に挿入するタイトルのサイズと挿入位置を指定することができる。
 このような操作が行われると、操作検出部32は、没入操作部14や入力デバイス13からの信号と、位置姿勢検出部31から供給された位置姿勢情報とに基づいてユーザの操作を検出し、その検出結果を示す操作検出情報を編集反映処理部34に供給する。
 編集反映処理部34は、操作検出部32から供給された操作検出情報に応じて、各素材クリップの正面点がユーザにより指定された位置となるように素材クリップの付随情報を編集したり、素材クリップにタイトルを挿入したりする。
 編集反映処理部34では、ユーザによる編集操作が編集中の素材クリップ(全天球画像)に対してリアルタイムで反映され、編集操作が反映された素材クリップが編集反映処理部34からレンダラ部35へと供給される。
 そして、レンダラ部35では編集操作反映後の素材クリップ(全天球画像)についてレンダリング処理が行われて提示用全天球画像が生成され、没入提示デバイス11で表示される。したがって、ユーザは自身の編集操作が反映された素材クリップを、没入提示デバイス11を装着したまま直ちに確認することができる。
 ユーザの編集作業が終了し、最終的な1つのコンテンツである全天球画像が得られると、ユーザは没入操作部14や入力デバイス13を操作して編集により得られた全天球画像の再生を指示し、全天球画像をプレビューする。
 この場合、操作検出部32は、没入操作部14や入力デバイス13から供給された信号と、位置姿勢検出部31から供給された位置姿勢情報とに応じて、全天球画像の再生を指示する操作検出情報を生成し、編集反映処理部34に供給する。
 編集反映処理部34は、操作検出部32からの操作検出情報に応じて、編集により得られた全天球画像をレンダラ部35に供給する。また、レンダラ部35は、編集反映処理部34から供給された全天球画像に基づいてレンダリング処理を行い、得られた提示用全天球画像を、通信部36を介して没入提示デバイス11に供給し、再生させる。
 ユーザは、編集により得られた全天球画像を没入提示デバイス11で再生させて確認すると、没入操作部14や入力デバイス13を操作して全天球画像の保存を指示する。すると、レンダラ部35は、ユーザの操作に応じて、編集により得られた全天球画像を例えば正距円筒形式の画像データ(例えばmp4ファイル)などの適切な形式の画像データに変換して、得られた全天球画像を出力したり記録したりする。
 このように編集システムでは、ユーザが没入提示デバイス11を装着したままで素材クリップのプレビューから、編集、完成した全天球画像のプレビューまでの全作業を簡単に行うことができる。
 特に、正面点の指定やタイトル挿入等の編集作業については、没入提示デバイス11に全天球画像が表示されている状態で、つまり実際に再生時の全天球画像が表示されている状態で、その全天球画像の各部を確認しながら作業を行うことができる。したがって、より簡単に自身の意図通りの編集作業を行うことができる。
〈コンテンツ編集処理の説明〉
 次に、編集システムにおいて行われる処理の流れについて説明する。
 すなわち、以下、図6のフローチャートを参照して、編集システムにより行われるコンテンツ編集処理について説明する。
 ステップS11において、位置姿勢検出部31は、没入操作部14の位置および姿勢を検出し、その検出結果を示す位置姿勢情報を操作検出部32、編集反映処理部34、およびレンダラ部35に供給する。
 また、通信部36は、没入提示デバイス11から、没入提示デバイス11の位置姿勢情報および撮影画像を取得し、位置姿勢情報をレンダラ部35に供給するとともに撮影画像を編集反映処理部34に供給する。
 ステップS12において、操作検出部32は、位置姿勢検出部31から供給された位置姿勢情報、入力デバイス13から供給された信号、および没入操作部14から供給された信号に基づいてユーザによる操作入力を検出し、その検出結果を示す操作検出情報を編集反映処理部34に供給する。
 例えば操作検出部32は、没入操作部14の位置姿勢情報と没入操作部14から供給された信号とに基づいて、ユーザによる補助ウィンドウ上の特定ボタンの操作が検出された場合、その検出結果を示す操作検出情報を生成して編集反映処理部34に供給する。
 ステップS13において、編集反映処理部34は、操作検出部32から供給された操作検出情報に基づいて、ユーザにより編集が指示されたか否かを判定する。
 例えばステップS13では、操作検出情報がタイトルの挿入や正面点の指定、エフェクトの付加、イン点とアウト点の指定などの編集に関する操作を示している場合、編集が指示されたと判定される。
 ステップS13において編集が指示されたと判定された場合、ステップS14において編集反映処理部34は、操作検出部32から供給された操作検出情報により示される編集に関する操作入力に応じた編集処理を行う。
 例えば編集反映処理部34は、保持部33に保持されている全天球画像を読み出して、全天球画像に対してタイトルを挿入したり、全天球画像の付随情報を編集したり、全天球画像に対してエフェクトを施したりする処理等を編集処理として行う。
 編集処理が行われると、編集反映処理部34は、編集処理により得られた全天球画像をレンダラ部35に供給し、処理はステップS15へと進む。
 これに対して、ステップS13において編集が指示されなかったと判定された場合、ステップS14の処理は行われず、処理はステップS15へと進む。
 ステップS14の処理が行われたか、またはステップS13において編集が指示されなかったと判定されると、ステップS15において編集反映処理部34は、UI画像を生成する。
 ステップS15では、例えば上述したシースルーウィンドウの画像や補助ウィンドウの画像、メニュー画像などがUI画像として生成される。
 すなわち、例えば編集反映処理部34は、通信部36から供給された撮影画像の一部を切り出してシースルーウィンドウの画像を生成したり、操作検出情報に基づいてユーザの操作が反映された補助ウィンドウの画像を生成したりする。
 ステップS16において、編集反映処理部34は、位置姿勢検出部31から供給された位置姿勢情報に基づいて没入操作部モデル画像を生成する。
 編集反映処理部34は、ステップS15およびステップS16の処理で生成されたUI画像および没入操作部モデル画像をレンダラ部35に供給する。また、ステップS15で生成されたUI画像としての補助ウィンドウは、編集反映処理部34からディスプレイ12にも供給されて、ディスプレイ12に補助ウィンドウが表示される。
 ステップS17において、レンダラ部35は、通信部36から供給された没入提示デバイス11の位置姿勢情報、および位置姿勢検出部31から供給された没入操作部14の位置姿勢情報に基づいてレンダリング処理を行う。
 すなわち、レンダラ部35は、没入提示デバイス11や没入操作部14の位置姿勢情報に基づいて、編集反映処理部34から供給された全天球画像の適切な位置に没入操作部モデル画像およびUI画像を重畳し、提示用全天球画像を生成する。また、レンダラ部35は、適宜、提示用全天球画像を没入提示デバイス11で取り扱うことが可能な形式の画像データに変換し、通信部36に供給する。
 ステップS18において、通信部36はレンダラ部35から供給された提示用全天球画像を没入提示デバイス11に出力する。また、没入提示デバイス11は通信部36から供給された提示用全天球画像を表示する。
 換言すれば、レンダラ部35は、通信部36を介して没入提示デバイス11に提示用全天球画像を供給し、その提示用全天球画像を表示させる。特に、ステップS14で編集に関する操作入力に応じた編集処理が行われた場合には、その編集に関する操作入力がリアルタイムで反映された提示用全天球画像が表示されるように、レンダラ部35により没入提示デバイス11における表示が制御されることになる。
 没入提示デバイス11で提示用全天球画像が表示されると、没入提示デバイス11を装着しているユーザは、編集中の全天球画像を没入提示デバイス11で確認しながら没入操作部14や入力デバイス13を操作して、編集作業を行うことができる。
 なお、ステップS18では通信部36が没入提示デバイス11とは異なる他の没入提示デバイスにも提示用全天球画像を出力するようにしてもよい。すなわち、没入提示デバイス11と他の没入提示デバイスに対して、同じ提示用全天球画像が同時に出力されるようにしてもよい。このようにすることで、没入提示デバイス11を含む複数の没入提示デバイスにおいて、同じ提示用全天球画像を同時に見ることができるようになる。
 ステップS19において、画像処理装置15は処理を終了するか否かを判定する。例えばステップS19では、ユーザにより編集の終了が指示された場合、処理を終了すると判定される。
 ステップS19において、まだ処理を終了しないと判定された場合、処理はステップS11に戻り、上述した処理が繰り返し行われる。
 これに対して、ステップS19において処理を終了すると判定された場合、コンテンツ編集処理は終了する。この場合、適宜、編集により得られた全天球画像が保存されたり、外部の装置に出力されたりする。
 以上のようにして編集システムは、ユーザの操作に応じて全天球画像上にUI画像や没入操作部モデル画像を重畳して提示用全天球画像を生成し、没入提示デバイス11で表示させる。これにより、ユーザは、没入提示デバイス11を装着したままの状態で、全天球画像を確認しながらより簡単に編集作業を行うことができる。
<具体的な編集例>
 上記したように、本実施の形態によれば、全天球画像を確認しながらより簡単に編集作業を行うことができる。ここで、その編集の一例を説明する。
 図7は、没入提示デバイス11に表示される画面例を示している。没入提示デバイス11には、提示用全天球画像が、画面全体に表示されている。
 画面中央下側には、没入操作部モデル画像としてコントローラCT11が表示されている。以下、画面に表示されているコントローラCT11の没入操作部モデル画像を、没入操作部モデル画像CT11と記述する。
 没入操作部モデル画像CT11の先端からは、ポインタ101が出ている。このポインタ101は、レーザーポインタを模写したような絵となっており、所定の色の直線で表示されている。図7に示した例では、ポインタ101の先端は、“demo”といった文字102を指している。
 この文字102は、提示用全天球画像上に重畳(オーバーレイ)されている文字である。ここでは、文字を例に挙げて説明するが、マークなどであっても良い。文字102は、提示用全天球画像に重畳されている画像の一例である。
 時刻T1において、文字102は、図中左側の位置P1に表示されていたとする。また、時刻T1においては、没入操作部モデル画像CT11の先端は、位置P1の方を向いており、没入操作部モデル画像CT11からのポインタ101は、文字102を指している状態である。
 時刻T1において、ユーザがコントローラCT11のボタン(例えば、図9に示すボタン122)を操作し、コントローラCT11を、右方向に移動させる。この操作により、文字102が捕まれ(ドラッグされ)、位置P2まで移動される。
 すなわち時刻T1から時刻T2の間、コントローラCT11のボタンが押し込まれたまま、左側から右側に先端部分が移動するような操作がなされた場合、換言すれば、ポインタ101の先端が、位置P1から位置P2まで移動するような操作が、ボタンが操作されたままなされた場合、文字102は、位置P1から位置P2に移動される。
 すなわちユーザは、コントローラCT11を用いて、所謂ドラッグアンドドロップという操作を行うことで、提示用全天球画像内で、文字102を所望の位置に移動させることができる。
 ユーザは、このような操作を、没入提示デバイス11を装着した状態で行えるため、また、没入提示デバイス11で提示される提示用全天球画像を見ながら行えるため、例えば文字102を、背景で見づらくなる位置から、見やすい位置に移動させるといったことを容易に行うことができる。
 他の操作例として、ユーザは、文字102を所望の大きさに変更する操作も、提示用全天球画像を見ながら行うことができる。
 例えば、図8に示すように、時刻T11において、文字102が所定の大きさで表示されており、この文字102を拡大したいとき、ユーザは、コントローラCT11を広げるような動作を行うことで、文字102を拡大させることができる。
 時刻T11において、ユーザの左手に保持されているコントローラCT11(コントローラCT11Lとする)を表す没入操作部モデル画像CT11Lと、ユーザの右手に保持されているコントローラCT11(コントローラCT11Rとする)を表す没入操作部モデル画像CT11Rが、提示用全天球画像に重畳されて表示されている。
 ユーザは、文字102を拡大したい場合、コントローラCT11LまたはコントローラCT11Rの所定のボタンを操作し、文字102を選択し、コントローラCT11LとコントローラCT11Lを左右に広げるような操作を行う。
 時刻T12として示したように、コントローラCT11LとコントローラCT11Lを左右に広げるような操作が行われることで、文字102が拡大される。なお図示していないが、コントローラCT11LとコントローラCT11Lを左右に狭めるような操作が行われた場合には、文字102が縮小される。
 このように、文字102の拡大や縮小といったサイズの変更は、2つのコントローラCT11を左右に広げるまたは狭めるといった簡便な操作で行うことができる。
 また、このような文字102の大きさの変更も、提示用全天球画像内で行うことができるため、実際に提示される全天球画像上での大きさを確認しながら所望の大きさとすることができる。
<コントローラの構成>
 このような操作を行えるコントローラCT11について説明を加える。
 コントローラCT11は、図9に示すように、タッチパッド121、ボタン122、ボタン123を備える。タッチパッド121は、平板状のセンサであり、その上を指でなぞったり、タップしたりすることでマウスポインタと同様の操作を行うことができるように構成されている。
 ボタン122とボタン123は、所定の処理が割り当てられており、押下されることで、その割り当てられている操作の指示を出せるように構成されている。例えば、上記したように、ボタン122には、全天球画像に重畳されている文字102を選択する(ドラッグする)ときに操作される。
 なお、図9に示したコントローラCT11の構成や形状は、一例であり、限定を示すものではない。例えば、図9に示したコントローラCT11には、2つのボタン122,123が設けられているが、さらに複数のボタンが設けられていても良いし、コントローラCT11の側面や裏面など、図9に示した以外の部分にも設けられていても良い。
 コントローラCT11は、図7や図8を参照して説明したように、没入提示デバイス11が装着され、その没入提示デバイス11で提示される画像を見ながら操作される。換言すれば、ユーザは、コントローラCT11を直接視認しながら操作を行うのではない。コントローラCT11は、直接視認しなくても操作できるような簡便な構成とされているのが良い。
 そこで、タッチパッド121に、複数の操作を割り当てる。すなわち、タッチパッド121は、指でなぞる、タップするなど、比較的位置を正確に確認していない状態でも、簡便に操作できる装置であり、さらに、そのようなタッチパッド121に複数の操作を割り当てておくことで、簡便に操作の指示を出すことができるようになる。
 例えば、図10に示すように、タッチパッド121を5分割する。タッチパッド121の上部を領域121Aとし、タッチパッド121の右部を領域121Bとし、タッチパッド121の下部を領域121Cとし、タッチパッド121の上部を領域121Dとし、タッチパッド121の中央部を領域121Eとする。
 例えば、領域121Aをタップすることで、マーカの追加や移動を指示することができ、領域121Bをタップすることで、前のクリップへの移動を指示することができ、領域121Cをタップすることで、再生の停止を指示することができ、領域121Dをタップすることで、次のクリップへの移動を指示することができ、領域121Eをタップすることで、再生や一時停止を指示することができる。
 また、複数の領域121をなぞることでも指示を出せるようにしても良い。例えば、領域121Dから領域121Bを指でなぞることで(左から右方向に指を動かすことで)、早送りを指示することができ、領域121Bから領域121Dを指でなぞることで(右から左方向に指を動かすことで)、巻き戻しを指示することができたりするようにしても良い。
 このような操作は、コントローラCT11を直接視認しなくても行えるような簡便な操作である。このような操作を、コントローラCT11のタッチパッド121に、領域を分割することで割り当てる。この割り当ては、ユーザにより設定できる(カスタマイズできる)ような仕組みを設けても良い。
 また、ボタン122,123とタッチパッド121との操作が組み合わされることで、新たな操作の指示が出せるようにしても良い。例えば、ボタン122を押下しながら、タッチパッド121の領域121Aが操作されたときには、付けられているマーカを削除する指示が出され、ボタン122を押下しながら、タッチパッド121の領域121Bが操作されたときには、3倍速で早送りする指示が出されるといったような指示が割り当てられているようにしても良い。
 また、タッチパッド121の所定の領域に割り当てられている操作を、ユーザに認識させるために、図11に示したように、案内表示がされるようにしても良い。図11に示した案内表示151は、タッチパッド121の形状を模写した円形内に、各領域121A乃至Eに対応する位置に、それぞれコンテンツの再生に係わるマークが表示されている。
 領域121Aに対応する位置には、一時停止のマークが表示され、領域121Bに対応する位置には、次のマーク(チャプター)に移動するときのマークが表示され、領域121Cに対応する位置には、再生停止のマークが表示され、領域121Dに対応する位置には、前のマーク(チャプター)に移動するときのマークが表示され、領域121Eに対応する位置には、再生のマークが表示されている。
 このような案内表示151は、常に表示されていても良いし、例えばタッチパッド121に触れたときに表示されるようにしても良い。また、表示されているときに、例えばボタン122が操作された場合、案内表示151内の案内が変更されるようにしてもよい。
 また例えば、図11に示した案内表示151には、コンテンツの再生に関するマークが表示されているが、ボタン122が操作されると、コンテンツの編集に関するマークに切り替わるようにしても良い。
 すなわち、再生モード、編集モードといったモードの切り替えを、ボタン122を操作することでできるようにし、そのモードに対応する案内が、案内表示151に表示されるようにしても良い。
 なおここでは、案内表示151内にはマークが表示される例を示したが、マーク以外、例えば、“再生”、“停止”といった文言が表示されるようにしても良い。
 他の表示例として、タッチパッド121、ボタン122、またはボタン123のメニューを表示させる操作が割り当てられている操作部が操作されたときに、メニュー画面が表示されるようにしても良い。
 例えば、図12に示すように、所定の操作がなされると、コントローラCT11Lを表す没入操作部モデル画像CT11Lの右側に、メニュー171が表示される。図12に示した例では、メニュー171として、“項目A”、“項目B”、“項目C”が表示されている。
 ユーザは、メニュー171に表示されている項目A、項目B、および項目Cの中から、所望な項目を、コントローラCT11Rを用いて選択することができる。ユーザは、例えば、項目Bを選択したい場合、コントローラCT11R(の没入操作部モデル画像CT11R)の先端から出ているポインタ101の先端を、項目Bに合わせる。合わせただけで、項目Bが選択されるようにしても良いし、合わした後、ボタン122やボタン123が操作されることで、項目Bが選択されるようにしても良い。
 メニュー171からユーザが所望とする項目が選択されると、サブメニュー172がメニュー171の右側に表示される。サブメニュー172には、メニュー171内で選択されたさらに詳細な選択項目が表示されている。図12では、“項目a”、“項目b”、“項目c”が表示されている。サブメニュー172内の項目から、ユーザが所望な項目を選択するための操作は、メニュー171内の項目から所望な項目を選択する操作と同様に行われる。
 メニュー171とサブメニュー172は、横方向に配置される関係にある。メニュー171内の項目は縦方向に配置され、サブメニュー172内の項目も縦方向に配置されている。このように、メニューが展開していく方向(この場合、横方向)と、メニュー内の項目が配列されている方向(この場合、縦方向)は、異なる方向とされている。
 このようにメニューが展開していく方向と、メニュー内の項目が配列されている方向を異ならせることで、誤った項目を選択してしまうようなことを低減させることができる。例えば、仮に、メニューが展開していく方向と、メニュー内の項目が配列されている方向を同じにした場合、メニュー171、サブメニュー172、さらにそのサブメニュー内の項目が横並びに並ぶことになる。
 このように、横並びにメニュー171、サブメニュー172、さらにそのサブメニュー内の項目が並ぶと、コントローラCT11R(の先端)を順次横方向に移動させることになるが、同一方向に移動させると、例えば、メニュー171からサブメニュー172に移動させ、その勢いで、選択したい項目を行き過ぎ、他の項目を誤って選択してしまうといったことが発生する可能性が高くなる。
 しかしながら、上記したように、メニューが展開していく方向と、メニュー内の項目が配列されている方向を異ならせることで、メニュー171からサブメニュー172に移動するときの方向と、サブメニュー172内を移動する方向が異なるため、メニュー171からサブメニュー172に移動させ、その勢いで、選択したい項目を行き過ぎるといったことが発生することを防ぐことができる。
 さらに、コントローラCT11を用いた操作の例を挙げるに、上記したシースルーウィンドウSW11(図3)を表示させたり、非表示にさせたりする操作にもコントローラCT11は、用いられる。
 例えば、シースルーウィンドウSW11が表示されていないときに、表示を指示する操作、例えば、ボタン123が、シースルーウィンドウSW11の表示を指示するボタンであった場合、そのボタン123が操作されると、提示用全天球画像に、シースルーウィンドウSW11が表示される。例えば、図13に示すように、提示用全天球画像に、シースルーウィンドウSW11が所定の位置に表示される。
 ユーザは、シースルーウィンドウSW11を見ながら、キーボードやマウスの操作を行うことができる。このように、提示用全天球画像に、シースルーウィンドウSW11が表示されているときに、ボタン123が操作された場合、シースルーウィンドウSW11は閉じられるようにしても良い。
 このように、本技術によれば、全天球画像を確認しながらより簡単に編集作業を行うことができる。また、そのような全天球画像を確認しながら行う編集に適したコントローラや、ユーザインタフェースを提供することができる。
<編集の処理>
 ところで、上記したように、例えば、図7を参照して説明したように、全天球画像上に表示されている文字102を移動させる場合、文字102が全天球画像上のどの位置に表示されているのかを特定し、また、移動先として指示された全天球画像上の位置を特定する必要がある。
 そのような処理に関して、図14、図15のフローチャートを参照して説明する。またここでは、例えば、図7を参照して説明したように、全天球画像上に表示されている文字102を移動させる場合を例に挙げて説明を続ける。また、ここでは、図14を参照して、リアルタイムアップデートに関する処理(常に行われている処理)について説明し、図15を参照して、文字102などが選択され、移動が指示されたときの処理について説明する。
 図14、図15に示したフローチャートの処理は、没入操作部14からの操作を受け、操作検出部32で、その操作内容が判断され、編集反映処理部34で処理されることで実行される。
 図14に示したフローチャートを参照するに、ステップS101において、ポインタと提示用全天球画像との交点位置が検出される。例えば、図7に示したような提示用全天球画像が表示されているとき、時刻T1においては、コントローラCT11からのポインタ101は、位置P1を指しているため、この位置P1の座標が検出される。
 ステップS102において、球面座標の交点を正距円筒図法における座標(以下、正距円筒座標と記述する)に変換する。球面座標は、提示用全天球画像における座標、換言すれば、360度画像における座標である。正距円筒図法とは、地図投影法の一種であり、緯線、経線が直角かつ等間隔に交差するので方眼図法・正方形図法などとも称される図法であり、正距円筒座標は、そのような図法における座標である。
 ステップS102における座標の変換は、3次元の座標を2次元の座標に変換する処理であるともいえる。よって、そのような3次元を2次元に変換するような処理が行われるのであれば、他の変換が行われるようにしても良い。また、必ずしも、3次元の座標を2次元の座標に変換して処理を行う必要もなく、3次元の座標のまま処理が行われるように構成することも可能である。
 例えば、ユーザは、正距円筒図法により得られる正距円筒(Equirectangular)形式の2次元の全天球画像をディスプレイ12に表示させて編集作業を行うこともできる。このディスプレイ12に表示されている2次元の画像で編集作業を行う場合と同じように処理を行えるようにするために、ここでは、球面座標を正距円筒座標に変換するとして説明を続ける。
 換言すれば、全天球画像を編集するソフトウェアとして、従来のソフトウェアを用いても処理を行えるようにする場合、球面座標を正距円筒座標に変換することで、そのソフトウェアでも扱える座標を得ることができる。よって、上記したように、3次元の座標を用いて処理できるソフトウェアを用いる場合、ステップS102の処理を省略し、球面座標で処理が続けられるようにすることもできる。
 なお、ここでは、正距円筒図法における座標に変換するとして説明を続けるが、他の図法における座標に変換されるようにしても良い。
 ステップS101、ステップS102における処理において、その時点でポインタが指し示している位置の座標が求められる。このように、コントローラCT11が用いられ、ポインタ101が出射されているような状態のときには、そのポインタ101が指し示している位置は、常に把握されている。
 ステップS103において、オーバーレイされているものの座標が上書きされる。例えば、図7に示した提示用全天球画像の例においては、文字102がオーバーレイされているものであり、文字102の座標が求められ、その求められた座標に、文字102の座標が上書きされる。オーバーレイされているもの(文字102、マーク、画像など)の座標も、球面座標が正距円筒座標に変換され、その変換された正距円筒座標に上書きされるようにすることができる。
 このように、オーバーレイされているものの座標も常に管理されている。なお、以下の説明においては、オーバーレイされているものは、文字102であるとして説明を続ける。
 このような処理が繰り返されることで、ポインタ101が指し示している位置と、オーバーレイされているものの位置がリアルタイムに管理されている。
 このような管理が行われている一方で、コントローラCT11からの操作、ここでは、ボタン122が操作され、その時点でポインタ101が位置するオーバーレイされている文字102が移動されるときに行われる処理について、図15を参照して説明する。
 ステップS141において、コントローラCT11のボタン122が操作されたか否かが判定される。ボタン122が操作されたと判定されるまで、待機状態が維持され(図14に示したフローチャートの処理が実行されることで、リアルタイムアップデータの処理が行われている状態が維持され)る。一方で、ボタン122が操作されたと判定された場合、ステップS142に処理は進められる。
 ステップS142において、ポインタと全天球画像の交点位置が検出される。またステップS143において、球面座標の交点が正距円筒座標に変換される。このステップS142とステップS143の処理は、図14に示したフローチャートのステップS101とステップS102の処理と同様に行われる。
 ステップS144において、オーバーレイされているものがあるか否かが判定される。オーバーレイされているもの、例えば文字102の座標は、図14のステップS103の処理で所定の間隔で更新されている。ステップS143までの処理で求められたポインタ101が指し示す位置の座標と、管理しているオーバーレイされているものの座標が一致するか否かを判定することで、ステップS144の判定処理が行われる。
 ステップS144において、オーバーレイされているものはないと判定された場合、ステップS141に処理が戻され、それ以降の処理が繰り返される。なお、ボタンの操作が行われているため、オーバーレイされているものはないと判定された場合にも、そのボタンが操作されることにより実行すべき処理は実行される。
 一方、ステップS144において、オーバーレイされているものがあると判定された場合、ステップS145に処理が進められ、ボタンの操作が維持されているか否かが判定される。
 例えば、図7を参照して説明したように、コントローラCT11の操作により、文字102が移動される場合、ドラッグアンドドロップという操作が行われる。よって、ボタンの操作が維持されている間は、オーバーレイされている文字102は、まだ所望とされる位置まで移動されていない状況であると判定できる。
 よって、ステップS145において、ボタンの操作が維持されていると判定されるまで、ステップS145における判定処理が繰り返される。ステップS145において、ボタンの操作が維持されていないと判定された場合、換言すれば、ユーザがボタンを放し、文字102をドロップしたと判定された場合、さらに換言するに、ユーザが所望の位置まで文字102を移動させたと判定された場合、ステップS146に処理が進められる。
 ステップS146において、ボタンの操作が終了されたときのポインタが指し示している位置と全天球画像の交点位置が検出される。ステップS147において、球面座標の交点が正距円筒座標に変換される。このステップS146とステップS147の処理は、ステップS142とステップS143の処理と基本的に同様に行われる。この時点で、文字102は、ユーザが所望とした位置、図7では、位置P2に移動され、表示されている。
 ステップS148において、対象のオーバーレイされたものの座標が上書きされる。すなわち、この場合、移動先の座標に、文字102の座標が書き換えられる。このようにして、オーバーレイされている文字やマークなどの位置(座標)が管理されている。
 このように、現実空間でのコントローラCT11を模写した没入操作部モデル画像を仮想空間の提示用全天球画像に表示し、そのコントローラCT11からのポインタが、提示用全天球画像内で指し示す位置を検出することで、ユーザからの操作が受け付けられ、処理される。
 よって、全天球画像を確認しながらより簡単に編集作業を行うことができる。また、そのような全天球画像を確認しながら行う編集に適したコントローラや、ユーザインタフェースを提供することができる。
〈コンピュータの構成例〉
 ところで、上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウェアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のコンピュータなどが含まれる。
 図16は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。
 コンピュータにおいて、CPU(Central Processing Unit)501,ROM(Read Only Memory)502,RAM(Random Access Memory)503は、バス504により相互に接続されている。
 バス504には、さらに、入出力インターフェース505が接続されている。入出力インターフェース505には、入力部506、出力部507、記録部508、通信部509、及びドライブ510が接続されている。
 入力部506は、キーボード、マウス、マイクロホン、撮影素子などよりなる。出力部507は、ディスプレイ、スピーカなどよりなる。記録部508は、ハードディスクや不揮発性のメモリなどよりなる。通信部509は、ネットワークインターフェースなどよりなる。ドライブ510は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブル記録媒体511を駆動する。
 以上のように構成されるコンピュータでは、CPU501が、例えば、記録部508に記録されているプログラムを、入出力インターフェース505及びバス504を介して、RAM503にロードして実行することにより、上述した一連の処理が行われる。
 コンピュータ(CPU501)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブル記録媒体511に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。
 コンピュータでは、プログラムは、リムーバブル記録媒体511をドライブ510に装着することにより、入出力インターフェース505を介して、記録部508にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部509で受信し、記録部508にインストールすることができる。その他、プログラムは、ROM502や記録部508に、あらかじめインストールしておくことができる。
 なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
 また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
 例えば、本技術は、1つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
 また、上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。
 さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
 また、本明細書中に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。
 さらに、本技術は、以下の構成とすることも可能である。
(1)
 操作部による操作入力を検出する操作検出部と、
 没入提示デバイスに対して、前記操作部の画像が重畳された全天球画像の一部または全部を提示画像として出力して表示させるとともに、前記操作入力が検出された場合、前記操作入力が反映されるように前記提示画像の表示を制御する表示制御部と
 を備え、
 前記操作検出部は、前記操作部のポインタが前記全天球画像内で指し示す位置の座標を検出する
 画像処理装置。
(2)
 前記操作検出部は、前記検出した交点の座標に、前記全天球画像にオーバーレイされている画像が検出された場合、その画像をドラッグする
 前記(1)に記載の画像処理装置。
(3)
 前記表示制御部は、前記ドラッグされた画像が、ドロップされた位置に、前記画像が表示されるように前記提示画像の表示を制御し、
 前記操作検出部は、前記ドロップされた前記全天球画像内の位置の座標を検出する
 前記(2)に記載の画像処理装置。
(4)
 前記操作検出部は、オーバーレイされている画像の拡大、または縮小の操作を検出する
 前記(1)乃至(3)のいずれかに記載の画像処理装置。
(5)
 前記操作検出部は、2つの前記操作部が左右方向に広がったことを検出したとき、前記画像の拡大が指示されたと検出し、2つの前記操作部が左右方向に狭まったことを検出したとき、前記画像の縮小が指示されたと検出する
 前記(4)に記載の画像処理装置。
(6)
 前記操作部は、タッチパッドを備え、前記タッチパッドは、複数の領域に分割され、各領域に所定の操作が割り当てられている
 前記(1)乃至(5)のいずれかに記載の画像処理装置。
(7)
 前記操作部が操作され、メニューが表示されるとき、前記メニューは、横方向に展開され、前記メニュー内の項目は、縦方向に配列されている
 前記(1)乃至(6)のいずれかに記載の画像処理装置。
(8)
 操作部による操作入力を検出し、
 没入提示デバイスに対して、前記操作部の画像が重畳された全天球画像の一部または全部を提示画像として出力して表示させるとともに、前記操作入力が検出された場合、前記操作入力が反映されるように前記提示画像の表示を制御する
 ステップを含み、
 前記操作入力の検出は、前記操作部のポインタが前記全天球画像内で指し示す位置の座標を検出するステップを含む
 画像処理方法。
(9)
 操作部による操作入力を検出し、
 没入提示デバイスに対して、前記操作部の画像が重畳された全天球画像の一部または全部を提示画像として出力して表示させるとともに、前記操作入力が検出された場合、前記操作入力が反映されるように前記提示画像の表示を制御する
 ステップを含み、
 前記操作入力の検出は、前記操作部のポインタが前記全天球画像内で指し示す位置の座標を検出するステップを含む
 処理をコンピュータに実行させるプログラム。
 11 没入提示デバイス, 12 ディスプレイ, 13 入力デバイス, 14 没入操作部, 15 画像処理装置, 32 操作検出部, 33 保持部, 34 編集反映処理部, 35 レンダラ部, 36 通信部, 121 タッチパッド, 122,123 ボタン

Claims (9)

  1.  操作部による操作入力を検出する操作検出部と、
     没入提示デバイスに対して、前記操作部の画像が重畳された全天球画像の一部または全部を提示画像として出力して表示させるとともに、前記操作入力が検出された場合、前記操作入力が反映されるように前記提示画像の表示を制御する表示制御部と
     を備え、
     前記操作検出部は、前記操作部のポインタが前記全天球画像内で指し示す位置の座標を検出する
     画像処理装置。
  2.  前記操作検出部は、前記検出した交点の座標に、前記全天球画像にオーバーレイされている画像が検出された場合、その画像をドラッグする
     請求項1に記載の画像処理装置。
  3.  前記表示制御部は、前記ドラッグされた画像が、ドロップされた位置に、前記画像が表示されるように前記提示画像の表示を制御し、
     前記操作検出部は、前記ドロップされた前記全天球画像内の位置の座標を検出する
     請求項2に記載の画像処理装置。
  4.  前記操作検出部は、オーバーレイされている画像の拡大、または縮小の操作を検出する
     請求項1に記載の画像処理装置。
  5.  前記操作検出部は、2つの前記操作部が左右方向に広がったことを検出したとき、前記画像の拡大が指示されたと検出し、2つの前記操作部が左右方向に狭まったことを検出したとき、前記画像の縮小が指示されたと検出する
     請求項4に記載の画像処理装置。
  6.  前記操作部は、タッチパッドを備え、前記タッチパッドは、複数の領域に分割され、各領域に所定の操作が割り当てられている
     請求項1に記載の画像処理装置。
  7.  前記操作部が操作され、メニューが表示されるとき、前記メニューは、横方向に展開され、前記メニュー内の項目は、縦方向に配列されている
     請求項1に記載の画像処理装置。
  8.  操作部による操作入力を検出し、
     没入提示デバイスに対して、前記操作部の画像が重畳された全天球画像の一部または全部を提示画像として出力して表示させるとともに、前記操作入力が検出された場合、前記操作入力が反映されるように前記提示画像の表示を制御する
     ステップを含み、
     前記操作入力の検出は、前記操作部のポインタが前記全天球画像内で指し示す位置の座標を検出するステップを含む
     画像処理方法。
  9.  操作部による操作入力を検出し、
     没入提示デバイスに対して、前記操作部の画像が重畳された全天球画像の一部または全部を提示画像として出力して表示させるとともに、前記操作入力が検出された場合、前記操作入力が反映されるように前記提示画像の表示を制御する
     ステップを含み、
     前記操作入力の検出は、前記操作部のポインタが前記全天球画像内で指し示す位置の座標を検出するステップを含む
     処理をコンピュータに実行させるプログラム。
PCT/JP2018/009147 2017-03-22 2018-03-09 画像処理装置および方法、並びにプログラム WO2018173791A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
EP18772584.1A EP3605300A4 (en) 2017-03-22 2018-03-09 IMAGE PROCESSING DEVICE AND METHOD AND PROGRAM
US16/494,094 US11070724B2 (en) 2017-03-22 2018-03-09 Image processing apparatus and method
CN201880017780.7A CN110402426A (zh) 2017-03-22 2018-03-09 图像处理装置、方法及程序
JP2019507536A JP7196834B2 (ja) 2017-03-22 2018-03-09 画像処理装置および方法、並びにプログラム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2017055996 2017-03-22
JP2017-055996 2017-03-22

Publications (1)

Publication Number Publication Date
WO2018173791A1 true WO2018173791A1 (ja) 2018-09-27

Family

ID=63584258

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2018/009147 WO2018173791A1 (ja) 2017-03-22 2018-03-09 画像処理装置および方法、並びにプログラム

Country Status (5)

Country Link
US (1) US11070724B2 (ja)
EP (1) EP3605300A4 (ja)
JP (1) JP7196834B2 (ja)
CN (1) CN110402426A (ja)
WO (1) WO2018173791A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4086729A4 (en) * 2019-12-31 2023-03-22 Vivo Mobile Communication Co., Ltd. VIDEO EDITING PROCEDURE AND HEAD-WEAR DEVICE
WO2023095642A1 (ja) * 2021-11-26 2023-06-01 ソニーグループ株式会社 画像処理装置、画像処理方法、プログラム

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102598082B1 (ko) * 2016-10-28 2023-11-03 삼성전자주식회사 영상 표시 장치, 모바일 장치 및 그 동작방법
WO2018173790A1 (ja) * 2017-03-22 2018-09-27 ソニー株式会社 画像処理装置および方法、並びにプログラム
US11983382B2 (en) * 2022-06-13 2024-05-14 Illuscio, Inc. Systems and methods for generating three-dimensional menus and toolbars to control computer operation

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003143579A (ja) 2001-11-01 2003-05-16 Sony Corp 全方位映像の有料配信システム,有料配信方法及び有料視聴システム
JP2014072570A (ja) * 2012-09-27 2014-04-21 Kyocera Corp 表示装置および制御方法
JP2016167219A (ja) * 2015-03-10 2016-09-15 株式会社コロプラ ヘッドマウントディスプレイへ表示するためのユーザインタフェース表示方法、及びプログラム
JP6093473B1 (ja) * 2016-08-19 2017-03-08 株式会社コロプラ 情報処理方法及び当該情報処理方法をコンピュータに実行させるためのプログラム
WO2017037962A1 (ja) * 2015-08-28 2017-03-09 株式会社タカラトミー 頭部装着型ディスプレイを備えた情報処理装置

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004005272A (ja) * 2002-05-31 2004-01-08 Cad Center:Kk 仮想空間移動制御装置及び制御方法並びに制御プログラム
US7667700B1 (en) * 2004-03-05 2010-02-23 Hrl Laboratories, Llc System and method for navigating operating in a virtual environment
US9880619B2 (en) * 2010-02-23 2018-01-30 Muy Interactive Ltd. Virtual reality system with a finger-wearable control
US20130278631A1 (en) * 2010-02-28 2013-10-24 Osterhout Group, Inc. 3d positioning of augmented reality information
EP2587792B1 (en) * 2010-06-28 2017-08-30 LG Electronics Inc. Method and apparatus for providing the operation state of an external device
US9292184B2 (en) * 2011-11-18 2016-03-22 Zspace, Inc. Indirect 3D scene positioning control
CN104685869B (zh) 2012-09-27 2018-12-28 京瓷株式会社 显示装置、控制方法
JP6066676B2 (ja) * 2012-11-06 2017-01-25 株式会社ソニー・インタラクティブエンタテインメント ヘッドマウントディスプレイおよび映像提示システム
US20160291687A1 (en) * 2013-05-21 2016-10-06 Sony Corporation Display control device, display control method, and recording medium
GB2529191A (en) * 2014-08-12 2016-02-17 Sony Comp Entertainment Europe Display apparatus and method
US9740010B2 (en) * 2014-11-28 2017-08-22 Mahmoud A. ALHASHIM Waterproof virtual reality goggle and sensor system
US20160300392A1 (en) * 2015-04-10 2016-10-13 VR Global, Inc. Systems, media, and methods for providing improved virtual reality tours and associated analytics
US10586469B2 (en) * 2015-06-08 2020-03-10 STRIVR Labs, Inc. Training using virtual reality
US9703102B2 (en) * 2015-08-28 2017-07-11 Tomy Company Ltd. Information processing device including head mounted display
US9766713B2 (en) * 2015-09-08 2017-09-19 Unity IPR ApS System and method for providing user interface tools
WO2017082457A1 (ko) * 2015-11-11 2017-05-18 엘지전자 주식회사 Hmd 및 그 hmd의 제어 방법
US20170206707A1 (en) * 2016-01-15 2017-07-20 Anthony Guay Virtual reality analytics platform
US10083539B2 (en) * 2016-02-08 2018-09-25 Google Llc Control system for navigation in virtual reality environment
US9721393B1 (en) * 2016-04-29 2017-08-01 Immersive Enterprises, LLC Method for processing and delivering virtual reality content to a user
US10509487B2 (en) * 2016-05-11 2019-12-17 Google Llc Combining gyromouse input and touch input for navigation in an augmented and/or virtual reality environment
US20170352184A1 (en) * 2016-06-06 2017-12-07 Adam G. Poulos Optically augmenting electromagnetic tracking in mixed reality
US11172005B2 (en) * 2016-09-09 2021-11-09 Nokia Technologies Oy Method and apparatus for controlled observation point and orientation selection audiovisual content
WO2018048000A1 (ko) * 2016-09-12 2018-03-15 주식회사 딥픽셀 단일 카메라 기반의 3차원 영상 해석 장치 및 방법, 3차원 영상 해석을 위한 프로그램이 기록된 컴퓨터로 읽을 수 있는 매체
KR102560029B1 (ko) * 2016-09-12 2023-07-26 삼성전자주식회사 가상 현실 콘텐트를 송수신하는 방법 및 장치
US20180101986A1 (en) * 2016-10-10 2018-04-12 Aaron Mackay Burns Drawing in a 3d virtual reality environment
US10147243B2 (en) * 2016-12-05 2018-12-04 Google Llc Generating virtual notation surfaces with gestures in an augmented and/or virtual reality environment
KR20180099182A (ko) * 2017-02-28 2018-09-05 엘지전자 주식회사 헤드 마운티드 디스플레이를 포함하는 시스템 및 그 제어 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003143579A (ja) 2001-11-01 2003-05-16 Sony Corp 全方位映像の有料配信システム,有料配信方法及び有料視聴システム
JP2014072570A (ja) * 2012-09-27 2014-04-21 Kyocera Corp 表示装置および制御方法
JP2016167219A (ja) * 2015-03-10 2016-09-15 株式会社コロプラ ヘッドマウントディスプレイへ表示するためのユーザインタフェース表示方法、及びプログラム
WO2017037962A1 (ja) * 2015-08-28 2017-03-09 株式会社タカラトミー 頭部装着型ディスプレイを備えた情報処理装置
JP6093473B1 (ja) * 2016-08-19 2017-03-08 株式会社コロプラ 情報処理方法及び当該情報処理方法をコンピュータに実行させるためのプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP3605300A4

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4086729A4 (en) * 2019-12-31 2023-03-22 Vivo Mobile Communication Co., Ltd. VIDEO EDITING PROCEDURE AND HEAD-WEAR DEVICE
WO2023095642A1 (ja) * 2021-11-26 2023-06-01 ソニーグループ株式会社 画像処理装置、画像処理方法、プログラム

Also Published As

Publication number Publication date
EP3605300A1 (en) 2020-02-05
US11070724B2 (en) 2021-07-20
CN110402426A (zh) 2019-11-01
US20200077021A1 (en) 2020-03-05
JPWO2018173791A1 (ja) 2020-01-23
JP7196834B2 (ja) 2022-12-27
EP3605300A4 (en) 2020-02-26

Similar Documents

Publication Publication Date Title
JP7196834B2 (ja) 画像処理装置および方法、並びにプログラム
Nguyen et al. Vremiere: In-headset virtual reality video editing
US7434153B2 (en) Systems and methods for authoring a media presentation
KR101860313B1 (ko) 3차원 공간에서의 장면 편집 방법 및 시스템
KR101052805B1 (ko) 증강 현실 환경에서의 3차원 모델 객체 저작 방법 및 시스템
KR100930370B1 (ko) 증강현실 저작 방법 및 시스템과 그 프로그램을 기록한컴퓨터로 읽을 수 있는 기록 매체
JP2005209196A5 (ja)
US20140193140A1 (en) System and method for slow motion display, analysis and/or editing of audiovisual content on a mobile device
CN111064999B (zh) 用于处理虚拟现实输入的方法和系统
KR20140042427A (ko) 애니메이션 이모티콘을 생성하는 장치 및 그 방법
US20190155465A1 (en) Augmented media
JP7070547B2 (ja) 画像処理装置および方法、並びにプログラム
US20180165877A1 (en) Method and apparatus for virtual reality animation
JP2014016670A (ja) 画像処理装置及び画像処理プログラム
US20230033201A1 (en) Image processing apparatus, image processing method, and storage medium
JP3833155B2 (ja) 仮想空間呈示装置及び仮想空間提示方法
KR101743624B1 (ko) 강의 동영상에 북마크를 부가하는 방법 및 컴퓨터 프로그램
JP2018036942A (ja) 3次元ユーザインタフェース装置および3次元操作用プログラム
KR101263881B1 (ko) 무인 방송 제어 시스템
US20240062496A1 (en) Media processing method, device and system
Nguyen Designing In-Headset Authoring Tools for Virtual Reality Video
Guven Authoring and presenting situated media in augmented and virtual reality
Carter et al. Creating expository documents with web-based authoring and heads-up capture
JP2008176580A (ja) 情報処理装置及び表示制御方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18772584

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2019507536

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2018772584

Country of ref document: EP

Effective date: 20191022