WO2018139203A1 - 情報処理装置、情報処理方法、及びプログラム - Google Patents

情報処理装置、情報処理方法、及びプログラム Download PDF

Info

Publication number
WO2018139203A1
WO2018139203A1 PCT/JP2018/000426 JP2018000426W WO2018139203A1 WO 2018139203 A1 WO2018139203 A1 WO 2018139203A1 JP 2018000426 W JP2018000426 W JP 2018000426W WO 2018139203 A1 WO2018139203 A1 WO 2018139203A1
Authority
WO
WIPO (PCT)
Prior art keywords
model
generation
generation process
user
information processing
Prior art date
Application number
PCT/JP2018/000426
Other languages
English (en)
French (fr)
Inventor
真人 島川
Original Assignee
ソニー株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニー株式会社 filed Critical ソニー株式会社
Priority to US16/478,235 priority Critical patent/US10943383B2/en
Priority to JP2018564465A priority patent/JP7070435B2/ja
Publication of WO2018139203A1 publication Critical patent/WO2018139203A1/ja
Priority to US17/173,835 priority patent/US11288854B2/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T13/00Animation
    • G06T13/203D [Three Dimensional] animation
    • G06T13/403D [Three Dimensional] animation of characters, e.g. humans, animals or virtual beings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • G06T17/20Finite element generation, e.g. wire-frame surface description, tesselation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras

Definitions

  • the present technology relates to an information processing apparatus, an information processing method, and a program that can generate a model displayed in a virtual space or the like.
  • a technique for providing various virtual experiences to a user through a virtual space constructed by a computer system or the like is known. For example, a character selected by the user is displayed in the virtual space. A user can move in the virtual space or communicate with other users by operating a character or the like.
  • Patent Document 1 describes an operation expression of a character in a virtual space using a controller.
  • a controller activity such as a change in the position of a controller or a button operation that is obtained by a user is detected.
  • the posture, motion, and facial expression of the character in the virtual space are expressed. This makes it possible to communicate smoothly, for example, using gestures.
  • an object of the present technology is to provide an information processing apparatus, an information processing method, and a program that can provide a natural virtual experience to a user.
  • an information processing apparatus includes an acquisition unit, a generation unit, and a generation control unit.
  • the acquisition unit acquires an image of an object.
  • the generation unit includes a first generation process and a second generation process different from the first generation process as a generation process for generating a model of the object based on the acquired image of the object. Each can be done.
  • the generation control unit controls switching between execution of the first generation process and execution of the second generation process by the generation unit.
  • This information processing apparatus can execute different first and second generation processes as a generation process for generating a model of an object based on an image of the object. By appropriately switching the execution of each of the first and second generation processes, a natural virtual experience can be provided to the user.
  • the first generation process may generate a first model in which the object is reproduced with a first reproducibility.
  • the second generation process may generate a second model in which the object is reproduced with a second reproducibility lower than the first reproducibility.
  • the first generation process may generate the first model in which the state of the object included in the image of the object is reproduced.
  • the second generation process may generate the second model in which at least a part of the state of the object included in the image of the object is changed. Accordingly, for example, a first model that directly reproduces the state of the object and a second model that expresses a desired state by changing a part of the state of the object can be generated.
  • the second generation process may generate the second model in which at least a part of the object is replaced or deleted. This makes it possible to easily change the state of the object. As a result, the processing time can be shortened and high performance can be exhibited.
  • the object may include a person and an object used by the person.
  • a model imitating the state of the user can be generated, and a natural virtual experience can be provided to the user.
  • the second generation process may generate the second model in which at least one of the facial expression, posture, and motion of the person is changed. As a result, various states of the user can be expressed.
  • the second generation process may generate the second model in which an object used by the person is replaced or deleted. This makes it possible to generate a model in which, for example, a controller used by the user is deleted, and to provide a more natural virtual experience.
  • the generation unit When the execution of each of the first generation process and the second generation process is switched, the generation unit represents the first and second transition states for switching to each of the first and second models. Each of the second models may be generated. Thereby, switching to each of the first and second models is smoothly expressed.
  • the generation control unit executes the first generation process by the generation unit and the second generation based on determination information including a determination condition as to whether or not to change at least a part of the state of the object.
  • the switching of the execution of the process may be controlled. As a result, the first and second generation processes can be switched with high accuracy.
  • the determination condition may include a condition regarding at least one of an output from a controller used by the person, an image of the person, and a sound of the person.
  • the generation control unit may select execution of the second generation process when an instruction for a predetermined operation is input.
  • the generation unit may generate the second model that executes the predetermined operation as the second generation process. Thereby, it becomes possible to express with high accuracy the operation instructed by the user using the second model.
  • the generation unit may generate the second model that executes an operation of transitioning to the predetermined operation as the second generation process. As a result, it is possible to express a smooth transition to a predetermined operation.
  • the determination condition may include a condition related to at least one of an operation input by gesture of the person and an operation input by voice. Accordingly, it is possible to determine whether or not a gesture or utterance for operation input is performed, and it is possible to switch the gesture or the like to another expression.
  • the generation control unit may select execution of the second generation process when an operation input by the gesture and an operation input by the voice are accepted.
  • the generation unit may generate the second model that does not execute the gesture and the speech utterance operation. This makes it possible to generate a second model in which operations such as gestures and utterances for operation input are not reproduced. As a result, the operation input operation and the like can be cut.
  • the determination condition may include a condition related to whether or not the person is in a state that requires privacy protection. As a result, it is possible to determine when it is necessary to protect the privacy of the user, and it is possible to switch to an expression in which privacy is protected.
  • the generation control unit may select execution of the second generation process when it is determined that the person is in a state requiring privacy protection.
  • the generation unit may generate the second model in which at least a part of the person is changed as the second generation process.
  • the determination information may include a method of changing at least a part of the state of the object associated with the determination condition.
  • the generation unit may execute the second generation process based on the determination information.
  • the determination information may include specification information for specifying a part to be changed of the object and a method for changing the specified part to be changed.
  • An information processing method is an information processing method executed by a computer system, and includes obtaining an image of an object. As a generation process for generating a model of the object based on the acquired image of the object, a first generation process and a second generation process different from the first generation process are executed. . Switching between execution of the first generation process and execution of the second generation process is controlled.
  • a program causes a computer system to execute the following steps. Obtaining an image of the object; A step of executing each of a first generation process and a second generation process different from the first generation process as a generation process for generating a model of the object based on the acquired image of the object. . Controlling the switching between execution of the first generation process and execution of the second generation process.
  • a natural virtual experience can be provided by the user.
  • the effects described here are not necessarily limited, and may be any of the effects described in the present disclosure.
  • FIG. It is a schematic diagram which shows an example of the replacement information referred in the example shown in FIG. It is a block diagram which shows the structural example of the virtual space generation system in case HMD is used. It is a schematic diagram which shows the other example of a 2nd production
  • FIG. 1 is a schematic diagram for explaining an overview of a virtual space generation system according to an embodiment of the present technology.
  • the virtual space generation system 10 includes a plurality of cameras 40, a model generation device 100, and a virtual space generation device 50.
  • the user (person) 20 in the real space R is photographed by the plurality of cameras 40, and the virtual model 30 of the user 20 is generated by the model generation device 100.
  • the generated virtual model 30 is output to the virtual space generation device 50, and a virtual space V including the virtual model 30 is generated.
  • the generated virtual space V is transmitted to and displayed on a display device (not shown) owned by the user 20, for example. As a result, the user 20 can view the free viewpoint video in the virtual space V.
  • the model generation device 100 can generate a three-dimensional (3D) computer graphic (CG) or the like in which the state of the user 20 is reproduced in detail as the virtual model 30. Further, for example, by always photographing the user 20, it is possible to generate the virtual model 30 that reproduces the state of the user 20 in real time.
  • the target of the virtual model 30 is not limited to a person, and the virtual model 30 can be generated for an arbitrary target such as a pet or a robot.
  • an application (computer program) 51 for constructing the virtual space V is installed, and the virtual model 30 is output to the application 51 (see FIG. 2). Thereby, the virtual model 30 is displayed on the virtual space V.
  • connection form of the plurality of cameras 40, the model generation device 100, and the virtual space generation device 50 is not limited.
  • each device may be connected via a network such as a LAN (Local Area Network) or a WAN (Wide Area Network), or may be directly connected using a cable or the like.
  • the plurality of cameras 40 are arranged in the vicinity of the user 20, and the model generation device 100 and the virtual space generation device 50 are arranged on the network.
  • only the virtual space generation device 50 is arranged on the network.
  • any connection form and device arrangement may be employed.
  • the model generation device 100 and the virtual space generation device 50 can be realized by an arbitrary computer such as a PC (Personal Computer).
  • the model generation device 100 corresponds to an embodiment of an information processing device according to the present technology.
  • FIG. 2 is a block diagram illustrating a configuration example of the virtual space generation system 10.
  • an application 51 installed in the virtual space generation device 50 is schematically illustrated.
  • N cameras 40 are illustrated as the plurality of cameras 40.
  • the N cameras 40 take an image of the object (user 20) and generate an image of the object (image of the user 20).
  • the N cameras 40 are respectively arranged at different positions with reference to a predetermined shooting area.
  • the user 20 moves to the shooting area and is shot by N cameras 40.
  • images of the N users 20 that are taken from the user 20 in various directions are generated.
  • the RGB-D camera is a camera that includes an RGB camera that captures a color image and a distance sensor that can measure a distance for each pixel of the captured image.
  • a digital camera including an image sensor such as a CMOS (Complementary Metal-Oxide Semiconductor) sensor or a CCD (Charge Coupled Device) sensor is used.
  • the distance sensor for example, a TOF (Time Of Flight) type sensor that measures a distance based on a time required for the irradiated light to reciprocate to an object using an infrared LED (Light Emitting Diode) and an image sensor is used.
  • an RGB-D image including color information and distance information for each pixel is generated as an image of the user 20, for example.
  • the RGB-D image is an image called a 2.5D image or a 3D image because it includes distance information (depth information) from the direction in which the object is photographed. Therefore, in this embodiment, N RGB-D images obtained by photographing the user 20 are generated by N RGB-D cameras. As a result, for example, it is possible to generate three-dimensional coordinates for the outer shape of the user 20.
  • the specific configuration of the camera 40 is not limited. For example, an RGB camera that does not have a distance sensor or the like may be used. Even in this case, the three-dimensional coordinates of the user 20 and the like can be generated by stereo shooting using a plurality of RGB cameras.
  • the model generation apparatus 100 has hardware necessary for the configuration of the computer, such as a CPU (Central Processing Unit), a ROM (Read Only Memory), a RAM (Random Access Memory), and an HDD (Hard Disk Drive).
  • a CPU Central Processing Unit
  • ROM Read Only Memory
  • RAM Random Access Memory
  • HDD Hard Disk Drive
  • Each function block shown in FIG. 2 is realized by the CPU loading and executing the program according to the present technology stored in the ROM or HDD into the RAM. And the information processing method concerning this art is performed by these functional blocks.
  • dedicated hardware such as an FPGA (Field Programmable Gate Array) or an image processing IC (Integrated Circuit) may be used as appropriate.
  • the program is installed in the model generation apparatus 100 via various recording media, for example.
  • the program may be installed via the Internet or the like.
  • the model generation apparatus 100 includes a 3D model generation unit 110, a replacement processing unit 120, a replacement control unit 130, a UI determination unit 140, and a stream generation unit 150 as functional blocks. Further, a replacement information DB (Data Base) 160 is stored in a storage unit configured by a ROM or the like of the model generation device 100, and a generated model buffer 170 is also configured by the storage unit. Furthermore, the model generation device 100 includes an image acquisition unit that is not illustrated.
  • the image acquisition unit acquires the RGB-D image of the user 20 through an interface or the like.
  • the type of interface used is not limited.
  • an interface provided with an HDMI (registered trademark) (High-Definition Multimedia Interface) terminal, a WiFi module, or the like is used.
  • the RGB-D image acquired by the image acquisition unit is output to the 3D model generation unit 110.
  • the image acquisition unit corresponds to an acquisition unit that acquires an image of an object.
  • the 3D model generation unit 110 generates a 3D model of an object including the user 20 and an object used by the user 20 based on the N RGB-D images.
  • a 3D model is generated in which the state of the object included in each of the N RGB-D images (the state relating to the facial expression, posture, movement, etc. of the user 20 and the state of the object used by the user) is directly reproduced.
  • the user 20 and the objects used by the user 20 may be simply referred to as the user 20.
  • coordinate conversion or the like is performed on the RGB-D image captured by the RGB-D camera. Specifically, the position and depth of each pixel of the RGB-D image are converted into coordinates in a predetermined three-dimensional coordinate system. As a result, the three-dimensional coordinates (point cloud) of many points representing the three-dimensional shape of the user 20 are calculated.
  • the process of calculating the point cloud is executed for N RGB-D images. Thereby, for example, a point cloud representing the entire image of the user 20 can be calculated with high accuracy. A mesh model representing the three-dimensional shape of the user 20 is generated based on the calculated point cloud.
  • texture information related to the skin color of the user 20 and the color of clothes being worn is acquired. Based on the acquired texture information, the color of the surface of the mesh model is set, and a 3D model such as the user 20 is generated. Therefore, in the 3D model, the shape and color of the user 20 shown in the RGB-D image are reproduced with high accuracy.
  • the method for generating the 3D model is not limited, and the 3D model may be generated by another method.
  • 3D model information or N 2D images are output from the 3D model generation unit 110 to other functional blocks.
  • the 2D image is a two-dimensional image obtained by removing distance information (depth information) from the RGB-D image.
  • distance information depth information
  • N 2D images are generated from the N RGB-D images used for generating the output 3D model, and are output together with the information of the 3D model.
  • information output to other functional blocks is not limited, and for example, N RGB-D images may be output as they are instead of N 2D images.
  • the RGB-D image and the 2D image that is a part of the RGB-D image correspond to the image of the object.
  • the replacement processing unit 120 can change at least a part of the 3D model generated by the 3D model generation unit 110. That is, the replacement processing unit 120 has at least a part of the state of the object included in each of the N 2D images (the state relating to the facial expression, posture, movement, etc. of the user 20 and the state of the object used by the user 20). It is possible to generate a modified 3D model.
  • the 3D model subjected to the change process by the replacement processing unit 120 is a model in which the object is reproduced with lower reproducibility than the 3D model before the change.
  • the changing process for changing the 3D model for example, a process of replacing at least a part of the 3D model, a process of deleting at least a part, a process of adding a predetermined object to the 3D model, and the like are executed.
  • the case where the controller etc. which the user 20 uses is deleted, the case where it replaces with another thing, etc. are included.
  • the process which changes a 3D model is not limited, A specific example is demonstrated in detail later.
  • the replacement control unit 130 controls the operation of the replacement processing unit 120.
  • the replacement control unit 130 controls whether the replacement processing unit 120 executes the change process. Therefore, the replacement control unit 130 appropriately switches between a mode in which the change process by the replacement processing unit 120 is executed and a mode in which the change process is not executed.
  • a highly reproducible 3D model is output from the replacement processing unit 120.
  • a 3D model with low reproducibility is output from the replacement processing unit 120.
  • the control of whether or not the change process is executed by the replacement control unit 130 is executed based on the replacement information 161 stored in the replacement information DB 160.
  • the replacement information 161 includes replacement condition information 162, replacement target information 163, and model generation information 164.
  • the replacement condition information 162 is information including a determination condition as to whether or not to change at least a part of the state of the object.
  • the determination condition will be described as a replacement condition. That is, the replacement conditions in this description include not only the conditions for replacement, but also the determination conditions for various changes in the 3D model including deletion.
  • the change process performed by the replacement processing unit 120 may be referred to as a replacement process.
  • the replacement control unit 130 determines whether or not the replacement condition included in the replacement condition information 162 is satisfied based on the information regarding the user 20 and the virtual space V input from the 3D model generation unit 110, the UI determination unit 140, and the application 51. Determine whether.
  • the replacement condition for example, instructions for starting and ending the replacement process, and specific instructions for the replacement process (which part to change and how) are output to the replacement processing unit 120.
  • the replacement target information 163 is specific information for specifying a part to be replaced.
  • the model generation information 164 is information including a method for changing the identified part to be replaced. These pieces of information are stored in association with the replacement condition information 162. That is, the replacement target information 163 and the model generation information 164 correspond to information related to a method for changing at least a part of the state of the object associated with the replacement condition.
  • the replacement information DB 160 a plurality of replacement information 161 corresponding to various situations is recorded. Accordingly, it is possible to execute replacement processing according to various situations, and it is possible to generate a 3D model desired by the user 20 with high accuracy.
  • the information included in the replacement information 161 is not limited, and any information that can realize a desired replacement process may be used.
  • the 3D model generation unit 110, the replacement processing unit 120, and the replacement control unit 130 cooperate to realize a generation unit.
  • the replacement control unit 130 also functions as a generation control unit.
  • the process in which the replacement process by the replacement processing unit 120 is not executed under the control of the replacement control unit 130 and a highly reproducible 3D model is generated corresponds to the first generation process in the present embodiment.
  • the highly reproducible 3D model output by the replacement processing unit 120 corresponds to the first model in which the object is reproduced with the first reproducibility, and becomes the virtual model 30 of the user 20 shown in FIG. .
  • the virtual model 30 generated without the replacement process may be referred to as a first virtual model generated by the first generation process.
  • the processing in which the replacement processing by the replacement processing unit 120 is executed under the control of the replacement control unit 130 and a 3D model with low reproducibility is generated corresponds to the second generation processing in the present embodiment.
  • the 3D model with low reproducibility output by the replacement processing unit 120 corresponds to the second model in which the object is reproduced with the second reproducibility lower than the first reproducibility, and is shown in FIG. It becomes the virtual model 30 of the user 20.
  • the virtual model 30 generated by the replacement process may be referred to as a second virtual model generated by the second generation process.
  • the first virtual model with high reproducibility and the second virtual model with low reproducibility can be switched and displayed. It becomes possible. For example, in various situations, it may be possible to enjoy a virtual experience naturally without a sense of incongruity by displaying a virtual model 30 that has been partially changed rather than a virtual model 30 that reproduces the state of the user 20 as it is. . That is, the first and second generation processes are appropriately switched, and the first and second virtual models are switched, so that a natural virtual experience can be provided to the user 20. Details will be described later.
  • switching whether or not the replacement process is performed by the replacement control unit 130 corresponds to switching between execution of the first generation process and execution of the second generation process by the generation control unit.
  • the UI determination unit 140 recognizes or determines an instruction input by the user 20 via various user interfaces (User ⁇ ⁇ ⁇ ⁇ ⁇ ⁇ ⁇ ⁇ Interface). For example, the UI determination unit 140 recognizes an operation input by a gesture of the user 20 or an operation input by voice based on a 2D image of the user 20 or information from the microphone 41 and the button 42 connected to the model generation apparatus 100. To do.
  • the type of interface used is not limited. For example, a multimodal interface using gestures and voices may be used.
  • the content such as the service requested by the user 20 is determined by the UI determination unit 140 and transmitted to the application 51 as a UI determination result. Accordingly, the application 51 can provide the requested service or the like to the user 20. Further, information that the user 20 is performing an operation input is transmitted to the replacement control unit 130 as a UI event. Accordingly, the replacement control unit 130 can perform a determination that the replacement process is performed when the user 20 is performing a predetermined operation input, for example.
  • the generated model buffer 170 holds information on the virtual model 30 (3D model) output from the replacement processing unit 120 for a certain period. That is, the information of the virtual model 30 output in the past is stored for a predetermined number of frames. Information on the stored virtual model 30 can be fed back to the replacement processing unit 120. Thereby, for example, it is possible to execute a replacement process or the like using the information of the virtual model 30 generated immediately before.
  • the stream generation unit 150 generates a video (stream) of the virtual model 30 based on the information of the virtual model 30 output from the replacement processing unit 120 for each frame.
  • the method for generating the stream is not limited, and an arbitrary rendering process according to the format of the 3D model, the specification of the application 51, or the like may be executed.
  • the generated stream of the virtual model 30 is output to the application 51.
  • the application 51 is a computer program that generates a virtual space V using the virtual space generation device 50.
  • the application 51 acquires video information and the like of the virtual model 30 and places the virtual model 30 at an appropriate position in the virtual space V. Thereby, the virtual model 30 of the user 20 is reproduced on the virtual space V.
  • the application 51 can output status information regarding the state of the virtual model 30 in the virtual space V to the replacement control unit 130.
  • the status information is information indicating what state the virtual model is in, for example, according to an operation instruction for the virtual model 30, an instruction for an operation or production determined as an expression in the virtual space V, or the like. Generated. For example, when an instruction for a predetermined operation is being input via a controller or the like used by the user 20, status information indicating that the specified operation is being performed is generated. In addition, various status information is generated.
  • FIG. 3 is a flowchart showing an outline of generation of the virtual model 30.
  • the image acquisition unit acquires a 2D image (RGB-D image) of the user 20 (object) (step 101). Based on the replacement condition information 162, the replacement control unit 130 determines whether to change at least a part of the state of the user 20 (step 102).
  • the first generation process is executed (step 103).
  • the replacement control unit 130 outputs an instruction not to execute the replacement process to the replacement processing unit 120.
  • the 3D model generated by the 3D model generation unit 110 is output as it is as the first virtual model. Accordingly, a first virtual model in which the state of the user 20 included in the 2D image is reproduced is generated.
  • Step 104 When at least a part of the state of the user 20 is changed, that is, when it is determined that the replacement condition is satisfied (YES in Step 102), the second generation process is executed (Step 104).
  • an instruction to execute the replacement process is output from the replacement control unit 130 to the replacement processing unit 120.
  • the replacement processing unit 120 executes replacement processing on the 3D model generated by the 3D model generation unit 110 and outputs the result as a second virtual model.
  • a second virtual model in which at least a part of the state of the user 20 included in the 2D image is changed is generated.
  • the operation of the replacement processing unit 120 is controlled by the replacement control unit 130, and the first virtual model and the second virtual model are switched to each other and generated. Accordingly, for example, an appropriate virtual model 30 corresponding to various situations of the user 20 and the virtual space V can be displayed as appropriate.
  • the method of generating the virtual model 30 is not limited to the method described above, and any other method may be used.
  • the 3D model generation unit 110 generates the 3D model of the user 20 in accordance with the acquisition of the 2D image of the user 20. Then, the first and second generation processes are switched depending on whether or not the replacement process is executed on the generated 3D model.
  • the determination in step 102 may be performed first, and then either the first or second generation process may be started based on the determination result.
  • the first and second virtual models may be directly generated based on the 2D image of the user 20, for example.
  • FIG. 4 is a schematic diagram showing an example of the second generation process.
  • the replacement process 121 is performed on the 3D model 60 a of the user 20 a who uses the walking controller 43, and the second virtual model 30 a that performs the walking motion is generated.
  • FIG. 4 schematically shows replacement information 161 used for the replacement process 121.
  • the walking controller 43 shown in FIG. 4 is of the type that the user 20a rides on and uses the movement of the second virtual model 30a in the virtual space V (walking) by moving the weight of the user 20a. / Running) can be instructed. It is possible to control the moving direction, moving speed, etc. of the second virtual model 30a by adjusting the direction and size of moving the weight. That is, the user 20a can cause the second virtual model 30a to execute a walking motion while maintaining a substantially upright posture without actually performing a walking motion.
  • the instruction of the walking motion input via the walking controller 43 is output to the application 51 and output to the replacement control unit 130 as status information.
  • the 3D model generation unit 110 generates the 3D model 60a including the user 20a and the walking controller 43 based on the N 2D images of the user 20 who uses the walking controller 43. .
  • FIG. 5 is a flowchart showing a processing example of the replacement control unit 130.
  • FIG. 6 is a schematic diagram illustrating an example of replacement information referred to in this example, and details of the replacement information 161 illustrated in FIG. 4.
  • the replacement information 161 includes replacement condition information 162, replacement target information 163, and model generation information 164.
  • items relating to status information, a target object (indicated as a model in FIG. 6), and UI determination are included as replacement conditions.
  • a plurality of replacement information 161 (1 to m) is acquired from the replacement information DB 160 (step 201).
  • the 3D model 60a generated by the 3D model generation unit 110 and N 2D images are acquired (step 202).
  • the replacement condition included in the plurality of replacement condition information 162 of 1 to m is satisfied.
  • the replacement information 161 is read sequentially, and it is first determined whether or not the status in the replacement condition information 162 matches (step 203).
  • the replacement information 161 shown in FIG. 6 is read, and the status indicating that the walking operation is being performed is matched according to the instruction of the walking operation via the walking controller 43 (Yes in Step 203).
  • Step 203 If no instruction for walking motion is input via the walking controller 43, it is determined that the replacement condition is not satisfied, and other replacement information 161 is read (No in Step 203, Step 209, and Step 210). Yes flow). If there is no replacement information that has not been read yet (No in Step 210), the replacement processing unit 120 is notified that there is no replacement target, and the process ends (Step 211).
  • the replacement condition information 162 includes a recognition feature amount in the 2D video (image) of the walking controller 43.
  • the replacement control unit 130 determines, for each of the N 2D images acquired in step 202, whether or not a portion matching the recognized feature amount is detected. If there is a matching part, it is determined that the target object is recognizable (Yes in step 204). If there is no portion that matches the recognized feature amount in the 2D image, it is determined that the replacement condition is not satisfied, and the process proceeds from No in step 204 to step 209.
  • the method for recognizing the target object is not limited, and any technique such as a matching technique may be used.
  • the replacement conditions presence / absence of recognition based on N 2D images and presence / absence of recognition based on the 3D model are set as separate items.
  • a condition that the target object is recognized by at least one of these without distinguishing between the 2D image and the 3D model may be set as the replacement condition.
  • a portion corresponding to the walking controller 43 on the 3D model 60a is marked (step 205). Specifically, each vertex information on the 3D model corresponding to each point is acquired based on the coordinates of each point in the 2D image that matches the recognition feature amount of the walking controller 43. Each acquired vertex information is marked as vertex information representing each point of the walking controller 43.
  • an object ID is set in a portion corresponding to the walking controller 43 on the 3D model 60a.
  • the walking controller 43 is a part to be deleted. Therefore, the target object also serves as identification information for identifying a part to be replaced.
  • step 206 it is determined whether or not there is an area including a human body. That is, it is determined whether or not a human body is detected.
  • a method for detecting a human body is not limited, and any technique using a 2D image or a 3D model 60a may be used. If no human body is detected, it is determined that the replacement condition is not satisfied, and the process proceeds from No in Step 206 to Step 209.
  • Step 207 a portion corresponding to the human body on the 3D model 60a is marked.
  • the vertex information corresponding to the human body on the 3D model 60a is marked by the same method as in step 205, and the object ID is set in the portion corresponding to the human body.
  • step 208 The mark and ID of the object (walking controller 43), the mark and ID of the human body (user 20a), and the replacement information are transmitted to the replacement processing unit, and the process ends (step 208). That is, in this case, it is determined that the replacement condition is satisfied, the process proceeds from Yes in step 102 in FIG. 3 to step 104, and the second generation process is executed.
  • FIG. 7A is a block diagram illustrating a specific configuration example of the replacement processing unit.
  • FIG. 7B is a schematic diagram relating to processing executed by each block of the replacement processing unit 120.
  • FIG. 8 is a flowchart illustrating an example of the replacement process. The steps given in FIG. 7B correspond to the steps in FIG.
  • the replacement processing unit 120 includes a replacement processing control unit 122, a target object replacement processing unit 123, a body model conversion unit 124, a body model replacement processing unit 125, and a Mesh model conversion unit 126.
  • the replacement processing control unit 122 controls the operation of each block based on the replacement information 161 and the like output from the replacement control unit 130.
  • a replacement process for the target object is executed (step 301).
  • the target object replacement processing unit 123 replaces the target object with another object or the like based on the model generation information 164.
  • the model generation information 164 does not include information on other objects, the target object is simply deleted.
  • the portion corresponding to the walking controller 43 is deleted from the 3D model 60a.
  • the object ID is set to the portion (segment) corresponding to the walking controller 43 on the 3D model 60a. Therefore, the walking controller 43 can be easily deleted by deleting the segment specified by the object ID.
  • the body model 70 is a model in which a portion corresponding to the human body in the 3D model 60a is converted into a form that can be easily deformed or replaced using the characteristics of the human body.
  • the body model 70 a deformable model in which the relative positional relationship between the mesh and the skeleton of the 3D model 60a is estimated, a parametric model that can control the size (parameter) of each part of the human body, and the like are used as appropriate.
  • the body model 70 is generated based on anatomical restrictions based on, for example, a bone model generated by bone recognition. The model is not limited to this, and any model that can represent a human body or the like may be used as the body model 70.
  • the technology used for bone recognition and conversion to the body model 70 is not limited.
  • a technique capable of estimating a human skeleton from a 2D image, a mesh model, or any other technique using machine learning may be used.
  • an arbitrary conversion method that can deform the mesh model or the like may be used.
  • the body model replacement processing unit 125 executes body model replacement processing including change (deformation) and replacement of the body model 70 (step 303).
  • the body model replacement processing unit 125 replaces both feet of the body model 70 with a walking action.
  • the part (both legs) specified by the replacement target information 163 is replaced with a model that performs a walking motion based on the model generation information 164. Accordingly, the replaced body model 71 is generated in which the person is changed from the upright state to the state in which the walking motion is performed.
  • the body model conversion unit 124 and the body model replacement processing unit 125 execute the replacement processing 121 for the human body.
  • a natural walking motion can be easily expressed.
  • a human body is identified using an object ID or the like.
  • replacement target information 163 to be replaced and model generation information 164 representing the replacement method of the replacement target are generated.
  • a skeleton of both feet is designated as the replacement target information 163
  • a replacement model related to the skeleton of both feet is stored in the model generation information 164. Therefore, the skeleton specified by the replacement target information 163 and the skeleton generated by the model generation information 164 are set to be the same.
  • it is not limited to a bone model For example, arbitrary parameters, such as the feature-value regarding each site
  • the model generation information 164 holds information on a plurality of frames in order to express walking motion and the like. For example, during the walking motion, it is possible to easily express the continuation of the walking motion by repeatedly using information of a plurality of frames.
  • the mesh model conversion unit 126 converts the replaced body model 71 into a mesh model again (step 304). As a result, the second virtual model 30a is generated, and the process ends.
  • the generated second virtual model 30a is appropriately output to the stream generation unit 150 and the like, and is displayed to the user as an animation.
  • the replacement control unit 130 selects execution of the second generation process based on the replacement information 161 when an instruction for walking motion is input. Then, as the second generation process, the second virtual model 30a that executes the walking motion is generated. Thereby, even when the user 20a is not performing a walking motion or the like, the second virtual model 30a of the user 20a performing the walking motion is displayed in the virtual space V. As a result, it is possible to provide a natural virtual experience with a small burden on the user 20a.
  • a model representing a transition state when switching from the first generation process to the second generation process. For example, in this example, when the start of the walking motion is instructed, the motion from the state of the first virtual model (the state of the user 20a) at the start time to the start of walking is generated as a transition state model. As a result, it is possible to express a state of smoothly transitioning from the state before starting the operation to the state in which the operation is performed.
  • a model representing a transition state when switching from the second generation process to the first generation process. For example, when the end of the walking motion is instructed, a motion to stop walking toward that state is generated as a transition state model so that the state of the first virtual model at the end time (the state of the user 20a) is obtained. Is done. For example, when the user 20a is sitting, a transition state such as sitting while stopping walking is expressed.
  • the method for generating the model representing the transition state is not limited, and for example, an estimation technique by machine learning based on information of the start action and the end action for various actions, or any other technique may be used.
  • a characteristic unique to the user 20a may be reflected in the replaced operation.
  • a walking motion that reflects how the user 20a walks may be expressed.
  • the characteristic of the unique motion of the user 20a can be acquired based on, for example, a 2D image obtained by capturing the motion of the user 20a in advance.
  • the characteristics of the user 20a are analyzed for various actions such as walking, running, sitting, standing, jumping, etc. It is also possible to memorize.
  • any technique such as machine learning may be used.
  • FIG. 9 is a schematic diagram illustrating another example of the second generation process.
  • FIG. 10 is a schematic diagram illustrating an example of replacement information referred to in this example.
  • the replacement process 121 is executed on the 3D model 60 b of the user 20 b who uses the handheld controller 44, and the second virtual model 30 b that performs the walking motion is generated.
  • the handheld controller 44 is operated by the user 20b.
  • the user 20b can control various operations of the virtual model 30 by using buttons, a joystick, or the like of the handheld controller 44.
  • the user 20 b can cause the virtual model 30 to perform various operations via the handheld controller 44 while sitting.
  • the replacement condition information 162 Based on the replacement condition information 162, it is determined whether the status matches. When the status indicating that the walking operation is being performed is matched according to an instruction from the handheld controller 44, it is determined whether or not the handheld controller 44 can be recognized. In the replacement information 161 illustrated in FIG. 10, it is determined whether or not the recognition feature amount of the handheld controller 44 matches in the 3D model 60 b.
  • the handheld controller 44 When the handheld controller 44 is recognized, the corresponding part is marked and given an ID. A human body is detected, and marking and ID assignment are executed. The mark and ID of the hand-held controller 44, the mark and ID of the human body, and the replacement information 161 are transmitted to the replacement processing unit 120. Then, a replacement process 121 (second generation process) is executed.
  • the replacement process 121 when the replacement process 121 is performed on the handheld controller 44, for example, a case where the user 20b is sitting is assumed. For this reason, a wide range is designated as a part to be replaced.
  • the replacement target information 163 of this example the hand-held controller 44, both arms using it, and both feet are designated as replacement targets.
  • the model generation information 164 stores model information representing walking motions for both arms and both legs.
  • the handheld controller 44 in the 3D model 60b is deleted. Also, both arms and legs of the person are replaced with a model that performs a walking motion, and a second virtual model 30b that performs the walking motion is generated.
  • a second virtual model 30b that performs a walking motion from the sitting 3D model 60b is generated.
  • the second generation process generates a second virtual model 30b that executes an action of transitioning to a walking action, such as executing an action of rising from a sitting state and then executing an action of starting to walk.
  • a series of motions that transition to a walking motion based on information of a plurality of frames included in the model generation information 164. This makes it possible to express a smooth transition to walking.
  • the 3D model 60b is generated based on the 2D image obtained by photographing the user 20b in the sitting state, there is a possibility that information such as the feet cannot be obtained sufficiently. Therefore, even if the 3D model is deformed using conversion to a body model or the like, there is a possibility that a good second virtual model 30b cannot be obtained.
  • a method is executed in which the 3D model 60b of the user 20b in an upright posture is acquired and the second virtual model 30b is generated using information such as the mesh and texture of the 3D model 60b. Also good.
  • FIG. 11 is a schematic diagram showing another example of the second generation process.
  • FIG. 12 is a schematic diagram illustrating an example of replacement information referred to in this example.
  • the replacement process 121 is performed on the 3D model 60 c of the user 20 c who performs an operation input using a gesture, and a second virtual model 30 c that does not execute the gesture is generated.
  • the user 20c can perform an operation input corresponding to the gesture by executing a predetermined gesture.
  • the user 20 c performs a gesture such as swinging both elbows and shaking both hands.
  • the gesture of the user 20c is recognized by the UI determination unit 140 based on the N 2D images and the 3D model 60c.
  • FIG. 13 is a block diagram illustrating a specific configuration example of the UI determination unit 140.
  • the UI determination unit 140 includes a gesture recognition unit 141, a voice recognition unit 142, and a determination unit 143.
  • operations of the gesture recognition unit 141 and the determination unit 143 when an operation input by a gesture is performed will be described.
  • the operation of the voice recognition unit 142 will be described in another example.
  • the operation input by gesture is performed by the user 20c.
  • the 3D model generation unit 110 generates a 3D model 60c of the user 20c who performs an operation input using a gesture, and information on the 3D model 60c and N 2D images are input to the gesture recognition unit 141.
  • the gesture recognition unit 141 recognizes that the user 20c is performing an operation input by a gesture based on the input 2D image or the like. For example, the action of the user 20c is detected based on the feature amount or the like, and it is determined whether or not the action matches a pre-stored gesture.
  • the operation of the user 20c matches the stored gesture, it is recognized that the user 20c is performing an operation input by the gesture, and the operation input by the gesture is accepted.
  • the method for recognizing the gesture is not limited, and for example, any method capable of detecting the motion based on the 3D model 60c or the 2D image may be used.
  • the determination unit 143 determines the content of the gesture based on the recognition result of the gesture recognition unit 141. That is, the contents of the service requested by the user 20c are determined. Information such as the determined service content is output to the application 51 as a determination result. In addition, the determination unit 143 generates a UI event that notifies the user that the operation input by the gesture is being recognized, and outputs the UI event to the replacement control unit 130 as appropriate.
  • FIG. 14 is a table showing an example of a UI event output to the replacement control unit 130.
  • the recognition status for an operation input by a gesture such as the start of gesture recognition, during recognition, or the end of recognition, is output. It is also possible to output operation input contents (recognition results) by gestures as UI events.
  • the UI event also includes information about operation input based on voice. This point will be described later.
  • the replacement control unit 130 determines whether or not the replacement condition is met based on the UI event output from the UI determination unit 140.
  • a UI recognition gesture recognition item is set as a replacement condition. That is, based on the UI event, it is determined whether or not a gesture by the user 20c is being recognized.
  • a human body is detected based on the 2D image or the like, and marking and ID assignment are performed on the human body. Then, the mark and ID of the human body and the replacement information 161 are transmitted to the replacement processing unit 120, and the replacement processing 121 (second generation processing) is executed.
  • both arms are designated as replacement targets.
  • the model generation information 164 stores model information indicating a state where both arms are extended.
  • a replacement process 121 is executed based on the replacement target information 163 and the model generation information 164, and a second virtual model 30c that is upright with both arms extended is generated.
  • the type of gesture to be replaced is not limited, and the replacement process 121 may be executed for an arbitrary gesture.
  • a gesture in which the user 20c uses a fingertip to sign is recognized.
  • the fingertip or palm of the user 20c may be replaced.
  • the efficiency of the replacement process 121 can be improved.
  • the replacement control unit 130 selects execution of the second generation process when an operation input by a gesture is accepted.
  • the second virtual model 30c that does not execute the gesture is generated. This makes it possible to switch the gesture or the like to another operation. Therefore, for example, it is possible to enjoy a virtual experience without showing local operation input or the like to other users who share the virtual space V.
  • the replacement process 121 is executed when the gesture recognition unit 141 recognizes that the gesture is started. For this reason, a certain delay may occur after the user 20c starts the gesture until the second virtual model 30c in which the gesture is replaced is generated.
  • the user 20c can notify the UI determination unit 140 that a gesture is started using the button 42 shown in FIG.
  • a gesture recognition start UI event is output by the gesture recognition unit 141 and the determination unit 143 based on the output of the button 42.
  • the replacement processing 121 can be started before the gesture recognition unit 141 actually recognizes the gesture of the user 20c.
  • a 3D model buffer or the like that can hold the 3D model 60c for a certain period of time between the 3D model generation unit 110 and the replacement processing unit 120, it is possible to avoid the influence of delay.
  • FIG. 15 is a schematic diagram illustrating another example of the second generation process.
  • FIG. 16 is a schematic diagram illustrating an example of replacement information referred to in this example.
  • the replacement process 121 is performed on the 3D model 60 d of the user 20 d who performs an operation input by voice, and the second virtual model 30 d that does not perform the voice utterance operation is generated.
  • User 20d can perform voice operation input. For example, when the user 20d speaks an instruction including a predetermined phrase, an operation corresponding to the instruction content is executed.
  • the 3D model generation unit 110 generates a 3D model 60d of the user 20d who performs the speech operation.
  • the voice of the user 20d is acquired by the microphone 41, and the voice information is output to the UI determination unit 140.
  • the voice recognition unit 142 of the UI determination unit 140 shown in FIG. 13 recognizes whether or not the user 20d is performing an operation input by voice based on the voice information of the user 20d. For example, the voice recognition unit 142 analyzes the voice information of the user 20d, and acquires words, phrases, and the like included in the voice. A method for analyzing the voice of the user 20d is not limited, and any voice recognition technique or the like may be used.
  • a predetermined phrase related to an operation input stored in advance is included in the voice of the user 20d, it is recognized that the user 20d is performing an operation input by voice.
  • a predetermined phrase or the like is not included, it is recognized that the user 20d has not performed a voice operation input.
  • the determination unit 143 determines the content of the voice based on the recognition result of the voice recognition unit 142. That is, the contents of the service requested by the user 20d are determined.
  • the determination unit 143 determines the content instructed by the user 20d based on, for example, the words or phrases analyzed by the voice recognition unit 142.
  • the method for determining the content of the voice is not limited, and for example, a sentence recognition technique using machine learning may be used as appropriate.
  • the information such as the service content determined by the determination unit 143 is output to the application 51 as a determination result.
  • information indicating that an operation input by voice is being recognized is output to the replacement control unit 130 as a UI event.
  • the replacement control unit 130 determines whether the replacement condition is met based on the UI event output from the UI determination unit 140.
  • a UI recognition speech recognition item is set as a replacement condition. Based on the UI event, it is determined whether or not the voice of the user 20d is being recognized, that is, whether or not the user 20d is performing an operation input by voice.
  • a human body is detected based on the 2D image or the like, and marking and ID assignment are performed on the human body. Then, the mark and ID of the human body and the replacement information 161 are transmitted to the replacement processing unit 120, and the replacement processing 121 (second generation processing) is executed.
  • the head is designated as the replacement target. Accordingly, mouth movements and facial expressions in the 3D model 60d are to be replaced.
  • the model generation information 164 stores a model of the head with the mouth closed.
  • the model of the head with the mouth closed can be generated based on, for example, a 2D image or the like obtained by photographing a state in which the user 20d closed the mouth beforehand.
  • a replacement process 121 is executed based on the replacement target information 163 and the model generation information 164, and the second virtual model 30d with the mouth closed is generated.
  • the voice of the user 20d may be cut.
  • a method of cutting the voice of the user 20d when the second virtual model 30d with the mouth closed is displayed may be used.
  • the replacement control unit 130 selects the execution of the second generation process when an operation input by voice is accepted. Then, as the second generation process, a second model that does not execute the speech utterance operation is generated. As a result, the speech operation can be switched to another operation. Therefore, for example, it is possible to enjoy the virtual experience without knowing the operation input by voice or the like to other users sharing the virtual space V.
  • the replacement process 121 is executed when the voice recognition unit 142 recognizes that an operation input by voice has been started. For this reason, there is a possibility that a certain delay occurs until the second virtual model 30d that does not execute the speech operation is generated.
  • the user 20d can notify the UI determination unit 140 that a voice operation input is started using the button 42 shown in FIG.
  • the replacement processing 121 can be started before the voice recognition unit 142 actually recognizes an operation input by voice.
  • a 3D model buffer or the like that can hold the 3D model 60d for a certain period of time between the 3D model generation unit 110 and the replacement processing unit 120, it is possible to avoid the influence of delay.
  • the first generation process is executed. That is, a first virtual model in which the user's speech operation is reproduced as it is is generated. This enables highly accurate communication.
  • a process of increasing the sampling rate for photographing the head of the user 20d may be executed. This makes it possible to reproduce the mouth of the user 20d who performs the speech operation with high reproducibility.
  • processing for increasing the sampling rate for photographing the head of the user 20d is executed. If the audio content is not related to the operation input, the first generation process is executed as it is. If the audio content relates to an operation input, the sampling rate is lowered (for example, returned to normal), and the second generation process is executed. This makes it possible to easily realize a natural virtual experience.
  • FIG. 11 and FIG. 15 show an example of the second generation process when an operation input by gesture and an operation input by voice are performed.
  • the operation input multimodal operation input in which both gesture and voice are used simultaneously may be performed.
  • the UI determination unit 140 recognizes both the gesture and voice of the user 20 and outputs a UI event corresponding to a multimodal operation input (see FIG. 14). This makes it possible to generate a second virtual model that does not execute, for example, gestures and speech operations.
  • FIG. 17 is a schematic diagram illustrating another example of the second generation process.
  • FIG. 18 is a schematic diagram illustrating an example of replacement information referred to in this example.
  • the replacement process 121 is performed on the 3D model 60e of the user 20e using an HMD (Head Mount Display) 45, and the second virtual model 30e from which the HMD 45 has been deleted is generated.
  • HMD Head Mount Display
  • the HMD 45 is a display device that is used by being worn on the head of the user 20e.
  • the HMD is connected to a computer system or the like in which the application 51 is installed, and for example, an image of the virtual space V generated by the application 51 is displayed.
  • the HMD 45 By using the HMD 45, for example, it is possible to enjoy an experience as if the user 20e is in the virtual space V.
  • the type of the HMD 45 is not limited, and for example, an immersive display that completely covers the user's eyes is used.
  • an HMD, a smart glass, or the like provided with a transmissive display may be used as appropriate.
  • the face model parameter of the user 20e is acquired based on information from a sensor that reads the facial expression of the user 20e attached inside the HMD 45.
  • a sensor for reading a facial expression or the like for example, a camera or the like capable of photographing the eyes and eyebrows of the user 20e is mounted inside the HMD 45.
  • the type of sensor that reads the facial expression or the like of the user 20e is not limited, and a sensor that detects the line of sight of the user 20e, a sensor that detects the movement of the eyebrows, or the like may be used as appropriate.
  • FIG. 19 is a block diagram illustrating a configuration example of the virtual space generation system 11 when the HMD 45 is used.
  • the virtual space generation system 11 includes an HMD 45, a plurality of cameras 40, a model generation device 101, and an application 51.
  • the model generation apparatus 101 includes a face model parameter generation unit 180 and a face model generation unit 181 in addition to the functional blocks shown in FIG. In FIG. 19, the microphone 41, the button 42, the UI determination unit 140, and the generated model buffer 170 illustrated in FIG. 2 are omitted.
  • the face model parameter generation unit 180 generates a face model parameter of the user 20e based on information from a sensor that reads the facial expression of the user 20e mounted on the HMD 45. For example, based on an image obtained by photographing the eye of the user 20e, the direction of the line of sight of the user 20e, the shape of the eye (contour), the movement of the eyebrows, and the like are generated as face model parameters.
  • the method for generating the face model parameters is not limited. For example, any facial expression recognition technology that can detect movements of eyes, nose, mouth, and the like may be used.
  • the face model generation unit 181 generates a face model of the user 20e based on the face model parameters. For example, a reference face model in which the contour of the face of the user 20e and each part such as eyes, nose, mouth, and ears are reproduced is generated and stored in advance. Then, the face model generation unit 181 generates a user face model based on the face model parameters and the reference face model.
  • the reference face model of the user 20e is generated based on, for example, a 2D image obtained by photographing the face of the user 20e without wearing the HMD 45.
  • a situation is also assumed in which the user 20e starts using the HMD 45 while using the model generation apparatus 101.
  • the reference face model may be generated based on the 3D model of the user 20e generated immediately before using the HMD 45. Thereby, a face model can be generated based on the state of the latest user 20e.
  • the face model generation unit 181 generates the face model of the user 20e by deforming the reference face model based on the face model parameters.
  • the reference face model is deformed in accordance with the degree of opening of the eyes and the movement of the eyebrows in the face model parameters.
  • a face model that reproduces the facial expression of the user 20e when the user 20e wears the HMD 45 is generated.
  • a method of deforming the reference face model is not limited, and for example, deformation of a 3D model using an arbitrary model that can express a human facial expression or the like is appropriately used.
  • a 3D model 60e of the user 20e using the HMD 45 is generated.
  • the replacement control unit 130 determines whether the status matches. As shown in FIG. 18, in the present embodiment, when status information notifying that the HMD 45 is being used is input to the replacement control unit 130, it is determined that the status matches. Then, it is determined whether or not the recognition feature amount of the HMD 45 matches in the 2D image. That is, it is determined whether or not the HMD 45 can be recognized.
  • the corresponding part is marked and given an ID.
  • a human body is detected, and marking and ID assignment are executed.
  • the mark and ID of the HMD 45, the mark and ID of the human body, and the replacement information 161 are transmitted to the replacement processing unit 120. Then, a replacement process 121 (second generation process) is executed.
  • the model generation information 164 stores a method for changing the head to be replaced.
  • the model generation information 164 for example, an instruction to generate a replacement head model using the face model of the user 20e generated by the face model generation unit 181 is stored.
  • the replacement processing unit 120 deletes the HMD 45 in the 3D model 60e based on the replacement target information 163 and the model generation information 164.
  • the head of the 3D model 60e is replaced with a model of the head generated based on the face model of the user 20e.
  • the second virtual model 30e in which the facial expression of the user 20e is reproduced is generated.
  • the second virtual model 30e from which the HMD 45 used by the user 20e is deleted is generated by the second generation process.
  • the facial expression of the user 20e is reproduced and it becomes possible to implement
  • any device or the like worn by the user 20e may be detected, and a replacement process may be performed as appropriate. For example, even when a device that reproduces a sense such as headphones or a tactile sensation is attached, it is possible to generate a second virtual model from which these devices are deleted.
  • FIG. 20 is a schematic diagram illustrating another example of the second generation process.
  • FIG. 21 is a schematic diagram illustrating an example of replacement information referred to in the present example.
  • the replacement process 121 is performed on the 3D model 60 f of the user 20 f in a state where privacy protection is necessary, and a second virtual model 30 f that has been modified to protect privacy is generated. .
  • the state requiring privacy protection is a state in which the user 20f is changing clothes or is naked, for example. Such a state is detected, for example, by performing image processing that detects the amount of skin exposure in a 2D image of the user 20f.
  • image processing that detects the amount of skin exposure in a 2D image of the user 20f.
  • the case where the user 20f inputs a personal identification number or the like in the virtual space V or the case where information related to the personal information of the user is photographed corresponds to a state where privacy protection is necessary.
  • the model generation device 100 (see FIG. 2) is provided with a privacy detection unit (not shown).
  • the privacy detection unit determines whether privacy protection is necessary based on the 2D image or the 3D model 60f.
  • a 2D image or the like in which a state requiring privacy protection is captured is detected as a privacy image. For example, when the skin exposure amount of the user 20f in the 2D image exceeds a predetermined threshold, it is determined that privacy protection is necessary. Then, a 2D image or the like taken by the user 20f in that state is detected as a privacy image.
  • the detection status of the privacy image is output to the replacement control unit 130 from the privacy detection unit. That is, information relating to the start and end of detection of privacy images, the end of detection, and the like are output. Alternatively, a detected privacy image, information about a part that needs privacy protection, and the like may be output.
  • the replacement control unit 130 determines whether or not the replacement condition is met based on the detection status of the privacy image output from the privacy detection unit.
  • the replacement condition information 162 illustrated in FIG. 21 an item regarding the detection status of the privacy image is set as a replacement condition regarding whether or not the user 20f is in a state where privacy protection is necessary. If a privacy image has been detected, the replacement condition is satisfied assuming that privacy protection is required.
  • the replacement control unit 130 detects a human body based on the 2D image or the like, and performs marking and ID assignment on the human body. Then, the mark and ID of the human body and the replacement information 161 are transmitted to the replacement processing unit 120, and the replacement processing 121 (second generation processing) is executed.
  • the replacement target information 163 of this example a part other than the head is specified as the replacement target. That is, both hands, both feet, and the torso are to be replaced.
  • the model generation information 164 stores a method for changing both hands, both feet, and the torso to be replaced.
  • As the model generation information for example, an instruction to blur and display a part to be replaced is stored.
  • a second virtual model 30f in which a part other than the head of the 3D model 60f is blurred is generated.
  • the method for changing the replacement target is not limited.
  • a mosaic is placed in a part to be replaced, replaced with a normal model based on a past image or 3D model, replaced with a model prepared in advance, a predetermined object is displayed (added) and hidden, Alternatively, various methods such as simple deletion may be used.
  • the replacement control unit 130 selects execution of the second generation process. Then, as the second generation process, a second virtual model 30f in which at least a part of the user 20f is changed is generated. Accordingly, the second virtual model 30f in which the privacy of the user 20f is protected can be generated, and the virtual experience can be enjoyed with peace of mind.
  • a privacy detection unit may finely determine and designate a part that is subject to privacy protection, such as an upper body, a lower body, a chest, or a waist, based on a 2D image or the like.
  • replacement target information 163 and model generation information 164 information indicating that the part specified by the privacy detection unit is to be blurred is stored. Note that when a nude photograph or the like is placed on a T-shirt worn by the user 20f, a calendar shown in a 2D image, or the like, a mosaic or the like can be applied thereto.
  • the necessity of privacy protection may be determined according to the situation of the virtual space V or the like. For example, in a situation where a virtual model 30f stands in front of a bank ATM or door in the virtual space V and a password is entered, the virtual space V in which the numeric keypad is blurred is provided to other users. May be provided.
  • FIG. 22 is a schematic diagram showing another example of replacement information.
  • FIG. 22A is a schematic diagram showing replacement information 161 in which an operation input by a gesture is included in a replacement condition.
  • FIG. 22B is a schematic diagram showing replacement information 161 in which an operation input by voice is included in the replacement condition.
  • the above second generation process is executed such as applying a mosaic or the like when the mode is changed to the privacy mode for privacy protection based on an operation input by the user 20f gesture, voice, button, or the like. Good.
  • the replacement condition is satisfied when the privacy image candidate of the user 20f is being detected and the change to the privacy mode by the gesture is recognized.
  • the privacy image candidate is an image that does not satisfy the condition that the privacy image satisfies, for example.
  • the replacement condition is satisfied when a privacy image candidate is being detected and a change to the privacy mode by voice is recognized.
  • the user 20f can explicitly switch to the privacy mode (second generation process) by performing an operation input using a gesture or the like. Therefore, for example, even in a situation where the privacy detection unit cannot determine that privacy protection is required, it is possible to sufficiently protect the privacy of the user 20f.
  • the detection of privacy image candidates and the instruction of the privacy mode by the user 20f are conditions for determining that the state is necessary for privacy protection.
  • the second generation process such as blurring and displaying other than the head of the user 20f may be executed regardless of the amount of skin exposure. Accordingly, it is possible to realize privacy protection that sufficiently reflects the intention of the user 20f.
  • the privacy mode can be surely protected by enabling the transition to the privacy mode based on the instruction of the user 20f.
  • FIG. 23 is a schematic diagram showing another example of the second generation process.
  • FIG. 24 is a schematic diagram illustrating an example of replacement information referred to in the present example.
  • the replacement process 121 is executed on the 3D model 60g of the user 20g who uses the walking controller 43, and the second virtual model 30g in which the walking controller 43 is replaced with another object is generated.
  • the user 20 g uses the walking controller 43 to instruct a walking operation or the like in the virtual space V.
  • the walking controller 43 is deleted and the second virtual model 30 a that performs the walking motion is generated based on the walking motion instruction.
  • the walking controller 43 is replaced with another object, and a moving state different from the walking motion is expressed.
  • the replacement condition information 162 Based on the replacement condition information 162, it is determined whether the status matches. If the status indicating that the walking operation is being performed is in accordance with an instruction from the walking controller 43, it is determined whether or not the walking controller 43 is recognizable. In the replacement information 161 illustrated in FIG. 24, it is determined whether or not the recognition feature amount of the walking controller 43 matches based on the 2D image.
  • the corresponding part on the 3D model 60g is marked and given an ID.
  • the mark and ID of the walking controller 43 and the replacement information 161 are transmitted to the replacement processing unit 120.
  • a replacement process 121 (second generation process) is executed.
  • the replacement target information 163 does not include information on the human body. Therefore, for example, a portion corresponding to a human body on the 3D model 60g is not detected. Of course, whether or not a human body is recognized may be included in the replacement condition.
  • the walking controller 43 is designated as the replacement target.
  • a cloud-like object 31 is recorded in the model generation information 164.
  • a second virtual model 30g in which the walking controller 43 on the 3D model 60g is replaced with the cloud-like object 31 is generated. In this case, for example, replacement is performed such that the cloud-like object 31 is arranged so as to cover the foot of the 3D model 60g.
  • the operation and state expressed by replacing at least a part of the 3D model 60g with another object are not limited.
  • the one-handed controller used by the user 20g may be replaced with a handgun model, a fishing rod, or the like. Further, the controller with both hands may be replaced with a handle of an automobile or the like.
  • a replacement process 121 or the like corresponding to the operation may be executed.
  • a replacement process 121 or the like corresponding to the operation may be executed.
  • the user 20g performs an operation of making a handgun shape with a fingertip, it is possible to replace that portion with a handgun model.
  • Various other actions such as replacing the user's 20g belongings with a bowl and chopsticks when a soba-eating operation is performed, or replacing both hands with wings when the user 20g moves both hands and flutters.
  • Variations of the replacement process 121 may be realized. Thereby, the user 20g can fully enjoy various virtual experiences.
  • FIG. 25 is a diagram for explaining another example of the second generation process, and is a schematic diagram illustrating an example of movement in the virtual space V.
  • FIG. 25 a space sharing spot S that captures a user with a plurality of cameras 40 and generates a virtual model 30 of the user is schematically illustrated.
  • the space sharing spot S By using the space sharing spot S, the user can experience the virtual space V.
  • the virtual model 30 of the user is generated and displayed on the virtual space V set as a default in the space sharing spot S.
  • space sharing spots S1 to S3 are shown.
  • virtual spaces V1 to V3 reproducing Harajuku Takeshita Street, Shibuya Center Street, and Ginza Chuo Street are set by default. Therefore, when the user starts a virtual experience using the space sharing spot S1, the user experiences the virtual space V1 that reproduces Harajuku Takeshita Street.
  • Such a plurality of virtual spaces V1 to V3 can be arranged on a static 3D space generated based on an actual map or the like. It is also possible to move to the virtual space V set as a default for other shared spots S by using one space shared spot S. For example, it is assumed that the user is experiencing the virtual space V1 of Harajuku Takeshita Street using the space sharing spot S1. The user can move to the virtual space V2 in which the Shibuya center town is reproduced by walking on the virtual space V1 along the same path from Harajuku Takeshita Street to Shibuya Center Street in the real space. .
  • the virtual space V when performing such long-distance movement in the virtual space V, for example, it is possible to move instantaneously (virtual space movement) by designating a destination. For example, when a user who is experiencing the virtual space V1 of Harajuku Takeshita Street using the space sharing spot S1 designates the Shibuya Center Town and inputs an instantaneous movement instruction, the virtual space V2 of the Shibuya Center Town is instantaneously entered. Switched.
  • FIG. 26A is a schematic diagram illustrating an example of a second generation process when a walking motion is instructed.
  • FIG. 26B is a schematic diagram illustrating an example of a second generation process when virtual space movement is instructed.
  • 27A and 27B are schematic diagrams illustrating examples of replacement information referred to in FIGS. 26A and 26B, respectively.
  • the user 20h logs in to the virtual space V2 from the space sharing spot S2, and the virtual model 30h of the user 20h is displayed on the virtual space V2 in which Shibuya Center Town is reproduced.
  • the user 20h can output a walking instruction or the like using the walking controller 43.
  • the replacement control unit 130 determines whether the status matches based on the replacement condition information 162 shown in FIG. 27A. If the status indicating that the walking operation is being performed is in accordance with an instruction from the walking controller 43, it is determined whether or not the walking controller 43 is recognizable. When the walking controller 43 is recognized, a portion corresponding to the walking controller 43 on the 3D model 60h and a portion corresponding to the human body are detected, and marking and ID assignment are performed on each of them.
  • the mark and ID of the walking controller 43, the mark and ID of the human body, and the replacement information 161 are transmitted to the replacement processing unit 120. Then, a replacement process 121 (second generation process) is executed, and a second virtual model 30h that performs a walking motion is generated. As a result, the user 20h can walk and move in the virtual space V2 via the second virtual model 30h.
  • the user 20i performs instantaneous virtual space movement from the virtual space V2 reproducing Shibuya Center Street to the virtual space V3 reproducing Ginza Chuo-dori.
  • the user 20i executes an operation input by uttering a phrase to move to Ginza Chuo-dori (virtual section V3).
  • the user 20 i performs a predetermined operation such as a jump on the walking controller 43.
  • the content of the operation input by voice is determined by the UI determination unit 140, and the UI determination result and UI event are transmitted to the application 51 and the replacement control unit 130, respectively.
  • the walking controller 43 outputs a jump operation instruction to the application 51.
  • the application 51 determines the status of the user 20i and the like based on the UI determination result and information from the walking controller 43. In this example, it is determined that the user 20i has requested virtual space movement. The application 51 generates status information indicating that the virtual space is being moved, and transmits the status information to the replacement control unit 130.
  • the replacement control unit 130 determines whether the status and UI determination items match based on the replacement condition information 162 shown in FIG. 27B. If the status that the user 20i requests virtual space movement and the instruction of the jump motion is output matches and the voice recognition result matches the predetermined content, whether or not the walking controller 43 can be recognized. Determined.
  • the walking controller 43 When the walking controller 43 is recognized, the corresponding part is marked and given an ID. A human body is detected, and marking and ID assignment are executed. The mark and ID of the walking controller 43, the mark and ID of the human body, and the replacement information 161 are transmitted to the replacement processing unit 120. Then, a replacement process 121 (second generation process) is executed.
  • the replacement target information 163 specifies the walking controller 43 and both hands, legs, and torso of the human body as replacement targets.
  • the model generation information 164 stores a model that performs a flight operation as an operation that expresses virtual space movement.
  • the replacement processing unit 120 deletes the walking controller 43 of the 3D model 60i, and generates a second virtual model 30i that performs a flight motion.
  • model generation information 164 a model expressing a deformed pose or effect used for an animation or the like may be set. This makes it possible to easily express operations that are difficult to realize in the real space S.
  • the replacement control unit 130 determines the determination condition regarding the output from the walking controller 43 and the operation input by voice, and the execution of the second generation process is selected. Then, by the second generation process, the second virtual model 30i in which the user's posture and action are changed is generated. As a result, it becomes possible to sufficiently express the motion unique to the virtual space V such as instantaneous movement between the virtual spaces V, and it is possible to provide a virtual experience that reduces the operational burden on the user 20i. .
  • the first and second generation processes different from each other can be executed as the generation process for generating the user model based on the user image.
  • a natural virtual experience can be provided to the user.
  • the replacement control unit 130 controls the switching of execution of the first and second generation processes.
  • a first virtual model in which the state of the user included in the user image is reproduced is generated.
  • a second virtual model in which at least a part of the user state included in the user image is changed is generated.
  • a model (first virtual model) that reproduces the user's state actually photographed as it is and a model (second virtual model) that is reproduced by appropriately changing the user's state are displayed by switching. It becomes possible. Therefore, it is possible to replace and display a part of an image that the user does not want to temporarily show to other users, such as a gesture associated with a temporary UI operation or a movement operation.
  • the switching control of the execution of the first and second generation processes is executed based on a plurality of replacement conditions corresponding to various situations.
  • the replacement process can be dynamically performed according to the situation at that time.
  • a method for changing at least a part of the user's state is stored in association with the replacement condition. Therefore, an appropriate change or the like corresponding to each situation is executed, and the user's operation or the like can be expressed more naturally.
  • the first generation process when the replacement condition is satisfied, the first generation process is switched to the second generation process, and the second virtual model in which the user state is changed is generated and displayed.
  • the second virtual model is displayed by default, and when a predetermined restoration condition is satisfied, the first generation process is switched to the first generation process and the user's state is reproduced as it is. It may be generated and displayed.
  • a model in which the left hand of the user is replaced is generated as the default second virtual model. That is, regardless of the actual left hand movement of the user, the left hand that moves naturally according to the overall movement and posture of the user is represented in the virtual space. For example, natural arm pretension according to walking / running motion, natural left hand posture according to upright / sitting posture, and the like. As a result, the user can use the left hand to perform local operations including gestures and the like without being known to other users.
  • restoration conditions For example, when a situation or the like that requires an operation using both hands occurs, the restoration condition is satisfied, and the first generation process is switched. Thus, the first virtual model in which the left and right hand movements are reproduced as they are is displayed.
  • presence / absence of a user instruction via button operation, voice, gesture, or the like may be set as a restoration condition. For example, the presence or absence of a predetermined gesture using the left hand, which is the default replacement target, can be considered. Thereby, it is possible to switch to the first virtual model reflecting the movements of both hands at the timing desired by the user.
  • the default replacement process (second generation process) when a predetermined time elapses. This makes it possible to switch to the dummy left hand again without being noticed by other users. In this way, by setting the second generation process as the default, the user can perform a local operation or the like without worrying about how the user sees it.
  • the replacement process may be executed with priority given to conditions under which a wider range of replacement is performed. For example, the latter may be given priority between the condition for replacing both feet and the condition for replacing both feet and hands. As a result, it is possible to prevent a plurality of replacements from being performed at the same time and display an unnatural virtual model.
  • the first generation process for generating the first virtual model in which the state of the user or the like is reproduced as it is and the second virtual model in which at least a part of the state of the user or the like is changed are generated.
  • the second generation process was appropriately switched.
  • the present invention is not limited to this, and any process may be executed as long as the first and second generation processes are different from each other.
  • the first replacement process is executed on the 3D model of the user or the like to generate the first virtual model.
  • a second replacement model different from the first replacement process is executed on the 3D model of the user or the like to generate a second virtual model. That is, different replacement processes may be executed as the first and second generation processes.
  • the first generation process (first replacement process) is an object change process
  • the second generation process (second replacement process) may be a human body change process, but is of course limited to this. Not a translation.
  • three or more different generation processes may be executed in a switchable manner.
  • the first to third generation processes, the first to fourth generation processes, and the like may be executed in a switchable manner according to conditions or the like.
  • the generation unit is realized by the cooperation of the 3D model generation unit 110, the replacement processing unit 120, and the replacement control unit 130.
  • the replacement control unit 130 also functions as a generation control unit.
  • a block in which the functions of the 3D model generation unit 110, the replacement processing unit 120, and the replacement control unit 130 are integrated may be configured.
  • the functions of these blocks may be arbitrarily divided and assigned to a plurality of blocks.
  • the generation unit may be realized by a block in which the replacement processing unit 120 and the replacement control unit 130 are integrated and the 3D model generation unit 110.
  • Other arbitrary configurations are possible.
  • processing for generating a model displayed on a virtual space expressing virtual reality VR has been performed.
  • VR Virtual Reality
  • the present technology can be applied even when a model is displayed in a space in which augmented reality AR (Augmented Reality) or mixed reality MR (Mixed Reality) is expressed.
  • the information processing method according to the present technology is executed by a computer such as a PC operated by a user has been described.
  • the information processing method and the program according to the present technology may be executed by another computer that can communicate with the computer operated by the user via a network or the like.
  • a simulation system according to the present technology may be constructed in conjunction with a computer operated by a user and another computer.
  • the information processing method and the program according to the present technology can be executed not only in a computer system configured by a single computer but also in a computer system in which a plurality of computers operate in conjunction with each other.
  • the system means a set of a plurality of components (devices, modules (parts), etc.), and it does not matter whether all the components are in the same housing. Accordingly, a plurality of devices housed in separate housings and connected via a network and a single device housing a plurality of modules in one housing are all systems.
  • the first generation process, the second generation process, and the control for switching the execution of each generation process are executed by a single computer.
  • the execution of each process by a predetermined computer includes causing another computer to execute a part or all of the process and acquiring the result.
  • the information processing method and program according to the present technology can be applied to a configuration of cloud computing in which one function is shared by a plurality of devices via a network and is processed jointly.
  • this technique can also take the following structures.
  • Each of the first generation process and the second generation process different from the first generation process can be executed as the generation process for generating the model of the object based on the acquired image of the object.
  • a generator An information processing apparatus comprising: a generation control unit that controls switching between execution of the first generation process and execution of the second generation process by the generation unit.
  • the information processing apparatus includes the object and a person and an object used by the person.
  • the information processing apparatus generates the second model in which at least one state of the facial expression, posture, and motion of the person is changed.
  • the information processing apparatus according to (5) or (6), The second generation processing generates the second model in which an object used by the person is replaced or deleted.
  • the information processing apparatus according to any one of (2) to (7), When the execution of each of the first generation process and the second generation process is switched, the generation unit represents the first and second transition states for switching to each of the first and second models. An information processing apparatus that generates each of the second models.
  • the generation control unit executes the first generation process by the generation unit and the second generation based on determination information including a determination condition as to whether or not to change at least a part of the state of the object. An information processing apparatus that controls switching of execution of processing.
  • the information processing apparatus includes a condition regarding at least one of an output from a controller used by the person, an image of the person, and a voice of the person.
  • the generation control unit selects execution of the second generation process when an instruction for a predetermined operation is input,
  • generation part produces
  • the information processing apparatus according to (11), The said production
  • the information processing apparatus according to any one of (9) to (12), The information processing apparatus according to claim 1, wherein the determination condition includes a condition relating to at least one of an operation input by the person's gesture and an operation input by voice.
  • the generation control unit selects execution of the second generation process, The said production
  • Information processing apparatus The information processing apparatus according to any one of (9) to (14), The determination condition includes a condition relating to whether or not the person is in a state that requires privacy protection.
  • the information processing apparatus When it is determined that the person is in a state that requires privacy protection, the generation control unit selects execution of the second generation process, The said production
  • the information processing apparatus according to any one of (9) to (16), The determination information includes a method of changing at least a part of the state of the object associated with the determination condition, The information processing apparatus, wherein the generation unit executes the second generation process based on the determination information.
  • the information processing apparatus includes specification information for specifying a part to be changed of the object and a method for changing the specified part to be changed.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Software Systems (AREA)
  • Human Computer Interaction (AREA)
  • Processing Or Creating Images (AREA)
  • Image Generation (AREA)

Abstract

本技術の一形態に係る情報処理装置は、取得部と、生成部と、生成制御部とを具備する。前記取得部は、対象物の画像を取得する。前記生成部は、前記取得された前記対象物の画像に基づいて前記対象物のモデルを生成する生成処理として、第1の生成処理、及び前記第1の生成処理と異なる第2の生成処理の各々を実行可能である。前記生成制御部は、前記生成部による前記第1の生成処理の実行及び前記第2の生成処理の実行の切替えを制御する。

Description

情報処理装置、情報処理方法、及びプログラム
 本技術は、仮想空間等に表示されるモデルを生成可能な情報処理装置、情報処理方法、及びプログラムに関する。
 近年、コンピュータシステム等により構築された仮想空間を介して、ユーザに様々な仮想体験を提供する技術が知られている。例えばユーザが選択したキャラクタ等が、仮想空間内に表示される。ユーザはキャラクタ等を操作することで、仮想空間内を移動したり、他のユーザとコミュニケーションを行ったりすることが可能である。
 例えば特許文献1には、コントローラを使った仮想空間内のキャラクタの操作表現について記載されている。特許文献1では、ユーザが手にしたコントローラの位置の変化やボタン操作といったコントローラのアクティビティが検出される。検出されたコントローラのアクティビティをもとに、仮想空間でのキャラクタの姿勢、動作、及び表情が表現される。これにより、例えばジェスチャー等を交えて円滑にコミュニケーションを行うことが可能となっている。(特許文献1の明細書段落[0001][0008][0033]等)
特開2014-149836号公報
 このようにユーザの操作等に応じて仮想空間内のキャラクタ等の表現を制御して、自然な仮想体験を提供することが可能な技術が求められている。
 以上のような事情に鑑み、本技術の目的は、ユーザに自然な仮想体験を提供可能な情報処理装置、情報処理方法、及びプログラムを提供することにある。
 上記目的を達成するため、本技術の一形態に係る情報処理装置は、取得部と、生成部と、生成制御部とを具備する。
 前記取得部は、対象物の画像を取得する。
 前記生成部は、前記取得された前記対象物の画像に基づいて前記対象物のモデルを生成する生成処理として、第1の生成処理、及び前記第1の生成処理と異なる第2の生成処理の各々を実行可能である。
 前記生成制御部は、前記生成部による前記第1の生成処理の実行及び前記第2の生成処理の実行の切替えを制御する。
 この情報処理装置では、対象物の画像に基づいて対象物のモデルを生成する生成処理として、互いに異なる第1及び第2の生成処理が実行可能である。これら第1及び第2の生成処理の各々の実行を適宜切替えることで、ユーザに自然な仮想体験を提供することが可能となる。
 前記第1の生成処理は、第1の再現性にて前記対象物が再現された第1のモデルを生成してもよい。この場合、前記第2の生成処理は、前記第1の再現性よりも低い第2の再現性にて前記対象物が再現された第2のモデルを生成してもよい。
 これにより高い再現性を有する第1のモデルと低い再現性を有する第2のモデルとを使い分けることが可能である。これによりユーザにより自然な仮想体験を提供することが可能となる。
 前記第1の生成処理は、前記対象物の画像に含まれる前記対象物の状態が再現された前記第1のモデルを生成してもよい。この場合、前記第2の生成処理は、前記対象物の画像に含まれる前記対象物の状態の少なくとも一部が変更された前記第2のモデルを生成してもよい。
 これにより例えば対象物の状態をそのまま再現した第1のモデルと、対象物の状態の一部を変更して所望の状態を表現した第2のモデルとがそれぞれ生成可能となる。
 前記第2の生成処理は、前記対象物の少なくとも一部が置換、又は削除された前記第2のモデルを生成してもよい。
 これにより対象物の状態を容易に変更することが可能となる。この結果、処理時間等を短縮することが可能となり、高いパフォーマンスを発揮することが可能となる。
 前記対象物は、人物、及びその人物が使用する物を含んでもよい。
 これにより例えばユーザの状態を模したモデルを生成することが可能となり、ユーザにより自然な仮想体験を提供することが可能となる。
 前記第2の生成処理は、前記人物の表情、姿勢、及び動作の少なくとも1つの状態が変更された前記第2のモデルを生成してもよい。
 これによりユーザの様々な状態を表現することが可能となる。
 前記第2の生成処理は、前記人物が使用する物が置換、又は削除された前記第2のモデルを生成してもよい。
 これにより例えばユーザの使用するコントローラ等が削除されたモデルを生成することが可能となり、より自然な仮想体験を提供することが可能となる。
 前記生成部は、前記第1及び前記第2の生成処理の各々の実行が切替えられる際に、前記第1及び前記第2のモデルの各々へ切替えるための遷移状態が表現された前記第1及び前記第2のモデルをそれぞれ生成してもよい。
 これにより第1及び第2のモデルの各々への切替えがスムーズに表現される。
 前記生成制御部は、前記対象物の状態の少なくとも一部を変更するか否かの判定条件を含む判定情報に基づいて、前記生成部による前記第1の生成処理の実行及び前記第2の生成処理の実行の切替えを制御してもよい。
 これにより第1及び第2の生成処理を高精度に切替えることが可能となる。
 前記判定条件は、前記人物が使用するコントローラからの出力、前記人物の画像、及び前記人物の音声の少なくとも1つに関する条件を含んでもよい。
 これにより様々な状況に応じた判定を行うことが可能となり、第1及び第2の生成処理を適正に切替えることが可能となる。
 前記生成制御部は、所定の動作の指示が入力された場合には、前記第2の生成処理の実行を選択してもよい。この場合、前記生成部は、前記第2の生成処理として、前記所定の動作を実行する前記第2のモデルを生成してもよい。
 これにより、第2のモデルを使ってユーザが指示した動作を高精度に表現することが可能となる。
 前記生成部は、前記第2の生成処理として、前記所定の動作へ遷移する動作を実行する前記第2のモデルを生成してもよい。
 これにより所定の動作へとスムーズに移行する様子を表現可能となる。
 前記判定条件は、前記人物のジェスチャーによる操作入力、及び音声による操作入力の少なくとも一方に関する条件を含んでもよい。
 これにより操作入力のためのジェスチャーや発話等が行われているか否かを判定することが可能となり、ジェスチャー等を他の表現に切替えることが可能となる。
 前記生成制御部は、前記ジェスチャーによる操作入力、及び前記音声による操作入力が受付けられた場合には、前記第2の生成処理の実行を選択してもよい。この場合、前記生成部は、前記第2の生成処理として、前記ジェスチャー及び前記音声の発話動作を実行しない前記第2のモデルを生成してもよい。
 これにより操作入力のためのジェスチャーや発話等の動作が再現されない第2のモデルを生成可能である。これにより操作入力の動作等をカットすることが可能となる。
 前記判定条件は、前記人物がプライバシーの保護が必要な状態にあるか否かに関する条件を含んでもよい。
 これによりユーザのプライバシーの保護が必要な場合を判定することが可能となり、プライバシーが保護された表現に切替えることが可能となる。
 前記生成制御部は、前記人物がプライバシーの保護が必要な状態にあると判定された場合には、前記第2の生成処理の実行を選択してもよい。この場合、前記生成部は、前記第2の生成処理として、前記人物の少なくとも一部が変更された前記第2のモデルを生成してもよい。
 これによりユーザのプライバシーが保護された第2のモデルを生成可能となり、安心して仮想体験を楽しむことができる。
 前記判定情報は、前記判定条件に関連付けられた前記対象物の状態の少なくとも一部を変更する方法を含んでもよい。この場合、前記生成部は、前記判定情報に基づいて前記第2の生成処理を実行してもよい。
 これにより様々な状況に応じた第2のモデルを高精度に生成することが可能となり、ユーザが所望する状態を高精度に実現することが可能となる。
 前記判定情報は、前記対象物の変更対象となる部位を特定するための特定情報と、前記特定された前記変更対象となる部位を変更する方法とを含んでもよい。
 これにより高精度に第2のモデルを生成することが可能となり、ユーザが所望する状態を高精度に実現することが可能となる。
 本技術の一形態に係る情報処理方法は、コンピュータシステムにより実行される情報処理方法であって、対象物の画像を取得することを含む。
 前記取得された前記対象物の画像に基づいて前記対象物のモデルを生成する生成処理として、第1の生成処理、及び前記第1の生成処理と異なる第2の生成処理の各々が実行される。
 前記第1の生成処理の実行及び前記第2の生成処理の実行の切替えが制御される。
 本技術の一形態に係るプログラムは、コンピュータシステムに以下のステップを実行させる。
 対象物の画像を取得するステップ。
 前記取得された前記対象物の画像に基づいて前記対象物のモデルを生成する生成処理として、第1の生成処理、及び前記第1の生成処理と異なる第2の生成処理の各々を実行するステップ。
 前記第1の生成処理の実行及び前記第2の生成処理の実行の切替えを制御するステップ。
 以上のように、本技術によれば、ユーザにより自然な仮想体験を提供可能となる。なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。
本技術の一実施形態に係る仮想空間生成システムの概要を説明するための模式図である。 仮想空間生成システムの構成例を示すブロック図である。 仮想モデルの生成の概要を示すフローチャートである。 第2の生成処理の一例を示す模式図である。 置換制御部の処理例を示すフローチャートである。 図4に示す例において参照される置換情報の一例を示す模式図であり。 置換処理部の動作の一例を説明するための模式図である。 置換処理の一例を示すフローチャートである。 第2の生成処理の他の例を示す模式図である。 図9に示す例において参照される置換情報の一例を示す模式図である。 第2の生成処理の他の例を示す模式図である。 図11に示す例において参照される置換情報の一例を示す模式図である。 UI判定部の具体的な構成例を示すブロック図である。 置換制御部に出力されるUIイベントの一例を示す表である。 第2の生成処理の他の例を示す模式図である。 図15に示す例において参照される置換情報の一例を示す模式図である。 第2の生成処理の他の例を示す模式図である。 図17に示す例において参照される置換情報の一例を示す模式図である。 HMDが使用される場合の仮想空間生成システムの構成例を示すブロック図である。 第2の生成処理の他の例を示す模式図である。 図20に示す例において参照される置換情報の一例を示す模式図である。 図20に示す例において参照される置換情報の他の例を示す模式図である。 第2の生成処理の他の例を示す模式図である。 図23に示す例において参照される置換情報の一例を示す模式図である。 仮想空間での移動についての一例を示す模式図である。 第2の生成処理の他の例を示す模式図である。 図26に示す例において参照される置換情報の一例を示す模式図である。
 以下、本技術に係る実施形態を、図面を参照しながら説明する。
 [仮想空間生成システム]
 図1は、本技術の一実施形態に係る仮想空間生成システムの概要を説明するための模式図である。仮想空間生成システム10は、複数のカメラ40と、モデル生成装置100と、仮想空間生成装置50とを有する。
 複数のカメラ40により実空間Rのユーザ(人物)20が撮影され、モデル生成装置100によりユーザ20の仮想モデル30が生成される。生成された仮想モデル30は、仮想空間生成装置50に出力され、仮想モデル30を含む仮想空間Vが生成される。生成された仮想空間Vは、例えばユーザ20が所有する図示しない表示デバイス等に送信されて表示される。これによりユーザ20は仮想空間Vの自由視点映像を見ることが可能となる。
 本実施形態では、モデル生成装置100により、仮想モデル30としてユーザ20の状態が詳細に再現された三次元(3D)のCG(Computer Graphics)等を生成することが可能である。また例えばユーザ20を常時撮影することで、ユーザ20の状態をリアルタイムで再現する仮想モデル30を生成可能である。なお仮想モデル30の対象は人物に限定されず、ペットやロボットといった任意の対象物について仮想モデル30を生成することも可能である。
 仮想空間生成装置50には、仮想空間Vを構築するアプリケーション(コンピュータプログラム)51がインストールされており、当該アプリケーション51に仮想モデル30が出力される(図2参照)。これにより仮想空間V上に仮想モデル30が表示される。
 複数のカメラ40、モデル生成装置100、及び仮想空間生成装置50の接続形態は限定されない。例えばLAN(Local Area Network)やWAN(Wide Area Network)等のネットワークを介して各装置が接続されてもよいし、ケーブル等を用いて直接的に接続されてもよい。例えば複数のカメラ40はユーザ20の近傍に配置され、モデル生成装置100及び仮想空間生成装置50は、ネットワーク上に配置される。あるいは、仮想空間生成装置50のみがネットワーク上に配置される。その他、任意の接続形態、及び装置の配置構成が採用されてよい。
 モデル生成装置100及び仮想空間生成装置50は、例えばPC(Personal Computer)等の任意のコンピュータにより実現可能である。本実施形態において、モデル生成装置100は、本技術に係る情報処理装置の一実施形態に相当する。
 図2は、仮想空間生成システム10の構成例を示すブロック図である。図2に示す例では、仮想空間生成装置50にインストールされたアプリケーション51が模式的に図示されている。また図2では、複数のカメラ40として、N台のカメラ40が図示されている。
 N台のカメラ40は、対象物(ユーザ20)を撮影して対象物の画像(ユーザ20の画像)を生成する。N台のカメラ40は、所定の撮影エリアを基準として、互いに異なる位置にそれぞれ配置される。撮影エリアにユーザ20が移動し、N台のカメラ40により撮影される。これによりユーザ20を様々な方向から撮影した、N個のユーザ20の画像が生成される。
 カメラ40としては、例えばRGB-Dカメラ等が用いられる。RGB-Dカメラは、カラー画像を撮影するRGBカメラと、撮影された画像の画素ごとに距離を測定できる距離センサとを備えたカメラである。RGBカメラとしては、例えばCMOS(Complementary Metal-Oxide Semiconductor)センサやCCD(Charge Coupled Device)センサ等のイメージセンサを備えるデジタルカメラが用いられる。また距離センサとしては、例えば赤外線LED(Light Emitting Diode)と撮像素子により、照射した光が対象物まで往復する時間に基づいて距離を測定するTOF(Time Of Flight)方式のセンサ等が用いられる。
 RGB-Dカメラを使ってユーザ20等を撮影することで、ユーザ20の画像として、例えば各画素のおける色情報と距離情報を含むRGB-D画像が生成される。RGB-D画像は、対象物を撮影する方向からの距離情報(奥行情報)を含むことから2.5D画像、あるいは3D画像と呼ばれる画像である。従って本実施形態では、N台のRGB-Dカメラにより、ユーザ20を撮影したN個のRGB-D画像が生成される。これにより例えばユーザ20の外形等についての3次元座標を生成することが可能となる。なおカメラ40の具体的な構成等は限定されず、例えば距離センサ等を持たないRGBカメラが用いられてもよい。この場合でも、複数のRGBカメラを使ったステレオ撮影等によりユーザ20等の3次元座標を生成可能である。
 モデル生成装置100は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)、HDD(Hard Disk Drive)等のコンピュータの構成に必要なハードウェアを有する。
 CPUが、ROMやHDDに格納された本技術に係るプログラムをRAMにロードして実行することにより、図2に示す各機能ブロックが実現される。そしてこれらの機能ブロックにより、本技術に係る情報処理方法が実行される。なお各機能ブロックを実現するために、FPGA(Field Programmable Gate Array)や画像処理IC(Integrated Circuit)等の専用のハードウェアが適宜用いられてもよい。
 プログラムは、例えば種々の記録媒体を介してモデル生成装置100にインストールされる。又はインターネット等を介してプログラムのインストールが実行されてもよい。
 図2に示すように、モデル生成装置100は、機能ブロックとして、3Dモデル生成部110、置換処理部120、置換制御部130、UI判定部140、及びストリーム生成部150を有する。またモデル生成装置100のROM等により構成される記憶部には置換情報DB(Data Base)160が格納されており、同じく記憶部により生成済モデルバッファ170が構成される。さらにモデル生成装置100は、図示を省略した画像取得部を有する。
 画像取得部は、インターフェース等を介してユーザ20のRGB-D画像を取得する。使用されるインターフェースの種類は限定されず、例えばHDMI(登録商標)(High-Definition Multimedia Interface)端子等やWiFiモジュール等が備えられたインターフェースが用いられる。画像取得部により取得されたRGB-D画像は、3Dモデル生成部110に出力される。本実施形態では、画像取得部は、対象物の画像を取得する取得部に相当する。
 3Dモデル生成部110は、N個のRGB-D画像に基づいてユーザ20やユーザ20が使用する物等を含む対象物の3Dモデルを生成する。すなわちN個のRGB-D画像の各々に含まれる対象物の状態(ユーザ20の表情、姿勢、及び動作等に関する状態、及びユーザが使用する物の状態)がそのまま再現された3Dモデルが生成される。以下、説明を簡潔にするために、ユーザ20及びユーザ20が使用する物を含めて、単にユーザ20と記載する場合がある。
 本実施形態では、RGB-Dカメラが撮影したRGB-D画像に対して座標変換等が実行される。具体的には、RGB-D画像の各画素の位置及び奥行が、所定の3次元座標系の座標に変換される。この結果、ユーザ20の3次元形状を表す多数の点の3次元座標(ポイントクラウド)が算出される。
 ポイントクラウドを算出する処理が、N個のRGB-D画像に対して実行される。これにより例えばユーザ20の全体像を表すポイントクラウドを高精度に算出可能である。算出されたポイントクラウドに基づいて、ユーザ20の3次元形状を表すメッシュモデルが生成される。
 RGB-D画像に基づいて、ユーザ20の肌の色や着ている服の色等に関するテクスチャ情報が取得される。取得されたテクスチャ情報に基づいて、メッシュモデル表面の色等が設定され、ユーザ20等の3Dモデルが生成される。従って3Dモデルでは、RGB-D画像に映っているユーザ20の形状や色が高精度に再現される。なお3Dモデルを生成する方法は限定されず、他の方法で3Dモデルが生成されてもよい。
 図2に示すように本実施形態では、3Dモデル生成部110から、3Dモデルの情報又はN個の2D画像が他の機能ブロックに出力される。ここで2D画像とは、RGB-D画像のうち、距離情報(奥行情報)等を除いた2次元の画像である。例えば3Dモデルが所定のフレームレートで生成される場合には、3Dモデルの情報がフレーム毎に出力される。この場合例えば、出力される3Dモデルの生成に使用されたN個のRGB-D画像からN個の2D画像が生成され3Dモデルの情報と一緒に出力される。なお他の機能ブロックに出力される情報等は限定されず、例えばN個の2D画像に代えてN個のRGB-D画像がそのまま出力されてもよい。本実施形態では、RGB-D画像及びRGB-D画像の一部である2D画像は、対象物の画像に相当する。
 置換処理部120は、3Dモデル生成部110により生成された3Dモデルの少なくとも一部を変更することが可能である。すなわち置換処理部120は、N個の2D画像の各々に含まれる対象物の状態(ユーザ20の表情、姿勢、及び動作等に関する状態、及びユーザ20が使用する物の状態)の少なくとも一部が変更された3Dモデルを生成することが可能である。置換処理部120により変更処理が実行された3Dモデルは、変更前の3Dモデルと比べて、低い再現性にて対象物が再現されたモデルとなる。
 3Dモデルに変更を加える変更処理として、例えば3Dモデルの少なくとも一部を置換する処理、少なくとも一部を削除する処理、及び3Dモデルに対して所定のオブジェクトを追加する処理等が実行される。静止状態のユーザ20の体の一部等を置換、又は削除する場合のみならず、静止状態である体の一部を所定の動作をしている状態に置換する場合等も含まれる。またユーザ20が使用するコントローラ等を削除する場合や、他のものに置換する場合等も含まれる。その他、3Dモデルに変更を加える処理は限定されず、後に具体的な例を詳細に説明する。
 置換制御部130は、置換処理部120の動作を制御する。本実施形態では置換制御部130により、置換処理部120による変更処理の実行の有無が制御される。従って置換制御部130により、置換処理部120による変更処理が実行されるモードと、変更処理が実行されないモードとが適宜切替えられる。変更処理が実行されない場合には、再現性の高い3Dモデルが置換処理部120から出力される。変更処理が実行される場合には、再現性の低い3Dモデルが置換処理部120から出力される。
 置換制御部130による変更処理の実行の有無の制御は、置換情報DB160に記憶された置換情報161に基づいて実行される。図2に示すように、置換情報161は、置換条件情報162、置換対象情報163、及びモデル生成情報164を含む。
 置換条件情報162は、対象物の状態の少なくとも一部を変更するか否かの判定条件を含む情報である。本実施形態では、当該判定条件のことを置換条件と記載して説明を行う。すなわち本説明における置換条件は、置換をするための条件のみならず、削除等も含めた3Dモデルの種々の変更に関する判定条件を含む。また以下、置換処理部120による変更処理のことを、置換処理と記載する場合がある。
 置換制御部130は、3Dモデル生成部110、UI判定部140、及びアプリケーション51から入力されたユーザ20や仮想空間Vに関する情報に基づいて、置換条件情報162に含まれる置換条件が満たされるか否かを判定する。置換条件が満たされる場合には、例えば置換処理の開始及び終了の指示や、置換処理の具体的な指示(どの部位をどのように変更するか等)を、置換処理部120に出力する。
 置換対象情報163は、置換対象となる部位を特定するための特定情報である。モデル生成情報164は、特定された置換対象となる部位を変更する方法を含む情報である。これらの情報は、置換条件情報162と関連付けられて記憶されている。すなわち置換対象情報163及びモデル生成情報164は、置換条件に関連付けられた対象物の状態の少なくとも一部を変更する方法に関する情報に相当する。
 置換情報DB160には、様々な状況に対応する複数の置換情報161が記録されている。従って、様々な状況に応じた置換処理を実行することが可能となり、ユーザ20が所望する3Dモデルを高精度に生成することが可能となる。なお置換情報161に含まれる情報は限定されず、所望の置換処理を実現可能とする任意の情報が用いられてよい。
 本実施形態では、3Dモデル生成部110と、置換処理部120と、置換制御部130とが協働することで、生成部が実現される。また本実施形態では、置換制御部130は、生成制御部としても機能する。
 置換制御部130の制御により、置換処理部120による置換処理が実行されず、再現性の高い3Dモデルが生成される処理が、本実施形態において、第1の生成処理に相当する。また置換処理部120により出力される再現性の高い3Dモデルが、第1の再現性にて対象物が再現された第1のモデルに相当し、図1に示すユーザ20の仮想モデル30となる。なお、置換処理なしで生成された仮想モデル30を、第1の生成処理にて生成された第1の仮想モデルと記載する場合がある。
 置換制御部130の制御により、置換処理部120による置換処理が実行され、再現性の低い3Dモデルが生成される処理が、本実施形態において、第2の生成処理に相当する。また置換処理部120により出力される再現性の低い3Dモデルが、第1の再現性よりも低い第2の再現性にて対象物が再現された第2のモデルに相当し、図1に示すユーザ20の仮想モデル30となる。なお、置換処理により生成された仮想モデル30を、第2の生成処理にて生成された第2の仮想モデルと記載する場合がある。
 すなわち本実施形態では、仮想空間Vに表示されるユーザ20の仮想モデル30として、再現性の高い第1の仮想モデルと、再現性の低い第2の仮想モデルとを互いに切替えて表示させることが可能となる。例えば様々な状況において、ユーザ20の状態をそのまま再現した仮想モデル30よりも、一部を変更した仮想モデル30を表示した方が、違和感なく自然に仮想体験を楽しむことが可能となる場合がある。すなわち第1及び第2の生成処理が適宜切替えられ、第1及び第2の仮想モデルが切替えられことで、ユーザ20に自然な仮想体験を提供することが可能となる。詳しくは後述する。
 なお本実施形態において、置換制御部130による置換処理の実行の有無の切替えは、生成制御部による第1の生成処理の実行及び第2の生成処理の実行の切替えに相当する。
 UI判定部140は、様々なユーザインターフェース(User Interface)を介してユーザ20が入力した指示等の認識、又は判定を行う。例えばUI判定部140は、ユーザ20の2D画像や、モデル生成装置100に接続されたマイク41及びボタン42からの情報等に基づいて、ユーザ20のジェスチャーによる操作入力や音声による操作入力等を認識する。使用されるインターフェースの種類等は限定されず、例えばジェスチャーや音声を併用したマルチモーダル・インターフェース等が用いられてもよい。
 例えばUI判定部140により、ユーザ20が要求するサービス等の内容が判定され、UI判定結果としてアプリケーション51に送信される。これにより、アプリケーション51は要求されたサービス等をユーザ20に提供することが可能となる。またユーザ20が操作入力中であるといった情報がUIイベントとして置換制御部130に送信される。これにより置換制御部130は、例えばユーザ20が所定の操作入力を行っている場合には置換処理を行うといった判定を行うことが可能となる。
 生成済みモデルバッファ170は、置換処理部120から出力された仮想モデル30(3Dモデル)の情報を一定期間保持する。すなわち過去に出力された仮想モデル30の情報が所定のフレーム枚数分だけ保存される。保存された仮想モデル30の情報は、置換処理部120にフィードバックすることが可能である。これにより例えば、直前に生成された仮想モデル30の情報等を使って置換処理等を実行することが可能となる。
 ストリーム生成部150は、置換処理部120からフレーム毎に出力される仮想モデル30の情報に基づいて仮想モデル30の映像(ストリーム)を生成する。ストリームを生成する方法等は限定されず、3Dモデルの形式やアプリケーション51の仕様等に応じた任意のレンダリング処理が実行されてよい。生成された仮想モデル30のストリームは、アプリケーション51に出力される。
 アプリケーション51は、仮想空間生成装置50を使って仮想空間Vを生成するコンピュータプログラムである。アプリケーション51は、仮想モデル30の映像情報等を取得して仮想空間V内の適正な位置に仮想モデル30を配置する。これにより、仮想空間V上にユーザ20の仮想モデル30が再現される。
 またアプリケーション51は、仮想空間V内での仮想モデル30の状態に関するステータス情報を置換制御部130に出力可能である。ステータス情報は、仮想モデルがどのような状態であるかを表す情報であり、例えば仮想モデル30に対する動作の指示や、仮想空間V内の表現として定められた動作や演出等の指示等に応じて生成される。例えばユーザ20が使用するコントローラ等を介して所定の動作の指示が入力中である場合には、当該指示された動作中であるステータス情報が生成される。その他、種々のステータス情報が生成される。
 図3は、仮想モデル30の生成の概要を示すフローチャートである。画像取得部により、ユーザ20(対象物)の2D画像(RGB-D画像)が取得される(ステップ101)。置換制御部130により、置換条件情報162に基づいて、ユーザ20の状態の少なくとも一部を変更するか否かが判定される(ステップ102)。
 ユーザ20の状態の少なくとも一部を変更しない、すなわち置換条件が満たされないと判定された場合(ステップ102のNO)、第1の生成処理が実行される(ステップ103)。本実施形態では、置換制御部130から置換処理部120に置換処理を実行しない旨の指示が出力される。そして3Dモデル生成部110により生成された3Dモデルが、そのまま第1の仮想モデルとして出力される。これにより2D画像に含まれるユーザ20の状態が再現された第1の仮想モデルが生成される。
 ユーザ20の状態の少なくとも一部を変更する、すなわち置換条件が満たされると判定された場合(ステップ102のYES)、第2の生成処理が実行される(ステップ104)。本実施形態では、置換制御部130から置換処理部120に置換処理を実行する旨の指示が出力される。これにより置換処理部120により、3Dモデル生成部110により生成された3Dモデルに対して置換処理が実行され、第2の仮想モデルとして出力される。これにより2D画像に含まれるユーザ20の状態の少なくとも一部が変更された第2の仮想モデルが生成される。
 このように、置換制御部130により置換処理部120の動作が制御され、第1の仮想モデルと第2の仮想モデルとが互いに切替えられて生成される。これにより例えばユーザ20や仮想空間Vの様々な状況に対応した適切な仮想モデル30を適宜表示させることが可能となる。
 なお仮想モデル30の生成方法は、上記で説明した方法に限定されず、他の任意の方法が用いられてよい。例えば本実施形態では、ユーザ20の2D画像の取得に応じて、3Dモデル生成部110によりユーザ20の3Dモデルが生成される。そして生成された3Dモデルに置換処理を実行するか否かにより、第1及び第2の生成処理が切替えられる。
 これに代えて、まずステップ102の判定が実行され、その後に判定結果に基づいて、第1及び第2の生成処理のいずれかが開始されてもよい。その際には、例えばユーザ20の2D画像に基づいて直接的に第1及び第2の仮想モデルがそれぞれ生成されてもよい。
 以下、第2の生成処理について、具体的な例を挙げて説明する。
 図4は、第2の生成処理の一例を示す模式図である。図4に示す例では、歩行コントローラ43を使用するユーザ20aの3Dモデル60aに置換処理121が実行され、歩行動作を行う第2の仮想モデル30aが生成される。なお図4には、置換処理121に用いられる置換情報161が模式的に図示されている。
 図4に示す歩行コントローラ43は、ユーザ20aが上に乗って使用するタイプのものであり、ユーザ20aは体重を移動させることで、仮想空間V内での第2の仮想モデル30aの移動(歩行/走行)を指示することが可能である。体重を移動させる方向や大きさを調整することで、第2の仮想モデル30aの移動方向や移動速度等をコントロールすることが可能である。すなわちユーザ20aは実際に歩行動作を行うことなく、ほぼ直立の姿勢のまま、第2の仮想モデル30aに歩行動作を実行させることが可能である。
 歩行コントローラ43を介して入力された歩行動作の指示等は、アプリケーション51に出力され、ステータス情報として置換制御部130に出力される。
 上記したように本実施形態では、まず3Dモデル生成部110により、歩行コントローラ43を使用するユーザ20のN個の2D画像に基づいて、ユーザ20a及び歩行コントローラ43を含む3Dモデル60aが生成される。
 図5は、置換制御部130の処理例を示すフローチャートである。図6は、本例において参照される置換情報の一例を示す模式図であり、図4に示す置換情報161の詳細である。上記したように置換情報161は、置換条件情報162、置換対象情報163、及びモデル生成情報164を含む。本実施形態では、置換条件としてステータス情報、対象オブジェクト(図6ではモデルと表記)、UI判定に関する項目が含まれる。
 置換情報DB160から複数の置換情報161(1~m)が取得される(ステップ201)。また3Dモデル生成部110により生成された3Dモデル60a、及びN個の2D画像が取得される(ステップ202)。
 1~mの複数の置換条件情報162に含まれる置換条件が満たされるか否かが判定される。具体的には、置換情報161が順に読みだされ、まず置換条件情報162内のステータスが合致するか否かが判定される(ステップ203)。本実施形態では、図6に示す置換情報161が読み出され、歩行コントローラ43を介した歩行動作の指示により歩行動作中であるというステータスが合致しているとする(ステップ203のYes)。
 なお歩行コントローラ43を介して歩行動作の指示が入力されていない場合には、置換条件は満たされないと判定され、他の置換情報161が読み出される(ステップ203のNo、ステップ209、及びステップ210のYesのフロー)。未だ読み出されていない置換情報が存在しない場合(ステップ210のNo)には、置換処理部120へ置換対象が存在しない旨が通知され処理が終了する(ステップ211)。
 ステータスが合致していると判定されると、置換条件情報162内に格納された対象オブジェクトが認識可能であるか否かが判定される(ステップ204)。本実施形態では、置換条件情報162に歩行コントローラ43の2D映像(画像)における認識特徴量が含まれる。置換制御部130は、ステップ202にて取得したN個の2D画像の各々について、認識特徴量が合致する部分が検出されるか否かを判定する。合致する部分がある場合には、対象オブジェクトは認識可能であると判定される(ステップ204のYes)。2D画像内に認識特徴量と合致する部分がない場合には、置換条件は満たされないと判定され、ステップ204のNoからステップ209に進む。
 なお対象オブジェクトを認識する方法は限定されず、マッチング技術等の任意の技術が用いられてよい。図6に示す置換情報では、置換条件として、N個の2D画像に基づいた認識の有無と、3Dモデルに基づいた認識の有無とが、別の項目として設定されている。これに対して2D画像及び3Dモデルを区別することなく、これらのうち少なくとも一方にて対象オブジェクトが認識されるといった条件が、置換条件として設定されてもよい。
 対象オブジェクト、すなわち本例では歩行コントローラ43が認識された場合には、3Dモデル60a上の、歩行コントローラ43に該当する部分がマークされる(ステップ205)。具体的には、歩行コントローラ43の認識特徴量に合致した2D画像内の各点の座標に基づいて、各点に対応する3Dモデル上での各頂点情報が取得される。取得された各頂点情報が、歩行コントローラ43の各点を表す頂点情報としてマークされる。
 またマークされた各頂点情報に基づいて、3Dモデル60a上の歩行コントローラ43に該当する部分には、オブジェクトIDが設定される。なお本例では、歩行コントローラ43は削除対象となる部分である。従って対象オブジェクトは、置換対象となる部位を特定するための特定情報ともなる。
 次に人体を含む領域があるか否かが判定される(ステップ206)。すなわち人物の体が検出されるか否かが判定される。人体を検出する方法は限定されず、2D画像や3Dモデル60aを用いた任意の技術が用いられてよい。人体が検出されない場合には、置換条件は満たされないと判定され、ステップ206のNoからステップ209に進む。
 人体が検出された場合(ステップ206のYes)、3Dモデル60a上の人体に該当する部分がマークされる(ステップ207)。例えばステップ205と同様の方法により、3Dモデル60a上での人体に該当する頂点情報がマークされ、人体に該当する部分にオブジェクトIDが設定される。
 対象物(歩行コントローラ43)のマーク及びIDと、人体(ユーザ20a)のマーク及びIDと、置換情報とが置換処理部に送信され処理が終わる(ステップ208)。すなわちこの場合は置換条件が満たされたと判定され、図3のステップ102のYesからステップ104に進み第2の生成処理が実行される。
 図7Aは、置換処理部の具体的な構成例を示すブロック図である。図7Bは、置換処理部120の各ブロックが実行する処理に関する模式図である。図8は、置換処理の一例を示すフローチャートである。図7Bに付されたステップは、図8のステップに対応する。
 置換処理部120は、置換処理制御部122、対象オブジェクト置換処理部123、ボディモデル変換部124、ボディモデル置換処理部125、及びMeshモデル変換部126を有する。置換処理制御部122により、置換制御部130から出力された置換情報161等に基づいて、各ブロックの動作が制御される。
 まず、対象オブジェクトについての置換処理が実行される(ステップ301)。対象オブジェクト置換処理部123により、モデル生成情報164に基づいて対象オブジェクトが他のオブジェクト等に置換される。なおモデル生成情報164に、他のオブジェクト等の情報が含まれない場合には、対象オブジェクトは単に削除される。
 本実施形態では、歩行コントローラ43の頂点情報に基づいて、3Dモデル60aから歩行コントローラ43に該当する部分が削除される。上記したように3Dモデル60a上の歩行コントローラ43に該当する部分(セグメント)にはオブジェクトIDが設定されている。従ってオブジェクトIDが指定するセグメントを削除することで、歩行コントローラ43を容易に削除することが可能となる。
 ボディモデル変換部124により、人物の骨格が推定(Bone認識)され、これに基づいてボディモデル70への変換が実行される(ステップ302)。ボディモデル70は、3Dモデル60aのうち人体に該当する部分を人体の特徴を利用して変形や置換を行いやすい形に変換したモデルである。ボディモデル70としては、3Dモデル60aのメッシュと骨格との相対的な位置関係が推定されたDeformableモデルや、人体の各部位のサイズ(パラメータ)等を制御可能なパラメトリックモデル等が適宜使用される。またボディモデル70は、例えばBone認識により生成されたボーンモデルをもとに、解剖学上の制約に基づいて生成される。これに限定されず、人体等を表現可能な任意のモデルが、ボディモデル70として用いられてよい。
 Bone認識やボディモデル70への変換に用いられる技術は限定されない。例えばBone認識として、2D画像やメッシュモデル等から人物の骨格を推定可能な技術や、機械学習等を用いた任意の技術が用いられてよい。またボディモデル70への変換として、メッシュモデル等を変形可能な任意の変換方法等が用いられてよい。
 ボディモデル置換処理部125は、ボディモデル70の変更(変形)及び置換等を含むボディモデル置換処理を実行する(ステップ303)。図7では、ボディモデル置換処理部125により、ボディモデル70の両足が歩く動作に置換される。例えば、置換対象情報163で指定された部位(両足)が、モデル生成情報164に基づいて歩く動作をするモデルに置き換えられる。従って人物が直立した状態から歩行動作を行う状態に変更された、置換後のボディモデル71が生成される。
 このように本実施形態では、ボディモデル変換部124及びボディモデル置換処理部125により、人体についての置換処理121が実行される。ボディモデル70での置換処理121を行うことで、自然な歩行動作を容易に表現することが可能となる。例えば人物の歩く動作に合わせて、人物の上半身が適宜変形されたモデルを生成するといったことも可能となり、ユーザが感じる違和感を十分に軽減することが可能となる。なお人体は、オブジェクトID等を用いて識別される。
 図6ではボーンモデル(骨格)に基づいて、置換対象となる置換対象情報163と、その置換対象の置換方法を表すモデル生成情報164とが生成される。例えば置換対象情報163として両足の骨格が指定された場合には、当該両足の骨格に関する置換モデルがモデル生成情報164に格納される。従って、置換対象情報163で指定される骨格とモデル生成情報164で生成される骨格とは同じになるように設定される。なおボーンモデルに限定されず、例えば人体の各部位に関する特徴量等の、任意のパラメータが用いられてもよい。
 なお図6に示すように、モデル生成情報164には、歩行動作等を表現するために複数のフレームの情報が保持されている。例えば歩行動作中は、複数のフレームの情報等を繰り返し使用することで、容易に歩行動作の継続を表現することが可能となる。
 Meshモデル変換部126により、置換後のボディモデル71が再びメッシュモデルに変換される(ステップ304)。これにより第2の仮想モデル30aが生成され処理が終了する。生成された第2の仮想モデル30aは、ストリーム生成部150等に適宜出力され、アニメーションとしてユーザに表示される。
 このように置換制御部130は、歩行動作の指示が入力された場合には、置換情報161に基づいて第2の生成処理の実行を選択する。そして第2の生成処理として、歩行動作を実行する第2の仮想モデル30aが生成される。これにより、ユーザ20aが歩行動作等を行っていない場合であっても、仮想空間Vには歩行動作を行うユーザ20aの第2の仮想モデル30aが表示される。この結果、ユーザ20aにとっての負担が小さく自然な仮想体験を提供することが可能となる。
 なお第1の生成処理から第2の生成処理に切替えられる場合の遷移状態を表すモデルを生成することも可能である。例えば本例において、歩行動作の開始が指示された場合には、開始時点での第1の仮想モデルの状態(ユーザ20aの状態)から歩き始めるまでの動作が遷移状態のモデルとして生成される。これにより、動作を開始する前の状態から動作を行う状態へとスムーズに移行する様子を表現可能となる。
 同様に第2の生成処理から第1の生成処理に切替えられる場合の遷移状態を表すモデルを生成することも可能である。例えば歩行動作の終了が指示された場合には、終了時点の第1の仮想モデルの状態(ユーザ20aの状態)となるように、その状態に向けて歩行をやめる動作が遷移状態のモデルとして生成される。例えばユーザ20aが座っている場合には、歩きを止めつつ座るといった遷移状態が表現される。
 遷移状態を表すモデルを生成する方法は限定されず、例えば種々の動作についての開始動作及び終了動作の情報に基づいた機械学習による推定技術や、その他、任意の技術が用いられてよい。
 また置換される動作に、ユーザ20a独自の特徴が反映されてもよい。例えば本例において、ユーザ20aの歩き方が反映された歩行動作が表現されてもよい。ユーザ20aの独特の動作の特徴は、例えば事前にユーザ20aの動作を撮影した2D画像等に基づいて取得可能である。例えばユーザ20aが仮想空間生成システム10を利用している間に、ユーザ20aの2D画像に基づいて、歩く、走る、座る、立つ、飛び上がる等の種々の動作について、ユーザ20aの特徴を分析して記憶する、といったことも可能である。その他、機械学習等の任意の技術が用いられてよい。
 図9は、第2の生成処理の他の例を示す模式図である。図10は、本例において参照される置換情報の一例を示す模式図である。図9に示す例では、手持ちコントローラ44を使用するユーザ20bの3Dモデル60bに置換処理121が実行され、歩行動作を行う第2の仮想モデル30bが生成される。
 手持ちコントローラ44は、ユーザ20bの手元で操作される。ユーザ20bは、手持ちコントローラ44のボタンやジョイスティック等を使って仮想モデル30の各種の動作をコントロールすることが可能である。例えば図9に示すように、ユーザ20bは座った姿勢のまま、手持ちコントローラ44を介して仮想モデル30に様々な動作を実行させることが可能である。
 置換条件情報162に基づいて、ステータスが合致するか否かが判定される。手持ちコントローラ44からの指示により歩行動作中であるというステータスが合致している場合、手持ちコントローラ44が認識可能であるか否かが判定される。図10に示す置換情報161では、3Dモデル60bにおいて、手持ちコントローラ44の認識特徴量が合致するか否かが判定される。
 手持ちコントローラ44が認識された場合には、該当する部分がマークされIDが付される。また人体が検出されマーク付け及びID付与が実行される。手持ちコントローラ44のマーク及びIDと、人体のマーク及びIDと、置換情報161とが、置換処理部120に送信される。そして置換処理121(第2の生成処理)が実行される。
 図9に示すように、手持ちコントローラ44に対して置換処理121が行われる際には、例えばユーザ20bが座っている場合等が想定される。このため置換される部位として広い範囲が指定される。本例の置換対象情報163では、手持ちコントローラ44と、それを使用する両腕と、両足とが置換対象として指定される。またモデル生成情報164には、両腕及び両足についての歩行動作を表すモデルの情報が記憶される。
 置換対象情報163及びモデル生成情報164に基づいて、3Dモデル60b内の手持ちコントローラ44が削除される。また人物の両腕及び両足が、歩く動作をするモデルに置換され、歩く動作を行う第2の仮想モデル30bが生成される。
 図9に示す例では、座っている姿勢の3Dモデル60bから歩く動作を行う第2の仮想モデル30bが生成される。この場合第2の生成処理により、まず座っている状態から立ち上がる動作を実行し、続いて歩き始める動作を実行するといった歩く動作へ遷移する動作を実行する第2の仮想モデル30bが生成される。例えばモデル生成情報164に含まれる複数のフレームの情報に基づいて、歩く動作へ遷移する一連の動作を表現することが可能である。これにより歩く動作へとスムーズに移行する様子を表現可能となる。
 なお、座った状態のユーザ20bを撮影した2D画像に基づいて3Dモデル60bを生成した場合、足元などの情報が十分に得られない可能性がある。従ってボディモデルへの変換等を使って3Dモデルを変形しても良好な第2の仮想モデル30bを得られない可能性がある。この場合例えば、直立した姿勢でのユーザ20bの3Dモデル60bを取得しておき、当該3Dモデル60bのメッシュやテクスチャ等の情報を使って第2の仮想モデル30bを生成するといった方法が実行されてもよい。
 図11は、第2の生成処理の他の例を示す模式図である。図12は、本例において参照される置換情報の一例を示す模式図である。図11に示す例では、ジェスチャーによる操作入力を行うユーザ20cの3Dモデル60cに置換処理121が実行され、ジェスチャーを実行しない第2の仮想モデル30cが生成される。
 ユーザ20cは所定のジェスチャーを実行することで、当該ジェスチャーに対応した操作入力を行うことが可能である。図11に示す例では、ユーザ20cにより両肘をまげて両手振るといったジェスチャーが実行される。ユーザ20cのジェスチャーは、N個の2D画像や3Dモデル60cに基づいて、UI判定部140により認識される。
 図13は、UI判定部140の具体的な構成例を示すブロック図である。UI判定部140は、ジェスチャー認識部141と、音声認識部142と、判定部143とを有する。以下ジェスチャーによる操作入力が行われた場合の、ジェスチャー認識部141及び判定部143の動作について説明する。なお音声認識部142の動作等については、他の例で説明する。
 ユーザ20cにより、ジェスチャーによる操作入力が行われる。3Dモデル生成部110により、ジェスチャーによる操作入力を行うユーザ20cの3Dモデル60cが生成され、当該3Dモデル60cの情報及びN個の2D画像がジェスチャー認識部141に入力される。
 ジェスチャー認識部141により、入力された2D画像等に基づいて、ユーザ20cがジェスチャーによる操作入力を実行していることが認識される。例えば、特徴量等に基づいてユーザ20cの動作が検出され、その動作が予め記憶されたジェスチャーと一致するか否かが判定される。
 ユーザ20cの動作が記憶されたジェスチャーと一致する場合は、ユーザ20cがジェスチャーによる操作入力を実行していると認識され、ジェスチャーによる操作入力が受け付けられる。なお、ジェスチャーを認識する方法等は限定されず、例えば3Dモデル60cや2D画像に基づいて動作を検出可能な任意の方法が用いられてよい。
 判定部143により、ジェスチャー認識部141の認識結果に基づいて、ジェスチャーの内容が判定される。すなわちユーザ20cが要求するサービス等の内容が判定される。判定されたサービス内容等の情報は、判定結果としてアプリケーション51に出力される。また判定部143は、ジェスチャーによる操作入力が認識中であるといった状況を知らせるUIイベントを生成し、置換制御部130に適宜出力する。
 図14は、置換制御部130に出力されるUIイベントの一例を示す表である。例えばジェスチャー認識の開始、認識中、認識の終了等、ジェスチャーによる操作入力に対する認識の状況が出力される。またUIイベントとして、ジェスチャーによる操作入力の内容(認識結果)等を出力することも可能である。なおUIイベントには、音声に基づく操作入力についての情報も含まれる。この点については後述する。
 置換制御部130は、UI判定部140から出力されたUIイベントに基づいて、置換条件が合致するか否かを判定する。図12に示す置換条件情報162では、UI判定のジェスチャー認識の項目が置換条件として設定されている。すなわち、UIイベントに基づいて、ユーザ20cによるジェスチャーが認識中であるか否かが判定される。
 ユーザ20cのジェスチャーが認識中であると判定された場合には、2D画像等に基づいて人体が検出され、人体に対してマーク付け及びID付与が実行される。そして人体のマーク及びIDと置換情報161とが置換処理部120に送信され、置換処理121(第2の生成処理)が実行される。
 図11に示すように、本例の置換対象情報163では、置換対象として両腕が指定されている。またモデル生成情報164には、両腕を伸ばした状態を表すモデルの情報が記憶される。置換対象情報163及びモデル生成情報164に基づいて置換処理121が実行され、両腕を伸ばして直立した第2の仮想モデル30cが生成される。
 もちろん置換されるジェスチャーの種類等は限定されず、任意のジェスチャーに対して置換処理121が実行されてよい。例えば、ユーザ20cが指先を使ってサインを出すといったジェスチャーが認識されたとする。この場合例えばユーザ20cの指先や手のひらが置換されてもよい。これによりジェスチャーに関係した部位だけが置換されるので、置換処理121の効率化をはかることが可能となる。
 このように、置換制御部130は、ジェスチャーによる操作入力が受け付けられた場合には、第2の生成処理の実行を選択する。そして第2の生成処理としてジェスチャーを実行しない第2の仮想モデル30cが生成される。これにより、ジェスチャー等を他の動作に切替えることが可能となる。従って、例えばローカルな操作入力等を仮想空間Vを共有している他のユーザに見せることなく、仮想体験を楽しむことが可能となる。
 なお本例では、ジェスチャー認識部141によりジェスチャーが開始されていると認識された時点で置換処理121が実行される。このため、ユーザ20cがジェスチャーを始めてから、ジェスチャーが置換された第2の仮想モデル30cが生成されるまでに、一定の遅延が生じる可能性がある。
 こうした置換処理121の遅延を回避するため、例えばユーザ20cは図13に示すボタン42を使ってジェスチャーを開始する旨をUI判定部140に通知することが可能である。例えばボタン42の出力に基づいてジェスチャー認識部141及び判定部143により、ジェスチャー認識開始のUIイベントが出力される。これによりジェスチャー認識部141が実際にユーザ20cのジェスチャーを認識する前から、置換処理121を開始することが可能となる。また、例えば3Dモデル生成部110と置換処理部120との間に、3Dモデル60cを一定の時間保持できる3Dモデルバッファ等を設けることで、遅延による影響を回避することもできる。
 図15は、第2の生成処理の他の例を示す模式図である。図16は、本例において参照される置換情報の一例を示す模式図である。図15に示す例では、音声による操作入力を行うユーザ20dの3Dモデル60dに置換処理121が実行され、音声の発話動作を実行しない第2の仮想モデル30dが生成される。
 ユーザ20dは音声による操作入力を行うことが可能である。例えば、ユーザ20dが所定のフレーズを含む指示等を発話することで、指示内容に対応した操作が実行される。3Dモデル生成部110は、発話動作を行うユーザ20dの3Dモデル60dを生成する。また、ユーザ20dの音声はマイク41によって取得され、UI判定部140に音声の情報が出力される。
 図13に示すUI判定部140の音声認識部142により、ユーザ20dの音声の情報に基づいて、ユーザ20dが音声による操作入力を実行しているか否かが認識される。例えば音声認識部142によりユーザ20dの音声の情報が解析され、音声に含まれる単語やフレーズ等が取得される。ユーザ20dの音声を解析する方法等は限定されず、任意の音声認識技術等が用いられてよい。
 例えば、予め記憶された操作入力に関する所定のフレーズ等がユーザ20dの音声に含まれる場合には、ユーザ20dが音声による操作入力を実行していると認識される。また所定のフレーズ等が含まれない場合には、ユーザ20dは音声による操作入力を実行していないと認識される。
 音声による操作入力が実行されていると認識された場合、判定部143により、音声認識部142の認識結果に基づいて音声の内容が判定される。すなわちユーザ20dが要求するサービス等の内容が判定される。判定部143は、例えば音声認識部142が解析した単語やフレーズ等をもとにユーザ20dが指示している内容を判定する。音声の内容を判定する方法等は限定されず、例えば機械学習を用いた文章認識技術等が適宜用いられてよい。
 判定部143により、判定されたサービス内容等の情報が判定結果としてアプリケーション51に出力される。またUIイベントとして、音声による操作入力を認識中であるといった情報(図14参照)が、置換制御部130に出力される。
 置換制御部130により、UI判定部140から出力されたUIイベントに基づいて、置換条件が合致するか否かが判定される。図16に示す置換条件情報162では、UI判定の音声認識の項目が置換条件として設定されている。UIイベントに基づいて、ユーザ20dの音声が認識中であるか否か、すなわちユーザ20dが音声による操作入力を実行中であるか否かが判定される。
 ユーザ20dの音声が認識中であると判定された場合には、2D画像等に基づいて人体が検出され、人体に対してマーク付け及びID付与が実行される。そして人体のマーク及びIDと置換情報161とが置換処理部120に送信され、置換処理121(第2の生成処理)が実行される。
 図15に示すように、本例の置換対象情報163では、置換対象として頭部が指定されている。従って3Dモデル60dでの口の動きや表情等が置換対象となる。またモデル生成情報164には、口を閉じた頭部のモデルが記憶される。口を閉じた頭部のモデルは、例えば事前にユーザ20dが口を閉じた状態を撮影した2D画像等に基づいて生成可能である。置換対象情報163及びモデル生成情報164に基づいて置換処理121が実行され、口を閉じた状態の第2の仮想モデル30dが生成される。
 なお、仮想空間V上で他のユーザと音声等を介したコミュニケーション等が可能な場合が想定される。この場合、例えばユーザ20dが音声による操作入力を実行している間は、ユーザ20dの音声がカットされてもよい。例えば口を閉じた第2の仮想モデル30dが表示される際に、ユーザ20dの音声をカットするといった方法が用いられてもよい。
 このように、置換制御部130は、音声による操作入力が受け付けられた場合には、第2の生成処理の実行を選択する。そして第2の生成処理として音声の発話動作を実行しない第2のモデルが生成される。これにより、発話動作を他の動作に切替えることが可能となる。従って、例えば音声による操作入力等を仮想空間Vを共有している他のユーザに知られることなく、仮想体験を楽しむことが可能となる。
 なお本例では、音声認識部142が音声による操作入力が開始されていると認識された時点で置換処理121が実行される。このため、発話動作を実行しない第2の仮想モデル30dが生成されるまでに、一定の遅延が生じる可能性がある。本例では、ユーザ20dは図13に示すボタン42を使って音声による操作入力を開始する旨をUI判定部140に通知することが可能である。これにより、音声認識部142が実際に音声による操作入力を認識する前から、置換処理121を開始することが可能となる。また、例えば3Dモデル生成部110と置換処理部120との間に、3Dモデル60dを一定の時間保持できる3Dモデルバッファ等を設けることで、遅延による影響を回避することもできる。
 他のユーザと音声等を介したコミュニケーション等が可能な場合、音声による操作入力であると判定されない場合は、第1の生成処理が実行される。すなわちユーザの発話動作がそのまま再現された第1の仮想モデルが生成される。これにより高精度なコミュニケーションが可能となる。
 この際に、例えばユーザ20dの頭部を撮影するサンプリングレートを上げるといった処理が実行されてもよい。これにより、発話動作を行うユーザ20dの口元等を高い再現性で再現することが可能となる。具体的な処理例としては、例えば音声認識部142にユーザ20dの音声が入力された場合に、ユーザ20dの頭部を撮影するサンプリングレートを上げる処理が実行される。音声の内容が操作入力に関するものでない場合には、そのまま第1の生成処理が実行される。音声の内容が操作入力に関するものである場合には、サンプリングレートを下げ(例えば通常に戻し)、第2の生成処理が実行される。これにより自然な仮想体験を容易に実現することが可能となる。
 図11及び図15では、ジェスチャーによる操作入力及び音声による操作入力が行われた場合の第2の生成処理の一例が示された。操作入力として、ジェスチャー及び音声の両方が同時に使用されるマルチモーダルな操作入力が行われてもよい。この場合、UI判定部140はユーザ20のジェスチャーと音声とをともに認識して、マルチモーダルな操作入力に対応するUIイベントを出力する(図14参照)。これにより、例えばジェスチャー及び発話動作を実行しない第2の仮想モデルを生成することが可能となる。
 図17は、第2の生成処理の他の例を示す模式図である。図18は、本例において参照される置換情報の一例を示す模式図である。図18に示す例では、HMD(Head Mount Display)45を使用したユーザ20eの3Dモデル60eに置換処理121が実行され、HMD45が削除された第2の仮想モデル30eが生成される。
 HMD45は、ユーザ20eの頭部に装着して使用されるディスプレイ装置である。HMDは、アプリケーション51がインストールされたコンピュータシステム等に接続され、例えばアプリケーション51により生成された仮想空間Vの画像等が表示される。HMD45を使用することで、例えばユーザ20e自身が仮想空間V内にいるかのような体験を楽しむことが可能となる。HMD45の種類等は限定されず、例えばユーザの目を完全に覆う没入方のディスプレイ等が使用される。この他透過型ディスプレイを備えたHMDやスマートグラス等が適宜使用されてよい。
 図17に示すように、ユーザ20eがHMD45を装着している場合には、ユーザ20eの表情等の情報を取得することが難しい場合がある。このためHMD45を装着した3Dモデル60eの顔部分の置換を行う際には、ユーザ20eの表情等に関するパラメータ(顔モデルパラメータ)が新たに取得される。本例では、HMD45の内部に取り付けられたユーザ20eの表情等を読み取るセンサからの情報に基づいて、ユーザ20eの顔モデルパラメータが取得される。
 表情等を読み取るセンサとして、例えばHMD45の内部にユーザ20eの目や眉等を撮影可能なカメラ等が搭載される。ユーザ20eの表情等を読み取るセンサの種類は限定されず、ユーザ20eの視線方向を検出するセンサや、眉の動きを検出するセンサ等が適宜用いられてよい。
 図19は、HMD45が使用される場合の仮想空間生成システム11の構成例を示すブロック図である。仮想空間生成システム11は、HMD45と、複数のカメラ40と、モデル生成装置101と、アプリケーション51とを有する。モデル生成装置101には、図2に示した各機能ブロックに加え、顔モデルパラメータ生成部180、及び顔モデル生成部181が含まれる。なお図19では、図2に示したマイク41、ボタン42、UI判定部140、及び生成済モデルバッファ170が省略されている。
 顔モデルパラメータ生成部180は、HMD45に搭載されたユーザ20eの表情等を読みとるセンサからの情報に基づいて、ユーザ20eの顔モデルパラメータを生成する。例えばユーザ20eの目元を撮影した画像に基づいて、ユーザ20eの視線の向き、目の形状(輪郭)、及び眉の動き等が顔モデルパラメータとして生成される。顔モデルパラメータを生成する方法は限定されない。例えば目、鼻、及び口等の動きを検出可能な任意の表情認識技術が用いられてよい。
 顔モデル生成部181は、顔モデルパラメータに基づいて、ユーザ20eの顔モデルを生成する。例えば、ユーザ20eの顔の輪郭や目、鼻、口、及び耳等の各部位が再現された基準顔モデルが予め生成されて記憶される。そして顔モデル生成部181により、顔モデルパラメータと基準顔モデルとに基づいてユーザの顔モデルが生成される。
 ユーザ20eの基準顔モデルは、例えばHMD45を装着しない状態でユーザ20eの顔を撮影した2D画像等に基づいて生成される。また、ユーザ20eがモデル生成装置101を利用している途中からHMD45を使用し始めるといった状況も想定される。このような場合、HMD45を使用する直前に生成されたユーザ20eの3Dモデルに基づいて基準顔モデルが生成されてもよい。これにより直近のユーザ20eの状態に基づいて顔モデルを生成可能である。
 顔モデル生成部181は、顔モデルパラメータに基づいて基準顔モデルを変形することで、ユーザ20eの顔モデルを生成する。例えば顔モデルパラメータでの目の開き具合や眉の動き等に合わせて基準顔モデルが変形される。これによりユーザ20eがHMD45を装着している時の、ユーザ20eの表情等を再現した顔モデルが生成される。基準顔モデルを変形する方法等は限定されず、例えば人物の表情等を表現可能な任意のモデル等を使った3Dモデルの変形等が適宜用いられる。
 図17に示すように、HMD45を使用したユーザ20eの3Dモデル60eが生成される。置換制御部130により、置換条件情報162に基づいて、ステータスが合致するか否かが判定される。図18に示すように、本実施形態では、HMD45を利用中であることを知らせるステータス情報が置換制御部130に入力されると、ステータスが合致していると判定される。そして、2D画像において、HMD45の認識特徴量が合致するか否かが判定される。すなわちHMD45が認識可能であるか否かが判定される。
 HMD45が認識された場合には、該当する部分がマークされIDが付される。また人体が検出されマーク付け及びID付与が実行される。HMD45のマーク及びIDと、人体のマーク及びIDと、置換情報161とが、置換処理部120に送信される。そして置換処理121(第2の生成処理)が実行される。
 本例の置換対象情報163ではHMD45と頭部とが指定される。またモデル生成情報164には置換対象となる頭部を変更する方法が記憶される。モデル生成情報164として、例えば顔モデル生成部181により生成されたユーザ20eの顔モデルを使って、置換用の頭部のモデルを生成するといった指示が記憶される。
 置換処理部120により、置換対象情報163及びモデル生成情報164に基づいて、3Dモデル60e内のHMD45が削除される。また3Dモデル60eの頭部は、ユーザ20eの顔モデルに基づいて生成された頭部のモデルに置換される。これにより、ユーザ20eの表情等が再現された第2の仮想モデル30eが生成される。
 このように、第2の生成処理によりユーザ20eが使用するHMD45が削除された第2の仮想モデル30eが生成される。これにより、HMD45等を使用する場合であってもユーザ20eの表情が再現され、他のユーザとの円滑なコミュニケーション等を実現することが可能となる。従ってユーザ20eへの負担を軽減し、自然な仮想体験を提供することが可能となる。
 HMD45の他にも、ユーザ20eが装着する任意の装置等が検出されて、適宜置換処理が実行されてもよい。例えばヘッドホンや触覚等の感覚を再現する装置等が装着されている場合であっても、これらの装置が削除された第2の仮想モデルを生成することが可能である。
 図20は、第2の生成処理の他の例を示す模式図である。図21は、本例において参照される置換情報の一例を示す模式図である。図20に示す例では、プライバシーの保護が必要な状態にあるユーザ20fの3Dモデル60fに置換処理121が実行され、プライバシーが保護されるように変更された第2の仮想モデル30fが生成される。
 プライバシーの保護が必要な状態とは、例えばユーザ20fが着替え中、あるいは裸であるといった状態である。このような状態は、例えばユーザ20fを撮影した2D画像中での肌の露出量等を検出する画像処理を行うことで検出される。他にもユーザ20fが仮想空間V内で暗証番号等の入力を行う場合や、ユーザの個人情報に関する情報が撮影される場合が、プライバシーの保護が必要な状態に該当する。
 本例ではモデル生成装置100(図2参照)に図示しないプライバシー検出部が設けられる。プライバシー検出部は、2D画像または3Dモデル60fに基づいて、プライバシーの保護が必要な状態であるかを判定する。そしてプライバシーの保護が必要な状態が撮影された2D画像等を、プライバシー画像として検出する。例えば、2D画像中でのユーザ20fの肌の露出量が所定の閾値を超えた場合に、プライバシーの保護が必要な状態であると判定される。そしてその状態のユーザ20fが撮影された2D画像等が、プライバシー画像として検出される。
 プライバシー検出部からは、プライバシー画像についての検出状況が置換制御部130に出力される。すなわちプライバシー画像の検出開始、検出が継続中、検出終了等に関する情報が出力される。あるいは検出されたプライバシー画像や、プライバシーの保護が必要な部位についての情報等が出力されてもよい。
 置換制御部130は、プライバシー検出部から出力されたプライバシー画像の検出状況に基づいて、置換条件が合致するか否かを判定する。図21に示す置換条件情報162では、ユーザ20fがプライバシーの保護が必要な状態にあるか否かに関する置換条件として、プライバシー画像の検出状況についての項目が設定されている。プライバシー画像が検出されている場合には、プライバシーの保護が必要な状態であるとして、置換条件が満たされる。
 置換条件が満たされると判定された場合には、置換制御部130により2D画像等に基づいて人体が検出され、人体に対してマーク付け及びID付与が実行される。そして人体のマーク及びIDと置換情報161とが置換処理部120に送信され、置換処理121(第2の生成処理)が実行される。
 図20に示すように、本例の置換対象情報163では、置換対象として頭部以外の部位が指定される。すなわち、両手、両足、及び胴体が置換対象となる。またモデル生成情報164には、置換対象となる両手、両足、及び胴体を変更する方法が記憶される。モデル生成情報として、例えば置換対象となる部位をぼかして表示させるといった指示が記憶される。置換対象情報163及びモデル生成情報164に基づいて、3Dモデル60fの頭部以外の部位がぼかされた第2の仮想モデル30fが生成される。
 なお置換対象を変更する方法等は限定されない。例えば、置換対象となる部位にモザイクを入れる、過去の画像や3Dモデルに基づいて通常状態のモデルに置換する、予め用意されたモデルに置換する、所定のオブジェクトを表示(追加)して隠す、あるいは単に削除するといった様々な方法が用いられてよい。
 このように置換制御部130は、ユーザ20fがプライバシーの保護が必要な状態にあると判定された場合には、第2の生成処理の実行を選択する。そして第2の生成処理としてユーザ20fの少なくとも一部が変更された第2の仮想モデル30fが生成される。これによりユーザ20fのプライバシーが保護された第2の仮想モデル30fを生成可能となり、安心して仮想体験を楽しむことができる。
 なお置換等の対象となる部位が指定可能であってもよい。例えばプライバシー検出部により、2D画像等に基づいて、上半身や下半身、胸や腰等、プライバシーの保護対象となる部位が細かく判定されて指定されてもよい。この場合、例えば置換対象情報163及びモデル生成情報164として、プライバシー検出部により指定された部位に対して、ぼかす等の変更を行う旨の情報が記憶される。なおユーザ20fが着ているTシャツや、2D画像内に映ったカレンダー等に、裸体の写真等が載せられている場合等において、そこにモザイク等を施すといったことも可能である。
 仮想空間Vのシチュエーション等に応じて、プライバシー保護の必要性が判定されてもよい。例えば仮想空間V上において、銀行のATMやドア等の前に仮想モデル30fが立ち、暗証番号等を入力するシチュエーションの場合、他のユーザに対しては、テンキー等がぼかされた仮想空間Vが提供されてもよい。
 図22は、置換情報の他の例を示す模式図である。図22Aは、ジェスチャーによる操作入力が置換条件に含まれる置換情報161を示す模式図である。図22Bは、音声による操作入力が置換条件に含まれる置換情報161を示す模式図である。
 例えばユーザ20fのジェスチャー、音声、又はボタン等による操作入力等に基づいて、プライバシー保護のためのプライバシーモードに変更された場合に、モザイク等を施すといった上記の第2の生成処理が実行されてもよい。
 図22Aでは、ユーザ20fのプライバシー画像の候補が検出中であり、ジェスチャーによるプライバシーモードへの変更が認識されている場合に置換条件が満たされる。なお、プライバシー画像の候補とは、例えばプライバシー画像が満たす条件を満たしていない画像である。また図22Bでは、プライバシー画像の候補が検出中で、音声によるプライバシーモードへの変更が認識された場合に置換条件が満たされる。
 これによりユーザ20fは、ジェスチャー等を用いた操作入力を行うことで、明示的にプライバシーモード(第2の生成処理)に切替えることが可能となる。従って例えばプライバシー検出部がプライバシーの保護が必要な状態であると判定できないような状況であっても、ユーザ20fのプライバシーを十分に保護することが可能となる。
 図22A及び図22Bに示す例では、プライバシー画像の候補の検出、及びユーザ20fによるプライバシーモードの指示が、プライバシーの保護に必要な状態と判定するための条件となる。
 ユーザ20fによるプライバシーモードの指示がある場合には、プライバシー画像や、その候補の検出の有無にかかわらず、プライバシーの保護が必要な状態であると判定されてもよい。そして例えば肌の露出量等にかかわらず、ユーザ20fの頭部以外をぼかして表示する等の第2の生成処理が実行されてもよい。これによりユーザ20fの意図を十分に反映したプライバシーの保護を実現することが可能となる。
 プライバシー画像の検出によるプライバシーモードへの移行に加えて、ユーザ20fの指示によるプライバシーモードへの移行を可能とすることで、確実なプライバシー保護を実現することが可能となる。
 図23は、第2の生成処理の他の例を示す模式図である。図24は、本例において参照される置換情報の一例を示す模式図である。図23に示す例では、歩行コントローラ43を使用するユーザ20gの3Dモデル60gに置換処理121が実行され、歩行コントローラ43が他のオブジェクトに置換された第2の仮想モデル30gが生成される。
 図23に示すように、ユーザ20gは歩行コントローラ43を使って仮想空間V内での歩行動作等の指示を行う。図4に示した例では歩行動作の指示に基づいて、歩行コントローラ43が削除され歩行動作を行う第2の仮想モデル30aが生成された。本例では、歩行コントローラ43が他のオブジェクトに置換され歩行動作とは異なる移動状態が表現される。
 置換条件情報162に基づいて、ステータスが合致するか否かが判定される。歩行コントローラ43からの指示により歩行動作中であるというステータスが合致している場合、歩行コントローラ43が認識可能であるか否かが判定される。図24に示す置換情報161では、2D画像に基づいて、歩行コントローラ43の認識特徴量が合致するか否かが判定される。
 歩行コントローラ43が認識された場合には、3Dモデル60g上の該当する部分がマークされIDが付される。歩行コントローラ43のマーク及びIDと置換情報161とが、置換処理部120に送信される。そして置換処理121(第2の生成処理)が実行される。なお図24に示すように、置換対象情報163には人体についての情報が含まれない。従って例えば、3Dモデル60g上の人体に該当する部分等の検出は行われない。もちろん人体の認識の有無が置換条件に含まれてもよい。
 置換対象情報163では、置換対象として歩行コントローラ43が指定される。またモデル生成情報164には雲状のオブジェクト31が記録されている。置換対象情報163及びモデル生成情報に基づいて、3Dモデル60g上の歩行コントローラ43が雲状のオブジェクト31に置換された第2の仮想モデル30gが生成される。この場合、例えば3Dモデル60gの足元を覆うようにして雲状のオブジェクト31が配置されるような置換が行われる。
 例えば、雲状のオブジェクト31に乗った第2の仮想モデル30gが、ユーザ20gが指定する移動方向に移動することで、歩行動作に代わる移動動作が表現される。このように、歩行コントローラ43を雲状のオブジェクト31等に置換することで、仮想空間V内での所定の動作等を表すメタファーとして使用することが可能となる。この場合、人体についての置換処理121等を行う必要が無いため、効率的に移動動作等を表現することが可能となる。
 3Dモデル60gの少なくとも一部を他のオブジェクトに置換することで表現される動作や状態は限定されない。例えば、ユーザ20gが使用する片手持ちのコントローラが、拳銃のモデルや釣竿等に置換されてもよい。また両手持ちのコントローラが自動車等のハンドルに置換されてもよい。
 またユーザ20gが所定の動作を行った場合に、その動作に対応する置換処理121等が実行されてもよい。例えばユーザ20gが指先で拳銃の形を作る動作を行った場合に、その部分を拳銃のモデルに置換することが可能である。他にもそばを食べる動作が行われた場合にユーザ20gの持ち物をどんぶりと箸に置換したり、ユーザ20gが両手を動かして羽ばたく動作を行った場合に両手を羽に置換したりといった様々な置換処理121のバリエーションが実現されてよい。これによりユーザ20gは多様な仮想体験を十分に楽しむことが可能となる。
 図25は、第2の生成処理の他の例を説明するための図であり、仮想空間Vでの移動についての一例を示す模式図である。図25では複数のカメラ40によりユーザを撮影してユーザの仮想モデル30を生成する空間共有スポットSが模式的に図示されている。空間共有スポットSを利用することで、ユーザは仮想空間Vを体験することが可能となる。例えばユーザが空間共有スポットS内に入ると、ユーザの仮想モデル30が生成され、空間共有スポットSにデフォルトで設定された仮想空間V上に表示される。
 図25に示す例では、3つの空間共有スポットS1~S3が図示されている。これら空間共有スポットS1~S3に対して、原宿竹下通り、渋谷センター街、及び銀座中央通りを再現した仮想空間V1~V3がデフォルトで設定される。従って、ユーザが空間共有スポットS1を利用して仮想体験を始める場合には、原宿竹下通りを再現した仮想空間V1を体験することになる。
 こうした複数の仮想空間V1~V3を、実際の地図等に基づいて生成された静的な3D空間上に配置することが可能である。そして1つの空間共有スポットSを利用して、他の共有スポットSにデフォルトで設定された仮想空間Vに移動することも可能である。例えばユーザが空間共有スポットS1を利用して原宿竹下通りの仮想空間V1を体験しているとする。そのユーザが、実空間における原宿竹下通りから渋谷センター街までの道のりと同様の道のりを、仮想空間V1上で歩くことで、渋谷センター街が再現された仮想空間V2へ移動することが可能である。
 またこのような仮想空間V上での長距離移動を行う際には、例えば行き先を指定して瞬間的に移動(仮想空間移動)するといったことも可能である。例えば空間共有スポットS1を利用して原宿竹下通りの仮想空間V1を体験しているユーザが、渋谷センター街を指定して瞬間移動の指示を入力すると、瞬間的に渋谷センター街の仮想空間V2に切替えられる。
 図26Aは歩行動作が指示された場合の第2の生成処理の一例を示す模式図である。図26Bは、仮想空間移動が指示された場合の第2の生成処理の一例を示す模式図である。図27A及び図27Bは、それぞれ図26A及び図26Bで参照される置換情報の一例を示す模式図である。
 図26Aでは、ユーザ20hは空間共有スポットS2から仮想空間V2にログインを行い、ユーザ20hの仮想モデル30hが渋谷センター街を再現した仮想空間V2上に表示される。ユーザ20hは歩行コントローラ43を使用して歩行の指示等を出力することが可能である。
 置換制御部130により、図27Aに示す置換条件情報162に基づいてステータスが合致するか否かが判定される。歩行コントローラ43からの指示により歩行動作中であるというステータスが合致している場合、歩行コントローラ43が認識可能であるか否かが判定される。歩行コントローラ43が認識された場合には、3Dモデル60h上の歩行コントローラ43に該当する部分と人体に該当する部分とが検出され、それぞれにマーク付け及びID付与が実行される。
 歩行コントローラ43のマーク及びIDと、人体のマーク及びIDと、置換情報161とが、置換処理部120に送信される。そして置換処理121(第2の生成処理)が実行され、歩行動作を行う第2の仮想モデル30hが生成される。これによりユーザ20hは、第2の仮想モデル30hを介して仮想空間V2内を歩行して移動することが可能となる。
 図26Bでは、ユーザ20iは渋谷センター街を再現した仮想空間V2から、銀座中央通りを再現した仮想空間V3への瞬間的な仮想空間移動を行う。例えばユーザ20iは、銀座中央通り(仮想区間V3)へ移動する旨のフレーズを発話し音声による操作入力を実行する。この際、ユーザ20iは、歩行コントローラ43上でジャンプ等の所定の動作を行う。
 UI判定部140により音声による操作入力の内容等が判定され、UI判定結果及びUIイベントがアプリケーション51及び置換制御部130にそれぞれ送信される。また歩行コントローラ43により、ジャンプ動作の指示がアプリケーション51に出力される。
 アプリケーション51は、UI判定結果及び歩行コントローラ43からの情報に基づいて、ユーザ20i等の状況を判定する。本例では、ユーザ20iが仮想空間移動を要求していると判定される。アプリケーション51により、仮想空間移動中を表すステータス情報が生成され、当該ステータス情報が置換制御部130に送信される。
 置換制御部130により、図27Bに示す置換条件情報162に基づいてステータス及びUI判定の項目が合致するか否かが判定される。ユーザ20iが仮想空間移動を要求しておりジャンプ動作の指示が出力されているというステータスが合致し、音声認識結果が所定の内容と合致した場合、歩行コントローラ43が認識可能であるか否かが判定される。
 歩行コントローラ43が認識された場合には、該当する部分がマークされIDが付される。また人体が検出されマーク付け及びID付与が実行される。歩行コントローラ43のマーク及びIDと、人体のマーク及びIDと、置換情報161とが、置換処理部120に送信される。そして置換処理121(第2の生成処理)が実行される。
 図27Bに示す例では、置換対象情報163により歩行コントローラ43と人体の両手、両足、及び胴体とが置換対象として指定される。またモデル生成情報164には、仮想空間移動を表現する動作として飛行動作を行うモデルが格納される。置換処理部120により、3Dモデル60iの歩行コントローラ43が削除され、飛行動作を行う第2の仮想モデル30iが生成される。
 仮想空間移動の表現として、飛行動作の他にも様々な表現が実現されてもよい。例えば、モデル生成情報164として、アニメーション等で用いられるようなデフォルメされたポーズや効果等を表現するモデルが設定されてよい。これにより、実空間Sでは実現することが困難な動作等を容易に表現することが可能となる。
 このように、置換制御部130により歩行コントローラ43からの出力及び音声による操作入力に関する判定条件が判定され、第2の生成処理の実行が選択される。そして第2の生成処理により、ユーザの姿勢や動作が変更された第2の仮想モデル30iが生成される。これにより、仮想空間Vの間を瞬間的に移動するといった仮想空間Vに固有の動作を十分に表現することが可能となり、ユーザ20iの動作負担を軽減した仮想体験を提供することが可能となる。
 以上、本実施形態に係るモデル生成装置では、ユーザの画像に基づいてユーザのモデルを生成する生成処理として、互いに異なる第1及び第2の生成処理が実行可能である。これら第1及び第2の生成処理の各々の実行を適宜切替えることで、ユーザに自然な仮想体験を提供することが可能となる。
 仮想空間を共有するユーザ同士が、自身の像を互いに送りあってコミュニケーションを行う場合、所定の指示を入力するためのジェスチャー等、他のユーザとのコミュニケーションとは関係のない動作等が、仮想空間上で再現されてしまう場合がある。このような場合、仮想空間上でのユーザ(仮想モデル)の挙動が不自然となったり、他のユーザに知られたくない動作等が表示されてしまったりといった問題が生じる。
 本実施形態では、置換制御部130により第1及び第2の生成処理の実行の切替えが制御される。第1の生成処理では、ユーザの画像に含まれるユーザの状態が再現された第1の仮想モデルが生成される。また第2の生成処理では、ユーザの画像に含まれるユーザの状態の少なくとも一部が変更された第2の仮想モデルが生成される。
 これにより、実際に撮影されているユーザの状態をそのまま再現したモデル(第1の仮想モデル)と、ユーザの状態を適宜変更して再現したモデル(第2の仮想モデル)とを切替えて表示することが可能となる。従って、一時的なUI操作や移動操作に伴うジェスチャー等の、他のユーザには一時的に見せたくない自身の像の一部を置き換えて表示させることが可能となる。
 また第1及び第2の生成処理の実行の切替えの制御は、様々なシチュエーションに対応した複数の置換条件に基づいて実行される。これにより、置換処理をその時の状況等に合わせて動的に行うことが可能となる。また置換条件には、ユーザの状態の少なくとも一部を変更する方法が関連付けられて記憶されている。従って、各シチュエーションに応じた適切な変更等が実行され、ユーザの動作等をより自然に表現することが可能となる。
 <その他の実施形態>
 本技術は、以上説明した実施形態に限定されず、他の種々の実施形態を実現することができる。
 上記では、置換条件が満たされた場合に、第1の生成処理から第2の生成処理に切替えられ、ユーザの状態が変更された第2の仮想モデルが生成されて表示された。これに限定されず、第2の仮想モデルをデフォルトで表示し、所定の復元条件が満たされた場合に、第1の生成処理に切替えられ、ユーザの状態をそのまま再現した第1の仮想モデルが生成されて表示されてもよい。
 例えばデフォルトの第2の仮想モデルとして、ユーザの左手が置換されたモデルが生成される。すなわちユーザの実際の左手の動きがどのようなものであっても、仮想空間上では、ユーザの全体の動作や姿勢に応じて自然に動く左手が表現される。例えば歩行/走行動作に応じた自然な腕のふり、直立/座位の姿勢に応じた自然な左手の構え、等である。これによりユーザは左手を使って、ジェスチャー等を含むローカルな操作等を、他のユーザに知られることなく行うことが可能となる。
 復元条件としては、種々の条件が考えられる。例えば両手を用いた動作が必要なシチュエーション等が発生する場合には、復元条件が満たされて、第1の生成処理に切替えられる。これにより左右の手の動きがそのまま再現された第1の仮想モデルが表示される。またボタン操作、音声、ジェスチャー等を介したユーザの指示の有無が、復元条件として設定されてよい。例えばデフォルトの置換対象である左手を使った所定のジェスチャーの有無等が考えられる。これにより、ユーザの所望するタイミングで両手の動作等を反映した第1の仮想モデルに切替えることが可能である。
 第1の生成処理に切替えられた後に、例えば所定の時間が経過すると自動的にデフォルトの置換処理(第2の生成処理)に切替えるといった設定も可能である。これにより他のユーザに気づかれることなく、再びダミーの左手に切替えることが可能となる。このように、第2の生成処理をデフォルトに設定することで、ユーザは他のユーザへの見え方等を気にせずにローカルな操作等を行うことが可能となる。
 なお置換条件に基づいて第2の生成処理へ切替える場合に、所定の時間の経過後に第1の生成処理へ戻す処理が適宜実行されてもよい。
 複数の置換条件が同時に成立する場合には、より広範な置換が行われる条件を優先して置換処理を実行してもよい。例えば両足の置換を行う条件と、両足及び両手の置換を行う条件とでは、後者のほうが優先されてもよい。これにより複数の置換えが同時に行われて不自然な仮想モデルが表示されることを防止することが可能である。
 上記した実施形態では、ユーザ等の状態がそのまま再現された第1の仮想モデルを生成する第1の生成処理と、ユーザ等の状態の少なくとも一部が変更された第2の仮想モデルを生成する第2の生成処理とが適宜切替えられた。これに限定されず、第1及び第2の生成処理として互いに異なる処理であれば、どのような処理が実行されてもよい。
 例えば第1の生成処理として、ユーザ等の3Dモデルに対して第1の置換処理が実行されて第1の仮想モデルが生成される。そして第2の生成処理として、ユーザ等の3Dモデルに対して第1の置換処理とは異なる第2の置換処理が実行されて第2の仮想モデルが生成される。すなわち第1及び第2の生成処理として、互いに異なる置換処理が実行されてもよい。例えば第1の生成処理(第1の置換処理)はオブジェクトの変更処理であり、第2の生成処理(第2の置換処理)は人体の変更処理等が考えられるが、もちろんこれに限定される訳ではない。
 また3以上の互いに異なる複数の生成処理が切替え可能に実行されてもよい。例えば第1~第3の生成処理や、第1~第4の生成処理等が、条件等に応じて、切替え可能に実行されてもよい。
 図2等に示すように、上記の実施形態では、3Dモデル生成部110と、置換処理部120と、置換制御部130とが協働することで、生成部が実現された。また置換制御部130が、生成制御部としても機能した。この構成に限定されず、例えば3Dモデル生成部110、置換処理部120、及び置換制御部130の各々の機能を統合したブロックが構成されてもよい。あるいはこれらのブロックの機能を任意に分割して、複数のブロックに担当させてもよい。例えば置換処理部120及び置換制御部130が統合されたブロックと、3Dモデル生成部110とにより、生成部が実現されてもよい。その他、任意の構成が可能である。
 上記では、仮想現実VR(Virtual Reality)を表現した仮想空間上に表示されるモデルを生成する処理等が行われた。例えば拡張現実AR(Augmented Reality)や複合現実MR(Mixed Reality)が表現される空間上にモデルを表示する場合であっても本技術は適用可能である。
 上記ではユーザにより操作されるPC等のコンピュータにより、本技術に係る情報処理方法が実行される場合を説明した。しかしながらユーザが操作するコンピュータとネットワーク等を介して通信可能な他のコンピュータにより、本技術に係る情報処理方法、及びプログラムが実行されてもよい。またユーザが操作するコンピュータと、他のコンピュータとが連動して、本技術に係るシミュレーションシステムが構築されてもよい。
 すなわち本技術に係る情報処理方法、及びプログラムは、単体のコンピュータにより構成されたコンピュータシステムのみならず、複数のコンピュータが連動して動作するコンピュータシステムにおいても実行可能である。なお本開示において、システムとは、複数の構成要素(装置、モジュール(部品)等)の集合を意味し、すべての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、1つの筐体の中に複数のモジュールが収納されている1つの装置は、いずれもシステムである。
 コンピュータシステムによる本技術に係る情報処理方法、及びプログラムの実行は、例えば第1の生成処理、第2の生成処理、及び各生成処理の実行の切替えの制御等が、単体のコンピュータにより実行される場合、及び各処理が異なるコンピュータにより実行される場合の両方を含む。また所定のコンピュータによる各処理の実行は、当該処理の一部または全部を他のコンピュータに実行させその結果を取得することを含む。
 すなわち本技術に係る情報処理方法及びプログラムは、1つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成にも適用することが可能である。
 以上説明した本技術に係る特徴部分のうち、少なくとも2つの特徴部分を組み合わせることも可能である。すなわち各実施形態で説明した種々の特徴部分は、各実施形態の区別なく、任意に組み合わされてもよい。また上記で記載した種々の効果は、あくまで例示であって限定されるものではなく、また他の効果が発揮されてもよい。
 なお、本技術は以下のような構成も採ることができる。
(1)対象物の画像を取得する取得部と、
 前記取得された前記対象物の画像に基づいて前記対象物のモデルを生成する生成処理として、第1の生成処理、及び前記第1の生成処理と異なる第2の生成処理の各々を実行可能な生成部と、
 前記生成部による前記第1の生成処理の実行及び前記第2の生成処理の実行の切替えを制御する生成制御部と
 を具備する情報処理装置。
(2)(1)に記載の情報処理装置であって、
 前記第1の生成処理は、第1の再現性にて前記対象物が再現された第1のモデルを生成し、
 前記第2の生成処理は、前記第1の再現性よりも低い第2の再現性にて前記対象物が再現された第2のモデルを生成する
 情報処理装置。
(3)(2)に記載の情報処理装置であって、
 前記第1の生成処理は、前記対象物の画像に含まれる前記対象物の状態が再現された前記第1のモデルを生成し、
 前記第2の生成処理は、前記対象物の画像に含まれる前記対象物の状態の少なくとも一部が変更された前記第2のモデルを生成する
 情報処理装置。
(4)(2)又は(3)に記載の情報処理装置であって、
 前記第2の生成処理は、前記対象物の少なくとも一部が置換、又は削除された前記第2のモデルを生成する
 情報処理装置。
(5)(3)又は(4)に記載の情報処理装置であって、
 前記対象物は、人物、及びその人物が使用する物を含む
 情報処理装置。
(6)(5)に記載の情報処理装置であって、
 前記第2の生成処理は、前記人物の表情、姿勢、及び動作の少なくとも1つの状態が変更された前記第2のモデルを生成する
 情報処理装置。
(7)(5)または(6)に記載の情報処理装置であって、
 前記第2の生成処理は、前記人物が使用する物が置換、又は削除された前記第2のモデルを生成する
 情報処理装置。
(8)(2)から(7)のうちいずれか1つに記載の情報処理装置であって、
 前記生成部は、前記第1及び前記第2の生成処理の各々の実行が切替えられる際に、前記第1及び前記第2のモデルの各々へ切替えるための遷移状態が表現された前記第1及び前記第2のモデルをそれぞれ生成する
 情報処理装置。
(9)(5)から(8)のうちいずれか1つに記載の情報処理装置であって、
 前記生成制御部は、前記対象物の状態の少なくとも一部を変更するか否かの判定条件を含む判定情報に基づいて、前記生成部による前記第1の生成処理の実行及び前記第2の生成処理の実行の切替えを制御する
 情報処理装置。
(10)(9)に記載の情報処理装置であって、
 前記判定条件は、前記人物が使用するコントローラからの出力、前記人物の画像、及び前記人物の音声の少なくとも1つに関する条件を含む
 情報処理装置。
(11)(3)から(10)のうちいずれか1つに記載の情報処理装置であって、
 前記生成制御部は、所定の動作の指示が入力された場合には、前記第2の生成処理の実行を選択し、
 前記生成部は、前記第2の生成処理として、前記所定の動作を実行する前記第2のモデルを生成する
 情報処理装置。
(12)(11)に記載の情報処理装置であって、
 前記生成部は、前記第2の生成処理として、前記所定の動作へ遷移する動作を実行する前記第2のモデルを生成する
 情報処理装置。
(13)(9)から(12)のうちいずれか1つに記載の情報処理装置であって、
 前記判定条件は、前記人物のジェスチャーによる操作入力、及び音声による操作入力の少なくとも一方に関する条件を含む
 情報処理装置。
(14)(13)に記載の情報処理装置であって、
 前記生成制御部は、前記ジェスチャーによる操作入力、及び前記音声による操作入力が受付けられた場合には、前記第2の生成処理の実行を選択し、
 前記生成部は、前記第2の生成処理として、前記ジェスチャー及び前記音声の発話動作を実行しない前記第2のモデルを生成する
 情報処理装置。
(15)(9)から(14)のうちいずれか1つに記載の情報処理装置であって、
 前記判定条件は、前記人物がプライバシーの保護が必要な状態にあるか否かに関する条件を含む
 情報処理装置。
(16)(15)に記載の情報処理装置であって、
 前記生成制御部は、前記人物がプライバシーの保護が必要な状態にあると判定された場合には、前記第2の生成処理の実行を選択し、
 前記生成部は、前記第2の生成処理として、前記人物の少なくとも一部が変更された前記第2のモデルを生成する
 情報処理装置。
(17)(9)から(16)のうちいずれか1つに記載の情報処理装置であって、
 前記判定情報は、前記判定条件に関連付けられた前記対象物の状態の少なくとも一部を変更する方法を含み、
 前記生成部は、前記判定情報に基づいて前記第2の生成処理を実行する
 情報処理装置。
(18)(17)に記載の情報処理装置であって、
 前記判定情報は、前記対象物の変更対象となる部位を特定するための特定情報と、前記特定された前記変更対象となる部位を変更する方法とを含む
 情報処理装置。
 V、V1~V3…仮想空間
 10、11…仮想空間生成システム
 20、20a~20i…ユーザ
 30…仮想モデル
 30a~30i…第2の仮想モデル
 40…カメラ
 41…マイク
 43…歩行コントローラ
 44…手持ちコントローラ
 45…HMD
 50…仮想空間生成装置
 51…アプリケーション
 60a~60i…3Dモデル
 100、101…モデル生成装置
 110…3Dモデル生成部
 120…置換処理部
 121…置換処理
 130…置換制御部
 140…UI判定部
 141…ジェスチャー認識部
 142…音声認識部
 143…判定部
 160…置換情報DB
 161…置換情報
 162…置換条件情報
 163…置換対象情報
 164…モデル生成情報

Claims (20)

  1.  対象物の画像を取得する取得部と、
     前記取得された前記対象物の画像に基づいて前記対象物のモデルを生成する生成処理として、第1の生成処理、及び前記第1の生成処理と異なる第2の生成処理の各々を実行可能な生成部と、
     前記生成部による前記第1の生成処理の実行及び前記第2の生成処理の実行の切替えを制御する生成制御部と
     を具備する情報処理装置。
  2.  請求項1に記載の情報処理装置であって、
     前記第1の生成処理は、第1の再現性にて前記対象物が再現された第1のモデルを生成し、
     前記第2の生成処理は、前記第1の再現性よりも低い第2の再現性にて前記対象物が再現された第2のモデルを生成する
     情報処理装置。
  3.  請求項2に記載の情報処理装置であって、
     前記第1の生成処理は、前記対象物の画像に含まれる前記対象物の状態が再現された前記第1のモデルを生成し、
     前記第2の生成処理は、前記対象物の画像に含まれる前記対象物の状態の少なくとも一部が変更された前記第2のモデルを生成する
     情報処理装置。
  4.  請求項2に記載の情報処理装置であって、
     前記第2の生成処理は、前記対象物の少なくとも一部が置換、又は削除された前記第2のモデルを生成する
     情報処理装置。
  5.  請求項3に記載の情報処理装置であって、
     前記対象物は、人物、及びその人物が使用する物を含む
     情報処理装置。
  6.  請求項5に記載の情報処理装置であって、
     前記第2の生成処理は、前記人物の表情、姿勢、及び動作の少なくとも1つの状態が変更された前記第2のモデルを生成する
     情報処理装置。
  7.  請求項5に記載の情報処理装置であって、
     前記第2の生成処理は、前記人物が使用する物が置換、又は削除された前記第2のモデルを生成する
     情報処理装置。
  8.  請求項2に記載の情報処理装置であって、
     前記生成部は、前記第1及び前記第2の生成処理の各々の実行が切替えられる際に、前記第1及び前記第2のモデルの各々へ切替えるための遷移状態が表現された前記第1及び前記第2のモデルをそれぞれ生成する
     情報処理装置。
  9.  請求項5に記載の情報処理装置であって、
     前記生成制御部は、前記対象物の状態の少なくとも一部を変更するか否かの判定条件を含む判定情報に基づいて、前記生成部による前記第1の生成処理の実行及び前記第2の生成処理の実行の切替えを制御する
     情報処理装置。
  10.  請求項9に記載の情報処理装置であって、
     前記判定条件は、前記人物が使用するコントローラからの出力、前記人物の画像、及び前記人物の音声の少なくとも1つに関する条件を含む
     情報処理装置。
  11.  請求項3に記載の情報処理装置であって、
     前記生成制御部は、所定の動作の指示が入力された場合には、前記第2の生成処理の実行を選択し、
     前記生成部は、前記第2の生成処理として、前記所定の動作を実行する前記第2のモデルを生成する
     情報処理装置。
  12.  請求項11に記載の情報処理装置であって、
     前記生成部は、前記第2の生成処理として、前記所定の動作へ遷移する動作を実行する前記第2のモデルを生成する
     情報処理装置。
  13.  請求項9に記載の情報処理装置であって、
     前記判定条件は、前記人物のジェスチャーによる操作入力、及び音声による操作入力の少なくとも一方に関する条件を含む
     情報処理装置。
  14.  請求項13に記載の情報処理装置であって、
     前記生成制御部は、前記ジェスチャーによる操作入力、及び前記音声による操作入力が受付けられた場合には、前記第2の生成処理の実行を選択し、
     前記生成部は、前記第2の生成処理として、前記ジェスチャー及び前記音声の発話動作を実行しない前記第2のモデルを生成する
     情報処理装置。
  15.  請求項9に記載の情報処理装置であって、
     前記判定条件は、前記人物がプライバシーの保護が必要な状態にあるか否かに関する条件を含む
     情報処理装置。
  16.  請求項15に記載の情報処理装置であって、
     前記生成制御部は、前記人物がプライバシーの保護が必要な状態にあると判定された場合には、前記第2の生成処理の実行を選択し、
     前記生成部は、前記第2の生成処理として、前記人物の少なくとも一部が変更された前記第2のモデルを生成する
     情報処理装置。
  17.  請求項9に記載の情報処理装置であって、
     前記判定情報は、前記判定条件に関連付けられた前記対象物の状態の少なくとも一部を変更する方法を含み、
     前記生成部は、前記判定情報に基づいて前記第2の生成処理を実行する
     情報処理装置。
  18.  請求項17に記載の情報処理装置であって、
     前記判定情報は、前記対象物の変更対象となる部位を特定するための特定情報と、前記特定された前記変更対象となる部位を変更する方法とを含む
     情報処理装置。
  19.  対象物の画像を取得し、
     前記取得された前記対象物の画像に基づいて前記対象物のモデルを生成する生成処理として、第1の生成処理、及び前記第1の生成処理と異なる第2の生成処理の各々を実行し、
     前記第1の生成処理の実行及び前記第2の生成処理の実行の切替えを制御する
     ことをコンピュータシステムが実行する情報処理方法。
  20.  対象物の画像を取得するステップと、
     前記取得された前記対象物の画像に基づいて前記対象物のモデルを生成する生成処理として、第1の生成処理、及び前記第1の生成処理と異なる第2の生成処理の各々を実行するステップと、
     前記第1の生成処理の実行及び前記第2の生成処理の実行の切替えを制御するステップと
     をコンピュータシステムに実行させるプログラム。
PCT/JP2018/000426 2017-01-26 2018-01-11 情報処理装置、情報処理方法、及びプログラム WO2018139203A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US16/478,235 US10943383B2 (en) 2017-01-26 2018-01-11 Information processing apparatus and information processing method
JP2018564465A JP7070435B2 (ja) 2017-01-26 2018-01-11 情報処理装置、情報処理方法、及びプログラム
US17/173,835 US11288854B2 (en) 2017-01-26 2021-02-11 Information processing apparatus and information processing method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2017012308 2017-01-26
JP2017-012308 2017-01-26

Related Child Applications (2)

Application Number Title Priority Date Filing Date
US16/478,235 A-371-Of-International US10943383B2 (en) 2017-01-26 2018-01-11 Information processing apparatus and information processing method
US17/173,835 Continuation US11288854B2 (en) 2017-01-26 2021-02-11 Information processing apparatus and information processing method

Publications (1)

Publication Number Publication Date
WO2018139203A1 true WO2018139203A1 (ja) 2018-08-02

Family

ID=62978314

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2018/000426 WO2018139203A1 (ja) 2017-01-26 2018-01-11 情報処理装置、情報処理方法、及びプログラム

Country Status (3)

Country Link
US (2) US10943383B2 (ja)
JP (1) JP7070435B2 (ja)
WO (1) WO2018139203A1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020135428A (ja) * 2019-02-20 2020-08-31 株式会社ドワンゴ 位置データ処理装置およびプログラム
JP2020163509A (ja) * 2019-03-29 2020-10-08 株式会社国際電気通信基礎技術研究所 シミュレーションシステム、シミュレーションプログラムおよび学習装置
JP2021057017A (ja) * 2020-07-16 2021-04-08 株式会社バーチャルキャスト コンテンツ配信システム、コンテンツ配信方法、及びコンテンツ配信プログラム
JP2023524252A (ja) * 2020-04-30 2023-06-09 グーグル エルエルシー 生成的非線形人間形状モデル
WO2024013949A1 (ja) * 2022-07-14 2024-01-18 富士通株式会社 生成プログラム、生成方法および情報処理装置

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11995854B2 (en) * 2018-12-19 2024-05-28 Nvidia Corporation Mesh reconstruction using data-driven priors
JP7060157B2 (ja) * 2019-03-14 2022-04-26 日本電信電話株式会社 データ圧縮装置、データ圧縮方法、及びプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006217161A (ja) * 2005-02-02 2006-08-17 Advanced Telecommunication Research Institute International 画像撮影システム
JP2012252437A (ja) * 2011-06-01 2012-12-20 Sony Corp 画像処理装置、画像処理方法、およびプログラム
JP2013508866A (ja) * 2009-10-23 2013-03-07 マイクロソフト コーポレーション ディスプレイ環境の装飾
JP2013533537A (ja) * 2010-06-02 2013-08-22 マイクロソフト コーポレーション アバター・ジェスチャーの表示制限

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7796733B2 (en) * 2007-02-01 2010-09-14 Rapiscan Systems, Inc. Personnel security screening system with enhanced privacy
EP2132650A4 (en) 2007-03-01 2010-10-27 Sony Comp Entertainment Us SYSTEM AND METHOD FOR COMMUNICATING WITH A VIRTUAL WORLD
US9646340B2 (en) * 2010-04-01 2017-05-09 Microsoft Technology Licensing, Llc Avatar-based virtual dressing room
JP5845830B2 (ja) * 2011-11-09 2016-01-20 ソニー株式会社 情報処理装置、表示制御方法、およびプログラム
CN104345350A (zh) * 2013-07-23 2015-02-11 清华大学 人体安全检查方法和人体安全检查系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006217161A (ja) * 2005-02-02 2006-08-17 Advanced Telecommunication Research Institute International 画像撮影システム
JP2013508866A (ja) * 2009-10-23 2013-03-07 マイクロソフト コーポレーション ディスプレイ環境の装飾
JP2013533537A (ja) * 2010-06-02 2013-08-22 マイクロソフト コーポレーション アバター・ジェスチャーの表示制限
JP2012252437A (ja) * 2011-06-01 2012-12-20 Sony Corp 画像処理装置、画像処理方法、およびプログラム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020135428A (ja) * 2019-02-20 2020-08-31 株式会社ドワンゴ 位置データ処理装置およびプログラム
JP2020163509A (ja) * 2019-03-29 2020-10-08 株式会社国際電気通信基礎技術研究所 シミュレーションシステム、シミュレーションプログラムおよび学習装置
JP7258426B2 (ja) 2019-03-29 2023-04-17 株式会社国際電気通信基礎技術研究所 シミュレーションシステム、シミュレーションプログラムおよび学習装置
JP2023524252A (ja) * 2020-04-30 2023-06-09 グーグル エルエルシー 生成的非線形人間形状モデル
JP7378642B2 (ja) 2020-04-30 2023-11-13 グーグル エルエルシー 生成的非線形人間形状モデル
JP2021057017A (ja) * 2020-07-16 2021-04-08 株式会社バーチャルキャスト コンテンツ配信システム、コンテンツ配信方法、及びコンテンツ配信プログラム
JP7291106B2 (ja) 2020-07-16 2023-06-14 株式会社バーチャルキャスト コンテンツ配信システム、コンテンツ配信方法、及びコンテンツ配信プログラム
WO2024013949A1 (ja) * 2022-07-14 2024-01-18 富士通株式会社 生成プログラム、生成方法および情報処理装置

Also Published As

Publication number Publication date
JPWO2018139203A1 (ja) 2019-12-12
US10943383B2 (en) 2021-03-09
US20190362530A1 (en) 2019-11-28
US20210166460A1 (en) 2021-06-03
JP7070435B2 (ja) 2022-05-18
US11288854B2 (en) 2022-03-29

Similar Documents

Publication Publication Date Title
JP7070435B2 (ja) 情報処理装置、情報処理方法、及びプログラム
US11398067B2 (en) Virtual reality presentation of body postures of avatars
US10922865B2 (en) Information processing apparatus, information processing method, and program
US10916044B2 (en) Information processing apparatus, information processing method, and program
JP6244593B1 (ja) 情報処理方法、装置、および当該情報処理方法をコンピュータに実行させるためのプログラム
JP7504968B2 (ja) アバター表示装置、アバター生成装置及びプログラム
JP6263252B1 (ja) 情報処理方法、装置、および当該情報処理方法をコンピュータに実行させるためのプログラム
US20190197755A1 (en) Producing realistic talking Face with Expression using Images text and voice
WO2018150831A1 (ja) 情報処理装置、情報処理方法及び記録媒体
KR20130080442A (ko) 표정의 실시간 애니메이션화
KR102148151B1 (ko) 디지털 커뮤니케이션 네트워크에 기반한 지능형 채팅
US20140068526A1 (en) Method and apparatus for user interaction
JP2022111142A (ja) コンピュータプログラム、サーバ装置及び方法
US20190302880A1 (en) Device for influencing virtual objects of augmented reality
US10580186B2 (en) Preventing transition shocks during transitions between realities
JP7479618B2 (ja) 情報処理プログラム、情報処理方法、情報処理装置
JP2021068404A (ja) アバターの顔の表情生成システムおよびアバターの顔の表情生成方法
JP2018089228A (ja) 情報処理方法、装置、および当該情報処理方法をコンピュータに実行させるためのプログラム
JPWO2019155735A1 (ja) 情報処理装置、情報処理方法及びプログラム
CN106502401B (zh) 一种图像控制方法及装置
US11182976B2 (en) Device for influencing virtual objects of augmented reality
JP2018092635A (ja) 情報処理方法、装置、および当該情報処理方法をコンピュータに実行させるためのプログラム
JP2018092592A (ja) 情報処理方法、装置、および当該情報処理方法をコンピュータに実行させるためのプログラム
Malerczyk Gestural interaction using feature classification
CN116868152A (zh) 用于在三维环境中呈现化身的界面

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18745300

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2018564465

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 18745300

Country of ref document: EP

Kind code of ref document: A1