WO2021145243A1 - Program, method executed by computer, and computer - Google Patents

Program, method executed by computer, and computer Download PDF

Info

Publication number
WO2021145243A1
WO2021145243A1 PCT/JP2021/000155 JP2021000155W WO2021145243A1 WO 2021145243 A1 WO2021145243 A1 WO 2021145243A1 JP 2021000155 W JP2021000155 W JP 2021000155W WO 2021145243 A1 WO2021145243 A1 WO 2021145243A1
Authority
WO
WIPO (PCT)
Prior art keywords
user
avatar
hmd
virtual space
image
Prior art date
Application number
PCT/JP2021/000155
Other languages
French (fr)
Japanese (ja)
Inventor
一晃 澤木
Original Assignee
株式会社コロプラ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社コロプラ filed Critical 株式会社コロプラ
Publication of WO2021145243A1 publication Critical patent/WO2021145243A1/en

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/55Controlling game characters or game objects based on the game progress
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T19/00Manipulating 3D models or images for computer graphics

Definitions

  • the present invention relates to a program, a method executed by a computer, and a computer.
  • the avatar's face may crumble.
  • the cause is that the displacement of the head mount device and the deformation of the face when the user touches it are reflected on the face of the avatar.
  • Such face collapse of the avatar can be corrected by performing a calibration to standardize the face.
  • a field of view image from the user's point of view.
  • Such a first-person view image includes the avatar of the chat partner, but does not include the user's own avatar. Since it is not possible to determine from the field of view image whether or not the face of the user's avatar is broken, the user had to perform an operation instructing the execution of calibration one by one when the chat partner pointed out that the face was broken. ..
  • An object of the present invention is to calibrate the face of an avatar at an appropriate timing without any user operation.
  • a step of defining a virtual space, a step of arranging a first avatar associated with the first user on the virtual space, and a step of detecting a facial expression of the first user are satisfied.
  • a step of performing the calibration and a program for causing the computer to perform the calibration are provided.
  • the face of the avatar can be calibrated at an appropriate timing without any user operation.
  • FIG. 1 It is a figure which shows the outline of the structure of the HMD system according to a certain embodiment. It is a block diagram which shows an example of the hardware composition of the computer according to a certain embodiment. It is a figure which conceptually represents the uvw field-of-view coordinate system set in the HMD according to a certain embodiment. It is a figure that conceptually represents one aspect of expressing a virtual space according to a certain embodiment. It is a figure which showed the head of the user who wears an HMD according to a certain embodiment from the top. It is a figure which shows the YZ cross section which looked at the visual field area from the X direction in the virtual space.
  • FIG. 5 is a sequence chart representing a portion of the processing performed in an HMD set according to an embodiment. It is a schematic diagram which shows the situation that each HMD provides a virtual space to a user in a network.
  • FIG. 12A It is a figure which shows the field of view image of the user 5A in FIG. 12A. It is a sequence diagram which shows the process to perform in the HMD system according to a certain embodiment. It is a block diagram which shows the detailed structure of the module of the computer according to a certain embodiment. It is a figure explaining the process of detecting a mouth from a user's face image. It is a figure (the 1) explaining the process which the face organ detection module detects the shape of a mouth. It is a figure (the 2) explaining the process which the face organ detection module detects the shape of a mouth. It is a figure which shows an example of the structure of face tracking data. It is a flowchart which shows the process performed by the computer according to a certain embodiment.
  • FIG. 1 is a diagram showing an outline of the configuration of the HMD system 100 according to the present embodiment.
  • the HMD system 100 is provided as a home system or a business system.
  • the HMD system 100 includes a server 600, HMD sets 110A, 110B, 110C, 110D, an external device 700, and a network 2.
  • Each of the HMD sets 110A, 110B, 110C, and 110D is configured to be able to communicate with the server 600 and the external device 700 via the network 2.
  • the HMD set 110A, 110B, 110C, 110D are collectively referred to as the HMD set 110.
  • the number of HMD sets 110 constituting the HMD system 100 is not limited to four, and may be three or less or five or more.
  • the HMD set 110 includes an HMD 120, a computer 200, an HMD sensor 410, a display 430, and a controller 300.
  • the HMD 120 includes a monitor 130, a gaze sensor 140, a first camera 150, a second camera 160, a microphone 170, and a speaker 180.
  • the controller 300 may include a motion sensor 420.
  • the computer 200 can connect to the Internet or other network 2 and communicate with the server 600 or other computer connected to the network 2. Examples of other computers include computers of other HMD sets 110 and external devices 700.
  • the HMD 120 may include a sensor 190 instead of the HMD sensor 410.
  • the HMD 120 may be worn on the head of the user 5 and provide the user 5 with a virtual space during operation. More specifically, the HMD 120 displays an image for the right eye and an image for the left eye on the monitor 130, respectively. When each eye of the user 5 visually recognizes the respective image, the user 5 can recognize the image as a three-dimensional image based on the parallax of both eyes.
  • the HMD 120 may include either a so-called head-mounted display having a monitor and a head-mounted device to which a smartphone or other terminal having a monitor can be attached.
  • the monitor 130 is realized as, for example, a non-transparent display device.
  • the monitor 130 is arranged in the body of the HMD 120 so that it is located in front of both eyes of the user 5. Therefore, the user 5 can immerse himself in the virtual space when he / she visually recognizes the three-dimensional image displayed on the monitor 130.
  • the virtual space includes, for example, a background, an object that the user 5 can manipulate, and an image of a menu that the user 5 can select.
  • the monitor 130 can be realized as a liquid crystal monitor or an organic EL (Electro Luminescence) monitor included in a so-called smartphone or other information display terminal.
  • the monitor 130 can be realized as a transmissive display device.
  • the HMD 120 may be an open type such as a glasses type rather than a closed type that covers the eyes of the user 5 as shown in FIG.
  • the transmissive monitor 130 may be temporarily configured as a non-transparent display device by adjusting its transmittance.
  • the monitor 130 may include a configuration that simultaneously displays a part of the image constituting the virtual space and the real space.
  • the monitor 130 may display an image of the real space taken by the camera mounted on the HMD 120, or may make the real space visible by setting a part of the transmittance to be high.
  • the monitor 130 may include a sub-monitor for displaying an image for the right eye and a sub-monitor for displaying an image for the left eye.
  • the monitor 130 may be configured to display the image for the right eye and the image for the left eye as a unit.
  • the monitor 130 includes a high speed shutter. The high-speed shutter operates so that the image for the right eye and the image for the left eye can be alternately displayed so that the image is recognized by only one of the eyes.
  • the HMD 120 includes a plurality of light sources (not shown). Each light source is realized by, for example, an LED (Light Emitting Diode) that emits infrared rays.
  • the HMD sensor 410 has a position tracking function for detecting the movement of the HMD 120. More specifically, the HMD sensor 410 reads a plurality of infrared rays emitted by the HMD 120 and detects the position and inclination of the HMD 120 in the real space.
  • the HMD sensor 410 may be implemented by a camera.
  • the HMD sensor 410 can detect the position and tilt of the HMD 120 by executing the image analysis process using the image information of the HMD 120 output from the camera.
  • the HMD 120 may include a sensor 190 as a position detector in place of the HMD sensor 410 or in addition to the HMD sensor 410.
  • the HMD 120 can use the sensor 190 to detect the position and tilt of the HMD 120 itself.
  • the sensor 190 is an angular velocity sensor, a geomagnetic sensor, or an accelerometer
  • the HMD 120 may use any of these sensors instead of the HMD sensor 410 to detect its position and tilt.
  • the angular velocity sensor detects the angular velocity around the three axes of the HMD 120 in real space over time.
  • the HMD 120 calculates the temporal change of the angle around the three axes of the HMD 120 based on each angular velocity, and further calculates the inclination of the HMD 120 based on the temporal change of the angle.
  • the gaze sensor 140 detects the directions in which the eyes of the user 5's right eye and left eye are directed. That is, the gaze sensor 140 detects the line of sight of the user 5.
  • the detection of the direction of the line of sight is realized by, for example, a known eye tracking function.
  • the gaze sensor 140 is realized by a sensor having the eye tracking function.
  • the gaze sensor 140 preferably includes a sensor for the right eye and a sensor for the left eye.
  • the gaze sensor 140 may be, for example, a sensor that irradiates the right eye and the left eye of the user 5 with infrared light and detects the angle of rotation of each eyeball by receiving the reflected light from the cornea and the iris with respect to the irradiation light. ..
  • the gaze sensor 140 can detect the line of sight of the user 5 based on each of the detected rotation angles.
  • the first camera 150 captures the lower part of the user 5's face. More specifically, the first camera 150 captures the nose, mouth, and the like of the user 5.
  • the second camera 160 captures the eyes, eyebrows, and the like of the user 5.
  • the housing on the user 5 side of the HMD 120 is defined as the inside of the HMD 120, and the housing on the side opposite to the user 5 of the HMD 120 is defined as the outside of the HMD 120.
  • the first camera 150 may be located outside the HMD 120 and the second camera 160 may be located inside the HMD 120.
  • the images generated by the first camera 150 and the second camera 160 are input to the computer 200.
  • the first camera 150 and the second camera 160 may be realized as one camera, and the face of the user 5 may be photographed by this one camera.
  • the microphone 170 converts the utterance of the user 5 into an audio signal (electric signal) and outputs it to the computer 200.
  • the speaker 180 converts the voice signal into voice and outputs it to the user 5.
  • the HMD 120 may include earphones instead of the speaker 180.
  • the controller 300 is connected to the computer 200 by wire or wirelessly.
  • the controller 300 receives an instruction input from the user 5 to the computer 200.
  • the controller 300 is configured to be grippable by the user 5.
  • the controller 300 is configured to be wearable on a part of the user 5's body or clothing.
  • the controller 300 may be configured to output at least one of vibration, sound, and light based on a signal transmitted from the computer 200.
  • the controller 300 receives from the user 5 an operation for controlling the position and movement of the object arranged in the virtual space.
  • the controller 300 includes a plurality of light sources. Each light source is realized by, for example, an LED that emits infrared rays.
  • the HMD sensor 410 has a position tracking function. In this case, the HMD sensor 410 reads a plurality of infrared rays emitted by the controller 300 and detects the position and inclination of the controller 300 in the real space.
  • the HMD sensor 410 may be implemented by a camera. In this case, the HMD sensor 410 can detect the position and tilt of the controller 300 by executing the image analysis process using the image information of the controller 300 output from the camera.
  • the motion sensor 420 is attached to the user 5's hand in a certain aspect to detect the movement of the user 5's hand.
  • the motion sensor 420 detects the rotation speed, the number of rotations, and the like of the hand.
  • the detected signal is sent to the computer 200.
  • the motion sensor 420 is provided in the controller 300, for example.
  • the motion sensor 420 is provided in, for example, a controller 300 configured to be grippable by the user 5.
  • the controller 300 is attached to something that does not easily fly by being attached to the user 5's hand, such as a glove type.
  • a sensor not attached to the user 5 may detect the movement of the user 5's hand.
  • the signal of the camera that shoots the user 5 may be input to the computer 200 as a signal representing the operation of the user 5.
  • the motion sensor 420 and the computer 200 are wirelessly connected to each other.
  • the communication mode is not particularly limited, and for example, Bluetooth (registered trademark) or other known communication method is used.
  • the display 430 displays an image similar to the image displayed on the monitor 130. As a result, users other than the user 5 wearing the HMD 120 can also view the same image as the user 5.
  • the image displayed on the display 430 does not have to be a three-dimensional image, and may be an image for the right eye or an image for the left eye. Examples of the display 430 include a liquid crystal display and an organic EL monitor.
  • the server 600 may send the program to the computer 200.
  • the server 600 may communicate with another computer 200 to provide virtual reality to the HMD 120 used by another user.
  • each computer 200 communicates a signal based on the operation of each user with another computer 200 via a server 600, and a plurality of users are used in the same virtual space. Allows users to enjoy a common game.
  • Each computer 200 may communicate a signal based on the operation of each user with another computer 200 without going through the server 600.
  • the external device 700 may be any device as long as it can communicate with the computer 200.
  • the external device 700 may be, for example, a device capable of communicating with the computer 200 via the network 2, or a device capable of directly communicating with the computer 200 by short-range wireless communication or a wired connection.
  • Examples of the external device 700 include, but are not limited to, smart devices, PCs (Personal Computers), and peripheral devices of the computer 200.
  • FIG. 2 is a block diagram showing an example of the hardware configuration of the computer 200 according to the present embodiment.
  • the computer 200 includes a processor 210, a memory 220, a storage 230, an input / output interface 240, and a communication interface 250 as main components. Each component is connected to bus 260, respectively.
  • the processor 210 executes a series of instructions included in the program stored in the memory 220 or the storage 230 based on the signal given to the computer 200 or when a predetermined condition is satisfied.
  • the processor 210 is realized as a CPU (Central Processing Unit), a GPU (Graphics Processing Unit), an MPU (Micro Processor Unit), an FPGA (Field-Programmable Gate Array), or other device.
  • the memory 220 temporarily stores programs and data.
  • the program is loaded from storage 230, for example.
  • the data includes data input to the computer 200 and data generated by the processor 210.
  • the memory 220 is realized as a RAM (Random Access Memory) or other volatile memory.
  • Storage 230 holds programs and data permanently.
  • the storage 230 is realized as, for example, a ROM (Read-Only Memory), a hard disk device, a flash memory, or other non-volatile storage device.
  • the program stored in the storage 230 includes a program for providing a virtual space in the HMD system 100, a simulation program, a game program, a user authentication program, and a program for realizing communication with another computer 200.
  • the data stored in the storage 230 includes data, objects, and the like for defining the virtual space.
  • the storage 230 may be realized as a removable storage device such as a memory card.
  • a configuration that uses programs and data stored in an external storage device may be used instead of the storage 230 built into the computer 200. According to such a configuration, for example, in a scene where a plurality of HMD systems 100 are used such as an amusement facility, it is possible to update programs and data at once.
  • the input / output interface 240 communicates signals with the HMD 120, the HMD sensor 410, the motion sensor 420, and the display 430.
  • the monitor 130, the gaze sensor 140, the first camera 150, the second camera 160, the microphone 170, and the speaker 180 included in the HMD 120 can communicate with the computer 200 via the input / output interface 240 of the HMD 120.
  • the input / output interface 240 is realized by using USB (Universal Serial Bus), DVI (Digital Visual Interface), HDMI (registered trademark) (High-Definition Multimedia Interface) and other terminals.
  • the input / output interface 240 is not limited to the above.
  • the input / output interface 240 may further communicate with the controller 300.
  • the input / output interface 240 receives input of signals output from the controller 300 and the motion sensor 420.
  • the input / output interface 240 sends an instruction output from the processor 210 to the controller 300.
  • the command instructs the controller 300 to vibrate, output voice, emit light, and the like.
  • the controller 300 executes either vibration, voice output, or light emission in response to the command.
  • the communication interface 250 is connected to the network 2 and communicates with another computer (for example, the server 600) connected to the network 2.
  • the communication interface 250 is realized as, for example, a LAN (Local Area Network) or other wired communication interface, or a WiFi (Wireless Fidelity), Bluetooth (registered trademark), NFC (Near Field Communication) or other wireless communication interface. Will be done.
  • the communication interface 250 is not limited to the above.
  • the processor 210 accesses the storage 230, loads one or more programs stored in the storage 230 into the memory 220, and executes a series of instructions contained in the program.
  • the one or more programs may include an operating system of a computer 200, an application program for providing a virtual space, game software that can be executed in the virtual space, and the like.
  • the processor 210 sends a signal to the HMD 120 to provide virtual space via the input / output interface 240.
  • the HMD 120 displays an image on the monitor 130 based on the signal.
  • the computer 200 is configured to be provided outside the HMD 120, but in another aspect, the computer 200 may be built in the HMD 120.
  • a portable information communication terminal for example, a smartphone
  • a monitor 130 may function as a computer 200.
  • the computer 200 may have a configuration commonly used for a plurality of HMD 120s. According to such a configuration, for example, the same virtual space can be provided to a plurality of users, so that each user can enjoy the same application as other users in the same virtual space.
  • a real coordinate system which is a coordinate system in the real space
  • the real coordinate system has three reference directions (axises) that are parallel to the vertical direction in the real space, the horizontal direction orthogonal to the vertical direction, and the front-back direction orthogonal to both the vertical direction and the horizontal direction.
  • the horizontal direction, the vertical direction (vertical direction), and the front-back direction in the real coordinate system are defined as the x-axis, the y-axis, and the z-axis, respectively. More specifically, in the real coordinate system, the x-axis is parallel to the horizontal direction in real space.
  • the y-axis is parallel to the vertical direction in real space.
  • the z-axis is parallel to the front-back direction of the real space.
  • the HMD sensor 410 includes an infrared sensor.
  • the infrared sensor detects infrared rays emitted from each light source of the HMD 120, the presence of the HMD 120 is detected.
  • the HMD sensor 410 further detects the position and inclination (orientation) of the HMD 120 in the real space according to the movement of the user 5 wearing the HMD 120 based on the value of each point (each coordinate value in the real coordinate system). do. More specifically, the HMD sensor 410 can detect a temporal change in the position and inclination of the HMD 120 by using each value detected over time.
  • Each inclination of the HMD 120 detected by the HMD sensor 410 corresponds to each inclination of the HMD 120 around three axes in the real coordinate system.
  • the HMD sensor 410 sets the uvw field coordinate system to the HMD 120 based on the inclination of the HMD 120 in the real coordinate system.
  • the uvw field-of-view coordinate system set in the HMD 120 corresponds to the viewpoint coordinate system when the user 5 wearing the HMD 120 sees an object in the virtual space.
  • FIG. 3 is a diagram conceptually representing the uvw field coordinate system set in the HMD 120 according to an embodiment.
  • the HMD sensor 410 detects the position and tilt of the HMD 120 in the real coordinate system when the HMD 120 is activated.
  • Processor 210 sets the uvw field coordinate system to HMD 120 based on the detected values.
  • the HMD 120 sets a three-dimensional uvw visual field coordinate system centered (origin) on the head of the user 5 wearing the HMD 120. More specifically, the HMD 120 defines the real coordinate system in the horizontal, vertical, and front-back directions (x-axis, y-axis, z-axis) by the inclination of the HMD 120 around each axis in the real coordinate system. The three directions newly obtained by tilting each around the axis are set as the pitch axis (u axis), the yaw axis (v axis), and the roll axis (w axis) of the uvw field coordinate system in the HMD 120.
  • the processor 210 sets the uvw field coordinate system parallel to the real coordinate system to the HMD 120.
  • the horizontal direction (x-axis), vertical direction (y-axis), and front-back direction (z-axis) in the real coordinate system are the pitch axis (u-axis) and yaw-axis (v-axis) of the uvw field coordinate system in the HMD 120.
  • the roll axis (w axis) are the roll axis (w axis).
  • the HMD sensor 410 can detect the tilt of the HMD 120 in the set uvw field coordinate system based on the movement of the HMD 120. In this case, the HMD sensor 410 detects the pitch angle ( ⁇ u), yaw angle ( ⁇ v), and roll angle ( ⁇ w) of the HMD 120 in the uvw visual field coordinate system as the inclination of the HMD 120, respectively.
  • the pitch angle ( ⁇ u) represents the tilt angle of the HMD 120 around the pitch axis in the uvw visual field coordinate system.
  • the yaw angle ( ⁇ v) represents the tilt angle of the HMD 120 around the yaw axis in the uvw visual field coordinate system.
  • the roll angle ( ⁇ w) represents the tilt angle of the HMD 120 around the roll axis in the uvw field coordinate system.
  • the HMD sensor 410 sets the uvw field coordinate system in the HMD 120 after the HMD 120 has moved to the HMD 120 based on the detected inclination of the HMD 120.
  • the relationship between the HMD 120 and the uvw field coordinate system of the HMD 120 is always constant regardless of the position and inclination of the HMD 120.
  • the position and inclination of the HMD 120 change, the position and inclination of the uvw visual field coordinate system of the HMD 120 in the real coordinate system change in conjunction with the change of the position and inclination.
  • the HMD sensor 410 determines the HMD 120 based on the intensity of the infrared light obtained based on the output from the infrared sensor and the relative positional relationship between the points (eg, the distance between the points).
  • the position of the above in the real space may be specified as a relative position with respect to the HMD sensor 410.
  • the processor 210 may determine the origin of the uvw visual field coordinate system of the HMD 120 in real space (real coordinate system) based on the identified relative position.
  • FIG. 4 is a diagram conceptually representing one aspect of expressing the virtual space 11 according to a certain embodiment.
  • the virtual space 11 has an all-sky spherical structure that covers the entire center 12 in the 360-degree direction.
  • the celestial sphere in the upper half of the virtual space 11 is illustrated so as not to complicate the explanation.
  • Each mesh is defined in the virtual space 11.
  • the position of each mesh is predetermined as a coordinate value in the XYZ coordinate system, which is a global coordinate system defined in the virtual space 11.
  • the computer 200 associates each partial image constituting the panoramic image 13 (still image, moving image, etc.) expandable in the virtual space 11 with each corresponding mesh in the virtual space 11.
  • the virtual space 11 defines an XYZ coordinate system with the center 12 as the origin.
  • the XYZ coordinate system is, for example, parallel to the real coordinate system.
  • the horizontal direction, vertical direction (vertical direction), and front-back direction in the XYZ coordinate system are defined as the X-axis, the Y-axis, and the Z-axis, respectively. Therefore, the X-axis (horizontal direction) of the XYZ coordinate system is parallel to the x-axis of the real coordinate system, and the Y-axis (vertical direction) of the XYZ coordinate system is parallel to the y-axis of the real coordinate system.
  • the Z-axis (front-back direction) is parallel to the z-axis of the real coordinate system.
  • the virtual camera 14 is arranged at the center 12 of the virtual space 11.
  • the processor 210 displays an image captured by the virtual camera 14 on the monitor 130 of the HMD 120.
  • the virtual camera 14 moves in the virtual space 11 in the same manner in conjunction with the movement of the HMD 120 in the real space.
  • changes in the position and inclination of the HMD 120 in the real space can be similarly reproduced in the virtual space 11.
  • the virtual camera 14 is defined with an uvw field-of-view coordinate system.
  • the uvw field-of-view coordinate system of the virtual camera 14 in the virtual space 11 is defined to be linked to the uvw field-of-view coordinate system of the HMD 120 in the real space (real coordinate system). Therefore, when the inclination of the HMD 120 changes, the inclination of the virtual camera 14 also changes accordingly.
  • the virtual camera 14 can also move in the virtual space 11 in conjunction with the movement of the user 5 wearing the HMD 120 in the real space.
  • the processor 210 of the computer 200 defines the field of view 15 in the virtual space 11 based on the position and tilt (reference line of sight 16) of the virtual camera 14.
  • the visual field area 15 corresponds to an area in the virtual space 11 that is visually recognized by the user 5 wearing the HMD 120. That is, the position of the virtual camera 14 can be said to be the viewpoint of the user 5 in the virtual space 11.
  • the line of sight of the user 5 detected by the gaze sensor 140 is a direction in the viewpoint coordinate system when the user 5 visually recognizes an object.
  • the uvw field-of-view coordinate system of the HMD 120 is equal to the viewpoint coordinate system when the user 5 visually recognizes the monitor 130.
  • the uvw field-of-view coordinate system of the virtual camera 14 is linked to the uvw field-of-view coordinate system of the HMD 120. Therefore, the HMD system 100 according to a certain aspect can consider the line of sight of the user 5 detected by the gaze sensor 140 as the line of sight of the user 5 in the uvw field of view coordinate system of the virtual camera 14.
  • FIG. 5 is a top view of the head of the user 5 who wears the HMD 120 according to an embodiment.
  • the gaze sensor 140 detects each line of sight of the user 5's right and left eyes. In a certain aspect, when the user 5 is looking near, the gaze sensor 140 detects the lines of sight R1 and L1. In another aspect, when the user 5 is looking far away, the gaze sensor 140 detects the lines of sight R2 and L2. In this case, the angle formed by the lines of sight R2 and L2 with respect to the roll axis w is smaller than the angle formed by the lines of sight R1 and L1 with respect to the roll axis w. The gaze sensor 140 transmits the detection result to the computer 200.
  • the computer 200 When the computer 200 receives the detection values of the lines of sight R1 and L1 from the gaze sensor 140 as the detection result of the line of sight, the computer 200 identifies the gaze point N1 which is the intersection of the lines of sight R1 and L1 based on the detected values. On the other hand, when the computer 200 receives the detected values of the lines of sight R2 and L2 from the gaze sensor 140, the computer 200 identifies the intersection of the lines of sight R2 and L2 as the gaze point. The computer 200 identifies the line of sight N0 of the user 5 based on the position of the specified gazing point N1.
  • the computer 200 detects, for example, the extending direction of the straight line passing through the midpoint of the straight line connecting the right eye R and the left eye L of the user 5 and the gazing point N1 as the line of sight N0.
  • the line of sight N0 is the direction in which the user 5 actually directs the line of sight with both eyes.
  • the line of sight N0 corresponds to the direction in which the user 5 actually directs the line of sight with respect to the field of view area 15.
  • the HMD system 100 may include a television broadcast receiving tuner. According to such a configuration, the HMD system 100 can display a television program in the virtual space 11.
  • the HMD system 100 may include a communication circuit for connecting to the Internet or a telephone function for connecting to a telephone line.
  • FIG. 6 is a diagram showing a YZ cross section of the field of view region 15 viewed from the X direction in the virtual space 11.
  • FIG. 7 is a diagram showing an XZ cross section of the field of view region 15 viewed from the Y direction in the virtual space 11.
  • the field of view region 15 in the YZ cross section includes the region 18.
  • the region 18 is defined by the position of the virtual camera 14, the reference line of sight 16, and the YZ cross section of the virtual space 11.
  • the processor 210 defines a range including the polar angle ⁇ centered on the reference line of sight 16 in the virtual space as a region 18.
  • the field of view region 15 in the XZ cross section includes the region 19.
  • the region 19 is defined by the position of the virtual camera 14, the reference line of sight 16, and the XZ cross section of the virtual space 11.
  • the processor 210 defines a range including the azimuth angle ⁇ centered on the reference line of sight 16 in the virtual space 11 as a region 19.
  • the polar angles ⁇ and ⁇ are determined according to the position of the virtual camera 14 and the inclination (orientation) of the virtual camera 14.
  • the HMD system 100 provides the user 5 with a field of view in the virtual space 11 by displaying the field of view image 17 on the monitor 130 based on the signal from the computer 200.
  • the field-of-view image 17 is an image corresponding to a portion of the panoramic image 13 corresponding to the field-of-view area 15.
  • the virtual camera 14 also moves in conjunction with the movement.
  • the position of the visual field region 15 in the virtual space 11 changes.
  • the field of view image 17 displayed on the monitor 130 is updated to an image of the panorama image 13 superimposed on the field of view area 15 in the direction in which the user 5 faces in the virtual space 11.
  • the user 5 can visually recognize a desired direction in the virtual space 11.
  • the inclination of the virtual camera 14 corresponds to the line of sight (reference line of sight 16) of the user 5 in the virtual space 11, and the position where the virtual camera 14 is arranged corresponds to the viewpoint of the user 5 in the virtual space 11. Therefore, by changing the position or tilt of the virtual camera 14, the image displayed on the monitor 130 is updated, and the field of view of the user 5 is moved.
  • the HMD system 100 can give the user 5 a high sense of immersion in the virtual space 11.
  • the processor 210 may move the virtual camera 14 in the virtual space 11 in conjunction with the movement of the user 5 wearing the HMD 120 in the real space. In this case, the processor 210 identifies an image region (field of view region 15) projected onto the monitor 130 of the HMD 120 based on the position and tilt of the virtual camera 14 in the virtual space 11.
  • the virtual camera 14 may include two virtual cameras, a virtual camera for providing an image for the right eye and a virtual camera for providing an image for the left eye. Appropriate parallax is set for the two virtual cameras so that the user 5 can recognize the three-dimensional virtual space 11.
  • the virtual camera 14 may be realized by one virtual camera. In this case, an image for the right eye and an image for the left eye may be generated from the image obtained by one virtual camera.
  • the virtual camera 14 includes two virtual cameras, and the roll axis (w) generated by synthesizing the roll axes of the two virtual cameras is adapted to the roll axis (w) of the HMD 120. The technical idea of the present disclosure is illustrated as being configured as such.
  • FIG. 8 is a diagram showing a schematic configuration of a controller 300 according to an embodiment.
  • the controller 300 may include a right controller 300R and a left controller (not shown).
  • the right controller 300R is operated by the right hand of the user 5.
  • the left controller is operated by the left hand of the user 5.
  • the right controller 300R and the left controller are symmetrically configured as separate devices. Therefore, the user 5 can freely move the right hand holding the right controller 300R and the left hand holding the left controller.
  • the controller 300 may be an integrated controller that accepts operations of both hands.
  • the right controller 300R will be described.
  • the right controller 300R includes a grip 310, a frame 320, and a top surface 330.
  • the grip 310 is configured to be gripped by the right hand of the user 5.
  • the grip 310 may be held by the palm of the user 5's right hand and three fingers (middle finger, ring finger, little finger).
  • the grip 310 includes buttons 340, 350 and a motion sensor 420.
  • the button 340 is arranged on the side surface of the grip 310 and accepts an operation by the middle finger of the right hand.
  • the button 350 is arranged in front of the grip 310 and accepts an operation by the index finger of the right hand.
  • the buttons 340,350 are configured as trigger-type buttons.
  • the motion sensor 420 is built in the housing of the grip 310. If the movement of the user 5 can be detected from around the user 5 by a camera or other device, the grip 310 may not include the motion sensor 420.
  • the frame 320 includes a plurality of infrared LEDs 360 arranged along its circumferential direction.
  • the infrared LED 360 emits infrared rays as the program progresses while the program using the controller 300 is being executed.
  • the infrared rays emitted from the infrared LED 360 can be used to detect each position and orientation (tilt, orientation) of the right controller 300R and the left controller.
  • infrared LEDs 360 arranged in two rows are shown, but the number of arrays is not limited to that shown in FIG. An array of one column or three or more columns may be used.
  • the top surface 330 includes buttons 370, 380 and an analog stick 390.
  • the buttons 370 and 380 are configured as push-type buttons. Buttons 370 and 380 accept operations by the thumb of the user 5's right hand.
  • the analog stick 390 accepts an operation 360 degrees in any direction from the initial position (neutral position) in a certain aspect.
  • the operation includes, for example, an operation for moving an object arranged in the virtual space 11.
  • the right controller 300R and the left controller include a battery for driving the infrared LED 360 and other components. Batteries include, but are not limited to, rechargeable, button type, dry cell type and the like.
  • the right controller 300R and the left controller may be connected to, for example, the USB interface of the computer 200. In this case, the right controller 300R and the left controller do not require batteries.
  • the yaw, roll, and pitch directions are defined with respect to the right hand of the user 5.
  • the direction in which the thumb extends is the yaw direction
  • the direction in which the index finger extends is the roll direction
  • the direction perpendicular to the plane defined by the yaw direction axis and the roll direction axis is the pitch direction. Is defined as.
  • FIG. 9 is a block diagram showing an example of the hardware configuration of the server 600 according to a certain embodiment.
  • the server 600 includes a processor 610, a memory 620, a storage 630, an input / output interface 640, and a communication interface 650 as main components. Each component is connected to bus 660, respectively.
  • the processor 610 executes a series of instructions contained in the program stored in the memory 620 or the storage 630 based on the signal given to the server 600 or the condition that a predetermined condition is satisfied.
  • the processor 610 is implemented as a CPU, GPU, MPU, FPGA or other device.
  • Memory 620 temporarily stores programs and data.
  • the program is loaded from storage 630, for example.
  • the data includes data input to the server 600 and data generated by the processor 610.
  • the memory 620 is realized as a RAM or other volatile memory.
  • Storage 630 permanently holds programs and data.
  • the storage 630 is realized as, for example, a ROM, a hard disk device, a flash memory, or other non-volatile storage device.
  • the program stored in the storage 630 may include a program for providing a virtual space in the HMD system 100, a simulation program, a game program, a user authentication program, and a program for realizing communication with the computer 200.
  • the data stored in the storage 630 may include data, objects, and the like for defining the virtual space.
  • the storage 630 may be realized as a removable storage device such as a memory card.
  • a configuration using programs and data stored in an external storage device may be used instead of the storage 630 built into the server 600. According to such a configuration, for example, in a scene where a plurality of HMD systems 100 are used such as an amusement facility, it is possible to update programs and data at once.
  • the input / output interface 640 communicates a signal with the input / output device.
  • the input / output interface 640 is implemented using USB, DVI, HDMI® and other terminals.
  • the input / output interface 640 is not limited to the above.
  • the communication interface 650 is connected to the network 2 and communicates with the computer 200 connected to the network 2.
  • the communication interface 650 is implemented as, for example, a LAN or other wired communication interface, or a WiFi, Bluetooth, NFC or other wireless communication interface.
  • the communication interface 650 is not limited to the above.
  • the processor 610 accesses the storage 630, loads one or more programs stored in the storage 630 into the memory 620, and executes a series of instructions contained in the program.
  • the one or more programs may include an operating system for the server 600, an application program for providing the virtual space, game software that can be executed in the virtual space, and the like.
  • the processor 610 may send a signal to the computer 200 to provide virtual space via the input / output interface 640.
  • FIG. 10 is a block diagram showing a computer 200 according to an embodiment as a module configuration.
  • the computer 200 includes a control module 510, a rendering module 520, a memory module 530, and a communication control module 540.
  • the control module 510 and the rendering module 520 are implemented by the processor 210.
  • the plurality of processors 210 may operate as the control module 510 and the rendering module 520.
  • the memory module 530 is realized by the memory 220 or the storage 230.
  • the communication control module 540 is realized by the communication interface 250.
  • the control module 510 controls the virtual space 11 provided to the user 5.
  • the control module 510 defines the virtual space 11 in the HMD system 100 by using the virtual space data representing the virtual space 11.
  • the virtual space data is stored in, for example, the memory module 530.
  • the control module 510 may generate virtual space data or acquire virtual space data from a server 600 or the like.
  • the control module 510 arranges an object in the virtual space 11 by using the object data representing the object.
  • the object data is stored in, for example, the memory module 530.
  • the control module 510 may generate object data or acquire object data from a server 600 or the like.
  • the objects are, for example, an avatar object that is the alter ego of the user 5, a character object, an operation object such as a virtual hand operated by the controller 300, a landscape including forests, mountains, etc. arranged as the story of the game progresses, a cityscape, and animals. Etc. may be included.
  • the control module 510 arranges the avatar object of the user 5 of another computer 200 connected via the network 2 in the virtual space 11. In a certain aspect, the control module 510 arranges the avatar object of the user 5 in the virtual space 11. In a certain aspect, the control module 510 arranges an avatar object imitating the user 5 in the virtual space 11 based on the image including the user 5. In another aspect, the control module 510 arranges in the virtual space 11 an avatar object that has been selected by the user 5 from among a plurality of types of avatar objects (for example, an object imitating an animal or a deformed human object). do.
  • a plurality of types of avatar objects for example, an object imitating an animal or a deformed human object.
  • the control module 510 identifies the tilt of the HMD 120 based on the output of the HMD sensor 410. In another aspect, the control module 510 identifies the tilt of the HMD 120 based on the output of the sensor 190, which functions as a motion sensor.
  • the control module 510 detects organs (for example, mouth, eyes, eyebrows) constituting the face of the user 5 from the images of the face of the user 5 generated by the first camera 150 and the second camera 160.
  • the control module 510 detects the movement (shape) of each detected organ.
  • the control module 510 detects the line of sight of the user 5 in the virtual space 11 based on the signal from the gaze sensor 140.
  • the control module 510 detects the viewpoint position (coordinate value in the XYZ coordinate system) at which the detected line of sight of the user 5 and the celestial sphere in the virtual space 11 intersect. More specifically, the control module 510 detects the viewpoint position based on the line of sight of the user 5 defined by the uvw coordinate system and the position and inclination of the virtual camera 14.
  • the control module 510 transmits the detected viewpoint position to the server 600.
  • the control module 510 may be configured to transmit line-of-sight information representing the line-of-sight of the user 5 to the server 600. In such a case, the viewpoint position can be calculated based on the line-of-sight information received by the server 600.
  • the control module 510 reflects the movement of the HMD 120 detected by the HMD sensor 410 on the avatar object. For example, the control module 510 detects that the HMD 120 is tilted and tilts and arranges the avatar object. The control module 510 reflects the detected movement of the facial organ on the face of the avatar object arranged in the virtual space 11. The control module 510 receives the line-of-sight information of the other user 5 from the server 600 and reflects it in the line-of-sight of the avatar object of the other user 5. In a certain aspect, the control module 510 reflects the movement of the controller 300 on the avatar object and the operation object. In this case, the controller 300 includes a motion sensor, an acceleration sensor, a plurality of light emitting elements (for example, infrared LEDs), and the like for detecting the movement of the controller 300.
  • the controller 300 includes a motion sensor, an acceleration sensor, a plurality of light emitting elements (for example, infrared LEDs), and the like for detecting the movement of the controller 300
  • the control module 510 arranges an operation object for receiving the operation of the user 5 in the virtual space 11 in the virtual space 11.
  • the user 5 operates, for example, an object arranged in the virtual space 11.
  • the operation object may include, for example, a hand object which is a virtual hand corresponding to the hand of the user 5.
  • the control module 510 moves the hand object in the virtual space 11 so as to be linked to the movement of the user 5's hand in the real space based on the output of the motion sensor 420.
  • the manipulation object can correspond to the hand portion of the avatar object.
  • the control module 510 detects the collision.
  • the control module 510 can detect, for example, the timing at which the collision area of one object and the collision area of another object touch each other, and when the detection is made, a predetermined process is performed.
  • the control module 510 can detect the timing when the object and the object are separated from the touching state, and when the detection is made, a predetermined process is performed.
  • the control module 510 can detect that the object is in contact with the object. For example, when the operation object touches another object, the control module 510 detects that the operation object touches the other object and performs a predetermined process.
  • the control module 510 controls the image display on the monitor 130 of the HMD 120.
  • the control module 510 arranges the virtual camera 14 in the virtual space 11.
  • the control module 510 controls the position of the virtual camera 14 in the virtual space 11 and the inclination (orientation) of the virtual camera 14.
  • the control module 510 defines the field of view 15 according to the inclination of the head of the user 5 wearing the HMD 120 and the position of the virtual camera 14.
  • the rendering module 520 generates a visual field image 17 to be displayed on the monitor 130 based on the determined visual field region 15.
  • the field of view image 17 generated by the rendering module 520 is output to the HMD 120 by the communication control module 540.
  • control module 510 When the control module 510 detects an utterance using the microphone 170 of the user 5 from the HMD 120, the control module 510 identifies the computer 200 to which the voice data to be transmitted corresponding to the utterance is transmitted. The voice data is transmitted to the computer 200 identified by the control module 510. When the control module 510 receives voice data from another user's computer 200 via the network 2, the control module 510 outputs the voice (utterance) corresponding to the voice data from the speaker 180.
  • the memory module 530 holds data used by the computer 200 to provide the virtual space 11 to the user 5.
  • the memory module 530 holds spatial information, object information, and user information.
  • Spatial information holds one or more templates defined to provide the virtual space 11.
  • the object information includes a plurality of panoramic images 13 constituting the virtual space 11 and object data for arranging the objects in the virtual space 11.
  • the panoramic image 13 may include a still image and a moving image.
  • the panoramic image 13 may include an image in the unreal space and an image in the real space. Examples of images in unreal space include images generated by computer graphics.
  • the user information holds a user ID that identifies the user 5.
  • the user ID may be, for example, an IP (Internet Protocol) address or a MAC (Media Access Control) address set in the computer 200 used by the user. In another aspect, the user ID may be set by the user.
  • the user information includes a program for operating the computer 200 as a control device of the HMD system 100 and the like.
  • the data and programs stored in the memory module 530 are input by the user 5 of the HMD 120.
  • the processor 210 downloads a program or data from a computer (for example, a server 600) operated by a business operator that provides the content, and stores the downloaded program or data in the memory module 530.
  • the communication control module 540 may communicate with the server 600 and other information communication devices via the network 2.
  • control module 510 and the rendering module 520 may be implemented using, for example, Unity® provided by Unity Technologies.
  • control module 510 and the rendering module 520 can also be realized as a combination of circuit elements that realize each process.
  • the processing in the computer 200 is realized by the hardware and the software executed by the processor 210.
  • Such software may be pre-stored in a hard disk or other memory module 530.
  • the software may be stored on a CD-ROM or other computer-readable non-volatile data recording medium and distributed as a program product. Alternatively, the software may be provided as a downloadable program product by an information provider connected to the Internet or other networks.
  • Such software is read from a data recording medium by an optical disk drive or other data reader, or downloaded from a server 600 or other computer via a communication control module 540, and then temporarily stored in a storage module. ..
  • the software is read from the storage module by the processor 210 and stored in RAM in the form of an executable program. Processor 210 executes the program.
  • FIG. 11 is a sequence chart showing a part of the processing performed in the HMD set 110 according to an embodiment.
  • step S1110 the processor 210 of the computer 200 specifies the virtual space data as the control module 510 and defines the virtual space 11.
  • step S1120 the processor 210 initializes the virtual camera 14. For example, the processor 210 arranges the virtual camera 14 at a predetermined center 12 in the virtual space 11 in the work area of the memory, and directs the line of sight of the virtual camera 14 in the direction in which the user 5 is facing.
  • step S1130 the processor 210 generates the field of view image data for displaying the initial field of view image as the rendering module 520.
  • the generated visual field image data is output to the HMD 120 by the communication control module 540.
  • step S1132 the monitor 130 of the HMD 120 displays the visual field image based on the visual field image data received from the computer 200.
  • the user 5 wearing the HMD 120 can recognize the virtual space 11 when he / she visually recognizes the field of view image.
  • step S1134 the HMD sensor 410 detects the position and tilt of the HMD 120 based on the plurality of infrared rays emitted from the HMD 120.
  • the detection result is output to the computer 200 as motion detection data.
  • step S1140 the processor 210 identifies the visual field direction of the user 5 wearing the HMD 120 based on the position and the inclination included in the motion detection data of the HMD 120.
  • step S1150 the processor 210 executes the application program and arranges the object in the virtual space 11 based on the instruction included in the application program.
  • step S1160 the controller 300 detects the operation of the user 5 based on the signal output from the motion sensor 420, and outputs the detection data representing the detected operation to the computer 200.
  • the operation of the controller 300 by the user 5 may be detected based on an image from a camera arranged around the user 5.
  • step S1170 the processor 210 detects the operation of the controller 300 by the user 5 based on the detection data acquired from the controller 300.
  • step S1180 the processor 210 generates the field of view image data based on the operation of the controller 300 by the user 5.
  • the generated visual field image data is output to the HMD 120 by the communication control module 540.
  • step S1190 the HMD 120 updates the visual field image based on the received visual field image data, and displays the updated visual field image on the monitor 130.
  • FIGS. 12A and 12B An avatar object according to the present embodiment will be described with reference to FIGS. 12A and 12B.
  • a user 5A the user of the HMD set 110A will be referred to as a user 5A
  • the user of the HMD set 110B will be referred to as a user 5B
  • the user of the HMD set 110C will be referred to as a user 5C
  • the user of the HMD set 110D will be referred to as a user 5D.
  • A is added to the reference code of each component related to the HMD set 110A
  • B is added to the reference code of each component related to the HMD set 110B
  • C is added to the reference code of each component related to the HMD set 110C
  • a D is added to the reference code of each component with respect to 110D.
  • the HMD 120A is included in the HMD set 110A.
  • FIG. 12A is a schematic diagram showing a situation in which each HMD 120 provides the virtual space 11 to the user 5 in the network 2.
  • the computers 200A to 200D provide the virtual spaces 11A to 11D to the users 5A to 5D via the HMDs 120A to 120D, respectively.
  • the virtual space 11A and the virtual space 11B are composed of the same data.
  • the computer 200A and the computer 200B share the same virtual space.
  • the avatar object 6A of the user 5A and the avatar object 6B of the user 5B exist.
  • the avatar object 6A in the virtual space 11A and the avatar object 6B in the virtual space 11B are each equipped with the HMD 120, but this is for the sake of clarity, and in reality, these objects are equipped with the HMD 120. Not.
  • the processor 210A may place a virtual camera 14A that captures the field of view image 17A of the user 5A at the eye position of the avatar object 6A.
  • FIG. 12 (B) is a diagram showing the field of view image 17A of the user 5A in FIG. 12 (A).
  • the visual field image 17A is an image displayed on the monitor 130A of the HMD 120A.
  • the field view image 17A is an image generated by the virtual camera 14A.
  • the avatar object 6B of the user 5B is displayed in the field of view image 17A.
  • the avatar object 6A of the user 5A is also displayed in the field of view image of the user 5B.
  • the user 5A can communicate with the user 5B through the virtual space 11A by dialogue. More specifically, the voice of the user 5A acquired by the microphone 170A is transmitted to the HMD 120B of the user 5B via the server 600, and is output from the speaker 180B provided in the HMD 120B. The voice of the user 5B is transmitted to the HMD 120A of the user 5A via the server 600, and is output from the speaker 180A provided in the HMD 120A.
  • the operation of the user 5B (the operation of the HMD 120B and the operation of the controller 300B) is reflected in the avatar object 6B arranged in the virtual space 11A by the processor 210A.
  • the user 5A can recognize the operation of the user 5B through the avatar object 6B.
  • FIG. 13 is a sequence chart showing a part of the processing executed in the HMD system 100 according to the present embodiment.
  • the HMD set 110D is not shown in FIG. 13, the HMD set 110D operates in the same manner as the HMD sets 110A, 110B, and 110C.
  • A is added to the reference code of each component related to the HMD set 110A
  • B is added to the reference code of each component related to the HMD set 110B
  • C is added to the reference code of each component related to the HMD set 110C. It shall be attached and D shall be attached to the reference code of each component with respect to the HMD set 110D.
  • step S1310A the processor 210A in the HMD set 110A acquires the avatar information for determining the operation of the avatar object 6A in the virtual space 11A.
  • This avatar information includes information about the avatar such as motion information, face tracking data, and voice data.
  • the motion information includes information indicating a temporal change in the position and inclination of the HMD 120A, information indicating the hand motion of the user 5A detected by the motion sensor 420A or the like, and the like.
  • Examples of the face tracking data include data for specifying the position and size of each part of the face of the user 5A.
  • Examples of the face tracking data include data indicating the movement of each organ constituting the face of the user 5A and line-of-sight data.
  • Examples of the voice data include data indicating the voice of the user 5A acquired by the microphone 170A of the HMD 120A.
  • the avatar information may include information that identifies the avatar object 6A or the user 5A associated with the avatar object 6A, information that identifies the virtual space 11A in which the avatar object 6A exists, and the like.
  • Information that identifies the avatar object 6A and the user 5A includes a user ID.
  • Information that identifies the virtual space 11A in which the avatar object 6A exists includes a room ID.
  • the processor 210A transmits the avatar information acquired as described above to the server 600 via the network 2.
  • step S1310B the processor 210B in the HMD set 110B acquires the avatar information for determining the operation of the avatar object 6B in the virtual space 11B and transmits it to the server 600, as in the process in step S1310A.
  • step S1310C the processor 210C in the HMD set 110C acquires the avatar information for determining the operation of the avatar object 6C in the virtual space 11C and transmits it to the server 600.
  • step S1320 the server 600 temporarily stores the player information received from each of the HMD set 110A, the HMD set 110B, and the HMD set 110C.
  • the server 600 integrates the avatar information of all users (users 5A to 5C in this example) associated with the common virtual space 11 based on the user ID, room ID, and the like included in each avatar information. Then, the server 600 transmits the integrated avatar information to all the users associated with the virtual space 11 at a predetermined timing. As a result, the synchronization process is executed.
  • the HMD set 110A, the HMD set 110B, and the HMD 110C can share each other's avatar information at substantially the same timing.
  • each HMD set 110A to 110C executes the process of steps S1330A to S1330C based on the avatar information transmitted from the server 600 to each HMD set 110A to 110C.
  • the process of step S1330A corresponds to the process of step S1180 in FIG.
  • step S1330A the processor 210A in the HMD set 110A updates the information of the avatar object 6B and the avatar object 6C of the other users 5B and 5C in the virtual space 11A. Specifically, the processor 210A updates the position and orientation of the avatar object 6B in the virtual space 11 based on the motion information included in the avatar information transmitted from the HMD set 110B. For example, the processor 210A updates the information (position, orientation, etc.) of the avatar object 6B included in the object information stored in the memory module 530. Similarly, the processor 210A updates the information (position, orientation, etc.) of the avatar object 6C in the virtual space 11 based on the motion information included in the avatar information transmitted from the HMD set 110C.
  • step S1330B the processor 210B in the HMD set 110B updates the information of the avatar objects 6A, 6C of the users 5A, 5C in the virtual space 11B, as in the process in step S1330A.
  • step S1330C the processor 210C in the HMD set 110C updates the information of the avatar objects 6A, 6B of the users 5A, 5B in the virtual space 11C.
  • FIG. 14 is a block diagram showing a detailed configuration of a module of the computer 200 according to an embodiment.
  • the control module 510 includes a virtual camera control module 1421, a view area determination module 1422, a reference line-of-sight identification module 1423, a facial organ detection module 1424, a motion detection module 1425, and a virtual space definition. It includes a module 1426, a virtual object generation module 1427, an operation object control module 1428, and an avatar control module 1429.
  • the rendering module 520 includes a field of view image generation module 1438.
  • the memory module 530 holds spatial information 1431, object information 1432, user information 1433, and face information 1434.
  • the virtual camera control module 1421 arranges the virtual camera 14 in the virtual space 11.
  • the virtual camera control module 1421 controls the arrangement position of the virtual camera 14 in the virtual space 11 and the orientation (tilt) of the virtual camera 14.
  • the field-of-view area determination module 1422 defines the field-of-view area 15 according to the orientation of the head of the user wearing the HMD 120 and the arrangement position of the virtual camera 14.
  • the visual field image generation module 1438 generates a visual field image 17 to be displayed on the monitor 130 based on the determined visual field region 15.
  • the reference line-of-sight identification module 1423 identifies the line-of-sight of the user 5 based on the signal from the gaze sensor 140.
  • the facial organ detection module 1424 detects organs (for example, mouth, eyes, eyebrows) constituting the face of the user 5 from the images of the face of the user 5 generated by the first camera 150 and the second camera 160.
  • the motion detection module 1425 detects the motion (shape) of each organ detected by the facial organ detection module 1424. In FIGS. 15 to 18, the control contents of the facial organ detection module 1424 and the motion detection module 1425 will be described later.
  • the virtual space definition module 1426 defines the virtual space 11 in the HMD system 100 by generating virtual space data representing the virtual space 11.
  • the virtual object generation module 1427 generates an object to be arranged in the virtual space 11.
  • Objects can include, for example, landscapes, animals, etc., including forests, mountains, etc., which are arranged as the story of the game progresses.
  • the operation object control module 1428 arranges an operation object for receiving a user's operation in the virtual space 11 in the virtual space 11.
  • the user operates, for example, an object arranged in the virtual space 11.
  • the operating object may include, for example, a hand object corresponding to the hand of the user wearing the HMD 120.
  • the manipulation object may correspond to the hand portion of the avatar object described below.
  • the avatar control module 1429 generates data for arranging the avatar object of another computer 200 user connected via the network 2 in the virtual space 11. In a certain aspect, the avatar control module 1429 generates data for arranging the avatar object of the user 5 in the virtual space 11. In one aspect, the avatar control module 1429 creates an avatar object that mimics the user 5 based on an image that includes the user 5. In another aspect, the avatar control module 1429 creates an avatar object in the virtual space 11 that has been selected by the user 5 from among a plurality of types of avatar objects (for example, an object imitating an animal or a deformed human object). Generate data for placement.
  • a plurality of types of avatar objects for example, an object imitating an animal or a deformed human object.
  • the avatar control module 1429 reflects the movement of the HMD 120 detected by the HMD sensor 410 on the avatar object. For example, the avatar control module 1429 detects that the HMD 120 is tilted and generates data for tilting and arranging the avatar object. In one aspect, the avatar control module 1429 reflects the movement of the controller 300 on the avatar object. In this case, the controller 300 includes a motion sensor, an acceleration sensor, a plurality of light emitting elements (for example, infrared LEDs), and the like for detecting the movement of the controller 300.
  • the avatar control module 1429 reflects the movement of the facial organ detected by the motion detection module 1425 on the face of the avatar object arranged in the virtual space 11. That is, the avatar control module 1429 reflects the movement of the face of the user 5A on the avatar object.
  • the control module 510 detects the collision.
  • the control module 510 can detect, for example, the timing at which a certain object and another object touch each other, and when the detection is made, a predetermined process is performed.
  • the control module 510 can detect the timing when the object and the object are separated from the touching state, and when the detection is made, a predetermined process is performed.
  • the control module 510 can detect that the object is in contact with the object.
  • the operation object control module 1428 detects that the operation object touches the other object when the operation object touches the other object, and performs a predetermined process. ..
  • the memory module 530 holds data used by the computer 200 to provide the virtual space 11 to the user 5.
  • the memory module 530 holds spatial information 1431, object information 1432, user information 1433, and face information 1434.
  • Spatial information 1431 holds one or more templates defined to provide the virtual space 11.
  • the object information 1432 holds the content to be reproduced in the virtual space 11, the object used in the content, and the information (for example, position information) for arranging the object in the virtual space 11.
  • the content may include, for example, a game, content representing a landscape similar to that of the real world, and the like.
  • the user information 1433 holds a program for operating the computer 200 as a control device of the HMD system 100, an application program for using each content held in the object information 1432.
  • the face organ detection module 1424 holds a template stored in advance for detecting the face organ of the user 5.
  • the face information 1434 holds a mouth template 1435, an eye template 1436, and an eyebrow template 1437.
  • Each template can be an image corresponding to the organs that make up the face.
  • the mouth template 1435 can be an image of the mouth.
  • Each template may contain multiple images.
  • FIGS. 15 to 18 show, as an example, a specific example of detecting the movement of the mouth of the user 5.
  • the detection methods described in FIGS. 15 to 18 are not limited to the movement of the mouth of the user 5, and the movement of other organs (for example, eyes, eyebrows, nose, cheeks) constituting the face of the user 5 is detected. Can also be applied to.
  • FIG. 15 is a diagram illustrating control for detecting a mouth from a user's face image 1521.
  • the face image 1521 generated by the first camera 150 includes the nose and mouth of the user 5.
  • the face organ detection module 1424 identifies the mouth region 1531 from the face image 1521 by pattern matching using the mouth template 1435 stored in the face information 1434.
  • the facial organ detection module 1424 sets a comparison area on a rectangle in the face image, and changes the size, position, and angle of the comparison area to obtain an image of the comparison area and an image of the mouth template 1435. Calculate the similarity with.
  • the facial organ detection module 1424 may identify a comparison region for which a similarity greater than a predetermined threshold is calculated as the mouth region 1531.
  • the facial organ detection module 1424 further determines that the comparison region is based on the relative relationship between the position of the comparison region where the calculated similarity is greater than the threshold value and the position of other facial organs (eg, eyes, nose). It is possible to judge whether or not it corresponds to the mouth area.
  • the comparison region is based on the relative relationship between the position of the comparison region where the calculated similarity is greater than the threshold value and the position of other facial organs (eg, eyes, nose). It is possible to judge whether or not it corresponds to the mouth area.
  • the motion detection module 1425 detects a more detailed mouth shape from the mouth region 1531 detected by the facial organ detection module 1424.
  • FIG. 16 is a diagram (No. 1) for explaining the process of detecting the shape of the mouth by the motion detection module 1425.
  • the motion detection module 1425 sets a contour detection line 1641 for detecting the shape of the mouth (the contour of the lips) included in the mouth region 1531.
  • a plurality of contour detection lines 1641 are set at predetermined intervals in a direction orthogonal to the height direction of the face.
  • the motion detection module 1425 can detect a change in the brightness value of the mouth region 1531 along each of the plurality of contour detection lines 1641, and can specify a position where the change in the brightness value is abrupt as a contour point. More specifically, the motion detection module 1425 can specify as a contour point a pixel whose luminance difference (that is, change in luminance value) from adjacent pixels is equal to or greater than a predetermined threshold value.
  • the brightness value of the pixel is obtained, for example, by integrating the RBG value of the pixel with a predetermined weighting.
  • the motion detection module 1425 identifies two types of contour points from the image corresponding to the mouth region 1531.
  • the motion detection module 1425 identifies contour points 1642 corresponding to the outer contour of the mouth (lips) and contour points 1643 corresponding to the inner contour of the mouth (lips).
  • the motion detection module 1425 may identify the contour points at both ends as the outer contour points 1642 when three or more contour points are detected on one contour detection line 1641.
  • the motion detection module 1425 can identify contour points other than the outer contour point 1642 as the inner contour point 1643.
  • the motion detection module 1425 can specify the detected contour points as the outer contour points 1642.
  • FIG. 17 is a diagram (No. 2) for explaining a process in which the motion detection module 1425 detects the shape of the mouth.
  • the outer contour points 1642 are shown as white circles and the inner contour points 1643 are shown as hatched circles.
  • the motion detection module 1425 identifies the mouth shape 1721 by interpolating between the inner contour points 1643.
  • the motion detection module 1425 may identify the mouth shape 1721 using a non-linear interpolation method such as spline interpolation.
  • the motion detection module 1425 may specify the mouth shape 1721 by interpolating between the outer contour points 1642.
  • the motion detection module 1425 excludes contour points that deviate significantly from the assumed mouth shape (a predetermined shape that can be formed by the upper and lower lips of a person), and the remaining contour points make the mouth.
  • the shape 1721 may be specified. In this way, the motion detection module 1425 can identify the motion (shape) of the user's mouth.
  • the method for detecting the mouth shape 1721 is not limited to the above, and the motion detection module 1425 may detect the mouth shape 1721 by another method.
  • the motion detection module 1425 can detect the motion of the user's eyes and eyebrows in the same manner.
  • the motion detection module 1425 may be configured to be able to detect the shape of an organ such as a cheek or a nose.
  • FIG. 18 shows an example of the structure of face tracking data.
  • the motion detection module 1425 generates face tracking data representing the facial expression of the user 5.
  • the face tracking data represents the position coordinates of the feature points constituting the shape of each organ to be detected in the uvw visual field coordinate system.
  • the points m1, m2, ... Shown in FIG. 18 correspond to the outer contour points 1642 constituting the mouth shape 1721.
  • the face tracking data is a coordinate value in the uvw field of view coordinate system with the position of the first camera 150 as a reference (origin).
  • the face tracking data is a coordinate value in a coordinate system with a feature point predetermined for each organ as a reference (origin).
  • the points m1, m2, ... Are coordinate values in the coordinate system with the origin of any one of the outer contour points 1642 corresponding to the corner of the mouth.
  • the computer 200 transmits the generated face tracking data to the server 600.
  • the server 600 transfers this data to another computer 200 that communicates with the computer 200.
  • the other computer 200 reflects the received face tracking data in the avatar object corresponding to the user of the receiving computer 200.
  • the computer 200A receives face tracking data representing the facial expression of the user 5B from the computer 200B.
  • the computer 200A reflects the received data on the avatar object 6B.
  • the vertices of the polygons constituting the avatar object 6B include the vertices corresponding to the feature points of the face tracking data.
  • the computer 200A moves the positions of the corresponding vertices based on the face tracking data.
  • the facial expression of the user 5B is reflected in the avatar object 6B.
  • the user 5A can recognize the facial expression of the user 5B via the avatar object 6B.
  • the facial expression of the avatar may be controlled not only according to the facial expression of the user but also according to the movement of the user's body. For example, if the movement of the limbs exceeds the threshold, the avatar's face is controlled to a happy smiling expression, and if the head falls toward you, the avatar's face is controlled to a sad expression with the bottom of the eyebrows lowered. ..
  • the computer 200 can perform avatar face calibration.
  • Calibration is a process of controlling the facial expression of the avatar to the standard state.
  • the standard state of facial expression is, for example, expressionless with no emotions, but a specific facial expression such as a smile may be set as the standard state.
  • the processor 210 of the computer 200 photographs the face of the user 5 by the first camera 150 and the second camera 160 of the HMD 120.
  • the processor 210 can urge the user 5 to set the facial expression to the standard state by displaying a menu, voice guidance, or the like.
  • the processor 210 can detect the facial expression of the user 5 from the captured image and generate face tracking data in the standard state.
  • the processor 210 updates the face tracking data of the current avatar with the generated standard state face tracking data.
  • the processor 210 can control the facial expression of the avatar to the standard state by moving the positions of the vertices of the polygons of the avatar's face based on the updated face tracking data.
  • the computer 200 can calibrate the avatar's face in response to user instructions. Further, in a certain embodiment, the computer 200 can automatically execute the calibration when the execution timing of the calibration is detected without any instruction operation by the user.
  • FIG. 19 is a flowchart showing the processing executed by the processor 210 of the computer 200 for the execution of the automatic calibration. As an example, as shown in FIG. 12A, a process executed by the computer 200A communicating with another computer 200B will be described.
  • FIG. 20 shows a virtual space 11A defined by the computer 200A of the user 5A.
  • the virtual space 11A is shared by the computers 200A and 200B because the data is the same as the virtual space 11B defined by the computer 200B of the user 5B.
  • the computer 200A arranges the avatar 6A associated with the user 5A and the avatar 6B associated with the user 5B in the virtual space 11A.
  • the computer 200A prompts the user 5A to set the face in the standard state, detects the facial expression of the user 5A, and generates face tracking data in the standard state.
  • the computer 200A controls the facial expression of the avatar 6A based on the face tracking data in the standard state.
  • the expression in the standard state is reflected on the face of the avatar 6A. Since the face tracking data of the user 5B in the standard state is transmitted from the other computer 200B as the avatar information, the computer 200A reflects the facial expression of the user 5B in the standard state on the face of the avatar 6B.
  • the computer 200A updates the face tracking data at a predetermined timing, and reflects the facial expressions of the users 5A and 5B on the avatars 6A and 6B.
  • the user 5A can interact with each other while recognizing the facial expression of the user 5B by communicating via the virtual space 11A.
  • the face of the avatar 6A may reflect the displacement of the HMD 120A at the time of shooting, the deformation of the face due to the touch of the user 5A, and the like. Therefore, if the face tracking data is continuously updated, the face state of the avatar 6A may change significantly from the standard state, causing the face to collapse, and calibration may be required.
  • the computer 200A determines whether or not the processor 210 satisfies the predetermined calibration execution conditions.
  • One of the execution conditions of the calibration is that the view image corresponding to the view from the avatar 6B of the user 6 is the view image including the face of the avatar 6A, but the image is switched to the image not including the face of the avatar 6A. ..
  • the field of view from the avatar 6B means the field of view from the virtual camera 14 (virtual viewpoint) associated with the user 5B.
  • the calibration can be executed while the user B of the communication partner does not recognize the collapsed face of the avatar 6A.
  • calibration may be executed before the face of the avatar 6A changes significantly from the standard state, and it is possible to prevent the face from collapsing in advance.
  • the processor 210 determines that when the display mode of the field of view image is switched to another display mode different from the display mode of the field of view image, the image is switched to the image that does not include the face of the avatar 6A.
  • Other display modes include, for example, display modes such as darkening images provided to the HMDs 120A and 120B while switching virtual spaces, tutorial images such as operation methods, and 360-degree moving images. Examples of switching virtual spaces include cases where the data of virtual spaces 11A and 11B are switched and a new virtual space is defined, specifically, cases where the virtual space for dialogue is switched to the virtual space for battle games. Be done.
  • the 360-degree moving image is a moving image captured by a 360-degree camera.
  • the space of the whole celestial sphere can be defined as a virtual space by 360 moving images.
  • the processor 210 can detect the switching of the virtual space in the HMD 120B when, for example, new virtual space data is transmitted from the server 600 and an update is instructed.
  • the processor 210 determines that the image is switched to the image that does not include the face of the avatar 6A. Even if the view image includes the avatar 6A, if the object is placed between the faces of the avatar 6B and the avatar 6A, the face is covered by the object, so that the view image does not include the face of the avatar 6A.
  • the processor 210 detects, for example, the positional relationship in which the object and the face of the avatar 6A are lined up on the line of sight of the avatar 6B, it can be determined that the image is switched to the image that does not include the face of the avatar 6B.
  • Examples of the object include an object for operation such as a menu, an object such as a tree and a wall, and the like.
  • the menu is a user interface (UI: User Interface) having a display area for notifications, function explanations, etc., and may also have an operation area for receiving user instructions as needed.
  • Examples of the menu display form include icons, pop-up windows, widgets, and the like.
  • the menu may be an object placed in the virtual spaces 11A and 11B, or it may be a two-dimensional image rendered in the visual field image.
  • FIG. 21 shows an example of a field of view image including a menu.
  • the field of view image 2117 displayed on the HMD 120B includes the avatar 6A.
  • the view image 2117 includes the menu 2121 located in front of the face of the avatar 6A.
  • Menu 2121 is a UI having a display area for asking for scene switching and an operation area for accepting selection of whether or not to switch.
  • the face of avatar 6A is covered by menu 2121, and the field of view image 2117 provided to the HMD 120B does not include the face of avatar 6A.
  • One of the calibration execution conditions is that the amount of change in the facial expression of the avatar 6A from the standard state exceeds the threshold value. According to this execution condition, the calibration can be executed at the timing when the face actually changes significantly.
  • the processor 210 can determine that the amount of change in the facial expression of the avatar 6A exceeds the threshold value. As a result, the calibration can be immediately executed according to the reaction of the communication partner to the change of the face. The user 5A, whose face has been pointed out by the communication partner, can omit the operation for calibration one by one.
  • the processor 210 detects a specific image pattern such as a movement of the avatar 6B pointing to its own face, a suspicious facial expression, or a laughing facial expression from the view image corresponding to the view from the avatar 6A
  • the avatar 6A It can be determined that the amount of change in facial expression of the face exceeds the threshold.
  • the field of view from the avatar 6A means the field of view from the virtual camera 14 (virtual viewpoint) associated with the user 5A.
  • the processor 210 extracts the movement information of the avatar 6B from the avatar information transmitted from the computer 200B via the server 600, and detects a specific movement pattern pointing out the change of the face of the avatar 6A from the extracted movement information. May be good.
  • the processor 210 analyzes the voice data of the user 5B included in the avatar information of the avatar 6B and recognizes a specific voice pattern such as "face”, “funny”, and “funny” to recognize the face of the avatar 6A. It can be determined that the amount of change in the facial expression of is exceeding the threshold.
  • the method for detecting the image pattern and the sound pattern is not particularly limited, and a known method can be used.
  • the image pattern detection method include a method in which an image pattern to be detected is prepared as a model pattern and an image pattern similar to the feature amount of the image of the model pattern is searched for in the visual field image.
  • a method of detecting a voice pattern a method of morphologically analyzing voice data, identifying a phoneme by collating it with a phoneme model, and searching for a target voice pattern can be mentioned.
  • the processor 210 may determine whether or not the amount of change in the facial expression of the avatar 6A described above exceeds the threshold value. good.
  • FIG. 22 shows an example of a field of view image including the avatar 6B.
  • the field of view image 2217 displayed on the HMD 120A includes the avatar 6B as shown in FIG.
  • the processor 210 detects the image pattern of the avatar 6B pointing to its own face in the view image 2217, it determines that the amount of change in the facial expression of the avatar 6A exceeds the threshold value.
  • the processor 210 detects the voice 2221 of the user 5B "the face is strange" that matches the voice patterns of "face” and "funny” from the avatar information of the avatar 6B. It is judged that the amount of change exceeds the threshold.
  • the processor 210 may detect the amount of change in the facial expression of the avatar 6A included in the view image by image-analyzing the view image corresponding to the view from the avatar 6B. For example, the processor 210 detects each part of the face of the avatar 6A in the same manner as in the case of generating face tracking data, and determines whether or not the amount of change in the position, shape, or the like exceeds the threshold value.
  • the field of view image of the avatar 6B can be obtained from the computer 200B of the user 5B.
  • One of the conditions for executing the calibration is that the facial expression of the user 5A in the standard state is detected.
  • the processor 210 compares the face tracking data generated for update with the face tracking data in the standard state, and if the similarity is equal to or higher than a certain value, it may determine that the facial expression of the user 5A is in the standard state. can.
  • the calibration may be performed before the face changes significantly, and it is possible to prevent the face from collapsing. Further, since the calibration is executed by the user 5A intentionally setting the facial expression to the standard state, the execution instruction becomes easy.
  • the processor 210 decides to execute the calibration.
  • the processor 210 may determine whether or not a specific one of the plurality of calibration execution conditions described above is satisfied. Further, the processor 210 may monitor a plurality of execution conditions and decide to execute the calibration when any one of them is satisfied. If the calibration execution condition is not satisfied in step S1951 (S1951: NO), this process ends.
  • step S1952 the processor 210 performs a process of notifying the execution of the calibration during the execution of the calibration.
  • the processor 210 places a notification menu in front of the face of Avatar 6A.
  • the menu may have not only a display area for notifying execution, but also a display area for prompting a standard state expression for calibration.
  • step S1953 the processor 210 generates and updates the field of view image.
  • the field of view image including the menu is displayed on the HMD120A of the user 5A.
  • the processor 210 may control the size of the menu to cover the face of the avatar 6A to be calibrated. Thereby, the visual field image corresponding to the visual field from the avatar 6B can be switched to the visual field image in which the face of the avatar 6A is covered with the menu.
  • processor 210 calibrates the face of Avatar 6A. Specifically, the processor 210 fixes the face of the avatar 6A being calibrated to the face immediately before the calibration. The processor 210 detects the facial expression of the user 5A in the standard state, generates face tracking data in the standard state, and reflects it on the face of the avatar 6A. Instead of regenerating the face tracking data in the standard state, the facial expression of the avatar 6A may be controlled based on the face tracking data in the standard state first generated.
  • step S1955 the processor 210 transmits the avatar information of the avatar 6A in the virtual space 11A to the computer 200B via the server 600.
  • the server 600 integrates the received avatar information of the avatar 6A with the avatar information of the avatar 6B transmitted from the computer 200B, and transmits the avatar information to the computers 200A and 200B.
  • the processor 210 updates the positions, orientations, facial expressions, and the like of the avatars 6A and 6B on the virtual space 11A based on the integrated avatar information of the avatars 6A and 6B.
  • step S1956 the processor 210 generates and updates the field of view image. Similarly, the avatar and the field of view image are updated on the computer 200B of the user 5B. With the update, a field of view image including the avatar 6A whose face is controlled to the standard state by calibration is displayed on the computer 200B.
  • FIG. 23 shows an example of a field of view image including the avatar 6A before and after calibration.
  • the visual field images 2317A and 2317B shown in FIG. 23 are visual field images in which the visual field 2016B shown in FIG. 20 is detected and displayed on the HMD 120B of the user 5B.
  • the field of view image 2317A is a field of view image before calibration, and as shown in FIG. 23, includes an avatar 6A in which the positions of eyes, mouth, etc. are shifted downward and the face is significantly changed from the standard state.
  • the field of view image 2317A is updated to the field of view image 2317B.
  • the face of avatar 6A in the field of view image 2317B is expressionless in the standard state, and the collapse of the face is corrected.
  • the processor 210 of the computer 200A executes the calibration when the execution condition of the calibration is satisfied. Therefore, the face of the avatar 6A can be calibrated at an appropriate timing without operating an input device such as a keyboard of the user 5A. Since no operation is required, it is particularly convenient when the field of view is obstructed by the HMD120A and it is difficult to operate the input device in the real space. Further, since the face collapse is automatically corrected, the user 5A can immerse himself in the dialogue without worrying about the face collapse of the avatar 6A and the operation for correcting the face collapse.
  • the processor 210 may not perform the calibration. good.
  • the virtual space (VR space) in which the user is immersed by the HMD has been described as an example, but a transparent HMD may be adopted as the HMD.
  • AR Augmented Reality
  • AR mixed reality
  • MR mixed Reality
  • a virtual experience in space may be provided to the user.
  • an action on the target object in the virtual space may be generated based on the movement of the user's hand.
  • the processor may specify the coordinate information of the position of the user's hand in the real space, and may define the position of the target object in the virtual space in relation to the coordinate information in the real space.
  • the processor can grasp the positional relationship between the user's hand in the real space and the target object in the virtual space, and can execute the process corresponding to the collision control and the like described above between the user's hand and the target object. .. As a result, it becomes possible to give an action to the target object based on the movement of the user's hand.
  • (Structure 1) A step of defining a virtual space, a step of arranging a first avatar associated with the first user on the virtual space, a step of detecting a facial expression of the first user, and a face of the first user.
  • the step of controlling the facial expression of the first avatar and the execution condition of the calibration for controlling the facial expression of the first avatar to the standard state are satisfied according to the facial expression of the first avatar, the calibration is performed.
  • (Structure 2) In (Structure 1), the computer is further made to perform a step of arranging a second avatar associated with the second user on the virtual space.
  • One of the execution conditions of the calibration is a field of view image corresponding to the field of view from the second avatar, and the field of view image including the face of the first avatar is switched to an image not including the face of the first avatar. That is.
  • the step of executing the calibration is an image that does not include the face of the first avatar when the display mode of the visual field image is switched to a display mode different from the display mode of the visual field image. Judge that it has switched to.
  • (Structure 7) A method executed by a computer, in which a step of defining a virtual space, a step of placing a first avatar associated with the first user on the virtual space, and a facial expression of the first user are detected. The step, the step of controlling the facial expression of the first avatar according to the facial expression of the first user, and the execution condition of the calibration for controlling the facial expression of the first avatar to the standard state are satisfied.
  • a method comprising, if done, a step of performing the calibration.
  • a memory for storing a program and a processor are provided, and the processor reads the program, defines a virtual space, and arranges a first avatar associated with the first user on the virtual space.
  • Rendering Module 530 ... Memory Module, 540 ... Communication Control Module, 600 ... Server , 610 ... Processor, 620 ... Memory, 630 ... Storage, 640 ... Input / output interface, 650 ... Communication interface, 1421 ... Virtual camera control module, 1422 ... View area determination module, 1423 ... Reference line-of-sight identification module, 1424 ... Motion detection module , 1424 ... Face organ detection module, 1425 ... Motion detection module, 1426 ... Virtual space definition module, 1427 ... Virtual object generation module, 1428 ... Operation object control module, 1429 ... Avatar control module, 1438 ... Visibility image generation module

Abstract

A program for causing a computer to execute: a step for defining a virtual space; a step for positioning a first avatar in the virtual space, the first avatar being associated with a first user; a step for detecting the expression on the face of the first user; a step for controlling the expression on the face of the first avatar in accordance with the expression on the face of the first user; and a step for executing calibration when a calibration execution condition has been satisfied, the calibration being for controlling the expression on the face of the first avatar so as to reach a standard state.

Description

プログラム、コンピュータが実行する方法及びコンピュータPrograms, how computers run and computers
本発明は、プログラム、コンピュータが実行する方法及びコンピュータに関する。 The present invention relates to a program, a method executed by a computer, and a computer.
従来、共有する1つの仮想空間を介して、複数のユーザが通信する技術が知られている(例えば、特許文献1参照。)。仮想空間上には各ユーザのアバターが配置され、アバターを介してユーザ同士がチャットすることができる。ユーザが装着するヘッドマウントデバイスによってユーザの顔の動きを検出することで、検出した顔の動きをアバターに反映することも可能である。ユーザは、アバターの顔の動きによってチャット相手の顔の表情を認識でき、仮想空間上での対話をあたかも現実での対話であるかのように体験することができる。 Conventionally, there is known a technique in which a plurality of users communicate with each other via one shared virtual space (see, for example, Patent Document 1). Each user's avatar is placed in the virtual space, and users can chat with each other via the avatar. By detecting the movement of the user's face with the head mount device worn by the user, it is possible to reflect the detected movement of the face on the avatar. The user can recognize the facial expression of the chat partner by the movement of the face of the avatar, and can experience the dialogue in the virtual space as if it were a dialogue in the real world.
特許第6298561号公報Japanese Patent No. 6298561
時間が経過すると、アバターの顔は崩れてくることがある。原因としては、ヘッドマウントデバイスのずれやユーザが手で触れたときの顔の変形等が、アバターの顔に反映されてしまうことが挙げられる。このようなアバターの顔の崩れは、顔を標準化するキャリブレーションを実行することにより、修正することができる。 Over time, the avatar's face may crumble. The cause is that the displacement of the head mount device and the deformation of the face when the user touches it are reflected on the face of the avatar. Such face collapse of the avatar can be corrected by performing a calibration to standardize the face.
通常、チャット中のユーザのヘッドマウントデバイスに表示されるのは、ユーザの視点からの視界画像である。このような1人称視点の視界画像には、チャット相手のアバターは含まれるが、ユーザ自身のアバターは含まれない。ユーザは、自身のアバターの顔が崩れているかどうかを視界画像から判断できないため、チャット相手から顔の崩れを指摘されたときに、キャリブレーションの実行を指示する操作を逐一行わなければならなかった。 Usually, what is displayed on the user's head mount device during chat is a field of view image from the user's point of view. Such a first-person view image includes the avatar of the chat partner, but does not include the user's own avatar. Since it is not possible to determine from the field of view image whether or not the face of the user's avatar is broken, the user had to perform an operation instructing the execution of calibration one by one when the chat partner pointed out that the face was broken. ..
本発明は、ユーザの操作がなくとも、アバターの顔のキャリブレーションを適切なタイミングで行うことを目的とする。 An object of the present invention is to calibrate the face of an avatar at an appropriate timing without any user operation.
ある実施形態によれば、仮想空間を定義するステップと、前記仮想空間上に、第1ユーザに関連付けられた第1アバターを配置するステップと、前記第1ユーザの顔の表情を検出するステップと、前記第1ユーザの顔の表情に応じて、前記第1アバターの顔の表情を制御するステップと、前記第1アバターの顔の表情を標準状態に制御するキャリブレーションの実行条件が満たされた場合に、前記キャリブレーションを実行するステップと、をコンピュータに実行させるためのプログラムが提供される。 According to one embodiment, a step of defining a virtual space, a step of arranging a first avatar associated with the first user on the virtual space, and a step of detecting a facial expression of the first user. , The step of controlling the facial expression of the first avatar according to the facial expression of the first user and the execution condition of the calibration for controlling the facial expression of the first avatar to the standard state are satisfied. In some cases, a step of performing the calibration and a program for causing the computer to perform the calibration are provided.
本開示によれば、ユーザの操作がなくとも、アバターの顔のキャリブレーションを適切なタイミングで行うことができる。 According to the present disclosure, the face of the avatar can be calibrated at an appropriate timing without any user operation.
ある実施の形態に従うHMDシステムの構成の概略を表す図である。It is a figure which shows the outline of the structure of the HMD system according to a certain embodiment. ある実施の形態に従うコンピュータのハードウェア構成の一例を表すブロック図である。It is a block diagram which shows an example of the hardware composition of the computer according to a certain embodiment. ある実施の形態に従うHMDに設定されるuvw視野座標系を概念的に表す図である。It is a figure which conceptually represents the uvw field-of-view coordinate system set in the HMD according to a certain embodiment. ある実施の形態に従う仮想空間を表現する一態様を概念的に表す図である。It is a figure that conceptually represents one aspect of expressing a virtual space according to a certain embodiment. ある実施の形態に従うHMDを装着するユーザの頭部を上から表した図である。It is a figure which showed the head of the user who wears an HMD according to a certain embodiment from the top. 仮想空間において視界領域をX方向から見たYZ断面を表す図である。It is a figure which shows the YZ cross section which looked at the visual field area from the X direction in the virtual space. 仮想空間において視界領域をY方向から見たXZ断面を表す図である。It is a figure which shows the XZ cross section which looked at the field of view area from the Y direction in a virtual space. ある実施の形態に従うコントローラの概略構成を表す図である。It is a figure which shows the schematic structure of the controller according to a certain embodiment. ある実施の形態に従うユーザの右手に対して規定されるヨー、ロール、ピッチの各方向の一例を示す図である。It is a figure which shows an example of each direction of yaw, roll, and pitch defined for the right hand of the user according to a certain embodiment. ある実施の形態に従うサーバのハードウェア構成の一例を表すブロック図である。It is a block diagram which shows an example of the hardware configuration of the server according to a certain embodiment. ある実施の形態に従うコンピュータをモジュール構成として表すブロック図である。It is a block diagram which shows the computer according to a certain embodiment as a module structure. ある実施の形態に従うHMDセットにおいて実行される処理の一部を表すシーケンスチャートである。FIG. 5 is a sequence chart representing a portion of the processing performed in an HMD set according to an embodiment. ネットワークにおいて、各HMDがユーザに仮想空間を提供する状況を表す模式図である。It is a schematic diagram which shows the situation that each HMD provides a virtual space to a user in a network. 図12(A)におけるユーザ5Aの視界画像を示す図である。It is a figure which shows the field of view image of the user 5A in FIG. 12A. ある実施の形態に従うHMDシステムにおいて実行する処理を示すシーケンス図である。It is a sequence diagram which shows the process to perform in the HMD system according to a certain embodiment. ある実施の形態に従うコンピュータのモジュールの詳細構成を表すブロック図である。It is a block diagram which shows the detailed structure of the module of the computer according to a certain embodiment. ユーザの顔画像から口を検出する処理を説明する図である。It is a figure explaining the process of detecting a mouth from a user's face image. 顔器官検出モジュールが口の形状を検出する処理を説明する図(その1)である。It is a figure (the 1) explaining the process which the face organ detection module detects the shape of a mouth. 顔器官検出モジュールが口の形状を検出する処理を説明する図(その2)である。It is a figure (the 2) explaining the process which the face organ detection module detects the shape of a mouth. フェイストラッキングデータの構造の一例を示す図である。It is a figure which shows an example of the structure of face tracking data. ある実施の形態に従うコンピュータにより実行される処理を示すフローチャートである。It is a flowchart which shows the process performed by the computer according to a certain embodiment. 他のコンピュータと共有される仮想空間を示す図である。It is a figure which shows the virtual space shared with other computers. メニューを含む視界画像の一例を示す図である。It is a figure which shows an example of the field of view image including a menu. 他のコンピュータのユーザのアバターを含む視界画像の一例を示す図である。It is a figure which shows an example of the field of view image including the avatar of the user of another computer. キャリブレーション前後のアバターを含む視界画像の一例を示す図である。It is a figure which shows an example of the field of view image including the avatar before and after calibration.
以下、この技術的思想の実施の形態について図面を参照しながら詳細に説明する。以下の説明では、同一の部品には同一の符号を付してある。それらの名称および機能も同じである。したがって、それらについての詳細な説明は繰り返さない。本開示において示される1以上の実施形態において、各実施形態が含む要素を互いに組み合わせることができ、かつ、当該組み合わせられた結果物も本開示が示す実施形態の一部をなすものとする。 Hereinafter, embodiments of this technical idea will be described in detail with reference to the drawings. In the following description, the same parts are designated by the same reference numerals. Their names and functions are the same. Therefore, the detailed description of them will not be repeated. In one or more embodiments set forth in the present disclosure, the elements included in each embodiment may be combined with each other, and the combined deliverables shall also form part of the embodiments set forth in the present disclosure.
[HMDシステムの構成]
図1を参照して、HMD(Head-Mounted Device)システム100の構成について説明する。図1は、本実施の形態に従うHMDシステム100の構成の概略を表す図である。
HMDシステム100は、家庭用のシステムとしてあるいは業務用のシステムとして提供される。
[HMD system configuration]
The configuration of the HMD (Head-Mounted Device) system 100 will be described with reference to FIG. FIG. 1 is a diagram showing an outline of the configuration of the HMD system 100 according to the present embodiment.
The HMD system 100 is provided as a home system or a business system.
HMDシステム100は、サーバ600と、HMDセット110A,110B,110C,110Dと、外部機器700と、ネットワーク2とを含む。HMDセット110A,110B,110C,110Dの各々は、ネットワーク2を介してサーバ600や外部機器700と通信可能に構成される。以下、HMDセット110A,110B,110C,110Dを総称して、HMDセット110とも言う。HMDシステム100を構成するHMDセット110の数は、4つに限られず、3つ以下でも、5つ以上でもよい。HMDセット110は、HMD120と、コンピュータ200と、HMDセンサ410と、ディスプレイ430と、コントローラ300とを備える。HMD120は、モニタ130と、注視センサ140と、第1カメラ150と、第2カメラ160と、マイク170と、スピーカ180とを含む。コントローラ300は、モーションセンサ420を含み得る。 The HMD system 100 includes a server 600, HMD sets 110A, 110B, 110C, 110D, an external device 700, and a network 2. Each of the HMD sets 110A, 110B, 110C, and 110D is configured to be able to communicate with the server 600 and the external device 700 via the network 2. Hereinafter, the HMD set 110A, 110B, 110C, 110D are collectively referred to as the HMD set 110. The number of HMD sets 110 constituting the HMD system 100 is not limited to four, and may be three or less or five or more. The HMD set 110 includes an HMD 120, a computer 200, an HMD sensor 410, a display 430, and a controller 300. The HMD 120 includes a monitor 130, a gaze sensor 140, a first camera 150, a second camera 160, a microphone 170, and a speaker 180. The controller 300 may include a motion sensor 420.
ある局面において、コンピュータ200は、インターネットその他のネットワーク2に接続可能であり、ネットワーク2に接続されているサーバ600その他のコンピュータと通信可能である。その他のコンピュータとしては、例えば、他のHMDセット110のコンピュータや外部機器700が挙げられる。別の局面において、HMD120は、HMDセンサ410の代わりに、センサ190を含み得る。 In some aspects, the computer 200 can connect to the Internet or other network 2 and communicate with the server 600 or other computer connected to the network 2. Examples of other computers include computers of other HMD sets 110 and external devices 700. In another aspect, the HMD 120 may include a sensor 190 instead of the HMD sensor 410.
HMD120は、ユーザ5の頭部に装着され、動作中に仮想空間をユーザ5に提供し得る。より具体的には、HMD120は、右目用の画像および左目用の画像をモニタ130にそれぞれ表示する。ユーザ5の各目がそれぞれの画像を視認すると、ユーザ5は、両目の視差に基づき当該画像を3次元画像として認識し得る。HMD120は、モニタを備える所謂ヘッドマウントディスプレイと、スマートフォンその他のモニタを有する端末を装着可能なヘッドマウント機器のいずれをも含み得る。 The HMD 120 may be worn on the head of the user 5 and provide the user 5 with a virtual space during operation. More specifically, the HMD 120 displays an image for the right eye and an image for the left eye on the monitor 130, respectively. When each eye of the user 5 visually recognizes the respective image, the user 5 can recognize the image as a three-dimensional image based on the parallax of both eyes. The HMD 120 may include either a so-called head-mounted display having a monitor and a head-mounted device to which a smartphone or other terminal having a monitor can be attached.
モニタ130は、例えば、非透過型の表示装置として実現される。ある局面において、モニタ130は、ユーザ5の両目の前方に位置するようにHMD120の本体に配置されている。したがって、ユーザ5は、モニタ130に表示される3次元画像を視認すると、仮想空間に没入することができる。ある局面において、仮想空間は、例えば、背景、ユーザ5が操作可能なオブジェクト、ユーザ5が選択可能なメニューの画像を含む。ある局面において、モニタ130は、所謂スマートフォンその他の情報表示端末が備える液晶モニタまたは有機EL(Electro Luminescence)モニタとして実現され得る。 The monitor 130 is realized as, for example, a non-transparent display device. In one aspect, the monitor 130 is arranged in the body of the HMD 120 so that it is located in front of both eyes of the user 5. Therefore, the user 5 can immerse himself in the virtual space when he / she visually recognizes the three-dimensional image displayed on the monitor 130. In one aspect, the virtual space includes, for example, a background, an object that the user 5 can manipulate, and an image of a menu that the user 5 can select. In a certain aspect, the monitor 130 can be realized as a liquid crystal monitor or an organic EL (Electro Luminescence) monitor included in a so-called smartphone or other information display terminal.
別の局面において、モニタ130は、透過型の表示装置として実現され得る。この場合、HMD120は、図1に示されるようにユーザ5の目を覆う密閉型ではなく、メガネ型のような開放型であり得る。透過型のモニタ130は、その透過率を調整することにより、一時的に非透過型の表示装置として構成可能であってもよい。モニタ130は、仮想空間を構成する画像の一部と、現実空間とを同時に表示する構成を含んでいてもよい。例えば、モニタ130は、HMD120に搭載されたカメラで撮影した現実空間の画像を表示してもよいし、一部の透過率を高く設定することにより現実空間を視認可能にしてもよい。 In another aspect, the monitor 130 can be realized as a transmissive display device. In this case, the HMD 120 may be an open type such as a glasses type rather than a closed type that covers the eyes of the user 5 as shown in FIG. The transmissive monitor 130 may be temporarily configured as a non-transparent display device by adjusting its transmittance. The monitor 130 may include a configuration that simultaneously displays a part of the image constituting the virtual space and the real space. For example, the monitor 130 may display an image of the real space taken by the camera mounted on the HMD 120, or may make the real space visible by setting a part of the transmittance to be high.
ある局面において、モニタ130は、右目用の画像を表示するためのサブモニタと、左目用の画像を表示するためのサブモニタとを含み得る。別の局面において、モニタ130は、右目用の画像と左目用の画像とを一体として表示する構成であってもよい。この場合、モニタ130は、高速シャッタを含む。高速シャッタは、画像がいずれか一方の目にのみ認識されるように、右目用の画像と左目用の画像とを交互に表示可能に作動する。 In some aspects, the monitor 130 may include a sub-monitor for displaying an image for the right eye and a sub-monitor for displaying an image for the left eye. In another aspect, the monitor 130 may be configured to display the image for the right eye and the image for the left eye as a unit. In this case, the monitor 130 includes a high speed shutter. The high-speed shutter operates so that the image for the right eye and the image for the left eye can be alternately displayed so that the image is recognized by only one of the eyes.
ある局面において、HMD120は、図示せぬ複数の光源を含む。各光源は例えば、赤外線を発するLED(Light Emitting Diode)により実現される。HMDセンサ410は、HMD120の動きを検出するためのポジショントラッキング機能を有する。より具体的には、HMDセンサ410は、HMD120が発する複数の赤外線を読み取り、現実空間内におけるHMD120の位置および傾きを検出する。 In one aspect, the HMD 120 includes a plurality of light sources (not shown). Each light source is realized by, for example, an LED (Light Emitting Diode) that emits infrared rays. The HMD sensor 410 has a position tracking function for detecting the movement of the HMD 120. More specifically, the HMD sensor 410 reads a plurality of infrared rays emitted by the HMD 120 and detects the position and inclination of the HMD 120 in the real space.
別の局面において、HMDセンサ410は、カメラにより実現されてもよい。この場合、HMDセンサ410は、カメラから出力されるHMD120の画像情報を用いて、画像解析処理を実行することにより、HMD120の位置および傾きを検出することができる。 In another aspect, the HMD sensor 410 may be implemented by a camera. In this case, the HMD sensor 410 can detect the position and tilt of the HMD 120 by executing the image analysis process using the image information of the HMD 120 output from the camera.
別の局面において、HMD120は、位置検出器として、HMDセンサ410の代わりに、あるいはHMDセンサ410に加えてセンサ190を備えてもよい。HMD120は、センサ190を用いて、HMD120自身の位置および傾きを検出し得る。例えば、センサ190が角速度センサ、地磁気センサ、あるいは加速度センサである場合、HMD120は、HMDセンサ410の代わりに、これらの各センサのいずれかを用いて、自身の位置および傾きを検出し得る。一例として、センサ190が角速度センサである場合、角速度センサは、現実空間におけるHMD120の3軸周りの角速度を経時的に検出する。HMD120は、各角速度に基づいて、HMD120の3軸周りの角度の時間的変化を算出し、さらに、角度の時間的変化に基づいて、HMD120の傾きを算出する。 In another aspect, the HMD 120 may include a sensor 190 as a position detector in place of the HMD sensor 410 or in addition to the HMD sensor 410. The HMD 120 can use the sensor 190 to detect the position and tilt of the HMD 120 itself. For example, if the sensor 190 is an angular velocity sensor, a geomagnetic sensor, or an accelerometer, the HMD 120 may use any of these sensors instead of the HMD sensor 410 to detect its position and tilt. As an example, when the sensor 190 is an angular velocity sensor, the angular velocity sensor detects the angular velocity around the three axes of the HMD 120 in real space over time. The HMD 120 calculates the temporal change of the angle around the three axes of the HMD 120 based on each angular velocity, and further calculates the inclination of the HMD 120 based on the temporal change of the angle.
注視センサ140は、ユーザ5の右目および左目の視線が向けられる方向を検出する。つまり、注視センサ140は、ユーザ5の視線を検出する。視線の方向の検出は、例えば、公知のアイトラッキング機能によって実現される。注視センサ140は、当該アイトラッキング機能を有するセンサにより実現される。ある局面において、注視センサ140は、右目用のセンサおよび左目用のセンサを含むことが好ましい。注視センサ140は、例えば、ユーザ5の右目および左目に赤外光を照射するとともに、照射光に対する角膜および虹彩からの反射光を受けることにより各眼球の回転角を検出するセンサであってもよい。注視センサ140は、検出した各回転角に基づいて、ユーザ5の視線を検知することができる。 The gaze sensor 140 detects the directions in which the eyes of the user 5's right eye and left eye are directed. That is, the gaze sensor 140 detects the line of sight of the user 5. The detection of the direction of the line of sight is realized by, for example, a known eye tracking function. The gaze sensor 140 is realized by a sensor having the eye tracking function. In certain aspects, the gaze sensor 140 preferably includes a sensor for the right eye and a sensor for the left eye. The gaze sensor 140 may be, for example, a sensor that irradiates the right eye and the left eye of the user 5 with infrared light and detects the angle of rotation of each eyeball by receiving the reflected light from the cornea and the iris with respect to the irradiation light. .. The gaze sensor 140 can detect the line of sight of the user 5 based on each of the detected rotation angles.
第1カメラ150は、ユーザ5の顔の下部を撮影する。より具体的には、第1カメラ150は、ユーザ5の鼻および口などを撮影する。第2カメラ160は、ユーザ5の目および眉などを撮影する。HMD120のユーザ5側の筐体をHMD120の内側、HMD120のユーザ5とは逆側の筐体をHMD120の外側と定義する。ある局面において、第1カメラ150は、HMD120の外側に配置され、第2カメラ160は、HMD120の内側に配置され得る。第1カメラ150および第2カメラ160が生成した画像は、コンピュータ200に入力される。別の局面において、第1カメラ150と第2カメラ160とを1台のカメラとして実現し、この1台のカメラでユーザ5の顔を撮影するようにしてもよい。 The first camera 150 captures the lower part of the user 5's face. More specifically, the first camera 150 captures the nose, mouth, and the like of the user 5. The second camera 160 captures the eyes, eyebrows, and the like of the user 5. The housing on the user 5 side of the HMD 120 is defined as the inside of the HMD 120, and the housing on the side opposite to the user 5 of the HMD 120 is defined as the outside of the HMD 120. In some aspects, the first camera 150 may be located outside the HMD 120 and the second camera 160 may be located inside the HMD 120. The images generated by the first camera 150 and the second camera 160 are input to the computer 200. In another aspect, the first camera 150 and the second camera 160 may be realized as one camera, and the face of the user 5 may be photographed by this one camera.
マイク170は、ユーザ5の発話を音声信号(電気信号)に変換してコンピュータ200に出力する。スピーカ180は、音声信号を音声に変換してユーザ5に出力する。別の局面において、HMD120は、スピーカ180に替えてイヤホンを含み得る。 The microphone 170 converts the utterance of the user 5 into an audio signal (electric signal) and outputs it to the computer 200. The speaker 180 converts the voice signal into voice and outputs it to the user 5. In another aspect, the HMD 120 may include earphones instead of the speaker 180.
コントローラ300は、有線または無線によりコンピュータ200に接続されている。コントローラ300は、ユーザ5からコンピュータ200への命令の入力を受け付ける。ある局面において、コントローラ300は、ユーザ5によって把持可能に構成される。別の局面において、コントローラ300は、ユーザ5の身体あるいは衣類の一部に装着可能に構成される。さらに別の局面において、コントローラ300は、コンピュータ200から送信される信号に基づいて、振動、音、光のうちの少なくともいずれかを出力するように構成されてもよい。さらに別の局面において、コントローラ300は、ユーザ5から、仮想空間に配置されるオブジェクトの位置や動きを制御するための操作を受け付ける。 The controller 300 is connected to the computer 200 by wire or wirelessly. The controller 300 receives an instruction input from the user 5 to the computer 200. In one aspect, the controller 300 is configured to be grippable by the user 5. In another aspect, the controller 300 is configured to be wearable on a part of the user 5's body or clothing. In yet another aspect, the controller 300 may be configured to output at least one of vibration, sound, and light based on a signal transmitted from the computer 200. In yet another aspect, the controller 300 receives from the user 5 an operation for controlling the position and movement of the object arranged in the virtual space.
ある局面において、コントローラ300は、複数の光源を含む。各光源は例えば、赤外線を発するLEDにより実現される。HMDセンサ410は、ポジショントラッキング機能を有する。この場合、HMDセンサ410は、コントローラ300が発する複数の赤外線を読み取り、現実空間内におけるコントローラ300の位置および傾きを検出する。別の局面において、HMDセンサ410は、カメラにより実現されてもよい。この場合、HMDセンサ410は、カメラから出力されるコントローラ300の画像情報を用いて、画像解析処理を実行することにより、コントローラ300の位置および傾きを検出することができる。 In one aspect, the controller 300 includes a plurality of light sources. Each light source is realized by, for example, an LED that emits infrared rays. The HMD sensor 410 has a position tracking function. In this case, the HMD sensor 410 reads a plurality of infrared rays emitted by the controller 300 and detects the position and inclination of the controller 300 in the real space. In another aspect, the HMD sensor 410 may be implemented by a camera. In this case, the HMD sensor 410 can detect the position and tilt of the controller 300 by executing the image analysis process using the image information of the controller 300 output from the camera.
モーションセンサ420は、ある局面において、ユーザ5の手に取り付けられて、ユーザ5の手の動きを検出する。例えば、モーションセンサ420は、手の回転速度、回転数等を検出する。検出された信号は、コンピュータ200に送られる。モーションセンサ420は、例えば、コントローラ300に設けられている。ある局面において、モーションセンサ420は、例えば、ユーザ5に把持可能に構成されたコントローラ300に設けられている。別の局面において、現実空間における安全のため、コントローラ300は、手袋型のようにユーザ5の手に装着されることにより容易に飛んで行かないものに装着される。さらに別の局面において、ユーザ5に装着されないセンサがユーザ5の手の動きを検出してもよい。例えば、ユーザ5を撮影するカメラの信号が、ユーザ5の動作を表す信号として、コンピュータ200に入力されてもよい。モーションセンサ420とコンピュータ200とは、一例として、無線により互いに接続される。無線の場合、通信形態は特に限られず、例えば、Bluetooth(登録商標)その他の公知の通信手法が用いられる。 The motion sensor 420 is attached to the user 5's hand in a certain aspect to detect the movement of the user 5's hand. For example, the motion sensor 420 detects the rotation speed, the number of rotations, and the like of the hand. The detected signal is sent to the computer 200. The motion sensor 420 is provided in the controller 300, for example. In a certain aspect, the motion sensor 420 is provided in, for example, a controller 300 configured to be grippable by the user 5. In another aspect, for safety in real space, the controller 300 is attached to something that does not easily fly by being attached to the user 5's hand, such as a glove type. In yet another aspect, a sensor not attached to the user 5 may detect the movement of the user 5's hand. For example, the signal of the camera that shoots the user 5 may be input to the computer 200 as a signal representing the operation of the user 5. As an example, the motion sensor 420 and the computer 200 are wirelessly connected to each other. In the case of wireless communication, the communication mode is not particularly limited, and for example, Bluetooth (registered trademark) or other known communication method is used.
ディスプレイ430は、モニタ130に表示されている画像と同様の画像を表示する。これにより、HMD120を装着しているユーザ5以外のユーザにも当該ユーザ5と同様の画像を視聴させることができる。ディスプレイ430に表示される画像は、3次元画像である必要はなく、右目用の画像や左目用の画像であってもよい。ディスプレイ430としては、例えば、液晶ディスプレイや有機ELモニタなどが挙げられる。 The display 430 displays an image similar to the image displayed on the monitor 130. As a result, users other than the user 5 wearing the HMD 120 can also view the same image as the user 5. The image displayed on the display 430 does not have to be a three-dimensional image, and may be an image for the right eye or an image for the left eye. Examples of the display 430 include a liquid crystal display and an organic EL monitor.
サーバ600は、コンピュータ200にプログラムを送信し得る。別の局面において、サーバ600は、他のユーザによって使用されるHMD120に仮想現実を提供するための他のコンピュータ200と通信し得る。例えば、アミューズメント施設において、複数のユーザが参加型のゲームを行う場合、各コンピュータ200は、各ユーザの動作に基づく信号をサーバ600を介して他のコンピュータ200と通信して、同じ仮想空間において複数のユーザが共通のゲームを楽しむことを可能にする。各コンピュータ200は、各ユーザの動作に基づく信号をサーバ600を介さずに他のコンピュータ200と通信するようにしてもよい。 The server 600 may send the program to the computer 200. In another aspect, the server 600 may communicate with another computer 200 to provide virtual reality to the HMD 120 used by another user. For example, in an amusement facility, when a plurality of users play a participatory game, each computer 200 communicates a signal based on the operation of each user with another computer 200 via a server 600, and a plurality of users are used in the same virtual space. Allows users to enjoy a common game. Each computer 200 may communicate a signal based on the operation of each user with another computer 200 without going through the server 600.
外部機器700は、コンピュータ200と通信可能な機器であればどのような機器であってもよい。外部機器700は、例えば、ネットワーク2を介してコンピュータ200と通信可能な機器であってもよいし、近距離無線通信や有線接続によりコンピュータ200と直接通信可能な機器であってもよい。外部機器700としては、例えば、スマートデバイス、PC(Personal Computer)、およびコンピュータ200の周辺機器などが挙げられるが、これらに限定されるものではない。 The external device 700 may be any device as long as it can communicate with the computer 200. The external device 700 may be, for example, a device capable of communicating with the computer 200 via the network 2, or a device capable of directly communicating with the computer 200 by short-range wireless communication or a wired connection. Examples of the external device 700 include, but are not limited to, smart devices, PCs (Personal Computers), and peripheral devices of the computer 200.
[コンピュータのハードウェア構成]
図2を参照して、本実施の形態に係るコンピュータ200について説明する。図2は、本実施の形態に従うコンピュータ200のハードウェア構成の一例を表すブロック図である。コンピュータ200は、主たる構成要素として、プロセッサ210と、メモリ220と、ストレージ230と、入出力インターフェイス240と、通信インターフェイス250とを備える。各構成要素は、それぞれ、バス260に接続されている。
[Computer hardware configuration]
The computer 200 according to the present embodiment will be described with reference to FIG. FIG. 2 is a block diagram showing an example of the hardware configuration of the computer 200 according to the present embodiment. The computer 200 includes a processor 210, a memory 220, a storage 230, an input / output interface 240, and a communication interface 250 as main components. Each component is connected to bus 260, respectively.
プロセッサ210は、コンピュータ200に与えられる信号に基づいて、あるいは、予め定められた条件が成立したことに基づいて、メモリ220またはストレージ230に格納されているプログラムに含まれる一連の命令を実行する。ある局面において、プロセッサ210は、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、MPU(Micro Processor Unit)、FPGA(Field-Programmable Gate Array)その他のデバイスとして実現される。 The processor 210 executes a series of instructions included in the program stored in the memory 220 or the storage 230 based on the signal given to the computer 200 or when a predetermined condition is satisfied. In a certain aspect, the processor 210 is realized as a CPU (Central Processing Unit), a GPU (Graphics Processing Unit), an MPU (Micro Processor Unit), an FPGA (Field-Programmable Gate Array), or other device.
メモリ220は、プログラムおよびデータを一時的に保存する。プログラムは、例えば、ストレージ230からロードされる。データは、コンピュータ200に入力されたデータと、プロセッサ210によって生成されたデータとを含む。ある局面において、メモリ220は、RAM(Random           Access Memory)その他の揮発メモリとして実現される。 The memory 220 temporarily stores programs and data. The program is loaded from storage 230, for example. The data includes data input to the computer 200 and data generated by the processor 210. In a certain aspect, the memory 220 is realized as a RAM (Random Access Memory) or other volatile memory.
ストレージ230は、プログラムおよびデータを永続的に保持する。ストレージ230は、例えば、ROM(Read-Only Memory)、ハードディスク装置、フラッシュメモリ、その他の不揮発記憶装置として実現される。ストレージ230に格納されるプログラムは、HMDシステム100において仮想空間を提供するためのプログラム、シミュレーションプログラム、ゲームプログラム、ユーザ認証プログラム、他のコンピュータ200との通信を実現するためのプログラムを含む。ストレージ230に格納されるデータは、仮想空間を規定するためのデータおよびオブジェクト等を含む。 Storage 230 holds programs and data permanently. The storage 230 is realized as, for example, a ROM (Read-Only Memory), a hard disk device, a flash memory, or other non-volatile storage device. The program stored in the storage 230 includes a program for providing a virtual space in the HMD system 100, a simulation program, a game program, a user authentication program, and a program for realizing communication with another computer 200. The data stored in the storage 230 includes data, objects, and the like for defining the virtual space.
別の局面において、ストレージ230は、メモリカードのように着脱可能な記憶装置として実現されてもよい。さらに別の局面において、コンピュータ200に内蔵されたストレージ230の代わりに、外部の記憶装置に保存されているプログラムおよびデータを使用する構成が使用されてもよい。このような構成によれば、例えば、アミューズメント施設のように複数のHMDシステム100が使用される場面において、プログラムやデータの更新を一括して行うことが可能になる。 In another aspect, the storage 230 may be realized as a removable storage device such as a memory card. In yet another aspect, a configuration that uses programs and data stored in an external storage device may be used instead of the storage 230 built into the computer 200. According to such a configuration, for example, in a scene where a plurality of HMD systems 100 are used such as an amusement facility, it is possible to update programs and data at once.
入出力インターフェイス240は、HMD120、HMDセンサ410、モーションセンサ420およびディスプレイ430との間で信号を通信する。HMD120に含まれるモニタ130,注視センサ140,第1カメラ150,第2カメラ160,マイク170およびスピーカ180は、HMD120の入出力インターフェイス240を介してコンピュータ200との通信を行ない得る。ある局面において、入出力インターフェイス240は、USB(Universal Serial Bus)、DVI(Digital Visual Interface)、HDMI(登録商標)(High-Definition Multimedia Interface)その他の端子を用いて実現される。入出力インターフェイス240は上述のものに限られない。 The input / output interface 240 communicates signals with the HMD 120, the HMD sensor 410, the motion sensor 420, and the display 430. The monitor 130, the gaze sensor 140, the first camera 150, the second camera 160, the microphone 170, and the speaker 180 included in the HMD 120 can communicate with the computer 200 via the input / output interface 240 of the HMD 120. In a certain aspect, the input / output interface 240 is realized by using USB (Universal Serial Bus), DVI (Digital Visual Interface), HDMI (registered trademark) (High-Definition Multimedia Interface) and other terminals. The input / output interface 240 is not limited to the above.
ある局面において、入出力インターフェイス240は、さらに、コントローラ300と通信し得る。例えば、入出力インターフェイス240は、コントローラ300およびモーションセンサ420から出力された信号の入力を受ける。別の局面において、入出力インターフェイス240は、プロセッサ210から出力された命令を、コントローラ300に送る。当該命令は、振動、音声出力、発光等をコントローラ300に指示する。コントローラ300は、当該命令を受信すると、その命令に応じて、振動、音声出力または発光のいずれかを実行する。 In some aspects, the input / output interface 240 may further communicate with the controller 300. For example, the input / output interface 240 receives input of signals output from the controller 300 and the motion sensor 420. In another aspect, the input / output interface 240 sends an instruction output from the processor 210 to the controller 300. The command instructs the controller 300 to vibrate, output voice, emit light, and the like. Upon receiving the command, the controller 300 executes either vibration, voice output, or light emission in response to the command.
通信インターフェイス250は、ネットワーク2に接続されて、ネットワーク2に接続されている他のコンピュータ(例えば、サーバ600)と通信する。ある局面において、通信インターフェイス250は、例えば、LAN(Local Area Network)その他の有線通信インターフェイス、あるいは、WiFi(Wireless Fidelity)、Bluetooth(登録商標)、NFC(Near Field Communication)その他の無線通信インターフェイスとして実現される。通信インターフェイス250は上述のものに限られない。 The communication interface 250 is connected to the network 2 and communicates with another computer (for example, the server 600) connected to the network 2. In a certain aspect, the communication interface 250 is realized as, for example, a LAN (Local Area Network) or other wired communication interface, or a WiFi (Wireless Fidelity), Bluetooth (registered trademark), NFC (Near Field Communication) or other wireless communication interface. Will be done. The communication interface 250 is not limited to the above.
ある局面において、プロセッサ210は、ストレージ230にアクセスし、ストレージ230に格納されている1つ以上のプログラムをメモリ220にロードし、当該プログラムに含まれる一連の命令を実行する。当該1つ以上のプログラムは、コンピュータ200のオペレーティングシステム、仮想空間を提供するためのアプリケーションプログラム、仮想空間で実行可能なゲームソフトウェア等を含み得る。プロセッサ210は、入出力インターフェイス240を介して、仮想空間を提供するための信号をHMD120に送る。HMD120は、その信号に基づいてモニタ130に映像を表示する。 In one aspect, the processor 210 accesses the storage 230, loads one or more programs stored in the storage 230 into the memory 220, and executes a series of instructions contained in the program. The one or more programs may include an operating system of a computer 200, an application program for providing a virtual space, game software that can be executed in the virtual space, and the like. The processor 210 sends a signal to the HMD 120 to provide virtual space via the input / output interface 240. The HMD 120 displays an image on the monitor 130 based on the signal.
図2に示される例では、コンピュータ200は、HMD120の外部に設けられる構成が示されているが、別の局面において、コンピュータ200は、HMD120に内蔵されてもよい。一例として、モニタ130を含む携帯型の情報通信端末(例えば、スマートフォン)がコンピュータ200として機能してもよい。 In the example shown in FIG. 2, the computer 200 is configured to be provided outside the HMD 120, but in another aspect, the computer 200 may be built in the HMD 120. As an example, a portable information communication terminal (for example, a smartphone) including a monitor 130 may function as a computer 200.
コンピュータ200は、複数のHMD120に共通して用いられる構成であってもよい。このような構成によれば、例えば、複数のユーザに同一の仮想空間を提供することもできるので、各ユーザは同一の仮想空間で他のユーザと同一のアプリケーションを楽しむことができる。 The computer 200 may have a configuration commonly used for a plurality of HMD 120s. According to such a configuration, for example, the same virtual space can be provided to a plurality of users, so that each user can enjoy the same application as other users in the same virtual space.
ある実施の形態において、HMDシステム100では、現実空間における座標系である実座標系が予め設定されている。実座標系は、現実空間における鉛直方向、鉛直方向に直交する水平方向、並びに、鉛直方向および水平方向の双方に直交する前後方向にそれぞれ平行な、3つの基準方向(軸)を有する。実座標系における水平方向、鉛直方向(上下方向)、および前後方向は、それぞれ、x軸、y軸、z軸と規定される。より具体的には、実座標系において、x軸は現実空間の水平方向に平行である。y軸は、現実空間の鉛直方向に平行である。z軸は現実空間の前後方向に平行である。 In a certain embodiment, in the HMD system 100, a real coordinate system, which is a coordinate system in the real space, is preset. The real coordinate system has three reference directions (axises) that are parallel to the vertical direction in the real space, the horizontal direction orthogonal to the vertical direction, and the front-back direction orthogonal to both the vertical direction and the horizontal direction. The horizontal direction, the vertical direction (vertical direction), and the front-back direction in the real coordinate system are defined as the x-axis, the y-axis, and the z-axis, respectively. More specifically, in the real coordinate system, the x-axis is parallel to the horizontal direction in real space. The y-axis is parallel to the vertical direction in real space. The z-axis is parallel to the front-back direction of the real space.
ある局面において、HMDセンサ410は、赤外線センサを含む。赤外線センサが、HMD120の各光源から発せられた赤外線をそれぞれ検出すると、HMD120の存在を検出する。HMDセンサ410は、さらに、各点の値(実座標系における各座標値)に基づいて、HMD120を装着したユーザ5の動きに応じた、現実空間内におけるHMD120の位置および傾き(向き)を検出する。より詳しくは、HMDセンサ410は、経時的に検出された各値を用いて、HMD120の位置および傾きの時間的変化を検出できる。 In some aspects, the HMD sensor 410 includes an infrared sensor. When the infrared sensor detects infrared rays emitted from each light source of the HMD 120, the presence of the HMD 120 is detected. The HMD sensor 410 further detects the position and inclination (orientation) of the HMD 120 in the real space according to the movement of the user 5 wearing the HMD 120 based on the value of each point (each coordinate value in the real coordinate system). do. More specifically, the HMD sensor 410 can detect a temporal change in the position and inclination of the HMD 120 by using each value detected over time.
HMDセンサ410によって検出されたHMD120の各傾きは、実座標系におけるHMD120の3軸周りの各傾きに相当する。HMDセンサ410は、実座標系におけるHMD120の傾きに基づき、uvw視野座標系をHMD120に設定する。HMD120に設定されるuvw視野座標系は、HMD120を装着したユーザ5が仮想空間において物体を見る際の視点座標系に対応する。 Each inclination of the HMD 120 detected by the HMD sensor 410 corresponds to each inclination of the HMD 120 around three axes in the real coordinate system. The HMD sensor 410 sets the uvw field coordinate system to the HMD 120 based on the inclination of the HMD 120 in the real coordinate system. The uvw field-of-view coordinate system set in the HMD 120 corresponds to the viewpoint coordinate system when the user 5 wearing the HMD 120 sees an object in the virtual space.
[uvw視野座標系]
図3を参照して、uvw視野座標系について説明する。図3は、ある実施の形態に従うHMD120に設定されるuvw視野座標系を概念的に表す図である。HMDセンサ410は、HMD120の起動時に、実座標系におけるHMD120の位置および傾きを検出する。プロセッサ210は、検出された値に基づいて、uvw視野座標系をHMD120に設定する。
[Uvw field coordinate system]
The uvw field coordinate system will be described with reference to FIG. FIG. 3 is a diagram conceptually representing the uvw field coordinate system set in the HMD 120 according to an embodiment. The HMD sensor 410 detects the position and tilt of the HMD 120 in the real coordinate system when the HMD 120 is activated. Processor 210 sets the uvw field coordinate system to HMD 120 based on the detected values.
図3に示されるように、HMD120は、HMD120を装着したユーザ5の頭部を中心(原点)とした3次元のuvw視野座標系を設定する。より具体的には、HMD120は、実座標系を規定する水平方向、鉛直方向、および前後方向(x軸、y軸、z軸)を、実座標系内においてHMD120の各軸周りの傾きだけ各軸周りにそれぞれ傾けることによって新たに得られる3つの方向を、HMD120におけるuvw視野座標系のピッチ軸(u軸)、ヨー軸(v軸)、およびロール軸(w軸)として設定する。 As shown in FIG. 3, the HMD 120 sets a three-dimensional uvw visual field coordinate system centered (origin) on the head of the user 5 wearing the HMD 120. More specifically, the HMD 120 defines the real coordinate system in the horizontal, vertical, and front-back directions (x-axis, y-axis, z-axis) by the inclination of the HMD 120 around each axis in the real coordinate system. The three directions newly obtained by tilting each around the axis are set as the pitch axis (u axis), the yaw axis (v axis), and the roll axis (w axis) of the uvw field coordinate system in the HMD 120.
ある局面において、HMD120を装着したユーザ5が直立し、かつ、正面を視認している場合、プロセッサ210は、実座標系に平行なuvw視野座標系をHMD120に設定する。この場合、実座標系における水平方向(x軸)、鉛直方向(y軸)、および前後方向(z軸)は、HMD120におけるuvw視野座標系のピッチ軸(u軸)、ヨー軸(v軸)、およびロール軸(w軸)に一致する。 In a certain aspect, when the user 5 wearing the HMD 120 is upright and visually recognizing the front, the processor 210 sets the uvw field coordinate system parallel to the real coordinate system to the HMD 120. In this case, the horizontal direction (x-axis), vertical direction (y-axis), and front-back direction (z-axis) in the real coordinate system are the pitch axis (u-axis) and yaw-axis (v-axis) of the uvw field coordinate system in the HMD 120. , And the roll axis (w axis).
uvw視野座標系がHMD120に設定された後、HMDセンサ410は、HMD120の動きに基づいて、設定されたuvw視野座標系におけるHMD120の傾きを検出できる。この場合、HMDセンサ410は、HMD120の傾きとして、uvw視野座標系におけるHMD120のピッチ角(θu)、ヨー角(θv)、およびロール角(θw)をそれぞれ検出する。ピッチ角(θu)は、uvw視野座標系におけるピッチ軸周りのHMD120の傾き角度を表す。ヨー角(θv)は、uvw視野座標系におけるヨー軸周りのHMD120の傾き角度を表す。ロール角(θw)は、uvw視野座標系におけるロール軸周りのHMD120の傾き角度を表す。 After the uvw field coordinate system is set to the HMD 120, the HMD sensor 410 can detect the tilt of the HMD 120 in the set uvw field coordinate system based on the movement of the HMD 120. In this case, the HMD sensor 410 detects the pitch angle (θu), yaw angle (θv), and roll angle (θw) of the HMD 120 in the uvw visual field coordinate system as the inclination of the HMD 120, respectively. The pitch angle (θu) represents the tilt angle of the HMD 120 around the pitch axis in the uvw visual field coordinate system. The yaw angle (θv) represents the tilt angle of the HMD 120 around the yaw axis in the uvw visual field coordinate system. The roll angle (θw) represents the tilt angle of the HMD 120 around the roll axis in the uvw field coordinate system.
HMDセンサ410は、検出されたHMD120の傾きに基づいて、HMD120が動いた後のHMD120におけるuvw視野座標系を、HMD120に設定する。HMD120と、HMD120のuvw視野座標系との関係は、HMD120の位置および傾きに関わらず、常に一定である。HMD120の位置および傾きが変わると、当該位置および傾きの変化に連動して、実座標系におけるHMD120のuvw視野座標系の位置および傾きが変化する。 The HMD sensor 410 sets the uvw field coordinate system in the HMD 120 after the HMD 120 has moved to the HMD 120 based on the detected inclination of the HMD 120. The relationship between the HMD 120 and the uvw field coordinate system of the HMD 120 is always constant regardless of the position and inclination of the HMD 120. When the position and inclination of the HMD 120 change, the position and inclination of the uvw visual field coordinate system of the HMD 120 in the real coordinate system change in conjunction with the change of the position and inclination.
ある局面において、HMDセンサ410は、赤外線センサからの出力に基づいて取得される赤外線の光強度および複数の点間の相対的な位置関係(例えば、各点間の距離など)に基づいて、HMD120の現実空間内における位置を、HMDセンサ410に対する相対位置として特定してもよい。プロセッサ210は、特定された相対位置に基づいて、現実空間内(実座標系)におけるHMD120のuvw視野座標系の原点を決定してもよい。 In one aspect, the HMD sensor 410 determines the HMD 120 based on the intensity of the infrared light obtained based on the output from the infrared sensor and the relative positional relationship between the points (eg, the distance between the points). The position of the above in the real space may be specified as a relative position with respect to the HMD sensor 410. The processor 210 may determine the origin of the uvw visual field coordinate system of the HMD 120 in real space (real coordinate system) based on the identified relative position.
[仮想空間]
図4を参照して、仮想空間についてさらに説明する。図4は、ある実施の形態に従う仮想空間11を表現する一態様を概念的に表す図である。仮想空間11は、中心12の360度方向の全体を覆う全天球状の構造を有する。図4では、説明を複雑にしないために、仮想空間11のうちの上半分の天球が例示されている。仮想空間11では各メッシュが規定される。各メッシュの位置は、仮想空間11に規定されるグローバル座標系であるXYZ座標系における座標値として予め規定されている。コンピュータ200は、仮想空間11に展開可能なパノラマ画像13(静止画、動画等)を構成する各部分画像を、仮想空間11において対応する各メッシュにそれぞれ対応付ける。
[Virtual space]
The virtual space will be further described with reference to FIG. FIG. 4 is a diagram conceptually representing one aspect of expressing the virtual space 11 according to a certain embodiment. The virtual space 11 has an all-sky spherical structure that covers the entire center 12 in the 360-degree direction. In FIG. 4, the celestial sphere in the upper half of the virtual space 11 is illustrated so as not to complicate the explanation. Each mesh is defined in the virtual space 11. The position of each mesh is predetermined as a coordinate value in the XYZ coordinate system, which is a global coordinate system defined in the virtual space 11. The computer 200 associates each partial image constituting the panoramic image 13 (still image, moving image, etc.) expandable in the virtual space 11 with each corresponding mesh in the virtual space 11.
ある局面において、仮想空間11では、中心12を原点とするXYZ座標系が規定される。XYZ座標系は、例えば、実座標系に平行である。XYZ座標系における水平方向、鉛直方向(上下方向)、および前後方向は、それぞれX軸、Y軸、Z軸として規定される。したがって、XYZ座標系のX軸(水平方向)が実座標系のx軸と平行であり、XYZ座標系のY軸(鉛直方向)が実座標系のy軸と平行であり、XYZ座標系のZ軸(前後方向)が実座標系のz軸と平行である。 In a certain aspect, the virtual space 11 defines an XYZ coordinate system with the center 12 as the origin. The XYZ coordinate system is, for example, parallel to the real coordinate system. The horizontal direction, vertical direction (vertical direction), and front-back direction in the XYZ coordinate system are defined as the X-axis, the Y-axis, and the Z-axis, respectively. Therefore, the X-axis (horizontal direction) of the XYZ coordinate system is parallel to the x-axis of the real coordinate system, and the Y-axis (vertical direction) of the XYZ coordinate system is parallel to the y-axis of the real coordinate system. The Z-axis (front-back direction) is parallel to the z-axis of the real coordinate system.
HMD120の起動時、すなわちHMD120の初期状態において、仮想カメラ14が、仮想空間11の中心12に配置される。ある局面において、プロセッサ210は、仮想カメラ14が撮影する画像をHMD120のモニタ130に表示する。仮想カメラ14は、現実空間におけるHMD120の動きに連動して、仮想空間11を同様に移動する。これにより、現実空間におけるHMD120の位置および傾きの変化が、仮想空間11において同様に再現され得る。 At the time of starting the HMD 120, that is, in the initial state of the HMD 120, the virtual camera 14 is arranged at the center 12 of the virtual space 11. In one aspect, the processor 210 displays an image captured by the virtual camera 14 on the monitor 130 of the HMD 120. The virtual camera 14 moves in the virtual space 11 in the same manner in conjunction with the movement of the HMD 120 in the real space. As a result, changes in the position and inclination of the HMD 120 in the real space can be similarly reproduced in the virtual space 11.
仮想カメラ14には、HMD120の場合と同様に、uvw視野座標系が規定される。仮想空間11における仮想カメラ14のuvw視野座標系は、現実空間(実座標系)におけるHMD120のuvw視野座標系に連動するように規定されている。したがって、HMD120の傾きが変化すると、それに応じて、仮想カメラ14の傾きも変化する。仮想カメラ14は、HMD120を装着したユーザ5の現実空間における移動に連動して、仮想空間11において移動することもできる。 As in the case of the HMD 120, the virtual camera 14 is defined with an uvw field-of-view coordinate system. The uvw field-of-view coordinate system of the virtual camera 14 in the virtual space 11 is defined to be linked to the uvw field-of-view coordinate system of the HMD 120 in the real space (real coordinate system). Therefore, when the inclination of the HMD 120 changes, the inclination of the virtual camera 14 also changes accordingly. The virtual camera 14 can also move in the virtual space 11 in conjunction with the movement of the user 5 wearing the HMD 120 in the real space.
コンピュータ200のプロセッサ210は、仮想カメラ14の位置と傾き(基準視線16)とに基づいて、仮想空間11における視界領域15を規定する。視界領域15は、仮想空間11のうち、HMD120を装着したユーザ5が視認する領域に対応する。つまり、仮想カメラ14の位置は、仮想空間11におけるユーザ5の視点と言える。 The processor 210 of the computer 200 defines the field of view 15 in the virtual space 11 based on the position and tilt (reference line of sight 16) of the virtual camera 14. The visual field area 15 corresponds to an area in the virtual space 11 that is visually recognized by the user 5 wearing the HMD 120. That is, the position of the virtual camera 14 can be said to be the viewpoint of the user 5 in the virtual space 11.
注視センサ140によって検出されるユーザ5の視線は、ユーザ5が物体を視認する際の視点座標系における方向である。HMD120のuvw視野座標系は、ユーザ5がモニタ130を視認する際の視点座標系に等しい。仮想カメラ14のuvw視野座標系は、HMD120のuvw視野座標系に連動している。したがって、ある局面に従うHMDシステム100は、注視センサ140によって検出されたユーザ5の視線を、仮想カメラ14のuvw視野座標系におけるユーザ5の視線とみなすことができる。 The line of sight of the user 5 detected by the gaze sensor 140 is a direction in the viewpoint coordinate system when the user 5 visually recognizes an object. The uvw field-of-view coordinate system of the HMD 120 is equal to the viewpoint coordinate system when the user 5 visually recognizes the monitor 130. The uvw field-of-view coordinate system of the virtual camera 14 is linked to the uvw field-of-view coordinate system of the HMD 120. Therefore, the HMD system 100 according to a certain aspect can consider the line of sight of the user 5 detected by the gaze sensor 140 as the line of sight of the user 5 in the uvw field of view coordinate system of the virtual camera 14.
[ユーザの視線]
図5を参照して、ユーザ5の視線の決定について説明する。図5は、ある実施の形態に従うHMD120を装着するユーザ5の頭部を上から表した図である。
[User's line of sight]
The determination of the line of sight of the user 5 will be described with reference to FIG. FIG. 5 is a top view of the head of the user 5 who wears the HMD 120 according to an embodiment.
ある局面において、注視センサ140は、ユーザ5の右目および左目の各視線を検出する。ある局面において、ユーザ5が近くを見ている場合、注視センサ140は、視線R1およびL1を検出する。別の局面において、ユーザ5が遠くを見ている場合、注視センサ140は、視線R2およびL2を検出する。この場合、ロール軸wに対して視線R2およびL2が成す角度は、ロール軸wに対して視線R1およびL1が成す角度よりも小さい。注視センサ140は、検出結果をコンピュータ200に送信する。 In one aspect, the gaze sensor 140 detects each line of sight of the user 5's right and left eyes. In a certain aspect, when the user 5 is looking near, the gaze sensor 140 detects the lines of sight R1 and L1. In another aspect, when the user 5 is looking far away, the gaze sensor 140 detects the lines of sight R2 and L2. In this case, the angle formed by the lines of sight R2 and L2 with respect to the roll axis w is smaller than the angle formed by the lines of sight R1 and L1 with respect to the roll axis w. The gaze sensor 140 transmits the detection result to the computer 200.
コンピュータ200が、視線の検出結果として、視線R1およびL1の検出値を注視センサ140から受信した場合には、その検出値に基づいて、視線R1およびL1の交点である注視点N1を特定する。一方、コンピュータ200は、視線R2およびL2の検出値を注視センサ140から受信した場合には、視線R2およびL2の交点を注視点として特定する。コンピュータ200は、特定した注視点N1の位置に基づき、ユーザ5の視線N0を特定する。コンピュータ200は、例えば、ユーザ5の右目Rと左目Lとを結ぶ直線の中点と、注視点N1とを通る直線の延びる方向を、視線N0として検出する。視線N0は、ユーザ5が両目により実際に視線を向けている方向である。視線N0は、視界領域15に対してユーザ5が実際に視線を向けている方向に相当する。 When the computer 200 receives the detection values of the lines of sight R1 and L1 from the gaze sensor 140 as the detection result of the line of sight, the computer 200 identifies the gaze point N1 which is the intersection of the lines of sight R1 and L1 based on the detected values. On the other hand, when the computer 200 receives the detected values of the lines of sight R2 and L2 from the gaze sensor 140, the computer 200 identifies the intersection of the lines of sight R2 and L2 as the gaze point. The computer 200 identifies the line of sight N0 of the user 5 based on the position of the specified gazing point N1. The computer 200 detects, for example, the extending direction of the straight line passing through the midpoint of the straight line connecting the right eye R and the left eye L of the user 5 and the gazing point N1 as the line of sight N0. The line of sight N0 is the direction in which the user 5 actually directs the line of sight with both eyes. The line of sight N0 corresponds to the direction in which the user 5 actually directs the line of sight with respect to the field of view area 15.
別の局面において、HMDシステム100は、テレビジョン放送受信チューナを備えてもよい。このような構成によれば、HMDシステム100は、仮想空間11においてテレビ番組を表示することができる。 In another aspect, the HMD system 100 may include a television broadcast receiving tuner. According to such a configuration, the HMD system 100 can display a television program in the virtual space 11.
さらに別の局面において、HMDシステム100は、インターネットに接続するための通信回路、あるいは、電話回線に接続するための通話機能を備えていてもよい。 In yet another aspect, the HMD system 100 may include a communication circuit for connecting to the Internet or a telephone function for connecting to a telephone line.
[視界領域]
図6および図7を参照して、視界領域15について説明する。図6は、仮想空間11において視界領域15をX方向から見たYZ断面を表す図である。図7は、仮想空間11において視界領域15をY方向から見たXZ断面を表す図である。
[Visibility area]
The field of view 15 will be described with reference to FIGS. 6 and 7. FIG. 6 is a diagram showing a YZ cross section of the field of view region 15 viewed from the X direction in the virtual space 11. FIG. 7 is a diagram showing an XZ cross section of the field of view region 15 viewed from the Y direction in the virtual space 11.
図6に示されるように、YZ断面における視界領域15は、領域18を含む。領域18は、仮想カメラ14の位置と基準視線16と仮想空間11のYZ断面とによって定義される。プロセッサ210は、仮想空間における基準視線16を中心として極角αを含む範囲を、領域18として規定する。 As shown in FIG. 6, the field of view region 15 in the YZ cross section includes the region 18. The region 18 is defined by the position of the virtual camera 14, the reference line of sight 16, and the YZ cross section of the virtual space 11. The processor 210 defines a range including the polar angle α centered on the reference line of sight 16 in the virtual space as a region 18.
図7に示されるように、XZ断面における視界領域15は、領域19を含む。領域19は、仮想カメラ14の位置と基準視線16と仮想空間11のXZ断面とによって定義される。プロセッサ210は、仮想空間11における基準視線16を中心とした方位角βを含む範囲を、領域19として規定する。極角αおよびβは、仮想カメラ14の位置と仮想カメラ14の傾き(向き)とに応じて定まる。 As shown in FIG. 7, the field of view region 15 in the XZ cross section includes the region 19. The region 19 is defined by the position of the virtual camera 14, the reference line of sight 16, and the XZ cross section of the virtual space 11. The processor 210 defines a range including the azimuth angle β centered on the reference line of sight 16 in the virtual space 11 as a region 19. The polar angles α and β are determined according to the position of the virtual camera 14 and the inclination (orientation) of the virtual camera 14.
ある局面において、HMDシステム100は、コンピュータ200からの信号に基づいて、視界画像17をモニタ130に表示させることにより、ユーザ5に仮想空間11における視界を提供する。視界画像17は、パノラマ画像13のうち視界領域15に対応する部分に相当する画像である。ユーザ5が、頭に装着したHMD120を動かすと、その動きに連動して仮想カメラ14も動く。その結果、仮想空間11における視界領域15の位置が変化する。これにより、モニタ130に表示される視界画像17は、パノラマ画像13のうち、仮想空間11においてユーザ5が向いた方向の視界領域15に重畳する画像に更新される。ユーザ5は、仮想空間11における所望の方向を視認することができる。 In a certain aspect, the HMD system 100 provides the user 5 with a field of view in the virtual space 11 by displaying the field of view image 17 on the monitor 130 based on the signal from the computer 200. The field-of-view image 17 is an image corresponding to a portion of the panoramic image 13 corresponding to the field-of-view area 15. When the user 5 moves the HMD 120 attached to the head, the virtual camera 14 also moves in conjunction with the movement. As a result, the position of the visual field region 15 in the virtual space 11 changes. As a result, the field of view image 17 displayed on the monitor 130 is updated to an image of the panorama image 13 superimposed on the field of view area 15 in the direction in which the user 5 faces in the virtual space 11. The user 5 can visually recognize a desired direction in the virtual space 11.
このように、仮想カメラ14の傾きは仮想空間11におけるユーザ5の視線(基準視線16)に相当し、仮想カメラ14が配置される位置は、仮想空間11におけるユーザ5の視点に相当する。したがって、仮想カメラ14の位置または傾きを変更することにより、モニタ130に表示される画像が更新され、ユーザ5の視界が移動される。 As described above, the inclination of the virtual camera 14 corresponds to the line of sight (reference line of sight 16) of the user 5 in the virtual space 11, and the position where the virtual camera 14 is arranged corresponds to the viewpoint of the user 5 in the virtual space 11. Therefore, by changing the position or tilt of the virtual camera 14, the image displayed on the monitor 130 is updated, and the field of view of the user 5 is moved.
ユーザ5は、HMD120を装着している間、現実世界を視認することなく、仮想空間11に展開されるパノラマ画像13のみを視認できる。そのため、HMDシステム100は、仮想空間11への高い没入感覚をユーザ5に与えることができる。 While wearing the HMD 120, the user 5 can visually recognize only the panoramic image 13 developed in the virtual space 11 without visually recognizing the real world. Therefore, the HMD system 100 can give the user 5 a high sense of immersion in the virtual space 11.
ある局面において、プロセッサ210は、HMD120を装着したユーザ5の現実空間における移動に連動して、仮想空間11において仮想カメラ14を移動し得る。この場合、プロセッサ210は、仮想空間11における仮想カメラ14の位置および傾きに基づいて、HMD120のモニタ130に投影される画像領域(視界領域15)を特定する。 In a certain aspect, the processor 210 may move the virtual camera 14 in the virtual space 11 in conjunction with the movement of the user 5 wearing the HMD 120 in the real space. In this case, the processor 210 identifies an image region (field of view region 15) projected onto the monitor 130 of the HMD 120 based on the position and tilt of the virtual camera 14 in the virtual space 11.
ある局面において、仮想カメラ14は、2つの仮想カメラ、すなわち、右目用の画像を提供するための仮想カメラと、左目用の画像を提供するための仮想カメラとを含み得る。ユーザ5が3次元の仮想空間11を認識できるように、適切な視差が、2つの仮想カメラに設定される。別の局面において、仮想カメラ14を1つの仮想カメラにより実現してもよい。この場合、1つの仮想カメラにより得られた画像から、右目用の画像と左目用の画像とを生成するようにしてもよい。本実施の形態においては、仮想カメラ14が2つの仮想カメラを含み、2つの仮想カメラのロール軸が合成されることによって生成されるロール軸(w)がHMD120のロール軸(w)に適合されるように構成されているものとして、本開示に係る技術思想を例示する。 In some aspects, the virtual camera 14 may include two virtual cameras, a virtual camera for providing an image for the right eye and a virtual camera for providing an image for the left eye. Appropriate parallax is set for the two virtual cameras so that the user 5 can recognize the three-dimensional virtual space 11. In another aspect, the virtual camera 14 may be realized by one virtual camera. In this case, an image for the right eye and an image for the left eye may be generated from the image obtained by one virtual camera. In the present embodiment, the virtual camera 14 includes two virtual cameras, and the roll axis (w) generated by synthesizing the roll axes of the two virtual cameras is adapted to the roll axis (w) of the HMD 120. The technical idea of the present disclosure is illustrated as being configured as such.
[コントローラ]
図8を参照して、コントローラ300の一例について説明する。図8は、ある実施の形態に従うコントローラ300の概略構成を表す図である。
[controller]
An example of the controller 300 will be described with reference to FIG. FIG. 8 is a diagram showing a schematic configuration of a controller 300 according to an embodiment.
図8に示されるように、ある局面において、コントローラ300は、右コントローラ300Rと図示せぬ左コントローラとを含み得る。右コントローラ300Rは、ユーザ5の右手で操作される。左コントローラは、ユーザ5の左手で操作される。ある局面において、右コントローラ300Rと左コントローラとは、別個の装置として対称に構成される。したがって、ユーザ5は、右コントローラ300Rを把持した右手と、左コントローラを把持した左手とをそれぞれ自由に動かすことができる。別の局面において、コントローラ300は両手の操作を受け付ける一体型のコントローラであってもよい。以下、右コントローラ300Rについて説明する。 As shown in FIG. 8, in some aspects, the controller 300 may include a right controller 300R and a left controller (not shown). The right controller 300R is operated by the right hand of the user 5. The left controller is operated by the left hand of the user 5. In a certain aspect, the right controller 300R and the left controller are symmetrically configured as separate devices. Therefore, the user 5 can freely move the right hand holding the right controller 300R and the left hand holding the left controller. In another aspect, the controller 300 may be an integrated controller that accepts operations of both hands. Hereinafter, the right controller 300R will be described.
右コントローラ300Rは、グリップ310と、フレーム320と、天面330とを備える。グリップ310は、ユーザ5の右手によって把持されるように構成されている。たとえば、グリップ310は、ユーザ5の右手の掌と3本の指(中指、薬指、小指)とによって保持され得る。 The right controller 300R includes a grip 310, a frame 320, and a top surface 330. The grip 310 is configured to be gripped by the right hand of the user 5. For example, the grip 310 may be held by the palm of the user 5's right hand and three fingers (middle finger, ring finger, little finger).
グリップ310は、ボタン340,350と、モーションセンサ420とを含む。ボタン340は、グリップ310の側面に配置され、右手の中指による操作を受け付ける。ボタン350は、グリップ310の前面に配置され、右手の人差し指による操作を受け付ける。ある局面において、ボタン340,350は、トリガー式のボタンとして構成される。モーションセンサ420は、グリップ310の筐体に内蔵されている。ユーザ5の動作がカメラその他の装置によってユーザ5の周りから検出可能である場合には、グリップ310は、モーションセンサ420を備えなくてもよい。 The grip 310 includes buttons 340, 350 and a motion sensor 420. The button 340 is arranged on the side surface of the grip 310 and accepts an operation by the middle finger of the right hand. The button 350 is arranged in front of the grip 310 and accepts an operation by the index finger of the right hand. In one aspect, the buttons 340,350 are configured as trigger-type buttons. The motion sensor 420 is built in the housing of the grip 310. If the movement of the user 5 can be detected from around the user 5 by a camera or other device, the grip 310 may not include the motion sensor 420.
フレーム320は、その円周方向に沿って配置された複数の赤外線LED360を含む。赤外線LED360は、コントローラ300を使用するプログラムの実行中に、当該プログラムの進行に合わせて赤外線を発光する。赤外線LED360から発せられた赤外線は、右コントローラ300Rと左コントローラとの各位置や姿勢(傾き、向き)を検出するために使用され得る。図8に示される例では、二列に配置された赤外線LED360が示されているが、配列の数は図8に示されるものに限られない。一列あるいは3列以上の配列が使用されてもよい。 The frame 320 includes a plurality of infrared LEDs 360 arranged along its circumferential direction. The infrared LED 360 emits infrared rays as the program progresses while the program using the controller 300 is being executed. The infrared rays emitted from the infrared LED 360 can be used to detect each position and orientation (tilt, orientation) of the right controller 300R and the left controller. In the example shown in FIG. 8, infrared LEDs 360 arranged in two rows are shown, but the number of arrays is not limited to that shown in FIG. An array of one column or three or more columns may be used.
天面330は、ボタン370,380と、アナログスティック390とを備える。ボタン370,380は、プッシュ式ボタンとして構成される。ボタン370,380は、ユーザ5の右手の親指による操作を受け付ける。アナログスティック390は、ある局面において、初期位置(ニュートラルの位置)から360度任意の方向への操作を受け付ける。当該操作は、たとえば、仮想空間11に配置されるオブジェクトを移動するための操作を含む。 The top surface 330 includes buttons 370, 380 and an analog stick 390. The buttons 370 and 380 are configured as push-type buttons. Buttons 370 and 380 accept operations by the thumb of the user 5's right hand. The analog stick 390 accepts an operation 360 degrees in any direction from the initial position (neutral position) in a certain aspect. The operation includes, for example, an operation for moving an object arranged in the virtual space 11.
ある局面において、右コントローラ300Rおよび左コントローラは、赤外線LED360その他の部材を駆動するための電池を含む。電池は、充電式、ボタン型、乾電池型などを含むが、これらに限定されない。別の局面において、右コントローラ300Rと左コントローラは、たとえば、コンピュータ200のUSBインターフェースに接続され得る。この場合、右コントローラ300Rおよび左コントローラは、電池を必要としない。 In one aspect, the right controller 300R and the left controller include a battery for driving the infrared LED 360 and other components. Batteries include, but are not limited to, rechargeable, button type, dry cell type and the like. In another aspect, the right controller 300R and the left controller may be connected to, for example, the USB interface of the computer 200. In this case, the right controller 300R and the left controller do not require batteries.
図8の状態(A)および状態(B)に示されるように、例えば、ユーザ5の右手に対して、ヨー、ロール、ピッチの各方向が規定される。ユーザ5が親指と人差し指とを伸ばした場合に、親指の伸びる方向がヨー方向、人差し指の伸びる方向がロール方向、ヨー方向の軸およびロール方向の軸によって規定される平面に垂直な方向がピッチ方向として規定される。 As shown in the states (A) and (B) of FIG. 8, for example, the yaw, roll, and pitch directions are defined with respect to the right hand of the user 5. When the user 5 extends the thumb and the index finger, the direction in which the thumb extends is the yaw direction, the direction in which the index finger extends is the roll direction, and the direction perpendicular to the plane defined by the yaw direction axis and the roll direction axis is the pitch direction. Is defined as.
[サーバのハードウェア構成]
図9を参照して、本実施の形態に係るサーバ600について説明する。図9は、ある実施の形態に従うサーバ600のハードウェア構成の一例を表すブロック図である。サーバ600は、主たる構成要素として、プロセッサ610と、メモリ620と、ストレージ630と、入出力インターフェイス640と、通信インターフェイス650とを備える。各構成要素は、それぞれ、バス660に接続されている。
[Server hardware configuration]
The server 600 according to the present embodiment will be described with reference to FIG. FIG. 9 is a block diagram showing an example of the hardware configuration of the server 600 according to a certain embodiment. The server 600 includes a processor 610, a memory 620, a storage 630, an input / output interface 640, and a communication interface 650 as main components. Each component is connected to bus 660, respectively.
プロセッサ610は、サーバ600に与えられる信号に基づいて、あるいは、予め定められた条件が成立したことに基づいて、メモリ620またはストレージ630に格納されているプログラムに含まれる一連の命令を実行する。ある局面において、プロセッサ610は、CPU、GPU、MPU、FPGAその他のデバイスとして実現される。 The processor 610 executes a series of instructions contained in the program stored in the memory 620 or the storage 630 based on the signal given to the server 600 or the condition that a predetermined condition is satisfied. In some aspects, the processor 610 is implemented as a CPU, GPU, MPU, FPGA or other device.
メモリ620は、プログラムおよびデータを一時的に保存する。プログラムは、例えば、ストレージ630からロードされる。データは、サーバ600に入力されたデータと、プロセッサ610によって生成されたデータとを含む。ある局面において、メモリ620は、RAMその他の揮発メモリとして実現される。 Memory 620 temporarily stores programs and data. The program is loaded from storage 630, for example. The data includes data input to the server 600 and data generated by the processor 610. In one aspect, the memory 620 is realized as a RAM or other volatile memory.
ストレージ630は、プログラムおよびデータを永続的に保持する。ストレージ630は、例えば、ROM、ハードディスク装置、フラッシュメモリ、その他の不揮発記憶装置として実現される。ストレージ630に格納されるプログラムは、HMDシステム100において仮想空間を提供するためのプログラム、シミュレーションプログラム、ゲームプログラム、ユーザ認証プログラム、コンピュータ200との通信を実現するためのプログラムを含んでもよい。ストレージ630に格納されるデータは、仮想空間を規定するためのデータおよびオブジェクト等を含んでもよい。 Storage 630 permanently holds programs and data. The storage 630 is realized as, for example, a ROM, a hard disk device, a flash memory, or other non-volatile storage device. The program stored in the storage 630 may include a program for providing a virtual space in the HMD system 100, a simulation program, a game program, a user authentication program, and a program for realizing communication with the computer 200. The data stored in the storage 630 may include data, objects, and the like for defining the virtual space.
別の局面において、ストレージ630は、メモリカードのように着脱可能な記憶装置として実現されてもよい。さらに別の局面において、サーバ600に内蔵されたストレージ630の代わりに、外部の記憶装置に保存されているプログラムおよびデータを使用する構成が使用されてもよい。このような構成によれば、例えば、アミューズメント施設のように複数のHMDシステム100が使用される場面において、プログラムやデータの更新を一括して行うことが可能になる。 In another aspect, the storage 630 may be realized as a removable storage device such as a memory card. In yet another aspect, a configuration using programs and data stored in an external storage device may be used instead of the storage 630 built into the server 600. According to such a configuration, for example, in a scene where a plurality of HMD systems 100 are used such as an amusement facility, it is possible to update programs and data at once.
入出力インターフェイス640は、入出力機器との間で信号を通信する。ある局面において、入出力インターフェイス640は、USB、DVI、HDMI(登録商標)その他の端子を用いて実現される。入出力インターフェイス640は上述のものに限られない。 The input / output interface 640 communicates a signal with the input / output device. In some aspects, the input / output interface 640 is implemented using USB, DVI, HDMI® and other terminals. The input / output interface 640 is not limited to the above.
通信インターフェイス650は、ネットワーク2に接続されて、ネットワーク2に接続されているコンピュータ200と通信する。ある局面において、通信インターフェイス650は、例えば、LANその他の有線通信インターフェイス、あるいは、WiFi、Bluetooth、NFCその他の無線通信インターフェイスとして実現される。通信インターフェイス650は上述のものに限られない。 The communication interface 650 is connected to the network 2 and communicates with the computer 200 connected to the network 2. In some aspects, the communication interface 650 is implemented as, for example, a LAN or other wired communication interface, or a WiFi, Bluetooth, NFC or other wireless communication interface. The communication interface 650 is not limited to the above.
ある局面において、プロセッサ610は、ストレージ630にアクセスし、ストレージ630に格納されている1つ以上のプログラムをメモリ620にロードし、当該プログラムに含まれる一連の命令を実行する。当該1つ以上のプログラムは、サーバ600のオペレーティングシステム、仮想空間を提供するためのアプリケーションプログラム、仮想空間で実行可能なゲームソフトウェア等を含み得る。プロセッサ610は、入出力インターフェイス640を介して、仮想空間を提供するための信号をコンピュータ200に送ってもよい。 In one aspect, the processor 610 accesses the storage 630, loads one or more programs stored in the storage 630 into the memory 620, and executes a series of instructions contained in the program. The one or more programs may include an operating system for the server 600, an application program for providing the virtual space, game software that can be executed in the virtual space, and the like. The processor 610 may send a signal to the computer 200 to provide virtual space via the input / output interface 640.
[HMDの制御装置]
図10を参照して、HMD120の制御装置について説明する。ある実施の形態において、制御装置は周知の構成を有するコンピュータ200によって実現される。図10は、ある実施の形態に従うコンピュータ200をモジュール構成として表すブロック図である。
[HMD control device]
The control device of the HMD 120 will be described with reference to FIG. In certain embodiments, the control device is implemented by a computer 200 having a well-known configuration. FIG. 10 is a block diagram showing a computer 200 according to an embodiment as a module configuration.
図10に示されるように、コンピュータ200は、コントロールモジュール510と、レンダリングモジュール520と、メモリモジュール530と、通信制御モジュール540とを備える。ある局面において、コントロールモジュール510とレンダリングモジュール520とは、プロセッサ210によって実現される。別の局面において、複数のプロセッサ210がコントロールモジュール510とレンダリングモジュール520として作動してもよい。メモリモジュール530は、メモリ220またはストレージ230によって実現される。通信制御モジュール540は、通信インターフェイス250によって実現される。 As shown in FIG. 10, the computer 200 includes a control module 510, a rendering module 520, a memory module 530, and a communication control module 540. In some aspects, the control module 510 and the rendering module 520 are implemented by the processor 210. In another aspect, the plurality of processors 210 may operate as the control module 510 and the rendering module 520. The memory module 530 is realized by the memory 220 or the storage 230. The communication control module 540 is realized by the communication interface 250.
コントロールモジュール510は、ユーザ5に提供される仮想空間11を制御する。コントロールモジュール510は、仮想空間11を表す仮想空間データを用いて、HMDシステム100における仮想空間11を規定する。仮想空間データは、例えば、メモリモジュール530に記憶されている。コントロールモジュール510が、仮想空間データを生成したり、サーバ600などから仮想空間データを取得するようにしたりしてもよい。 The control module 510 controls the virtual space 11 provided to the user 5. The control module 510 defines the virtual space 11 in the HMD system 100 by using the virtual space data representing the virtual space 11. The virtual space data is stored in, for example, the memory module 530. The control module 510 may generate virtual space data or acquire virtual space data from a server 600 or the like.
コントロールモジュール510は、オブジェクトを表すオブジェクトデータを用いて、仮想空間11にオブジェクトを配置する。オブジェクトデータは、例えば、メモリモジュール530に記憶されている。コントロールモジュール510が、オブジェクトデータを生成したり、サーバ600などからオブジェクトデータを取得するようにしたりしてもよい。オブジェクトは、例えば、ユーザ5の分身であるアバターオブジェクト、キャラクタオブジェクト、コントローラ300によって操作される仮想手などの操作オブジェクト、ゲームのストーリーの進行に従って配置される森、山その他を含む風景、街並み、動物等を含み得る。 The control module 510 arranges an object in the virtual space 11 by using the object data representing the object. The object data is stored in, for example, the memory module 530. The control module 510 may generate object data or acquire object data from a server 600 or the like. The objects are, for example, an avatar object that is the alter ego of the user 5, a character object, an operation object such as a virtual hand operated by the controller 300, a landscape including forests, mountains, etc. arranged as the story of the game progresses, a cityscape, and animals. Etc. may be included.
コントロールモジュール510は、ネットワーク2を介して接続される他のコンピュータ200のユーザ5のアバターオブジェクトを仮想空間11に配置する。ある局面において、コントロールモジュール510は、ユーザ5のアバターオブジェクトを仮想空間11に配置する。ある局面において、コントロールモジュール510は、ユーザ5を含む画像に基づいて、ユーザ5を模したアバターオブジェクトを仮想空間11に配置する。別の局面において、コントロールモジュール510は、複数種類のアバターオブジェクト(例えば、動物を模したオブジェクトや、デフォルメされた人のオブジェクト)の中からユーザ5による選択を受け付けたアバターオブジェクトを仮想空間11に配置する。 The control module 510 arranges the avatar object of the user 5 of another computer 200 connected via the network 2 in the virtual space 11. In a certain aspect, the control module 510 arranges the avatar object of the user 5 in the virtual space 11. In a certain aspect, the control module 510 arranges an avatar object imitating the user 5 in the virtual space 11 based on the image including the user 5. In another aspect, the control module 510 arranges in the virtual space 11 an avatar object that has been selected by the user 5 from among a plurality of types of avatar objects (for example, an object imitating an animal or a deformed human object). do.
コントロールモジュール510は、HMDセンサ410の出力に基づいてHMD120の傾きを特定する。別の局面において、コントロールモジュール510は、モーションセンサとして機能するセンサ190の出力に基づいてHMD120の傾きを特定する。コントロールモジュール510は、第1カメラ150および第2カメラ160が生成するユーザ5の顔の画像から、ユーザ5の顔を構成する器官(例えば、口,目,眉)を検出する。コントロールモジュール510は、検出した各器官の動き(形状)を検出する。 The control module 510 identifies the tilt of the HMD 120 based on the output of the HMD sensor 410. In another aspect, the control module 510 identifies the tilt of the HMD 120 based on the output of the sensor 190, which functions as a motion sensor. The control module 510 detects organs (for example, mouth, eyes, eyebrows) constituting the face of the user 5 from the images of the face of the user 5 generated by the first camera 150 and the second camera 160. The control module 510 detects the movement (shape) of each detected organ.
コントロールモジュール510は、注視センサ140からの信号に基づいて、ユーザ5の仮想空間11における視線を検出する。コントロールモジュール510は、検出したユーザ5の視線と仮想空間11の天球とが交わる視点位置(XYZ座標系における座標値)を検出する。より具体的には、コントロールモジュール510は、uvw座標系で規定されるユーザ5の視線と、仮想カメラ14の位置および傾きとに基づいて、視点位置を検出する。コントロールモジュール510は、検出した視点位置をサーバ600に送信する。別の局面において、コントロールモジュール510は、ユーザ5の視線を表す視線情報をサーバ600に送信するように構成されてもよい。係る場合、サーバ600が受信した視線情報に基づいて視点位置を算出し得る。 The control module 510 detects the line of sight of the user 5 in the virtual space 11 based on the signal from the gaze sensor 140. The control module 510 detects the viewpoint position (coordinate value in the XYZ coordinate system) at which the detected line of sight of the user 5 and the celestial sphere in the virtual space 11 intersect. More specifically, the control module 510 detects the viewpoint position based on the line of sight of the user 5 defined by the uvw coordinate system and the position and inclination of the virtual camera 14. The control module 510 transmits the detected viewpoint position to the server 600. In another aspect, the control module 510 may be configured to transmit line-of-sight information representing the line-of-sight of the user 5 to the server 600. In such a case, the viewpoint position can be calculated based on the line-of-sight information received by the server 600.
コントロールモジュール510は、HMDセンサ410が検出するHMD120の動きをアバターオブジェクトに反映する。例えば、コントロールモジュール510は、HMD120が傾いたことを検知して、アバターオブジェクトを傾けて配置する。コントロールモジュール510は、検出した顔器官の動作を、仮想空間11に配置されるアバターオブジェクトの顔に反映させる。コントロールモジュール510は、サーバ600から他のユーザ5の視線情報を受信し、当該他のユーザ5のアバターオブジェクトの視線に反映させる。ある局面において、コントロールモジュール510は、コントローラ300の動きをアバターオブジェクトや操作オブジェクトに反映する。この場合、コントローラ300は、コントローラ300の動きを検知するためのモーションセンサ、加速度センサ、または複数の発光素子(例えば、赤外線LED)などを備える。 The control module 510 reflects the movement of the HMD 120 detected by the HMD sensor 410 on the avatar object. For example, the control module 510 detects that the HMD 120 is tilted and tilts and arranges the avatar object. The control module 510 reflects the detected movement of the facial organ on the face of the avatar object arranged in the virtual space 11. The control module 510 receives the line-of-sight information of the other user 5 from the server 600 and reflects it in the line-of-sight of the avatar object of the other user 5. In a certain aspect, the control module 510 reflects the movement of the controller 300 on the avatar object and the operation object. In this case, the controller 300 includes a motion sensor, an acceleration sensor, a plurality of light emitting elements (for example, infrared LEDs), and the like for detecting the movement of the controller 300.
コントロールモジュール510は、仮想空間11においてユーザ5の操作を受け付けるための操作オブジェクトを仮想空間11に配置する。ユーザ5は、操作オブジェクトを操作することにより、例えば、仮想空間11に配置されるオブジェクトを操作する。ある局面において、操作オブジェクトは、例えば、ユーザ5の手に相当する仮想手である手オブジェクト等を含み得る。ある局面において、コントロールモジュール510は、モーションセンサ420の出力に基づいて現実空間におけるユーザ5の手の動きに連動するように仮想空間11において手オブジェクトを動かす。ある局面において、操作オブジェクトは、アバターオブジェクトの手の部分に相当し得る。 The control module 510 arranges an operation object for receiving the operation of the user 5 in the virtual space 11 in the virtual space 11. By operating the operation object, the user 5 operates, for example, an object arranged in the virtual space 11. In a certain aspect, the operation object may include, for example, a hand object which is a virtual hand corresponding to the hand of the user 5. In a certain aspect, the control module 510 moves the hand object in the virtual space 11 so as to be linked to the movement of the user 5's hand in the real space based on the output of the motion sensor 420. In some aspects, the manipulation object can correspond to the hand portion of the avatar object.
コントロールモジュール510は、仮想空間11に配置されるオブジェクトのそれぞれが、他のオブジェクトと衝突した場合に、当該衝突を検出する。コントロールモジュール510は、例えば、あるオブジェクトのコリジョンエリアと、別のオブジェクトのコリジョンエリアとが触れたタイミングを検出することができ、当該検出がされたときに、予め定められた処理を行う。コントロールモジュール510は、オブジェクトとオブジェクトとが触れている状態から離れたタイミングを検出することができ、当該検出がされたときに、予め定められた処理を行う。コントロールモジュール510は、オブジェクトとオブジェクトとが触れている状態であることを検出することができる。例えば、コントロールモジュール510は、操作オブジェクトと、他のオブジェクトとが触れたときに、これら操作オブジェクトと他のオブジェクトとが触れたことを検出して、予め定められた処理を行う。 When each of the objects arranged in the virtual space 11 collides with another object, the control module 510 detects the collision. The control module 510 can detect, for example, the timing at which the collision area of one object and the collision area of another object touch each other, and when the detection is made, a predetermined process is performed. The control module 510 can detect the timing when the object and the object are separated from the touching state, and when the detection is made, a predetermined process is performed. The control module 510 can detect that the object is in contact with the object. For example, when the operation object touches another object, the control module 510 detects that the operation object touches the other object and performs a predetermined process.
ある局面において、コントロールモジュール510は、HMD120のモニタ130における画像表示を制御する。例えば、コントロールモジュール510は、仮想空間11に仮想カメラ14を配置する。コントロールモジュール510は、仮想空間11における仮想カメラ14の位置と、仮想カメラ14の傾き(向き)を制御する。コントロールモジュール510は、HMD120を装着したユーザ5の頭の傾きと、仮想カメラ14の位置に応じて、視界領域15を規定する。レンダリングモジュール520は、決定された視界領域15に基づいて、モニタ130に表示される視界画像17を生成する。レンダリングモジュール520により生成された視界画像17は、通信制御モジュール540によってHMD120に出力される。 In one aspect, the control module 510 controls the image display on the monitor 130 of the HMD 120. For example, the control module 510 arranges the virtual camera 14 in the virtual space 11. The control module 510 controls the position of the virtual camera 14 in the virtual space 11 and the inclination (orientation) of the virtual camera 14. The control module 510 defines the field of view 15 according to the inclination of the head of the user 5 wearing the HMD 120 and the position of the virtual camera 14. The rendering module 520 generates a visual field image 17 to be displayed on the monitor 130 based on the determined visual field region 15. The field of view image 17 generated by the rendering module 520 is output to the HMD 120 by the communication control module 540.
コントロールモジュール510は、HMD120から、ユーザ5のマイク170を用いた発話を検出すると、当該発話に対応する音声データの送信対象のコンピュータ200を特定する。音声データは、コントロールモジュール510によって特定されたコンピュータ200に送信される。コントロールモジュール510は、ネットワーク2を介して他のユーザのコンピュータ200から音声データを受信すると、当該音声データに対応する音声(発話)をスピーカ180から出力する。 When the control module 510 detects an utterance using the microphone 170 of the user 5 from the HMD 120, the control module 510 identifies the computer 200 to which the voice data to be transmitted corresponding to the utterance is transmitted. The voice data is transmitted to the computer 200 identified by the control module 510. When the control module 510 receives voice data from another user's computer 200 via the network 2, the control module 510 outputs the voice (utterance) corresponding to the voice data from the speaker 180.
メモリモジュール530は、コンピュータ200が仮想空間11をユーザ5に提供するために使用されるデータを保持している。ある局面において、メモリモジュール530は、空間情報と、オブジェクト情報と、ユーザ情報とを保持している。 The memory module 530 holds data used by the computer 200 to provide the virtual space 11 to the user 5. In a certain aspect, the memory module 530 holds spatial information, object information, and user information.
空間情報は、仮想空間11を提供するために規定された1つ以上のテンプレートを保持している。 Spatial information holds one or more templates defined to provide the virtual space 11.
オブジェクト情報は、仮想空間11を構成する複数のパノラマ画像13、仮想空間11にオブジェクトを配置するためのオブジェクトデータを含む。パノラマ画像13は、静止画像および動画像を含み得る。パノラマ画像13は、非現実空間の画像と現実空間の画像とを含み得る。非現実空間の画像としては、例えば、コンピュータグラフィックスで生成された画像が挙げられる。 The object information includes a plurality of panoramic images 13 constituting the virtual space 11 and object data for arranging the objects in the virtual space 11. The panoramic image 13 may include a still image and a moving image. The panoramic image 13 may include an image in the unreal space and an image in the real space. Examples of images in unreal space include images generated by computer graphics.
ユーザ情報は、ユーザ5を識別するユーザIDを保持する。ユーザIDは、例えば、ユーザが使用するコンピュータ200に設定されるIP(Internet Protocol)アドレスまたはMAC(Media Access Control)アドレスであり得る。別の局面において、ユーザIDはユーザによって設定され得る。ユーザ情報は、HMDシステム100の制御装置としてコンピュータ200を機能させるためのプログラム等を含む。 The user information holds a user ID that identifies the user 5. The user ID may be, for example, an IP (Internet Protocol) address or a MAC (Media Access Control) address set in the computer 200 used by the user. In another aspect, the user ID may be set by the user. The user information includes a program for operating the computer 200 as a control device of the HMD system 100 and the like.
メモリモジュール530に格納されているデータおよびプログラムは、HMD120のユーザ5によって入力される。あるいは、プロセッサ210が、当該コンテンツを提供する事業者が運営するコンピュータ(例えば、サーバ600)からプログラムあるいはデータをダウンロードして、ダウンロードされたプログラムあるいはデータをメモリモジュール530に格納する。 The data and programs stored in the memory module 530 are input by the user 5 of the HMD 120. Alternatively, the processor 210 downloads a program or data from a computer (for example, a server 600) operated by a business operator that provides the content, and stores the downloaded program or data in the memory module 530.
通信制御モジュール540は、ネットワーク2を介して、サーバ600その他の情報通信装置と通信し得る。 The communication control module 540 may communicate with the server 600 and other information communication devices via the network 2.
ある局面において、コントロールモジュール510およびレンダリングモジュール520は、例えば、ユニティテクノロジーズ社によって提供されるUnity(登録商標)を用いて実現され得る。別の局面において、コントロールモジュール510およびレンダリングモジュール520は、各処理を実現する回路素子の組み合わせとしても実現され得る。 In certain aspects, the control module 510 and the rendering module 520 may be implemented using, for example, Unity® provided by Unity Technologies. In another aspect, the control module 510 and the rendering module 520 can also be realized as a combination of circuit elements that realize each process.
コンピュータ200における処理は、ハードウェアと、プロセッサ210により実行されるソフトウェアとによって実現される。このようなソフトウェアは、ハードディスクその他のメモリモジュール530に予め格納されている場合がある。ソフトウェアは、CD-ROMその他のコンピュータ読み取り可能な不揮発性のデータ記録媒体に格納されて、プログラム製品として流通している場合もある。あるいは、当該ソフトウェアは、インターネットその他のネットワークに接続されている情報提供事業者によってダウンロード可能なプログラム製品として提供される場合もある。このようなソフトウェアは、光ディスク駆動装置その他のデータ読取装置によってデータ記録媒体から読み取られて、あるいは、通信制御モジュール540を介してサーバ600その他のコンピュータからダウンロードされた後、記憶モジュールに一旦格納される。そのソフトウェアは、プロセッサ210によって記憶モジュールから読み出され、実行可能なプログラムの形式でRAMに格納される。プロセッサ210は、そのプログラムを実行する。 The processing in the computer 200 is realized by the hardware and the software executed by the processor 210. Such software may be pre-stored in a hard disk or other memory module 530. The software may be stored on a CD-ROM or other computer-readable non-volatile data recording medium and distributed as a program product. Alternatively, the software may be provided as a downloadable program product by an information provider connected to the Internet or other networks. Such software is read from a data recording medium by an optical disk drive or other data reader, or downloaded from a server 600 or other computer via a communication control module 540, and then temporarily stored in a storage module. .. The software is read from the storage module by the processor 210 and stored in RAM in the form of an executable program. Processor 210 executes the program.
[HMDシステムの制御構造]
図11を参照して、HMDセット110の制御構造について説明する。図11は、ある実施の形態に従うHMDセット110において実行される処理の一部を表すシーケンスチャートである。
[Control structure of HMD system]
The control structure of the HMD set 110 will be described with reference to FIG. FIG. 11 is a sequence chart showing a part of the processing performed in the HMD set 110 according to an embodiment.
図11に示されるように、ステップS1110にて、コンピュータ200のプロセッサ210は、コントロールモジュール510として、仮想空間データを特定し、仮想空間11を定義する。 As shown in FIG. 11, in step S1110, the processor 210 of the computer 200 specifies the virtual space data as the control module 510 and defines the virtual space 11.
ステップS1120にて、プロセッサ210は、仮想カメラ14を初期化する。たとえば、プロセッサ210は、メモリのワーク領域において、仮想カメラ14を仮想空間11において予め規定された中心12に配置し、仮想カメラ14の視線をユーザ5が向いている方向に向ける。 In step S1120, the processor 210 initializes the virtual camera 14. For example, the processor 210 arranges the virtual camera 14 at a predetermined center 12 in the virtual space 11 in the work area of the memory, and directs the line of sight of the virtual camera 14 in the direction in which the user 5 is facing.
ステップS1130にて、プロセッサ210は、レンダリングモジュール520として、初期の視界画像を表示するための視界画像データを生成する。生成された視界画像データは、通信制御モジュール540によってHMD120に出力される。 In step S1130, the processor 210 generates the field of view image data for displaying the initial field of view image as the rendering module 520. The generated visual field image data is output to the HMD 120 by the communication control module 540.
ステップS1132にて、HMD120のモニタ130は、コンピュータ200から受信した視界画像データに基づいて、視界画像を表示する。HMD120を装着したユーザ5は、視界画像を視認すると仮想空間11を認識し得る。 In step S1132, the monitor 130 of the HMD 120 displays the visual field image based on the visual field image data received from the computer 200. The user 5 wearing the HMD 120 can recognize the virtual space 11 when he / she visually recognizes the field of view image.
ステップS1134にて、HMDセンサ410は、HMD120から発信される複数の赤外線光に基づいて、HMD120の位置と傾きを検知する。検知結果は、動き検知データとして、コンピュータ200に出力される。 In step S1134, the HMD sensor 410 detects the position and tilt of the HMD 120 based on the plurality of infrared rays emitted from the HMD 120. The detection result is output to the computer 200 as motion detection data.
ステップS1140にて、プロセッサ210は、HMD120の動き検知データに含まれる位置と傾きとに基づいて、HMD120を装着したユーザ5の視界方向を特定する。 In step S1140, the processor 210 identifies the visual field direction of the user 5 wearing the HMD 120 based on the position and the inclination included in the motion detection data of the HMD 120.
ステップS1150にて、プロセッサ210は、アプリケーションプログラムを実行し、アプリケーションプログラムに含まれる命令に基づいて、仮想空間11にオブジェクトを配置する。 In step S1150, the processor 210 executes the application program and arranges the object in the virtual space 11 based on the instruction included in the application program.
ステップS1160にて、コントローラ300は、モーションセンサ420から出力される信号に基づいて、ユーザ5の操作を検出し、その検出された操作を表す検出データをコンピュータ200に出力する。別の局面において、ユーザ5によるコントローラ300の操作は、ユーザ5の周囲に配置されたカメラからの画像に基づいて検出されてもよい。 In step S1160, the controller 300 detects the operation of the user 5 based on the signal output from the motion sensor 420, and outputs the detection data representing the detected operation to the computer 200. In another aspect, the operation of the controller 300 by the user 5 may be detected based on an image from a camera arranged around the user 5.
ステップS1170にて、プロセッサ210は、コントローラ300から取得した検出データに基づいて、ユーザ5によるコントローラ300の操作を検出する。 In step S1170, the processor 210 detects the operation of the controller 300 by the user 5 based on the detection data acquired from the controller 300.
ステップS1180にて、プロセッサ210は、ユーザ5によるコントローラ300の操作に基づく視界画像データを生成する。生成された視界画像データは、通信制御モジュール540によってHMD120に出力される。 In step S1180, the processor 210 generates the field of view image data based on the operation of the controller 300 by the user 5. The generated visual field image data is output to the HMD 120 by the communication control module 540.
ステップS1190にて、HMD120は、受信した視界画像データに基づいて視界画像を更新し、更新後の視界画像をモニタ130に表示する。 In step S1190, the HMD 120 updates the visual field image based on the received visual field image data, and displays the updated visual field image on the monitor 130.
[アバターオブジェクト]
図12(A)、(B)を参照して、本実施の形態に従うアバターオブジェクトについて説明する。以下、HMDセット110A,110Bの各ユーザ5のアバターオブジェクトを説明する図である。以下、HMDセット110Aのユーザをユーザ5A、HMDセット110Bのユーザをユーザ5B、HMDセット110Cのユーザをユーザ5C、HMDセット110Dのユーザをユーザ5Dと表す。HMDセット110Aに関する各構成要素の参照符号にAが付され、HMDセット110Bに関する各構成要素の参照符号にBが付され、HMDセット110Cに関する各構成要素の参照符号にCが付され、HMDセット110Dに関する各構成要素の参照符号にDが付される。例えば、HMD120Aは、HMDセット110Aに含まれる。
[Avatar Object]
An avatar object according to the present embodiment will be described with reference to FIGS. 12A and 12B. Hereinafter, it is a figure explaining the avatar object of each user 5 of the HMD set 110A, 110B. Hereinafter, the user of the HMD set 110A will be referred to as a user 5A, the user of the HMD set 110B will be referred to as a user 5B, the user of the HMD set 110C will be referred to as a user 5C, and the user of the HMD set 110D will be referred to as a user 5D. A is added to the reference code of each component related to the HMD set 110A, B is added to the reference code of each component related to the HMD set 110B, and C is added to the reference code of each component related to the HMD set 110C. A D is added to the reference code of each component with respect to 110D. For example, the HMD 120A is included in the HMD set 110A.
図12(A)は、ネットワーク2において、各HMD120がユーザ5に仮想空間11を提供する状況を表す模式図である。コンピュータ200A~200Dは、HMD120A~120Dを介して、ユーザ5A~5Dに、仮想空間11A~11Dをそれぞれ提供する。図12(A)に示される例において、仮想空間11Aおよび仮想空間11Bは同じデータによって構成されている。換言すれば、コンピュータ200Aとコンピュータ200Bとは同じ仮想空間を共有していることになる。仮想空間11Aおよび仮想空間11Bには、ユーザ5Aのアバターオブジェクト6Aと、ユーザ5Bのアバターオブジェクト6Bとが存在する。仮想空間11Aにおけるアバターオブジェクト6Aおよび仮想空間11Bにおけるアバターオブジェクト6BがそれぞれHMD120を装着しているが、これは説明を分かりやすくするためのものであって、実際にはこれらのオブジェクトはHMD120を装着していない。 FIG. 12A is a schematic diagram showing a situation in which each HMD 120 provides the virtual space 11 to the user 5 in the network 2. The computers 200A to 200D provide the virtual spaces 11A to 11D to the users 5A to 5D via the HMDs 120A to 120D, respectively. In the example shown in FIG. 12A, the virtual space 11A and the virtual space 11B are composed of the same data. In other words, the computer 200A and the computer 200B share the same virtual space. In the virtual space 11A and the virtual space 11B, the avatar object 6A of the user 5A and the avatar object 6B of the user 5B exist. The avatar object 6A in the virtual space 11A and the avatar object 6B in the virtual space 11B are each equipped with the HMD 120, but this is for the sake of clarity, and in reality, these objects are equipped with the HMD 120. Not.
ある局面において、プロセッサ210Aは、ユーザ5Aの視界画像17Aを撮影する仮想カメラ14Aを、アバターオブジェクト6Aの目の位置に配置し得る。 In one aspect, the processor 210A may place a virtual camera 14A that captures the field of view image 17A of the user 5A at the eye position of the avatar object 6A.
図12(B)は、図12(A)におけるユーザ5Aの視界画像17Aを示す図である。視界画像17Aは、HMD120Aのモニタ130Aに表示される画像である。この視界画像17Aは、仮想カメラ14Aにより生成された画像である。視界画像17Aには、ユーザ5Bのアバターオブジェクト6Bが表示されている。特に図示はしていないが、ユーザ5Bの視界画像にも同様に、ユーザ5Aのアバターオブジェクト6Aが表示されている。 12 (B) is a diagram showing the field of view image 17A of the user 5A in FIG. 12 (A). The visual field image 17A is an image displayed on the monitor 130A of the HMD 120A. The field view image 17A is an image generated by the virtual camera 14A. The avatar object 6B of the user 5B is displayed in the field of view image 17A. Although not shown in particular, the avatar object 6A of the user 5A is also displayed in the field of view image of the user 5B.
図12(B)の状態において、ユーザ5Aは仮想空間11Aを介してユーザ5Bと対話による通信(コミュニケーション)を図ることができる。より具体的には、マイク170Aにより取得されたユーザ5Aの音声は、サーバ600を介してユーザ5BのHMD120Bに送信され、HMD120Bに設けられたスピーカ180Bから出力される。ユーザ5Bの音声は、サーバ600を介してユーザ5AのHMD120Aに送信され、HMD120Aに設けられたスピーカ180Aから出力される。 In the state of FIG. 12B, the user 5A can communicate with the user 5B through the virtual space 11A by dialogue. More specifically, the voice of the user 5A acquired by the microphone 170A is transmitted to the HMD 120B of the user 5B via the server 600, and is output from the speaker 180B provided in the HMD 120B. The voice of the user 5B is transmitted to the HMD 120A of the user 5A via the server 600, and is output from the speaker 180A provided in the HMD 120A.
ユーザ5Bの動作(HMD120Bの動作およびコントローラ300Bの動作)は、プロセッサ210Aにより仮想空間11Aに配置されるアバターオブジェクト6Bに反映される。これにより、ユーザ5Aは、ユーザ5Bの動作を、アバターオブジェクト6Bを通じて認識できる。 The operation of the user 5B (the operation of the HMD 120B and the operation of the controller 300B) is reflected in the avatar object 6B arranged in the virtual space 11A by the processor 210A. As a result, the user 5A can recognize the operation of the user 5B through the avatar object 6B.
図13は、本実施の形態に従うHMDシステム100において実行される処理の一部を表すシーケンスチャートである。図13においては、HMDセット110Dを図示していないが、HMDセット110Dについても、HMDセット110A、110B、110Cと同様に動作する。以下の説明でも、HMDセット110Aに関する各構成要素の参照符号にAが付され、HMDセット110Bに関する各構成要素の参照符号にBが付され、HMDセット110Cに関する各構成要素の参照符号にCが付され、HMDセット110Dに関する各構成要素の参照符号にDが付されるものとする。 FIG. 13 is a sequence chart showing a part of the processing executed in the HMD system 100 according to the present embodiment. Although the HMD set 110D is not shown in FIG. 13, the HMD set 110D operates in the same manner as the HMD sets 110A, 110B, and 110C. Also in the following description, A is added to the reference code of each component related to the HMD set 110A, B is added to the reference code of each component related to the HMD set 110B, and C is added to the reference code of each component related to the HMD set 110C. It shall be attached and D shall be attached to the reference code of each component with respect to the HMD set 110D.
ステップS1310Aにおいて、HMDセット110Aにおけるプロセッサ210Aは、仮想空間11Aにおけるアバターオブジェクト6Aの動作を決定するためのアバター情報を取得する。このアバター情報は、例えば、動き情報、フェイストラッキングデータ、および音声データ等のアバターに関する情報を含む。動き情報は、HMD120Aの位置および傾きの時間的変化を示す情報や、モーションセンサ420A等により検出されたユーザ5Aの手の動きを示す情報などを含む。フェイストラッキングデータは、ユーザ5Aの顔の各パーツの位置および大きさを特定するデータが挙げられる。フェイストラッキングデータは、ユーザ5Aの顔を構成する各器官の動きを示すデータや視線データが挙げられる。音声データは、HMD120Aのマイク170Aによって取得されたユーザ5Aの音声を示すデータが挙げられる。アバター情報には、アバターオブジェクト6A、あるいはアバターオブジェクト6Aに関連付けられるユーザ5Aを特定する情報や、アバターオブジェクト6Aが存在する仮想空間11Aを特定する情報等が含まれてもよい。アバターオブジェクト6Aやユーザ5Aを特定する情報としては、ユーザIDが挙げられる。アバターオブジェクト6Aが存在する仮想空間11Aを特定する情報としては、ルームIDが挙げられる。プロセッサ210Aは、上述のように取得されたアバター情報を、ネットワーク2を介してサーバ600に送信する。 In step S1310A, the processor 210A in the HMD set 110A acquires the avatar information for determining the operation of the avatar object 6A in the virtual space 11A. This avatar information includes information about the avatar such as motion information, face tracking data, and voice data. The motion information includes information indicating a temporal change in the position and inclination of the HMD 120A, information indicating the hand motion of the user 5A detected by the motion sensor 420A or the like, and the like. Examples of the face tracking data include data for specifying the position and size of each part of the face of the user 5A. Examples of the face tracking data include data indicating the movement of each organ constituting the face of the user 5A and line-of-sight data. Examples of the voice data include data indicating the voice of the user 5A acquired by the microphone 170A of the HMD 120A. The avatar information may include information that identifies the avatar object 6A or the user 5A associated with the avatar object 6A, information that identifies the virtual space 11A in which the avatar object 6A exists, and the like. Information that identifies the avatar object 6A and the user 5A includes a user ID. Information that identifies the virtual space 11A in which the avatar object 6A exists includes a room ID. The processor 210A transmits the avatar information acquired as described above to the server 600 via the network 2.
ステップS1310Bにおいて、HMDセット110Bにおけるプロセッサ210Bは、ステップS1310Aにおける処理と同様に、仮想空間11Bにおけるアバターオブジェクト6Bの動作を決定するためのアバター情報を取得し、サーバ600に送信する。同様に、ステップS1310Cにおいて、HMDセット110Cにおけるプロセッサ210Cは、仮想空間11Cにおけるアバターオブジェクト6Cの動作を決定するためのアバター情報を取得し、サーバ600に送信する。 In step S1310B, the processor 210B in the HMD set 110B acquires the avatar information for determining the operation of the avatar object 6B in the virtual space 11B and transmits it to the server 600, as in the process in step S1310A. Similarly, in step S1310C, the processor 210C in the HMD set 110C acquires the avatar information for determining the operation of the avatar object 6C in the virtual space 11C and transmits it to the server 600.
ステップS1320において、サーバ600は、HMDセット110A、HMDセット110B、およびHMDセット110Cのそれぞれから受信したプレイヤ情報を一旦記憶する。サーバ600は、各アバター情報に含まれるユーザIDおよびルームID等に基づいて、共通の仮想空間11に関連付けられた全ユーザ(この例では、ユーザ5A~5C)のアバター情報を統合する。そして、サーバ600は、予め定められたタイミングで、統合したアバター情報を当該仮想空間11に関連付けられた全ユーザに送信する。これにより、同期処理が実行される。このような同期処理により、HMDセット110A、HMDセット110B、およびHMD110Cは、互いのアバター情報をほぼ同じタイミングで共有することができる。 In step S1320, the server 600 temporarily stores the player information received from each of the HMD set 110A, the HMD set 110B, and the HMD set 110C. The server 600 integrates the avatar information of all users (users 5A to 5C in this example) associated with the common virtual space 11 based on the user ID, room ID, and the like included in each avatar information. Then, the server 600 transmits the integrated avatar information to all the users associated with the virtual space 11 at a predetermined timing. As a result, the synchronization process is executed. By such a synchronization process, the HMD set 110A, the HMD set 110B, and the HMD 110C can share each other's avatar information at substantially the same timing.
続いて、サーバ600から各HMDセット110A~110Cに送信されたアバター情報に基づいて、各HMDセット110A~110Cは、ステップS1330A~S1330Cの処理を実行する。ステップS1330Aの処理は、図11におけるステップS1180の処理に相当する。 Subsequently, each HMD set 110A to 110C executes the process of steps S1330A to S1330C based on the avatar information transmitted from the server 600 to each HMD set 110A to 110C. The process of step S1330A corresponds to the process of step S1180 in FIG.
ステップS1330Aにおいて、HMDセット110Aにおけるプロセッサ210Aは、仮想空間11Aにおける他のユーザ5B,5Cのアバターオブジェクト6B、アバターオブジェクト6Cの情報を更新する。具体的には、プロセッサ210Aは、HMDセット110Bから送信されたアバター情報に含まれる動き情報に基づいて、仮想空間11におけるアバターオブジェクト6Bの位置および向き等を更新する。例えば、プロセッサ210Aは、メモリモジュール530に格納されたオブジェクト情報に含まれるアバターオブジェクト6Bの情報(位置および向き等)を更新する。同様に、プロセッサ210Aは、HMDセット110Cから送信されたアバター情報に含まれる動き情報に基づいて、仮想空間11におけるアバターオブジェクト6Cの情報(位置および向き等)を更新する。 In step S1330A, the processor 210A in the HMD set 110A updates the information of the avatar object 6B and the avatar object 6C of the other users 5B and 5C in the virtual space 11A. Specifically, the processor 210A updates the position and orientation of the avatar object 6B in the virtual space 11 based on the motion information included in the avatar information transmitted from the HMD set 110B. For example, the processor 210A updates the information (position, orientation, etc.) of the avatar object 6B included in the object information stored in the memory module 530. Similarly, the processor 210A updates the information (position, orientation, etc.) of the avatar object 6C in the virtual space 11 based on the motion information included in the avatar information transmitted from the HMD set 110C.
ステップS1330Bにおいて、HMDセット110Bにおけるプロセッサ210Bは、ステップS1330Aにおける処理と同様に、仮想空間11Bにおけるユーザ5A,5Cのアバターオブジェクト6A,6Cの情報を更新する。同様に、ステップS1330Cにおいて、HMDセット110Cにおけるプロセッサ210Cは、仮想空間11Cにおけるユーザ5A,5Bのアバターオブジェクト6A,6Bの情報を更新する。 In step S1330B, the processor 210B in the HMD set 110B updates the information of the avatar objects 6A, 6C of the users 5A, 5C in the virtual space 11B, as in the process in step S1330A. Similarly, in step S1330C, the processor 210C in the HMD set 110C updates the information of the avatar objects 6A, 6B of the users 5A, 5B in the virtual space 11C.
[モジュールの詳細構成]
図14を参照して、コンピュータ200のモジュール構成の詳細について説明する。図14は、ある実施の形態に従うコンピュータ200のモジュールの詳細構成を表すブロック図である。
[Detailed configuration of module]
The details of the module configuration of the computer 200 will be described with reference to FIG. FIG. 14 is a block diagram showing a detailed configuration of a module of the computer 200 according to an embodiment.
図14に示されるように、コントロールモジュール510は、仮想カメラ制御モジュール1421と、視界領域決定モジュール1422と、基準視線特定モジュール1423と、顔器官検出モジュール1424と、動き検出モジュール1425と、仮想空間定義モジュール1426と、仮想オブジェクト生成モジュール1427と、操作オブジェクト制御モジュール1428と、アバター制御モジュール1429と、を備える。レンダリングモジュール520は、視界画像生成モジュール1438を備える。メモリモジュール530は、空間情報1431と、オブジェクト情報1432と、ユーザ情報1433と、顔情報1434と、を保持している。 As shown in FIG. 14, the control module 510 includes a virtual camera control module 1421, a view area determination module 1422, a reference line-of-sight identification module 1423, a facial organ detection module 1424, a motion detection module 1425, and a virtual space definition. It includes a module 1426, a virtual object generation module 1427, an operation object control module 1428, and an avatar control module 1429. The rendering module 520 includes a field of view image generation module 1438. The memory module 530 holds spatial information 1431, object information 1432, user information 1433, and face information 1434.
仮想カメラ制御モジュール1421は、仮想空間11に仮想カメラ14を配置する。仮想カメラ制御モジュール1421は、仮想空間11における仮想カメラ14の配置位置と、仮想カメラ14の向き(傾き)を制御する。視界領域決定モジュール1422は、HMD120を装着したユーザの頭の向きと、仮想カメラ14の配置位置に応じて、視界領域15を規定する。視界画像生成モジュール1438は、決定された視界領域15に基づいて、モニタ130に表示される視界画像17を生成する。 The virtual camera control module 1421 arranges the virtual camera 14 in the virtual space 11. The virtual camera control module 1421 controls the arrangement position of the virtual camera 14 in the virtual space 11 and the orientation (tilt) of the virtual camera 14. The field-of-view area determination module 1422 defines the field-of-view area 15 according to the orientation of the head of the user wearing the HMD 120 and the arrangement position of the virtual camera 14. The visual field image generation module 1438 generates a visual field image 17 to be displayed on the monitor 130 based on the determined visual field region 15.
基準視線特定モジュール1423は、注視センサ140からの信号に基づいて、ユーザ5の視線を特定する。顔器官検出モジュール1424は、第1カメラ150および第2カメラ160が生成するユーザ5の顔の画像から、ユーザ5の顔を構成する器官(例えば、口、目、眉)を検出する。動き検出モジュール1425は、顔器官検出モジュール1424が検出した各器官の動き(形状)を検出する。図15~図18において、顔器官検出モジュール1424および動き検出モジュール1425の制御内容は後述される。 The reference line-of-sight identification module 1423 identifies the line-of-sight of the user 5 based on the signal from the gaze sensor 140. The facial organ detection module 1424 detects organs (for example, mouth, eyes, eyebrows) constituting the face of the user 5 from the images of the face of the user 5 generated by the first camera 150 and the second camera 160. The motion detection module 1425 detects the motion (shape) of each organ detected by the facial organ detection module 1424. In FIGS. 15 to 18, the control contents of the facial organ detection module 1424 and the motion detection module 1425 will be described later.
仮想空間定義モジュール1426は、仮想空間11を表す仮想空間データを生成することにより、HMDシステム100における仮想空間11を規定する。 The virtual space definition module 1426 defines the virtual space 11 in the HMD system 100 by generating virtual space data representing the virtual space 11.
仮想オブジェクト生成モジュール1427は、仮想空間11に配置されるオブジェクトを生成する。オブジェクトは、例えば、ゲームのストーリーの進行に従って配置される森、山その他を含む風景、動物等を含み得る。 The virtual object generation module 1427 generates an object to be arranged in the virtual space 11. Objects can include, for example, landscapes, animals, etc., including forests, mountains, etc., which are arranged as the story of the game progresses.
操作オブジェクト制御モジュール1428は、仮想空間11においてユーザの操作を受け付けるための操作オブジェクトを仮想空間11に配置する。ユーザは、操作オブジェクトを操作することにより、例えば、仮想空間11に配置されるオブジェクトを操作する。ある局面において、操作オブジェクトは、例えば、HMD120を装着したユーザの手に相当する手オブジェクト等を含み得る。ある局面において、操作オブジェクトは、後述するアバターオブジェクトの手の部分に相当し得る。 The operation object control module 1428 arranges an operation object for receiving a user's operation in the virtual space 11 in the virtual space 11. By manipulating the operation object, the user operates, for example, an object arranged in the virtual space 11. In some aspects, the operating object may include, for example, a hand object corresponding to the hand of the user wearing the HMD 120. In some aspects, the manipulation object may correspond to the hand portion of the avatar object described below.
アバター制御モジュール1429は、ネットワーク2を介して接続される他のコンピュータ200のユーザのアバターオブジェクトを仮想空間11に配置するためのデータを生成する。ある局面において、アバター制御モジュール1429は、ユーザ5のアバターオブジェクトを仮想空間11に配置するためのデータを生成する。ある局面において、アバター制御モジュール1429は、ユーザ5を含む画像に基づいて、ユーザ5を模したアバターオブジェクトを生成する。別の局面において、アバター制御モジュール1429は、複数種類のアバターオブジェクト(例えば、動物を模したオブジェクトや、デフォルメされた人のオブジェクト)の中からユーザ5による選択を受け付けたアバターオブジェクトを仮想空間11に配置するためのデータを生成する。 The avatar control module 1429 generates data for arranging the avatar object of another computer 200 user connected via the network 2 in the virtual space 11. In a certain aspect, the avatar control module 1429 generates data for arranging the avatar object of the user 5 in the virtual space 11. In one aspect, the avatar control module 1429 creates an avatar object that mimics the user 5 based on an image that includes the user 5. In another aspect, the avatar control module 1429 creates an avatar object in the virtual space 11 that has been selected by the user 5 from among a plurality of types of avatar objects (for example, an object imitating an animal or a deformed human object). Generate data for placement.
アバター制御モジュール1429は、HMDセンサ410が検出するHMD120の動きをアバターオブジェクトに反映する。例えば、アバター制御モジュール1429は、HMD120が傾いたことを検知して、アバターオブジェクトを傾けて配置するためのデータを生成する。ある局面において、アバター制御モジュール1429は、コントローラ300の動きをアバターオブジェクトに反映する。この場合、コントローラ300は、コントローラ300の動きを検知するためのモーションセンサ、加速度センサ、または複数の発光素子(例えば、赤外線LED)などを備える。アバター制御モジュール1429は、動き検出モジュール1425が検出した顔器官の動作を、仮想空間11に配置されるアバターオブジェクトの顔に反映させる。つまり、アバター制御モジュール1429は、ユーザ5Aの顔の動作をアバターオブジェクトに反映する。 The avatar control module 1429 reflects the movement of the HMD 120 detected by the HMD sensor 410 on the avatar object. For example, the avatar control module 1429 detects that the HMD 120 is tilted and generates data for tilting and arranging the avatar object. In one aspect, the avatar control module 1429 reflects the movement of the controller 300 on the avatar object. In this case, the controller 300 includes a motion sensor, an acceleration sensor, a plurality of light emitting elements (for example, infrared LEDs), and the like for detecting the movement of the controller 300. The avatar control module 1429 reflects the movement of the facial organ detected by the motion detection module 1425 on the face of the avatar object arranged in the virtual space 11. That is, the avatar control module 1429 reflects the movement of the face of the user 5A on the avatar object.
コントロールモジュール510は、仮想空間11に配置されるオブジェクトのそれぞれが、他のオブジェクトと衝突した場合に、当該衝突を検出する。コントロールモジュール510は、例えば、あるオブジェクトと、別のオブジェクトとが触れたタイミングを検出することができ、当該検出がされたときに、予め定められた処理を行う。コントロールモジュール510は、オブジェクトとオブジェクトとが触れている状態から離れたタイミングを検出することができ、当該検出がされたときに、予め定められた処理を行う。コントロールモジュール510は、オブジェクトとオブジェクトとが触れている状態であることを検出することができる。具体的には、操作オブジェクト制御モジュール1428は、操作オブジェクトと、他のオブジェクトとが触れたときに、これら操作オブジェクトと他のオブジェクトとが触れたことを検出して、予め定められた処理を行う。 When each of the objects arranged in the virtual space 11 collides with another object, the control module 510 detects the collision. The control module 510 can detect, for example, the timing at which a certain object and another object touch each other, and when the detection is made, a predetermined process is performed. The control module 510 can detect the timing when the object and the object are separated from the touching state, and when the detection is made, a predetermined process is performed. The control module 510 can detect that the object is in contact with the object. Specifically, the operation object control module 1428 detects that the operation object touches the other object when the operation object touches the other object, and performs a predetermined process. ..
メモリモジュール530は、コンピュータ200が仮想空間11をユーザ5に提供するために使用されるデータを保持している。ある局面において、メモリモジュール530は、空間情報1431と、オブジェクト情報1432と、ユーザ情報1433と、顔情報1434とを保持している。 The memory module 530 holds data used by the computer 200 to provide the virtual space 11 to the user 5. In a certain aspect, the memory module 530 holds spatial information 1431, object information 1432, user information 1433, and face information 1434.
空間情報1431は、仮想空間11を提供するために規定された1つ以上のテンプレートを保持している。 Spatial information 1431 holds one or more templates defined to provide the virtual space 11.
オブジェクト情報1432は、仮想空間11において再生されるコンテンツ、当該コンテンツで使用されるオブジェクト、およびオブジェクトを仮想空間11に配置するための情報(たとえば、位置情報)を保持している。当該コンテンツは、例えば、ゲーム、現実社会と同様の風景を表したコンテンツ等を含み得る。 The object information 1432 holds the content to be reproduced in the virtual space 11, the object used in the content, and the information (for example, position information) for arranging the object in the virtual space 11. The content may include, for example, a game, content representing a landscape similar to that of the real world, and the like.
ユーザ情報1433は、HMDシステム100の制御装置としてコンピュータ200を機能させるためのプログラム、オブジェクト情報1432に保持される各コンテンツを使用するアプリケーションプログラム等を保持している。 The user information 1433 holds a program for operating the computer 200 as a control device of the HMD system 100, an application program for using each content held in the object information 1432.
顔情報1434は、顔器官検出モジュール1424が、ユーザ5の顔器官を検出するために予め記憶されたテンプレートを保持している。ある局面において、顔情報1434は、口テンプレート1435と、目テンプレート1436と、眉テンプレート1437とを保持する。各テンプレートは、顔を構成する器官に対応する画像であり得る。例えば、口テンプレート1435は、口の画像であり得る。各テンプレートは複数の画像を含んでもよい。 In the face information 1434, the face organ detection module 1424 holds a template stored in advance for detecting the face organ of the user 5. In one aspect, the face information 1434 holds a mouth template 1435, an eye template 1436, and an eyebrow template 1437. Each template can be an image corresponding to the organs that make up the face. For example, the mouth template 1435 can be an image of the mouth. Each template may contain multiple images.
[フェイストラッキング]
以下、図15~図18を参照して、ユーザの表情(顔の動き)を検出するための具体例について説明する。図15~図18では、一例として、ユーザ5の口の動きを検出する具体例について説明する。なお、図15~図18で説明される検出方法は、ユーザ5の口の動きに限られず、ユーザ5の顔を構成する他の器官(例えば、目、眉、鼻、頬)の動きの検出にも適用され得る。
[Face tracking]
Hereinafter, a specific example for detecting a user's facial expression (face movement) will be described with reference to FIGS. 15 to 18. 15 to 18 show, as an example, a specific example of detecting the movement of the mouth of the user 5. The detection methods described in FIGS. 15 to 18 are not limited to the movement of the mouth of the user 5, and the movement of other organs (for example, eyes, eyebrows, nose, cheeks) constituting the face of the user 5 is detected. Can also be applied to.
図15は、ユーザの顔画像1521から口を検出する制御について説明する図である。第1カメラ150により生成された顔画像1521は、ユーザ5の鼻と口を含む。 FIG. 15 is a diagram illustrating control for detecting a mouth from a user's face image 1521. The face image 1521 generated by the first camera 150 includes the nose and mouth of the user 5.
顔器官検出モジュール1424は、顔情報1434に格納される口テンプレート1435を利用したパターンマッチングにより、顔画像1521から口領域1531を特定する。ある局面において、顔器官検出モジュール1424は、顔画像において、矩形上の比較領域を設定し、この比較領域の大きさ、位置および角度をそれぞれ変えながら、比較領域の画像と、口テンプレート1435の画像との類似度を算出する。顔器官検出モジュール1424は、予め定められたしきい値よりも大きい類似度が算出された比較領域を、口領域1531として特定し得る。 The face organ detection module 1424 identifies the mouth region 1531 from the face image 1521 by pattern matching using the mouth template 1435 stored in the face information 1434. In a certain aspect, the facial organ detection module 1424 sets a comparison area on a rectangle in the face image, and changes the size, position, and angle of the comparison area to obtain an image of the comparison area and an image of the mouth template 1435. Calculate the similarity with. The facial organ detection module 1424 may identify a comparison region for which a similarity greater than a predetermined threshold is calculated as the mouth region 1531.
顔器官検出モジュール1424はさらに、算出した類似度がしきい値よりも大きい比較領域の位置と、他の顔器官(例えば、目、鼻)の位置との相対関係に基づいて、当該比較領域が口領域に相当するか否かを判断し得る。 The facial organ detection module 1424 further determines that the comparison region is based on the relative relationship between the position of the comparison region where the calculated similarity is greater than the threshold value and the position of other facial organs (eg, eyes, nose). It is possible to judge whether or not it corresponds to the mouth area.
動き検出モジュール1425は、顔器官検出モジュール1424が検出した口領域1531から、より詳細な口の形状を検出する。 The motion detection module 1425 detects a more detailed mouth shape from the mouth region 1531 detected by the facial organ detection module 1424.
図16は、動き検出モジュール1425が口の形状を検出する処理を説明する図(その1)である。図16を参照して、動き検出モジュール1425は、口領域1531に含まれる口の形状(唇の輪郭)を検出するための輪郭検出線1641を設定する。輪郭検出線1641は、顔の高さ方向に直交する方向に、所定間隔で複数本設定される。 FIG. 16 is a diagram (No. 1) for explaining the process of detecting the shape of the mouth by the motion detection module 1425. With reference to FIG. 16, the motion detection module 1425 sets a contour detection line 1641 for detecting the shape of the mouth (the contour of the lips) included in the mouth region 1531. A plurality of contour detection lines 1641 are set at predetermined intervals in a direction orthogonal to the height direction of the face.
動き検出モジュール1425は、複数本の輪郭検出線1641の各々に沿った口領域1531の輝度値の変化を検出し、輝度値の変化が急激な位置を輪郭点として特定し得る。より具体的には、動き検出モジュール1425は、隣接画素との輝度差(すなわち、輝度値変化)が予め定められたしきい値以上である画素を、輪郭点として特定し得る。画素の輝度値は、例えば、画素のRBG値を所定の重み付けで積算することにより得られる。 The motion detection module 1425 can detect a change in the brightness value of the mouth region 1531 along each of the plurality of contour detection lines 1641, and can specify a position where the change in the brightness value is abrupt as a contour point. More specifically, the motion detection module 1425 can specify as a contour point a pixel whose luminance difference (that is, change in luminance value) from adjacent pixels is equal to or greater than a predetermined threshold value. The brightness value of the pixel is obtained, for example, by integrating the RBG value of the pixel with a predetermined weighting.
動き検出モジュール1425は、口領域1531に対応する画像から2種類の輪郭点を特定する。動き検出モジュール1425は、口(唇)の外側の輪郭に対応する輪郭点1642と、口(唇)の内側の輪郭に対応する輪郭点1643とを特定する。ある局面において、動き検出モジュール1425は、1つの輪郭検出線1641上に3つ以上の輪郭点が検出された場合には、両端の輪郭点を外側の輪郭点1642として特定し得る。この場合、動き検出モジュール1425は、外側の輪郭点1642以外の輪郭点を、内側の輪郭点1643として特定し得る。また、動き検出モジュール1425は、1つの輪郭検出線1641上に2つ以下の輪郭点が検出された場合には、検出された輪郭点を外側の輪郭点1642として特定し得る。 The motion detection module 1425 identifies two types of contour points from the image corresponding to the mouth region 1531. The motion detection module 1425 identifies contour points 1642 corresponding to the outer contour of the mouth (lips) and contour points 1643 corresponding to the inner contour of the mouth (lips). In one aspect, the motion detection module 1425 may identify the contour points at both ends as the outer contour points 1642 when three or more contour points are detected on one contour detection line 1641. In this case, the motion detection module 1425 can identify contour points other than the outer contour point 1642 as the inner contour point 1643. Further, when two or less contour points are detected on one contour detection line 1641, the motion detection module 1425 can specify the detected contour points as the outer contour points 1642.
図17は、動き検出モジュール1425が口の形状を検出する処理を説明するための図(その2)である。図17では、外側の輪郭点1642は白丸、内側の輪郭点1643はハッチングされた丸としてそれぞれ示されている。 FIG. 17 is a diagram (No. 2) for explaining a process in which the motion detection module 1425 detects the shape of the mouth. In FIG. 17, the outer contour points 1642 are shown as white circles and the inner contour points 1643 are shown as hatched circles.
動き検出モジュール1425は、内側の輪郭点1643間を補間することにより、口形状1721を特定する。ある局面において、動き検出モジュール1425は、スプライン補間などの非線形の補間方法を用いて、口形状1721を特定し得る。なお、他の局面において、動き検出モジュール1425は、外側の輪郭点1642間を補間することにより口形状1721を特定してもよい。さらに他の局面において、動き検出モジュール1425は、想定される口形状(人の上唇と下唇とによって形成され得る所定の形状)から、大きく逸脱する輪郭点を除外し、残った輪郭点によって口形状1721を特定してもよい。このようにして、動き検出モジュール1425は、ユーザの口の動作(形状)を特定し得る。なお、口形状1721の検出方法は上記に限られず、動き検出モジュール1425は、他の手法により口形状1721を検出してもよい。また、動き検出モジュール1425は、同様にして、ユーザの目および眉の動作を検出し得る。なお、動き検出モジュール1425は、頬、鼻などの器官の形状を検出可能に構成されてもよい。 The motion detection module 1425 identifies the mouth shape 1721 by interpolating between the inner contour points 1643. In certain aspects, the motion detection module 1425 may identify the mouth shape 1721 using a non-linear interpolation method such as spline interpolation. In another aspect, the motion detection module 1425 may specify the mouth shape 1721 by interpolating between the outer contour points 1642. In yet another aspect, the motion detection module 1425 excludes contour points that deviate significantly from the assumed mouth shape (a predetermined shape that can be formed by the upper and lower lips of a person), and the remaining contour points make the mouth. The shape 1721 may be specified. In this way, the motion detection module 1425 can identify the motion (shape) of the user's mouth. The method for detecting the mouth shape 1721 is not limited to the above, and the motion detection module 1425 may detect the mouth shape 1721 by another method. In addition, the motion detection module 1425 can detect the motion of the user's eyes and eyebrows in the same manner. The motion detection module 1425 may be configured to be able to detect the shape of an organ such as a cheek or a nose.
図18は、フェイストラッキングデータの構造の一例を表す。動き検出モジュール1425は、ユーザ5の表情を表すフェイストラッキングデータを生成する。フェイストラッキングデータは、検出対象の各器官の形状を構成する特徴点のuvw視野座標系における位置座標を表す。例えば、図18に示されるポイントm1、m2・・は、口形状1721を構成する外側の輪郭点1642に対応する。ある局面において、フェイストラッキングデータは、第1カメラ150の位置を基準(原点)としたuvw視野座標系における座標値である。他の局面において、フェイストラッキングデータは、各器官に予め定められた特徴点を基準(原点)とした座標系における座標値である。一例として、ポイントm1、m2・・は、外側の輪郭点1642のうち口角に対応するいずれか一方の特徴点を原点とした座標系における座標値である。 FIG. 18 shows an example of the structure of face tracking data. The motion detection module 1425 generates face tracking data representing the facial expression of the user 5. The face tracking data represents the position coordinates of the feature points constituting the shape of each organ to be detected in the uvw visual field coordinate system. For example, the points m1, m2, ... Shown in FIG. 18 correspond to the outer contour points 1642 constituting the mouth shape 1721. In a certain aspect, the face tracking data is a coordinate value in the uvw field of view coordinate system with the position of the first camera 150 as a reference (origin). In another aspect, the face tracking data is a coordinate value in a coordinate system with a feature point predetermined for each organ as a reference (origin). As an example, the points m1, m2, ... Are coordinate values in the coordinate system with the origin of any one of the outer contour points 1642 corresponding to the corner of the mouth.
コンピュータ200は、生成されたフェイストラッキングデータをサーバ600に送信する。サーバ600は、コンピュータ200と通信する他のコンピュータ200にこのデータを転送する。他のコンピュータ200は、受信したフェイストラッキングデータを、受信元のコンピュータ200のユーザに対応するアバターオブジェクトに反映する。 The computer 200 transmits the generated face tracking data to the server 600. The server 600 transfers this data to another computer 200 that communicates with the computer 200. The other computer 200 reflects the received face tracking data in the avatar object corresponding to the user of the receiving computer 200.
図12(A)に示される例において、コンピュータ200Aは、コンピュータ200Bからユーザ5Bの表情を表すフェイストラッキングデータを受信する。コンピュータ200Aは、受信したデータをアバターオブジェクト6Bに反映する。一例として、アバターオブジェクト6Bを構成するポリゴンの頂点は、フェイストラッキングデータの特徴点に対応する頂点を含む。コンピュータ200Aは、対応する頂点の位置をフェイストラッキングデータに基づいて移動する。これにより、ユーザ5Bの表情がアバターオブジェクト6Bに反映される。その結果、ユーザ5Aは、アバターオブジェクト6Bを介してユーザ5Bの表情を認識できる。 In the example shown in FIG. 12A, the computer 200A receives face tracking data representing the facial expression of the user 5B from the computer 200B. The computer 200A reflects the received data on the avatar object 6B. As an example, the vertices of the polygons constituting the avatar object 6B include the vertices corresponding to the feature points of the face tracking data. The computer 200A moves the positions of the corresponding vertices based on the face tracking data. As a result, the facial expression of the user 5B is reflected in the avatar object 6B. As a result, the user 5A can recognize the facial expression of the user 5B via the avatar object 6B.
なお、アバターの顔の表情は、ユーザの顔の表情だけでなくユーザの身体の動きに応じて制御されてもよい。例えば手足の動きが閾値を超えて大きい場合は、アバターの顔が喜ぶ笑顔の表情に制御され、頭部が手前に倒れた場合は、アバターの顔が眉尻が下がった悲しい表情に制御される。 The facial expression of the avatar may be controlled not only according to the facial expression of the user but also according to the movement of the user's body. For example, if the movement of the limbs exceeds the threshold, the avatar's face is controlled to a happy smiling expression, and if the head falls toward you, the avatar's face is controlled to a sad expression with the bottom of the eyebrows lowered. ..
[顔のキャリブレーション]
ある実施形態において、コンピュータ200は、アバターの顔のキャリブレーションを実行することができる。キャリブレーションは、アバターの顔の表情を標準状態に制御する処理である。顔の表情の標準状態は、例えば喜怒哀楽がない無表情であるが、笑顔等の特定の表情を標準状態としてもよい。
[Face calibration]
In certain embodiments, the computer 200 can perform avatar face calibration. Calibration is a process of controlling the facial expression of the avatar to the standard state. The standard state of facial expression is, for example, expressionless with no emotions, but a specific facial expression such as a smile may be set as the standard state.
キャリブレーションの実行時、コンピュータ200のプロセッサ210は、HMD120の第1カメラ150及び第2カメラ160によりユーザ5の顔を撮影する。撮影時、プロセッサ210は、メニュー表示、音声案内等により顔の表情を標準状態とすることをユーザ5に促すことができる。プロセッサ210は、撮影画像からユーザ5の顔の表情を検出し、標準状態のフェイストラッキングデータを生成することができる。 At the time of performing the calibration, the processor 210 of the computer 200 photographs the face of the user 5 by the first camera 150 and the second camera 160 of the HMD 120. At the time of shooting, the processor 210 can urge the user 5 to set the facial expression to the standard state by displaying a menu, voice guidance, or the like. The processor 210 can detect the facial expression of the user 5 from the captured image and generate face tracking data in the standard state.
プロセッサ210は、現在のアバターのフェイストラッキングデータを、生成した標準状態のフェイストラッキングデータに更新する。プロセッサ210は、更新したフェイストラッキングデータに基づいてアバターの顔のポリゴンの頂点の位置を移動することで、アバターの顔の表情を標準状態に制御することができる。 The processor 210 updates the face tracking data of the current avatar with the generated standard state face tracking data. The processor 210 can control the facial expression of the avatar to the standard state by moving the positions of the vertices of the polygons of the avatar's face based on the updated face tracking data.
[キャリブレーション制御]
ある実施形態において、コンピュータ200は、アバターの顔のキャリブレーションを、ユーザの指示操作に応じて実行することができる。また、ある実施形態において、コンピュータ200は、ユーザの指示操作がなくとも、キャリブレーションの実行タイミングを検出した場合に、キャリブレーションを自動的に実行することができる。
[Calibration control]
In certain embodiments, the computer 200 can calibrate the avatar's face in response to user instructions. Further, in a certain embodiment, the computer 200 can automatically execute the calibration when the execution timing of the calibration is detected without any instruction operation by the user.
図19は、自動的なキャリブレーションの実行のために、コンピュータ200のプロセッサ210により実行される処理を示すフローチャートである。一例として、図12(A)に示したように、他のコンピュータ200Bと通信するコンピュータ200Aが実行する処理を説明する。 FIG. 19 is a flowchart showing the processing executed by the processor 210 of the computer 200 for the execution of the automatic calibration. As an example, as shown in FIG. 12A, a process executed by the computer 200A communicating with another computer 200B will be described.
図20は、ユーザ5Aのコンピュータ200Aが定義する仮想空間11Aを示す。上述のように、仮想空間11Aは、ユーザ5Bのコンピュータ200Bが定義する仮想空間11Bとデータが同じであるため、各コンピュータ200Aおよび200Bによって共有されている。コンピュータ200Aは、仮想空間11Aにユーザ5Aに関連付けられたアバター6Aとユーザ5Bに関連付けられたアバター6Bとを配置する。 FIG. 20 shows a virtual space 11A defined by the computer 200A of the user 5A. As described above, the virtual space 11A is shared by the computers 200A and 200B because the data is the same as the virtual space 11B defined by the computer 200B of the user 5B. The computer 200A arranges the avatar 6A associated with the user 5A and the avatar 6B associated with the user 5B in the virtual space 11A.
コンピュータ200Aは、ユーザ5Aに顔を標準状態とすることを促して、ユーザ5Aの顔の表情を検出し、標準状態のフェイストラッキングデータを生成する。コンピュータ200Aは、標準状態のフェイストラッキングデータに基づいてアバター6Aの顔の表情を制御する。これにより、アバター6Aの顔に標準状態の表情が反映される。他のコンピュータ200Bからユーザ5Bの標準状態のフェイストラッキングデータがアバター情報として送信されるので、コンピュータ200Aは、アバター6Bの顔にもユーザ5Bの標準状態の表情を反映させる。 The computer 200A prompts the user 5A to set the face in the standard state, detects the facial expression of the user 5A, and generates face tracking data in the standard state. The computer 200A controls the facial expression of the avatar 6A based on the face tracking data in the standard state. As a result, the expression in the standard state is reflected on the face of the avatar 6A. Since the face tracking data of the user 5B in the standard state is transmitted from the other computer 200B as the avatar information, the computer 200A reflects the facial expression of the user 5B in the standard state on the face of the avatar 6B.
その後、コンピュータ200Aは、所定のタイミングでフェイストラッキングデータを更新し、アバター6A及び6Bに各ユーザ5A及び5Bの表情を反映させる。ユーザ5Aは、仮想空間11Aを介した通信により、ユーザ5Bの表情を認識しながら対話することが可能である。 After that, the computer 200A updates the face tracking data at a predetermined timing, and reflects the facial expressions of the users 5A and 5B on the avatars 6A and 6B. The user 5A can interact with each other while recognizing the facial expression of the user 5B by communicating via the virtual space 11A.
アバター6Aの顔には、撮影時のHMD120Aの位置ずれやユーザ5Aが触れたことによる顔の変形等も反映され得る。そのため、フェイストラッキングデータの更新を続けると、アバター6Aの顔の状態が標準状態から大きく変化して顔の崩れが生じ、キャリブレーションが必要になることがある。コンピュータ200Aは、図19に示すステップS1951において、プロセッサ210が予め定められたキャリブレーションの実行条件が満たされたか否かを判断する。 The face of the avatar 6A may reflect the displacement of the HMD 120A at the time of shooting, the deformation of the face due to the touch of the user 5A, and the like. Therefore, if the face tracking data is continuously updated, the face state of the avatar 6A may change significantly from the standard state, causing the face to collapse, and calibration may be required. In step S1951 shown in FIG. 19, the computer 200A determines whether or not the processor 210 satisfies the predetermined calibration execution conditions.
キャリブレーションの実行条件の1つは、ユーザ6のアバター6Bからの視界に対応する視界画像がアバター6Aの顔を含む視界画像であったが、アバター6Aの顔を含まない画像に切り替わることである。アバター6Bからの視界とは、ユーザ5Bに関連付けられた仮想カメラ14(仮想視点)からの視界をいう。このキャリブレーションの実行タイミングによれば、通信相手のユーザBによってアバター6Aの崩れた顔が認識されない間にキャリブレーションを実行することができる。また、アバター6Aの顔が標準状態から大きく変化する前にキャリブレーションが実行されることもあり、顔の崩れを事前に防ぐことも可能である。 One of the execution conditions of the calibration is that the view image corresponding to the view from the avatar 6B of the user 6 is the view image including the face of the avatar 6A, but the image is switched to the image not including the face of the avatar 6A. .. The field of view from the avatar 6B means the field of view from the virtual camera 14 (virtual viewpoint) associated with the user 5B. According to the execution timing of this calibration, the calibration can be executed while the user B of the communication partner does not recognize the collapsed face of the avatar 6A. In addition, calibration may be executed before the face of the avatar 6A changes significantly from the standard state, and it is possible to prevent the face from collapsing in advance.
ある局面において、プロセッサ210は、視界画像の表示モードが視界画像の表示モードとは異なる他の表示モードに切り替えられた場合に、アバター6Aの顔を含まない画像に切り替わったと判断する。他の表示モードとしては、例えば仮想空間を切り替える間にHMD120A及び120Bに提供される暗転用の画像、操作方法等のチュートリアル画像、360度動画等の表示モードが挙げられる。仮想空間が切り替わる例としては、仮想空間11A及び11Bのデータが切り替わり、新たな仮想空間が定義される場合、具体的には対話用の仮想空間から戦闘ゲーム用の仮想空間に切り替わる場合等が挙げられる。360度動画は、360度カメラにより撮像された動画である。360動画によって全天球の空間を仮想空間として定義できる。プロセッサ210は、例えばサーバ600から新しい仮想空間データが送信され、更新が指示された場合に、HMD120Bにおける仮想空間の切り替わりを検出することができる。 In a certain aspect, the processor 210 determines that when the display mode of the field of view image is switched to another display mode different from the display mode of the field of view image, the image is switched to the image that does not include the face of the avatar 6A. Other display modes include, for example, display modes such as darkening images provided to the HMDs 120A and 120B while switching virtual spaces, tutorial images such as operation methods, and 360-degree moving images. Examples of switching virtual spaces include cases where the data of virtual spaces 11A and 11B are switched and a new virtual space is defined, specifically, cases where the virtual space for dialogue is switched to the virtual space for battle games. Be done. The 360-degree moving image is a moving image captured by a 360-degree camera. The space of the whole celestial sphere can be defined as a virtual space by 360 moving images. The processor 210 can detect the switching of the virtual space in the HMD 120B when, for example, new virtual space data is transmitted from the server 600 and an update is instructed.
また、ある局面において、プロセッサ210は、アバター6Bとアバター6Aの顔との間にオブジェクトが配置された場合に、アバター6Aの顔を含まない画像に切り替わったと判断する。視界画像にアバター6Aが含まれていても、アバター6Bとアバター6Aの顔の間にオブジェクトが配置されると、オブジェクトによって顔が覆われるため、視界画像にはアバター6Aの顔が含まれない。プロセッサ210は、例えばアバター6Bの視線上にオブジェクトとアバター6Aの顔とが並ぶ位置関係を検出した場合に、アバター6Bの顔が含まれない画像に切り替わったと判断できる。 Further, in a certain aspect, when the object is arranged between the avatar 6B and the face of the avatar 6A, the processor 210 determines that the image is switched to the image that does not include the face of the avatar 6A. Even if the view image includes the avatar 6A, if the object is placed between the faces of the avatar 6B and the avatar 6A, the face is covered by the object, so that the view image does not include the face of the avatar 6A. When the processor 210 detects, for example, the positional relationship in which the object and the face of the avatar 6A are lined up on the line of sight of the avatar 6B, it can be determined that the image is switched to the image that does not include the face of the avatar 6B.
オブジェクトは、例えばメニュー等の操作用のオブジェクト、木や壁等のオブジェクト等が挙げられる。メニューは、通知、機能説明等の表示領域を有するユーザーインターフェイス(UI:User Interface)であり、必要に応じてユーザの指示を受け付ける操作領域も有することができる。メニューの表示形態としては、例えばアイコン、ポップアップウィンドウ、ウィジェット等が挙げられる。メニューは、仮想空間11A及び11Bに配置されるオブジェクトであってもよいし、視界画像中にレンダリングされる2次元画像であってもよい。 Examples of the object include an object for operation such as a menu, an object such as a tree and a wall, and the like. The menu is a user interface (UI: User Interface) having a display area for notifications, function explanations, etc., and may also have an operation area for receiving user instructions as needed. Examples of the menu display form include icons, pop-up windows, widgets, and the like. The menu may be an object placed in the virtual spaces 11A and 11B, or it may be a two-dimensional image rendered in the visual field image.
図21は、メニューを含む視界画像の一例を示している。
図20に示すように、アバター6Bからの視線2016B上にアバター6Aが位置する場合、HMD120Bに表示される視界画像2117にはアバター6Aが含まれる。しかし、仮想視点とアバター6Aの顔と間にメニューのオブジェクトが配置された場合、視界画像2117には、アバター6Aの顔の正面に位置するメニュー2121が含まれる。メニュー2121は、シーンの切り替えを問う表示領域と切り替えするか否かの選択を受け付ける操作領域を有するUIである。メニュー2121によってアバター6Aの顔が覆われ、HMD120Bに提供される視界画像2117にはアバター6Aの顔が含まれない。
FIG. 21 shows an example of a field of view image including a menu.
As shown in FIG. 20, when the avatar 6A is located on the line of sight 2016B from the avatar 6B, the field of view image 2117 displayed on the HMD 120B includes the avatar 6A. However, when the menu object is placed between the virtual viewpoint and the face of the avatar 6A, the view image 2117 includes the menu 2121 located in front of the face of the avatar 6A. Menu 2121 is a UI having a display area for asking for scene switching and an operation area for accepting selection of whether or not to switch. The face of avatar 6A is covered by menu 2121, and the field of view image 2117 provided to the HMD 120B does not include the face of avatar 6A.
キャリブレーションの実行条件の1つは、標準状態からのアバター6Aの顔の表情の変化量が閾値を超えることである。この実行条件によれば、実際に顔が大きく変化したタイミングでキャリブレーションを実行することができる。 One of the calibration execution conditions is that the amount of change in the facial expression of the avatar 6A from the standard state exceeds the threshold value. According to this execution condition, the calibration can be executed at the timing when the face actually changes significantly.
プロセッサ210は、ユーザ5Bに関連付けられたアバター6Bの動き又は音声の特定のパターンが検出された場合に、アバター6Aの顔の表情の変化量が閾値を超えたと判断することができる。これにより、顔の変化に対する通信相手の反応に応じてすぐにキャリブレーションを実行することができる。通信相手から顔の変化を指摘されたユーザ5Aが逐一キャリブレーションのための操作を省くことができる。 When a specific pattern of movement or voice of the avatar 6B associated with the user 5B is detected, the processor 210 can determine that the amount of change in the facial expression of the avatar 6A exceeds the threshold value. As a result, the calibration can be immediately executed according to the reaction of the communication partner to the change of the face. The user 5A, whose face has been pointed out by the communication partner, can omit the operation for calibration one by one.
例えば、プロセッサ210は、アバター6Aからの視界に対応する視界画像から、アバター6Bが自身の顔を指さす動き、怪訝な顔の表情、笑う表情等の特定の画像パターンを検出した場合に、アバター6Aの顔の表情の変化量が閾値を超えたと判断できる。アバター6Aからの視界とは、ユーザ5Aに関連付けられた仮想カメラ14(仮想視点)からの視界をいう。プロセッサ210は、サーバ600を介してコンピュータ200Bから送信されるアバター情報からアバター6Bの動き情報を抽出し、抽出した動き情報からアバター6Aの顔の変化を指摘する特定の動きのパターンを検出してもよい。また、プロセッサ210は、アバター6Bのアバター情報に含まれるユーザ5Bの音声データを解析し、「顔」、「おかしい」、「変」等の特定の音声パターンを認識することで、アバター6Aの顔の表情の変化量が閾値を超えたと判断できる。 For example, when the processor 210 detects a specific image pattern such as a movement of the avatar 6B pointing to its own face, a suspicious facial expression, or a laughing facial expression from the view image corresponding to the view from the avatar 6A, the avatar 6A It can be determined that the amount of change in facial expression of the face exceeds the threshold. The field of view from the avatar 6A means the field of view from the virtual camera 14 (virtual viewpoint) associated with the user 5A. The processor 210 extracts the movement information of the avatar 6B from the avatar information transmitted from the computer 200B via the server 600, and detects a specific movement pattern pointing out the change of the face of the avatar 6A from the extracted movement information. May be good. Further, the processor 210 analyzes the voice data of the user 5B included in the avatar information of the avatar 6B and recognizes a specific voice pattern such as "face", "funny", and "funny" to recognize the face of the avatar 6A. It can be determined that the amount of change in the facial expression of is exceeding the threshold.
画像パターン及び音声パターンの検出方法としては特に限定されず、公知の方法を使用できる。画像パターンの検出方法としては、例えば検出対象の画像パターンをモデルパターンとして準備しておき、視界画像中にモデルパターンの画像の特徴量と類似する画像パターンを検索する方法等が挙げられる。また、音声パターンの検出方法としては、音声データを形態素解析して、音素のモデルと照合することで音素を特定し、目的の音声パターンを検索する方法等が挙げられる。 The method for detecting the image pattern and the sound pattern is not particularly limited, and a known method can be used. Examples of the image pattern detection method include a method in which an image pattern to be detected is prepared as a model pattern and an image pattern similar to the feature amount of the image of the model pattern is searched for in the visual field image. Further, as a method of detecting a voice pattern, a method of morphologically analyzing voice data, identifying a phoneme by collating it with a phoneme model, and searching for a target voice pattern can be mentioned.
アバター6Bの視界にアバター6Aが含まれない場合は、ユーザ5Bがアバター6Aの顔の表情を視認できない。よって、アバター6Bの視線上にアバター6Aが位置する場合に限定して、プロセッサ210は、上述したアバター6Aの顔の表情の変化量が閾値を超えているか否かの判断を行うようにしてもよい。 When the avatar 6A is not included in the field of view of the avatar 6B, the user 5B cannot visually recognize the facial expression of the avatar 6A. Therefore, only when the avatar 6A is located in the line of sight of the avatar 6B, the processor 210 may determine whether or not the amount of change in the facial expression of the avatar 6A described above exceeds the threshold value. good.
図22は、アバター6Bを含む視界画像の一例を示している。
図20に示すように、アバター6Aの視線2016A上にアバター6Bが位置する場合、図22に示すように、HMD120Aに表示される視界画像2217にはアバター6Bが含まれる。
図22に示すように、プロセッサ210は、視界画像2217中の自身の顔を指さすアバター6Bの画像パターンを検出すると、アバター6Aの顔の表情の変化量が閾値を超えたと判断する。または、プロセッサ210は、アバター6Bのアバター情報から「顔」及び「変」の音声パターンに一致する、ユーザ5Bの「顔が変だよ」の音声2221を検出すると、アバター6Aの顔の表情の変化量が閾値を超えたと判断する。
FIG. 22 shows an example of a field of view image including the avatar 6B.
As shown in FIG. 20, when the avatar 6B is located on the line of sight 2016A of the avatar 6A, the field of view image 2217 displayed on the HMD 120A includes the avatar 6B as shown in FIG.
As shown in FIG. 22, when the processor 210 detects the image pattern of the avatar 6B pointing to its own face in the view image 2217, it determines that the amount of change in the facial expression of the avatar 6A exceeds the threshold value. Alternatively, when the processor 210 detects the voice 2221 of the user 5B "the face is strange" that matches the voice patterns of "face" and "funny" from the avatar information of the avatar 6B, the processor 210 detects the facial expression of the avatar 6A. It is judged that the amount of change exceeds the threshold.
なお、プロセッサ210は、アバター6Bからの視界に対応する視界画像を画像解析することにより、当該視界画像中に含まれるアバター6Aの顔の表情の変化量を検出してもよい。例えば、プロセッサ210は、フェイストラッキングデータを生成する場合と同様にしてアバター6Aの顔の各部位を検出し、その位置、形状等の変化量が閾値を超えるか否かを判断する。アバター6Bの視界画像は、ユーザ5Bのコンピュータ200Bから取得できる。 The processor 210 may detect the amount of change in the facial expression of the avatar 6A included in the view image by image-analyzing the view image corresponding to the view from the avatar 6B. For example, the processor 210 detects each part of the face of the avatar 6A in the same manner as in the case of generating face tracking data, and determines whether or not the amount of change in the position, shape, or the like exceeds the threshold value. The field of view image of the avatar 6B can be obtained from the computer 200B of the user 5B.
キャリブレーションの実行条件の1つは、標準状態にあるユーザ5Aの顔の表情が検出されたことである。プロセッサ210は、更新のために生成したフェイストラッキングデータを標準状態のフェイストラッキングデータと比較し、類似度が一定値以上の場合に、ユーザ5Aの顔の表情が標準状態にあると判断することができる。この実行条件によれば、顔が大きく変化する前にキャリブレーションが実行されることもあり、顔の崩れの予防も可能である。また、ユーザ5Aが意図的に顔の表情を標準状態とすることでキャリブレーションが実行されるため、実行の指示が容易になる。 One of the conditions for executing the calibration is that the facial expression of the user 5A in the standard state is detected. The processor 210 compares the face tracking data generated for update with the face tracking data in the standard state, and if the similarity is equal to or higher than a certain value, it may determine that the facial expression of the user 5A is in the standard state. can. According to this execution condition, the calibration may be performed before the face changes significantly, and it is possible to prevent the face from collapsing. Further, since the calibration is executed by the user 5A intentionally setting the facial expression to the standard state, the execution instruction becomes easy.
上述したキャリブレーションの実行条件が満たされた場合(S1951:YES)、プロセッサ210は、キャリブレーションの実行を決定する。プロセッサ210は、上述した複数のキャリブレーションの実行条件のうちの特定の1つが満たされたか否かを判断するようにしてもよい。また、プロセッサ210は、複数の実行条件を監視していずれか1つでも満たされた場合に、キャリブレーションの実行を決定するようにしてもよい。ステップS1951において、キャリブレーションの実行条件が満たされない場合は(S1951:NO)、本処理を終了する。 When the above-mentioned calibration execution condition is satisfied (S1951: YES), the processor 210 decides to execute the calibration. The processor 210 may determine whether or not a specific one of the plurality of calibration execution conditions described above is satisfied. Further, the processor 210 may monitor a plurality of execution conditions and decide to execute the calibration when any one of them is satisfied. If the calibration execution condition is not satisfied in step S1951 (S1951: NO), this process ends.
キャリブレーションの実行が決定されると、ステップS1952において、プロセッサ210は、キャリブレーションの実行中、キャリブレーションの実行を通知する処理を行う。例えば、プロセッサ210は、通知用のメニューをアバター6Aの顔の正面に配置する。メニューは、実行を通知する表示領域だけでなく、キャリブレーションのために標準状態の表情を促す表示領域を有してもよい。次いで、ステップS1953において、プロセッサ210は、視界画像を生成して更新する。 When the execution of the calibration is determined, in step S1952, the processor 210 performs a process of notifying the execution of the calibration during the execution of the calibration. For example, the processor 210 places a notification menu in front of the face of Avatar 6A. The menu may have not only a display area for notifying execution, but also a display area for prompting a standard state expression for calibration. Then, in step S1953, the processor 210 generates and updates the field of view image.
通知の処理により、ユーザ5AのHMD120Aには、メニューを含む視界画像が表示される。プロセッサ210は、メニューのサイズを、キャリブレーション対象のアバター6Aの顔を覆うサイズに制御してもよい。これにより、アバター6Bからの視界に対応する視界画像を、アバター6Aの顔がメニューにより覆われた視界画像に切り替えることができる。 By the notification processing, the field of view image including the menu is displayed on the HMD120A of the user 5A. The processor 210 may control the size of the menu to cover the face of the avatar 6A to be calibrated. Thereby, the visual field image corresponding to the visual field from the avatar 6B can be switched to the visual field image in which the face of the avatar 6A is covered with the menu.
ステップS1954において、プロセッサ210は、アバター6Aの顔のキャリブレーションを実行する。具体的には、プロセッサ210は、キャリブレーション中のアバター6Aの顔を、キャリブレーション直前の顔に固定する。プロセッサ210は、標準状態にあるユーザ5Aの顔の表情を検出して、標準状態のフェイストラッキングデータを生成し、アバター6Aの顔に反映する。なお、標準状態の顔のフェイストラッキングデータを生成し直すのではなく、最初に生成した標準状態のフェイストラッキングデータに基づいて、アバター6Aの顔の表情を制御してもよい。 In step S1954, processor 210 calibrates the face of Avatar 6A. Specifically, the processor 210 fixes the face of the avatar 6A being calibrated to the face immediately before the calibration. The processor 210 detects the facial expression of the user 5A in the standard state, generates face tracking data in the standard state, and reflects it on the face of the avatar 6A. Instead of regenerating the face tracking data in the standard state, the facial expression of the avatar 6A may be controlled based on the face tracking data in the standard state first generated.
ステップS1955において、プロセッサ210は、仮想空間11Aにおけるアバター6Aのアバター情報を、サーバ600を介してコンピュータ200Bへ送信する。具体的には、サーバ600が、受信したアバター6Aのアバター情報を、コンピュータ200Bから送信されたアバター6Bのアバター情報と統合して、各コンピュータ200A及び200Bに送信する。プロセッサ210は、統合されたアバター6A及び6Bのアバター情報に基づいて、仮想空間11A上のアバター6A及び6Bの位置、向き、顔の表情等を更新する。 In step S1955, the processor 210 transmits the avatar information of the avatar 6A in the virtual space 11A to the computer 200B via the server 600. Specifically, the server 600 integrates the received avatar information of the avatar 6A with the avatar information of the avatar 6B transmitted from the computer 200B, and transmits the avatar information to the computers 200A and 200B. The processor 210 updates the positions, orientations, facial expressions, and the like of the avatars 6A and 6B on the virtual space 11A based on the integrated avatar information of the avatars 6A and 6B.
ステップS1956において、プロセッサ210は、視界画像を生成して更新する。ユーザ5Bのコンピュータ200Bにおいても同様に、アバターと視界画像の更新が行われる。更新により、キャリブレーションによって顔が標準状態に制御されたアバター6Aを含む視界画像がコンピュータ200Bに表示される。 In step S1956, the processor 210 generates and updates the field of view image. Similarly, the avatar and the field of view image are updated on the computer 200B of the user 5B. With the update, a field of view image including the avatar 6A whose face is controlled to the standard state by calibration is displayed on the computer 200B.
図23は、キャリブレーション前後のアバター6Aを含む視界画像の一例を示す。
図23に示す視界画像2317A及び2317Bは、図20に示す視線2016Bが検出され、ユーザ5BのHMD120Bに表示された視界画像である。視界画像2317Aは、キャリブレーション前の視界画像であり、図23に示すように、目、口等の位置が下側にずれて顔が標準状態から大きく変化したアバター6Aが含まれる。キャリブレーション後、視界画像2317Aは視界画像2317Bに更新される。視界画像2317B中のアバター6Aの顔が標準状態の無表情であり、顔の崩れが修正されている。
FIG. 23 shows an example of a field of view image including the avatar 6A before and after calibration.
The visual field images 2317A and 2317B shown in FIG. 23 are visual field images in which the visual field 2016B shown in FIG. 20 is detected and displayed on the HMD 120B of the user 5B. The field of view image 2317A is a field of view image before calibration, and as shown in FIG. 23, includes an avatar 6A in which the positions of eyes, mouth, etc. are shifted downward and the face is significantly changed from the standard state. After calibration, the field of view image 2317A is updated to the field of view image 2317B. The face of avatar 6A in the field of view image 2317B is expressionless in the standard state, and the collapse of the face is corrected.
以上のように、上記キャリブレーション制御によれば、コンピュータ200Aのプロセッサ210がキャリブレーションの実行条件が満たされた場合に、キャリブレーションを実行する。したがって、ユーザ5Aのキーボード等の入力装置の操作がなくとも、アバター6Aの顔のキャリブレーションを適切なタイミングで行うことができる。操作が不要であるため、HMD120Aにより視界が遮られて現実空間の入力装置が操作しづらい場合には特に利便性がよい。また、顔の崩れが自動的に修正されるため、ユーザ5Aはアバター6Aの顔の崩れやその修正のための操作を気にせずに、対話に没入することができる。 As described above, according to the above calibration control, the processor 210 of the computer 200A executes the calibration when the execution condition of the calibration is satisfied. Therefore, the face of the avatar 6A can be calibrated at an appropriate timing without operating an input device such as a keyboard of the user 5A. Since no operation is required, it is particularly convenient when the field of view is obstructed by the HMD120A and it is difficult to operate the input device in the real space. Further, since the face collapse is automatically corrected, the user 5A can immerse himself in the dialogue without worrying about the face collapse of the avatar 6A and the operation for correcting the face collapse.
なお、頻繁なキャリブレーションを防ぐため、キャリブレーションの実行条件が満たされた場合でも、前回のキャリブレーションから一定時間が経過していない場合は、プロセッサ210は、キャリブレーションを行わないようにしてもよい。 In order to prevent frequent calibration, even if the calibration execution conditions are satisfied, if a certain period of time has not passed since the previous calibration, the processor 210 may not perform the calibration. good.
以上、本開示の実施形態について説明したが、本発明の技術的範囲は、本実施形態の説明によって限定的に解釈されるべきではない。本実施形態は一例であって、特許請求の範囲に記載された発明の範囲内において、様々な実施形態の変更が可能であることが当業者によって理解されるところである。本発明の技術的範囲は、特許請求の範囲に記載された発明の範囲およびその均等の範囲に基づいて定められるべきである。 Although the embodiments of the present disclosure have been described above, the technical scope of the present invention should not be construed as being limited by the description of the present embodiments. This embodiment is an example, and it is understood by those skilled in the art that various embodiments can be changed within the scope of the invention described in the claims. The technical scope of the present invention should be determined based on the scope of the invention described in the claims and the equivalent scope thereof.
上記実施形態においては、HMDによってユーザが没入する仮想空間(VR空間)を例示して説明したが、HMDとして、透過型のHMDを採用してもよい。この場合、透過型のHMDを介してユーザが視認する現実空間に仮想空間を構成する画像の一部を合成した視界画像を出力することにより、拡張現実(AR:Augmented Reality)空間または複合現実(MR:Mixed Reality)空間における仮想体験をユーザに提供してもよい。この場合、操作オブジェクトに代えて、ユーザの手の動きに基づいて、仮想空間内における対象オブジェクトへの作用を生じさせてもよい。具体的には、プロセッサは、現実空間におけるユーザの手の位置の座標情報を特定するとともに、仮想空間内における対象オブジェクトの位置を現実空間における座標情報との関係で定義してもよい。これにより、プロセッサは、現実空間におけるユーザの手と仮想空間における対象オブジェクトとの位置関係を把握し、ユーザの手と対象オブジェクトとの間で上述したコリジョン制御等に対応する処理を実行可能となる。その結果、ユーザの手の動きに基づいて対象オブジェクトに作用を与えることが可能となる。 In the above embodiment, the virtual space (VR space) in which the user is immersed by the HMD has been described as an example, but a transparent HMD may be adopted as the HMD. In this case, augmented reality (AR) space or mixed reality (AR) space or mixed reality (AR: Augmented Reality) space or mixed reality (AR) space or mixed reality (AR) MR: Mixed Reality) A virtual experience in space may be provided to the user. In this case, instead of the operation object, an action on the target object in the virtual space may be generated based on the movement of the user's hand. Specifically, the processor may specify the coordinate information of the position of the user's hand in the real space, and may define the position of the target object in the virtual space in relation to the coordinate information in the real space. As a result, the processor can grasp the positional relationship between the user's hand in the real space and the target object in the virtual space, and can execute the process corresponding to the collision control and the like described above between the user's hand and the target object. .. As a result, it becomes possible to give an action to the target object based on the movement of the user's hand.
(構成)
以上に開示された技術的特徴は、以下のように要約され得る。
(Constitution)
The technical features disclosed above can be summarized as follows.
(構成1)
仮想空間を定義するステップと、前記仮想空間上に、第1ユーザに関連付けられた第1アバターを配置するステップと、前記第1ユーザの顔の表情を検出するステップと、前記第1ユーザの顔の表情に応じて、前記第1アバターの顔の表情を制御するステップと、前記第1アバターの顔の表情を標準状態に制御するキャリブレーションの実行条件が満たされた場合に、前記キャリブレーションを実行するステップ(ステップS1951、S1954)と、をコンピュータに実行させるためのプログラム。
(Structure 1)
A step of defining a virtual space, a step of arranging a first avatar associated with the first user on the virtual space, a step of detecting a facial expression of the first user, and a face of the first user. When the step of controlling the facial expression of the first avatar and the execution condition of the calibration for controlling the facial expression of the first avatar to the standard state are satisfied according to the facial expression of the first avatar, the calibration is performed. A program for causing a computer to execute steps (steps S1951 and S1954) to be executed.
(構成2)
(構成1)において、前記仮想空間上に、第2ユーザに関連付けられた第2アバターを配置するステップを前記コンピュータにさらに実行させる。前記キャリブレーションの実行条件の1つは、前記第2アバターからの視界に対応する視界画像であって前記第1アバターの顔を含む視界画像が、前記第1アバターの顔を含まない画像に切り替わることである。
(Structure 2)
In (Structure 1), the computer is further made to perform a step of arranging a second avatar associated with the second user on the virtual space. One of the execution conditions of the calibration is a field of view image corresponding to the field of view from the second avatar, and the field of view image including the face of the first avatar is switched to an image not including the face of the first avatar. That is.
(構成3)
(構成2)において、前記キャリブレーションを実行するステップは、前記第2アバターと前記第1アバターの顔との間にオブジェクトが配置された場合に、前記第1アバターの顔を含まない画像に切り替わったと判断する。
(Structure 3)
In (Structure 2), the step of executing the calibration switches to an image that does not include the face of the first avatar when an object is placed between the face of the second avatar and the face of the first avatar. Judge.
(構成4)
(構成2)において、前記キャリブレーションを実行するステップは、前記視界画像の表示モードが前記視界画像の表示モードとは異なる表示モードに切り替えられた場合に、前記第1アバターの顔を含まない画像に切り替わったと判断する。
(Structure 4)
In (Structure 2), the step of executing the calibration is an image that does not include the face of the first avatar when the display mode of the visual field image is switched to a display mode different from the display mode of the visual field image. Judge that it has switched to.
(構成5)
(構成1)~(構成4)のいずれかにおいて、前記キャリブレーションの実行条件の1つは、前記標準状態からの前記第1アバターの顔の表情の変化量が閾値を超えることである。
(Structure 5)
In any of (Structure 1) to (Structure 4), one of the execution conditions of the calibration is that the amount of change in the facial expression of the first avatar from the standard state exceeds the threshold value.
(構成6)
(構成1)~(構成5)のいずれかにおいて、前記キャリブレーションの実行条件の1つは、前記標準状態にある前記第1ユーザの顔の表情が検出されたことである。
(Structure 6)
In any of (Structure 1) to (Structure 5), one of the execution conditions of the calibration is that the facial expression of the first user in the standard state is detected.
(構成7)
コンピュータが実行する方法であって、仮想空間を定義するステップと、前記仮想空間上に、第1ユーザに関連付けられた第1アバターを配置するステップと、前記第1ユーザの顔の表情を検出するステップと、前記第1ユーザの顔の表情に応じて、前記第1アバターの顔の表情を制御するステップと、前記第1アバターの顔の表情を標準状態に制御するキャリブレーションの実行条件が満たされた場合に、前記キャリブレーションを実行するステップと、を含む方法。
(Structure 7)
A method executed by a computer, in which a step of defining a virtual space, a step of placing a first avatar associated with the first user on the virtual space, and a facial expression of the first user are detected. The step, the step of controlling the facial expression of the first avatar according to the facial expression of the first user, and the execution condition of the calibration for controlling the facial expression of the first avatar to the standard state are satisfied. A method comprising, if done, a step of performing the calibration.
(構成8)
プログラムを格納したメモリと、プロセッサと、を備え、前記プロセッサは、前記プログラムを読み取って、仮想空間を定義するステップと、前記仮想空間上に、第1ユーザに関連付けられた第1アバターを配置するステップと、前記第1ユーザの顔の表情を検出するステップと、前記第1ユーザの顔の表情に応じて、前記第1アバターの顔の表情を制御するステップと、前記第1アバターの顔の表情を標準状態に制御するキャリブレーションの実行条件が満たされた場合に、前記キャリブレーションを実行するステップと、を実行するコンピュータ。
(Structure 8)
A memory for storing a program and a processor are provided, and the processor reads the program, defines a virtual space, and arranges a first avatar associated with the first user on the virtual space. A step of detecting the facial expression of the first user, a step of controlling the facial expression of the first avatar according to the facial expression of the first user, and a step of controlling the facial expression of the first avatar. A computer that executes a step of executing the calibration and a computer that executes the calibration when the execution condition of the calibration for controlling the facial expression to the standard state is satisfied.
2…ネットワーク、5…ユーザ、6…アバターオブジェクト、11…仮想空間、12…中心、14…仮想カメラ、15…視界領域、100…HMDシステム、110…HMDセット、130…モニタ、170…マイク、180…スピーカ、190…センサ、200…コンピュータ、210…プロセッサ、220…メモリ、230…ストレージ、240…入出力インターフェイス、250…通信インターフェイス、300…コントローラ、310…グリップ、320…フレーム、340、350、370、380…ボタン、390…アナログスティック、410…HMDセンサ、420…モーションセンサ、430…ディスプレイ、510…コントロールモジュール、520…レンダリングモジュール、530…メモリモジュール、540…通信制御モジュール、600…サーバ、610…プロセッサ、620…メモリ、630…ストレージ、640…入出力インターフェイス、650…通信インターフェイス、1421…仮想カメラ制御モジュール、1422…視界領域決定モジュール、1423…基準視線特定モジュール、1424…動き検出モジュール、1424…顔器官検出モジュール、1425…動き検出モジュール、1426…仮想空間定義モジュール、1427…仮想オブジェクト生成モジュール、1428…操作オブジェクト制御モジュール、1429…アバター制御モジュール、1438…視界画像生成モジュール 2 ... network, 5 ... user, 6 ... avatar object, 11 ... virtual space, 12 ... center, 14 ... virtual camera, 15 ... view area, 100 ... HMD system, 110 ... HMD set, 130 ... monitor, 170 ... microphone, 180 ... Speaker, 190 ... Sensor, 200 ... Computer, 210 ... Processor, 220 ... Memory, 230 ... Storage, 240 ... Input / Output Interface, 250 ... Communication Interface, 300 ... Controller, 310 ... Grip, 320 ... Frame, 340, 350 370, 380 ... Button, 390 ... Analog Stick, 410 ... HMD Sensor, 420 ... Motion Sensor, 430 ... Display, 510 ... Control Module, 520 ... Rendering Module, 530 ... Memory Module, 540 ... Communication Control Module, 600 ... Server , 610 ... Processor, 620 ... Memory, 630 ... Storage, 640 ... Input / output interface, 650 ... Communication interface, 1421 ... Virtual camera control module, 1422 ... View area determination module, 1423 ... Reference line-of-sight identification module, 1424 ... Motion detection module , 1424 ... Face organ detection module, 1425 ... Motion detection module, 1426 ... Virtual space definition module, 1427 ... Virtual object generation module, 1428 ... Operation object control module, 1429 ... Avatar control module, 1438 ... Visibility image generation module

Claims (8)

  1. 仮想空間を定義するステップと、
    前記仮想空間上に、第1ユーザに関連付けられた第1アバターを配置するステップと、前記第1ユーザの顔の表情を検出するステップと、
    前記第1ユーザの顔の表情に応じて、前記第1アバターの顔の表情を制御するステップと、
    前記第1アバターの顔の表情を標準状態に制御するキャリブレーションの実行条件が満たされた場合に、前記キャリブレーションを実行するステップと、
    をコンピュータに実行させるためのプログラム。
    Steps to define virtual space and
    A step of arranging the first avatar associated with the first user on the virtual space, a step of detecting the facial expression of the first user, and a step of detecting the facial expression of the first user.
    A step of controlling the facial expression of the first avatar according to the facial expression of the first user, and
    When the execution condition of the calibration for controlling the facial expression of the first avatar to the standard state is satisfied, the step of executing the calibration and the step of executing the calibration.
    A program that lets your computer run.
  2. 前記仮想空間上に、第2ユーザに関連付けられた第2アバターを配置するステップを前記コンピュータにさらに実行させ、
    前記キャリブレーションの実行条件の1つは、前記第2アバターからの視界に対応する視界画像であって前記第1アバターの顔を含む視界画像が、前記第1アバターの顔を含まない画像に切り替わることである、
    請求項1に記載のプログラム。
    Further causing the computer to perform a step of placing a second avatar associated with the second user in the virtual space.
    One of the execution conditions of the calibration is a field of view image corresponding to the field of view from the second avatar, and the field of view image including the face of the first avatar is switched to an image not including the face of the first avatar. That is,
    The program according to claim 1.
  3. 前記キャリブレーションを実行するステップは、前記第2アバターと前記第1アバターの顔との間にオブジェクトが配置された場合に、前記第1アバターの顔を含まない画像に切り替わったと判断する、
    請求項2に記載のプログラム。
    The step of executing the calibration determines that when an object is placed between the second avatar and the face of the first avatar, the image is switched to an image that does not include the face of the first avatar.
    The program according to claim 2.
  4. 前記キャリブレーションを実行するステップは、前記視界画像の表示モードが前記視界画像の表示モードとは異なる表示モードに切り替えられた場合に、前記第1アバターの顔を含まない画像に切り替わったと判断する、
    請求項2に記載のプログラム。
    The step of executing the calibration determines that when the display mode of the visual field image is switched to a display mode different from the display mode of the visual field image, the image is switched to the image that does not include the face of the first avatar.
    The program according to claim 2.
  5. 前記キャリブレーションの実行条件の1つは、前記標準状態からの前記第1アバターの顔の表情の変化量が閾値を超えることである、
    請求項1~4のいずれか一項に記載のプログラム。
    One of the execution conditions of the calibration is that the amount of change in the facial expression of the first avatar from the standard state exceeds the threshold value.
    The program according to any one of claims 1 to 4.
  6. 前記キャリブレーションの実行条件の1つは、前記標準状態にある前記第1ユーザの顔の表情が検出されたことである、
    請求項1~5のいずれか一項に記載のプログラム。
    One of the execution conditions of the calibration is that the facial expression of the first user in the standard state is detected.
    The program according to any one of claims 1 to 5.
  7. コンピュータが実行する方法であって、仮想空間を定義するステップと、
    前記仮想空間上に、第1ユーザに関連付けられた第1アバターを配置するステップと、前記第1ユーザの顔の表情を検出するステップと、
    前記第1ユーザの顔の表情に応じて、前記第1アバターの顔の表情を制御するステップと、
    前記第1アバターの顔の表情を標準状態に制御するキャリブレーションの実行条件が満たされた場合に、前記キャリブレーションを実行するステップと、を含む方法。
    The steps that a computer performs, defining virtual space,
    A step of arranging the first avatar associated with the first user on the virtual space, a step of detecting the facial expression of the first user, and a step of detecting the facial expression of the first user.
    A step of controlling the facial expression of the first avatar according to the facial expression of the first user, and
    A method including a step of executing the calibration when the execution condition of the calibration for controlling the facial expression of the first avatar to the standard state is satisfied.
  8. プログラムを格納したメモリと、プロセッサと、を備え、
    前記プロセッサは、前記プログラムを読み取って、仮想空間を定義するステップと、
    前記仮想空間上に、第1ユーザに関連付けられた第1アバターを配置するステップと、
    前記第1ユーザの顔の表情を検出するステップと、
    前記第1ユーザの顔の表情に応じて、前記第1アバターの顔の表情を制御するステップと、
    前記第1アバターの顔の表情を標準状態に制御するキャリブレーションの実行条件が満たされた場合に、前記キャリブレーションを実行するステップと、を実行する
    コンピュータ。
    It has a memory for storing programs and a processor.
    The processor reads the program and defines a virtual space.
    A step of placing the first avatar associated with the first user in the virtual space, and
    The step of detecting the facial expression of the first user and
    A step of controlling the facial expression of the first avatar according to the facial expression of the first user, and
    A computer that executes a step of executing the calibration and a step of executing the calibration when the execution condition of the calibration for controlling the facial expression of the first avatar to the standard state is satisfied.
PCT/JP2021/000155 2020-01-16 2021-01-06 Program, method executed by computer, and computer WO2021145243A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2020-005257 2020-01-16
JP2020005257A JP7295045B2 (en) 2020-01-16 2020-01-16 Programs, computer implemented methods and computers

Publications (1)

Publication Number Publication Date
WO2021145243A1 true WO2021145243A1 (en) 2021-07-22

Family

ID=76864593

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/000155 WO2021145243A1 (en) 2020-01-16 2021-01-06 Program, method executed by computer, and computer

Country Status (2)

Country Link
JP (1) JP7295045B2 (en)
WO (1) WO2021145243A1 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017006872A1 (en) * 2015-07-03 2017-01-12 学校法人慶應義塾 Facial expression identification system, facial expression identification method, and facial expression identification program
JP2018538593A (en) * 2015-09-29 2018-12-27 バイナリーヴィーアール, インコーポレイテッドBinaryvr, Inc. Head mounted display with facial expression detection function
JP2019106220A (en) * 2019-03-27 2019-06-27 株式会社コロプラ Program executed by computer to provide virtual space via head mount device, method, and information processing device
JP6560463B1 (en) * 2016-06-03 2019-08-14 フェイスブック・テクノロジーズ・リミテッド・ライアビリティ・カンパニーFacebook Technologies, Llc Face and eye tracking and facial animation using face sensors in head mounted displays

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017006872A1 (en) * 2015-07-03 2017-01-12 学校法人慶應義塾 Facial expression identification system, facial expression identification method, and facial expression identification program
JP2018538593A (en) * 2015-09-29 2018-12-27 バイナリーヴィーアール, インコーポレイテッドBinaryvr, Inc. Head mounted display with facial expression detection function
JP6560463B1 (en) * 2016-06-03 2019-08-14 フェイスブック・テクノロジーズ・リミテッド・ライアビリティ・カンパニーFacebook Technologies, Llc Face and eye tracking and facial animation using face sensors in head mounted displays
JP2019106220A (en) * 2019-03-27 2019-06-27 株式会社コロプラ Program executed by computer to provide virtual space via head mount device, method, and information processing device

Also Published As

Publication number Publication date
JP7295045B2 (en) 2023-06-20
JP2021114036A (en) 2021-08-05

Similar Documents

Publication Publication Date Title
US20180165862A1 (en) Method for communication via virtual space, program for executing the method on a computer, and information processing device for executing the program
US20180181367A1 (en) Method for providing virtual space, program and apparatus therefor
JP7394158B2 (en) Program and method executed on a computer and information processing apparatus for providing a virtual space via a head-mounted device
JP7466034B2 (en) Programs and systems
JP6770562B2 (en) Program, virtual space provision method and information processing device
JP6513241B1 (en) PROGRAM, INFORMATION PROCESSING DEVICE, AND INFORMATION PROCESSING METHOD
JP7005406B2 (en) Programs, information processing devices, and information processing methods
JP7192151B2 (en) Program, information processing device, and information processing method
JP2022171742A (en) Program, information processing method, and information processing device
JP6965304B2 (en) Programs, information processing devices, and information processing methods
JP7356827B2 (en) Program, information processing method, and information processing device
JP6771006B2 (en) Programs, methods and information processing equipment
JP6703578B2 (en) Program, method and information processing apparatus
WO2021145243A1 (en) Program, method executed by computer, and computer
JP2021009713A (en) Program, method for providing virtual space, and information processing device
JP6966336B2 (en) An information processing method, a device, and a program for causing a computer to execute the information processing method.
JP6856572B2 (en) An information processing method, a device, and a program for causing a computer to execute the information processing method.
JP6392953B1 (en) Information processing method, apparatus, and program for causing computer to execute information processing method
JP2019048045A (en) Information processing method device, and program for causing computer to execute the information processing method
JP7386948B2 (en) Program, method and information processing device
WO2021131935A1 (en) Program, method, and information processing device
JP2019032715A (en) Information processing method, device, and program for causing computer to execute the method
WO2021131938A1 (en) Program, method, and information processing device
JP2020181581A (en) Program, method, and information processing device
JP2021002390A (en) Program, method, and information processing apparatus

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21741224

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 21741224

Country of ref document: EP

Kind code of ref document: A1