WO2024090792A1 - Robot for generating 3d model and control method therefor - Google Patents

Robot for generating 3d model and control method therefor Download PDF

Info

Publication number
WO2024090792A1
WO2024090792A1 PCT/KR2023/014160 KR2023014160W WO2024090792A1 WO 2024090792 A1 WO2024090792 A1 WO 2024090792A1 KR 2023014160 W KR2023014160 W KR 2023014160W WO 2024090792 A1 WO2024090792 A1 WO 2024090792A1
Authority
WO
WIPO (PCT)
Prior art keywords
user
robot
model
images
image
Prior art date
Application number
PCT/KR2023/014160
Other languages
French (fr)
Korean (ko)
Inventor
이태윤
문보석
우석윤
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Publication of WO2024090792A1 publication Critical patent/WO2024090792A1/en

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J11/00Manipulators not otherwise provided for
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J19/00Accessories fitted to manipulators, e.g. for monitoring, for viewing; Safety devices combined with or specially adapted for use in connection with manipulators
    • B25J19/02Sensing devices
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J5/00Manipulators mounted on wheels or on carriages
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • G06T17/20Finite element generation, e.g. wire-frame surface description, tesselation

Definitions

  • the present disclosure relates to a robot and a control method thereof, and more specifically, to a robot and a control method for generating a 3D model of a user by photographing the user from multiple directions.
  • a robot that generates a 3D model includes a traveling unit; At least one camera; output unit; Memory to store maps; and at least one processor connected to the traveling unit, the at least one camera, the output unit, and the memory, and controlling the robot.
  • the at least one processor Upon entering the first mode of generating a 3D model for the user, the at least one processor identifies a shooting location for generating a 3D model for the user based on the map.
  • the at least one processor controls the output unit to output a message to the user to move to the identified shooting location.
  • the at least one processor obtains a photographing path for photographing the user.
  • the at least one processor acquires a plurality of images by photographing the user through the camera at preset photographing intervals while moving along the photographing path through the traveling unit.
  • the at least one processor generates a 3D model for the user based on the acquired plurality of images.
  • a method of controlling a robot that generates a 3D model includes, upon entering a first mode of generating a 3D model for a user, creating a 3D model for the user based on a map stored in the robot. Identifying a shooting location to create; Outputting a message to the user to move to the identified shooting location; When the user is located at the photographing location, obtaining a photographing path for photographing the user; acquiring a plurality of images by photographing the user at preset photographing intervals while moving along the photographing path; and generating a 3D model for the user based on the acquired plurality of images.
  • the control method includes a first mode for generating a 3D model for a user. Upon entering, identifying a shooting location to generate a 3D model for the user based on the map stored in the robot; Outputting a message to the user to move to the identified shooting location; When the user is located at the photographing location, obtaining a photographing path for photographing the user; acquiring a plurality of images by photographing the user at preset photographing intervals while moving along the photographing path; and generating a 3D model for the user based on the acquired plurality of images.
  • FIG. 1 is a diagram schematically showing a method of generating a 3D model for a user using a robot, according to an embodiment of the present disclosure
  • Figure 2 is a block diagram showing the configuration of a robot according to an embodiment of the present disclosure
  • FIG. 3 is a flowchart illustrating a method of generating a 3D model for a user while operating in a first 3D model creation mode, according to an embodiment of the present disclosure
  • FIG. 4A is a diagram for explaining a method of identifying a shooting location based on a map, according to an embodiment of the present disclosure
  • FIG. 4B is a diagram illustrating a method of obtaining a photographing path for photographing a user according to an embodiment of the present disclosure
  • FIG. 4C is a diagram for explaining a method of photographing a user at a preset photographing interval according to an embodiment of the present disclosure
  • 5A and 5B are diagrams for explaining a method of determining the quality of a 3D model according to an embodiment of the present disclosure
  • Figure 6 is a diagram for explaining a method of photographing a user at a reset photographing interval according to an embodiment of the present disclosure
  • FIG. 7 is a flowchart illustrating a method of generating a 3D model for a user while operating in a second 3D model creation mode according to an embodiment of the present disclosure
  • FIG. 8 is a diagram for explaining a method of changing a route based on a shooting location for a user, according to an embodiment of the present disclosure
  • FIG. 9 is a flowchart illustrating a method of updating a 3D model according to the quality of the 3D model while operating in a second 3D model creation mode according to an embodiment of the present disclosure
  • FIG. 10 is a flowchart illustrating a method for generating facial expressions of a 3D model according to an embodiment of the present disclosure
  • FIG. 11 is a flowchart illustrating a method for generating motion of a 3D model according to an embodiment of the present disclosure.
  • expressions such as “have,” “may have,” “includes,” or “may include” refer to the existence of the corresponding feature (e.g., a numerical value, function, operation, or component such as a part). , and does not rule out the existence of additional features.
  • expressions such as “A or B,” “at least one of A or/and B,” or “one or more of A or/and B” may include all possible combinations of the items listed together.
  • “A or B,” “at least one of A and B,” or “at least one of A or B” (1) includes at least one A, (2) includes at least one B, or (3) it may refer to all cases including both at least one A and at least one B.
  • first,” “second,” “first,” or “second,” used in this document can modify various components regardless of order and/or importance, and refer to one component. It is only used to distinguish from other components and does not limit the components.
  • a first user device and a second user device may represent different user devices regardless of order or importance.
  • a first component may be renamed a second component without departing from the scope of rights described in this document, and similarly, the second component may also be renamed to the first component.
  • module “unit,” and “part” used in this document are terms to refer to components that perform at least one function or operation, and these components are implemented in hardware or software. Alternatively, it can be implemented through a combination of hardware and software. In addition, a plurality of “modules”, “units”, “parts”, etc. are integrated into at least one module or chip, except in cases where each needs to be implemented with individual specific hardware, and is integrated into at least one processor. It can be implemented as:
  • a component e.g., a first component is “(operatively or communicatively) coupled with/to” another component (e.g., a second component).
  • another component e.g., a second component.
  • any component may be directly connected to the other component or may be connected through another component (e.g., a third component).
  • a component e.g., a first component
  • another component e.g., a second component
  • no other component e.g., a third component
  • the expression “configured to” depends on the situation, for example, “suitable for,” “having the capacity to.” ,” can be used interchangeably with “designed to,” “adapted to,” “made to,” or “capable of.”
  • the term “configured (or set to)” may not necessarily mean “specifically designed to” in hardware.
  • the expression “a device configured to” may mean that the device is “capable of” working with other devices or components.
  • the phrase “processor configured (or set) to perform A, B, and C” refers to a processor dedicated to performing the operations (e.g., an embedded processor), or by executing one or more software programs stored on a memory device.
  • the robot 100 may enter a 3D model creation mode to create a 3D model for the user 10.
  • the 3D model creation mode may include a first 3D model creation mode and a second 3D model creation mode.
  • the robot 100 may identify a shooting location for generating a 3D model for the user 10 based on a pre-stored map. That is, the robot 100 can identify a drivable area as a shooting location while maintaining a critical distance from the user 10 based on the map.
  • the robot 100 may output a message to the user 10 to move to the identified filming location.
  • the robot 100 acquires a shooting path for shooting the user 10, and, as shown on the left side of FIG. 1, performs preset shooting while moving along the shooting path. Multiple images can be obtained by photographing the user at intervals.
  • the robot 100 can generate a 3D model 20 for the user, as shown on the right side of FIG. 1, based on the plurality of acquired images. At this time, the robot 100 may create a 3D model 20 for the user 10 using photogrammetry techniques or vision techniques.
  • the robot 100 can recognize the user 10 while the robot 100 drives.
  • the robot 100 may estimate the shooting location of the robot 100 based on information about the recognized user's location and move the robot to the estimated location.
  • the robot 100 may acquire at least one image through a camera at the estimated location. At this time, the robot 100 analyzes at least one image, classifies the type of at least one image (and information about the posture and position of the camera at the time of shooting), and stores at least one image by type in a database according to the classification result. It can be saved in . At this time, the type of image may be classified according to the shooting angle at which the user 10 is captured.
  • the robot 100 may generate the 3D model 20 based on the plurality of types of images.
  • the user can create a 3D model for the user using the robot 100 at home even without visiting a separate studio. There will be.
  • FIG. 2 is a block diagram showing the configuration of a robot according to an embodiment of the present disclosure.
  • the robot 100 includes a traveling unit 110, a camera 120, an output unit 130, a sensor 140, a communication interface 150, a memory 160, and at least one processor. It may include (170).
  • the robot 100 may be a robot that provides various services within the home, but this is only an embodiment and can be used in various places such as airports, hotels, supermarkets, clothing stores, logistics, and hospitals. It may be a service robot that provides services (for example, a guidance robot, etc.).
  • the configuration of the robot 100 is not limited to the configuration shown in FIG. 1, and of course, configurations obvious to those skilled in the art may be added.
  • the traveling unit 110 may drive (or move) the robot 100 under the control of at least one processor 170.
  • the traveling unit 110 may include wheels that drive the robot 100 and a wheel drive motor that rotates the wheels.
  • the traveling unit 110 may move the robot 100 along a photographing path surrounding the user in order to photograph the user.
  • the camera 120 is configured to obtain an image by photographing the surroundings of the robot 100.
  • at least one processor 170 may recognize the user by analyzing the image acquired through the camera 120.
  • at least one processor 170 may generate a 3D model for the user using a plurality of images acquired through a camera. At this time, the camera 120 is
  • the output unit 130 can output various information.
  • the output unit 130 may output a guidance message guiding the user to the shooting location.
  • the output unit 130 may be implemented as a display or LED that provides a visual message, or may be implemented as a speaker that provides an auditory message.
  • the sensor 140 is configured to detect the environment around the robot 100 or the user's condition.
  • the sensor 140 may include a depth sensor and an Inertial Measurement Unit (IMU) sensor.
  • the depth sensor is configured to detect obstacles around the robot 100.
  • At least one processor 170 may obtain the distance from the robot 100 to the obstacle based on the sensing value of the depth sensor.
  • the depth sensor may include a LiDAR sensor.
  • the depth sensor may include a radar sensor and a depth camera.
  • the IMU sensor is configured to acquire posture information of the robot 100.
  • IMU sensors may include gyro sensors and geomagnetic sensors.
  • the robot 100 may include various sensors to detect the environment around the robot 100 or the user's status.
  • the communication interface 150 includes at least one circuit and can communicate with various types of external devices or servers.
  • the communication interface 140 includes a BLE (Bluetooth Low Energy) module, a Wi-Fi communication module, a cellular communication module, a 3G (3rd generation) mobile communication module, a 4G (4th generation) mobile communication module, and a 4th generation LTE (Long Term Evolution) communication module. , may include at least one of 5G (5th generation) mobile communication modules.
  • the communication interface 150 may transmit a guidance message to an external portable terminal (eg, a smart phone of the user 10, etc.).
  • an external portable terminal eg, a smart phone of the user 10, etc.
  • the memory 160 may store an operating system (OS) for controlling the overall operation of the components of the robot 100 and instructions or data related to the components of the robot 100.
  • OS operating system
  • the memory 160 may include various modules for creating a 3D model.
  • the memory 160 may include a database that stores images captured by a user. Additionally, the memory 160 may store a database that matches and stores facial images and expression types, and a database that matches and stores motion images and motion types. Additionally, the memory 160 can store information about maps within your home.
  • the memory 150 may be implemented as non-volatile memory (ex: hard disk, solid state drive (SSD), flash memory), volatile memory (may also include memory in at least one processor 180), etc. You can.
  • At least one processor 170 may be electrically connected to the memory 160 to control the overall functions and operations of the robot 100.
  • at least one processor 170 may load data for a module stored in the non-volatile memory to perform various operations into the volatile memory.
  • loading refers to an operation of loading and storing data stored in non-volatile memory in volatile memory so that at least one processor 180 can access it.
  • At least one processor 180 when entering the first mode for generating a 3D model for the user, at least one processor 180 identifies a shooting location for generating a 3D model for the user based on the map. At least one processor 180 controls the output unit 130 to output a message to the user to move to the identified shooting location.
  • At least one processor 180 obtains a photographing path for photographing the user.
  • At least one processor 180 acquires a plurality of images by photographing the user through the camera 120 at preset photographing intervals while moving along the photographing path through the traveling unit 110.
  • At least one processor 180 generates a 3D model for the user based on the plurality of acquired images.
  • At least one processor 180 may acquire a plurality of projection images by projecting the generated 3D model into 2D. At least one processor 180 may compare a plurality of images and a plurality of projection images corresponding to the plurality of images, and measure the quality value of the 3D model based on the comparison result. At this time, the at least one processor 180 uses the pixels of the plurality of first feature points included in the first image taken at a first angle with respect to the front of the user among the plurality of images and the 3D model among the plurality of projection images as the first A pixel difference value may be calculated by comparing pixels of a plurality of second feature points included in the first projection image projected in the angular direction. Additionally, at least one processor 180 may measure the quality value of the 3D model based on the calculated pixel difference value.
  • At least one processor 180 may reset the robot's shooting interval or shooting position. At least one processor 180 may acquire a plurality of reset images by photographing the user at a reset photographing interval or photographing position while moving along the photographing path through the traveling unit 110. At least one processor 180 may update the 3D model for the user based on the plurality of acquired reset images.
  • At least one processor 180 may recognize the user while the robot is traveling. At least one processor 180 may estimate the robot's shooting location based on information about the recognized user's location. At least one processor 180 may control the traveling unit 110 to move the robot 100 to the estimated position. At least one processor 180 may acquire at least one image through the camera 110 at the estimated location. At least one processor 180 may analyze at least one image, classify the type of at least one image, and store it in a database.
  • At least one processor 180 may generate a 3D model for the user based on the plurality of types of stored images.
  • At least one processor 180 may acquire a plurality of projection images by projecting the generated 3D model into 2D. At least one processor 180 may compare a plurality of types of images with a plurality of projection images corresponding to the plurality of types of images, and measure the quality value of the 3D model based on the comparison result. If the quality value of the 3D model is less than the threshold, at least one processor 180 resets the shooting position of the robot, acquires a plurality of reset images by photographing the user at the reset shooting position through the traveling unit 110, and , the 3D model for the user can be updated based on the acquired plurality of reset images.
  • At least one processor 180 may obtain a facial image by photographing the user's face. At least one processor 180 may analyze the acquired facial image and obtain an expression type corresponding to the acquired facial image. At least one processor 180 may store facial images and information about the expression type in a database. At least one processor 180 may generate a facial expression of the 3D model based on facial images for each expression type stored in a database.
  • At least one processor 180 may acquire a motion image by capturing the user's motion. At least one processor 180 may analyze the acquired motion image and obtain a motion type corresponding to the acquired motion image. At least one processor 180 may store motion images and information about the motion type in a database. At least one processor 180 may generate motion of a 3D model based on motion images for each motion type stored in a database.
  • FIG. 3 is a flowchart illustrating a method of generating a 3D model for a user while operating in a first 3D model creation mode, according to an embodiment of the present disclosure.
  • the robot 100 may enter the first 3D model creation mode (S305). Specifically, when a user voice such as “Generate a 3D model” is input from the user, the robot 100 may enter the first 3D model creation mode. Alternatively, when a 3D model creation request is received from the user terminal, the robot 100 may enter the first 3D model creation mode.
  • the robot 100 can identify the shooting location based on the map stored in the memory 160 (S310). Specifically, in order to create a 3D model of a user, it is necessary to photograph the user from various shooting angles while maintaining a certain distance from the user. Therefore, an area larger than a critical size is required to capture a user's image from multiple shooting angles. Accordingly, the robot 100 can search for an area larger than a critical size among the maps stored in the memory 160. If a plurality of areas larger than the critical size are searched, the robot 100 may identify the area closest to the user among the plurality of searched areas as the shooting location.
  • the threshold size may be determined according to user information (eg, user's height, etc.). Specifically, the larger the user's height, the larger the threshold size may be determined, and the shorter the user's height, the smaller the threshold size may be determined.
  • user information eg, user's height, etc.
  • the robot 100 determines the threshold as shown in the right drawing of FIG. 4A based on the map.
  • the second space 410 which is an area larger than the size, can be determined as the shooting location.
  • the robot 100 may output a movement message to the user (2315). Specifically, the robot 100 may output a message to the user to move to the identified filming location. For example, the robot 100 may output a voice message to the user, “Please move to the living room,” and may move to the filming location along with a voice message to the user, “Please follow me.”
  • the robot 100 can acquire the shooting path (S320). Specifically, the robot 100 may acquire a shooting path based on the user's location after the user moves. For example, the robot 100 may obtain a circular imaging path that maintains a certain distance from the user based on the point where the user is located. At this time, a certain distance may be determined according to user information (eg, user's height). For example, as shown in FIG. 4B, the robot 10 may obtain a circular imaging path 420 that maintains a certain distance R from the user 10.
  • user information eg, user's height
  • the robot 100 may photograph the user along the photographing path and correct the photographing path based on the acquired image. For example, if the size of the user included in the acquired image is outside the critical range, the robot 100 may correct the capturing path. That is, if the size of the user included in the acquired image exceeds the critical range, the robot 100 may correct the capturing path to increase a certain distance. If the size of the user included in the acquired image is less than the critical range, the robot 100 may correct the capturing path to reduce the certain distance.
  • the robot 100 may acquire a plurality of images by photographing the user at preset photographing intervals while moving along the photographing path (S325).
  • the preset shooting interval may be determined by initial settings. For example, as shown in FIG. 4C, the robot 100 acquires five captured images at the first to fifth photographing points 430-1 to 430-5 while moving the photographing path 420. You can. At this time, each of the five captured images can store information about the shooting angle taken based on the front of the user. Meanwhile, the robot 100 may acquire a plurality of images from a plurality of shooting positions determined based on user information (eg, user's height, etc.) rather than a preset shooting interval.
  • user information eg, user's height, etc.
  • the robot 100 may generate a 3D model (or basic 3D model) for the user based on the plurality of acquired images (S330). At this time, the robot 100 may create a 3D model for the user 10 using photogrammetry techniques or vision techniques.
  • the robot 100 may acquire a plurality of projection images to inspect the quality of the acquired 3D model (S335).
  • the plurality of projection images may be images obtained by projecting the 3D model into 2D at an angle corresponding to the shooting angle at which the plurality of images were captured.
  • the robot 100 uses the 3D model 20
  • the first projection image 520 may be obtained by projecting the 3D model at a first angle (for example, 72 degrees based on the front) based on the front. In this way, the robot 100 can acquire a plurality of projection images corresponding to each of the first to fifth images 430-1 to 430-5.
  • the robot 100 can obtain the quality value of the 3D model based on a plurality of images and a plurality of projection images (S340). Specifically, the robot 100 may compare a plurality of images and a plurality of projection images corresponding to the plurality of images. At this time, the pixels of a plurality of first feature points included in the first image taken at a first angle with respect to the front of the user among the plurality of images and the first projection of the 3D model in the first angle direction among the plurality of projection images A pixel difference value can be calculated by comparing pixels of a plurality of second feature points included in the image.
  • the robot 100 includes a plurality of feature points (a point on the head, a point on the left shoulder, a point on the left hand, and a point on the left foot) and the first image 510.
  • the pixel difference value between the corresponding pixels can be calculated. there is.
  • the robot 100 can obtain the quality value of the image used to create the 3D model based on the pixel difference value. Specifically, the robot 100 can obtain a lower quality value as the pixel difference value increases, and obtain a higher quality value as the pixel difference value decreases.
  • the robot 100 can obtain the quality value of the 3D model by obtaining the quality value for each of the plurality of images used to generate the 3D model.
  • the robot 100 can obtain the quality value of the 3D model by measuring the similarity between the image and the projected image.
  • the robot 100 may obtain the quality value of the 3D model using a neural network model learned to obtain the quality value by inputting an image and a projection image. That is, the robot 100 can obtain the quality value of the 3D model by inputting an image and a projection image into the neural network model.
  • the robot 100 may determine whether the quality value is less than the threshold (S345).
  • the robot 100 may create an avatar using a previously created 3D model.
  • the robot 100 may reset the robot's shooting interval or shooting position (S350). At this time, the robot 100 may reset the robot's shooting interval or shooting position based on the size of the error between the image and the projected image. In other words, the robot 100 can be reset to narrow the shooting interval at a shooting angle where the error between the image and the projected image is large, and to widen the shooting interval at a shooting angle where the size of the error between the image and the projected image is small. It can be reset. Alternatively, the robot 100 may reset the capturing position to re-photograph at an angle where the error between the image and the projected image is large.
  • the robot 100 may reset the shooting interval or shooting position to perform rephotography at seven points 610-1 to 610-7 on the shooting path.
  • the robot 100 may acquire a plurality of reset images by photographing the user at a reset photographing interval or photographing position during the photographing path (S355).
  • the robot 100 may update the 3D model based on the plurality of reset images (S360). Specifically, the robot 100 may update the existing 3D model by regenerating the 3D model based on a plurality of reset images.
  • the robot 100 may repeatedly perform steps S335 to S345 to check the quality of the updated 3D model.
  • FIG. 7 is a flowchart illustrating a method of generating a 3D model for a user while operating in a second 3D model creation mode, according to an embodiment of the present disclosure.
  • the robot 100 may enter the second 3D model creation mode (S710). Specifically, when a 3D model creation request is received from a user, the robot 100 may enter the second 3D model creation mode. At this time, the robot 100 (or user terminal) may display icons corresponding to each of the first 3D model creation mode and the second 3D model creation mode, and may enter the 3D model creation mode according to the selected icon. Meanwhile, when entering the second 3D model creation mode, the robot 100 does not immediately photograph the user, but captures the user while driving while performing other functions of the robot 100 (e.g., delivery function, cleaning function, etc.). You can shoot.
  • other functions of the robot 100 e.g., delivery function, cleaning function, etc.
  • the robot 100 can recognize the user while driving (S720). At this time, the robot 100 can recognize the user through face recognition and voice recognition. When the user is recognized, the robot 100 can obtain information about the user's location. At this time, information about the user's location may include lighting information of the area where the user is located. Additionally, the robot 100 can track a recognized user.
  • the robot 100 may estimate the shooting location of the robot 100 based on information about the recognized user (eg, current location and user posture, etc.) (S730). At this time, of course, the robot 100 can estimate the shooting location of the robot based on the location of the robot 100, surrounding obstacle information, map information, etc. in addition to information about the user. In addition, the robot 100 can identify the direction in which the light shines or the direction with illuminance above a preset value among the areas where the user is located, and estimate the shooting position of the robot 100 so that the user can be photographed in the identified direction. .
  • information about the recognized user eg, current location and user posture, etc.
  • the robot 100 can estimate the shooting location of the robot based on the location of the robot 100, surrounding obstacle information, map information, etc. in addition to information about the user.
  • the robot 100 can identify the direction in which the light shines or the direction with illuminance above a preset value among the areas where the user is located, and estimate the shooting position of the robot 100 so that the
  • the robot 100 estimates the shooting position of the robot so that it can shoot at a shooting angle corresponding to the image of the type not saved. You can. For example, to create a 3D model, 6 types (e.g., type taken at 0 degrees, type taken at 60 degrees, type taken at 120 degrees, type taken at 180 degrees, type taken at 240 degrees) If an image of the type captured at 60 degrees does not exist in a situation where an image of the type captured at 300 degrees is required, the robot 100 adjusts the capturing position of the robot 100 so that it can capture the user from a 60-degree direction. It can be estimated.
  • 6 types e.g., type taken at 0 degrees, type taken at 60 degrees, type taken at 120 degrees, type taken at 180 degrees, type taken at 240 degrees
  • the robot 100 adjusts the capturing position of the robot 100 so that it can capture the user from a 60-degree direction. It can be estimated.
  • the robot 100 can move to the estimated location (S740). At this time, the robot 100 may identify a new path to move to the estimated location from the existing path. For example, as shown in FIG. 8, when the user 10 located at the first point is recognized while driving through the first path 810, the robot 100 estimates the second point 830. It can be identified by its location. At this time, since the second point 830 is not included in the first path 810, the robot 100 can identify a new second path 820 to move to the estimated location.
  • the robot 100 may acquire at least one image through the camera 120 at the estimated location (S750). After acquiring at least one image, the robot 100 may travel along the second path 820 to perform an existing function.
  • the robot 100 may analyze at least one image and classify the type of at least one image (S760). Specifically, the robot 100 may analyze at least one acquired image to obtain information about the direction in which the at least one image was captured or information about the user's body part included in the at least one image. And, the robot 100 classifies the robot into one type among a plurality of pre-stored types based on information about the direction in which at least one image was taken or information about the user's body part included in at least one image. You can. Additionally, the robot 100 may classify the captured image based on the user's illumination level and skin tone. At this time, the robot 100 may analyze at least one image and classify the type of at least one image, and may also estimate information about the posture and position of the camera at the time of shooting and store it in a database.
  • the robot 100 may store information about at least one acquired image and the type of the image in a database (S770).
  • the robot 100 may determine whether a plurality of preset types of images are stored in the database (S780). Specifically, the robot 100 may determine whether all of the plurality of preset types of images needed to create a 3D model for the user have been stored. For example, the robot 100 may have six types needed to create a 3D model (e.g., a type taken at 0 degrees, a type taken at 60 degrees, a type taken at 120 degrees, a type taken at 180 degrees, It is possible to determine whether all images (the type taken at 240 degrees and the type taken at 300 degrees) have been saved. At this time, the robot 100 may determine whether a preset number of images (for example, three) are stored in one type.
  • a preset number of images for example, three
  • the robot 100 can create a 3D model using the images stored in the database (S790). At this time, the robot 100 may create a 3D model for the user 10 using photogrammetry techniques or vision techniques.
  • the robot 100 may repeat steps S720 to S780 to acquire the user's image again. At this time, the robot 100 may estimate the shooting position of the robot so that it can shoot at a shooting angle corresponding to a type of image that is not stored in the robot 100 in step S730.
  • the type of image is classified according to the user's shooting angle, but this is only an example, and the type of image may be classified according to the body part of the user included in the image.
  • the robot 100 includes a first type including the user's face and torso, a second type including the user's left side profile, left arm, and left leg, and a third type including the user's back, back, and buttocks. Images can be classified into a fourth type, which includes the user's right side profile, right arm, and right leg.
  • FIG. 9 is a flowchart illustrating a method of updating a 3D model according to the quality of the 3D model while operating in a second 3D model creation mode, according to an embodiment of the present disclosure.
  • the robot 100 can acquire a plurality of projection images (S910).
  • the plurality of projection images may be images obtained by projecting a 3D model into 2D at an angle corresponding to the type of the plurality of images stored in the database.
  • the robot 100 may compare a plurality of types of images and a plurality of projection images corresponding to the plurality of types of images (S920). At this time, the robot 100 uses a plurality of first feature points included in a first image (i.e., a first type of image) taken at a first angle based on the front of the user among the plurality of images and a 3D image among the plurality of projection images. A plurality of second feature points included in a first projection image that projects the model in a first angular direction may be compared. In this way, the robot 100 can compare a plurality of first feature points included in a plurality of types of images with a plurality of second feature points included in the corresponding projection image.
  • a first image i.e., a first type of image
  • the robot 100 may obtain the quality value of the 3D model based on the comparison result (S930). Specifically, the robot 100 may compare a plurality of images and a plurality of projection images corresponding to the plurality of images. Specifically, the robot 100 includes a plurality of feature points (a point on the head, a point on the left shoulder, a point on the left hand, and a point on the left foot) of the first type of image and a first type of image corresponding to the first type of image. 1 The pixel difference value between the pixels corresponding to a plurality of feature points of the projection image (a point on the head, a point on the left shoulder, a point on the left hand, and a point on the left foot) can be calculated.
  • the robot 100 can obtain the quality value of the image used to create the 3D model based on the pixel difference value. Specifically, the robot 100 can obtain a lower quality value as the pixel difference value increases, and obtain a higher quality value as the pixel difference value decreases. In the same manner as described above, the robot 100 can obtain the quality value of the 3D model by obtaining quality values for each of a plurality of types of images used to generate the 3D model.
  • the robot 100 can obtain the quality value of the 3D model by measuring the similarity between the image and the projected image.
  • the robot 100 may obtain the quality value of the 3D model using a neural network model learned to obtain the quality value by inputting an image and a projection image. That is, the robot 100 can obtain the quality value of the 3D model by inputting an image and a projection image into the neural network model.
  • the robot 100 may determine whether the quality value is less than the threshold (S940).
  • the robot 100 can create an avatar using an existing 3D model.
  • the robot 100 may reset the robot's shooting position (S950). At this time, the robot 100 may reset the robot's shooting interval or shooting position based on the size of the error between the image and the projected image. In other words, the robot 100 can reset the capturing position to re-photograph at an angle where the error between the image and the projected image is large. Accordingly, while performing another function, the robot 100 can estimate the shooting position by changing the driving path to retake the image at an angle where the error between the image and the projected image is large.
  • the robot 100 may obtain a plurality of reset images by photographing the user at the reset shooting location (S960).
  • the robot 100 may update the 3D model based on the plurality of reset images (S970). Specifically, the robot 100 may update the existing 3D model by regenerating the 3D model based on a plurality of reset images.
  • the robot 100 analyzes the quality of the existing 3D model, estimates the position and direction of the camera that can improve the quality of the 3D model, and tracks the camera while the robot 100 drives while performing other functions. For the user, a location and direction that can improve the quality of the 3D model can be determined, and the 3D model can be updated (or improved) with images obtained by shooting at that location and direction. Additionally, the robot 100 can continuously improve the 3D model for the user by repeating the above-described process while driving.
  • the robot 100 can recognize a user while driving and obtain information about the face or motion of the recognized user. Additionally, the robot 100 may generate the facial expression or motion of the 3D model based on the acquired information about the user's face or motion. This will be described in more detail with reference to FIGS. 10 and 11.
  • FIG. 10 is a flowchart illustrating a method for generating facial expressions of a 3D model, according to an embodiment of the present disclosure.
  • the robot 100 can recognize the user (S1010). Specifically, the robot 100 may recognize the user while driving while performing other functions of the robot 100. Alternatively, the robot 100 may recognize the user while operating in the first 3D model creation mode or the second 3D model creation mode. At this time, the robot 100 can recognize the user by recognizing the user's face, iris, voice, etc.
  • the robot 100 may acquire a facial image by photographing the user's face (S1020). Specifically, the robot 100 may obtain a face image of a recognized user by photographing the user.
  • the robot 100 may analyze the face image and obtain the expression type corresponding to the face image (S1030). At this time, the robot 100 may acquire information about the type of expression corresponding to the facial image by analyzing feature points (eg, eyes, nose, mouth, etc.) included in the facial image. Alternatively, the robot 100 may obtain information about the type of expression corresponding to the face image by inputting the face image into a learned neural network model.
  • feature points eg, eyes, nose, mouth, etc.
  • the robot 100 may store information about the acquired facial image and expression type in a database (S1040). At this time, the robot 100 may store not only facial expressions but also additional information such as facial skin tone.
  • the robot 100 can generate the facial expression of the 3D model based on the facial image for each expression type stored in the database (S1050. At this time, the robot 100 can finally generate the facial expression of the 3D model according to the user input. Meanwhile, the robot 100 can generate facial expressions of a 3D model using photogrammetry techniques or vision techniques.
  • FIG. 11 is a flowchart illustrating a method for generating motion of a 3D model according to an embodiment of the present disclosure.
  • the robot 100 can recognize the user (S1110). Specifically, the robot 100 may recognize the user while driving while performing other functions of the robot 100. Alternatively, the robot 100 may recognize the user while operating in the first 3D model creation mode or the second 3D model creation mode. At this time, the robot 100 can recognize the user by recognizing the user's face, iris, voice, etc.
  • the robot 100 may acquire a motion image by photographing the user (S1120). At this time, the robot 100 may obtain a motion image by filming the user's motion while moving.
  • the robot 100 may analyze the motion image and obtain a motion type corresponding to the motion image (S1130). At this time, the robot 100 may acquire information about the motion type corresponding to the motion image by analyzing feature points (eg, arms, legs, torso, face, etc.) included in the motion image. Alternatively, the robot 100 may obtain information about the motion type corresponding to the motion image by inputting the motion image into a learned neural network model.
  • feature points eg, arms, legs, torso, face, etc.
  • the robot 100 may store information about the acquired motion image and motion type in a database (S1140).
  • the robot 100 may generate motion of a 3D model based on motion images for each motion type stored in the database (S1150). At this time, the robot 100 may apply the user's motion to the 3D model according to the motion searched by the user. Meanwhile, the robot 100 can apply the user's motion to the 3D model using motion capture-related graphics techniques.
  • functions related to artificial intelligence eg, learning function and inference function for a neural network model
  • functions related to artificial intelligence are operated through at least one processor and memory of the robot.
  • the processor may consist of one or multiple processors.
  • one or more processors may include at least one of a Central Processing Unit (CPU), a Graphics Processing Unit (GPU), and a Neural Processing Unit (NPU), but are not limited to the examples of the processors described above.
  • CPU Central Processing Unit
  • GPU Graphics Processing Unit
  • NPU Neural Processing Unit
  • CPU is a general-purpose processor that can perform not only general calculations but also artificial intelligence calculations, and can efficiently execute complex programs through a multi-layer cache structure. CPUs are advantageous for serial processing, which allows organic connection between previous and next calculation results through sequential calculations.
  • the general-purpose processor is not limited to the above-described examples, except where specified as the above-described CPU.
  • GPU is a processor for large-scale operations such as floating-point operations used in graphics processing, and can perform large-scale operations in parallel by integrating a large number of cores.
  • GPUs may be more advantageous than CPUs in parallel processing methods such as convolution operations.
  • the GPU can be used as a co-processor to supplement the functions of the CPU.
  • the processor for mass computation is not limited to the above-described example, except for the case specified as the above-described GPU.
  • NPU is a processor specialized in artificial intelligence calculations using artificial neural networks, and each layer that makes up the artificial neural network can be implemented in hardware (e.g., silicon). At this time, the NPU is designed specifically according to the company's requirements, so it has a lower degree of freedom than a CPU or GPU, but can efficiently process artificial intelligence calculations requested by the company. Meanwhile, as a processor specialized for artificial intelligence calculations, NPU can be implemented in various forms such as TPU (Tensor Processing Unit), IPU (Intelligence Processing Unit), and VPU (Vision processing unit).
  • the artificial intelligence processor is not limited to the examples described above, except where specified as the NPU described above.
  • one or more processors may be implemented as a System on Chip (SoC).
  • SoC System on Chip
  • the SoC may further include memory and a network interface such as a bus for data communication between the processor and memory.
  • the robot 100 uses some of the plurality of processors to perform artificial intelligence-related operations (for example, Operations related to learning or inference) can be performed.
  • the robot 100 performs artificial intelligence-related operations using at least one of a GPU, NPU, VPU, TPU, or hardware accelerator specialized for artificial intelligence operations such as convolution operation, matrix multiplication operation, etc. among a plurality of processors. can do.
  • this is only an example, and of course, calculations related to artificial intelligence can be processed using general-purpose processors such as CPUs.
  • the robot 100 may perform calculations on functions related to artificial intelligence using multiple cores (eg, dual core, quad core, etc.) included in one processor.
  • the robot 100 can perform artificial intelligence operations such as convolution operations and matrix multiplication operations in parallel using multi-cores included in the processor.
  • One or more processors control input data to be processed according to predefined operation rules or artificial intelligence models stored in memory.
  • Predefined operation rules or artificial intelligence models are characterized by being created through learning.
  • being created through learning means that a predefined operation rule or artificial intelligence model with desired characteristics is created by applying a learning algorithm to a large number of learning data.
  • This learning may be performed on the device itself that performs the artificial intelligence according to the present disclosure, or may be performed through a separate server/system.
  • An artificial intelligence model may be composed of multiple neural network layers. At least one layer has at least one weight value, and the operation of the layer is performed using the operation result of the previous layer and at least one defined operation.
  • Examples of neural networks include Convolutional Neural Network (CNN), Deep Neural Network (DNN), Recurrent Neural Network (RNN), Restricted Boltzmann Machine (RBM), Deep Belief Network (DBN), Bidirectional Recurrent Deep Neural Network (BRDNN), and Deep Neural Network (BRDNN).
  • CNN Convolutional Neural Network
  • DNN Deep Neural Network
  • RNN Restricted Boltzmann Machine
  • BBM Restricted Boltzmann Machine
  • BBN Deep Belief Network
  • BBN Deep Belief Network
  • BBN Bidirectional Recurrent Deep Neural Network
  • BDN Deep Neural Network
  • BDN Deep Neural Network
  • a learning algorithm is a method of training a target device (eg, a robot) using a large number of learning data so that the target device can make decisions or make predictions on its own.
  • Examples of learning algorithms include supervised learning, unsupervised learning, semi-supervised learning, or reinforcement learning, and the learning algorithm in the present disclosure is specified. Except, it is not limited to the examples described above.
  • Computer program products are commodities and can be traded between sellers and buyers.
  • the computer program product may be distributed in the form of a machine-readable storage medium (e.g. compact disc read only memory (CD-ROM)) or through an application store (e.g. Play StoreTM) or on two user devices (e.g. It can be distributed (e.g. downloaded or uploaded) directly between smartphones) or online.
  • a machine-readable storage medium e.g. compact disc read only memory (CD-ROM)
  • an application store e.g. Play StoreTM
  • two user devices e.g. It can be distributed (e.g. downloaded or uploaded) directly between smartphones) or online.
  • at least a portion of the computer program product e.g., a downloadable app
  • a machine-readable storage medium such as the memory of a manufacturer's server, an application store's server, or a relay server. It can be temporarily stored or created temporarily.
  • Methods according to various embodiments of the present disclosure may be implemented as software including instructions stored in a machine-readable storage media (e.g., a computer).
  • the device stores information stored from the storage medium.
  • a device capable of calling a command and operating according to the called command may include an electronic device (eg, the robot 100) according to the disclosed embodiments.
  • a storage medium that can be read by a device may be provided in the form of a non-transitory storage medium.
  • 'non-transitory storage medium' only means that it is a tangible device and does not contain signals (e.g. electromagnetic waves). This term refers to cases where data is semi-permanently stored in a storage medium and temporary storage media. It does not distinguish between cases where it is stored as .
  • a 'non-transitory storage medium' may include a buffer where data is temporarily stored.
  • the processor may perform the function corresponding to the instruction directly or using other components under the control of the processor.
  • Instructions may contain code generated or executed by a compiler or interpreter.

Landscapes

  • Engineering & Computer Science (AREA)
  • Mechanical Engineering (AREA)
  • Robotics (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Geometry (AREA)
  • Computer Graphics (AREA)
  • Automation & Control Theory (AREA)
  • Image Processing (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)

Abstract

A robot for generating a 3D model and a control method therefor are provided. The robot comprises a traveling unit, at least one camera, an output unit, a memory for storing a map, and at least one processor which is connected to the traveling unit, the at least one camera, the output unit, and the memory and controls the robot. The at least one processor: when entering a first mode of generating a 3D model for a user, identifies a photographing location for generating the 3D model for the user on the basis of a map; controls the output unit to output a message directing the user to move to the identified photographing location; when the user is located at the photographing location, acquires a photographing path for photographing the user; acquires multiple images by photographing the user through the camera at a preconfigured photographing interval while moving along the photographing path through the traveling unit; and generates the 3D model for the user on the basis of the acquired multiple images.

Description

3D 모델을 생성하는 로봇 및 이의 제어 방법Robot that creates 3D models and its control method
본 개시는 로봇 및 이의 제어 방법에 관한 것으로, 더욱 상세하게는 사용자를 복수의 방향에서 촬영하여 사용자에 대한 3D 모델을 생성하는 로봇 및 이의 제어 방법에 관한 것이다.The present disclosure relates to a robot and a control method thereof, and more specifically, to a robot and a control method for generating a 3D model of a user by photographing the user from multiple directions.
최근 메타버스에 대한 관심이 증가하면서 메타버스 공간 내에 사용자의 분신 역할을 수행하는 아바타의 중요성이 점점 커지고 있다. 특히, 최근 사용자에 대한 3D 모델을 생성하여 아바타를 생성하는 기술이 개발되고 있다.Recently, as interest in the metaverse has increased, the importance of avatars that play the role of the user's alter ego within the metaverse space is increasing. In particular, technology has recently been developed to create an avatar by creating a 3D model of the user.
다만, 근래에는 실감나는 3D 모델을 생성하기 위하여, 피사체를 중심으로 복수의 카메라를 배치하고, 배치된 복수의 카메라를 통해 획득된 복수의 이미지를 획득하여 3D 모델을 생성하였다. 또한, 생성된 3D 모델의 모션을 생성하기 위해, 모션 캡쳐 등과 같은 기술적이 적용되고 있다.However, in recent years, in order to create a realistic 3D model, a plurality of cameras have been placed around the subject, and a 3D model has been created by acquiring a plurality of images obtained through the arranged cameras. Additionally, technologies such as motion capture are being applied to generate motion of the generated 3D model.
다만, 일반 사용자들에게는 피사체를 중심으로 복수의 카메라가 배치된 스튜디오에 가서 자신의 3D 모델을 생성하는 것이 비용이 비싸고, 편의성 역시 떨어지며, 필요할 때 바로 제작하지 못하는 한계가 존재한다.However, for general users, going to a studio where multiple cameras are placed around the subject to create their own 3D model is expensive, less convenient, and there are limitations in creating it right away when needed.
본 개시의 일 실시예에 따른, 3D 모델을 생성하는 로봇은, 주행부; 적어도 하나의 카메라; 출력부; 맵을 저장하는 메모리; 및 상기 주행부, 상기 적어도 하나의 카메라, 상기 출력부 및 상기 메모리와 연결되며, 상기 로봇을 제어하는 적어도 하나의 프로세서;를 포함한다. 사용자에 대한 3D 모델을 생성하는 제1 모드에 진입하면, 상기 적어도 하나의 프로세서는, 상기 맵에 기초하여 상기 사용자에 대한 3D 모델을 생성하기 위한 촬영 장소를 식별한다. 상기 적어도 하나의 프로세서는, 상기 사용자에게 상기 식별된 촬영 장소로 이동하라는 메시지를 출력하도록 상기 출력부를 제어한다. 상기 사용자가 상기 촬영 장소에 위치하면, 상기 적어도 하나의 프로세서는, 상기 사용자를 촬영하기 위한 촬영 경로를 획득한다. 상기 적어도 하나의 프로세서는, 상기 주행부를 통해 상기 촬영 경로를 따라 이동하는 동안 기설정된 촬영 간격으로 상기 카메라를 통해 상기 사용자를 촬영하여 복수의 이미지를 획득한다. 상기 적어도 하나의 프로세서는, 상기 획득된 복수의 이미지에 기초하여 상기 사용자에 대한 3D 모델을 생성한다.According to an embodiment of the present disclosure, a robot that generates a 3D model includes a traveling unit; At least one camera; output unit; Memory to store maps; and at least one processor connected to the traveling unit, the at least one camera, the output unit, and the memory, and controlling the robot. Upon entering the first mode of generating a 3D model for the user, the at least one processor identifies a shooting location for generating a 3D model for the user based on the map. The at least one processor controls the output unit to output a message to the user to move to the identified shooting location. When the user is located at the photographing location, the at least one processor obtains a photographing path for photographing the user. The at least one processor acquires a plurality of images by photographing the user through the camera at preset photographing intervals while moving along the photographing path through the traveling unit. The at least one processor generates a 3D model for the user based on the acquired plurality of images.
본 개시의 일 실시예에 따른, 3D 모델을 생성하는 로봇의 제어 방법은, 사용자에 대한 3D 모델을 생성하는 제1 모드에 진입하면, 상기 로봇에 저장된 맵에 기초하여 상기 사용자에 대한 3D 모델을 생성하기 위한 촬영 장소를 식별하는 단계; 상기 사용자에게 상기 식별된 촬영 장소로 이동하라는 메시지를 출력하는 단계; 상기 사용자가 상기 촬영 장소에 위치하면, 상기 사용자를 촬영하기 위한 촬영 경로를 획득하는 단계; 상기 촬영 경로를 따라 이동하는 동안 기설정된 촬영 간격으로 상기 사용자를 촬영하여 복수의 이미지를 획득하는 단계; 및 상기 획득된 복수의 이미지에 기초하여 상기 사용자에 대한 3D 모델을 생성하는 단계;를 포함한다.According to an embodiment of the present disclosure, a method of controlling a robot that generates a 3D model includes, upon entering a first mode of generating a 3D model for a user, creating a 3D model for the user based on a map stored in the robot. Identifying a shooting location to create; Outputting a message to the user to move to the identified shooting location; When the user is located at the photographing location, obtaining a photographing path for photographing the user; acquiring a plurality of images by photographing the user at preset photographing intervals while moving along the photographing path; and generating a 3D model for the user based on the acquired plurality of images.
본 개시의 일 실시예에 따른, 3D 모델을 생성하는 로봇의 제어 방법을 실행시키기 위한 프로그램을 저장하는 컴퓨터 판독가능한 기록매체에 있어서, 상기 제어 방법은, 사용자에 대한 3D 모델을 생성하는 제1 모드에 진입하면, 상기 로봇에 저장된 맵에 기초하여 상기 사용자에 대한 3D 모델을 생성하기 위한 촬영 장소를 식별하는 단계; 상기 사용자에게 상기 식별된 촬영 장소로 이동하라는 메시지를 출력하는 단계; 상기 사용자가 상기 촬영 장소에 위치하면, 상기 사용자를 촬영하기 위한 촬영 경로를 획득하는 단계; 상기 촬영 경로를 따라 이동하는 동안 기설정된 촬영 간격으로 상기 사용자를 촬영하여 복수의 이미지를 획득하는 단계; 및 상기 획득된 복수의 이미지에 기초하여 상기 사용자에 대한 3D 모델을 생성하는 단계;를 포함한다.According to an embodiment of the present disclosure, in a computer-readable recording medium storing a program for executing a control method of a robot for generating a 3D model, the control method includes a first mode for generating a 3D model for a user. Upon entering, identifying a shooting location to generate a 3D model for the user based on the map stored in the robot; Outputting a message to the user to move to the identified shooting location; When the user is located at the photographing location, obtaining a photographing path for photographing the user; acquiring a plurality of images by photographing the user at preset photographing intervals while moving along the photographing path; and generating a 3D model for the user based on the acquired plurality of images.
도 1은 본 개시의 일 실시예에 따른, 로봇을 이용하여 사용자에 대한 3D 모델을 생성하는 방법을 개략적으로 도시한 도면,1 is a diagram schematically showing a method of generating a 3D model for a user using a robot, according to an embodiment of the present disclosure;
도 2는 본 개시의 일 실시예에 따른, 로봇의 구성을 나타내는 블록도,Figure 2 is a block diagram showing the configuration of a robot according to an embodiment of the present disclosure;
도 3은 본 개시의 일 실시예에 따른, 제1 3D 모델 생성 모드로 동작하는 동안 사용자에 대한 3D 모델을 생성하는 방법을 설명하기 위한 흐름도,3 is a flowchart illustrating a method of generating a 3D model for a user while operating in a first 3D model creation mode, according to an embodiment of the present disclosure;
도 4a는 본 개시의 일 실시예에 따른, 맵에 기초하여 촬영 장소를 식별하는 방법을 설명하기 위한 도면,FIG. 4A is a diagram for explaining a method of identifying a shooting location based on a map, according to an embodiment of the present disclosure;
도 4b는 본 개시의 일 실시예에 따른, 사용자를 촬영하기 위한 촬영 경로를 획득하는 방법을 설명하기 위한 도면,FIG. 4B is a diagram illustrating a method of obtaining a photographing path for photographing a user according to an embodiment of the present disclosure;
도 4c는 본 개시의 일 실시예에 따른, 기설정된 촬영 간격으로 사용자를 촬영하는 방법을 설명하기 위한 도면,FIG. 4C is a diagram for explaining a method of photographing a user at a preset photographing interval according to an embodiment of the present disclosure;
도 5a 및 도 5b는 본 개시의 일 실시예에 따른, 3D 모델의 품질을 판단하는 방법을 설명하기 위한 도면,5A and 5B are diagrams for explaining a method of determining the quality of a 3D model according to an embodiment of the present disclosure;
도 6은 본 개시의 일 실시예에 따른, 재설정된 촬영 간격으로 사용자를 촬영하는 방법을 설명하기 위한 도면,Figure 6 is a diagram for explaining a method of photographing a user at a reset photographing interval according to an embodiment of the present disclosure;
도 7은 본 개시의 일 실시예에 따른, 제2 3D 모델 생성 모드로 동작하는 동안 사용자에 대한 3D 모델을 생성하는 방법을 설명하기 위한 흐름도,7 is a flowchart illustrating a method of generating a 3D model for a user while operating in a second 3D model creation mode according to an embodiment of the present disclosure;
도 8은 본 개시의 일 실시예에 따른, 사용자에 대한 촬영 위치에 기초하여 경로를 변경하는 방법을 설명하기 위한 도면,FIG. 8 is a diagram for explaining a method of changing a route based on a shooting location for a user, according to an embodiment of the present disclosure;
도 9는 본 개시의 일 실시예에 따른, 제2 3D 모델 생성 모드로 동작하는 동안 3D 모델의 품질에 따라 3D 모델을 업데이트 하는 방법을 설명하기 위한 흐름도,9 is a flowchart illustrating a method of updating a 3D model according to the quality of the 3D model while operating in a second 3D model creation mode according to an embodiment of the present disclosure;
도 10은 본 개시의 일 실시예에 따른, 3D 모델의 얼굴 표정을 생성하는 방법을 설명하기 위한 흐름도, 그리고,10 is a flowchart illustrating a method for generating facial expressions of a 3D model according to an embodiment of the present disclosure, and
도 11은 본 개시의 일 실시예에 따른, 3D 모델의 모션을 생성하는 방법을 설명하기 위한 흐름도이다.FIG. 11 is a flowchart illustrating a method for generating motion of a 3D model according to an embodiment of the present disclosure.
이하, 본 개시의 다양한 실시 예가 기재된다. 그러나, 이는 본 개시의 기술을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 개시의 실시 예들의 다양한 변경(modifications), 균등물(equivalents), 및/또는 대체물(alternatives)을 포함하는 것으로 이해되어야 한다. Below, various embodiments of the present disclosure are described. However, this is not intended to limit the technology of the present disclosure to specific embodiments, and should be understood to include various modifications, equivalents, and/or alternatives to the embodiments of the present disclosure. .
본 문서에서, "가진다," "가질 수 있다," "포함한다," 또는 "포함할 수 있다" 등의 표현은 해당 특징(예: 수치, 기능, 동작, 또는 부품 등의 구성요소)의 존재를 가리키며, 추가적인 특징의 존재를 배제하지 않는다.In this document, expressions such as “have,” “may have,” “includes,” or “may include” refer to the existence of the corresponding feature (e.g., a numerical value, function, operation, or component such as a part). , and does not rule out the existence of additional features.
본 문서에서, "A 또는 B," "A 또는/및 B 중 적어도 하나," 또는 "A 또는/및 B 중 하나 또는 그 이상"등의 표현은 함께 나열된 항목들의 모든 가능한 조합을 포함할 수 있다. 예를 들면, "A 또는 B," "A 및 B 중 적어도 하나," 또는 "A 또는 B 중 적어도 하나"는, (1) 적어도 하나의 A를 포함, (2) 적어도 하나의 B를 포함, 또는 (3) 적어도 하나의 A 및 적어도 하나의 B 모두를 포함하는 경우를 모두 지칭할 수 있다.In this document, expressions such as “A or B,” “at least one of A or/and B,” or “one or more of A or/and B” may include all possible combinations of the items listed together. . For example, “A or B,” “at least one of A and B,” or “at least one of A or B” (1) includes at least one A, (2) includes at least one B, or (3) it may refer to all cases including both at least one A and at least one B.
본 문서에서 사용된 "제 1," "제 2," "첫째," 또는 "둘째," 등의 표현들은 다양한 구성요소들을, 순서 및/또는 중요도에 상관없이 수식할 수 있고, 한 구성요소를 다른 구성요소와 구분하기 위해 사용될 뿐 해당 구성요소들을 한정하지 않는다. 예를 들면, 제 1 사용자 기기와 제 2 사용자 기기는, 순서 또는 중요도와 무관하게, 서로 다른 사용자 기기를 나타낼 수 있다. 예를 들면, 본 문서에 기재된 권리 범위를 벗어나지 않으면서 제 1 구성요소는 제 2 구성요소로 명명될 수 있고, 유사하게 제 2 구성요소도 제 1 구성요소로 바꾸어 명명될 수 있다.Expressions such as “first,” “second,” “first,” or “second,” used in this document can modify various components regardless of order and/or importance, and refer to one component. It is only used to distinguish from other components and does not limit the components. For example, a first user device and a second user device may represent different user devices regardless of order or importance. For example, a first component may be renamed a second component without departing from the scope of rights described in this document, and similarly, the second component may also be renamed to the first component.
본 문서에서 사용된 "모듈", "유닛", "부(part)" 등과 같은 용어는 적어도 하나의 기능이나 동작을 수행하는 구성요소를 지칭하기 위한 용어이며, 이러한 구성요소는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다. 또한, 복수의 "모듈", "유닛", "부(part)" 등은 각각이 개별적인 특정한 하드웨어로 구현될 필요가 있는 경우를 제외하고는, 적어도 하나의 모듈이나 칩으로 일체화되어 적어도 하나의 프로세서로 구현될 수 있다.Terms such as “module,” “unit,” and “part” used in this document are terms to refer to components that perform at least one function or operation, and these components are implemented in hardware or software. Alternatively, it can be implemented through a combination of hardware and software. In addition, a plurality of "modules", "units", "parts", etc. are integrated into at least one module or chip, except in cases where each needs to be implemented with individual specific hardware, and is integrated into at least one processor. It can be implemented as:
어떤 구성요소(예: 제 1 구성요소)가 다른 구성요소(예: 제 2 구성요소)에 "(기능적으로 또는 통신적으로) 연결되어((operatively or communicatively) coupled with/to)" 있다거나 "접속되어(connected to)" 있다고 언급된 때에는, 상기 어떤 구성요소가 상기 다른 구성요소에 직접적으로 연결되거나, 다른 구성요소(예: 제 3 구성요소)를 통하여 연결될 수 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소(예: 제 1 구성요소)가 다른 구성요소(예: 제 2 구성요소)에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 상기 어떤 구성요소와 상기 다른 구성요소 사이에 다른 구성요소(예: 제 3 구성요소)가 존재하지 않는 것으로 이해될 수 있다.A component (e.g., a first component) is “(operatively or communicatively) coupled with/to” another component (e.g., a second component). When referred to as being “connected to,” it should be understood that any component may be directly connected to the other component or may be connected through another component (e.g., a third component). On the other hand, when a component (e.g., a first component) is said to be “directly connected” or “directly connected” to another component (e.g., a second component), the component and the It may be understood that no other component (e.g., a third component) exists between other components.
본 문서에서 사용된 표현 "~하도록 구성된(또는 설정된)(configured to)"은 상황에 따라, 예를 들면, "~에 적합한(suitable for)," "~하는 능력을 가지는(having the capacity to)," "~하도록 설계된(designed to)," "~하도록 변경된(adapted to)," "~하도록 만들어진(made to)," 또는 "~를 할 수 있는(capable of)"과 바꾸어 사용될 수 있다. 용어 "~하도록 구성된(또는 설정된)"은 하드웨어적으로 "특별히 설계된(specifically designed to)" 것만을 반드시 의미하지 않을 수 있다. 대신, 어떤 상황에서는, "~하도록 구성된 장치"라는 표현은, 그 장치가 다른 장치 또는 부품들과 함께 "~할 수 있는" 것을 의미할 수 있다. 예를 들면, 문구 "A, B, 및 C를 수행하도록 구성된(또는 설정된) 프로세서"는 해당 동작을 수행하기 위한 전용 프로세서(예: 임베디드 프로세서), 또는 메모리 장치에 저장된 하나 이상의 소프트웨어 프로그램들을 실행함으로써, 해당 동작들을 수행할 수 있는 범용 프로세서(generic-purpose processor)(예: CPU 또는 application processor)를 의미할 수 있다. As used in this document, the expression “configured to” depends on the situation, for example, “suitable for,” “having the capacity to.” ," can be used interchangeably with "designed to," "adapted to," "made to," or "capable of." The term “configured (or set to)” may not necessarily mean “specifically designed to” in hardware. Instead, in some contexts, the expression “a device configured to” may mean that the device is “capable of” working with other devices or components. For example, the phrase "processor configured (or set) to perform A, B, and C" refers to a processor dedicated to performing the operations (e.g., an embedded processor), or by executing one or more software programs stored on a memory device. , may refer to a general-purpose processor (e.g., CPU or application processor) capable of performing the corresponding operations.
본 문서에서 사용된 용어들은 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 다른 실시예의 범위를 한정하려는 의도가 아닐 수 있다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함할 수 있다. 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 용어들은 본 문서에 기재된 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가질 수 있다. 본 문서에 사용된 용어들 중 일반적인 사전에 정의된 용어들은, 관련 기술의 문맥상 가지는 의미와 동일 또는 유사한 의미로 해석될 수 있으며, 본 문서에서 명백하게 정의되지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다. 경우에 따라서, 본 문서에서 정의된 용어일지라도 본 문서의 실시예들을 배제하도록 해석될 수 없다Terms used in this document are merely used to describe specific embodiments and may not be intended to limit the scope of other embodiments. Singular expressions may include plural expressions, unless the context clearly indicates otherwise. Terms used herein, including technical or scientific terms, may have the same meaning as commonly understood by a person of ordinary skill in the technical field described in this document. Among the terms used in this document, terms defined in general dictionaries may be interpreted to have the same or similar meaning as the meaning they have in the context of related technology, and unless clearly defined in this document, have an ideal or excessively formal meaning. It is not interpreted as In some cases, even terms defined in this document cannot be interpreted to exclude embodiments of this document.
이하에서는 도면을 참조하여 본 개시에 대해 더욱 상세히 설명하도록 한다. 다만, 본 개시를 설명함에 있어서, 관련된 공지 기능 혹은 구성에 대한 구체적인 설명이 본 개시의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그에 대한 상세한 설명은 생략한다. 도면의 설명과 관련하여, 유사한 구성요소에 대해서는 유사한 참조 부호가 사용될 수 있다.Hereinafter, the present disclosure will be described in more detail with reference to the drawings. However, in describing the present disclosure, if it is determined that a detailed description of a related known function or configuration may unnecessarily obscure the gist of the present disclosure, the detailed description thereof will be omitted. In connection with the description of the drawings, similar reference numbers may be used for similar components.
이하에서는 도면을 참조하여 본 개시에 대해 더욱 상세히 설명하기로 한다.Hereinafter, the present disclosure will be described in more detail with reference to the drawings.
본 개시의 일 실시예에 따른, 로봇(100)은 사용자(10)에 대한 3D 모델을 생성하기 위한 3D 모델 생성 모드에 진입할 수 있다. 이때, 3D 모델 생성 모드는 제1 3D 모델 생성 모드 및 제2 3D 모델 생성 모드를 포함할 수 있다. According to an embodiment of the present disclosure, the robot 100 may enter a 3D model creation mode to create a 3D model for the user 10. At this time, the 3D model creation mode may include a first 3D model creation mode and a second 3D model creation mode.
사용자에 대한 3D 모델을 생성하는 제1 3D 모델 생성 모드에 진입하면, 로봇(100)은 기저장된 맵에 기초하여 사용자(10)에 대한 3D 모델을 생성하기 위한 촬영 장소를 식별할 수 있다. 즉, 로봇(100)은 맵에 기초하여 사용자(10)로부터 임계 거리를 유지하면서 주행 가능한 영역을 촬영 장소로 식별할 수 있다.When entering the first 3D model creation mode for generating a 3D model for the user, the robot 100 may identify a shooting location for generating a 3D model for the user 10 based on a pre-stored map. That is, the robot 100 can identify a drivable area as a shooting location while maintaining a critical distance from the user 10 based on the map.
그리고, 로봇(100)은 사용자(10)에게 식별된 촬영 장소로 이동하라는 메시지를 출력할 수 있다.Additionally, the robot 100 may output a message to the user 10 to move to the identified filming location.
사용자(10)가 촬영 장소에 위치하면, 로봇(100)은 사용자(10)를 촬영하기 위한 촬영 경로를 획득하며, 도 1의 좌측에 도시된 바와 같이, 촬영 경로를 따라 이동하는 동안 기설정된 촬영 간격으로 사용자를 촬영하여 복수의 이미지를 획득할 수 있다.When the user 10 is located at the shooting location, the robot 100 acquires a shooting path for shooting the user 10, and, as shown on the left side of FIG. 1, performs preset shooting while moving along the shooting path. Multiple images can be obtained by photographing the user at intervals.
그리고, 로봇(100)은 획득된 복수의 이미지에 기초하여 도 1의 우측에 도시된 바와 같이, 사용자에 대한 3D 모델(20)을 생성할 수 있다. 이때, 로봇(100)은 Photogrammetry 기법 또는 Vision 기법 등을 이용하여 사용자(10)에 대한 3D 모델(20)을 생성할 수 있다.And, the robot 100 can generate a 3D model 20 for the user, as shown on the right side of FIG. 1, based on the plurality of acquired images. At this time, the robot 100 may create a 3D model 20 for the user 10 using photogrammetry techniques or vision techniques.
사용자에 대한 3D 모델을 생성하는 제2 3D 모델 생성 모드에 진입하면, 로봇(100)은 로봇(100)이 주행하는 동안 사용자(10)를 인식할 수 있다.When entering the second 3D model creation mode that generates a 3D model for the user, the robot 100 can recognize the user 10 while the robot 100 drives.
그리고, 로봇(100)은 인식된 사용자의 위치에 대한 정보에 기초하여 로봇(100)의 촬영 위치를 추정하며, 추정된 위치로 로봇을 이동할 수 있다. Additionally, the robot 100 may estimate the shooting location of the robot 100 based on information about the recognized user's location and move the robot to the estimated location.
그리고, 로봇(100)은 추정된 위치에서 카메라를 통해 적어도 하나의 이미지를 획득할 수 있다. 이때, 로봇(100)은 적어도 하나의 이미지를 분석하여 적어도 하나의 이미지의 유형(및 촬영 당시의 카메라의 자세 및 위치에 대한 정보)을 분류하고, 분류 결과에 따라 적어도 하나의 이미지를 유형별로 데이터베이스에 저장할 수 있다. 이때, 이미지의 유형은 사용자(10)를 촬영한 촬영 각도에 따라 구분될 수 있다. Additionally, the robot 100 may acquire at least one image through a camera at the estimated location. At this time, the robot 100 analyzes at least one image, classifies the type of at least one image (and information about the posture and position of the camera at the time of shooting), and stores at least one image by type in a database according to the classification result. It can be saved in . At this time, the type of image may be classified according to the shooting angle at which the user 10 is captured.
데이터베이스에 기설정된 복수의 유형의 이미지가 저장되면, 로봇(100)은 복수의 유형의 이미지에 기초하여 3D 모델(20)을 생성할 수 있다. When a plurality of preset types of images are stored in the database, the robot 100 may generate the 3D model 20 based on the plurality of types of images.
상술한 바와 같이, 댁 내에서 사용자(10)에 대한 3D 모델(20)을 생성함으로써, 사용자는 별도의 스튜디오를 방문하지 않더라도 댁 내의 로봇(100)을 이용하여 사용자에 대한 3D 모델을 생성할 수 있게 된다.As described above, by creating a 3D model 20 for the user 10 at home, the user can create a 3D model for the user using the robot 100 at home even without visiting a separate studio. There will be.
도 2는 본 개시의 일 실시예에 따른, 로봇의 구성을 나타내는 블록도이다. 도 2에 도시된 바와 같이, 로봇(100)은 주행부(110), 카메라(120), 출력부(130), 센서(140), 통신 인터페이스(150), 메모리(160) 및 적어도 하나의 프로세서(170)를 포함할 수 있다. 본 개시의 일 실시예에 따른, 로봇(100)은 댁내에서 다양한 서비스를 제공하는 로봇일 수 있으나, 이는 일 실시예에 불과할 뿐, 공항, 호텔, 마트, 의류매장, 물류, 병원 등 다양한 장소에서 서비스를 제공하는 서비스 로봇(예를 들어, 안내 로봇 등)이 될 수 있다. 또한, 로봇(100)의 구성이 도 1에 도시된 구성으로 한정되는 것은 아니며, 당업자에게 자명한 구성이 추가될 수 있음은 물론이다.Figure 2 is a block diagram showing the configuration of a robot according to an embodiment of the present disclosure. As shown in FIG. 2, the robot 100 includes a traveling unit 110, a camera 120, an output unit 130, a sensor 140, a communication interface 150, a memory 160, and at least one processor. It may include (170). According to an embodiment of the present disclosure, the robot 100 may be a robot that provides various services within the home, but this is only an embodiment and can be used in various places such as airports, hotels, supermarkets, clothing stores, logistics, and hospitals. It may be a service robot that provides services (for example, a guidance robot, etc.). Additionally, the configuration of the robot 100 is not limited to the configuration shown in FIG. 1, and of course, configurations obvious to those skilled in the art may be added.
주행부(110)는 적어도 하나의 프로세서(170)의 제어에 따라 로봇(100)을 주행(또는 이동)시킬 수 있다. 특히, 주행부(110)는 로봇(100)을 주행시키는 바퀴 및 바퀴를 회전시키는 바퀴 구동 모터를 포함할 수 있다. The traveling unit 110 may drive (or move) the robot 100 under the control of at least one processor 170. In particular, the traveling unit 110 may include wheels that drive the robot 100 and a wheel drive motor that rotates the wheels.
특히, 주행부(110)는 사용자를 촬영하기 위하여 사용자를 둘러싼 촬영 경로에 따라 로봇(100)을 이동시킬 수 있다.In particular, the traveling unit 110 may move the robot 100 along a photographing path surrounding the user in order to photograph the user.
카메라(120)는 로봇(100) 주변을 촬영하여 이미지를 획득하기 위한 구성이다. 특히, 적어도 하나의 프로세서(170)는 카메라(120)를 통해 획득한 이미지를 분석하여 사용자를 인식할 수 있다. 또는, 적어도 하나의 프로세서(170)는 카메라를 통해 획득된 복수의 이미지를 이용하여 사용자에 대한 3D 모델을 생성할 수 있다. 이때, 카메라(120)는 The camera 120 is configured to obtain an image by photographing the surroundings of the robot 100. In particular, at least one processor 170 may recognize the user by analyzing the image acquired through the camera 120. Alternatively, at least one processor 170 may generate a 3D model for the user using a plurality of images acquired through a camera. At this time, the camera 120 is
출력부(130)는 다양한 정보를 출력할 수 있다. 특히, 출력부(130)는 사용자에게 촬영 위치로 안내하는 안내 메시지를 출력할 수 있다. 출력부(130)는 시각적인 메시지를 제공하는 디스플레이, LED 등으로 구현될 수 있으며, 청각적인 메시지를 제공하는 스피커 등을 구현될 수 있다.The output unit 130 can output various information. In particular, the output unit 130 may output a guidance message guiding the user to the shooting location. The output unit 130 may be implemented as a display or LED that provides a visual message, or may be implemented as a speaker that provides an auditory message.
센서(140)는 로봇(100) 주변의 환경이나 사용자의 상태를 감지하기 위한 구성이다. 일 실시예로, 센서(140)는 뎁스 센서 및 IMU(Inertial Measurement Unit) 센서를 포함할 수 있다. 뎁스 센서는 로봇(100) 주변의 장애물을 감지하기 위한 구성이다. 적어도 하나의 프로세서(170)는 뎁스 센서의 센싱값에 기초하여 로봇(100)으로부터 장애물까지의 거리를 획득할 수 있다. 예를 들어, 뎁스 센서는 라이다(LiDAR) 센서를 포함할 수 있다. 또는, 뎁스 센서는 레이더(Radar) 센서 및 뎁스 카메라를 포함할 수 있다. IMU 센서는 로봇(100)의 자세 정보를 획득하기 위한 구성이다. IMU 센서는 자이로 센서 및 지자기 센서를 포함할 수 있다. 그 밖에 로봇(100)은 로봇(100) 주변의 환경이나 사용자의 상태를 감지하기 위한 다양한 센서를 포함할 수 있다.The sensor 140 is configured to detect the environment around the robot 100 or the user's condition. In one embodiment, the sensor 140 may include a depth sensor and an Inertial Measurement Unit (IMU) sensor. The depth sensor is configured to detect obstacles around the robot 100. At least one processor 170 may obtain the distance from the robot 100 to the obstacle based on the sensing value of the depth sensor. For example, the depth sensor may include a LiDAR sensor. Alternatively, the depth sensor may include a radar sensor and a depth camera. The IMU sensor is configured to acquire posture information of the robot 100. IMU sensors may include gyro sensors and geomagnetic sensors. In addition, the robot 100 may include various sensors to detect the environment around the robot 100 or the user's status.
통신 인터페이스(150)는 적어도 하나의 회로를 포함하며 다양한 유형의 외부 기기나 서버와 통신을 수행할 수 있다. 통신 인터페이스(140)는 BLE(Bluetooth Low Energy) 모듈, 와이파이 통신 모듈, 셀룰러 통신모듈, 3G(3세대) 이동통신 모듈, 4G(4세대) 이동통신 모듈, 4세대 LTE(Long Term Evolution) 통신 모듈, 5G(5세대) 이동통신 모듈 중 적어도 하나를 포함할 수 있다.The communication interface 150 includes at least one circuit and can communicate with various types of external devices or servers. The communication interface 140 includes a BLE (Bluetooth Low Energy) module, a Wi-Fi communication module, a cellular communication module, a 3G (3rd generation) mobile communication module, a 4G (4th generation) mobile communication module, and a 4th generation LTE (Long Term Evolution) communication module. , may include at least one of 5G (5th generation) mobile communication modules.
특히, 통신 인터페이스(150)는 외부의 휴대 단말(예로, 사용자(10)의 스마트 폰 등)로 안내 메시지를 전송할 수 있다. In particular, the communication interface 150 may transmit a guidance message to an external portable terminal (eg, a smart phone of the user 10, etc.).
메모리(160)는 로봇(100)의 구성요소들의 전반적인 동작을 제어하기 위한 운영체제(OS: Operating System) 및 로봇(100)의 구성요소와 관련된 인스트럭션 또는 데이터를 저장할 수 있다. 특히, 메모리(160)는 3D 모델을 생성하기 위한 다양한 모듈을 포함할 수 있다.The memory 160 may store an operating system (OS) for controlling the overall operation of the components of the robot 100 and instructions or data related to the components of the robot 100. In particular, the memory 160 may include various modules for creating a 3D model.
특히, 메모리(160)는 사용자를 촬영한 이미지를 저장하는 데이터베이스를 포함할 수 있다. 또한, 메모리(160)는 얼굴 이미지와 표정 유형을 매칭하여 저장하는 데이터베이스, 모션 이미지와 모션 유형을 매칭하여 저장하는 데이터베이스를 저장할 수 있다. 또한, 메모리(160)는 댁 내의 맵에 대한 정보를 저장할 수 있다.In particular, the memory 160 may include a database that stores images captured by a user. Additionally, the memory 160 may store a database that matches and stores facial images and expression types, and a database that matches and stores motion images and motion types. Additionally, the memory 160 can store information about maps within your home.
한편, 메모리(150)는 비휘발성 메모리(ex: 하드 디스크, SSD(Solid state drive), 플래시 메모리), 휘발성 메모리(적어도 하나의 프로세서(180) 내의 메모리도 포함할 수 있음.) 등으로 구현될 수 있다.Meanwhile, the memory 150 may be implemented as non-volatile memory (ex: hard disk, solid state drive (SSD), flash memory), volatile memory (may also include memory in at least one processor 180), etc. You can.
적어도 하나의 프로세서(170)는 메모리(160)와 전기적으로 연결되어 로봇(100)의 전반적인 기능 및 동작을 제어할 수 있다. 3D 모델 생성 모드에 진입하면, 적어도 하나의 프로세서(170)는 비휘발성 메모리에 저장되어 있는 모듈이 각종 동작을 수행하기 위한 데이터를 휘발성 메모리로 로딩(loading)할 수 있다. 여기서, 로딩이란 적어도 하나의 프로세서(180)가 액세스할 수 있도록 비휘발성 메모리에 저장된 데이터를 휘발성 메모리에 불러들여 저장하는 동작을 의미한다.At least one processor 170 may be electrically connected to the memory 160 to control the overall functions and operations of the robot 100. When entering the 3D model creation mode, at least one processor 170 may load data for a module stored in the non-volatile memory to perform various operations into the volatile memory. Here, loading refers to an operation of loading and storing data stored in non-volatile memory in volatile memory so that at least one processor 180 can access it.
특히, 사용자에 대한 3D 모델을 생성하는 제1 모드에 진입하면, 적어도 하나의 프로세서(180)는 맵에 기초하여 사용자에 대한 3D 모델을 생성하기 위한 촬영 장소를 식별한다. 적어도 하나의 프로세서(180)는 사용자에게 상기 식별된 촬영 장소로 이동하라는 메시지를 출력하도록 출력부(130)를 제어한다. 사용자가 촬영 장소에 위치하면, 적어도 하나의 프로세서(180)는 사용자를 촬영하기 위한 촬영 경로를 획득한다. 적어도 하나의 프로세서(180)는 주행부(110)를 통해 촬영 경로를 따라 이동하는 동안 기설정된 촬영 간격으로 카메라(120)를 통해 사용자를 촬영하여 복수의 이미지를 획득한다. 적어도 하나의 프로세서(180)는 획득된 복수의 이미지에 기초하여 사용자에 대한 3D 모델을 생성한다.In particular, when entering the first mode for generating a 3D model for the user, at least one processor 180 identifies a shooting location for generating a 3D model for the user based on the map. At least one processor 180 controls the output unit 130 to output a message to the user to move to the identified shooting location. When a user is located at a photographing location, at least one processor 180 obtains a photographing path for photographing the user. At least one processor 180 acquires a plurality of images by photographing the user through the camera 120 at preset photographing intervals while moving along the photographing path through the traveling unit 110. At least one processor 180 generates a 3D model for the user based on the plurality of acquired images.
또한, 적어도 하나의 프로세서(180)는 생성된 3D 모델을 2D로 투영하여 복수의 투영 이미지를 획득할 수 있다. 적어도 하나의 프로세서(180)는 복수의 이미지와 복수의 이미지와 대응되는 복수의 투영 이미지를 비교하며, 비교 결과를 바탕으로 3D 모델의 품질값을 측정할 수 있다. 이때, 적어도 하나의 프로세서(180)는 복수의 이미지 중 사용자의 정면을 기준으로 제1 각도에서 촬영된 제1 이미지에 포함된 복수의 제1 특징점의 픽셀과 복수의 투영 이미지 중 3D 모델을 제1 각도 방향에서 투영한 제1 투영 이미지에 포함된 복수의 제2 특징점의 픽셀을 비교하여 픽셀 차이값을 산출할 수 있다. 그리고, 적어도 하나의 프로세서(180)는 산출된 픽셀 차이값에 기초하여 3D 모델의 품질값을 측정할 수 있다.Additionally, at least one processor 180 may acquire a plurality of projection images by projecting the generated 3D model into 2D. At least one processor 180 may compare a plurality of images and a plurality of projection images corresponding to the plurality of images, and measure the quality value of the 3D model based on the comparison result. At this time, the at least one processor 180 uses the pixels of the plurality of first feature points included in the first image taken at a first angle with respect to the front of the user among the plurality of images and the 3D model among the plurality of projection images as the first A pixel difference value may be calculated by comparing pixels of a plurality of second feature points included in the first projection image projected in the angular direction. Additionally, at least one processor 180 may measure the quality value of the 3D model based on the calculated pixel difference value.
3D 모델의 품질값이 임계값 미만인 경우, 적어도 하나의 프로세서(180)는 로봇의 촬영 간격 또는 촬영 위치를 재설정할 수 있다. 적어도 하나의 프로세서(180)는 주행부(110)를 통해 촬영 경로를 따라 이동하는 동안 재설정된 촬영 간격 또는 촬영 위치에서 사용자를 촬영하여 복수의 재설정 이미지를 획득할 수 있다. 적어도 하나의 프로세서(180)는 획득된 복수의 재설정 이미지에 기초하여 사용자에 대한 3D 모델을 업데이트할 수 있다.If the quality value of the 3D model is less than the threshold, at least one processor 180 may reset the robot's shooting interval or shooting position. At least one processor 180 may acquire a plurality of reset images by photographing the user at a reset photographing interval or photographing position while moving along the photographing path through the traveling unit 110. At least one processor 180 may update the 3D model for the user based on the plurality of acquired reset images.
한편, 사용자에 대한 3D 모델을 생성하는 제2 모드에 진입하면, 적어도 하나의 프로세서(180)는 로봇이 주행하는 동안 상기 사용자를 인식할 수 있다. 적어도 하나의 프로세서(180)는 인식된 사용자의 위치에 대한 정보에 기초하여 로봇의 촬영 위치를 추정할 수 있다. 적어도 하나의 프로세서(180)는 추정된 위치로 로봇(100)을 이동하도록 주행부(110)를 제어할 수 있다. 적어도 하나의 프로세서(180)는 추정된 위치에서 카메라(110)를 통해 적어도 하나의 이미지를 획득할 수 있다. 적어도 하나의 프로세서(180)는 적어도 하나의 이미지를 분석하여 적어도 하나의 이미지의 유형을 분류하여 데이터베이스에 저장할 수 있다.Meanwhile, when entering the second mode for generating a 3D model for a user, at least one processor 180 may recognize the user while the robot is traveling. At least one processor 180 may estimate the robot's shooting location based on information about the recognized user's location. At least one processor 180 may control the traveling unit 110 to move the robot 100 to the estimated position. At least one processor 180 may acquire at least one image through the camera 110 at the estimated location. At least one processor 180 may analyze at least one image, classify the type of at least one image, and store it in a database.
그리고, 데이터베이스에 기설정된 복수의 유형의 이미지가 저장되면, 적어도 하나의 프로세서(180)는 저장된 복수의 유형의 이미지의 기초하여 사용자에 대한 3D 모델을 생성할 수 있다.And, when a plurality of preset types of images are stored in the database, at least one processor 180 may generate a 3D model for the user based on the plurality of types of stored images.
이때, 복수의 유형 중 저장되지 않은 유형의 이미지가 존재하면, 적어도 하나의 프로세서(180)는 저장되지 않는 유형의 이미지에 대응되는 촬영 각도로 촬영할 수 있도록 로봇(100)의 촬영 위치를 추정할 수 있다.At this time, if there is an image of an unsaved type among the plurality of types, at least one processor 180 may estimate the shooting position of the robot 100 so that it can be captured at a shooting angle corresponding to the image of the unsaved type. there is.
그리고, 적어도 하나의 프로세서(180)는 생성된 3D 모델을 2D로 투영하여 복수의 투영 이미지를 획득할 수 있다. 적어도 하나의 프로세서(180)는 복수의 유형의 이미지와 상기 복수의 유형의 이미지와 대응되는 복수의 투영 이미지를 비교하며, 비교 결과를 바탕으로 3D 모델의 품질값을 측정할 수 있다. 3D 모델의 품질값이 임계값 미만인 경우, 적어도 하나의 프로세서(180)는 로봇의 촬영 위치를 재설정하고, 주행부(110)를 통해 재설정된 촬영 위치에서 사용자를 촬영하여 복수의 재설정 이미지를 획득하고, 획득된 복수의 재설정 이미지에 기초하여 사용자에 대한 3D 모델을 업데이트할 수 있다.Additionally, at least one processor 180 may acquire a plurality of projection images by projecting the generated 3D model into 2D. At least one processor 180 may compare a plurality of types of images with a plurality of projection images corresponding to the plurality of types of images, and measure the quality value of the 3D model based on the comparison result. If the quality value of the 3D model is less than the threshold, at least one processor 180 resets the shooting position of the robot, acquires a plurality of reset images by photographing the user at the reset shooting position through the traveling unit 110, and , the 3D model for the user can be updated based on the acquired plurality of reset images.
한편, 사용자가 인식되면, 적어도 하나의 프로세서(180)는 사용자의 얼굴을 촬영하여 얼굴 이미지를 획득할 수 있다. 적어도 하나의 프로세서(180)는 획득된 얼굴 이미지를 분석하여 획득된 얼굴 이미지에 대응되는 표정 유형을 획득할 수 있다. 적어도 하나의 프로세서(180)는 얼굴 이미지와 상기 표정 유형에 대한 정보를 데이터베이스에 저장할 수 있다. 적어도 하나의 프로세서(180)는 데이터베이스에 저장된 표정 유형별 얼굴 이미지에 기초하여 3D 모델의 얼굴 표정을 생성할 수 있다.Meanwhile, when the user is recognized, at least one processor 180 may obtain a facial image by photographing the user's face. At least one processor 180 may analyze the acquired facial image and obtain an expression type corresponding to the acquired facial image. At least one processor 180 may store facial images and information about the expression type in a database. At least one processor 180 may generate a facial expression of the 3D model based on facial images for each expression type stored in a database.
또한, 사용자가 인식되면, 적어도 하나의 프로세서(180)는 사용자의 모션을 촬영하여 모션 이미지를 획득할 수 있다. 적어도 하나의 프로세서(180)는 획득된 모션 이미지를 분석하여 획득된 모션 이미지에 대응되는 모션 유형을 획득할 수 있다. 적어도 하나의 프로세서(180)는 모션 이미지와 상기 모션 유형에 대한 정보를 데이터베이스에 저장할 수 있다. 적어도 하나의 프로세서(180)는 데이터베이스에 저장된 모션 유형별 모션 이미지에 기초하여 3D 모델의 모션을 생성할 수 있다.Additionally, when a user is recognized, at least one processor 180 may acquire a motion image by capturing the user's motion. At least one processor 180 may analyze the acquired motion image and obtain a motion type corresponding to the acquired motion image. At least one processor 180 may store motion images and information about the motion type in a database. At least one processor 180 may generate motion of a 3D model based on motion images for each motion type stored in a database.
이하에서는 도 3 내지 도 6을 참조하여 제1 3D 모델 생성 모드로 동작하는 동안 사용자에 대한 3D 모델을 생성하는 방법에 대해 설명하기로 한다.Hereinafter, a method of generating a 3D model for a user while operating in the first 3D model creation mode will be described with reference to FIGS. 3 to 6.
도 3은 본 개시의 일 실시예에 따른, 제1 3D 모델 생성 모드로 동작하는 동안 사용자에 대한 3D 모델을 생성하는 방법을 설명하기 위한 흐름도이다.FIG. 3 is a flowchart illustrating a method of generating a 3D model for a user while operating in a first 3D model creation mode, according to an embodiment of the present disclosure.
우선, 로봇(100)은 제1 3D 모델 생성 모드에 진입할 수 있다(S305). 구체적으로, 사용자로부터 "3D 모델 생성해 줘" 등과 같은 사용자 음성이 입력되면, 로봇(100)은 제1 3D 모델 생성 모드에 진입할 수 있다. 또는, 사용자 단말로부터 3D 모델 생성 요청이 수신되면, 로봇(100)은 제1 3D 모델 생성 모드에 진입할 수 있다.First, the robot 100 may enter the first 3D model creation mode (S305). Specifically, when a user voice such as “Generate a 3D model” is input from the user, the robot 100 may enter the first 3D model creation mode. Alternatively, when a 3D model creation request is received from the user terminal, the robot 100 may enter the first 3D model creation mode.
로봇(100)은 메모리(160)에 저장된 맵에 기초하여 촬영 장소를 식별할 수 있다(S310). 구체적으로, 사용자에 대한 3D 모델을 생성하기 위해서는 사용자와 일정 간격을 유지하면서 사용자를 다양한 촬영 각도에서 촬영할 필요가 있다. 따라서, 사용자를 복수의 촬영 각도에서 촬영하기 위하여 임계 크기 이상의 영역이 필요하다. 따라서, 로봇(100)은 메모리(160)에 저장된 맵 중 임계 크기 이상의 영역을 검색할 수 있다. 임계 크기 이상의 영역이 복수 개 검색되면, 로봇(100)은 검색된 복수의 영역 중 사용자와 가장 가까운 영역을 촬영 장소로 식별할 수 있다. The robot 100 can identify the shooting location based on the map stored in the memory 160 (S310). Specifically, in order to create a 3D model of a user, it is necessary to photograph the user from various shooting angles while maintaining a certain distance from the user. Therefore, an area larger than a critical size is required to capture a user's image from multiple shooting angles. Accordingly, the robot 100 can search for an area larger than a critical size among the maps stored in the memory 160. If a plurality of areas larger than the critical size are searched, the robot 100 may identify the area closest to the user among the plurality of searched areas as the shooting location.
한편, 임계 크기는 사용자 정보(예로, 사용자의 키 등)에 따라 결정될 수 있다. 구체적으로, 사용자의 키가 클수록 임계 크기가 크게 결정될 수 있으며, 사용자의 키가 작을수록 임계 크기가 작게 결정될 수 있다. Meanwhile, the threshold size may be determined according to user information (eg, user's height, etc.). Specifically, the larger the user's height, the larger the threshold size may be determined, and the shorter the user's height, the smaller the threshold size may be determined.
예를 들어, 도 4a의 좌측 도면에 도시된 바와 같이, 사용자(10)가 댁 내의 제1 공간에 위치하는 경우, 로봇(100)은 맵에 기초하여 도 4a의 우측에 도시된 바와 같이, 임계 크기 이상의 영역인 제2 공간(410)을 촬영 장소로 결정할 수 있다. For example, as shown in the left drawing of FIG. 4A, when the user 10 is located in the first space in the home, the robot 100 determines the threshold as shown in the right drawing of FIG. 4A based on the map. The second space 410, which is an area larger than the size, can be determined as the shooting location.
로봇(100)은 사용자에게 이동 메시지를 출력할 수 있다(2315). 구체적으로, 로봇(100)은 식별된 촬영 장소로 이동하라는 메시지를 사용자에게 출력할 수 있다. 예를 들어, 로봇(100)은 사용자에게 "거실로 이동하세요"라는 음성 메시지를 출력할 수 있으며, 사용자에게 "저를 따라 오세요"라는 음성 메시지와 함께 촬영 장소로 이동할 수 있다.The robot 100 may output a movement message to the user (2315). Specifically, the robot 100 may output a message to the user to move to the identified filming location. For example, the robot 100 may output a voice message to the user, “Please move to the living room,” and may move to the filming location along with a voice message to the user, “Please follow me.”
사용자가 촬영 장소에 위치하면, 로봇(100)은 촬영 경로를 획득할 수 있다(S320). 구체적으로, 로봇(100)은 사용자 이동 후 사용자 위치를 기반으로 촬영 경로를 획득할 수 있다. 예를 들어, 로봇(100)은 사용자가 위치한 지점을 기준으로 사용자와 일정 거리를 유지하도록 하는 원 형상의 촬영 경로를 획득할 수 있다. 이때, 일정 거리는 사용자 정보(예로, 사용자의 키)에 따라 결정될 수 있다. 예를 들어, 도 4b에 도시된 바와 같이, 로봇(10)은 사용자(10)를 기준으로 사용자와 일정 거리(R)를 유지하도록 하는 원 형상의 촬영 경로(420)를 획득할 수 있다.When the user is located at the shooting location, the robot 100 can acquire the shooting path (S320). Specifically, the robot 100 may acquire a shooting path based on the user's location after the user moves. For example, the robot 100 may obtain a circular imaging path that maintains a certain distance from the user based on the point where the user is located. At this time, a certain distance may be determined according to user information (eg, user's height). For example, as shown in FIG. 4B, the robot 10 may obtain a circular imaging path 420 that maintains a certain distance R from the user 10.
이때, 로봇(100)은 촬영 경로를 따라 사용자를 촬영하고, 획득된 이미지를 기준으로 촬영 경로를 보정할 수 있다. 예를 들어, 획득된 이미지에 포함된 사용자의 크기가 임계 범위를 벗어나면, 로봇(100)은 촬영 경로를 보정할 수 있다. 즉, 획득된 이미지에 포함된 사용자의 크기가 임계 범위를 초과하면, 로봇(100)은 일정 거리를 증가시키도록 촬영 경로를 보정할 수 있다. 획득된 이미지에 포함된 사용자의 크기가 임계 범위 미만이면, 로봇(100)은 일정 거리를 감소시키도록 촬영 경로를 보정할 수 있다.At this time, the robot 100 may photograph the user along the photographing path and correct the photographing path based on the acquired image. For example, if the size of the user included in the acquired image is outside the critical range, the robot 100 may correct the capturing path. That is, if the size of the user included in the acquired image exceeds the critical range, the robot 100 may correct the capturing path to increase a certain distance. If the size of the user included in the acquired image is less than the critical range, the robot 100 may correct the capturing path to reduce the certain distance.
로봇(100)은 촬영 경로를 이동하는 동안 기설정된 촬영 간격으로 사용자를 촬영하여 복수의 이미지를 획득할 수 있다(S325). 이때, 기설정된 촬영 간격은 초기 설정에 의해 결정될 수 있다. 예를 들어, 도 4c에 도시된 바와 같이, 로봇(100)은 촬영 경로(420)를 이동하는 동안 제1 내지 제5 촬영 지점(430-1 내지 430-5)에서 5개의 촬영 이미지를 획득할 수 있다. 이때, 5개의 촬영 이미지 각각은 사용자의 정면을 기준으로 촬영된 촬영 각도에 대한 정보를 함께 저장할 수 있다. 한편, 로봇(100)은 기설정된 촬영 간격이 아닌 사용자 정보(예를 들어, 사용자의 키 등)에 기초하여 결정된 복수의 촬영 위치에서 복수의 이미지를 획득할 수 있다. The robot 100 may acquire a plurality of images by photographing the user at preset photographing intervals while moving along the photographing path (S325). At this time, the preset shooting interval may be determined by initial settings. For example, as shown in FIG. 4C, the robot 100 acquires five captured images at the first to fifth photographing points 430-1 to 430-5 while moving the photographing path 420. You can. At this time, each of the five captured images can store information about the shooting angle taken based on the front of the user. Meanwhile, the robot 100 may acquire a plurality of images from a plurality of shooting positions determined based on user information (eg, user's height, etc.) rather than a preset shooting interval.
로봇(100)은 획득된 복수의 이미지에 기초하여 사용자에 대한 3D 모델(또는 기본 3D 모델)을 생성할 수 있다(S330). 이때, 로봇(100)은 Photogrammetry 기법 또는 Vision 기법 등을 이용하여 사용자(10)에 대한 3D 모델을 생성할 수 있다.The robot 100 may generate a 3D model (or basic 3D model) for the user based on the plurality of acquired images (S330). At this time, the robot 100 may create a 3D model for the user 10 using photogrammetry techniques or vision techniques.
그리고, 로봇(100)은 획득된 3D 모델의 품질을 검사하기 위하여, 복수의 투영 이미지를 획득할 수 있다(S335). 이때, 복수의 투영 이미지는 복수의 이미지를 촬영한 촬영 각도에 대응되는 각도에서 3D 모델을 2D로 투영한 이미지일 수 있다. 예를 들어, 도 5a에 도시된 바와 같이, 제1 이미지(510)가 제1 촬영 각도(예로, 정면을 기준으로 72도)에서 촬영된 이미지인 경우, 로봇(100)은 3D 모델(20)의 정면을 기준으로 제1 각도(예로, 정면을 기준으로 72)에서 3D 모델을 투영하여 제1 투영 이미지(520)를 획득할 수 있다. 이와 같은 방식으로, 로봇(100)은 제1 내지 제5 이미지(430-1 내지 430-5) 각각에 대응되는 복수의 투영 이미지를 획득할 수 있다.Additionally, the robot 100 may acquire a plurality of projection images to inspect the quality of the acquired 3D model (S335). At this time, the plurality of projection images may be images obtained by projecting the 3D model into 2D at an angle corresponding to the shooting angle at which the plurality of images were captured. For example, as shown in FIG. 5A, when the first image 510 is an image taken at a first shooting angle (e.g., 72 degrees from the front), the robot 100 uses the 3D model 20 The first projection image 520 may be obtained by projecting the 3D model at a first angle (for example, 72 degrees based on the front) based on the front. In this way, the robot 100 can acquire a plurality of projection images corresponding to each of the first to fifth images 430-1 to 430-5.
그리고, 로봇(100)은 복수의 이미지와 복수의 투영 이미지에 기초하여 3D 모델의 품질값을 획득할 수 있다(S340). 구체적으로, 로봇(100)은 복수의 이미지와 복수의 이미지와 대응되는 복수의 투영 이미지를 비교할 수 있다. 이때, 복수의 이미지 중 사용자의 정면을 기준으로 제1 각도에서 촬영된 제1 이미지에 포함된 복수의 제1 특징점의 픽셀과 복수의 투영 이미지 중 3D 모델을 제1 각도 방향에서 투영한 제1 투영 이미지에 포함된 복수의 제2 특징점의 픽셀을 비교하여 픽셀 차이값을 산출할 수 있다. 예를 들어, 로봇(100)은 제1 이미지(510)의 복수의 특징점(머리의 일 지점, 왼쪽 어깨의 일 지점, 왼 손의 일 지점, 왼 발의 일 지점)과 제1 이미지(510)에 대응되는 제1 투영 이미지(520)의 복수의 특징점(머리의 일 지점, 왼쪽 어깨의 일 지점, 왼 손의 일 지점, 왼 발의 일 지점)에 대해, 대응되는 픽셀 간의 픽셀 차이값을 산출할 수 있다. 그리고, 로봇(100)은 픽셀 차이값에 기초하여 3D 모델을 생성하는데 이용된 이미지의 품질값을 획득할 수 있다. 구체적으로, 로봇(100)은 픽셀 차이값이 클수록 품질값을 낮게 획득할 수 있으며, 픽셀 차이값이 작을수록 품질값을 높게 획득할 수 있다. 상술한 바와 같은 방법으로, 로봇(100)은 3D 모델을 생성하는데 이용된 복수의 이미지 각각에 대한 품질값을 획득하여, 3D 모델의 품질값을 획득할 수 있다.And, the robot 100 can obtain the quality value of the 3D model based on a plurality of images and a plurality of projection images (S340). Specifically, the robot 100 may compare a plurality of images and a plurality of projection images corresponding to the plurality of images. At this time, the pixels of a plurality of first feature points included in the first image taken at a first angle with respect to the front of the user among the plurality of images and the first projection of the 3D model in the first angle direction among the plurality of projection images A pixel difference value can be calculated by comparing pixels of a plurality of second feature points included in the image. For example, the robot 100 includes a plurality of feature points (a point on the head, a point on the left shoulder, a point on the left hand, and a point on the left foot) and the first image 510. For a plurality of feature points (a point on the head, a point on the left shoulder, a point on the left hand, and a point on the left foot) of the corresponding first projection image 520, the pixel difference value between the corresponding pixels can be calculated. there is. And, the robot 100 can obtain the quality value of the image used to create the 3D model based on the pixel difference value. Specifically, the robot 100 can obtain a lower quality value as the pixel difference value increases, and obtain a higher quality value as the pixel difference value decreases. In the same manner as described above, the robot 100 can obtain the quality value of the 3D model by obtaining the quality value for each of the plurality of images used to generate the 3D model.
그러나, 이는 일 실시예에 불과할 뿐, 로봇(100)은 이미지와 투영 이미지 사이의 유사도를 측정하여 3D 모델의 품질값을 획득할 수 있음은 물론이다. 또는, 로봇(100)은 이미지와 투영 이미지를 입력하여 품질값을 획득하도록 학습된 신경망 모델을 이용하여 3D 모델의 품질값을 획득할 수 있다. 즉, 로봇(100)은 신경망 모델에 이미지와 투영 이미지를 입력하여 3D 모델의 품질값을 획득할 수 있다. However, this is only an example, and of course, the robot 100 can obtain the quality value of the 3D model by measuring the similarity between the image and the projected image. Alternatively, the robot 100 may obtain the quality value of the 3D model using a neural network model learned to obtain the quality value by inputting an image and a projection image. That is, the robot 100 can obtain the quality value of the 3D model by inputting an image and a projection image into the neural network model.
로봇(100)은 품질값이 임계값 미만인지 여부를 판단할 수 있다(S345). The robot 100 may determine whether the quality value is less than the threshold (S345).
품질값이 임계값 이상인 경우(S345-N), 로봇(100)은 기존에 생성된 3D 모델을 이용하여 아바타를 생성할 수 있다.If the quality value is greater than or equal to the threshold (S345-N), the robot 100 may create an avatar using a previously created 3D model.
품질값이 임계값 미만인 경우(S345-Y), 로봇(100)은 로봇의 촬영 간격 또는 촬영 위치를 재설정할 수 있다(S350). 이때, 로봇(100)은 이미지와 투영 이미지의 오차의 크기에 기초하여 로봇의 촬영 간격 또는 촬영 위치를 재설정할 수 있다. 즉, 로봇(100)은 이미지와 투영 이미지 사이의 오차의 크기가 큰 촬영 각도에서 촬영 간격을 좁게 하도록 재설정할 수 있으며, 이미지와 투영 이미지 사이의 오차의 크기가 작은 촬영 각도에서는 촬영 간격을 넓게 하도록 재설정할 수 있다. 또는, 로봇(100)은 이미지와 투영 이미지 사이의 오차의 크기가 큰 촬영 각도에서 재촬영을 하도록 촬영 위치를 재설정할 수 있다.If the quality value is less than the threshold (S345-Y), the robot 100 may reset the robot's shooting interval or shooting position (S350). At this time, the robot 100 may reset the robot's shooting interval or shooting position based on the size of the error between the image and the projected image. In other words, the robot 100 can be reset to narrow the shooting interval at a shooting angle where the error between the image and the projected image is large, and to widen the shooting interval at a shooting angle where the size of the error between the image and the projected image is small. It can be reset. Alternatively, the robot 100 may reset the capturing position to re-photograph at an angle where the error between the image and the projected image is large.
예를 들어, 로봇(100)은 도 6에 도시된 바와 같이, 촬영 경로 중 7개의 지점(610-1 내지 610-7)에서 재촬영을 수행하도록 촬영 간격 또는 촬영 위치를 재설정할 수 있다.For example, as shown in FIG. 6, the robot 100 may reset the shooting interval or shooting position to perform rephotography at seven points 610-1 to 610-7 on the shooting path.
로봇(100)은 촬영 경로 중 재설정된 촬영 간격 또는 촬영 위치에서 사용자를 촬영하여 복수의 재설정 이미지를 획득할 수 있다(S355). The robot 100 may acquire a plurality of reset images by photographing the user at a reset photographing interval or photographing position during the photographing path (S355).
그리고, 로봇(100)은 복수의 재설정 이미지에 기초하여 3D 모델을 업데이트할 수 있다(S360). 구체적으로, 로봇(100)은 복수의 재설정 이미지에 기초하여 3D 모델을 재생성하여 기존의 3D 모델을 업데이트할 수 있다.Then, the robot 100 may update the 3D model based on the plurality of reset images (S360). Specifically, the robot 100 may update the existing 3D model by regenerating the 3D model based on a plurality of reset images.
그리고, 로봇(100)은 업데이트된 3D 모델의 품질을 확인하기 위하여, S335 내지 S345 과정을 반복하여 수행할 수 있다.Additionally, the robot 100 may repeatedly perform steps S335 to S345 to check the quality of the updated 3D model.
도 7은 본 개시의 일 실시예에 따른, 제2 3D 모델 생성 모드로 동작하는 동안 사용자에 대한 3D 모델을 생성하는 방법을 설명하기 위한 흐름도이다.FIG. 7 is a flowchart illustrating a method of generating a 3D model for a user while operating in a second 3D model creation mode, according to an embodiment of the present disclosure.
우선, 로봇(100)은 제2 3D 모델 생성 모드에 진입할 수 있다(S710). 구체적으로, 사용자로부터 3D 모델 생성 요청이 수신되면, 로봇(100)은 제2 3D 모델 생성 모드에 진입할 수 있다. 이때, 로봇(100)(또는 사용자 단말)은 제1 3D 모델 생성 모드 및 제2 3D 모델 생성 모드 각각에 대응되는 아이콘을 표시할 수 있으며, 선택된 아이콘에 따라 3D 모델 생성 모드에 진입할 수 있다. 한편, 제2 3D 모델 생성 모드에 진입한 경우, 로봇(100)은 바로 사용자를 촬영하지 않고, 로봇(100)의 다른 기능(예로, 배달 기능, 청소 기능 등)을 수행하는 동안 주행 중에 사용자를 촬영할 수 있다.First, the robot 100 may enter the second 3D model creation mode (S710). Specifically, when a 3D model creation request is received from a user, the robot 100 may enter the second 3D model creation mode. At this time, the robot 100 (or user terminal) may display icons corresponding to each of the first 3D model creation mode and the second 3D model creation mode, and may enter the 3D model creation mode according to the selected icon. Meanwhile, when entering the second 3D model creation mode, the robot 100 does not immediately photograph the user, but captures the user while driving while performing other functions of the robot 100 (e.g., delivery function, cleaning function, etc.). You can shoot.
제2 3D 모델 생성 모드에 진입한 후, 로봇(100)은 주행하는 동안 사용자를 인식할 수 있다(S720). 이때, 로봇(100)은 얼굴 인식, 음성 인식을 통해 사용자를 인식할 수 있다. 사용자가 인식되면, 로봇(100)은 사용자의 위치에 대한 정보를 획득할 수 있다. 이때, 사용자의 위치에 대한 정보는 사용자가 위치한 영역의 조명 정보 등이 포함될 수 있다. 또한, 로봇(100)은 인식된 사용자를 추적할 수 있다.After entering the second 3D model creation mode, the robot 100 can recognize the user while driving (S720). At this time, the robot 100 can recognize the user through face recognition and voice recognition. When the user is recognized, the robot 100 can obtain information about the user's location. At this time, information about the user's location may include lighting information of the area where the user is located. Additionally, the robot 100 can track a recognized user.
로봇(100)은 인식된 사용자에 대한 정보(예로, 현재 위치 및 사용자의 자세 등)에 기초하여 로봇(100)의 촬영 위치를 추정할 수 있다(S730). 이때, 로봇(100)은 사용자에 대한 정보 이외에 로봇(100)의 위치, 주변 장애물 정보, 맵 정보 등에 기초하여 로봇의 촬영 위치를 추정할 수 있음은 물론이다. 또한, 로봇(100)은 사용자가 위치한 영역 중 조명이 비추는 방향 또는 기설정된 값 이상의 조도를 가지는 방향을 식별하고, 식별된 방향에서 사용자를 촬영할 수 있도록 로봇(100)의 촬영 위치를 추정할 수 있다. 또는, 3D 모델을 생성하기 위해 필요한 복수의 유형 중 저장되지 않은 유형의 이미지가 존재하면, 로봇(100)은 저장되지 않는 유형의 이미지에 대응되는 촬영 각도로 촬영할 수 있도록 로봇의 촬영 위치를 추정할 수 있다. 예를 들어, 3D 모델을 생성하기 위하여, 6개 유형(예로, 0도에서 촬영한 유형, 60도에서 촬영한 유형, 120도에서 촬영한 유형, 180도에서 촬영한 유형, 240도에서 촬영한 유형 및 300도에서 촬영한 유형)의 이미지가 필요한 상황에서 60도에서 촬영한 유형의 이미지가 존재하지 않으면, 로봇(100)은 60도 방향에서 사용자를 촬영할 수 있도록 로봇(100)의 촬영 위치를 추정할 수 있다.The robot 100 may estimate the shooting location of the robot 100 based on information about the recognized user (eg, current location and user posture, etc.) (S730). At this time, of course, the robot 100 can estimate the shooting location of the robot based on the location of the robot 100, surrounding obstacle information, map information, etc. in addition to information about the user. In addition, the robot 100 can identify the direction in which the light shines or the direction with illuminance above a preset value among the areas where the user is located, and estimate the shooting position of the robot 100 so that the user can be photographed in the identified direction. . Alternatively, if there is an image of an unsaved type among the plurality of types required to create a 3D model, the robot 100 estimates the shooting position of the robot so that it can shoot at a shooting angle corresponding to the image of the type not saved. You can. For example, to create a 3D model, 6 types (e.g., type taken at 0 degrees, type taken at 60 degrees, type taken at 120 degrees, type taken at 180 degrees, type taken at 240 degrees) If an image of the type captured at 60 degrees does not exist in a situation where an image of the type captured at 300 degrees is required, the robot 100 adjusts the capturing position of the robot 100 so that it can capture the user from a 60-degree direction. It can be estimated.
로봇(100)은 추정된 위치로 이동할 수 있다(S740). 이때, 로봇(100)은 기존의 경로에서 추정된 위치로 이동하기 위하여 새로운 경로를 식별할 수 있다. 예를 들어, 도 8에 도시된 바와 같이, 제1 경로(810)를 통해 주행하는 동안 제1 지점에 위치한 사용자(10)가 인식된 경우, 로봇(100)은 제2 지점(830)을 추정된 위치로 식별할 수 있다. 이때, 제1 경로(810) 내에 제2 지점(830)이 포함되어 있지 않으므로, 로봇(100)은 추정된 위치로 이동하기 위하여 새로운 제2 경로(820)를 식별할 수 있다. The robot 100 can move to the estimated location (S740). At this time, the robot 100 may identify a new path to move to the estimated location from the existing path. For example, as shown in FIG. 8, when the user 10 located at the first point is recognized while driving through the first path 810, the robot 100 estimates the second point 830. It can be identified by its location. At this time, since the second point 830 is not included in the first path 810, the robot 100 can identify a new second path 820 to move to the estimated location.
로봇(100)은 추정된 위치에서 카메라(120)를 통해 적어도 하나의 이미지를 획득할 수 있다(S750). 적어도 하나의 이미지를 획득한 후, 로봇(100)은 기존의 기능을 수행하기 위하여 제2 경로(820)에 따라 주행할 수 있다.The robot 100 may acquire at least one image through the camera 120 at the estimated location (S750). After acquiring at least one image, the robot 100 may travel along the second path 820 to perform an existing function.
로봇(100)은 적어도 하나의 이미지를 분석하여 적어도 하나의 이미지의 유형을 분류할 수 있다(S760). 구체적으로, 로봇(100)은 획득된 적어도 하나의 이미지를 분석하여 적어도 하나의 이미지가 촬영된 방향에 대한 정보 또는 적어도 하나의 이미지에 포함된 사용자의 신체 부위에 대한 정보를 획득할 수 있다. 그리고, 로봇(100)은 적어도 하나의 이미지가 촬영된 방향에 대한 정보 또는 적어도 하나의 이미지에 포함된 사용자의 신체 부위에 대한 정보에 기초하여 로봇을 기 저장된 복수의 유형 중 하나의 유형으로 분류할 수 있다. 또한, 로봇(100)은 사용자의 조도 및 피부톤에 기초하여 촬영된 이미지를 분류할 수 있다. 이때, 로봇(100)은 적어도 하나의 이미지를 분석하여 적어도 하나의 이미지의 유형을 분류할 수 있으나, 촬영 당시의 카메라의 자세 및 위치에 대한 정보에 대한 정보를 추정하여 데이터베이스에 함께 저장할 수 있다.The robot 100 may analyze at least one image and classify the type of at least one image (S760). Specifically, the robot 100 may analyze at least one acquired image to obtain information about the direction in which the at least one image was captured or information about the user's body part included in the at least one image. And, the robot 100 classifies the robot into one type among a plurality of pre-stored types based on information about the direction in which at least one image was taken or information about the user's body part included in at least one image. You can. Additionally, the robot 100 may classify the captured image based on the user's illumination level and skin tone. At this time, the robot 100 may analyze at least one image and classify the type of at least one image, and may also estimate information about the posture and position of the camera at the time of shooting and store it in a database.
로봇(100)은 획득된 적어도 하나의 이미지와 이미지의 유형에 대한 정보를 데이터베이스에 저장할 수 있다(S770).The robot 100 may store information about at least one acquired image and the type of the image in a database (S770).
로봇(100)은 데이터베이스에 기설정된 복수의 유형의 이미지가 저장되었는지 여부를 판단할 수 있다(S780). 구체적으로, 로봇(100)은 사용자에 대한 3D 모델을 생성하는데 필요한 기설정된 복수의 유형의 이미지가 모두 저장되었는지 여부를 판단할 수 있다. 예를 들어, 로봇(100)은 3D 모델을 생성하기 위해 필요한 6개 유형(예로, 0도에서 촬영한 유형, 60도에서 촬영한 유형, 120도에서 촬영한 유형, 180도에서 촬영한 유형, 240도에서 촬영한 유형 및 300도에서 촬영한 유형)의 이미지가 모두 저장되었는지 여부를 판단할 수 있다. 이때, 로봇(100)은 한 개의 유형에 기설정된 복수의 개수(예로, 3개)의 이미지가 저장되었는지 여부를 판단할 수 있다.The robot 100 may determine whether a plurality of preset types of images are stored in the database (S780). Specifically, the robot 100 may determine whether all of the plurality of preset types of images needed to create a 3D model for the user have been stored. For example, the robot 100 may have six types needed to create a 3D model (e.g., a type taken at 0 degrees, a type taken at 60 degrees, a type taken at 120 degrees, a type taken at 180 degrees, It is possible to determine whether all images (the type taken at 240 degrees and the type taken at 300 degrees) have been saved. At this time, the robot 100 may determine whether a preset number of images (for example, three) are stored in one type.
데이터베이스에 기설정된 복수의 유형의 이미지가 저장된 경우(S780-Y), 로봇(100)은 데이터베이스에 저장된 이미지들을 이용하여 3D 모델을 생성할 수 있다(S790). 이때, 로봇(100)은 Photogrammetry 기법 또는 Vision 기법 등을 이용하여 사용자(10)에 대한 3D 모델을 생성할 수 있다.When a plurality of preset types of images are stored in the database (S780-Y), the robot 100 can create a 3D model using the images stored in the database (S790). At this time, the robot 100 may create a 3D model for the user 10 using photogrammetry techniques or vision techniques.
데이터베이스에 기설정된 복수의 유형의 이미지가 저장되지 않은 경우(S780-N), 로봇(100)은 다시 사용자의 이미지를 획득하기 위하여, S720 단계 내지 S780 단계를 반복할 수 있다. 이때, 로봇(100)은 S730 단계에서 로봇(100)에 저장되지 않는 유형의 이미지에 대응되는 촬영 각도로 촬영할 수 있도록 로봇의 촬영 위치를 추정할 수 있다. If the plurality of preset types of images are not stored in the database (S780-N), the robot 100 may repeat steps S720 to S780 to acquire the user's image again. At this time, the robot 100 may estimate the shooting position of the robot so that it can shoot at a shooting angle corresponding to a type of image that is not stored in the robot 100 in step S730.
한편, 상술한 실시예에서는 사용자의 촬영 각도에 따라 이미지의 유형이 분류되는 것으로 설명하였으나, 이는 일 실시예에 불과할 뿐, 이미지 포함된 사용자의 신체 부위에 따라 이미지의 유형이 분류될 수 있다. 예를 들어, 로봇(100)은 사용자의 얼굴, 몸통이 포함된 제1 유형, 사용자의 왼쪽 옆모습과 왼쪽 팔, 왼쪽 다리를 포함하는 제2 유형, 사용자의 뒷모습, 등, 엉덩이를 포함하는 제3 유형, 사용자의 오른쪽 옆모습과 오른쪽 팔, 오른쪽 다리를 포함하는 제4 유형으로 이미지를 분류할 수 있다.Meanwhile, in the above-described embodiment, it was explained that the type of image is classified according to the user's shooting angle, but this is only an example, and the type of image may be classified according to the body part of the user included in the image. For example, the robot 100 includes a first type including the user's face and torso, a second type including the user's left side profile, left arm, and left leg, and a third type including the user's back, back, and buttocks. Images can be classified into a fourth type, which includes the user's right side profile, right arm, and right leg.
도 9는 본 개시의 일 실시예에 따른, 제2 3D 모델 생성 모드로 동작하는 동안 3D 모델의 품질에 따라 3D 모델을 업데이트 하는 방법을 설명하기 위한 흐름도이다.FIG. 9 is a flowchart illustrating a method of updating a 3D model according to the quality of the 3D model while operating in a second 3D model creation mode, according to an embodiment of the present disclosure.
우선, 로봇(100)은 복수의 투영 이미지를 획득할 수 있다(S910). 이때, 복수의 투영 이미지는 데이터베이스에 저장된 복수의 이미지의 유형에 대응되는 각도에서 3D 모델을 2D로 투영한 이미지일 수 있다. First, the robot 100 can acquire a plurality of projection images (S910). At this time, the plurality of projection images may be images obtained by projecting a 3D model into 2D at an angle corresponding to the type of the plurality of images stored in the database.
그리고, 로봇(100)은 복수의 유형의 이미지와 복수의 유형의 이미지와 대응되는 복수의 투영 이미지를 비교할 수 있다(S920). 이때, 로봇(100)은 복수의 이미지 중 사용자의 정면을 기준으로 제1 각도에서 촬영된 제1 이미지(즉, 제1 유형의 이미지)에 포함된 복수의 제1 특징점과 복수의 투영 이미지 중 3D 모델을 제1 각도 방향에서 투영한 제1 투영 이미지에 포함된 복수의 제2 특징점을 비교할 수 있다. 이와 같은 방식으로, 로봇(100)은 복수의 유형의 이미지에 포함된 복수의 제1 특징점을 대응되는 투영 이미지에 포함된 복수의 제2 특징점과 비교할 수 있다.Additionally, the robot 100 may compare a plurality of types of images and a plurality of projection images corresponding to the plurality of types of images (S920). At this time, the robot 100 uses a plurality of first feature points included in a first image (i.e., a first type of image) taken at a first angle based on the front of the user among the plurality of images and a 3D image among the plurality of projection images. A plurality of second feature points included in a first projection image that projects the model in a first angular direction may be compared. In this way, the robot 100 can compare a plurality of first feature points included in a plurality of types of images with a plurality of second feature points included in the corresponding projection image.
로봇(100)은 비교 결과에 기초하여 3D 모델의 품질값을 획득할 수 있다(S930). 구체적으로, 로봇(100)은 복수의 이미지와 복수의 이미지와 대응되는 복수의 투영 이미지를 비교할 수 있다. 구체적으로, 로봇(100)은 제1 유형의 이미지의 복수의 특징점(머리의 일 지점, 왼쪽 어깨의 일 지점, 왼 손의 일 지점, 왼 발의 일 지점)과 제1 유형의 이미지에 대응되는 제1 투영 이미지의 복수의 특징점(머리의 일 지점, 왼쪽 어깨의 일 지점, 왼 손의 일 지점, 왼 발의 일 지점)에 대해 대응되는 픽셀 간의 픽셀 차이값을 산출할 수 있다. 그리고, 로봇(100)은 픽셀 차이값에 기초하여 3D 모델을 생성하는데 이용된 이미지의 품질값을 획득할 수 있다. 구체적으로, 로봇(100)은 픽셀 차이값이 클수록 품질값을 낮게 획득할 수 있으며, 픽셀 차이값이 작을수록 품질값을 높게 획득할 수 있다. 상술한 바와 같은 방법으로, 로봇(100)은 3D 모델을 생성하는데 이용된 복수의 유형의 이미지 각각에 대한 품질값을 획득하여, 3D 모델의 품질값을 획득할 수 있다.The robot 100 may obtain the quality value of the 3D model based on the comparison result (S930). Specifically, the robot 100 may compare a plurality of images and a plurality of projection images corresponding to the plurality of images. Specifically, the robot 100 includes a plurality of feature points (a point on the head, a point on the left shoulder, a point on the left hand, and a point on the left foot) of the first type of image and a first type of image corresponding to the first type of image. 1 The pixel difference value between the pixels corresponding to a plurality of feature points of the projection image (a point on the head, a point on the left shoulder, a point on the left hand, and a point on the left foot) can be calculated. And, the robot 100 can obtain the quality value of the image used to create the 3D model based on the pixel difference value. Specifically, the robot 100 can obtain a lower quality value as the pixel difference value increases, and obtain a higher quality value as the pixel difference value decreases. In the same manner as described above, the robot 100 can obtain the quality value of the 3D model by obtaining quality values for each of a plurality of types of images used to generate the 3D model.
그러나, 이는 일 실시예에 불과할 뿐, 로봇(100)은 이미지와 투영 이미지 사이의 유사도를 측정하여 3D 모델의 품질값을 획득할 수 있음은 물론이다. 또는, 로봇(100)은 이미지와 투영 이미지를 입력하여 품질값을 획득하도록 학습된 신경망 모델을 이용하여 3D 모델의 품질값을 획득할 수 있다. 즉, 로봇(100)은 신경망 모델에 이미지와 투영 이미지를 입력하여 3D 모델의 품질값을 획득할 수 있다. However, this is only an example, and of course, the robot 100 can obtain the quality value of the 3D model by measuring the similarity between the image and the projected image. Alternatively, the robot 100 may obtain the quality value of the 3D model using a neural network model learned to obtain the quality value by inputting an image and a projection image. That is, the robot 100 can obtain the quality value of the 3D model by inputting an image and a projection image into the neural network model.
로봇(100)은 품질값이 임계값 미만인지 여부를 판단할 수 있다(S940). The robot 100 may determine whether the quality value is less than the threshold (S940).
품질값이 임계값 이상인 경우(S940-N), 로봇(100)은 기존에 생성된 3D 모델을 이용하여 아바타를 생성할 수 있다.If the quality value is greater than or equal to the threshold (S940-N), the robot 100 can create an avatar using an existing 3D model.
품질값이 임계값 미만인 경우(S940-Y), 로봇(100)은 로봇의 촬영 위치를 재설정할 수 있다(S950). 이때, 로봇(100)은 이미지와 투영 이미지의 오차의 크기에 기초하여 로봇의 촬영 간격 또는 촬영 위치를 재설정할 수 있다. 즉, 로봇(100)은 이미지와 투영 이미지 사이의 오차의 크기가 큰 촬영 각도에서 재촬영을 하도록 촬영 위치를 재설정할 수 있다. 이에 따라, 로봇(100)은 다른 기능을 수행하는 동안 이미지와 투영 이미지 사이의 오차의 크기가 큰 촬영 각도에서 재촬영을 하도록 주행 경로를 변경하여 촬영 위치를 추정할 수 있다.If the quality value is less than the threshold (S940-Y), the robot 100 may reset the robot's shooting position (S950). At this time, the robot 100 may reset the robot's shooting interval or shooting position based on the size of the error between the image and the projected image. In other words, the robot 100 can reset the capturing position to re-photograph at an angle where the error between the image and the projected image is large. Accordingly, while performing another function, the robot 100 can estimate the shooting position by changing the driving path to retake the image at an angle where the error between the image and the projected image is large.
로봇(100)은 재설정된 촬영 위치에서 사용자를 촬영하여 복수의 재설정 이미지를 획득할 수 있다(S960). The robot 100 may obtain a plurality of reset images by photographing the user at the reset shooting location (S960).
그리고, 로봇(100)은 복수의 재설정 이미지에 기초하여 3D 모델을 업데이트할 수 있다(S970). 구체적으로, 로봇(100)은 복수의 재설정 이미지에 기초하여 3D 모델을 재생성하여 기존의 3D 모델을 업데이트할 수 있다.And, the robot 100 may update the 3D model based on the plurality of reset images (S970). Specifically, the robot 100 may update the existing 3D model by regenerating the 3D model based on a plurality of reset images.
즉, 로봇(100)은 기존의 3D 모델의 품질을 분석하여 3D 모델의 품질을 개선시킬 수 있는 카메라의 위치 및 방향을 추정하고, 로봇(100)이 다른 기능을 수행하면서 주행하는 동안 추적하고 있는 사용자에 대해, 3D 모델 품질을 개선시킬 수 있는 위치 및 방향을 결정하고, 해당 위치 및 방향에서 촬영하여 얻은 이미지로 3D 모델을 업데이트(또는 개선)시킬 수 있다. 또한, 로봇(100)은 평소 주행하면서 상술한 과정을 반복하여 사용자에 대한 3D 모델을 지속적으로 개선시킬 수 있다.That is, the robot 100 analyzes the quality of the existing 3D model, estimates the position and direction of the camera that can improve the quality of the 3D model, and tracks the camera while the robot 100 drives while performing other functions. For the user, a location and direction that can improve the quality of the 3D model can be determined, and the 3D model can be updated (or improved) with images obtained by shooting at that location and direction. Additionally, the robot 100 can continuously improve the 3D model for the user by repeating the above-described process while driving.
또한, 로봇(100)은 주행 중 사용자를 인식하고, 인식된 사용자의 얼굴이나 모션에 대한 정보를 획득할 수 있다. 그리고, 로봇(100)은 획득된 사용자의 얼굴이나 모션에 대한 정보에 기초하여 3D 모델의 표정 또는 모션을 생성할 수 있다. 이에 대해서는 도 10 및 도 11을 참조하여 더욱 상세히 설명하기로 한다.Additionally, the robot 100 can recognize a user while driving and obtain information about the face or motion of the recognized user. Additionally, the robot 100 may generate the facial expression or motion of the 3D model based on the acquired information about the user's face or motion. This will be described in more detail with reference to FIGS. 10 and 11.
도 10은 본 개시의 일 실시예에 따른, 3D 모델의 얼굴 표정을 생성하는 방법을 설명하기 위한 흐름도이다.FIG. 10 is a flowchart illustrating a method for generating facial expressions of a 3D model, according to an embodiment of the present disclosure.
우선, 로봇(100)은 사용자를 인식할 수 있다(S1010). 구체적으로, 로봇(100)은 로봇(100)의 다른 기능을 수행하는 상태에서 주행 중 사용자를 인식할 수 있다. 또는 로봇(100)은 제1 3D 모델 생성 모드 또는 제2 3D 모델 생성 모드로 동작하는 동안 사용자를 인식할 수 있다. 이때, 로봇(100)은 사용자의 얼굴, 홍채, 음성 등을 인식하여 사용자를 인식할 수 있다.First, the robot 100 can recognize the user (S1010). Specifically, the robot 100 may recognize the user while driving while performing other functions of the robot 100. Alternatively, the robot 100 may recognize the user while operating in the first 3D model creation mode or the second 3D model creation mode. At this time, the robot 100 can recognize the user by recognizing the user's face, iris, voice, etc.
로봇(100)은 사용자 얼굴을 촬영하여 얼굴 이미지를 획득할 수 있다(S1020). 구체적으로, 로봇(100)은 인식된 사용자를 촬영하여 사용자의 얼굴 이미지를 획득할 수 있다.The robot 100 may acquire a facial image by photographing the user's face (S1020). Specifically, the robot 100 may obtain a face image of a recognized user by photographing the user.
로봇(100)은 얼굴 이미지를 분석하여 얼굴 이미지에 대응되는 표정 유형을 획득할 수 있다(S1030). 이때, 로봇(100)은 얼굴 이미지에 포함된 특징점(예를 들어, 눈, 코, 입 등)을 분석하여 얼굴 이미지에 대응되는 표정 유형에 대한 정보를 획득할 수 있다. 또는 로봇(100)은 얼굴 이미지를 학습된 신경망 모델에 입력하여 얼굴 이미지에 대응되는 표정 유형에 대한 정보를 획득할 수 있다.The robot 100 may analyze the face image and obtain the expression type corresponding to the face image (S1030). At this time, the robot 100 may acquire information about the type of expression corresponding to the facial image by analyzing feature points (eg, eyes, nose, mouth, etc.) included in the facial image. Alternatively, the robot 100 may obtain information about the type of expression corresponding to the face image by inputting the face image into a learned neural network model.
로봇(100)은 획득된 얼굴 이미지와 표정 유형에 대한 정보를 데이터베이스에 저장할 수 있다(S1040). 이때, 로봇(100)은 얼굴 표정뿐만 아니라 얼굴의 피부 톤 등과 같은 부가 정보를 함께 저장할 수 있다.The robot 100 may store information about the acquired facial image and expression type in a database (S1040). At this time, the robot 100 may store not only facial expressions but also additional information such as facial skin tone.
로봇(100)은 데이터베이스에 저장된 표정 유형별 얼굴 이미지에 기초하여 3D 모델의 얼굴 표정을 생성할 수 있다(S1050. 이때, 로봇(100)은 사용자 입력에 따라 3D 모델의 얼굴 표정을 최종 생성할 수 있다. 한편, 로봇(100)은 Photogrammetry 기법 또는 Vision 기법 등을 이용하여 3D 모델의 얼굴 표정을 생성할 수 있다.The robot 100 can generate the facial expression of the 3D model based on the facial image for each expression type stored in the database (S1050. At this time, the robot 100 can finally generate the facial expression of the 3D model according to the user input. Meanwhile, the robot 100 can generate facial expressions of a 3D model using photogrammetry techniques or vision techniques.
도 11은 본 개시의 일 실시예에 따른, 3D 모델의 모션을 생성하는 방법을 설명하기 위한 흐름도이다.FIG. 11 is a flowchart illustrating a method for generating motion of a 3D model according to an embodiment of the present disclosure.
우선, 로봇(100)은 사용자를 인식할 수 있다(S1110). 구체적으로, 로봇(100)은 로봇(100)의 다른 기능을 수행하는 상태에서 주행 중 사용자를 인식할 수 있다. 또는 로봇(100)은 제1 3D 모델 생성 모드 또는 제2 3D 모델 생성 모드로 동작하는 동안 사용자를 인식할 수 있다. 이때, 로봇(100)은 사용자의 얼굴, 홍채, 음성 등을 인식하여 사용자를 인식할 수 있다.First, the robot 100 can recognize the user (S1110). Specifically, the robot 100 may recognize the user while driving while performing other functions of the robot 100. Alternatively, the robot 100 may recognize the user while operating in the first 3D model creation mode or the second 3D model creation mode. At this time, the robot 100 can recognize the user by recognizing the user's face, iris, voice, etc.
로봇(100)은 사용자를 촬영하여 모션 이미지를 획득할 수 있다(S1120). 이때, 로봇(100)은 이동하면서 사용자의 모션을 촬영하여 모션 이미지를 획득할 수 있다.The robot 100 may acquire a motion image by photographing the user (S1120). At this time, the robot 100 may obtain a motion image by filming the user's motion while moving.
로봇(100)은 모션 이미지를 분석하여 모션 이미지에 대응되는 모션 유형을 획득할 수 있다(S1130). 이때, 로봇(100)은 모션 이미지에 포함된 특징점(예를 들어, 팔, 다리, 몸통, 얼굴 등)을 분석하여 모션 이미지에 대응되는 모션 유형에 대한 정보를 획득할 수 있다. 또는, 로봇(100)은 모션 이미지를 학습된 신경망 모델에 입력하여 모션 이미지에 대응되는 모션 유형에 대한 정보를 획득할 수 있다. The robot 100 may analyze the motion image and obtain a motion type corresponding to the motion image (S1130). At this time, the robot 100 may acquire information about the motion type corresponding to the motion image by analyzing feature points (eg, arms, legs, torso, face, etc.) included in the motion image. Alternatively, the robot 100 may obtain information about the motion type corresponding to the motion image by inputting the motion image into a learned neural network model.
로봇(100)은 획득된 모션 이미지와 모션 유형에 대한 정보를 데이터베이스에 저장할 수 있다(S1140). The robot 100 may store information about the acquired motion image and motion type in a database (S1140).
로봇(100)은 데이터베이스에 저장된 모션 유형 별 모션 이미지에 기초하여 3D 모델의 모션을 생성할 수 있다(S1150). 이때, 로봇(100)은 사용자가 검색한 모션에 따라 3D 모델에 사용자의 모션을 적용할 수 있다. 한편, 로봇(100)은 모션 캡쳐 관련 그래픽스 기법 등을 이용하여 3D 모델에 사용자의 모션을 적용할 수 있다. The robot 100 may generate motion of a 3D model based on motion images for each motion type stored in the database (S1150). At this time, the robot 100 may apply the user's motion to the 3D model according to the motion searched by the user. Meanwhile, the robot 100 can apply the user's motion to the 3D model using motion capture-related graphics techniques.
한편, 본 개시에 따른 인공지능과 관련된 기능(예로, 신경망 모델에 대한 학습 기능 및 추론 기능)은 로봇의 적어도 하나의 프로세서와 메모리를 통해 동작된다.Meanwhile, functions related to artificial intelligence (eg, learning function and inference function for a neural network model) according to the present disclosure are operated through at least one processor and memory of the robot.
프로세서는 하나 또는 복수의 프로세서로 구성될 수 있다. 이때, 하나 또는 복수의 프로세서는 CPU(Central Processing Unit), GPU(Graphic Processing Unit), NPU(Neural Processing Unit) 중 적어도 하나를 포함할 수 있으나 전술한 프로세서의 예시에 한정되지 않는다.The processor may consist of one or multiple processors. At this time, one or more processors may include at least one of a Central Processing Unit (CPU), a Graphics Processing Unit (GPU), and a Neural Processing Unit (NPU), but are not limited to the examples of the processors described above.
CPU는 일반 연산뿐만 아니라 인공지능 연산을 수행할 수 있는 범용 프로세서로서, 다계층 캐시(Cache) 구조를 통해 복잡한 프로그램을 효율적으로 실행할 수 있다. CPU는 순차적인 계산을 통해 이전 계산 결과와 다음 계산 결과의 유기적인 연계가 가능하도록 하는 직렬 처리 방식에 유리하다. 범용 프로세서는 전술한 CPU로 명시한 경우를 제외하고 전술한 예에 한정되지 않는다.CPU is a general-purpose processor that can perform not only general calculations but also artificial intelligence calculations, and can efficiently execute complex programs through a multi-layer cache structure. CPUs are advantageous for serial processing, which allows organic connection between previous and next calculation results through sequential calculations. The general-purpose processor is not limited to the above-described examples, except where specified as the above-described CPU.
GPU는 그래픽 처리에 이용되는 부동 소수점 연산 등과 같은 대량 연산을 위한 프로세서로서, 코어를 대량으로 집적하여 대규모 연산을 병렬로 수행할 수 있다. 특히, GPU는 CPU에 비해 컨볼루션(Convolution) 연산 등과 같은 병렬 처리 방식에 유리할 수 있다. 또한, GPU는 CPU의 기능을 보완하기 위한 보조 프로세서(co-processor)로 이용될 수 있다. 대량 연산을 위한 프로세서는 전술한 GPU로 명시한 경우를 제외하고 전술한 예에 한정되지 않는다. GPU is a processor for large-scale operations such as floating-point operations used in graphics processing, and can perform large-scale operations in parallel by integrating a large number of cores. In particular, GPUs may be more advantageous than CPUs in parallel processing methods such as convolution operations. Additionally, the GPU can be used as a co-processor to supplement the functions of the CPU. The processor for mass computation is not limited to the above-described example, except for the case specified as the above-described GPU.
NPU는 인공 신경망을 이용한 인공지능 연산에 특화된 프로세서로서, 인공 신경망을 구성하는 각 레이어를 하드웨어(예로, 실리콘)로 구현할 수 있다. 이때, NPU는 업체의 요구 사양에 따라 특화되어 설계되므로, CPU나 GPU에 비해 자유도가 낮으나, 업체가 요구하기 위한 인공지능 연산을 효율적으로 처리할 수 있다. 한편, 인공지능 연산에 특화된 프로세서로, NPU는 TPU(Tensor Processing Unit), IPU(Intelligence Processing Unit), VPU(Vision processing unit) 등과 같은 다양한 형태로 구현 될 수 있다. 인공 지능 프로세서는 전술한 NPU로 명시한 경우를 제외하고 전술한 예에 한정되지 않는다.NPU is a processor specialized in artificial intelligence calculations using artificial neural networks, and each layer that makes up the artificial neural network can be implemented in hardware (e.g., silicon). At this time, the NPU is designed specifically according to the company's requirements, so it has a lower degree of freedom than a CPU or GPU, but can efficiently process artificial intelligence calculations requested by the company. Meanwhile, as a processor specialized for artificial intelligence calculations, NPU can be implemented in various forms such as TPU (Tensor Processing Unit), IPU (Intelligence Processing Unit), and VPU (Vision processing unit). The artificial intelligence processor is not limited to the examples described above, except where specified as the NPU described above.
또한, 하나 또는 복수의 프로세서는 SoC(System on Chip)으로 구현될 수 있다. 이때, SoC에는 하나 또는 복수의 프로세서 이외에 메모리, 및 프로세서와 메모리 사이의 데이터 통신을 위한 버스(Bus) 등과 같은 네트워크 인터페이스를 더 포함할 수 있다. Additionally, one or more processors may be implemented as a System on Chip (SoC). At this time, in addition to one or more processors, the SoC may further include memory and a network interface such as a bus for data communication between the processor and memory.
로봇(100)에 포함된 SoC(System on Chip)에 복수의 프로세서가 포함된 경우, 로봇(100)은 복수의 프로세서 중 일부 프로세서를 이용하여 인공지능과 관련된 연산(예를 들어, 인공지능 모델의 학습(learning)이나 추론(inference)에 관련된 연산)을 수행할 수 있다. 예를 들어, 로봇(100)은 복수의 프로세서 중 컨볼루션 연산, 행렬 곱 연산 등과 같은 인공지능 연산에 특화된 GPU, NPU, VPU, TPU, 하드웨어 가속기 중 적어도 하나를 이용하여 인공지능과 관련된 연산을 수행할 수 있다. 다만, 이는 일 실시예에 불과할 뿐, CPU 등과 범용 프로세서를 이용하여 인공지능과 관련된 연산을 처리할 수 있음은 물론이다. If the SoC (System on Chip) included in the robot 100 includes a plurality of processors, the robot 100 uses some of the plurality of processors to perform artificial intelligence-related operations (for example, Operations related to learning or inference) can be performed. For example, the robot 100 performs artificial intelligence-related operations using at least one of a GPU, NPU, VPU, TPU, or hardware accelerator specialized for artificial intelligence operations such as convolution operation, matrix multiplication operation, etc. among a plurality of processors. can do. However, this is only an example, and of course, calculations related to artificial intelligence can be processed using general-purpose processors such as CPUs.
또한, 로봇(100)은 하나의 프로세서에 포함된 멀티 코어(예를 들어, 듀얼 코어, 쿼드 코어 등)를 이용하여 인공지능과 관련된 기능에 대한 연산을 수행할 수 있다. 특히, 로봇(100)은 프로세서에 포함된 멀티 코어를 이용하여 병렬적으로 컨볼루션 연산, 행렬 곱 연산 등과 같은 인공 지능 연산을 수행할 수 있다. Additionally, the robot 100 may perform calculations on functions related to artificial intelligence using multiple cores (eg, dual core, quad core, etc.) included in one processor. In particular, the robot 100 can perform artificial intelligence operations such as convolution operations and matrix multiplication operations in parallel using multi-cores included in the processor.
하나 또는 복수의 프로세서는, 메모리에 저장된 기정의된 동작 규칙 또는 인공지능 모델에 따라, 입력 데이터를 처리하도록 제어한다. 기정의된 동작 규칙 또는 인공지능 모델은 학습을 통해 만들어진 것을 특징으로 한다. One or more processors control input data to be processed according to predefined operation rules or artificial intelligence models stored in memory. Predefined operation rules or artificial intelligence models are characterized by being created through learning.
여기서, 학습을 통해 만들어진다는 것은, 다수의 학습 데이터들에 학습 알고리즘을 적용함으로써, 원하는 특성의 기정의된 동작 규칙 또는 인공지능 모델이 만들어짐을 의미한다. 이러한 학습은 본 개시에 따른 인공지능이 수행되는 기기 자체에서 이루어질 수도 있고, 별도의 서버/시스템을 통해 이루어 질 수도 있다. Here, being created through learning means that a predefined operation rule or artificial intelligence model with desired characteristics is created by applying a learning algorithm to a large number of learning data. This learning may be performed on the device itself that performs the artificial intelligence according to the present disclosure, or may be performed through a separate server/system.
인공지능 모델은, 복수의 신경망 레이어들로 구성될 수 있다. 적어도 하나의 레이어는 적어도 하나의 가중치(weight values)을 갖고 있으며, 이전(previous) 레이어의 연산 결과와 적어도 하나의 정의된 연산을 통해 레이어의 연산을 수행한다. 신경망의 예로는, CNN (Convolutional Neural Network), DNN (Deep Neural Network), RNN (Recurrent Neural Network), RBM (Restricted Boltzmann Machine), DBN (Deep Belief Network), BRDNN(Bidirectional Recurrent Deep Neural Network) 및 심층 Q-네트워크 (Deep Q-Networks), Transformer가 있으며, 본 개시에서의 신경망은 명시한 경우를 제외하고 전술한 예에 한정되지 않는다.An artificial intelligence model may be composed of multiple neural network layers. At least one layer has at least one weight value, and the operation of the layer is performed using the operation result of the previous layer and at least one defined operation. Examples of neural networks include Convolutional Neural Network (CNN), Deep Neural Network (DNN), Recurrent Neural Network (RNN), Restricted Boltzmann Machine (RBM), Deep Belief Network (DBN), Bidirectional Recurrent Deep Neural Network (BRDNN), and Deep Neural Network (BRDNN). There are Q-Networks (Deep Q-Networks) and Transformer, and the neural network in this disclosure is not limited to the above-described examples except where specified.
학습 알고리즘은, 다수의 학습 데이터들을 이용하여 소정의 대상 기기(예컨대, 로봇)을 훈련시켜 소정의 대상 기기 스스로 결정을 내리거나 예측을 할 수 있도록 하는 방법이다. 학습 알고리즘의 예로는, 지도형 학습(supervised learning), 비지도형 학습(unsupervised learning), 준지도형 학습(semi-supervised learning) 또는 강화 학습(reinforcement learning)이 있으며, 본 개시에서의 학습 알고리즘은 명시한 경우를 제외하고 전술한 예에 한정되지 않는다.A learning algorithm is a method of training a target device (eg, a robot) using a large number of learning data so that the target device can make decisions or make predictions on its own. Examples of learning algorithms include supervised learning, unsupervised learning, semi-supervised learning, or reinforcement learning, and the learning algorithm in the present disclosure is specified. Except, it is not limited to the examples described above.
또한, 본 개시의 다양한 실시 예들에 따른 방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 상품으로서 판매자 및 구매자 간에 거래될 수 있다. 컴퓨터 프로그램 제품은 기기로 읽을 수 있는 저장 매체(예: compact disc read only memory (CD-ROM))의 형태로 배포되거나, 또는 어플리케이션 스토어(예: 플레이 스토어TM)를 통해 또는 두개의 사용자 장치들(예: 스마트폰들) 간에 직접, 온라인으로 배포(예: 다운로드 또는 업로드)될 수 있다. 온라인 배포의 경우에, 컴퓨터 프로그램 제품(예: 다운로더블 앱(downloadable app))의 적어도 일부는 제조사의 서버, 어플리케이션 스토어의 서버, 또는 중계 서버의 메모리와 같은 기기로 읽을 수 있는 저장 매체에 적어도 일시 저장되거나, 임시적으로 생성될 수 있다.Additionally, methods according to various embodiments of the present disclosure may be included and provided in a computer program product. Computer program products are commodities and can be traded between sellers and buyers. The computer program product may be distributed in the form of a machine-readable storage medium (e.g. compact disc read only memory (CD-ROM)) or through an application store (e.g. Play StoreTM) or on two user devices (e.g. It can be distributed (e.g. downloaded or uploaded) directly between smartphones) or online. In the case of online distribution, at least a portion of the computer program product (e.g., a downloadable app) is stored on a machine-readable storage medium, such as the memory of a manufacturer's server, an application store's server, or a relay server. It can be temporarily stored or created temporarily.
본 개시의 다양한 실시 예에 따른 방법은 기기(machine)(예: 컴퓨터)로 읽을 수 있는 저장 매체(machine-readable storage media에 저장된 명령어를 포함하는 소프트웨어로 구현될 수 있다. 기기는 저장 매체로부터 저장된 명령어를 호출하고, 호출된 명령어에 따라 동작이 가능한 장치로서, 개시된 실시 예들에 따른 전자 장치(예: 로봇(100))를 포함할 수 있다. Methods according to various embodiments of the present disclosure may be implemented as software including instructions stored in a machine-readable storage media (e.g., a computer). The device stores information stored from the storage medium. A device capable of calling a command and operating according to the called command may include an electronic device (eg, the robot 100) according to the disclosed embodiments.
한편, 기기로 읽을 수 있는 저장매체는, 비일시적(non-transitory) 저장매체의 형태로 제공될 수 있다. 여기서, '비일시적 저장매체'는 실재(tangible)하는 장치이고, 신호(signal)(예: 전자기파)를 포함하지 않는다는 것을 의미할 뿐이며, 이 용어는 데이터가 저장매체에 반영구적으로 저장되는 경우와 임시적으로 저장되는 경우를 구분하지 않는다. 예로, '비일시적 저장매체'는 데이터가 임시적으로 저장되는 버퍼를 포함할 수 있다.Meanwhile, a storage medium that can be read by a device may be provided in the form of a non-transitory storage medium. Here, 'non-transitory storage medium' only means that it is a tangible device and does not contain signals (e.g. electromagnetic waves). This term refers to cases where data is semi-permanently stored in a storage medium and temporary storage media. It does not distinguish between cases where it is stored as . For example, a 'non-transitory storage medium' may include a buffer where data is temporarily stored.
상기 명령이 프로세서에 의해 실행될 경우, 프로세서가 직접 또는 상기 프로세서의 제어 하에 다른 구성요소들을 이용하여 상기 명령에 해당하는 기능을 수행할 수 있다. 명령은 컴파일러 또는 인터프리터에 의해 생성 또는 실행되는 코드를 포함할 수 있다. When the instruction is executed by a processor, the processor may perform the function corresponding to the instruction directly or using other components under the control of the processor. Instructions may contain code generated or executed by a compiler or interpreter.
이상에서는 본 개시의 바람직한 실시 예에 대하여 도시하고 설명하였지만, 본 개시는 상술한 특정의 실시 예에 한정되지 아니하며, 청구범위에서 청구하는 본 개시의 요지를 벗어남이 없이 당해 개시가 속하는 기술분야에서 통상의 지식을 가진 자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 개시의 기술적 사상이나 전망으로부터 개별적으로 이해되어서는 안 될 것이다.In the above, preferred embodiments of the present disclosure have been shown and described, but the present disclosure is not limited to the specific embodiments described above, and may be used in the technical field to which the disclosure pertains without departing from the gist of the disclosure as claimed in the claims. Of course, various modifications can be made by those skilled in the art, and these modifications should not be understood individually from the technical ideas or perspectives of the present disclosure.

Claims (15)

  1. 3D 모델을 생성하는 로봇에 있어서,In a robot that creates a 3D model,
    주행부;Running part;
    적어도 하나의 카메라;At least one camera;
    출력부;output unit;
    맵을 저장하는 메모리; 및Memory to store maps; and
    상기 주행부, 상기 적어도 하나의 카메라, 상기 출력부 및 상기 메모리와 연결되며, 상기 로봇을 제어하는 적어도 하나의 프로세서;를 포함하며,At least one processor connected to the traveling unit, the at least one camera, the output unit, and the memory, and controlling the robot,
    상기 적어도 하나의 프로세서는,The at least one processor,
    사용자에 대한 3D 모델을 생성하는 제1 모드에 진입하면, 상기 맵에 기초하여 상기 사용자에 대한 3D 모델을 생성하기 위한 촬영 장소를 식별하고,Upon entering the first mode for creating a 3D model for the user, identifying a shooting location for generating a 3D model for the user based on the map,
    상기 사용자에게 상기 식별된 촬영 장소로 이동하라는 메시지를 출력하도록 상기 출력부를 제어하며,Controlling the output unit to output a message to the user to move to the identified shooting location,
    상기 사용자가 상기 촬영 장소에 위치하면, 상기 사용자를 촬영하기 위한 촬영 경로를 획득하며,When the user is located at the shooting location, a shooting path for shooting the user is obtained,
    상기 주행부를 통해 상기 촬영 경로를 따라 이동하는 동안 기설정된 촬영 간격으로 상기 카메라를 통해 상기 사용자를 촬영하여 복수의 이미지를 획득하고,Obtaining a plurality of images by photographing the user through the camera at preset photographing intervals while moving along the photographing path through the traveling unit,
    상기 획득된 복수의 이미지에 기초하여 상기 사용자에 대한 3D 모델을 생성하는 로봇.A robot that generates a 3D model for the user based on the acquired plurality of images.
  2. 제1항에 있어서,According to paragraph 1,
    상기 적어도 하나의 프로세서는,The at least one processor,
    상기 생성된 3D 모델을 2D로 투영하여 복수의 투영 이미지를 획득하고,Obtaining a plurality of projection images by projecting the generated 3D model into 2D,
    상기 복수의 이미지와 상기 복수의 이미지와 대응되는 복수의 투영 이미지를 비교하며,Comparing the plurality of images with a plurality of projection images corresponding to the plurality of images,
    상기 비교 결과를 바탕으로 상기 3D 모델의 품질값을 측정하는 로봇A robot that measures the quality value of the 3D model based on the comparison results
  3. 제2항에 있어서,According to paragraph 2,
    상기 적어도 하나의 프로세서는,The at least one processor,
    상기 복수의 이미지 중 사용자의 정면을 기준으로 제1 각도에서 촬영된 제1 이미지에 포함된 복수의 제1 특징점의 픽셀과 상기 복수의 투영 이미지 중 상기 3D 모델을 상기 제1 각도 방향에서 투영한 제1 투영 이미지에 포함된 복수의 제2 특징점의 픽셀을 비교하여 픽셀 차이값을 산출하며,Pixels of a plurality of first feature points included in a first image taken at a first angle with respect to the front of the user among the plurality of images and a first projection of the 3D model in the first angle direction among the plurality of projection images 1 Compare pixels of a plurality of second feature points included in the projection image to calculate a pixel difference value,
    상기 산출된 픽셀 차이값에 기초하여 상기 3D 모델의 품질값을 측정하는 로봇.A robot that measures the quality value of the 3D model based on the calculated pixel difference value.
  4. 제3항에 있어서,According to paragraph 3,
    상기 적어도 하나의 프로세서는,The at least one processor,
    상기 3D 모델의 품질값이 임계값 미만인 경우, 상기 로봇의 촬영 간격 또는 촬영 위치를 재설정하고,If the quality value of the 3D model is less than the threshold, reset the shooting interval or shooting position of the robot,
    상기 주행부를 통해 상기 촬영 경로를 따라 이동하는 동안 상기 재설정된 촬영 간격 또는 촬영 위치에서 상기 사용자를 촬영하여 복수의 재설정 이미지를 획득하고,Obtaining a plurality of reset images by photographing the user at the reset photographing interval or photographing position while moving along the photographing path through the traveling unit,
    상기 획득된 복수의 재설정 이미지에 기초하여 상기 사용자에 대한 3D 모델을 업데이트하는 로봇.A robot that updates a 3D model for the user based on the acquired plurality of reset images.
  5. 제1항에 있어서,According to paragraph 1,
    상기 적어도 하나의 프로세서는,The at least one processor,
    사용자에 대한 3D 모델을 생성하는 제2 모드에 진입하면, 상기 로봇이 주행하는 동안 상기 사용자를 인식하고,Upon entering the second mode of generating a 3D model for the user, the robot recognizes the user while driving,
    상기 인식된 사용자의 위치에 대한 정보에 기초하여 상기 로봇의 촬영 위치를 추정하며,Estimate the shooting location of the robot based on information about the recognized user's location,
    상기 추정된 위치로 상기 로봇을 이동하도록 상기 주행부를 제어하고,Controlling the traveling unit to move the robot to the estimated position,
    상기 추정된 위치에서 상기 카메라를 통해 적어도 하나의 이미지를 획득하며,Obtaining at least one image through the camera at the estimated location,
    상기 적어도 하나의 이미지를 분석하여 상기 적어도 하나의 이미지의 유형을 분류하여 데이터베이스에 저장하는 로봇.A robot that analyzes the at least one image, classifies the type of the at least one image, and stores it in a database.
  6. 제5항에 있어서,According to clause 5,
    상기 적어도 하나의 프로세서는,The at least one processor,
    상기 데이터베이스에 기설정된 복수의 유형의 이미지가 저장되면, 상기 저장된 복수의 유형의 이미지의 기초하여 상기 사용자에 대한 3D 모델을 생성하는 로봇.A robot that, when a plurality of preset types of images are stored in the database, creates a 3D model for the user based on the plurality of types of stored images.
  7. 제6항에 있어서,According to clause 6,
    상기 적어도 하나의 프로세서는,The at least one processor,
    상기 복수의 유형 중 저장되지 않은 유형의 이미지가 존재하면, 상기 저장되지 않는 유형의 이미지에 대응되는 촬영 각도로 촬영할 수 있도록 상기 로봇의 촬영 위치를 추정하는 로봇.If there is an image of an unstored type among the plurality of types, a robot that estimates the shooting position of the robot so that it can shoot at a shooting angle corresponding to the image of the unstored type.
  8. 제6항에 있어서,According to clause 6,
    상기 적어도 하나의 프로세서는,The at least one processor,
    상기 생성된 3D 모델을 2D로 투영하여 복수의 투영 이미지를 획득하고,Obtaining a plurality of projection images by projecting the generated 3D model into 2D,
    상기 복수의 유형의 이미지와 상기 복수의 유형의 이미지와 대응되는 복수의 투영 이미지를 비교하며,Comparing the plurality of types of images with a plurality of projection images corresponding to the plurality of types of images,
    상기 비교 결과를 바탕으로 상기 3D 모델의 품질값을 측정하며,Based on the comparison results, the quality value of the 3D model is measured,
    상기 3D 모델의 품질값이 임계값 미만인 경우, 상기 로봇의 촬영 위치를 재설정하고,If the quality value of the 3D model is less than the threshold, reset the shooting position of the robot,
    상기 주행부를 통해 상기 재설정된 촬영 위치에서 상기 사용자를 촬영하여 복수의 재설정 이미지를 획득하고,Obtaining a plurality of reset images by photographing the user at the reset shooting position through the traveling unit,
    상기 획득된 복수의 재설정 이미지에 기초하여 상기 사용자에 대한 3D 모델을 업데이트하는 로봇.A robot that updates a 3D model for the user based on the acquired plurality of reset images.
  9. 제1항에 있어서,According to paragraph 1,
    상기 적어도 하나의 프로세서는,The at least one processor,
    상기 사용자가 인식되면, 상기 사용자의 얼굴을 촬영하여 얼굴 이미지를 획득하고,When the user is recognized, obtain a facial image by photographing the user's face,
    상기 획득된 얼굴 이미지를 분석하여 상기 획득된 얼굴 이미지에 대응되는 표정 유형을 획득하고,Analyzing the acquired facial image to obtain an expression type corresponding to the acquired facial image,
    상기 얼굴 이미지와 상기 표정 유형에 대한 정보를 데이터베이스에 저장하고,Store information about the face image and the expression type in a database,
    상기 데이터베이스에 저장된 표정 유형별 얼굴 이미지에 기초하여 3D 모델의 얼굴 표정을 생성하는 로봇.A robot that generates facial expressions of a 3D model based on facial images for each expression type stored in the database.
  10. 제1항에 있어서,According to paragraph 1,
    상기 적어도 하나의 프로세서는,The at least one processor,
    상기 사용자가 인식되면, 상기 사용자의 모션을 촬영하여 모션 이미지를 획득하고,When the user is recognized, obtain a motion image by photographing the user's motion,
    상기 획득된 모션 이미지를 분석하여 상기 획득된 모션 이미지에 대응되는 모션 유형을 획득하고,Analyzing the acquired motion image to obtain a motion type corresponding to the acquired motion image,
    상기 모션 이미지와 상기 모션 유형에 대한 정보를 데이터베이스에 저장하고,Store information about the motion image and the motion type in a database,
    상기 데이터베이스에 저장된 모션 유형별 모션 이미지에 기초하여 3D 모델의 모션을 생성하는 로봇.A robot that generates motion of a 3D model based on motion images for each motion type stored in the database.
  11. 3D 모델을 생성하는 로봇의 제어 방법에 있어서,In the control method of a robot that creates a 3D model,
    사용자에 대한 3D 모델을 생성하는 제1 모드에 진입하면, 상기 로봇에 저장된 맵에 기초하여 상기 사용자에 대한 3D 모델을 생성하기 위한 촬영 장소를 식별하는 단계;Upon entering a first mode for generating a 3D model for a user, identifying a shooting location for generating a 3D model for the user based on a map stored in the robot;
    상기 사용자에게 상기 식별된 촬영 장소로 이동하라는 메시지를 출력하는 단계;Outputting a message to the user to move to the identified shooting location;
    상기 사용자가 상기 촬영 장소에 위치하면, 상기 사용자를 촬영하기 위한 촬영 경로를 획득하는 단계;When the user is located at the photographing location, obtaining a photographing path for photographing the user;
    상기 촬영 경로를 따라 이동하는 동안 기설정된 촬영 간격으로 상기 사용자를 촬영하여 복수의 이미지를 획득하는 단계; 및acquiring a plurality of images by photographing the user at preset photographing intervals while moving along the photographing path; and
    상기 획득된 복수의 이미지에 기초하여 상기 사용자에 대한 3D 모델을 생성하는 단계;를 포함하는 제어 방법.A control method comprising: generating a 3D model for the user based on the acquired plurality of images.
  12. 제11항에 있어서,According to clause 11,
    상기 제어 방법은,The control method is,
    상기 생성된 3D 모델을 2D로 투영하여 복수의 투영 이미지를 획득하는 단계;acquiring a plurality of projection images by projecting the generated 3D model into 2D;
    상기 복수의 이미지와 상기 복수의 이미지와 대응되는 복수의 투영 이미지를 비교하는 단계;Comparing the plurality of images and a plurality of projection images corresponding to the plurality of images;
    상기 비교 결과를 바탕으로 상기 3D 모델의 품질값을 측정하는 단계;를 포함하는 제어 방법.A control method comprising: measuring a quality value of the 3D model based on the comparison result.
  13. 제12항에 있어서,According to clause 12,
    상기 비교하는 단계는,The comparison step is,
    상기 복수의 이미지 중 사용자의 정면을 기준으로 제1 각도에서 촬영된 제1 이미지에 포함된 복수의 제1 특징점의 픽셀과 상기 복수의 투영 이미지 중 상기 3D 모델을 상기 제1 각도 방향에서 투영한 제1 투영 이미지에 포함된 복수의 제2 특징점의 픽셀을 비교하여 픽셀 차이값을 산출하고,Pixels of a plurality of first feature points included in a first image taken at a first angle with respect to the front of the user among the plurality of images and a first projection of the 3D model in the first angle direction among the plurality of projection images 1 Compare pixels of a plurality of second feature points included in the projection image to calculate a pixel difference value,
    상기 3D 모델의 품질값을 측정하는 단계는,The step of measuring the quality value of the 3D model is,
    상기 산출된 픽셀 차이값에 기초하여 상기 3D 모델의 품질값을 측정하는 제어 방법.A control method for measuring the quality value of the 3D model based on the calculated pixel difference value.
  14. 제13항에 있어서,According to clause 13,
    상기 제어 방법은,The control method is,
    상기 3D 모델의 품질값이 임계값 미만인 경우, 상기 로봇의 촬영 간격 또는 촬영 위치를 재설정하는 단계;If the quality value of the 3D model is less than a threshold, resetting the shooting interval or shooting position of the robot;
    상기 주행부를 통해 상기 촬영 경로를 따라 이동하는 동안 상기 재설정된 촬영 간격 또는 촬영 위치에서 상기 사용자를 촬영하여 복수의 재설정 이미지를 획득하는 단계; 및acquiring a plurality of reset images by photographing the user at the reset photographing interval or photographing position while moving along the photographing path through the traveling unit; and
    상기 획득된 복수의 재설정 이미지에 기초하여 상기 사용자에 대한 3D 모델을 업데이트하는 단계;를 포함하는 제어 방법.A control method including; updating a 3D model for the user based on the obtained plurality of reset images.
  15. 제11항에 있어서,According to clause 11,
    상기 제어 방법은,The control method is,
    사용자에 대한 3D 모델을 생성하는 제2 모드에 진입하면, 상기 로봇이 주행하는 동안 상기 사용자를 인식하는 단계;Upon entering a second mode of generating a 3D model for the user, the robot recognizes the user while driving;
    상기 인식된 사용자의 위치에 대한 정보에 기초하여 상기 로봇의 촬영 위치를 추정하는 단계;estimating the shooting location of the robot based on information about the recognized user's location;
    상기 추정된 위치로 이동하는 단계;moving to the estimated location;
    상기 추정된 위치에서 적어도 하나의 이미지를 획득하는 단계;acquiring at least one image at the estimated location;
    상기 적어도 하나의 이미지를 분석하여 상기 적어도 하나의 이미지의 유형을 분류하여 데이터베이스에 저장하는 단계;를 포함하는 제어 방법.A control method comprising: analyzing the at least one image, classifying the type of the at least one image, and storing the type in a database.
PCT/KR2023/014160 2022-10-24 2023-09-19 Robot for generating 3d model and control method therefor WO2024090792A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020220137789A KR20240057536A (en) 2022-10-24 2022-10-24 A robot that generates a 3D model and its control method
KR10-2022-0137789 2022-10-24

Publications (1)

Publication Number Publication Date
WO2024090792A1 true WO2024090792A1 (en) 2024-05-02

Family

ID=90831305

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2023/014160 WO2024090792A1 (en) 2022-10-24 2023-09-19 Robot for generating 3d model and control method therefor

Country Status (2)

Country Link
KR (1) KR20240057536A (en)
WO (1) WO2024090792A1 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005338977A (en) * 2004-05-25 2005-12-08 Aichi Gakuin Three-dimensional image processing system
KR101757765B1 (en) * 2016-05-24 2017-07-26 주식회사 글로브포인트 System and method for producing 3d animation based on motioncapture
KR20190090980A (en) * 2018-01-26 2019-08-05 인천대학교 산학협력단 Apparatus for generating 3d model using filter-equipped lighting and drone
KR20200078311A (en) * 2018-12-21 2020-07-01 엘지전자 주식회사 The control method of robot
KR20210019185A (en) * 2019-08-12 2021-02-22 엘지전자 주식회사 Multimedia device and method for controlling the same

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005338977A (en) * 2004-05-25 2005-12-08 Aichi Gakuin Three-dimensional image processing system
KR101757765B1 (en) * 2016-05-24 2017-07-26 주식회사 글로브포인트 System and method for producing 3d animation based on motioncapture
KR20190090980A (en) * 2018-01-26 2019-08-05 인천대학교 산학협력단 Apparatus for generating 3d model using filter-equipped lighting and drone
KR20200078311A (en) * 2018-12-21 2020-07-01 엘지전자 주식회사 The control method of robot
KR20210019185A (en) * 2019-08-12 2021-02-22 엘지전자 주식회사 Multimedia device and method for controlling the same

Also Published As

Publication number Publication date
KR20240057536A (en) 2024-05-03

Similar Documents

Publication Publication Date Title
US20210378554A1 (en) Method and system for privacy-preserving health monitoring
CN107341442B (en) Motion control method, motion control device, computer equipment and service robot
WO2020122432A1 (en) Electronic device, and method for displaying three-dimensional image thereof
US11592825B2 (en) Electronic device and operation method therefor
WO2020130689A1 (en) Electronic device for recommending play content, and operation method therefor
CN106292657A (en) Mobile robot and patrol path setting method thereof
JP2014137756A (en) Image processor and image processing method
JP2021144260A (en) Information processing device, information processing method, program, and information processing system
WO2022005157A1 (en) Electronic device and controlling method of electronic device
CN111034189B (en) Imaging object tracking device and imaging object tracking method
WO2022039404A1 (en) Stereo camera apparatus having wide field of view, and depth image processing method using same
EP4004872A1 (en) Electronic apparatus and method for controlling thereof
US11238604B1 (en) Densifying sparse depth maps
US11861842B2 (en) Information processing method, program, and information processing system
WO2018117514A1 (en) Airport robot and movement method therefor
WO2020141888A1 (en) Device for managing environment of breeding farm
WO2024090792A1 (en) Robot for generating 3d model and control method therefor
WO2023158205A1 (en) Noise removal from surveillance camera image by means of ai-based object recognition
WO2022098164A1 (en) Electronic device and control method of electronic device
WO2022235075A1 (en) Electronic device and operation method thereof
WO2022035054A1 (en) Robot and method for controlling same
WO2021210492A1 (en) Information processing device, information processing method, and program
WO2021107734A1 (en) Method and device for recommending golf-related contents, and non-transitory computer-readable recording medium
WO2021066275A1 (en) Electronic device and method for controlling same
WO2024005380A1 (en) Electronic device for generating map of space and control method therefor