WO2020060091A1 - 청소 로봇 및 그의 태스크 수행 방법 - Google Patents

청소 로봇 및 그의 태스크 수행 방법 Download PDF

Info

Publication number
WO2020060091A1
WO2020060091A1 PCT/KR2019/011635 KR2019011635W WO2020060091A1 WO 2020060091 A1 WO2020060091 A1 WO 2020060091A1 KR 2019011635 W KR2019011635 W KR 2019011635W WO 2020060091 A1 WO2020060091 A1 WO 2020060091A1
Authority
WO
WIPO (PCT)
Prior art keywords
cleaning robot
recognition
information
sensor
task
Prior art date
Application number
PCT/KR2019/011635
Other languages
English (en)
French (fr)
Inventor
홍순혁
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020180136757A external-priority patent/KR102577785B1/ko
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to US17/264,085 priority Critical patent/US20210370511A1/en
Publication of WO2020060091A1 publication Critical patent/WO2020060091A1/ko

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J13/00Controls for manipulators
    • B25J13/08Controls for manipulators by means of sensing devices, e.g. viewing or touching devices
    • B25J13/088Controls for manipulators by means of sensing devices, e.g. viewing or touching devices with position, velocity or acceleration sensors
    • B25J13/089Determining the position of the robot with reference to its environment
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J11/00Manipulators not otherwise provided for
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J11/00Manipulators not otherwise provided for
    • B25J11/008Manipulators for service tasks
    • B25J11/0085Cleaning
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J13/00Controls for manipulators
    • B25J13/006Controls for manipulators by means of a wireless system for controlling one or several manipulators
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J19/00Accessories fitted to manipulators, e.g. for monitoring, for viewing; Safety devices combined with or specially adapted for use in connection with manipulators
    • B25J19/02Sensing devices
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J19/00Accessories fitted to manipulators, e.g. for monitoring, for viewing; Safety devices combined with or specially adapted for use in connection with manipulators
    • B25J19/02Sensing devices
    • B25J19/021Optical sensing devices
    • B25J19/023Optical sensing devices including video camera means
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1656Programme controls characterised by programming, planning systems for manipulators
    • B25J9/1661Programme controls characterised by programming, planning systems for manipulators characterised by task planning, object-oriented languages
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1679Programme controls characterised by the tasks executed
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1694Programme controls characterised by use of sensors other than normal servo-feedback from position, speed or acceleration sensors, perception control, multi-sensor controlled systems, sensor fusion
    • B25J9/1697Vision controlled systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/255Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Definitions

  • the present invention relates to a cleaning robot and a task method of the cleaning robot, and more specifically, to a robot capable of providing a suitable task using information about surrounding objects (eg, obstacles) of the cleaning robot and a control method thereof. .
  • the present disclosure is in accordance with the above-mentioned needs, and an object of the present disclosure is to provide a cleaning robot and a control method thereof, which can provide a service for performing a suitable task on surrounding objects using a plurality of sensors of the cleaning robot.
  • a method of performing a task of a cleaning robot includes an operation of photographing an object around the cleaning robot, and applying the captured image to a learned artificial intelligence model to the image. Obtaining recognition information of an included object, obtaining additional information about the object using a result of sensing at least one sensor based on the recognition information of the object among a plurality of sensors, And performing a task of the cleaning robot based on additional information about the object.
  • the cleaning robot controls the camera to capture a sensing unit including a plurality of sensors, a camera, and objects around the cleaning robot, and the captured image Is applied to the learned artificial intelligence model to obtain recognition information of an object included in the image, and among a plurality of sensors, at least one sensor selected based on the recognition information of the object uses the result of sensing the object
  • a processor that acquires additional information on the object and performs the task of the cleaning robot based on the additional information on the object.
  • the cleaning robot may provide a service that performs the most suitable task, such as removing or avoiding the object, in consideration of recognition information and additional information of the surrounding objects.
  • the cleaning robot may provide a semantic map indicating the environment of the task area. Accordingly, the user who has been provided with the semantic map can control the task of the cleaning robot using the name of the object or place, and the user's convenience can be greatly improved.
  • 1 is a view for explaining that the cleaning robot according to an embodiment of the present disclosure recognizes and detects an object of an obstacle.
  • FIGS. 2A and 2B are simple block diagrams illustrating a configuration of a cleaning robot according to an embodiment of the present disclosure.
  • FIG. 3 is a detailed block diagram illustrating the configuration of a cleaning robot according to an embodiment of the present disclosure.
  • 4A to 4D are diagrams for explaining that a cleaning robot acquires additional information about an object as a result of detection through an IR stereo sensor, according to an embodiment of the present disclosure.
  • 5A to 5C are diagrams for explaining that a cleaning robot acquires additional information on an object as a result of detection through a LIDAR sensor according to an embodiment of the present disclosure.
  • 6A and 6B are diagrams for explaining that a cleaning robot acquires additional information on an object as a result of detection through an ultrasonic sensor according to an embodiment of the present disclosure.
  • FIGS. 7A to 7C are diagrams for illustrating that the cleaning robot grasps an in-house structure according to an embodiment of the present disclosure.
  • FIGS. 8A and 8B are diagrams for explaining that a cleaning robot generates a semantic map based on additional information about an in-house structure and an object according to an embodiment of the present disclosure.
  • 9A and 9B are diagrams for explaining that a cleaning robot informs a user of a dangerous substance present on the floor according to an embodiment of the present disclosure.
  • FIG. 10 is a diagram for explaining an area in which the cleaning robot does not clean, according to an embodiment of the present disclosure.
  • 11A and 11B are block diagrams illustrating a learning unit and a recognition unit according to various embodiments of the present disclosure.
  • FIG. 12 is a diagram illustrating an example of learning and recognizing data by interlocking a cleaning robot and a server according to an embodiment of the present disclosure.
  • FIG. 13 is a flowchart of a network system using a recognition model according to an embodiment of the present disclosure.
  • FIG. 14 is a flowchart illustrating an embodiment in which a cleaning robot according to an embodiment of the present disclosure provides a search result for a first area using a recognition model.
  • 15 is a flowchart of a system using a recognition model according to an embodiment of the present disclosure.
  • 16 is a diagram for explaining generating a semantic map according to an embodiment of the present disclosure.
  • 17 is a diagram illustrating a user interface for use of a semantic map according to an embodiment of the present disclosure.
  • FIG. 18 is a diagram illustrating a situation in which a cleaning robot is controlled using a semantic map according to an embodiment of the present disclosure.
  • 19 is a diagram for explaining generating a semantic map according to an embodiment of the present disclosure.
  • FIG. 20 is a diagram illustrating a user interface for use of a semantic map according to an embodiment of the present disclosure.
  • 21 is a diagram illustrating a situation in which a cleaning robot is controlled using a semantic map according to an embodiment of the present disclosure.
  • 22 is a diagram illustrating a process of recognizing an object according to an embodiment of the present disclosure.
  • FIG. 23 is a diagram illustrating a process of generating a semantic map according to an embodiment of the present disclosure.
  • FIG. 24 is a diagram illustrating a situation in which a cleaning robot is controlled using a semantic map according to an embodiment of the present disclosure.
  • 25 is a view showing the mechanism configuration of a cleaning robot according to an embodiment of the present disclosure.
  • 26A and 26B are views illustrating a detection range of a cleaning robot according to an embodiment of the present disclosure.
  • 27 to 29 are flowcharts of a cleaning robot according to an embodiment of the present disclosure.
  • first may modify various components, regardless of order and / or importance, to distinguish one component from another component. It is used but does not limit the components.
  • first user device and the second user device may indicate different user devices regardless of order or importance.
  • the first component may be referred to as a second component without departing from the scope of rights described in this document, and similarly, the second component may also be referred to as a first component.
  • Some component eg, first component
  • another component eg, second component
  • any of the above components may be directly connected to the other component or may be connected through another component (eg, a third component).
  • one component eg, the first component
  • the component and the component are It can be understood that there are no other components (eg, the third component) between the other components.
  • FIG. 1 is a view for explaining that the cleaning robot according to an embodiment of the present disclosure recognizes and detects an object of an obstacle.
  • the cleaning robot 100 may recognize the object 200 around the cleaning robot.
  • the cleaning robot 100 is a device that moves by itself and provides a cleaning service to the user, and may be implemented as various types of electronic devices.
  • the cleaning robot 100 may be implemented in various forms such as a cylindrical shape or a cuboid shape for various purposes, such as a household cleaning robot, a cleaning robot for a large building, and an airport cleaning robot.
  • the cleaning robot 100 may perform not only a task of simply removing foreign substances from the floor, but also a task of moving an object according to a user's command.
  • the cleaning robot 100 may capture an image including the object 200 through a camera, and may recognize the object by inputting the captured image into an artificial intelligence model trained to recognize an object.
  • the artificial intelligence model may be included in the cleaning robot 100, or may be included in an external server (not shown).
  • the artificial intelligence model may be, for example, a model trained according to a supervised learning method or an unsupervised learning method based on an artificial intelligence algorithm.
  • the neural network model may be configured to include a plurality of network nodes having weights, and the plurality of network nodes may be located at different depths (or layers) and data according to a convolutional connection relationship. Can send and receive.
  • a deep neural network (DNN), a recurrent neural network (RNN), or a bidirectional recurrent deep neural network (BRDNN) may be used as a neural network model, but is not limited thereto.
  • the cleaning robot 100 may use sensors other than the RGB camera to obtain more accurate information about the object 200.
  • the cleaning robot 100 may be preset to preferentially use a LIDAR sensor to obtain information about the position of the chair leg and the distance between the legs when the object is a chair, and may use a plurality of sensors. The result may be set to give a higher weight to the result through the LIDAR sensor.
  • the cleaning robot 100 may fire a laser pulse 220 for sensing the object 200 through the lidar sensor for precise information on the recognized object 200. This will be described later in more detail.
  • the cleaning robot 100 may store speed information at a first position, object image information at a first position, speed information at a second position, and image information at a second position of the cleaning robot.
  • the cleaning robot 100 may determine the distance d between the first location and the second location based on the stored information, and thereby determine the distance from the specific location to the object 200.
  • the cleaning robot 100 is associated with the object 200 by the cleaning robot 100 based on precise information such as the position and spacing of the chair leg and distance information to the object 200 through an additional sensor such as a lidar sensor. You can decide which task to take in the future. For example, the cleaning robot 100 may control the progress speed and direction to perform the task of cleaning between the chair legs based on the information of the distance between the chair legs.
  • the cleaning robot 100 may determine a prohibited access area or a bounding box 210 for the recognized object 200. That is, the cleaning robot 100 may only access the object 200 to the access prohibition area 210 when there is no additional sensing information in addition to the object recognition through the RGB camera and information on the access prohibition area 210.
  • a lidar sensor as the case where the object is a chair is exemplified, but is not limited thereto, and various sensors may be used for various objects.
  • the cleaning robot 100 may differently determine a task to be performed according to the object according to the object recognition result. For example, the cleaning robot 100 may remove the cereal when the object is recognized as a serial, push the cushion when the object is a cushion, and recognize the object as a fragile object such as a glass cup. Accurate recognition can be performed to reduce the speed and avoid completely. Furthermore, when the object is recognized as a dangerous object, the cleaning robot 100 may take an image of the object and transmit the image to the user terminal device. In addition, even when the recognized object is recognized to be dirty, such as pet waste, precise recognition can be performed for complete evasion, and an image including the object can be transmitted to the user terminal device.
  • the cleaning robot 100 may accurately measure an object through a combination of detection results of at least one sensor available to determine whether to perform a close evasion driving or a complete evasion driving, especially when avoiding driving. Information can be obtained. This will be explained later.
  • FIG. 2A is a simple block diagram illustrating a configuration of a cleaning robot according to an embodiment of the present disclosure.
  • the cleaning robot 100 may include a sensing unit 110, a camera 120, a memory 130, and a processor 140.
  • the sensing unit 110 may include various types of sensors. Specifically, the sensing unit 110 may include an IR stereo sensor, a LIDAR sensor, and an ultrasonic sensor. Each IR stereo sensor, LIDAR sensor, and ultrasonic sensor may be implemented as a single sensor, but may also be implemented as separate sensors.
  • the IR stereo sensor can sense the 3D shape and distance information of the object.
  • the IR stereo sensor can acquire 3D depth information of the object.
  • the IR stereo sensor has a disadvantage in that it is impossible to sense black, transparent or metal.
  • the cleaning robot 100 may acquire 2D line shape and distance information about an object using a LIDAR sensor. Through this, space information on the object and distance of the surrounding object may be obtained.
  • the lidar sensor has a disadvantage that it cannot sense black, transparent, or metal.
  • the ultrasonic sensor may acquire distance information about an obstacle.
  • the ultrasonic sensor has a disadvantage that the sensing range is relatively limited, but it has the advantage of being able to detect black, transparent, and metal.
  • the sensing unit 110 includes sensors for detecting surroundings such as dust sensors, odor sensors, laser sensors, UWB sensors, image sensors, obstacle sensors, and sensors for detecting movement conditions such as gyro sensors and GPS sensors. can do.
  • the sensor for detecting the surroundings and the sensor for detecting the moving state of the cleaning robot may be implemented in different configurations, or may be implemented in one configuration.
  • each sensor of the sensing unit 110 may be implemented in a separate configuration.
  • the sensing unit 110 may further include various types of sensors, and some of the illustrated sensors may not be included according to tasks to be performed by the cleaning robot 100.
  • the camera 120 is configured to photograph the surrounding images of the cleaning robot 100 in various directions.
  • the camera 120 may take a front image of the cleaning robot 100 through an RGB camera, or may take an image of a direction different from the driving direction.
  • the camera 120 may be provided independently of the cleaning robot 100 or may be a camera included in the object recognition sensor as part of the object recognition sensor.
  • the camera 120 may be configured to include a plurality of cameras.
  • the camera 120 may be installed both above and in front of the cleaning robot 100, or may be installed only in at least one of the above and the front.
  • the memory 130 may store an image captured by the camera 120 and moving state information and shooting direction information of the cleaning robot 100 at the time of shooting. Also, the memory 130 may store navigation map information about a place for the cleaning robot 100 to perform a task. This is only an example, and the memory 130 may store various programs required to operate the cleaning robot 100.
  • the memory 130 may store a number of application programs or applications that are driven by the cleaning robot 100, data and commands for the operation of the cleaning robot 100. At least some of these applications may be downloaded from external servers via wireless communication. In addition, at least some of these application programs may exist on the cleaning robot 100 from the time of shipment for the basic function of the cleaning robot 100.
  • the application program may be stored in the memory 130 and driven by the processor 140 to perform an operation (or function) of the cleaning robot 100.
  • the memory 130 generates a navigation map for driving the cleaning robot 100 by using the result of the processor 140 detecting a task area in which at least one sensor is disposed, and at least Semantic representing the environment of the task area by acquiring the recognition information of the object by applying the image captured by the object to the trained artificial intelligence model, and mapping the object's area and object recognition information included in the navigation map At least one instruction set to generate a map may be stored.
  • the processor 140 photographs an object around the cleaning robot, applies the photographed image to the learned artificial intelligence model, acquires recognition information of an object included in the image, and multiple Among the sensors, at least one command to detect an object using at least one sensor selected based on the obtained recognition information of the object, and to obtain additional information about the object using the result detected by the at least one sensor You can store instructions.
  • the memory 130 may be implemented as a non-volatile memory, a volatile memory, a flash-memory, a hard disk drive (HDD) or a solid state drive (SSD).
  • the memory 130 is accessed by the processor 140, and data read / write / modify / delete / update by the processor 140 may be performed.
  • the term memory is a memory card (not shown) mounted on a memory 130, a ROM (not shown), a RAM (not shown), or a cleaning robot 100 in the processor 140 (eg, micro SD) Card, memory stick).
  • the processor 140 may control the overall configuration of the cleaning robot 100.
  • the processor 140 may control the camera 120 to photograph an image around the cleaning robot 100.
  • the processor 140 may include a RAM, a ROM, and a system bus.
  • the ROM is a configuration in which a command set for booting the system is stored, and the CPU 141 copies the operating system stored in the memory of the cleaning robot 100 to RAM according to the command stored in the ROM, and executes O / S to execute the system. Boot it. When the booting is completed, the CPU 141 may perform various operations by copying and executing various applications stored in the memory 130 to RAM.
  • the cleaning robot 100 may include a plurality of processors 141 and 142.
  • the plurality of processors 141 and 142 may include a central processing unit (CPU) 141 and a neural processing unit (NPU) 142.
  • the NPU 142 may be a dedicated processor optimized to recognize objects using the trained artificial intelligence model.
  • the cleaning robot 100 includes a digital signal processor (DSP), a microprocessor (microprocessor), a time controller (TCON), a micro controller unit (MCU), and a micro processing unit (MPU) that processes digital signals.
  • the processor 140 includes a processing algorithm It may be implemented as a system-on-chip (SoC), large scale integration (LSI), or a field programmable gate array (FPGA).
  • SoC system-on-chip
  • LSI large scale integration
  • FPGA field programmable gate array
  • the processor 140 may recognize an obstacle included in an image through an artificial intelligence model trained to recognize an object, such as an obstacle. That is, the processor 140 may input an image including an obstacle to the artificial intelligence model, and obtain an output result including information about the obstacle type. The processor 140 may determine the size of different access prohibition areas according to the type of obstacle. At this time, the access prohibited area is an area including an obstacle, and refers to an area that the cleaning robot 100 will not approach when performing the cleaning task.
  • the artificial intelligence model is a type of on device that has been learned, or may be stored in the memory 130 of the cleaning robot 100 or may be stored in an external server. This will be described in detail later. Hereinafter, an embodiment in which the artificial intelligence model is stored in the cleaning robot 100 is assumed and described.
  • the processor 140 may generate a second image overlapping the first image and the forbidden access area for the recognized obstacle.
  • the processor 140 may recognize the location of structures and obstacles around the cleaning robot 100 based on the information included in the second image, and determine the direction and speed in which the cleaning robot 100 will move.
  • the processor 140 may control the driving unit 110 so that the cleaning robot 100 moves according to the determined moving direction and speed.
  • the processor 140 may generate a first image characteristically dividing the bottom surface from the captured image. At this time, in order to divide the bottom surface, the processor 140 may use an image segmentation technique.
  • the processor 140 may generate a navigation map for driving the cleaning robot 100 by using the result of the sensing unit 110 detecting the task area in which the object is disposed.
  • the processor 140 may acquire the recognition information of the object by applying the image captured by the camera 120 to the learned artificial intelligence model.
  • the processor 140 may map a region of the object included in the navigation map and object recognition information, and generate a semantic map indicating the environment of the task region.
  • the processor 140 may perform the task of the cleaning robot based on the user's control command using the semantic map. Accordingly, the user provided with the semantic map can control the task of the cleaning robot 100 in various ways by using the recognition information of the object, so that the user's convenience can be greatly improved.
  • the processor 140 may acquire recognition information of a place included in the task area using the recognition information of the object.
  • the processor 140 may generate a semantic map indicating the environment of the task area by using the recognition information of the place and the object recognition information included in the task area. Accordingly, it is possible for a user who is provided with the semantic map to more accurately control the task to be performed by the cleaning robot 100 by referring to both the recognition information of each place and the recognition information of the object.
  • the processor 140 maps a region of an object included in a navigation map and recognition information of the object based on at least one of an object location or an object shape according to an object detection result, to thereby perform a task
  • the processor 140 may apply the image captured by the camera 120 to the trained artificial intelligence model located on an external server to obtain object recognition information.
  • the recognition rate of the object may be greatly improved.
  • the limited resources of the cleaning robot 100 are overcome and more resources are used to artificial intelligence. Usability of the model can be further improved.
  • the processor 140 may identify a boundary of an object corresponding to the object in the navigation map.
  • the processor 140 may map a region of the object determined by the boundary of the object and recognition information of the object, and generate a semantic map indicating the environment of the task region.
  • the processor 140 may apply the image captured by the camera 120 to the trained artificial intelligence model located on an external server to obtain object recognition information.
  • the processor 140 may control at least one sensor selected from among the plurality of sensors included in the sensing unit 110 based on the recognition information of the object to detect the object.
  • the processor 140 may obtain additional information about the object using the result detected by at least one sensor.
  • the processor 140 may set priorities for a plurality of sensors according to object recognition information.
  • the processor 140 may obtain additional information about an object using a result detected by at least one sensor according to a priority among a plurality of sensors.
  • the processor 140 may control the camera 120 to photograph objects around the cleaning robot 100.
  • the processor 140 may obtain the recognition information of the object included in the image by applying the captured image to the learned artificial intelligence model.
  • the processor 140 may control at least one sensor selected from among the plurality of sensors included in the sensing unit 110 based on the recognition information of the object to detect the object.
  • the processor 140 may acquire additional information about the object using the result detected by at least one sensor, and determine a task to be performed by the cleaning robot 100 on the object based on the additional information about the object.
  • the processor 140 may set priorities for a plurality of sensors included in the sensing unit 110 according to object recognition information.
  • the processor 140 may obtain additional information about an object using a result detected by at least one sensor according to a priority among a plurality of sensors.
  • the processor 140 when the priority of the plurality of sensors is set to a high priority among the plurality of sensors according to the recognition information of the object, the processor 140 adds a weight to the result detected by the IR stereo sensor to add to the object Information can be obtained.
  • the processor 140 determines the bounding box for the recognized object, and determines the threshold value of the IR stereo sensor for an area where the determination result of the bounding box and the object detection result through the IR stereo sensor do not match. Can be reduced.
  • the processor 140 may determine the result detected by the lidar sensor. Additional information on the object may be obtained by adding a weight.
  • the processor 140 when the priority is set to the ultrasonic sensor among the plurality of sensors included in the sensing unit 110 according to the object recognition information, the processor 140 weights the result detected by the ultrasonic sensor. In addition, additional information on the object may be obtained.
  • a high priority is set for an ultrasonic sensor among a plurality of sensors included in the sensing unit 110 according to the recognition information of the object, it is characterized in that the recognized object is a transparent or black index object.
  • the processor 140 may acquire the recognition information of the object by applying the photographed image to a learned artificial intelligence model located in an external server.
  • FIG. 3 is a detailed block diagram illustrating the configuration of a cleaning robot according to an embodiment of the present disclosure.
  • the cleaning robot 100 includes a sensing unit 110, a camera 120, a memory 130, a communication unit 150, a dust collecting unit 160, a driving unit 170, a power supply unit 180, and It may be composed of a processor 140 that is electrically connected to and controlled by the components.
  • the communication unit 150 may transmit and receive data, control commands, and the like with an external device.
  • the communication unit 150 may receive global map information including location information about a space in which the cleaning robot 100 will operate from an external device.
  • the communication unit 150 may transmit information for updating the global map information to an external device.
  • the communication unit 150 may receive a signal for controlling the cleaning robot 100 transmitted by the user using the remote control device.
  • the remote control device may be implemented in various forms such as a remote control and a mobile device.
  • the communication unit 150 may transmit and receive data and the like with an external server (not shown).
  • the communication unit 150 may transmit the image captured through the camera 120 to the external server, and is recognized using the artificial intelligence model stored in the external server.
  • Object recognition information eg, information about an obstacle
  • the communication unit 150 may receive information on a movable area for a space in which the cleaning robot 100 performs a task from an external server.
  • the communication unit 150 may use various methods such as Near Field Communication (NFC), Wireless LAN (Wireless LAN), InfraRed (IR) communication, Zigbee communication, WiFi, and Bluetooth as a wireless communication method.
  • NFC Near Field Communication
  • Wireless LAN Wireless LAN
  • IR InfraRed
  • Zigbee communication Zigbee communication
  • WiFi Wireless Fidelity
  • Bluetooth Bluetooth
  • the dust collecting unit 160 is configured to collect dust. Specifically, the dust collecting unit 160 may suck air and collect dust in the sucked air.
  • the dust collecting unit 160 may include a motor for passing air through a guide pipe leading from the inlet to the outlet, a filter for filtering dust in the intake air, and a dust container for trapping dust.
  • the driving unit 170 may drive the cleaning robot 100.
  • the driving unit 170 may move the cleaning robot 100 to a position to perform the task under the control of the processor 140.
  • the driving unit 170 may include at least one wheel in contact with the bottom surface, a motor that provides power to the wheel, and a driver to control the motor.
  • the driver 170 may implement an operation for performing a task.
  • the driving unit 170 may include a motor for performing an operation of picking up an object.
  • the power supply unit 180 supplies power required for driving the cleaning robot 100.
  • the power supply unit 180 may be implemented with a battery that can be charged and discharged.
  • the processor 140 may control the driving unit 110 to move to the charging station when the residual power of the cleaning robot 100 falls below a predetermined level or when the task is completed.
  • the charging method of the power supply unit 180 may be both contact and non-contact charging.
  • 4A to 4D are diagrams for explaining that a cleaning robot acquires additional information about an object as a result of detection through an IR stereo sensor, according to an embodiment of the present disclosure.
  • the cleaning robot 100 may detect an object in front through an IR stereo sensor. Specifically, the cleaning robot 100 may recognize an object placed on the floor in front of the camera 120. Also, the cleaning robot 100 may detect an object through an IR stereo sensor and obtain depth information of the object. For example, referring to FIG. 4A, the cleaning robot 100 may recognize and detect a plurality of objects 410 and 420 in the front through the camera 120 and the IR stereo sensor, and the objects 410 and 420. Depth information for can be obtained.
  • the IR stereo sensor may detect an object when the depth of the object is greater than a threshold value, but cannot detect the object when the depth of the object is less than the threshold value. For example, when the depth information of the carpet 420 is smaller than a preset threshold, the cleaning robot 100 cannot recognize the carpet 420 and, for the flowerpot 410 through the IR stereo sensor, as shown in FIG. 4B. Only the depth information 411 can be obtained.
  • the camera 120 may detect and recognize all objects 410 and 420 in front regardless of the depth information of the object. That is, the cleaning robot 100 may capture and recognize images of both the flowerpot 410 and the carpet 420 as shown in FIG. 4C, and determine the bounding boxes 412 and 422 for each object.
  • the cleaning robot 100 may set the threshold value of the IR stereo sensor to be small.
  • the cleaning robot 100 may decrease the threshold value of the IR stereo sensor until the object recognition result through the camera 120 and the object detection result through the IR stereo sensor match, for example, until the number of objects is the same. have.
  • the threshold value of the IR stereo sensor is sufficiently lowered, the cleaning robot 100, as well as depth information 411 for the flowerpot 410 through the IR stereo sensor, as shown in FIG. 4D, depth information 421 of the carpet 420 ) As additional information.
  • the cleaning robot 100 may reduce the threshold value of the IR stereo sensor only for the area corresponding to the bounding boxes 412 and 422 obtained as shown in FIG. 4C. That is, the cleaning robot 100 may reduce the threshold value of the IR stereo sensor only for different areas 422 by comparing the object recognition result with the object detection result through the IR stereo sensor. According to the above-described embodiment, the cleaning robot 100 allows the IR stereo sensor to detect the carpet 420 that is not currently detected, and at the same time, it is possible to still maintain the existing threshold when detecting a new object. There is.
  • 5A to 5C are diagrams for explaining that a cleaning robot acquires additional information on an object as a result of detection through a LIDAR sensor according to an embodiment of the present disclosure.
  • the cleaning robot 100 may first photograph and recognize the object 500 around the cleaning robot 100 through the camera 120. As a result of object recognition, the cleaning robot 100 may determine that the recognized objects 500 are desks and chairs.
  • the cleaning robot 100 is an additional sensor for acquiring additional information about the object when the object is a desk and a chair, and can detect the lidar sensor by setting the priority of other sensors to a higher priority.
  • 5B is a plan view illustrating that the cleaning robot 100 recognizes the object 500 and determines the bounding box 510 for the object 500.
  • the cleaning robot 100 may obtain detailed information of the object 500 as additional information through the lidar sensor having a high priority.
  • the lidar sensor may acquire information about the leg of the object 500 as it fires the laser pulse in the direction of the object recognized by the cleaning robot 100.
  • the cleaning robot 100 may acquire information 520 about the leg of the object 500 through the lidar sensor. That is, the cleaning robot 100 may obtain information about the position of the legs of the object 500, the distance between the legs, and the like, and determine a suitable task.
  • 6A and 6B are diagrams for explaining that a cleaning robot acquires additional information on an object as a result of detection through an ultrasonic sensor according to an embodiment of the present disclosure.
  • the cleaning robot 100 prioritizes the ultrasonic sensor over the IR stereo sensor or the lidar sensor when it recognizes that the object is the black table 600 and the glass cup 610 in the image acquired through the camera 120. It can be detected by placing it high.
  • the cleaning robot 100 may attempt to detect an object by rotating left and right. For example, as shown in FIG. 6B, the cleaning robot 100 approaches within a detectable distance through an ultrasonic sensor, and the object for objects such as the position of the legs of the black table 600 and the position of the glass cup 610 through ultrasonic waves. Additional information can be obtained.
  • FIGS. 7A and 7B are diagrams for illustrating that the cleaning robot grasps an in-house structure according to an embodiment of the present disclosure.
  • the cleaning robot 100 may recognize the object as a door 700 or 710 using a result of sensing the object by at least one of the camera 120 or a plurality of sensors.
  • the method in which the cleaning robot 100 recognizes the object as a door may be to recognize an image including the doors 700 and 710 through a result of inputting it to an artificial intelligence model.
  • the cleaning robot 100 may determine the structure of the task area (for example, a home structure) through the door. For example, the cleaning robot 100 may determine the walls of both sides of the door 700 and 710 in a horizontal direction, unless otherwise specified.
  • the cleaning robot 100 may determine both directions horizontal to the recognized first door 700 as the first wall 701, and both directions horizontal to the recognized second door 710. May be determined as the second wall 711. On the other hand, if there is a portion 720 where the inferred first wall 701 and the inferred second wall 711 intersect, the cleaning robot may determine the corresponding intersecting portion 720 as an edge portion of the wall in the home. have.
  • the cleaning robot 100 may detect an empty space at a portion 730 where the inferred first wall 701 and the inferred second wall 711 are expected to cross.
  • the cleaning robot 100 may detect a separate area 740 using a lidar sensor. According to the detection result, the cleaning robot 100 determines that there is an empty space between the first wall 701 and the second wall 711, and separate area 740 using the empty space as a passage in the structure of the task area ).
  • the cleaning robot 100 when the object is recognized as a door, the cleaning robot 100 has an effect that it is possible to grasp the structure of the task area without ending with object recognition.
  • the cleaning robot 100 may generate a semantic map reflecting the structure of the task area in the navigation map.
  • FIGS. 8A and 8B are diagrams for explaining that a cleaning robot generates a semantic map based on additional information about an in-house structure and an object according to an embodiment of the present disclosure.
  • the cleaning robot 100 may recognize objects in the home as doors 700 and 710 and a sofa 800, respectively.
  • the cleaning robot 100 may grasp the structure of the task area (eg, a wall in the home) through the doors 700 and 710. Also, the cleaning robot 100 may recognize the sofa 800 while driving toward the object. For example, in FIG. 8A, while the cleaning robot 100 travels toward an object, as a result of being detected by at least one of the camera 120 or a plurality of sensors, the plurality of images 801 to 803 of the object are captured. Can be obtained. For example, the cleaning robot 100 may acquire images 801 to 803 while photographing an object at a certain distance (eg, 20 cm to 40 cm) or at a certain period (eg, 0.5 to 2 seconds) and store them in the memory 130. have.
  • a certain distance eg, 20 cm to 40 cm
  • a certain period eg, 0.5 to 2 seconds
  • the cleaning robot 100 may acquire object recognition information from the images 801 to 803 stored in the memory 130.
  • the cleaning robot 100 may obtain the recognition information of the object by applying the stored images 801 to 803 to the artificial intelligence model.
  • the cleaning robot 100 may generate a semantic map by adding it to the navigation map for the task area when the additionally recognized object is recognized as a structure other than an obstacle or a foreign object.
  • the cleaning robot 100 infers through the sofa bridge information 810 and the doors 700 and 710 additionally acquired through a lidar sensor, etc., for the structure 800. Based on the structure of the task area, a semantic map can be generated.
  • 9A and 9B are diagrams for explaining that a cleaning robot informs a user of a dangerous substance present on the floor according to an embodiment of the present disclosure.
  • the cleaning robot 100 may recognize an object existing on the floor as a broken glass 900. At this time, the cleaning robot 100 may recognize the object as a broken glass as a result of performing object recognition by inputting an image including the object 900 into the artificial intelligence model.
  • the cleaning robot 100 can inform the user that a dangerous object is on the floor. That is, the cleaning robot 100 may transmit warning data to the user terminal device 910 such that a notification phrase 911 such as 'I think there is an object that should not be on the floor' is displayed on the user terminal device 910. have. Alternatively, the cleaning robot 100 may transmit warning data to the user terminal device 910 so that a notification phrase including recognition information of the object, which is a result of the recognition of the object, is displayed. For example, when the object is recognized as a glass, the cleaning robot 100 may transmit warning data to the user terminal device 910 so that a notification phrase such as 'I have a glass on the floor' is displayed.
  • the cleaning robot 100 may transmit the generated navigation map or semantic map to the user terminal device 910 according to the method described with reference to FIGS. 7A to 8B.
  • the user terminal device 910 may display a semantic map or a navigation map on the user terminal device 910, and may also display location information of a dangerous object received from the cleaning robot 100.
  • the user terminal device 910 displays the UI 912 for the navigation map received from the cleaning robot 100, and determines the location where the cleaning robot 100 is currently detecting a dangerous object. It can be displayed together in the UI.
  • FIG. 10 is a diagram for explaining an area in which the cleaning robot does not clean, according to an embodiment of the present disclosure.
  • the user terminal device 910 may receive the navigation map from the cleaning robot 100 and display the UI 912 for this.
  • the user can designate an area 913 that the cleaning robot 100 will not clean.
  • the user interacts with the corresponding area 913 on the UI displayed on the user terminal device 910 (eg
  • the cleaning robot 100 may be commanded not to clean through touch and click.
  • the cleaning robot 100 may automatically perform a task to avoid a specific area 913 requiring access restriction without receiving a user command.
  • the cleaning robot 100 may recognize an object (eg, a sleeping baby) included in a specific area 913 using an artificial intelligence model before entering the specific area 913.
  • the cleaning robot 100 may perform the task while traveling while avoiding the specific area 913.
  • 11A and 11B are block diagrams illustrating a learning unit and a recognition unit according to various embodiments.
  • the processor 1100 may include at least one of a learning unit 1110 and a recognition unit 1120.
  • the processor 1100 of FIG. 11A may correspond to the processor 140 of the cleaning robot 100 of FIG. 2, or may correspond to a processor of an external server (not shown) capable of communicating with the cleaning robot 100. .
  • the learning unit 1110 may generate or train a recognition model having a criterion for determining a predetermined situation.
  • the learning unit 1110 may generate a recognition model having a judgment criterion using the collected learning data.
  • the learning unit 1110 may generate, learn, or update an object recognition model having a criterion for determining which object is included in the image by using the image containing the object as training data.
  • the learning unit 1110 generates and learns a periphery information recognition model having a criterion for determining various additional information around an object included in an image by using the periphery information included in the screen including the object as learning data. Or you can update it.
  • the learning unit 1110 may generate, learn, or update an obstacle recognition model having a criterion for determining an obstacle included in the image using the image captured by the camera as training data.
  • the recognition unit 1120 may use the predetermined data as input data of the learned recognition model, and estimate a recognition target included in the predetermined data.
  • the recognition unit 1120 obtains object information about an object included in the object area (or estimation, inference) using the object area (or image) containing the object as input data of the learned recognition model. can do.
  • the recognition unit 1120 may estimate (or determine, infer) a search category to provide a search result by applying object information to a learned recognition model. At this time, a plurality of search results may be obtained according to priority.
  • At least a portion of the learning unit 1110 and at least a portion of the recognition unit 1120 may be implemented as a software module or manufactured in the form of at least one hardware chip and mounted on an electronic device.
  • at least one of the learning unit 1110 and the recognition unit 1120 may be manufactured in the form of a dedicated hardware chip for artificial intelligence (AI), or an existing general-purpose processor (eg, CPU or application) processor) or a graphics-only processor (for example, a GPU), and may be mounted on the cleaning robot 100 described above.
  • the dedicated hardware chip for artificial intelligence is a dedicated processor specialized in probabilistic computation, and has higher parallel processing performance than the conventional general-purpose processor, so it can quickly process computational tasks in the field of artificial intelligence such as machine learning.
  • the software module is a computer-readable, non-transitory readable recording medium (non- transitory computer readable media).
  • the software module may be provided by an operating system (OS) or may be provided by a predetermined application.
  • OS operating system
  • OS operating system
  • some of the software modules may be provided by an operating system (OS), and the other may be provided by a predetermined application.
  • the learning unit 1110 and the recognition unit 1120 may be mounted on one electronic device, or may be mounted on separate electronic devices, respectively.
  • one of the learning unit 1210 and the recognition unit 1220 may be included in the cleaning robot 100, and the other may be included in an external server.
  • the learning unit 1110 and the recognition unit 1120 may provide model information constructed by the learning unit 1110 to the recognition unit 1120 through wired or wireless communication, or input to the recognition unit 1120. Data may be provided to the learning unit 1110 as additional learning data.
  • 11B is a block diagram of a learning unit 1110 and a recognition unit 1120 according to various embodiments.
  • the learning unit 1110 may include a learning data acquisition unit 1110-1 and a model learning unit 1110-4.
  • the learning unit 1110 may further include at least one of a learning data pre-processing unit 1110-2, a learning data selection unit 1110-3, and a model evaluation unit 1110-5.
  • the learning data acquisition unit 1110-1 may acquire learning data necessary for a recognition model for inferring a recognition object.
  • the learning data acquisition unit 1110-1 may acquire the entire image including the object, the image corresponding to the object area, and object information as learning data.
  • the learning data may be data collected or tested by the learning unit 1110 or the manufacturer of the learning unit 1110.
  • the model learning unit 1110-4 may use learning data to train the recognition model to have a judgment criterion on how to determine a predetermined recognition object. For example, the model learning unit 1110-4 may train the recognition model through supervised learning using at least a part of the learning data as a judgment criterion. Alternatively, the model learning unit 1110-4, for example, through unsupervised learning to discover a judgment criterion for judging a situation by learning by itself using learning data without much guidance, a recognition model Can be learned. In addition, the model learning unit 1110-4 may train a recognition model, for example, through reinforcement learning using feedback on whether a result of situation determination according to learning is correct. In addition, the model learning unit 1110-4 may train a recognition model using, for example, a learning algorithm including error back-propagation or gradient descent.
  • model learning unit 1110-4 may learn the selection criteria for what training data to use to estimate the recognition target using the input data.
  • the model learning unit 1110-4 may determine a recognition model having a high relationship between input learning data and basic learning data as a recognition model for learning.
  • the basic learning data may be pre-classified for each data type, and the recognition model may be pre-built for each data type.
  • the basic training data is classified into various criteria such as the region where the training data is generated, the time when the training data is generated, the size of the training data, the genre of the training data, the creator of the training data, and the type of object in the training data. It may be.
  • the model learning unit 1110-4 may store the learned recognition model.
  • the model learning unit 1110-4 may store the learned recognition model in the memory 130 of the cleaning robot 100.
  • the model learning unit 1110-4 may store the learned recognition model in a memory of a server connected to the cleaning robot 100 through a wired or wireless network.
  • the learning unit 1110 uses the learning data preprocessing unit 1110-2 and the learning data selection unit 1110-3 to improve the analysis result of the recognition model or to save resources or time required to generate the recognition model. It may further include.
  • the learning data pre-processing unit 1110-2 may pre-process the acquired data so that the acquired data can be used for learning for situation determination.
  • the learning data pre-processing unit 1110-2 may process the acquired data in a preset format so that the model learning unit 1110-4 can use the acquired data for learning for situation determination.
  • the learning data selection unit 1110-3 may select data necessary for learning from data acquired by the learning data acquisition unit 1110-1 or data preprocessed by the learning data preprocessing unit 1110-2.
  • the selected learning data may be provided to the model learning unit 1110-4.
  • the learning data selection unit 1110-3 may select learning data necessary for learning from acquired or preprocessed data according to a preset selection criterion. Further, the learning data selector 1110-3 may select learning data according to a preset selection criterion by learning by the model learning unit 1110-4.
  • the learning unit 1110 may further include a model evaluation unit 1110-5 to improve the analysis result of the data recognition model.
  • the model evaluation unit 1110-5 may input evaluation data into the recognition model, and when the analysis result output from the evaluation data does not satisfy a predetermined criterion, the model learning unit 1110-4 may cause the model learning unit 1110-4 to learn again.
  • the evaluation data may be predefined data for evaluating the recognition model.
  • the model evaluator 1110-5 satisfies a predetermined criterion when the number or ratio of the inaccurate evaluation data exceeds a preset threshold among the analysis results of the learned recognition model for the evaluation data. It can be evaluated as failure.
  • the model evaluator 1110-5 evaluates whether or not a predetermined criterion is satisfied for each learned recognition model, and determines a model that satisfies a predetermined criterion as a final recognition model. You can. In this case, when there are a plurality of models satisfying a predetermined criterion, the model evaluator 1110-5 may determine, as a final recognition model, any one or a predetermined number of models preset in the order of highest evaluation score.
  • the recognition unit 1120 may include a recognition data acquisition unit 1120-1 and a recognition result providing unit 1120-4.
  • the recognition unit 1120 may further include at least one of the recognition data pre-processing unit 1120-2, the recognition data selection unit 1120-3, and the model update unit 1120-5.
  • the recognition data acquisition unit 1120-1 may acquire data necessary for situation determination.
  • the recognition result providing unit 1120-4 may determine the situation by applying the data obtained from the recognition data acquisition unit 1120-1 to the recognition model learned as an input value.
  • the recognition result providing unit 1120-4 may provide analysis results according to the purpose of analyzing the data.
  • the recognition result providing unit 1120-4 may obtain analysis results by applying the data selected by the recognition data pre-processing unit 1120-2 or the recognition data selection unit 1120-3, which will be described later, to the recognition model as an input value. have.
  • the results of the analysis can be determined by the recognition model.
  • the recognition result providing unit 1120-4 obtains object information corresponding to the object region by applying the learned recognition model to the object region including the object acquired by the recognition data acquisition unit 1120-1 ( Or, estimate).
  • the recognition result providing unit 1120-4 provides a search result by applying at least one of the object area, object information, and context information acquired by the recognition data acquisition unit 1120-1 to the learned recognition model. You can obtain (or estimate) the search category to be done.
  • the recognition unit 1120 uses the recognition data pre-processing unit 1120-2 and the recognition data selection unit 1120-3 to improve the analysis result of the recognition model or to save resources or time for providing the analysis result. It may further include.
  • the recognition data pre-processing unit 1120-2 may pre-process the acquired data so that the acquired data can be used for situation determination.
  • the recognition data pre-processing unit 1120-2 may process the acquired data in a predefined format so that the recognition result providing unit 1120-4 can use the acquired data for situation determination.
  • the recognition data selection unit 1120-3 may select data necessary for situation determination from data obtained by the recognition data acquisition unit 1120-1 or data pre-processed by the recognition data pre-processing unit 1120-2. The selected data may be provided to the recognition result providing unit 1120-4.
  • the recognition data selector 1120-3 may select some or all of the obtained or preprocessed data according to a preset selection criterion for determining the situation. Further, the recognition data selection unit 1120-3 may select data according to a preset selection criterion by learning by the model learning unit 1110-4.
  • the model updating unit 1120-5 may control the recognition model to be updated based on the evaluation of the analysis result provided by the recognition result providing unit 1120-4. For example, the model update unit 1120-5 provides the model learning unit 1110-4 with the analysis result provided by the recognition result providing unit 1120-4, so that the model learning unit 1110-4 You may ask to further learn or update your recognition model.
  • FIG. 12 is a diagram illustrating an example in which the cleaning robot 100 and the server 200 according to an embodiment learn and recognize data by interworking with each other.
  • the server 200 may learn the criteria for determining the situation, and the cleaning robot 100 may determine the situation based on the learning result by the server 200.
  • the model learning unit 1110-4 of the server 200 may perform the function of the model learning unit 1110-4 shown in FIG. 11B.
  • the model learning unit 1110-4 of the server 200 learns what object image, object information or context information to use in order to determine a predetermined situation, and how to judge the situation using the data. You can.
  • the recognition result providing unit 1120-4 of the cleaning robot 100 applies the data selected by the recognition data selection unit 1120-3 to the recognition model generated by the server 200 to obtain object information or search categories. Can judge.
  • the recognition result providing unit 1120-4 of the cleaning robot 100 may receive the recognition model generated by the server 200 from the server 200, and determine the situation using the received recognition model. .
  • the recognition result providing unit 1120-4 of the cleaning robot 100 applies the object image selected by the recognition data selection unit 1120-3 to the recognition model received from the server 200, to the object image.
  • Corresponding object information can be determined.
  • the recognition result providing unit 1120-4 may determine a search category to obtain a search result using at least one of context information and context recognition information.
  • FIG. 13 is a flowchart of a network system using a recognition model according to an embodiment of the present disclosure.
  • the first component 1301 is the cleaning robot 100
  • the second component 1302 can be the server 200 in which the recognition model is stored.
  • the first component 1301 may be a general-purpose processor
  • the second component 1302 may be an artificial intelligence-only processor.
  • the first component 1301 may be at least one application
  • the second component 1302 may be an operating system (OS). That is, the second component 1302 is a component that is more integrated, dedicated, has a small delay, has a superior performance, or has many resources than the first component 1301.
  • a number of operations required when creating, updating, or applying may be a component that can be processed more quickly and effectively than the first component 1301.
  • the first component 1301 may generate a captured image (eg, a captured image) by photographing a surrounding environment including an object (eg, an object disposed in a task area) (1311). .
  • the first component 1301 may transmit the captured image to the second component 1302 (1312).
  • the first component 1301 may transmit information on an object area corresponding to the selected object along with the captured image.
  • the second component 1302 may separate the received captured image into an object area and a surrounding area (1313). At this time, the second component 1302 may separate the object area and the surrounding area based on the information on the received object area.
  • the second component 1302 may obtain object information and additional information about the object by inputting the separated object area and the surrounding area as a recognition model (1314). At this time, the second component 1302 may acquire object information by inputting an object region into the object recognition model, and obtain additional information about the object by inputting a peripheral region into the surrounding information recognition model. Also, the second component 1302 may determine a search category and a priority of the search category based on the object information and additional information about the object.
  • the second component 1302 may obtain a result associated with the object using the obtained object information and additional information (1315). At this time, the second component 1302 may obtain object-related results by applying object information and additional information to the recognition model as input data. At this time, the second component 1302 may obtain results by using a search category together. In addition, the second component 1302 may obtain results using additional data (eg, the risk of obstacles and the importance of the obstacles to the user) in addition to object information and additional information. At this time, the additional data may be transmitted from the first component 1301 or another element or may be pre-stored in the second component 1302.
  • additional data eg, the risk of obstacles and the importance of the obstacles to the user
  • the first component 1301 detects the object through the sensing unit based on the result associated with the received object It can be done (1317).
  • FIG. 14 is a flowchart illustrating an embodiment in which a cleaning robot according to an embodiment of the present disclosure provides a search result for a first area using a recognition model.
  • the cleaning robot 100 may capture or photograph a surrounding environment to generate an image (1410).
  • the cleaning robot 100 may obtain first information about the first area through the trained first model using the generated image as input data (1420).
  • the first model may be stored in the cleaning robot 100, but this is only an example, and may be stored in an external server.
  • the cleaning robot 100 may acquire second information about the second region through the learned second model using the first information and the generated image as input data (1430).
  • the first model may be stored in the cleaning robot 100, but this is only an example, and may be stored in an external server.
  • the cleaning robot 100 transmits the generated image to the external server, and inputs the image from the external server into the first model, and the first information and image obtained.
  • the second information obtained by inputting the 1 information to the second model may be received.
  • the information on the first area can be more accurately obtained. do.
  • 15 is a flowchart of a system using a recognition model according to an embodiment of the present disclosure.
  • the cleaning robot 100 may generate an image by capturing or photographing an environment (1510).
  • the cleaning robot 100 may obtain first information about the first area through the learned first model using the generated image as input data (1520).
  • the cleaning robot 100 may transmit the generated image and the first information to the server 200 (1530).
  • the server 200 may obtain second information about the second region through the learned second model using the first information and the generated image as input data (1540).
  • the server 200 may search for information related to the first area based on the first information and the second information (1550).
  • the server 200 may transmit the search result related to the first area to the cleaning robot 100 (1560), and the cleaning robot 100 may provide the received search result (1570).
  • the operation of acquiring the first information through the first model for recognizing the object is performed by the cleaning robot 100, and the second information is obtained through the second model for estimating context information.
  • the server 200 can be performed. That is, the object recognition operation capable of performing information even with a small throughput may be performed by the cleaning robot 100, and the server 200 may perform the context estimation operation requiring a large amount of throughput.
  • one server 200 acquires first information or second information through a trained model and searches for information related to the first area. Only a plurality of servers can be performed by dividing the above-described operation. That is, the first server acquires the first information and the second information through the trained model, and the second server searches for information related to the first area based on the first information and the second information obtained from the first server. can do. This is only an example, and all processes performed on the server 200 may be performed on the cleaning robot 100.
  • 16 is a diagram illustrating a process of generating a semantic map, according to an embodiment of the disclosure.
  • the cleaning robot 100 may generate a navigation map as shown in FIG. 16 (b) for a task area as shown in FIG. 16 (a).
  • the cleaning robot may detect the task area using at least one of an IR stereo sensor, an ultrasonic sensor, a LIDAR sensor, a PSD sensor, or an image sensor.
  • the cleaning robot may generate a navigation map for driving the cleaning robot using the result of detecting the task area.
  • a 2-D (dimension) type navigation map as shown in FIG. 16B may be generated using a lidar sensor.
  • the navigation map may be displayed, for example, to be divided into one or more 2-D lines.
  • the cleaning robot 100 targets at least one of the camera 120, the object recognition sensor, the IR stereo sensor, the ultrasonic sensor, the LIDAR sensor, or the image sensor for the task area as shown in FIG. 16 (a). You can use it to detect objects that exist in the task area.
  • the cleaning robot may acquire the recognition information of the object by applying the result of sensing the object to the learned artificial intelligence model.
  • the result detected by the object may include, for example, a captured image of the object, depth information of the object, medium information of the object, or reflection coefficient of the object, but is not limited to the above-described example.
  • the cleaning robot 100 may obtain a name for each object, as shown in (c) of FIG. 16 as object recognition information.
  • the cleaning robot 100 is object recognition information, the type of the object, the size of the object (eg, the height of the object, the width of the object, the depth of the object, etc.) or the characteristics of the object (eg, the color of the object, the object Material, etc.), but is not limited to the above-described example.
  • the cleaning robot 100 may generate a semantic map indicating the environment of the task area in which the cleaning robot 100 performs work by mapping the area of the object included in the navigation map and object recognition information. To this end, the cleaning robot 100 may identify the boundary of the object corresponding to the object in the navigation map. When the boundary of the object is identified, the cleaning robot 100 may determine the area of the object by the boundary of the object.
  • the cleaning robot 100 may map the area of the object and the recognition information of the object.
  • the cleaning robot 100 may map the area of the object included in the navigation map and the recognition information of the object based on the position of the object according to the detection result of the object. Specifically, the cleaning robot 100 detects an object in a situation in which an object is sensed to generate a navigation map (eg, when an object detection result is obtained) and an object in order to obtain object recognition information.
  • a navigation map eg, when an object detection result is obtained
  • object recognition information included in the navigation map can be mapped to each other.
  • the cleaning robot 100 may map the area of the object included in the navigation map and the recognition information of the object based on the shape of the object according to the detection result of the object. Specifically, the cleaning robot 100 compares the shape of the object according to the result of detecting the object to generate the navigation map with the shape of the object included in the recognition information of the object, and when each shape is the same or similar to each other, The region of the object included in the navigation map and the recognition information of the object may be mapped to each other.
  • the cleaning robot 100 may generate a semantic map indicating the environment of the task area, as shown in FIG. 16D.
  • the cleaning robot 100 may display the generated semantic map through a display.
  • the user terminal device may display the semantic map through a display.
  • the user terminal device or an external server may generate a semantic map.
  • the cleaning robot 100 transmits the navigation map and object recognition information to the user terminal device or an external server
  • the user terminal device or an external server may generate a semantic map.
  • the navigation robot 100 transmits a result of detecting a navigation map and an object to a user terminal device or an external server
  • the user terminal device or an external server may generate a semantic map.
  • object recognition information may be displayed as text (eg, the name of the object) or an icon.
  • the object recognition information of the semantic map may be displayed in the form of a reference.
  • the recognition information of the object may be displayed with respect to a leader line indicating the object area, or the object recognition information may be displayed with respect to a color divided by an area of the object.
  • 17 is a diagram illustrating a user interface for use of a semantic map according to an embodiment of the present disclosure.
  • the user terminal device 1700 may display a semantic map.
  • the semantic map can be generated, for example, through the process of FIG. 16 described above.
  • object recognition information may be displayed, for example, on a background of at least one of a 3-D (dimension) map or a navigation map (eg, a rider map) reflecting the structure of the task area.
  • the bed 1701 may be displayed as recognition information of an object in at least a part of the object area of the simatic map.
  • the user may select the bed 1701, which is recognition information.
  • the user terminal device 1700 may display a drop down box 1710 associated with the selected recognition information 1701, as shown in FIG. 17B.
  • names of objects that can replace the selected recognition information may be displayed.
  • the recognition result of the object may be recognized as 50% of a bed, 30% of a sofa, 20% of a table, respectively.
  • names that can be applied to the object may be sequentially displayed in the drop-down box 1710 according to the order in which the recognition result value is high. For example, a bed 1701 in the first field of the list, a sofa 1702 in the second field, and a table 1703 in the third field may be displayed in the drop box down 1710, respectively.
  • the user terminal device 1700 may display the recognition information 1703 of the changed object on the navigation map. have.
  • FIG. 18 is a diagram illustrating a situation in which a cleaning robot is controlled using a semantic map according to an embodiment of the present disclosure.
  • a user may perform a control command using recognition information of an object displayed on the semantic map provided by the user terminal device 1700.
  • the display of the user terminal device 1700 may display recognition information of at least one object displayed on the semantic maps of FIGS. 16 and 17 described above.
  • the user can utter 'Clean in front of the TV' in order to designate a cleaning area.
  • the user terminal device 1700 may recognize the user's utterance command and transmit a user's control command corresponding to the recognized utterance command to the cleaning robot 100.
  • the control command may be a command requesting execution of a task with respect to an area related to a specific object.
  • the cleaning robot 100 may perform a task based on a user's control command. For example, the cleaning robot 100 may move in front of the TV to clean the front of the TV.
  • 19 is a diagram for describing a process of generating a semantic map according to an embodiment of the present disclosure.
  • the cleaning robot 100 may generate a navigation map as shown in FIG. 19B for a task area as shown in FIG. 19A.
  • a navigation map as shown in FIG. 19B for a task area as shown in FIG. 19A.
  • Detailed description of generating a navigation map corresponds to FIGS. 16A and 16B above, and duplicate description is omitted.
  • the cleaning robot 100 may acquire recognition information of each place in the task area using the result of sensing the task area as shown in FIG. 19A.
  • the cleaning robot 100 may acquire a name for each location, as shown in FIG. 19 (c) as recognition information.
  • the cleaning robot 100 may acquire recognition information of each place in the task area by applying a plurality of images of each place in the task area to the learned artificial intelligence model.
  • the cleaning robot 100 detects an object and recognizes the doors 700 and 710 as illustrated in FIGS. 7A and 7B described above, and uses the recognized doors 700 and 710 to detect the structure of the task area. Can decide.
  • the cleaning robot 100 may acquire recognition information of each place classified as the structure of the task area. For example, the cleaning robot 100 may recognize the area where the door is most recognized, the area having the widest structure as the living room, and the area having the wide structure as the car ranking as the bedroom.
  • the cleaning robot 100 may acquire recognition information of each place in the task area using recognition information of an object located in each place in the task area. For example, the cleaning robot 100 may determine the area where the dining table is recognized as the kitchen, the area where the bed is recognized as the bedroom, and the area where the TV or sofa is recognized as the living room.
  • the cleaning robot 100 may generate a semantic map indicating the environment of the task area, as shown in FIG. 19 (d), using the navigation map and the obtained recognition information of each place. .
  • the cleaning robot 100 may display the generated semantic map through a display.
  • the cleaning robot 100 transmits the generated semantic map to an external user terminal device the user terminal device may display the semantic map through a display.
  • the user terminal device or an external server may generate a semantic map.
  • the user terminal device or an external server may generate a semantic map.
  • the cleaning robot 100 transmits the navigation map and the recognition information of each place to the user terminal device or an external server
  • the user terminal device or an external server may generate a semantic map.
  • the cleaning robot 100 transmits a navigation map and a result of detecting an object included in each place of the task area to a user terminal device or an external server
  • the user terminal device or an external server generates a semantic map. can do.
  • FIG. 20 is a diagram illustrating a user interface for use of a semantic map according to an embodiment of the present disclosure.
  • the user terminal device 2000 may display a semantic map.
  • the semantic map may be generated, for example, through the process of FIG. 19 described above.
  • the semantic map may display object recognition information, for example, a background of at least one of a 3-D map or a navigation map reflecting the structure of the task area.
  • the living room 2001 may be displayed as recognition information of a place on at least a part of the object area of the semantic map.
  • the user can select the living room 2001 as recognition information.
  • the user terminal device 2000 may display a drop down box 2010 associated with the selected recognition information 2001, as shown in FIG. 20B.
  • names of places that can replace the selected recognition information may be displayed.
  • the recognition result of one place may be recognized as 50% in the living room, 30% in the bedroom, and 20% in the study.
  • names that can be applied to one place may be sequentially displayed in the drop-down box 2010 according to the order in which the recognition result value is high.
  • a living room 2001 may be displayed in the first field of the list, a bedroom 2002 in the second field, and a library 2003 in the third field.
  • the user terminal device 2000 may display the recognition information 2003 of the changed place on the navigation map. have.
  • 21 is a diagram illustrating a situation in which a cleaning robot is controlled using a semantic map according to an embodiment of the present disclosure.
  • a user may perform a control command using recognition information of each place displayed on the semantic map provided by the user terminal device 2000.
  • the display of the user terminal device 2000 may display recognition information of each place displayed on the semantic map of FIGS. 19 and 20 described above.
  • the user may ignite 'Please clean the living room' in order to designate a cleaning area.
  • the user terminal device 2000 may recognize the user's utterance command and transmit a user's control command corresponding to the recognized user's utterance command to the cleaning robot 100.
  • the user's control command may be a command requesting execution of a task for a specific place.
  • the cleaning robot 100 may perform a task based on a user's control command. For example, the cleaning robot 100 may move to the living room and clean the living room.
  • the user terminal device may display a semantic map including both the recognition information of the object of FIG. 17 (a) and the recognition information of each place of FIG. 20 (a).
  • the user terminal device may provide a user interface capable of changing the selected recognition information.
  • the user terminal device may provide a candidate list for changing the selected recognition information.
  • the candidate list may include changeable names, and the names may be arranged according to a high probability value in consideration of the recognition result of the artificial intelligence model. Among them, when a user input for selecting a name is detected, the user terminal device may change and display the recognition information of the existing object with the selected name.
  • 22 is a diagram illustrating a process of recognizing an object according to an embodiment of the present disclosure.
  • the cleaning robot 100 may acquire the recognition information of the object by applying the image of the object using the camera 120 to the trained artificial intelligence model.
  • the cleaning robot 100 may acquire the recognition information of the place by applying the image photographing the place of the task area to the trained artificial intelligence model using the camera 120.
  • the cleaning robot 100 when the cleaning robot 100 photographs an object in a specific place, the cleaning robot 100 applies the photographed image to the trained artificial intelligence model to acquire object recognition information and place recognition information together.
  • the electronic device provided with the artificial intelligence model eg, an external server
  • the artificial intelligence model eg, an external server
  • the electronic device provided with the artificial intelligence model is a feature map of a termination generated through an object recognition network (eg, a convolutional network model) 2210.
  • an object recognition network eg, a convolutional network model
  • the learning step may be simplified as the loss for recognition of the object and the loss for recognition of the place are simultaneously learned.
  • the recognition result of the object included in the captured image may be recognized as a table 50%, a table 30%, and a desk 20%.
  • the electronic device 2300 may finally recognize the object as a table rather than a table.
  • the recognition result of the object and the place where the object is placed is a study room and a table, respectively, the object may be finally recognized as a desk.
  • the recognition result of the object and the place where the object is placed is a front door and a door, respectively, the object may be finally recognized as a front door.
  • the object when the recognition result of the object and the place where the object is placed is a room and a door, respectively, the object may be finally recognized as a visit. As another example, when the recognition result of the object and the place where the object is placed is a threshold and a room, respectively, the object may be finally recognized as a visited threshold. As another example, when the recognition result of the object and the place where the object is placed is a threshold and a veranda, respectively, the object may be finally recognized as a veranda threshold.
  • the electronic device 2200 or the cleaning robot 100 may more efficiently perform a semantic map indicating the environment of the task area.
  • the semantic map displays not only the recognition information of the object, but also the place information of the object.
  • FIG. 23 is a diagram illustrating a process of generating a semantic map according to an embodiment of the present disclosure.
  • the semantic map includes recognition information of an object and recognition information of a place (or , The context of the place).
  • the cleaning robot 100 may apply the captured image to the object recognition module 2230 of FIG. 22 to generate a first semantic map as shown in (a) of FIG. 23.
  • a first semantic map of FIG. 23A as object recognition information, an object name may be displayed at a position corresponding to the object.
  • the cleaning robot 100 may apply the captured image to the location recognition module 2240 of FIG. 22 to generate a second semantic map as shown in FIG. 23B.
  • the name of a place as recognition information of the place may be displayed in an area corresponding to the place among the divided areas of the task.
  • the cleaning robot 100 may combine the first semantic map of FIG. 23 (a) and the second semantic map of FIG. 23 (b) to generate a final semantic map as shown in FIG. 23 (c).
  • the final semantic map of FIG. 23C as the environment information of the task area, the name of the object and the place of the object existing in the task area may be displayed together.
  • FIG. 24 is a diagram illustrating a situation in which a cleaning robot is controlled using a semantic map according to an embodiment of the present disclosure.
  • a user may perform a control command using the object displayed on the semantic map provided by the user terminal device 2400 and recognition information of each place.
  • an object displayed on the semantic map of FIG. 23 described above and recognition information of each place may be displayed on the display of the user terminal device 2400.
  • the user may utter 'Please clean in front of the table in the living room' to designate a cleaning area.
  • the user terminal device 2400 may recognize the user's utterance command.
  • the user terminal device 2400 may transmit a user's control command corresponding to the recognized utterance command to the cleaning robot 100.
  • the control command may be a command requesting execution of a task with respect to an area related to a specific object located in a specific place.
  • the cleaning robot 100 may perform a task based on a user's control command. For example, the cleaning robot 100 may clean the front of the table by moving in front of the table located in the living room among the places (living room or study, etc.) where the table is located.
  • the cleaning robot 100 may directly recognize the user's utterance command according to the user's utterance command.
  • the cleaning robot 100 includes an automatic speech recognition (ASR) module, an automatic speech recognition (ASR) module, and natural language understanding for recognizing a user's speech command. It may include at least one of a (NLU) module and a path planner module.
  • ASR automatic speech recognition
  • ASR automatic speech recognition
  • NLU natural language understanding
  • the cleaning robot 100 may recognize the user's utterance command using at least one of the modules described above.
  • the cleaning robot 100 may perform a task according to the recognized user's control command. For example, the cleaning robot 100 may perform a task according to a user's control command based on environmental information (eg, the name of an object, the name of a place, etc.) included in the stored semantic map.
  • environmental information eg, the name of an object, the name of a place, etc.
  • a third voice recognition device may recognize a user's voice command according to a user's voice command.
  • the third speech recognition device may include at least one of the above-described automatic speech recognition module, automatic speech recognition module, natural language understanding module, and pass planner module.
  • the third voice recognition device may recognize a user's utterance command and transmit a user's control command corresponding to the recognized utterance command to the cleaning robot 100. Accordingly, it is possible to perform a task according to a user's control command while the cleaning robot 100 minimizes the limitation of a place or device.
  • 25 is a view showing the mechanism configuration of a cleaning robot according to an embodiment of the present disclosure.
  • FIG. 25 (a) shows a perspective view of the cleaning robot 100 with a plurality of sensors
  • FIG. 25 (b) shows a front view of the cleaning robot 100 with a plurality of sensors.
  • the cleaning robot 100 of FIG. 25 is a plurality of sensors, and includes at least one of an IR stereo sensor, a LIDAR sensor, an ultrasonic sensor, a 3D sensor, an object recognition sensor, a fall detection sensor, or a Position Sensitive Diodes (PSD) sensor. It can contain.
  • an IR stereo sensor a LIDAR sensor
  • an ultrasonic sensor a 3D sensor
  • an object recognition sensor a fall detection sensor
  • PSD Position Sensitive Diodes
  • the ultrasonic sensor may include, for example, two sensor modules for light emission and two sensor modules for light reception.
  • the cleaning robot 100 may detect an object on the front side using a 3D sensor and extract a 3D dimensional shape of the object. Accordingly, it is possible for the cleaning robot 100 to acquire object size and distance information.
  • the cleaning robot 100 may acquire an object type by sensing an object on the front surface using an object recognition sensor. For example, the cleaning robot 100 may photograph an object using a camera included in the object recognition sensor, apply the photographed image to the learned artificial intelligence model, and obtain a type of object as an application result.
  • the cleaning robot 100 may recognize a step difference (for example, a step difference between the floor of the living room and the entrance of the entrance) when driving forward and backward using the fall detection sensor.
  • Fall detection sensors for example, may be provided two at each of the front and rear.
  • the cleaning robot 100 may detect the position of the object at a close distance (eg, within 15 cm) using a PSD sensor.
  • the cleaning robot 100 may detect an object using a PSD sensor or perform cleaning while driving along a wall.
  • the PSD sensor for example, may be provided on the left and right sides of the front in a 45-degree outward direction, or may be provided on the right and left sides of the cleaning robot 100, respectively.
  • a plurality of sensors may be provided on the front, rear, or side surfaces of the cleaning robot 100.
  • at least one ultrasonic sensor 2501 to 2504 at least one 3D sensor 2511, at least one camera (eg, RGB camera) 2521, and an IR stereo sensor (eg, at the front of the cleaning robot 100)
  • At least one of a docking IR stereo sensor (2531), a PSD sensor (2541, 2542), a lidar sensor (2551), or a bumper sensor (2561) may be provided.
  • another PSD sensor (not shown) may be provided on the side of the cleaning robot 100.
  • 26A and 26B are views illustrating a detection range of a cleaning robot according to an embodiment of the present disclosure.
  • FIG. 26A (a) is a plan view of the cleaning robot 100, respectively, FIG. 26A (b) is a side view of the cleaning robot 100, and FIGS. 26B (c) and (d) are perspective views of the cleaning robot 100. Shows.
  • the cleaning robot 100 may detect an object or an indoor structure while driving using a plurality of sensors.
  • the sensing range of the 3D sensor 2511 is approximately the first range 2510a
  • the sensing range of the ultrasonic sensors 2501 to 2504 is approximately the second range 2500a
  • the detection ranges 2542 and 2542 of the PSD sensor are approximately the third ranges 2540a and 2540b
  • the detection ranges of the PSD sensors 2543 on the side are approximately the fourth ranges 2540c and 2540d
  • the sensing range of the sensor 2551 is approximately the fifth range 2550a
  • the angle of view of the camera 2521 may be approximately the sixth range 2520a, but the above-described example is only one embodiment and includes a plurality of sensors. Based on their specifications or mounting positions, the sensing or shooting range may be variously predicted.
  • the cleaning robot 100 may select at least one sensor among the plurality of sensors described above based on the recognition information of the object.
  • the cleaning robot 100 may detect an object using at least one selected sensor, and acquire additional information about the object using the detected result.
  • the cleaning robot 100 may determine a task to be performed by the cleaning robot 100 based on additional information about the object.
  • FIG. 27 is a flowchart of a cleaning robot according to an embodiment of the present disclosure.
  • the cleaning robot 100 may generate a navigation map for driving the cleaning robot 100 by using a result of at least one sensor detecting a task area in which the object is placed (2701). .
  • the cleaning robot 100 may acquire the recognition information of the object by applying the image captured by the camera 120 to the learned artificial intelligence model (2702).
  • the operation of acquiring the recognition information of the object may be performed prior to the operation of the cleaning robot 100 generating the navigation map in operation 2701, or the recognition information of the object may be obtained in the process of generating the navigation map It may be.
  • the cleaning robot 100 may acquire the recognition information of the object by applying the image captured by the camera 120 to the learned artificial intelligence model located in an external server.
  • the cleaning robot 100 may generate a semantic map indicating the environment of the task area by mapping the object area included in the navigation map and the object recognition information (2703).
  • the cleaning robot 100 may perform a task of the cleaning robot based on a user's control command using the semantic map (2704).
  • the user's control command may be a command for requesting execution of a task with respect to a specific object area or a specific place.
  • the cleaning robot 100 may acquire recognition information of each place in the task area.
  • the cleaning robot 100 may generate a semantic map indicating the environment of the task area using recognition information of each acquired place and recognition information of the mapped object.
  • the cleaning robot 100 maps a region of an object included in a navigation map and recognition information of an object based on at least one of an object location or an object shape according to an object detection result, to thereby perform a task It is possible to create a semantic map representing the environment of a region.
  • the cleaning robot 100 may identify a boundary of an object corresponding to the object in the navigation map.
  • the cleaning robot 100 may map a region of an object determined by a boundary of the object and recognition information of the object, and generate a semantic map indicating the environment of the task region.
  • the cleaning robot 100 may sense an object using at least one sensor selected based on object recognition information.
  • the cleaning robot 100 may acquire additional information about the object by using a result sensed by at least one sensor.
  • the cleaning robot 100 may set priorities for a plurality of sensors according to object recognition information.
  • the cleaning robot 100 may acquire additional information about an object using a result detected by at least one sensor according to a priority among a plurality of sensors.
  • the cleaning robot 100 may generate a navigation map for driving the cleaning robot 100 by using a result of at least one sensor detecting a task area (2801).
  • the cleaning robot 100 may acquire the recognition information of the place included in the task area by applying the image of the place where the camera 120 is included in the task area to the learned artificial intelligence model (2802). .
  • the cleaning robot 100 maps the area corresponding to the place included in the navigation map and the recognition information of the place, and generates a semantic map indicating the environment of the task area It can be done (2803).
  • the cleaning robot 100 may perform the task of the cleaning robot 100 based on a user's control command using the semantic map (2804).
  • 29 is a flowchart of a cleaning robot according to another embodiment of the present disclosure.
  • the cleaning robot 100 may photograph an object around the cleaning robot 100 (2901).
  • the cleaning robot 100 may acquire the recognition information of the object included in the image by applying the captured image to the learned artificial intelligence model (2902).
  • the cleaning robot 100 may acquire the recognition information of the object by applying the photographed image to a learned artificial intelligence model located in an external server.
  • the cleaning robot 100 may obtain additional information about the object using a result of sensing the object by at least one sensor selected based on recognition information of the acquired object, among a plurality of sensors (2903).
  • the cleaning robot 100 among the detection results detected by a plurality of sensors within a predetermined time (eg, 10 ms) based on a certain time point, detection results sensed by at least one sensor selected based on object recognition information. Only selectively can be used to obtain additional information about the object.
  • the at least one sensor selected based on the recognition information of the object may be one or a plurality.
  • the selected plurality of sensors may have priority.
  • the cleaning robot 100 may acquire additional information about the object by adding a weight to the detection result of the sensor having a high priority.
  • the cleaning robot 100 may acquire additional information about the object by adding weights to the results detected by the IR stereo sensor. have. Specifically, the cleaning robot 100 determines the bounding box for the object, and decreases the threshold value of the IR stereo sensor for an area where the determination result of the bounding box and the object detection result through the IR stereo sensor do not match. Can detect.
  • the cleaning robot 100 sets priorities for a plurality of sensors according to object recognition information, and uses a result detected by at least one sensor among the plurality of sensors according to a priority. Additional information about the object may be obtained.
  • the cleaning robot 100 adds a weight to a result detected by the lidar sensor when a priority is set to a lidar sensor among a plurality of sensors according to object recognition information, and then adds a weight to the object. Additional information can be obtained.
  • the cleaning robot 100 adds a weight to a result detected by the ultrasonic sensor to add additional information about the object when the priority is set to the ultrasonic sensor among a plurality of sensors according to the object recognition information Can be obtained.
  • the priority of the ultrasonic sensor is set high among the plurality of sensors according to the recognition information of the object, it may be a case where the recognized object is a transparent or black index object.
  • the cleaning robot 100 may determine a task to be performed by the cleaning robot 100 (2904).
  • the mobile device may be, for example, various forms such as a service robot for a public place, a transfer robot at a production site, a worker assistance robot, a provisional robot, a security robot, or an autonomous vehicle.
  • the task of the present disclosure may be a task according to the purpose of the mobile device.
  • the task of the cleaning robot is a function of avoiding an object or inhaling dust in a home
  • the task of the worker assisting robot may be a function of avoiding an object or moving an object.
  • the task of the security robot may be a function of evading an object, detecting an intruder, providing an alarm, or photographing an intruder.
  • the task of the autonomous vehicle may be a function of avoiding another vehicle or an obstacle, or controlling a steering device or an acceleration / deceleration device.
  • module used in the present disclosure may include a unit implemented in hardware, software, or firmware, and may be used interchangeably with terms such as logic, logic blocks, components, or circuits.
  • the module may be an integrally configured component or a minimum unit of the component or a part thereof performing one or more functions.
  • the module may be implemented in the form of an application-specific integrated circuit (ASIC).
  • ASIC application-specific integrated circuit
  • a storage medium readable by a machine eg, a cleaning robot 100, a server (not shown) capable of communicating with the cleaning robot 100
  • a memory ( 130) may be implemented as software (eg, a program) including one or more instructions stored in a memory (not shown) of a server.
  • the processor of the device eg, the processor 140, the processor of the server (not shown)
  • the one or more instructions may include code generated by a compiler or code executable by an interpreter.
  • the storage medium readable by the device may be provided in the form of a non-transitory storage medium.
  • 'non-transitory' only means that the storage medium is a tangible device, and does not include a signal (eg, electromagnetic wave), and this term is used when data is semi-permanently stored in the storage medium. It does not distinguish between temporary storage cases.
  • a method according to various embodiments disclosed in the present disclosure may be provided as being included in a computer program product.
  • Computer program products are commodities that can be traded between sellers and buyers.
  • the computer program product is distributed in the form of a device-readable storage medium (eg compact disc read only memory (CD-ROM)), or through an application store (eg Play StoreTM) or two user devices ( It can be distributed (eg, downloaded or uploaded) directly or online between smartphones).
  • a portion of the computer program product may be temporarily stored at least temporarily in a storage medium readable by a device such as a memory of a manufacturer's server, an application store's server, or a relay server, or temporarily generated.
  • each component (eg, module or program) of the above-described components may include a singular or a plurality of entities.
  • one or more components or operations of the above-described corresponding components may be omitted, or one or more other components or operations may be added.
  • a plurality of components eg, modules or programs
  • the integrated component may perform one or more functions of each component of the plurality of components the same or similar to that performed by the corresponding component among the plurality of components prior to the integration. .
  • operations performed by a module, program, or other component may be executed sequentially, in parallel, repeatedly, or heuristically, or one or more of the operations may be executed in a different order, or omitted Or, one or more other actions can be added.

Landscapes

  • Engineering & Computer Science (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Geometry (AREA)
  • Human Computer Interaction (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
  • Electromagnetism (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Automation & Control Theory (AREA)

Abstract

본 개시에 따른 청소 로봇의 태스크 수행 방법은, 상기 청소 로봇 주변의 오브젝트를 촬영하는 동작, 상기 촬영된 영상을 학습된 인공지능 모델에 적용하여 상기 영상에 포함된 오브젝트의 인식 정보를 획득하는 동작, 복수의 센서들 중에서, 상기 오브젝트의 인식 정보에 기반하여 선택된 적어도 하나의 센서가 상기 오브젝트를 감지한 결과를 이용하여 상기 오브젝트에 대한 추가 정보를 획득하는 동작, 및 상기 오브젝트에 대한 추가 정보에 기반하여 상기 청소 로봇의 태스크를 수행하는 동작을 포함한다. 학습된 인공 지능 모델로는, 예로, 가중치를 가지는 복수의 네트워크 노드들이 서로 다른 레이어에 위치하여 컨볼루션 관계에 따라 데이터를 주고 받는 딥러닝 신경망 모델이 이용될 수 있으나, 전술한 예에 제한되지는 않는다.

Description

청소 로봇 및 그의 태스크 수행 방법
본 발명은 청소 로봇 및 청소 로봇의 태스크 방법에 관한 것으로, 구체적으로는, 청소 로봇의 주변 오브젝트(예로, 장애물)에 대한 정보를 이용하여 적합한 태스크를 제공할 수 있는 로봇 및 그의 제어 방법에 관한 것이다.
로봇 기술의 발전에 따라 전문화된 학술 분야 또는 대규모의 노동력을 요하는 산업 분야뿐만 아니라 일반적인 가정에도 로봇의 공급이 보편화 되고 있다. 사용자에게 가사 서비스를 제공하는 서비스 로봇, 청소 로봇, 애완용 로봇 등이 많이 보급되고 있다.
특히 청소 로봇과 같은 경우, 청소 로봇 주변의 이물질, 구조물, 장애물 등의 오브젝트와 관련된 정보를 구체적으로 판단하고, 각각의 오브젝트에 대해 적합한 태스크를 수행하는 것이 매우 중요하다. 종래의 청소 로봇은 제한된 센서 조합으로 인해 오브젝트의 구체적인 정보를 획득하는 것에 제한이 있다. 즉, 종래의 청소 로봇은 대상 오브젝트가 어떤 오브젝트인지에 대한 정보가 없이 센서의 센싱 능력에만 의존하여 모두 동일한 패턴의 회피 주행만을 할 뿐이다.
이에 따라, 청소 로봇 주변의 오브젝트를 인식하고, 대상 오브젝트에 대한 청소 로봇의 가장 적합한 태스크를 판단하고, 나아가 주행 및 회피 방법의 차별화를 하는 것이 필요하다.
본 개시는 상술한 필요성에 따른 것으로, 본 개시의 목적은, 청소 로봇의 복수의 센서를 이용해 주변 오브젝트에 대하여 적합한 태스크를 수행하는 서비스를 제공할 수 있는 청소 로봇 및 그의 제어 방법을 제공함에 있다.
상술한 서비스를 제공하기 위한 본 개시의 일 실시 예에 따른, 청소 로봇의 태스크 수행 방법은 상기 청소 로봇 주변의 오브젝트를 촬영하는 동작, 상기 촬영된 영상을 학습된 인공지능 모델에 적용하여 상기 영상에 포함된 오브젝트의 인식 정보를 획득하는 동작, 복수의 센서들 중에서 상기 오브젝트의 인식 정보에 기반하여 선택된 적어도 하나의 센서가 상기 오브젝트를 감지한 결과를 이용하여 상기 오브젝트에 대한 추가 정보를 획득하는 동작, 및 상기 오브젝트에 대한 추가 정보에 기반하여 상기 청소 로봇의 태스크를 수행하는 동작을 포함한다.
상술한 서비스를 제공하기 위한 본 개시의 일 실시 예에 따른, 청소 로봇은 복수의 센서들을 포함하는 센싱부, 카메라, 및 상기 청소 로봇 주변의 오브젝트를 촬영하도록 상기 카메라를 제어하고, 상기 촬영된 영상을 학습된 인공지능 모델에 적용하여 상기 영상에 포함된 오브젝트의 인식 정보를 획득하고, 복수의 센서들 중에서, 상기 오브젝트의 인식 정보에 기반하여 선택된 적어도 하나의 센서가 상기 오브젝트를 감지한 결과를 이용하여 상기 오브젝트에 대한 추가 정보를 획득하고, 상기 오브젝트에 대한 추가 정보에 기반하여 상기 청소 로봇의 태스크를 수행하는 프로세서를 포함한다.
상술한 바와 같은 본 개시의 다양한 실시 예에 따르면, 청소 로봇은 주변의 오브젝트의 인식 정보 및 추가 정보 등을 고려하여, 오브젝트를 제거하거나 회피하는 등과 같은 가장 적합한 태스크를 수행하는 서비스를 제공할 수 있다,
또한, 상술한 바와 같은 본 개시의 다양한 실시 예에 따르면, 청소 로봇은 태스크 영역의 환경을 나타내는 시맨틱 맵을 제공할 수 있다. 이에 따라, 시맨틱 맵을 제공 받은 사용자는 오브젝트 또는 장소의 명칭 등을 이용하여 청소 로봇의 태스크를 제어할 수 있어, 사용자의 편의성이 크게 향상될 수 있다.
도 1은 본 개시의 일 실시 예에 따른 청소 로봇이 장애물의 오브젝트를 인식 및 감지하는 것을 설명하기 위한 도면이다.
도 2a 및 도 2b는 본 개시의 일 실시 예에 따른, 청소 로봇의 구성을 설명하기 위한 간단한 블록도이다.
도 3은 본 개시의 일 실시 예에 따른, 청소 로봇의 구성을 설명하기 위한 상세한 블록도이다.
도 4a 내지 도 4d는 본 개시의 일 실시 예에 따른, 청소 로봇이 IR 스테레오 센서를 통한 감지 결과 오브젝트에 대한 추가 정보를 획득하는 것을 설명하기 위한 도면이다.
도 5a 내지 5c는 본 개시의 일 실시 예에 따른, 청소 로봇이 라이다(LIDAR) 센서를 통한 감지 결과 오브젝트에 대한 추가 정보를 획득하는 것을 설명하기 위한 도면이다.
도 6a 및 6b는 본 개시의 일 실시 예에 따른, 청소 로봇이 초음파 센서를 통한 감지 결과 오브젝트에 대한 추가 정보를 획득하는 것을 설명하기 위한 도면이다.
도 7a 내지 7c는 본 개시의 일 실시 예에 따른, 청소 로봇이 댁 내 구조를 파악하는 것을 도시하기 위한 도면이다.
도 8a 및 8b는 본 개시의 일 실시 예에 따른, 청소 로봇이 댁 내 구조 및 오브젝트에 대한 추가 정보에 기반하여 시맨틱 맵을 생성하는 것을 설명하기 위한 도면이다.
도 9a 및 9b는 본 개시의 일 실시 예에 따른, 청소 로봇이 바닥 상에 존재하는 위험물질을 사용자에게 알려주는 것을 설명하기 위한 도면이다.
도 10은 본 개시의 일 실시 예에 따른, 청소 로봇이 청소하지 않을 영역을 지정하는 것을 설명하기 위한 도면이다.
도 11a 및 도 11b는, 다양한 실시 예에 따른 학습부 및 인식부를 나타내는 블록도이다.
도 12는, 본 개시의 일 실시 예에 따른 청소 로봇 및 서버가 서로 연동함으로써 데이터를 학습하고 인식하는 예시를 나타내는 도면이다.
도 13은, 본 개시의 일 실시 예에 따른 인식 모델을 이용하는 네트워크 시스템의 흐름도이다.
도 14는, 본 개시의 일 실시 예에 따른 청소 로봇이 인식 모델을 이용하여 제1 영역에 대한 검색 결과를 제공하는 실시 예를 설명하기 위한 흐름도이다.
도 15는, 본 개시의 일 실시 예에 따른 인식 모델을 이용하는 시스템의 흐름도이다.
도 16은, 본 개시의 일 실시 예에 따른 시맨틱 맵을 생성하는 것을 설명하기 위한 도면이다.
도 17은, 본 개시의 일 실시 예에 따른 시맨틱 맵의 이용을 위한 사용자 인터페이스를 나타내는 도면이다.
도 18은, 본 개시의 일 실시 예에 따른 시맨틱 맵을 이용하여 청소 로봇을 제어하는 상황을 나타내는 도면이다.
도 19는, 본 개시의 일 실시 예에 따른 시맨틱 맵을 생성하는 것을 설명하기 위한 도면이다.
도 20은, 본 개시의 일 실시 예에 따른 시맨틱 맵의 이용을 위한 사용자 인터페이스를 나타내는 도면이다.
도 21은, 본 개시의 일 실시 예에 따른 시맨틱 맵을 이용하여 청소 로봇을 제어하는 상황을 나타내는 도면이다.
도 22는, 본 개시의 일 실시 예에 따른 오브젝트를 인식하는 과정을 나타내는 도면이다.
도 23은, 본 개시의 일 실시 예에 따른 시맨틱 맵을 생성하는 과정을 설명하기 위한 도면이다.
도 24는, 본 개시의 일 실시 예에 따른 시맨틱 맵을 이용하여 청소 로봇을 제어하는 상황을 나타내는 도면이다.
도 25는, 본 개시의 일 실시예에 따른 청소 로봇의 기구 구성을 나타내는 도면이다.
도 26a 및 도 26b는, 본 개시의 일 실시 예에 따른 청소 로봇의 감지 범위를 나타내는 도면이다.
도 27 내지 도 29는, 본 개시의 일 실시 예에 따른 청소 로봇의 흐름도들이다.
이하, 본 문서의 다양한 실시예가 첨부된 도면을 참조하여 기재된다. 그러나, 이는 본 문서에 기재된 기술을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 문서의 실시예의 다양한 변경(modifications), 균등물(equivalents), 및/또는 대체물(alternatives)을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 구성요소에 대해서는 유사한 참조 부호가 사용될 수 있다.
또한, 본 문서에서 사용된 "제 1," "제 2," 등의 표현들은 다양한 구성요소들을, 순서 및/또는 중요도에 상관없이 수식할 수 있고, 한 구성요소를 다른 구성요소와 구분하기 위해 사용될 뿐 해당 구성요소들을 한정하지 않는다. 예를 들면, 제 1 사용자 기기와 제 2 사용자 기기는, 순서 또는 중요도와 무관하게, 서로 다른 사용자 기기를 나타낼 수 있다. 예를 들면, 본 문서에 기재된 권리 범위를 벗어나지 않으면서 제 1 구성요소는 제 2 구성요소로 명명될 수 있고, 유사하게 제 2 구성요소도 제 1 구성요소로 바꾸어 명명될 수 있다.
어떤 구성요소(예: 제 1 구성요소)가 다른 구성요소(예: 제 2 구성요소)에 "(기능적으로 또는 통신적으로) 연결되어((operatively or communicatively) coupled with/to)" 있다거나 "접속되어(connected to)" 있다고 언급된 때에는, 상기 어떤 구성요소가 상기 다른 구성요소에 직접적으로 연결되거나, 다른 구성요소(예: 제 3 구성요소)를 통하여 연결될 수 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소(예: 제 1 구성요소)가 다른 구성요소(예: 제 2 구성요소)에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 상기 어떤 구성요소와 상기 다른 구성요소 사이에 다른 구성요소(예: 제 3 구성요소)가 존재하지 않는 것으로 이해될 수 있다.
본 문서에서 사용된 용어들은 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 다른 실시예의 범위를 한정하려는 의도가 아닐 수 있다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함할 수 있다. 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 용어들은 본 문서에 기재된 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가질 수 있다. 본 문서에 사용된 용어들 중 일반적인 사전에 정의된 용어들은, 관련 기술의 문맥상 가지는 의미와 동일 또는 유사한 의미로 해석될 수 있으며, 본 문서에서 명백하게 정의되지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다. 경우에 따라서, 본 문서에서 정의된 용어일지라도 본 문서의 실시예들을 배제하도록 해석될 수 없다.
이하에서, 첨부된 도면을 이용하여 본 발명의 다양한 실시 예들에 대하여 구체적으로 설명한다. 도 1은 본 개시의 일 실시 예에 따른 청소 로봇이 장애물의 오브젝트를 인식 및 감지하는 것을 설명하기 위한 도면이다.
도 1을 참조하면, 청소 로봇(100)은 청소 로봇 주변의 오브젝트(200)를 인식할 수 있다. 이때, 청소 로봇(100)은 스스로 이동하며 사용자에게 청소 서비스를 제공하는 장치로, 다양한 형태의 전자장치로 구현될 수 있다. 예를 들면, 청소 로봇(100)은 가정용 청소 로봇, 대형건물용 청소 로봇, 공항용 청소 로봇 등 다양한 목적을 위해 원기둥 형태, 직육면체 형태 등 다양한 형태로 구현될 수 있다. 일 실시 예에 따르면, 청소 로봇(100)은 바닥의 이물질을 단순히 제거하는 태스크를 수행할 뿐만 아니라, 사용자의 명령에 따라 물체를 옮기는 태스크도 수행할 수 있다.
한편 청소 로봇(100)은 카메라를 통해 오브젝트(200)를 포함하는 영상을 촬영할 수 있고, 촬영된 영상을 사물을 인식하도록 학습된 인공지능 모델에 입력하여 오브젝트를 인식할 수 있다. 이때, 인공지능 모델은 청소 로봇(100)에 포함되어 있을 수도 있고, 외부 서버(미도시)에 포함되어 있을 수도 있다. 인공 지능 모델은, 예로, 인공 지능 알고리즘에 기초한 지도 학습(supervised learning) 방식 또는 비지도 학습(unsupervised learning) 방식에 따라 학습된 모델일 수 있다. 인공 지능 모델의 예로, 신경망 모델은 가중치를 가지는 복수의 네트워크 노드들이 포함되도록 구성될 수 있으며, 복수의 네트워크 노드들은 서로 다른 깊이(또는, 레이어)에 위치하면서 컨볼루션(convolution) 연결 관계에 따라 데이터를 주고 받을 수 있다. 예컨대, DNN(Deep Neural Network), RNN(Recurrent Neural Network), BRDNN(Bidirectional Recurrent Deep Neural Network) 등이 신경망 모델로서 사용될 수 있으나, 이에 한정되지 않는다.
청소 로봇(100)은 오브젝트(200)를 의자로 인식한 경우, 오브젝트(200)에 대한 더욱 정밀한 정보를 획득하기 위해 RGB 카메라 이외의 센서를 이용할 수 있다. 구체적으로 청소 로봇(100)은 오브젝트가 의자인 경우 의자 다리의 위치 및 다리 간의 간격에 대한 정보를 획득하기 위해 라이다(LIDAR) 센서를 우선적으로 사용하도록 기설정되어 있을 수 있고, 복수의 센서를 통한 결과 값 중 라이다(LIDAR) 센서를 통한 결과에 더 높은 가중치를 부여하도록 설정되어 있을 수 있다.
즉, 청소 로봇(100)은 인식된 오브젝트(200)에 대한 정밀한 정보를 위해 라이다 센서를 통해 오브젝트(200)를 센싱하기 위한 레이저 펄스(220)를 발사할 수 있다. 이에 대하여 더욱 자세한 내용은 후술하기로 한다.
한편, 청소 로봇(100)은 청소 로봇의 제1 위치에서의 속도 정보, 제1 위치에서의 오브젝트 영상 정보 및 제2 위치에서의 속도 정보, 제2 위치에서 영상 정보를 저장할 수 있다. 청소 로봇(100)은 저장된 정보들에 기반하여 제1 위치와 제2 위치 간의 거리(d)를 판단할 수 있고, 이를 통해 특정 위치에서 오브젝트(200)까지의 거리를 판단할 수 있다.
청소 로봇(100)은 라이다 센서와 같은 추가적인 센서를 통해 의자 다리의 위치, 간격 등의 정밀한 정보 및 오브젝트(200)까지의 거리 정보에 기반하여 청소 로봇(100)이 오브젝트(200)와 관련하여 앞으로 취할 태스크를 판단할 수 있다. 예를 들어, 청소 로봇(100)은 의자 다리의 간격의 정보에 기반하여 의자 다리 사이를 청소하는 태스크를 수행하기 위해 진행 속도 및 방향을 제어할 수 있다.
한편, 청소 로봇(100)은 인식된 오브젝트(200)에 대한 접근금지 영역 또는 바운딩 박스(bounding box)(210)를 판단할 수 있다. 즉, 청소 로봇(100)은 오브젝트(200)에 대해 RGB 카메라를 통한 사물인식 및 접근금지 영역(210)에 대한 정보 외에 추가적인 센싱 정보가 없는 경우에 접근금지 영역(210)까지만 접근할 수 있다.
상술한 예에서는 오브젝트가 의자인 경우로써 라이다 센서를 이용하는 것을 예시로 들었으나, 이에 한정하지 않으며, 다양한 오브젝트에 대하여 다양한 센서를 이용할 수 있다.
청소 로봇(100)은 오브젝트 인식 결과에 따라 오브젝트에 따라 수행할 태스크를 상이하게 판단할 수 있다. 예를 들면, 청소 로봇(100)은 오브젝트를 시리얼로 인식한 경우 시리얼을 제거할 수 있고, 오브젝트를 쿠션인 경우 쿠션을 밀어버릴 수 있고, 오브젝트를 유리컵과 같이 깨질 수 있는 물체로 인식한 경우 속도를 낮추고 완전회피를 위해 정밀한 인식을 수행할 수 있다. 나아가, 오브젝트를 위험물로 인식한 경우 청소로봇(100)은 오브젝트에 대한 영상을 촬영하고 사용자 단말장치로 영상을 전송할 수도 있다. 또한 인식한 오브젝트가 애완동물의 배설물과 같은 더러운 것으로 인식한 경우에도 마찬가지로 완전회피를 위해 정밀인식을 수행할 수 있고, 사용자단말장치로 오브젝트를 포함하는 영상을 전송할 수 있다.
상술한 바와 같이 청소 로봇(100)은 특히 회피주행을 하는 경우 근접회피주행을 할 것인지 완전회피주행을 할 것인지 등을 판단하기 위해 가용 가능한 적어도 하나의 센서들의 감지결과의 조합을 통해 오브젝트에 대한 정밀한 정보를 획득할 수 있다. 이에 대해서는 추후에 설명하도록 한다. 
도 2a는 본 개시의 일 실시 예에 따른, 청소 로봇의 구성을 설명하기 위한 간단한 블록도이다.
도 2a를 참조하면, 청소 로봇(100)은 센싱부(110), 카메라(120), 메모리(130) 및 프로세서(140)로 구성될 수 있다.
센싱부(110)는 다양한 종류의 센서를 포함할 수 있다. 구체적으로 센싱부(110)는 IR 스테레오 센서, 라이다(LIDAR) 센서, 초음파 센서 등을 포함할 수 있다. 각각의 IR 스테레오 센서, 라이다(LIDAR) 센서, 초음파 센서들은 하나의 센서로 구현될 수도 있으나, 각각 별도의 센서로 구현될 수도 있다.
IR 스테레오 센서는 오브젝트의 3차원의 형상 및 거리 정보를 센싱할 수 있다. 특히, IR 스테레오 센서는 오브젝트의 3D depth 정보를 획득할 수 있다. 다만, IR 스테레오 센서는 검정색, 투명색 또는 금속에 대한 센싱이 불가하다는 단점이 있다.
청소 로봇(100)은 라이다(LIDAR) 센서를 이용하여 오브젝트에 대한 2D line 형상 및 거리 정보를 획득할 수 있다. 이를 통해 오브젝트에 대한 공간 및 주변 물체의 거리 정보가 획득될 수 있다. 다만, 라이다 센서는 검정색, 투명색 또는 금속에 대한 센싱이 불가하다는 단점이 있다.
초음파 센서는 장애물에 대한 거리정보를 획득할 수 있다. 초음파 센서는 센싱 범위가 상대적으로 제한된다는 단점이 있으나, 검정색, 투명, 금속에 대한 감지가 가능하다는 장점이 있다.
이 외에도 센싱부(110)는 먼지 센서, 냄새 센서, 레이저 센서, UWB 센서, 이미지 센서, 장애물 센서 등과 같은 주변탐지를 위한 센서 및 자이로 센서, GPS 센서 등과 같은 이동상태를 감지하기 위한 센서 등을 포함할 수 있다. 이때, 주변탐지를 위한 센서와 청소 로봇의 이동상태를 감지하기 위한 센서는 상이한 구성으로 구현될 수도 있고, 하나의 구성으로 구현될 수도 있다. 또한, 센싱부(110)의 각각의 센서는 별도의 구성으로 구현될 수 있다. 센싱부(110)는 이외에도 다양한 종류의 센서를 더 포함할 수 있으며, 청소 로봇(100)이 수행할 태스크에 따라 도시된 센서 중 일부는 포함하지 않을 수도 있다.
카메라(120)는 청소 로봇(100)의 주변 영상을 다양한 방면으로 촬영하기 위한 구성이다. 특히, 카메라(120)는 RGB 카메라를 통해 청소 로봇(100)의 전면 영상을 촬영할 수도 있고, 주행 방향과 다른 방향에 대한 영상을 촬영할 수도 있다. 카메라(120)는 청소 로봇(100)에 독립적으로 마련될 수도 있고, 사물 인식 센서의 일부로서 사물 인식 센서에 포함된 카메라가 될 수도 있다.
카메라(120)는 복수의 카메라를 포함하는 구성일 수 있다. 특히 카메라(120)는 청소 로봇(100)의 상방 및 전방에 모두 설치되어 있을 수도 있고, 상방 및 전방 중 적어도 하나에만 설치되어 있을 수도 있다.
메모리(130)는 카메라(120)가 촬영한 영상 및 촬영 당시의 청소 로봇(100)의 이동상태정보 및 촬영 방향정보를 저장할 수 있다. 또한 메모리(130)는 청소 로봇(100)이 태스크를 수행하기 위한 장소에 대한 네비게이션 맵 정보를 저장할 수 있다. 이는 일 실시 예에 불과할 뿐, 메모리(130)는 청소 로봇(100)을 동작시키기 위해 필요한 각종 프로그램 등이 저장될 수 있다.
메모리(130)는 청소 로봇(100)에서 구동되는 다수의 응용 프로그램(application program 또는 애플리케이션(application)), 청소 로봇(100)의 동작을 위한 데이터들, 명령어들을 저장할 수 있다. 이러한 응용 프로그램 중 적어도 일부는, 무선 통신을 통해 외부 서버로부터 다운로드 될 수 있다. 또한 이러한 응용 프로그램 중 적어도 일부는, 청소 로봇(100)의 기본적인 기능을 위하여 출고 당시부터 청소 로봇(100) 상에 존재할 수 있다. 응용 프로그램은, 메모리(130)에 저장되고, 프로세서(140)에 의하여 청소 로봇(100)의 동작(또는 기능)을 수행하도록 구동될 수 있다.
다양한 실시예로, 메모리(130)는 프로세서(140)가 적어도 하나의 센서가 오브젝트가 배치된 태스크 영역을 감지한 결과를 이용하여, 청소 로봇(100)의 주행을 위한 네비게이션 맵을 생성하고, 적어도 하나의 카메라가 오브젝트를 촬영한 영상을 학습된 인공 지능 모델에 적용하여 오브젝트의 인식 정보를 획득하고, 네비게이션 맵에 포함된 오브젝트의 영역과 오브젝트의 인식 정보를 매핑하여, 태스크 영역의 환경을 나타내는 시맨틱 맵을 생성하도록 설정된 적어도 하나의 명령어들(instructions)를 저장할 수 있다.
다양한 실시예로, 메모리(130)는 프로세서(140)가 청소 로봇 주변의 오브젝트를 촬영하고, 촬영된 영상을 학습된 인공지능 모델에 적용하여 영상에 포함된 오브젝트의 인식 정보를 획득하고, 복수의 센서들 중에서, 상기 획득된 오브젝트의 인식 정보에 기반하여 선택된 적어도 하나의 센서를 이용하여 오브젝트를 감지하고, 적어도 하나의 센서가 감지한 결과를 이용하여 오브젝트에 대한 추가 정보를 획득하도록 적어도 하나의 명령어들(instructions)를 저장할 수 있다.
메모리(130)는 비휘발성 메모리, 휘발성 메모리, 플래시메모리(flash-memory), 하드디스크 드라이브(HDD) 또는 솔리드 스테이트 드라이브(SSD) 등으로 구현될 수 있다. 메모리(130)는 프로세서(140)에 의해 액세스 되며, 프로세서(140)에 의한 데이터의 독취/기록/수정/삭제/갱신 등이 수행될 수 있다. 본 개시에서 메모리라는 용어는 메모리(130), 프로세서(140) 내 ROM(미도시), RAM(미도시) 또는 청소 로봇 (100)에 장착되는 메모리 카드(미도시)(예를 들어, micro SD 카드, 메모리 스틱)를 포함할 수 있다.
프로세서(140)는 청소 로봇(100)의 전반적인 구성을 제어할 수 있다. 예를 들어, 프로세서(140)는 청소 로봇(100) 주변의 영상을 촬영하도록 카메라(120)를 제어할 수 있다. 또한, 프로세서(140)는 램(RAM), 롬(ROM), 시스템 버스를 포함할 수 있다. 여기서, 롬은 시스템 부팅을 위한 명령어 세트가 저장되는 구성이고, CPU(141)는 롬에 저장된 명령어에 따라 청소 로봇(100)의 메모리에 저장된 운영체제를 램에 복사하고, O/S를 실행시켜 시스템을 부팅시킨다. 부팅이 완료되면, CPU(141)는 메모리(130)에 저장된 각종 애플리케이션을 램에 복사하고, 실행시켜 각종 동작을 수행할 수 있다.
다양한 실시예로, 도 2b와 같이, 청소 로봇(100)은 복수 개의 프로세서들(141,142)을 포함할 수도 있다. 복수 개의 프로세서들(141,142)은 CPU(central processing unit)(141) 및 NPU(Neural Processing Unit)(142)를 포함할 수 있다. NPU(142)는 학습된 인공지능 모델을 이용하여 오브젝트를 인식하도록 최적화된 전용 프로세서일 수 있다. 그 밖에, 청소 로봇(100)은 디지털 신호를 처리하는 디지털 시그널 프로세서(digital signal processor(DSP), 마이크로 프로세서(microprocessor), TCON(Time controller), MCU(Micro Controller Unit), MPU(micro processing unit), 어플리케이션 프로세서(application processor(AP)), 또는 커뮤니케이션 프로세서(communication processor(CP)), ARM 프로세서 중 하나 또는 그 이상을 포함하거나, 해당 용어로 정의될 수 있다. 프로세서(140)는 프로세싱 알고리즘이 내장된 SoC(System on Chip), LSI(large scale integration)로 구현될 수도 있고, FPGA(Field Programmable gate array) 형태로 구현될 수도 있다.
다양한 실시예로, 프로세서(140)는 장애물과 같이 오브젝트를 인식하도록 학습된 인공 지능 모델을 통해 영상에 포함된 장애물을 인식할 수 있다. 즉, 프로세서(140)는 인공 지능 모델에 장애물을 포함하는 영상을 입력하고, 장애물 유형에 대한 정보를 포함하는 출력 결과를 획득할 수 있다.  프로세서(140)는 장애물의 유형에 따라 상이한 접근금지 영역의 크기를 결정할 수 있다. 이 때, 접근금지 영역은 장애물을 포함하는 영역으로, 청소 로봇(100)이 청소 태스크를 수행 시 접근하지 않을 영역을 의미한다. 한편, 인공 지능 모델은 학습되어 온 디바이스(on device)의 유형으로 청소 로봇(100)의 메모리(130)에 저장된 것일 수도 있고, 외부 서버에 저장된 것일 수도 있다. 이에 대하여 추후에 자세히 설명하도록 한다. 이하에서는 청소 로봇(100)에 인공 지능 모델을 저장하고 있는 실시 예를 가정하고 설명하기로 한다.
다양한 실시예로, 프로세서(140)는 인식된 장애물에 대한 접근금지 영역과 제1 영상을 오버래핑한 제2 영상을 생성할 수 있다. 프로세서(140)는 제2 영상에 포함된 정보에 기반하여, 청소 로봇(100)의 주변의 구조물과 장애물의 위치를 인식할 수 있고, 청소 로봇(100)이 이동할 방향 및 속도를 결정할 수 있다. 프로세서(140)는 결정된 이동방향 및 속도에 따라 청소 로봇(100)이 이동되도록 구동부(110)를 제어할 수 있다.
다양한 실시예로, 프로세서(140)는 촬영된 영상에서 바닥면을 특징적으로 분할한 제1 영상을 생성할 수 있다. 이때, 바닥면을 분할하기 위해서 프로세서(140)는 영상 분할 기법을 사용할 수 있다.
다양한 실시예로, 프로세서(140)는, 센싱부(110)가 오브젝트가 배치된 태스크 영역을 감지한 결과를 이용하여, 청소 로봇(100)의 주행을 위한 네비게이션 맵을 생성할 수 있다. 또한, 프로세서(140)는 카메라(120)가 오브젝트를 촬영한 영상을 학습된 인공 지능 모델에 적용하여, 오브젝트의 인식 정보를 획득할 수 있다. 프로세서(140)는 네비게이션 맵에 포함된 오브젝트의 영역과 오브젝트의 인식 정보를 매핑하여, 태스크 영역의 환경을 나타내는 시맨틱 맵을 생성할 수 있다. 그리고, 프로세서(140)는 시맨틱 맵을 이용한 사용자의 제어 명령에 기반하여, 청소 로봇의 태스크를 수행할 수 있다. 이에 따라, 시맨틱 맵을 제공 받은 사용자가 오브젝트의 인식 정보를 이용하여 청소 로봇(100)의 태스크를 다양한 방식으로 제어할 수 있게 되어, 사용자의 편의성이 크게 향상될 수 있다.
다양한 실시예로, 프로세서(140)는 오브젝트의 인식 정보를 이용하여, 태스크 영역에 포함된 장소의 인식 정보를 획득할 수 있다. 프로세서(140)는 태스크 영역에 포함된 장소의 인식 정보 및 오브젝트의 인식 정보를 이용하여, 태스크 영역의 환경을 나타내는 시맨틱 맵을 생성할 수 있다. 이에 따라, 시맨틱 맵을 제공 받은 사용자가 각 장소들의 인식 정보 및 오브젝트의 인식 정보를 모두 참조하여, 청소 로봇(100)이 수행할 태스크를 보다 정확하게 제어하는 것이 가능해진다.
다양한 실시예로, 프로세서(140)는, 오브젝트의 감지 결과에 따른, 오브젝트의 위치 또는 오브젝트의 형태 중 적어도 하나에 기반하여, 네비게이션 맵에 포함된 오브젝트의 영역과 오브젝트의 인식 정보를 매핑하여, 태스크 영역의 환경을 나타내는 시맨틱 맵을 생성할 수 있다. 이에 따라, 네비게이션 맵을 대상으로 오브젝트가 정확한 위치에 매핑되어 시맨틱 맵이 제공될 수 있다.
다양한 실시예로, 프로세서(140)는 카메라(120)가 오브젝트를 촬영한 영상을 외부의 서버에 위치한 학습된 인공 지능 모델에 적용하여, 오브젝트의 인식 정보를 획득할 수 있다. 인공 지능 모델을 이용함에 따라, 오브젝트의 인식률이 크게 향상될 수 있으며, 특히 외부의 서버에 위치한 인공 지능 모델을 이용함에 따라 청소 로봇(100)의 제한된 자원을 극복하고 더 많은 자원을 이용하여 인공 지능 모델의 사용성이 더욱 향상될 수 있다.
다양한 실시예로, 프로세서(140)는 네비게이션 맵에서 오브젝트에 대응되는 오브젝트의 바운더리를 식별할 수 있다. 프로세서(140)는 오브젝트의 바운더리에 의하여 결정되는 오브젝트의 영역과 오브젝트의 인식 정보를 매핑하여, 태스크 영역의 환경을 나타내는 시맨틱 맵을 생성할 수 있다.
다양한 실시예로, 프로세서(140)는 카메라(120)가 오브젝트를 촬영한 영상을 외부의 서버에 위치한 학습된 인공 지능 모델에 적용하여, 오브젝트의 인식 정보를 획득할 수 있다.
다양한 실시예로, 프로세서(140)는 센싱부(110)에 포함된 복수의 센서들 중에서, 오브젝트의 인식 정보에 기반하여 선택된 적어도 하나의 센서가 오브젝트를 감지하도록 제어할 수 있다. 프로세서(140)는 적어도 하나의 센서가 감지한 결과를 이용하여 오브젝트에 대한 추가 정보를 획득할 수 있다.
다양한 실시예로, 프로세서(140)는 오브젝트의 인식 정보에 따라 복수의 센서들에 대한 우선 순위를 설정할 수 있다. 프로세서(140)는 복수의 센서들 중에서, 우선 순위에 따라 적어도 하나의 센서가 감지한 결과를 이용하여 오브젝트에 대한 추가 정보를 획득할 수 있다.
다양한 실시예로, 프로세서(140)는 청소 로봇(100) 주변의 오브젝트를 촬영하도록 카메라(120)를 제어할 수 있다. 프로세서(140)는 촬영된 영상을 학습된 인공지능 모델에 적용하여 영상에 포함된 오브젝트의 인식 정보를 획득할 수 있다. 프로세서(140)는 센싱부(110)에 포함된 복수의 센서들 중에서, 오브젝트의 인식 정보에 기반하여 선택된 적어도 하나의 센서가 오브젝트를 감지하도록 제어할 수 있다. 프로세서(140)는 적어도 하나의 센서가 감지한 결과를 이용하여 오브젝트에 대한 추가 정보를 획득하고, 오브젝트에 대한 추가 정보에 기반하여 오브젝트에 대하여 청소 로봇(100)이 수행할 태스크를 결정할 수 있다.
다양한 실시예로, 프로세서(140)는 오브젝트의 인식 정보에 따라 센싱부(110)에 포함된 복수의 센서들에 대한 우선 순위를 설정할 수 있다. 프로세서(140)는 복수의 센서들 중에서, 우선 순위에 따라 적어도 하나의 센서가 감지한 결과를 이용하여 오브젝트에 대한 추가 정보를 획득할 수 있다.
다양한 실시예로, 프로세서(140)는 오브젝트의 인식 정보에 따라 복수의 센서들 중 IR센서에 우선 순위가 높게 설정되는 경우, IR 스테레오 센서가 감지한 결과에 대하여 가중치를 부가하여 상기 오브젝트에 대한 추가 정보를 획득할 수 있다.
다양한 실시예로, 프로세서(140)는 인식된 오브젝트에 대한 바운딩 박스를 판단하고, 바운딩 박스의 판단 결과와 IR 스테레오 센서를 통한 오브젝트 감지 결과가 일치하지 않는 영역에 대하여, IR 스테레오 센서의 임계값을 감소시킬 수 있다.
다양한 실시예로, 프로세서(140)는 오브젝트의 인식 정보에 따라 센싱부(110)에 포함된 복수의 센서들 중 라이다 센서에 우선 순위가 높게 설정되는 경우, 라이다 센서가 감지한 결과에 대하여 가중치를 부가하여 오브젝트에 대한 추가 정보를 획득할 수 있다.
다양한 실시예로, 프로세서(140)는 오브젝트의 인식 정보에 따라 센싱부(110)에 포함된 복수의 센서들 중 초음파 센서에 우선 순위가 높게 설정되는 경우, 초음파 센서가 감지한 결과에 대하여 가중치를 부가하여 오브젝트에 대한 추가 정보를 획득할 수 있다.
다양한 실시예로, 오브젝트의 인식 정보에 따라 센싱부(110)에 포함된 복수의 센서들 중 초음파 센서에 우선 순위가 높게 설정되는 경우는, 인식된 오브젝트가 투명하거나 검은 색인 오브젝트인 경우인 것을 특징으로 할 수 있다.
다양한 실시예로, 프로세서(140)는 촬영된 영상을 외부의 서버에 위치한 학습된 인공 지능 모델에 적용하여, 오브젝트의 인식 정보를 획득할 수 있다.
도 3은 본 개시의 일 실시 예에 따른, 청소 로봇의 구성을 설명하기 위한 상세한 블록도이다.
도 3을 참조하면, 청소 로봇(100)은 센싱부(110), 카메라(120), 메모리(130), 통신부(150), 집진부(160), 구동부(170), 전원부(180) 및 상술한 구성들과 전기적으로 연결되어 제어하는 프로세서(140)로 구성될 수 있다.
센싱부(110), 카메라(120), 메모리(130), 프로세서(140)에 대하여는 이미 설명하였으므로, 중복되는 설명은 생략하도록 한다.
통신부(150)는 외부 장치와 데이터, 제어 명령 등을 송수신할 수 있다. 예를 들어, 통신부(150)는 외부 장치로부터 청소 로봇(100)이 동작할 공간에 대한 위치 정보를 포함하는 전역 지도 정보를 수신할 수 있다. 또한, 통신부(150)는 외부 장치로 전역 지도 정보를 갱신하기 위한 정보를 송신할 수 있다. 다른 예로, 통신부(150)는 사용자가 원격제어장치를 이용하여 송신한 청소 로봇(100)을 제어하기 위한 신호를 수신할 수 있다. 이때 원격제어장치는 리모컨, 모바일 장치 등 다양한 형태로 구현될 수 있다.
또한 통신부(150)는 외부 서버(미도시)와 데이터 등을 송수신할 수 있다. 예를 들어 외부 서버에 인공 지능 모델이 저장되어 있는 경우, 통신부(150)는 외부 서버로 카메라(120)를 통해 촬영한 영상을 송신할 수 있고, 외부 서버에 저장된 인공 지능 모델을 이용하여 인식된 오브젝트의 인식 정보(예: 장애물에 대한 정보)를 수신할 수 있다. 이는 일 실시 예에 불과하며, 통신부(150)는 외부 서버로부터 청소 로봇(100)이 태스크를 수행할 공간에 대한 이동 가능 영역에 대한 정보를 수신할 수 있다.
한편, 통신부(150)는 무선 통신 방식으로 NFC(Near Field Communication), 무선 LAN(Wireless LAN), IR(InfraRed) 통신, Zigbee 통신, WiFi, 블루투스(Bluetooth) 등 다양한 방식을 이용할 수 있다.
집진부(160)는 먼지를 집진하기 위한 구성이다. 구체적으로, 집진부(160)는 공기를 흡입하고, 흡입된 공기 중의 먼지를 집진할 수 있다. 예를 들어, 집진부(160)는 흡입구에서 배출구까지 이어지는 가이드 배관을 통해 공기를 통과시키는 모터와 흡입된 공기 중의 먼지를 거르는 필터 및 걸리진 먼지를 담는 먼지통 등을 포함할 수 있다.
구동부(170)는 청소 로봇(100)을 구동시킬 수 있다. 예를 들어, 구동부(170)는 프로세서(140)의 제어에 의해 태스크를 수행할 위치로 청소 로봇(100)을 이동시킬 수 있다. 이러한 경우에, 구동부(170)는 바닥면과 접촉하는 적어도 하나의 바퀴, 바퀴에 동력을 제공하는 모터 및 모터를 제어할 드라이버를 포함할 수 있다. 다른 예로, 구동부(170)는 태스크를 수행하기 위한 동작을 구현할 수 있다. 물체 이동 태스크의 경우에 구동부(170)는 물체를 집어드는 동작 등을 수행하기 위한 모터를 포함할 수 있다.
전원부(180)는 청소 로봇(100)의 구동에 필요한 전원을 공급한다. 예를 들어, 전원부(180)는 충방전이 가능한 배터리로 구현될 수 있다. 프로세서(140)는 청소 로봇(100)의 잔여 전원이 기설정된 레벨 이하로 떨어진 경우, 또는 태스크를 완료한 경우에 충전 스테이션으로 이동하도록 구동부(110)를 제어할 수 있다. 전원부(180)의 충전 방식은 접촉식 및 비접촉식 충전이 모두 가능하다.
도 4a 내지 도 4d는 본 개시의 일 실시 예에 따른, 청소 로봇이 IR 스테레오 센서를 통한 감지 결과 오브젝트에 대한 추가 정보를 획득하는 것을 설명하기 위한 도면이다.
청소 로봇(100)은 IR 스테레오 센서를 통해서 전방의 오브젝트를 감지할 수 있다. 구체적으로 청소 로봇(100)은 카메라(120)를 통해 전방의 바닥에 놓인 오브젝트를 인식할 수 있다. 또한, 청소 로봇(100)은 IR 스테레오 센서를 통해 오브젝트를 감지하고 오브젝트의 깊이(depth) 정보를 획득할 수 있다. 예를 들어, 도 4a를 참조하면, 청소 로봇(100)은 전방의 복수의 오브젝트(410, 420)를 카메라(120) 및 IR 스테레오 센서를 통해 인식하고 감지할 수 있고, 오브젝트(410, 420)에 대한 깊이 정보를 획득할 수 있다.
한편, IR 스테레오 센서는 오브젝트의 깊이가 임계값(threshold value)보다 큰 경우 오브젝트를 감지할 수 있으나, 오브젝트의 깊이가 임계값보다 작은 경우 오브젝트를 감지할 수 없다. 예를 들어, 카펫(420)의 깊이 정보가 기설정된 임계값보다 작은 경우 청소 로봇(100)은 카펫(420)을 인지할 수 없고, 도 4b와 같이 IR 스테레오 센서를 통해 화분(410)에 대한 깊이 정보(411)만을 획득할 수 있다.
이때, 카메라(120)는 오브젝트의 깊이 정보와 무관하게 전방의 모든 오브젝트(410, 420)를 감지하고 인식할 수 있다. 즉, 청소 로봇(100)은 도 4c와 같이 화분(410), 카펫(420) 모두에 대한 영상을 촬영하여 인식하고, 각각의 오브젝트에 대한 바운딩 박스(412, 422)를 판단할 수 있다.
한편, 청소 로봇(100)은 도 4b 및 4c와 같이 카메라(120)를 통한 오브젝트 인식 결과와 IR 스테레오 센서를 통한 오브젝트 감지 결과가 상이한 경우에, IR 스테레오 센서의 임계값을 작게 설정할 수 있다. 청소 로봇(100)은 카메라(120)를 통한 오브젝트 인식 결과와 IR 스테레오 센서를 통한 오브젝트 감지 결과가 일치할 때까지, 예를 들면 오브젝트의 수가 동일할 때까지 IR 스테레오 센서의 임계값을 감소시킬 수 있다. IR 스테레오 센서의 임계값이 충분히 낮아지게 되면, 청소 로봇(100)은 도 4d와 같이 IR 스테레오 센서를 통해 화분(410)에 대한 깊이 정보(411)뿐만 아니라, 카페트(420)의 깊이 정보(421)를 추가 정보로서 획득할 수 있다.
본 개시의 일 실시 예에 따르면, 청소 로봇(100)은 도 4c와 같이 획득한 바운딩 박스(412, 422)에 해당하는 영역에 대해서만 IR 스테레오 센서의 임계값을 감소시킬 수 있다. 즉, 청소 로봇(100)은 오브젝트 인식 결과와 IR 스테레오 센서를 통한 오브젝트 감지 결과를 비교하여 상이한 영역(422)에 대해서만 IR 스테레오 센서의 임계값을 감소시킬 수 있다. 상술한 실시 예에 의하면, 청소 로봇(100)은 현재 IR 스테레오 센서가 감지하지 못하고 있는 카펫(420)을 감지할 수 있게 하는 동시에, 새로운 오브젝트를 감지함에 있어서는 여전히 기존의 임계값을 유지할 수 있다는 효과가 있다.
도 5a 내지 5c는 본 개시의 일 실시 예에 따른, 청소 로봇이 라이다(LIDAR) 센서를 통한 감지 결과 오브젝트에 대한 추가 정보를 획득하는 것을 설명하기 위한 도면이다.
도 5a를 참조하면, 청소 로봇(100)은 카메라(120)를 통해 먼저 청소 로봇(100) 주변의 오브젝트(500)를 촬영하고, 인식할 수 있다. 오브젝트 인식 결과, 청소 로봇(100)은 인식된 오브젝트(500)가 책상 및 의자인 것으로 판단할 수 있다. 청소 로봇(100)은 오브젝트가 책상 및 의자인 경우, 오브젝트에 대한 추가적인 정보를 획득하기 위한 추가적인 센서로 라이다 센서를 다른 센서들 보다 우선 순위를 높게 하여 감지할 수 있다.  
도 5b는 청소 로봇(100)이 오브젝트(500)를 인식하고, 오브젝트(500)에 대한 바운딩 박스(510)를 판단한 것을 나타내는 평면도이다. 상술한 바와 같이 청소 로봇(100)은 우선 순위를 높게 설정한 라이다 센서를 통해 오브젝트(500)의 상세한 정보를 추가 정보로서 획득할 수 있다. 구체적으로 라이다 센서는 레이저 펄스를 청소 로봇(100)이 인식한 오브젝트 방향으로 발사함에 따라, 오브젝트(500)의 다리에 대한 정보를 획득할 수 있다.
예를 들어, 도 5c를 참조하면, 청소 로봇(100)은 라이다 센서를 통해 오브젝트(500)의 다리에 대한 정보(520)를 획득할 수 있다. 즉, 청소 로봇(100)은 오브젝트(500)의 다리 위치, 다리 간의 간격 등에 대한 정보를 획득하고, 적합한 태스크를 결정할 수 있다.
도 6a 및 6b는 본 개시의 일 실시 예에 따른, 청소 로봇이 초음파 센서를 통한 감지 결과 오브젝트에 대한 추가 정보를 획득하는 것을 설명하기 위한 도면이다.
도 6a와 같이, 오브젝트가 검정색 테이블(600)이거나, 투명한 유리컵(610)인 경우에는, IR 스테레오 센서 또는 라이다 센서는 오브젝트에 대한 감지가 불가능하다. 이에, 청소 로봇(100)은 카메라(120)를 통해 획득한 영상에서 오브젝트가 검정색 테이블(600) 및 유리컵(610)이라고 인식한 경우, IR 스테레오 센서 또는 라이다 센서보다 초음파 센서에 우선 순위를 높게 두어 감지할 수 있다.
한편, 초음파 센서는 제한된 센싱 범위를 가지므로, 청소로봇(100)은 좌우로 회전하여 오브젝트의 감지를 시도할 수 있다. 예를 들면, 청소 로봇(100)은 도 6b와 같이, 초음파 센서를 통해 감지 가능한 거리 이내로 접근하여 초음파를 통해 검정색 테이블(600)에 대한 다리 위치, 유리컵(610)의 위치와 같은 오브젝트에 대한 추가 정보를 획득할 수 있다.
상술한 실시 예를 통해, IR 스테레오 센서 및 라이다 센서를 통해 감지하기 어려운 오브젝트에 대하여도 감지할 수 있다는 효과가 있다.
도 7a 및 7b는 본 개시의 일 실시 예에 따른, 청소 로봇이 댁 내 구조를 파악하는 것을 도시하기 위한 도면이다.
도 7a를 참조하면, 청소 로봇(100)은 카메라(120) 또는 복수의 센서들 중 적어도 하나에 의하여 오브젝트를 감지한 결과를 이용하여 상기 오브젝트를 문(700, 710)으로 인식할 수 있다. 이때, 청소 로봇(100)이 오브젝트를 문으로 인식하는 방법은 문(700,710)을 포함하는 영상을 인공지능 모델에 입력한 결과를 통해 인식하는 것일 수 있다.
한편, 청소 로봇(100)은 감지한 오브젝트가 문인 경우, 문을 통해 태스크 영역의 구조(예: 댁 내 구조)를 결정할 수 있다. 예를 들면, 청소 로봇(100)은 특별한 사정이 없는 한, 문(700, 710)과 수평한 방향의 양 옆을 벽으로 판단할 수 있다.
도 7b를 참조하면, 청소 로봇(100)은 인식된 제1 문(700)과 수평한 양 방향을 제1 벽(701)으로 결정할 수 있고, 인식된 제2문(710)과 수평한 양 방향을 제2 벽(711)으로 결정할 수 있다. 한편, 청소 로봇은 유추한 제1 벽(701)과 유추한 제2 벽(711)이 교차하는 부분(720)이 있는 경우, 해당 교차 부분(720)을 댁 내 벽의 모서리 부분으로 판단할 수 있다.
도 7c를 참조하면, 청소 로봇(100)은 유추한 제1 벽(701)과 유추한 제2 벽(711)이 교차가 예상되는 부분(730)에서 빈 공간을 감지할 수도 있다.
예로, 교차가 예상되는 부분을 통로로 별도의 영역(740)이 존재하는 경우, 청소 로봇(100)은 라이다 센서를 이용하여 별도의 영역(740)까지 감지할 수 있다. 감지 결과에 따라, 청소 로봇(100)은 제1 벽(701)과 제2 벽(711) 사이에 빈 공간이 있는 것으로 판단하고, 태스크 영역의 구조에 빈 공간을 통로로 하는 별도의 영역(740)을 포함시킬 수 있다.
상술한 실시 예를 통해, 청소 로봇(100)은 오브젝트를 문으로 인식한 경우, 단순히 오브젝트 인식으로 끝나지 않고 태스크 영역의 구조를 파악할 수 있다는 효과가 있다. 또한, 상술한 실시 예를 통해, 청소 로봇(100)은 태스크 영역의 구조를 네비게이션 맵에 반영한 시맨틱 맵을 생성할 수 있다.
도 8a 및 8b는 본 개시의 일 실시 예에 따른, 청소 로봇이 댁 내 구조 및 오브젝트에 대한 추가 정보에 기반하여 시맨틱 맵을 생성하는 것을 설명하기 위한 도면이다.
도 8a를 참조하면, 청소 로봇(100)은 댁 내의 오브젝트를 각각 문(700, 710), 쇼파(800)로 인식할 수 있다.
도 7a 및 도 7b에서 설명한 바와 같이, 청소 로봇(100)은 문(700,710)을 통해 태스크 영역의 구조(예: 댁 내 벽면)를 파악할 수 있다. 또한, 청소 로봇(100)은 오브젝트를 향하여 주행하면서 쇼파(800)를 인식할 수 있다. 예로, 도 8a에서, 청소 로봇(100)은 오브젝트를 향하여 주행하면서 카메라(120) 또는 복수의 센서들 중 적어도 하나에 의하여 감지된 결과로서, 오브젝트를 촬영한 다수의 영상들(801 ~ 803)을 획득할 수 있다. 예로, 청소 로봇(100)은 일정 거리(예로, 20cm 내지 40cm) 또는 일정 주기(예로, 0.5 내지 2초)마다 오브젝트를 촬영하면서 영상들(801 ~ 803)을 획득하여 메모리(130)에 저장할 수 있다.
청소 로봇(100)이 작업을 마치거나 또는 충전을 위하여 충전 스테이션으로 복귀하면, 청소 로봇(100)은 메모리(130)에 저장된 영상들(801 ~ 803)로부터 오브젝트의 인식 정보를 획득할 수 있다. 청소 로봇(100)은 저장된 영상들(801 ~ 803)을 인공 지능 모델에 적용하여 오브젝트의 인식 정보를 획득할 수 있다.
이때, 청소 로봇(100)은 추가적으로 인식한 오브젝트가 쇼파(800), 즉 장애물이나 이물질이 아닌 구조물로 인식한 경우에는 이를 태스크 영역에 대한 네비게이션 맵에 추가하여 시맨틱 맵을 생성할 수 있다.
예를 들면 도 8b를 참조하면, 청소 로봇(100)은 구조물인 쇼파(800)에 대해서 라이다 센서 등을 통해 추가적으로 획득한 쇼파 다리 정보(810), 및 문(700, 710)을 통해 유추한 태스크 영역의 구조에 기반하여, 시맨틱 맵을 생성할 수 있다.
도 9a 및 9b는 본 개시의 일 실시 예에 따른, 청소 로봇이 바닥 상에 존재하는 위험물질을 사용자에게 알려주는 것을 설명하기 위한 도면이다.
도 9a를 참조하면, 청소 로봇(100)은 바닥에 존재하는 오브젝트를 깨진 유리컵(900)으로 인식할 수 있다. 이때, 청소 로봇(100)은 오브젝트(900)을 포함하는 영상을 인공지능 모델에 입력하여 오브젝트 인식을 수행한 결과, 해당 오브젝트를 깨진 유리컵으로 인식할 수 있다.
청소 로봇(100)은 사용자에게 위험한 물체가 바닥에 있다는 것을 알릴 수 있다. 즉, 청소 로봇(100)은 사용자 단말장치(910) 상에 '바닥에 있으면 안 되는 물건이 있는 것 같아요'와 같은 알림 문구(911)가 표시되도록 사용자 단말장치(910)로 경고 데이터를 전송할 수 있다. 또는, 청소 로봇(100)은 오브젝트의 인식을 수행한 결과인 오브젝트의 인식 정보를 포함하는 알림 문구가 표시되도록 사용자 단말 장치(910)로 경고 데이터를 전송할 수도 있다. 예로, 오브젝트가 유리컵으로 인식된 경우, 청소 로봇(100)은 '바닥에 유리컵이 있어요'와 같은 알림 문구가 표시되도록 사용자 단말 장치(910)로 경고 데이터를 전송할 수 있다.
또는, 청소 로봇(100)은 도 7a 내지 도 8b에서 설명한 방법에 따라 생성된 네비게이션 맵 또는 시맨틱 맵을 사용자 단말장치(910)로 전송할 수 있다. 사용자 단말장치(910)는 시맨틱 맵 또는 네비게이션 맵을 사용자 단말장치(910) 상에 표시할 수 있고, 또한 청소 로봇(100)으로부터 수신한 위험한 물체의 위치 정보를 표시할 수도 있다.
예를 들면, 도 9b와 같이 사용자 단말장치(910)는 청소 로봇(100)으로부터 수신한 네비게이션 맵에 대한 UI(912)를 표시하고, 청소 로봇(100)이 현재 위험한 물체를 감지하고 있는 위치를 UI에 함께 표시할 수 있다.
상술한 실시 예를 통해, 사용자는 현재 위험한 물체가 바닥에 떨어져있는지 여부, 위험한 물체가 존재하는 위치에 대한 정보를 용이하게 알 수 있다는 효과가 있다.
도 10은 본 개시의 일 실시 예에 따른, 청소 로봇이 청소하지 않을 영역을 지정하는 것을 설명하기 위한 도면이다.
상술한 바와 같이, 사용자 단말장치(910)는 청소 로봇(100)으로부터 네비게이션 맵을 수신하고, 이에 대한 UI(912)를 표시할 수 있다.
이때, 사용자는 청소 로봇(100)이 청소하지 않을 영역(913)을 지정할 수 있다. 예를 들면, 네비게이션 맵 상의 특정 영역(913)에 접근 제한이 필요한 경우(예: 아기가 자고 있는 경우), 사용자는 사용자 단말장치(910)에 표시된 UI 상의 해당 영역(913)에 대한 인터렉션(예를 들면, 터치, 클릭)을 통해 청소 로봇(100)이 청소하지 않도록 명령할 수 있다.
또는, 청소 로봇(100)은 사용자의 명령을 수신하지 않고도, 자동으로 접근 제한이 필요한 특정 영역(913)을 회피하도록 태스크를 수행할 수도 있다. 예로, 청소 로봇(100)은 특정 영역(913)을 진입하기 전에, 인공지능 모델을 이용하여 특정 영역(913)에 포함된 오브젝트(예: 잠자고 있는 아기)를 인식할 수 있다. 오브젝트의 인식 결과로서, 특정 영역(913)에 접근 제한이 필요한 것으로 판단되면, 청소 로봇(100)은 특정 영역(913)을 회피하여 주행하면서 태스크를 수행할 수 있다.
도 11a 및 도 11b는, 다양한 실시예에 따른 학습부 및 인식부를 나타내는 블록도이다.
도 11a를 참조하면, 프로세서(1100)는 학습부(1110) 및 인식부(1120) 중 적어도 하나를 포함할 수 있다. 도 11a의 프로세서(1100)는 도 2의 청소 로봇(100)의 프로세서(140)에 대응될 수도 있고, 또는 청소 로봇(100)과 통신 가능한 외부의 서버(미도시)의 프로세서에 대응될 수 있다.
학습부(1110)는 소정의 상황 판단을 위한 기준을 갖는 인식 모델을 생성 또는 학습시킬 수 있다. 학습부(1110)는 수집된 학습 데이터를 이용하여 판단 기준을 갖는 인식 모델을 생성할 수 있다.
일 예로, 학습부(1110)는 오브젝트가 포함된 이미지를 학습 데이터로서 이용하여 이미지에 포함된 오브젝트가 어떤 것인지 판단하는 기준을 갖는 오브젝트 인식 모델을 생성, 학습 또는 갱신시킬 수 있다.
또 다른 예로, 학습부(1110)는 오브젝트가 포함된 화면에 포함된 주변 정보를 학습 데이터로서 이용하여 이미지에 포함된 오브젝트 주변에 다양한 추가 정보를 판단하는 기준을 갖는 주변 정보 인식 모델을 생성, 학습 또는 갱신시킬 수 있다.
또 다른 예로, 학습부(1110)는 카메라에 의해 촬영된 이미지를 학습 데이터로서 이용하여 이미지에 포함된 장애물을 판단하는 기준을 갖는 장애물 인식 모델을 생성, 학습 또는 갱신시킬 수 있다.
인식부(1120)는 소정의 데이터를 학습된 인식 모델의 입력 데이터로 사용하여, 소정의 데이터에 포함된 인식 대상을 추정할 수 있다.
일 예로, 인식부(1120)는 오브젝트가 포함된 오브젝트 영역(또는, 이미지)를 학습된 인식 모델의 입력 데이터로 사용하여 오브젝트 영역에 포함된 오브젝트에 대한 오브젝트 정보를 획득(또는, 추정, 추론)할 수 있다.
다른 예로, 인식부(1120)는 오브젝트 정보를 학습된 인식 모델에 적용하여 검색 결과를 제공할 검색 카테고리를 추정(또는, 결정, 추론)할 수 있다. 이 때, 검색 결과는 우선 순위에 따라 복수 개가 획득될 수도 있다.
학습부(1110)의 적어도 일부 및 인식부(1120)의 적어도 일부는, 소프트웨어 모듈로 구현되거나 적어도 하나의 하드웨어 칩 형태로 제작되어 전자 장치에 탑재될 수 있다. 예를 들어, 학습부(1110) 및 인식부(1120) 중 적어도 하나는 인공 지능(AI; artificial intelligence)을 위한 전용 하드웨어 칩 형태로 제작될 수도 있고, 또는 기존의 범용 프로세서(예: CPU 또는 application processor) 또는 그래픽 전용 프로세서(예: GPU)의 일부로 제작되어 전술한 청소 로봇(100)에 탑재될 수도 있다. 이 때, 인공 지능을 위한 전용 하드웨어 칩은 확률 연산에 특화된 전용 프로세서로서, 기존의 범용 프로세서보다 병렬처리 성능이 높아 기계 학습과 같은 인공 지능 분야의 연산 작업을 빠르게 처리할 수 있다. 학습부(1110) 및 인식부(1120)가 소프트웨어 모듈(또는, 인스트럭션(instruction) 포함하는 프로그램 모듈)로 구현되는 경우, 소프트웨어 모듈은 컴퓨터로 읽을 수 있는 판독 가능한 비일시적 판독 가능 기록매체(non-transitory computer readable media)에 저장될 수 있다. 이 경우, 소프트웨어 모듈은 OS(Operating System)에 의해 제공되거나, 소정의 애플리케이션에 의해 제공될 수 있다. 또는, 소프트웨어 모듈 중 일부는 OS(Operating System)에 의해 제공되고, 나머지 일부는 소정의 애플리케이션에 의해 제공될 수 있다.
 이 경우, 학습부(1110) 및 인식부(1120)는 하나의 전자 장치에 탑재될 수도 있으며, 또는 별개의 전자 장치들에 각각 탑재될 수도 있다. 예를 들어, 학습부(1210) 및 인식부(1220) 중 하나는 청소 로봇(100)에 포함되고, 나머지 하나는 외부의 서버에 포함될 수 있다. 또한, 학습부(1110) 및 인식부(1120)는 유선 또는 무선으로 통하여, 학습부(1110)가 구축한 모델 정보를 인식부(1120)로 제공할 수도 있고, 인식부(1120)로 입력된 데이터가 추가 학습 데이터로서 학습부(1110)로 제공될 수도 있다.
도 11b는, 다양한 실시예에 따른 학습부(1110) 및 인식부(1120)의 블록도이다.
도 11b의 (a)를 참조하면, 일부 실시예에 따른 학습부(1110)는 학습 데이터 획득부(1110-1) 및 모델 학습부(1110-4)를 포함할 수 있다. 또한, 학습부(1110)는 학습 데이터 전처리부(1110-2), 학습 데이터 선택부(1110-3) 및 모델 평가부(1110-5) 중 적어도 하나를 선택적으로 더 포함할 수 있다.
학습 데이터 획득부(1110-1)는 인식 대상을 추론하기 위한 인식 모델에 필요한 학습 데이터를 획득할 수 있다. 본 문서의 실시예로, 학습 데이터 획득부(1110-1)는 오브젝트를 포함하는 전체 이미지, 오브젝트 영역에 대응하는 이미지, 오브젝트 정보를 학습 데이터로서 획득할 수 있다. 학습 데이터는 학습부(1110) 또는 학습부(1110)의 제조사가 수집 또는 테스트한 데이터가 될 수도 있다.
모델 학습부(1110-4)는 학습 데이터를 이용하여, 인식 모델이 소정의 인식 대상을 어떻게 판단할 지에 관한 판단 기준을 갖도록 학습시킬 수 있다. 예로, 모델 학습부(1110-4)는 학습 데이터 중 적어도 일부를 판단 기준으로 이용하는 지도 학습(supervised learning)을 통하여, 인식 모델을 학습시킬 수 있다. 또는, 모델 학습부(1110-4)는, 예를 들어, 별다른 지도 없이 학습 데이터를 이용하여 스스로 학습함으로써, 상황의 판단을 위한 판단 기준을 발견하는 비지도 학습(unsupervised learning)을 통하여, 인식 모델을 학습시킬 수 있다. 또한, 모델 학습부(1110-4)는, 예를 들어, 학습에 따른 상황 판단의 결과가 올바른 지에 대한 피드백을 이용하는 강화 학습(reinforcement learning)을 통하여, 인식 모델을 학습시킬 수 있다. 또한, 모델 학습부(1110-4)는, 예를 들어, 오류 역전파법(error back-propagation) 또는 경사 하강법(gradient descent)을 포함하는 학습 알고리즘 등을 이용하여 인식 모델을 학습시킬 수 있다
또한, 모델 학습부(1110-4)는 입력 데이터를 이용하여 인식 대상을 추정하기 위하여 어떤 학습 데이터를 이용해야 하는 지에 대한 선별 기준을 학습할 수도 있다.
모델 학습부(1110-4)는 미리 구축된 인식 모델이 복수 개가 존재하는 경우, 입력된 학습 데이터와 기본 학습 데이터의 관련성이 큰 인식 모델을 학습할 인식 모델로 결정할 수 있다. 이 경우, 기본 학습 데이터는 데이터의 타입 별로 기 분류되어 있을 수 있으며, 인식 모델은 데이터의 타입 별로 미리 구축되어 있을 수 있다. 예를 들어, 기본 학습 데이터는 학습 데이터가 생성된 지역, 학습 데이터가 생성된 시간, 학습 데이터의 크기, 학습 데이터의 장르, 학습 데이터의 생성자, 학습 데이터 내의 오브젝트의 종류 등과 같은 다양한 기준으로 기 분류되어 있을 수 있다.
인식 모델이 학습되면, 모델 학습부(1110-4)는 학습된 인식 모델을 저장할 수 있다. 이 경우, 모델 학습부(1110-4)는 학습된 인식 모델을 청소 로봇(100)의 메모리(130)에 저장할 수 있다. 또는, 모델 학습부(1110-4)는 학습된 인식 모델을 청소 로봇(100)와 유선 또는 무선 네트워크로 연결되는 서버의 메모리에 저장할 수도 있다.
학습부(1110)는 인식 모델의 분석 결과를 향상시키거나, 인식 모델의 생성에 필요한 자원 또는 시간을 절약하기 위하여, 학습 데이터 전처리부(1110-2) 및 학습 데이터 선택부(1110-3)를 더 포함할 수도 있다.
학습 데이터 전처리부(1110-2)는 상황 판단을 위한 학습에 획득된 데이터가 이용될 수 있도록, 획득된 데이터를 전처리할 수 있다. 학습 데이터 전처리부(1110-2)는 모델 학습부(1110-4)가 상황 판단을 위한 학습을 위하여 획득된 데이터를 이용할 수 있도록, 획득된 데이터를 기 설정된 포맷으로 가공할 수 있다.
학습 데이터 선택부(1110-3)는 학습 데이터 획득부(1110-1)에서 획득된 데이터 또는 학습 데이터 전처리부(1110-2)에서 전처리된 데이터 중에서 학습에 필요한 데이터를 선택할 수 있다. 선택된 학습 데이터는 모델 학습부(1110-4)에 제공될 수 있다. 학습 데이터 선택부(1110-3)는 기 설정된 선별 기준에 따라, 획득되거나 전처리된 데이터 중에서 학습에 필요한 학습 데이터를 선택할 수 있다. 또한, 학습 데이터 선택부(1110-3)는 모델 학습부(1110-4)에 의한 학습에 의해 기 설정된 선별 기준에 따라 학습 데이터를 선택할 수도 있다.
학습부(1110)는 데이터 인식 모델의 분석 결과를 향상시키기 위하여, 모델 평가부(1110-5)를 더 포함할 수도 있다.
모델 평가부(1110-5)는 인식 모델에 평가 데이터를 입력하고, 평가 데이터로부터 출력되는 분석 결과가 소정 기준을 만족하지 못하는 경우, 모델 학습부(1110-4)로 하여금 다시 학습하도록 할 수 있다. 이 경우, 평가 데이터는 인식 모델을 평가하기 위한 기 정의된 데이터일 수 있다.
예를 들어, 모델 평가부(1110-5)는 평가 데이터에 대한 학습된 인식 모델의 분석 결과 중에서, 분석 결과가 정확하지 않은 평가 데이터의 개수 또는 비율이 미리 설정된 임계치를 초과하는 경우 소정 기준을 만족하지 못한 것으로 평가할 수 있다.
한편, 학습된 인식 모델이 복수 개가 존재하는 경우, 모델 평가부(1110-5)는 각각의 학습된 인식 모델에 대하여 소정 기준을 만족하는지를 평가하고, 소정 기준을 만족하는 모델을 최종 인식 모델로서 결정할 수 있다. 이 경우, 소정 기준을 만족하는 모델이 복수 개인 경우, 모델 평가부(1110-5)는 평가 점수가 높은 순으로 미리 설정된 어느 하나 또는 소정 개수의 모델을 최종 인식 모델로서 결정할 수 있다.
도 11b의 (b)를 참조하면, 일부 실시예에 따른 인식부(1120)는 인식 데이터 획득부(1120-1) 및 인식 결과 제공부(1120-4)를 포함할 수 있다.
또한, 인식부(1120)는 인식 데이터 전처리부(1120-2), 인식 데이터 선택부(1120-3) 및 모델 갱신부(1120-5) 중 적어도 하나를 선택적으로 더 포함할 수 있다.
인식 데이터 획득부(1120-1)는 상황 판단에 필요한 데이터를 획득할 수 있다. 인식 결과 제공부(1120-4)는 인식 데이터 획득부(1120-1)에서 획득된 데이터를 입력 값으로 학습된 인식 모델에 적용하여 상황을 판단할 수 있다. 인식 결과 제공부(1120-4)는 데이터의 분석 목적에 따른 분석 결과를 제공할 수 있다. 인식 결과 제공부(1120-4)는 후술할 인식 데이터 전처리부(1120-2) 또는 인식 데이터 선택부(1120-3)에 의해 선택된 데이터를 입력 값으로 인식 모델에 적용하여 분석 결과를 획득할 수 있다. 분석 결과는 인식 모델에 의해 결정될 수 있다.
일 실시예로, 인식 결과 제공부(1120-4)는 인식 데이터 획득부(1120-1)에서 획득한 오브젝트가 포함된 오브젝트 영역을 학습된 인식 모델 적용하여 오브젝트 영역에 대응하는 오브젝트 정보를 획득(또는, 추정)할 수 있다.
다른 실시예로, 인식 결과 제공부(1120-4)는 인식 데이터 획득부(1120-1)에서 획득한 오브젝트 영역, 오브젝트 정보 및 컨텍스트 정보 중 적어도 하나를 학습된 인식 모델에 적용하여 검색 결과를 제공할 검색 카테고리를 획득(또는, 추정)할 수 있다
인식부(1120)는 인식 모델의 분석 결과를 향상시키거나, 분석 결과의 제공을 위한 자원 또는 시간을 절약하기 위하여, 인식 데이터 전처리부(1120-2) 및 인식 데이터 선택부(1120-3)를 더 포함할 수도 있다.
인식 데이터 전처리부(1120-2)는 상황 판단을 위해 획득된 데이터가 이용될 수 있도록, 획득된 데이터를 전처리할 수 있다. 인식 데이터 전처리부(1120-2)는 인식 결과 제공부(1120-4)가 상황 판단을 위하여 획득된 데이터를 이용할 수 있도록, 획득된 데이터를 기 정의된 포맷으로 가공할 수 있다.
인식 데이터 선택부(1120-3)는 인식 데이터 획득부(1120-1)에서 획득된 데이터 또는 인식 데이터 전처리부(1120-2)에서 전처리된 데이터 중에서 상황 판단에 필요한 데이터를 선택할 수 있다. 선택된 데이터는 인식 결과 제공부(1120-4)에게 제공될 수 있다. 인식 데이터 선택부(1120-3)는 상황 판단을 위한 기 설정된 선별 기준에 따라, 획득되거나 전처리된 데이터 중에서 일부 또는 전부를 선택할 수 있다. 또한, 인식 데이터 선택부(1120-3)는 모델 학습부(1110-4)에 의한 학습에 의해 기 설정된 선별 기준에 따라 데이터를 선택할 수도 있다.
모델 갱신부(1120-5)는 인식 결과 제공부(1120-4)에 의해 제공되는 분석 결과에 대한 평가에 기초하여, 인식 모델이 갱신되도록 제어할 수 있다. 예를 들어, 모델 갱신부(1120-5)는 인식 결과 제공부(1120-4)에 의해 제공되는 분석 결과를 모델 학습부(1110-4)에게 제공함으로써, 모델 학습부(1110-4)가 인식 모델을 추가 학습 또는 갱신하도록 요청할 수 있다.
도 12는, 일 실시예에 따른 청소 로봇(100) 및 서버(200)가 서로 연동함으로써 데이터를 학습하고 인식하는 예시를 나타내는 도면이다.
도 12을 참조하면, 서버(200)는 상황 판단을 위한 기준을 학습할 수 있으며, 청소 로봇(100)는 서버(200)에 의한 학습 결과에 기초하여 상황을 판단할 수 있다.
이 경우, 서버(200)의 모델 학습부(1110-4)는 도 11b에 도시된 모델 학습부(1110-4)의 기능을 수행할 수 있다. 서버(200)의 모델 학습부(1110-4)는 소정의 상황을 판단하기 위하여 어떤 오브젝트 영상, 오브젝트 정보 또는 컨텍스트 정보를 이용할 지, 상기 데이터를 이용하여 상황을 어떻게 판단할 지에 관한 기준을 학습할 수 있다.
또한, 청소 로봇(100)의 인식 결과 제공부(1120-4)는 인식 데이터 선택부(1120-3)에 의해 선택된 데이터를 서버(200)에 의해 생성된 인식 모델에 적용하여 오브젝트 정보 또는 검색 카테고리를 판단할 수 있다. 또는, 청소 로봇(100)의 인식 결과 제공부(1120-4)는 서버(200)에 의해 생성된 인식 모델을 서버(200)로부터 수신하고, 수신된 인식 모델을 이용하여 상황을 판단할 수 있다. 이 경우, 청소 로봇(100)의 인식 결과 제공부(1120-4)는 인식 데이터 선택부(1120-3)에 의해 선택된 오브젝트 영상을 서버(200)로부터 수신된 인식 모델에 적용하여, 오브젝트 영상에 대응하는 오브젝트 정보를 판단할 수 있다. 또는, 인식 결과 제공부(1120-4)는 컨텍스트 정보 및 컨텍스트 인식 정보 중 적어도 하나를 이용하여 검색 결과를 획득할 검색 카테고리를 판단할 수 있다.
도 13은, 본 개시의 일 실시 예에 따른 인식 모델을 이용하는 네트워크 시스템의 흐름도이다.
여기서, 제1 구성 요소(1301)는 청소 로봇(100)이고, 제2 구성 요소(1302)는 인식 모델이 저장된 서버(200)가 될 수 있다. 또는, 제1 구성 요소(1301)는 범용 프로세서이고, 제2 구성 요소(1302)는 인공 지능 전용 프로세서가 될 수 있다. 또는, 제1 구성 요소(1301)는 적어도 하나의 어플리케이션이 될 수 있고, 제2 구성 요소(1302)는 운영 체제(operating system, OS)가 될 수 있다. 즉, 제2 구성 요소(1302)는 제1 구성 요소(1301)보다 더 집적화되거나, 전용화되거나, 딜레이(delay)가 작거나, 성능이 우세하거나 또는 많은 리소스를 가진 구성 요소로서 데이터 인식 모델의 생성, 갱신 또는 적용 시에 요구되는 많은 연산을 제1 구성 요소(1301)보다 신속하고 효과적으로 처리 가능한 구성 요소가 될 수 있다.
도13을 참조하면, 제1 구성 요소(1301)는 오브젝트(예: 태스크 영역에 배치된 오브젝트)를 포함하는 주변 환경을 촬영하여 캡쳐 이미지(예: 촬영된 영상)를 생성할 수 있다(1311). 제1 구성 요소(1301)는 캡쳐 이미지를 제2 구성 요소(1302)로 전송할 수 있다(1312). 이때, 제1 구성 요소(1301)는 캡쳐 이미지와 함께 선택된 오브젝트에 대응되는 오브젝트 영역에 대한 정보를 전송할 수 있다.
제2 구성 요소(1302)는 수신된 캡쳐 이미지를 오브젝트 영역 및 주변 영역으로 분리할 수 있다(1313). 이때, 제2 구성 요소(1302)는 수신된 오브젝트 영역에 대한 정보에 기반하여 오브젝트 영역 및 주변 영역을 분리할 수 있다.
제2 구성 요소(1302)는 분리된 오브젝트 영역 및 주변 영역을 인식 모델로 입력하여 오브젝트 정보 및 오브젝트에 대한 추가 정보를 획득할 수 있다(1314). 이때, 제2 구성 요소(1302)는 오브젝트 영역을 오브젝트 인식 모델에 입력하여 오브젝트 정보를 획득할 수 있으며, 주변 영역을 주변 정보 인식 모델에 입력하여 오브젝트에 대한 추가 정보를 획득할 수 있다. 또한, 제2 구성 요소(1302)는 오브젝트 정보 및 오브젝트에 대한 추가 정보에 기반하여 검색 카테고리 및 검색 카테고리의 우선 순위를 결정할 수 있다.
제2 구성 요소(1302)는 획득된 오브젝트 정보 및 추가 정보를 이용하여 오브젝트와 연관된 결과를 획득할 수 있다(1315). 이때, 제2 구성 요소(1302)는 오브젝트 정보 및 추가 정보를 입력 데이터로서 인식 모델에 적용하여 오브젝트와 연관된 결과를 획득할 수 있다. 이때, 제2 구성 요소(1302)는 검색 카테고리를 함께 이용하여 결과를 획득할 수 있다. 또한, 제2 구성 요소(1302)는 오브젝트 정보 및 추가 정보 이외에 부가 데이터(예를 들어, 장애물의 위험도, 장애물의 사용자에 대한 중요도)을 이용하여 결과를 획득할 수 있다. 이때, 부가 데이터는 제1 구성 요소(1301) 또는 다른 요소로부터 전송되거나 제2 구성 요소(1302)에 기 저장될 수 있다.
제2 구성 요소(1302)가 오브젝트와 연관된 결과를 제1 구성 요소(1301)로 전송하면(1316), 제1 구성 요소(1301)는 수신한 오브젝트와 연관된 결과에 기반하여 센싱부를 통해 오브젝트를 감지할 수 있다(1317).
도 14는, 본 개시의 일 실시 예에 따른 청소 로봇이 인식 모델을 이용하여 제1 영역에 대한 검색 결과를 제공하는 실시예를 설명하기 위한 흐름도이다.
도 14를 참조하면. 청소 로봇(100)는 주변 환경을 캡쳐 또는 촬영하여 이미지를 생성할 수 있다(1410). 청소 로봇(100)는 생성된 이미지를 입력 데이터 사용하는 학습된 제1 모델을 통해 제1 영역에 대한 제1 정보를 획득할 수 있다(1420). 이때, 제1 모델은 청소 로봇(100)에 저장될 수 있으나, 이는 일 실시예에 불과할 뿐, 외부 서버에 저장될 수 도 있다.
청소 로봇(100)는 제1 정보 및 생성된 이미지를 입력 데이터로 사용하는 학습된 제2 모델을 통해 제2 영역에 대한 제2 정보를 획득할 수 있다(1430). 이때, 제1 모델은 청소 로봇(100)에 저장될 수 있으나, 이는 일 실시예에 불과할 뿐, 외부 서버에 저장될 수 도 있다.
외부 서버에 제1 모델 및 제2 모델이 저장된 경우, 청소 로봇(100)는 생성된 이미지를 외부 서버로 전송하고, 외부 서버로부터 이미지를 제1 모델에 입력하여 획득한 제1 정보 및 이미지와 제1 정보를 제2 모델에 입력하여 획득한 제2 정보를 수신할 수 있다.
상술한 바와 같이, 사용자 입력이 감지된 제1 영역에 대한 제1 정보뿐만 아니라 제1 영역 주위의 제2 영역에 대한 제2 정보를 획득함으로써, 제1 영역에 대한 정보를 더욱 정확하게 획득할 수 있게 된다.
도 15는, 본 개시의 일 실시 예에 따른 인식 모델을 이용하는 시스템의 흐름도이다.
도 15에서, 청소 로봇(100)는 주변의 환경을 캡쳐 또는 촬영하여 이미지를 생성할 수 있다(1510). 청소 로봇(100)는 생성된 이미지를 입력 데이터 사용하는 학습된 제1 모델을 통해 제1 영역에 대한 제1 정보를 획득할 수 있다(1520).
청소 로봇(100)는 생성된 이미지 및 제1 정보를 서버(200)로 전송할 수 있다(1530).
서버(200)는 제1 정보 및 생성된 이미지를 입력 데이터로 사용하는 학습된 제2 모델을 통해 제2 영역에 대한 제2 정보를 획득할 수 있다(1540).
서버(200)는 제1 정보 및 제2 정보를 바탕으로 제1 영역과 관련된 정보를 검색할 수 있다(1550).
서버(200)는 제1 영역과 관련된 검색 결과를 청소 로봇(100)로 전송할 수 있으며(1560), 청소 로봇(100)는 수신된 검색 결과를 제공할 수 있다(1570).
즉, 상술한 실시예에서는 오브젝트를 인식하기 위한 제1 모델을 통해 제1 정보를 획득하는 동작은 청소 로봇(100)가 수행하고, 컨텍스트 정보를 추정하기 위한 제2 모델을 통해 제2 정보를 획득하는 서버(200)가 수행할 수 있다. 즉, 적은 처리량으로도 정보를 수행할 수 있는 오브젝트 인식 동작은 청소 로봇(100)가 수행할 수 있으며, 많은 처리량이 필요한 컨텍스트 추정 동작은 서버(200)가 수행할 수 있다
한편, 도 15에서 설명한 실시예에서는 하나의 서버(200)가 학습된 모델을 통해 제1 정보 또는 제2 정보를 획득하고, 제1 영역과 관련된 정보를 검색하는 것으로 설명하였으나, 이는 일 실시예에 불과할 뿐, 복수의 서버가 상술한 동작을 나누어 수행할 수 있다. 즉, 제1 서버가 학습된 모델을 통해 제1 정보 및 제2 정보를 획득하고, 제2 서버가 제1 서버로부터 획득된 제1 정보 및 제2 정보를 바탕으로 제1 영역과 관련된 정보를 검색할 수 있다. 이는 일 실시 예에 불과하며, 서버(200)에서 수행되는 모든 과정은 청소 로봇(100)에서 수행될 수도 있다.
도 16은 개시의 일 실시 예에 따른, 시맨틱 맵을 생성하는 과정을 설명하기 위한 도면이다.
도 16을 참조하면, 청소 로봇(100)은 도 16의 (a)와 같은 태스크 영역을 대상으로 도 16의 (b)와 같은 네비게이션 맵을 생성할 수 있다. 예로, 청소 로봇은 IR 스테레오 센서, 초음파 센서, 라이다(LIDAR) 센서, PSD 센서 또는 이미지 센서 중 적어도 하나를 이용하여 태스크 영역을 감지할 수 있다. 청소 로봇은 태스크 영역을 감지한 결과를 이용하여 청소 로봇의 주행을 위한 네비게이션 맵을 생성할 수 있다. 바람직하게는 라이다 센서를 이용하여, 도 16의 (b)와 같은 2-D(dimension) 형태의 네비게이션 맵을 생성할 수 있다. 네비게이션 맵은, 예로, 하나 이상의 2-D 라인(line)으로 구획되도록 표시될 수 있다.
또한, 청소 로봇(100)은 도 16의 (a)와 같은 태스크 영역을 대상으로 카메라(120), 사물인식 센서, IR 스테레오 센서, 초음파 센서, 라이다(LIDAR) 센서 또는 이미지 센서 중 적어도 하나를 이용하여 태스크 영역에 존재하는 오브젝트를 감지할 수 있다. 청소 로봇은 오브젝트를 감지한 결과를 학습된 인공 지능 모델에 적용하여 오브젝트의 인식 정보를 획득할 수 있다. 오브젝트가 감지한 결과는, 예로, 오브젝트의 촬영 영상, 오브젝트의 깊이 정보, 오브젝트의 매질 정보 또는 오브젝트의 반사 계수 등을 포함할 수 있으나, 전술한 예에 제한되지는 않는다.
청소 로봇(100)은 오브젝트의 인식 정보로서 도 16의 (c)와 같은, 오브젝트 별 명칭을 획득할 수 있다. 또한, 청소 로봇(100)은 오브젝트의 인식 정보로서, 오브젝트의 종류, 오브젝트의 크기(예로, 오브젝트의 높이, 오브젝트의 폭, 오브젝트의 깊이 등) 또는 오브젝트의 특징(예로, 오브젝트의 색, 오브젝트의 재질 등) 중 적어도 하나를 획득할 수 있으나 전술한 예에 제한되지는 않는다.
청소 로봇(100)은 네비게이션 맵에서 포함된 오브젝트의 영역과 오브젝트의 인식 정보를 매핑하여, 청소 로봇(100)이 작업을 수행하는 태스크 영역의 환경을 나타내는 시맨틱 맵을 생성할 수 있다. 이를 위해, 청소 로봇(100)은 네비게이션 맵에서 오브젝트에 대응되는 오브젝트의 바운더리를 식별할 수 있다. 오브젝트의 바운더리가 식별되면, 청소 로봇(100)은 오브젝트의 바운더리에 의하여 오브젝트의 영역을 결정할 수 있다.
오브젝트의 영역이 결정되면, 청소 로봇(100)은 오브젝트의 영역과 오브젝트의 인식 정보를 매핑할 수 있다.
일 예로, 청소 로봇(100)은 오브젝트의 감지 결과에 따른 오브젝트의 위치에 기반하여, 네비게이션 맵에 포함된 오브젝트의 영역과 오브젝트의 인식 정보를 매핑할 수 있다. 구체적으로, 청소 로봇(100)은 네비게이션 맵을 생성하기 위하여 오브젝트를 감지하는 상황(예: 오브젝트의 감지 결과가 획득될 때)에서의 오브젝트의 위치와, 오브젝트의 인식 정보를 획득하기 위하여 오브젝트를 감지하는 상황(예: 오브젝트의 감지 결과가 획득될 때, 또는 오브젝트의 영상을 저장할 때)에서의 오브젝트의 위치가 서로 동일하거나 임계 범위 이내로 근사한 경우, 네비게이션 맵에 포함된 오브젝트의 영역과 오브젝트의 인식 정보를 서로 매핑할 수 있다.
다른 예로, 청소 로봇(100)은 오브젝트의 감지 결과에 따른 오브젝트의 형태에 기반하여, 네비게이션 맵에 포함된 오브젝트의 영역과 오브젝트의 인식 정보를 매핑할 수 있다. 구체적으로, 청소 로봇(100)은 네비게이션 맵을 생성하기 오브젝트를 감지한 결과에 따른 오브젝트의 형태와, 오브젝트의 인식 정보에 포함된 오브젝트의 형태를 비교하여, 각각의 형태가 서로 동일 또는 유사한 경우, 네비게이션 맵에 포함된 오브젝트의 영역과 오브젝트의 인식 정보를 서로 매핑할 수 있다.
오브젝트의 영역과 오브젝트의 인식 정보를 매핑한 결과로서, 청소 로봇(100)은 도 16의 (d)와 같이, 태스크 영역의 환경을 나타내는 시맨틱 맵을 생성할 수 있다. 청소 로봇(100)은 생성된 시맨틱 맵을 디스플레이를 통하여 표시할 수 있다. 또는, 청소 로봇(100)이 생성된 시맨틱 맵을 외부의 사용자 단말장치로 전송하면, 사용자 단말장치가 시맨틱 맵을 디스플레이를 통하여 표시할 수 있다.
또는, 사용자 단말장치 또는 외부의 서버가 시맨틱 맵을 생성할 수 있다. 예로, 청소 로봇(100)이 네비게이션 맵 및 오브젝트의 인식 정보를 사용자 단말장치 또는 외부의 서버로 전송하면, 사용자 단말장치 또는 외부의 서버가 시맨틱 맵을 생성할 수 있다. 다른 예로, 청로 로봇(100)이 네비게이션 맵 및 오브젝트를 감지한 결과를 사용자 단말장치 또는 외부의 서버로 전송하면, 사용자 단말장치 또는 외부의 서버가 시맨틱 맵을 생성할 수 있다.
시맨틱 맵의 오브젝트 영역에는 오브젝트의 인식 정보가 텍스트(예: 오브젝트의 명칭) 또는 아이콘으로 표시될 수 있다. 또는, 시맨틱 맵의 오브젝트 영역에는 오브젝트의 인식 정보가 참조 형태로 표시될 수 있다. 구체적으로, 오브젝트 영역을 지시하는 지시선에 대하여 오브젝트의 인식 정보가 표시되거나, 오브젝트의 영역이 색으로 구분되어 구분된 색을 대상으로 오브젝트의 인식 정보가 표시될 수 있다.
도 17은 본 개시의 일 실시 예에 따른 시맨틱 맵의 이용을 위한 사용자 인터페이스를 나타내는 도면이다.
도 17의 (a)를 참조하면, 사용자 단말장치(1700)는 시맨틱 맵을 표시할 수 있다. 시맨틱 맵은, 예로, 전술한 도 16의 과정을 통하여 생성될 수 있다. 예로, 시맨틱 맵에는, 오브젝트의 인식 정보가, 예로, 태스크 영역의 구조가 반영된 3-D(dimension) 맵 또는 네비게이션 맵(예로: 라이다맵) 중 적어도 하나를 배경으로 표시될 수 있다.
예로, 시맵틱 맵의 오브젝트 영역의 적어도 일부에는 오브젝트의 인식 정보로서 침대(1701)가 표시될 수 있다. 이 경우, 사용자는 인식 정보인 침대(1701)를 선택할 수 있다.
사용자의 선택에 응답하여, 사용자 단말 장치(1700)는 도 17의 (b)와 같이, 선택된 인식 정보(1701)와 관련된 드롭 다운 박스(drop down box)(1710)를 표시할 수 있다. 드롭 다운 박스(1710)에는 선택된 인식 정보를 대신할 수 있는 오브젝트의 명칭들이 표시될 수 있다. 예로, 오브젝트를 감지한 결과를 학습된 인공 지능 모델에 적용한 결과로서, 오브젝트의 인식 결과가 침대 50%, 쇼파 30%, 테이블 20% 등으로 각각 인식될 수 있다. 이 경우, 인식 결과 값이 높은 순서에 따라, 드롭 다운 박스(1710)에 오브젝트에 적용이 가능한 명칭들이 순차적으로 표시될 수 있다. 예로, 드롭 박스 다운(1710)에 리스트의 첫 번째 필드에는 침대(1701), 두 번째 필드에는 쇼파(1702), 세 번째 필드에는 테이블(1703)이 각각 표시될 수 있다.
이 경우, 사용자가 일 명칭(예: 테이블(1703))을 선택하면, 도 17의 (c)와 같이, 사용자 단말 장치(1700)는 변경된 오브젝트의 인식 정보(1703)를 네비게이션 맵에 표시할 수 있다.
도 18은 본 개시의 일 실시예에 따른 시맨틱 맵을 이용하여 청소 로봇을 제어하는 상황을 나타내는 도면이다.
도 18을 참조하면, 사용자는 사용자 단말장치(1700)가 제공하는 시맨틱 맵에 표시된 오브젝트의 인식 정보를 이용하여 제어 명령을 수행할 수 있다. 예로, 사용자 단말 장치(1700)의 디스플레이에는 전술한 도 16 및 도 17의 시맨틱 맵에 표시된 적어도 하나의 오브젝트의 인식 정보가 표시될 수 있다. 이 경우, 사용자는 청소 구역을 지정하기 위하여, 'TV 앞 청소해줘' 라고 발화할 수 있다.
사용자의 발화 명령에 따라, 사용자 단말장치(1700)는 사용자의 발화 명령을 인식하고, 인식된 발화 명령에 대응되는 사용자의 제어 명령을 청소 로봇(100)으로 전송할 수 있다. 제어 명령은 특정 오브젝트에 관한 영역에 대하여 태스크의 수행을 요청하는 명령일 수 있다. 청소 로봇(100)은 사용자의 제어 명령에 기반하여 태스크를 수행할 수 있다. 예로, 청소 로봇(100)은 TV 앞으로 이동하여, TV 앞을 청소할 수 있다.
도 19는 본 개시의 일 실시 예에 따른, 시맨틱 맵을 생성하는 과정을 설명하기 위한 도면이다.
도 19를 참조하면, 청소 로봇(100)은 도 19의 (a)와 같은 태스크 영역을 대상으로 도 19의 (b)와 같은 네비게이션 맵을 생성할 수 있다. 네비게이션 맵을 생성하는 상세한 설명은 전술한 도 16의 (a) 및 (b)에 대응되어 중복되는 설명은 생략한다.
한편, 청소 로봇(100)은 도 19의 (a)와 같은 태스크 영역을 감지한 결과를 이용하여 태스크 영역의 각 장소들의 인식 정보를 획득할 수 있다. 예로, 청소 로봇(100)은, 인식 정보로서 도 19의 (c)와 같은, 장소 별 명칭을 획득할 수 있다.
다양한 실시 예로, 청소 로봇(100)는 태스크 영역의 각 장소를 촬영한 복수의 영상들을 학습된 인공 지능 모델에 적용하여 태스크 영역의 각 장소들의 인식 정보를 획득할 수 있다.
다양한 실시 예로, 청소 로봇(100)은 전술한 도 7a 및 도 7b와 같이, 오브젝트를 감지하여 문(700, 710)을 인식하고, 인식된 문(700, 710)을 이용하여 태스크 영역의 구조를 결정할 수 있다. 또한, 청소 로봇(100)는 태스크 영역의 구조로서 구분되는 각 장소들의 인식 정보를 획득할 수 있다. 예로, 청소 로봇(100)은 문이 가장 많이 인식되고, 가장 넓은 구조를 가진 영역을 거실로 인식하고, 차 순위로 넓은 구조를 가진 영역을 침실로 인식할 수 있다.
다양한 실시 예로, 청소 로봇(100)은 태스크 영역의 각 장소에 위치한 오브젝트의 인식 정보를 이용하여 태스크 영역의 각 장소들의 인식 정보를 획득할 수 있다. 예로, 청소 로봇(100)은 식탁이 인식된 영역은 부엌으로 결정하고, 침대가 인식된 영역은 침실로 인식하고, TV 또는 쇼파가 인식된 영역은 거실로 인식할 수 있다.
각 장소들의 인식 정보가 획득되면, 청소 로봇(100)은 네비게이션 맵 및 획득된 각 장소들의 인식 정보를 이용하여 도 19의 (d)와 같은, 태스크 영역의 환경을 나타내는 시맨틱 맵을 생성할 수 있다. 청소 로봇(100)은 생성된 시맨틱 맵을 디스플레이를 통하여 표시할 수 있다. 또는, 청소 로봇(100)이 생성된 시맨틱 맵을 외부의 사용자 단말장치로 전송하면, 사용자 단말장치가 시맨틱 맵을 디스플레이를 통하여 표시할 수 있다.
또는, 사용자 단말장치 또는 외부의 서버가 시맨틱 맵을 생성할 수 있다. 예로, 청소 로봇(100)이 네비게이션 맵 및 각 장소들의 인식 정보를 사용자 단말장치 또는 외부의 서버로 전송하면, 사용자 단말장치 또는 외부의 서버가 시맨틱 맵을 생성할 수 있다. 다른 예로, 청소 로봇(100)이 네비게이션 맵, 및 태스크 영역의 각 장소에 포함된 오브젝트를 감지한 결과를 사용자 단말장치 또는 외부의 서버로 전송하면, 사용자 단말장치 또는 외부의 서버가 시맨틱 맵을 생성할 수 있다.
도 20은 본 개시의 일 실시 예에 따른 시맨틱 맵의 이용을 위한 사용자 인터페이스를 나타내는 도면이다.
도 20의 (a)를 참조하면, 사용자 단말장치(2000)는 시맨틱 맵을 표시할 수 있다. 시맨틱 맵은, 예로, 전술한 도 19의 과정을 통하여 생성될 수 있다. 예로, 시맨틱 맵에는, 오브젝트의 인식 정보가, 예로, 태스크 영역의 구조가 반영된 3-D 맵 또는 네비게이션 맵 중 적어도 하나를 배경으로 표시될 수 있다.
예로, 시맨틱 맵의 오브젝트 영역의 적어도 일부에는 일 장소의 인식 정보로서 거실(2001)이 표시될 수 있다. 이 경우, 사용자는 인식 정보인 거실(2001)를 선택할 수 있다.
사용자의 선택에 응답하여, 사용자 단말장치(2000)는 도 20의 (b)와 같이, 선택된 인식 정보(2001)와 관련된 드롭 다운 박스(drop down box)(2010)를 표시할 수 있다. 드롭 다운 박스(2010)에는 선택된 인식 정보를 대신할 수 있는 장소들의 명칭들이 표시될 수 있다. 예로, 일 장소에서 촬영된 영상을 학습된 인공 지능 모델에 적용한 결과로서, 일 장소의 인식 결과가 거실 50%, 침실 30%, 서재 20%로 인식될 수 있다. 이 경우, 인식 결과 값이 높은 순서에 따라, 드롭 다운 박스(2010)에 일 장소에 적용이 가능한 명칭들이 순차적으로 표시될 수 있다. 예로, 드롭 박스 다운(2010)에 리스트의 첫 번째 필드에는 거실(2001), 두 번째 필드에는 침실(2002), 세 번째 필드에는 서재(2003)가 각각 표시될 수 있다.
이 경우, 사용자가 일 명칭(예: 서재(2003))을 선택하면, 도 20의 (c)와 같이, 사용자 단말장치(2000)는 변경된 장소의 인식 정보(2003)를 네비게이션 맵에 표시할 수 있다.
도 21은 본 개시의 일 실시예에 따른 시맨틱 맵을 이용하여 청소 로봇을 제어하는 상황을 나타내는 도면이다.
도 21을 참조하면, 사용자는 사용자 단말장치(2000)가 제공하는 시맨틱 맵에 표시된 각 장소들의 인식 정보를 이용하여 제어 명령을 수행할 수 있다. 예로, 사용자 단말 장치(2000)의 디스플레이에는 전술한 도 19및 도 20의 시맨틱 맵에 표시된 각 장소들의 인식 정보가 표시될 수 있다. 이 경우, 사용자는 청소 구역을 지정하기 위하여, '거실 청소해줘'라고 발화할 수 있다.
사용자의 발화 명령에 따라, 사용자 단말장치(2000)는 사용자의 발화 명령을 인식하고, 인식된 사용자의 발화 명령에 대응되는 사용자의 제어 명령을 청소 로봇(100)으로 전송할 수 있다. 사용자의 제어 명령은 특정 장소에 대하여 태스크의 수행을 요청하는 명령일 수 있다. 청소 로봇(100)은 사용자의 제어 명령에 기반하여 태스크를 수행할 수 있다. 예로, 청소 로봇(100)은 거실로 이동하여, 거실을 청소할 수 있다.
다양한 실시예로, 사용자 단말장치는 전술한 도 17의 (a)의 오브젝트의 인식 정보 및 도 20의 (a)의 각 장소들의 인식 정보를 모두 포함하는 시맨틱 맵을 표시할 수 있다. 이 경우, 오브젝트의 인식 정보 및 각 장소들의 인식 정보 중 일 인식 정보를 선택하면, 사용자 단말장치는 선택된 인식 정보를 변경할 수 있는 사용자 인터페이스를 제공할 수 있다.
예로, 사용자 단말장치는 선택된 인식 정보를 변경할 수 있는 후보 리스트를 제공할 수 있다. 후보 리스트에는 변경 가능한 명칭들이 포함될 수 있으며, 상기 명칭들은 인공 지능 모델의 인식 결과를 고려하여 확률 값이 높은 순서에 따라 배열될 수 있다. 이 중에, 일 명칭을 선택하는 사용자 입력이 감지되면, 사용자 단말장치는 선택된 명칭으로 기존의 오브젝트의 인식 정보를 변경하여 표시할 수 있다.
도 22는 본 개시의 일 실시 예에 따른 오브젝트를 인식하는 과정을 나타내는 도면이다.
전술한 실시예에 따르면, 청소 로봇(100)은 카메라(120)를 이용하여 오브젝트를 촬영한 영상을 학습된 인공 지능 모델에 적용하여 오브젝트의 인식 정보를 획득할 수 있다. 또한, 청소 로봇(100)은 카메라(120)를 이용하여 태스크 영역의 장소를 촬영한 영상을 학습된 인공 지능 모델에 적용하여 장소의 인식 정보를 획득할 수 있다.
또 다른 예로, 청소 로봇(100)이 특정 장소에 있는 오브젝트를 촬영한 경우, 청소 로봇(100)은 촬영된 영상을 학습된 인공 지능 모델에 적용하여 오브젝트의 인식 정보 및 장소의 인식 정보를 함께 획득할 수도 있다. 구체적으로, 인공 지능 모델이 마련된 전자 장치(예로, 외부의 서버)(2200)는 오브젝트 인식 네트워크(예로, 컨벌루션 네트워크(convolution network model))(2210)를 통하여 생성된 종단의 특징 맵(feature map)들(2220)을 분류기에 적용하여, 오브젝트를 인식하는 오브젝트 인식 모듈(2230) 및 오브젝트의 장소를 인식하는 장소 인식 모듈(2240)의 기능을 수행할 수 있다. 이 때, 오브젝트의 인식을 위한 손실(loss) 및 장소의 인식을 위한 손실(loss)이 동시에 학습함에 따라 학습 단계가 단순화될 수도 있다.
촬영된 영상에 대하여, 오브젝트의 인식 및 장소의 인식이 함께 수행되는 경우, 더욱 정확한 오브젝트의 인식이 가능할 수 있다. 예로, 촬영된 영상에 포함된 오브젝트의 인식 결과가 테이블 50%, 식탁 30%, 책상 20%로 인식될 수 있다. 이 경우, 오브젝트가 배치된 장소가 부엌으로 인식되는 경우, 전자 장치(2300)는 상기 오브젝트를 테이블이 아닌 식탁으로 최종 인식할 수 있다. 다른 예로, 오브젝트 및 오브젝트가 배치된 장소의 인식 결과가 각각 공부방 및 테이블인 경우, 오브젝트는 책상으로 최종 인식될 수 있다. 또 다른 예로, 오브젝트 및 오브젝트가 배치된 장소의 인식 결과가 각각 현관 및 문인 경우, 오브젝트는 현관문으로 최종 인식될 수 있다. 또 다른 예로, 오브젝트 및 오브젝트가 배치된 장소의 인식 결과가 각각 방 및 문인 경우, 오브젝트는 방문으로 최종 인식될 수 있다. 또 다른 예로, 오브젝트 및 오브젝트가 배치된 장소의 인식 결과가 각각 문턱 및 방인 경우, 오브젝트는 방문턱으로 최종 인식될 수 있다. 또 다른 예로, 오브젝트 및 오브젝트가 배치된 장소의 인식 결과가 각각 문턱 및 베란다인 경우, 오브젝트는 베란다 문턱으로 최종 인식 될 수 있다.
이와 같이, 촬영된 영상에 대하여, 오브젝트 및 오브젝트가 포함된 장소가 하나의 네트워크를 통하여 함께 인식되는 경우, 전자 장치(2200) 또는 청소 로봇(100)은 태스크 영역의 환경을 나타내는 시맨틱 맵을 더욱 효율적으로 생성할 수 있다. 예로, 시맨틱 맵에는 오브젝트의 인식 정보뿐만 아니라, 오브젝트의 장소 정보가 함께 표시되게 된다.
도 23은, 본 개시의 일 실시 예에 따른 시맨틱 맵을 생성하는 과정을 설명하기 위한 도면이다.
청소 로봇(100)이 카메라(120)를 이용하여 촬영한 영상을 도 22에서 전술한 전자 장치(2200)에 포함된 네트워크에 적용하는 경우, 시맨틱 맵에는 오브젝트의 인식 정보 및 장소의 인식 정보(또는, 장소의 컨텍스트) 중 적어도 하나가 표시될 수 있다.
예로, 청소 로봇(100)은 촬영된 영상을 도 22의 오브젝트 인식 모듈(2230)에 적용하여 도 23의 (a)와 같은 제1 시맨틱 맵을 생성할 수 있다. 도 23의 (a)의 제1 시맨틱 맵에는 오브젝트의 인식 정보로서, 오브젝트의 명칭이 오브젝트에 대응되는 위치에 표시될 수 있다. 또한, 청소 로봇(100)은 촬영된 영상을 도 22의 장소 인식 모듈(2240)에 적용하여 도 23의 (b)와 같은 제2 시맨틱 맵을 생성할 수 있다. 도 23의 (b)의 시맨틱 맵에는 장소의 인식 정보로서 장소의 명칭이, 태스크의 분할 영역 중 상기 장소에 대응되는 영역에 표시될 수 있다.
청소 로봇(100)은 도 23의 (a)의 제1 시맨틱 맵 및 도 23의 (b)의 제2 시맨틱 맵을 결합하여, 도 23의 (c)와 같은 최종 시맨틱 맵을 생성할 수 있다. 도 23의 (c)의 최종 시맨틱 맵에는 태스크 영역의 환경 정보로서, 태스크 영역에 존재하는 오브젝트의 명칭 및 장소의 명칭이 함께 표시될 수 있다.
도 24는, 본 개시의 일 실시 예에 따른 시맨틱 맵을 이용하여 청소 로봇을 제어하는 상황을 나타내는 도면이다.
도 24를 참조하면, 사용자는 사용자 단말장치(2400)가 제공하는 시맨틱 맵에 표시된 오브젝트 및 각 장소들의 인식 정보를 이용하여 제어 명령을 수행할 수 있다. 예로, 사용자 단말 장치(2400)의 디스플레이에는 전술한 도 23의 시맨틱 맵에 표시된 오브젝트 및 각 장소들의 인식 정보가 표시될 수 있다. 이 경우, 사용자는 청소 구역을 지정하기 위하여, '거실에 있는 테이블 앞 청소해줘' 라고 발화할 수 있다.
사용자의 발화 명령에 따라, 사용자 단말장치(2400)는 사용자의 발화 명령을 인식할 수 있다. 사용자 단말장치(2400)는 인식된 발화 명령에 대응되는 사용자의 제어 명령을 청소 로봇(100)으로 전송할 수 있다. 제어 명령은 특정 장소에 위치한 특정 오브젝트에 관한 영역에 대하여 태스크의 수행을 요청하는 명령일 수 있다. 청소 로봇(100)은 사용자의 제어 명령에 기반하여 태스크를 수행할 수 있다. 예로, 청소 로봇(100)은 테이블이 위치한 장소들(거실 또는 서재 등) 중에서, 거실에 위치한 테이블 앞으로 이동하여, 테이블 앞을 청소할 수 있다.
다양한 실시예로, 도 18, 도 21, 도 24에서, 사용자의 발화 명령에 따라, 청소 로봇(100)이 직접 사용자의 발화 명령을 인식할 수도 있다. 이 경우, 청소 로봇(100)은 사용자의 발화 명령을 인식하기 위한 자동 음성 인식(automatic speech recognition, ASR) 모듈, 자동 음성 인식(automatic speech recognition)(ASR) 모듈), 자연어 이해(natural language understanding)(NLU) 모듈 및 패스 플래너(path planner) 모듈 중 적어도 하나를 포함할 수 있다. 이 경우, 사용자가 청소 구역을 지정하기 위하여 발화함에 따라, 청소 로봇(100)은 전술한 모듈들 중 적어도 하나를 이용하여 사용자의 발화 명령을 인식할 수 있다. 청소 로봇(100)은 인식된 사용자의 제어 명령에 따라 태스크를 수행할 수 있다. 예로, 청소 로봇(100)은 저장된 시맨틱 맵에 포함된 환경 정보(예로, 오브젝트의 명칭, 장소의 명칭 등)에 기반하여 사용자의 제어 명령에 따른 태스크를 수행할 수 있다.
다양한 실시예로, 도 18, 도 21, 도 24에서, 사용자의 발화 명령에 따라, 제3 음성 인식 기기(예: 가정용 음성 인식 허브, 인공 지능 스피커 등)가 사용자의 발화 명령을 인식할 수도 있다. 이 때, 제3 음성 인식 기기는 전술한 자동 음성 인식 모듈, 자동 음성 인식 모듈, 자연어 이해 모듈 및 패스 플래너 모듈 중 적어도 하나를 포함할 수 있다. 제3 음성 인식 기기는 사용자의 발화 명령을 인식하고, 인식된 발화 명령에 대응되는 사용자의 제어 명령을 청소 로봇(100)으로 전송할 수 있다. 이에 따라, 장소 또는 기기의 제한이 최소화되면서, 청소 로봇(100)이 사용자의 제어 명령에 따른 태스크를 수행하는 것이 가능하게 된다.
도 25는, 본 개시의 일 실시예에 따른 청소 로봇의 기구 구성을 나타내는 도면이다.
도 25의 (a)는 복수 개의 센서를 구비한 청소 로봇(100)의 사시도를 나타내고, 도 25의 (b)는 복수 개의 센서를 구비한 청소 로봇(100)의 정면도를 나타낸다.
도 25의 청소 로봇(100)은 복수 개의 센서로서, IR 스테레오 센서, 라이다(LIDAR) 센서, 초음파 센서, 3D 센서, 사물인식 센서, 추락 감지 센서 또는 PSD(Position Sensitive Diodes) 센서 중 적어도 하나를 포함할 수 있다.
이 중, IR 스테레오 센서, 라이다 센서, 초음파 센서의 기능은 도 2에서 전술하여 상세한 설명은 생략한다. 초음파 센서는, 예로, 발광용 센서 모듈 2개 및 수광용 센서 모듈 2개로 구성될 수 있다. 청소 로봇(100)은 3D 센서를 이용하여 전면의 오브젝트를 감지하여, 오브젝트의 3D차원 형상을 추출할 수 있다. 이에 따라, 청소 로봇(100)이 오브젝트의 크기와 거리 정보를 획득하는 것이 가능하게 된다. 또한, 청소 로봇(100)은 사물 인식 센서를 이용하여 전면의 오브젝트를 감지하여, 오브젝트의 종류를 획득할 수 있다. 예로, 청소 로봇(100)은 사물 인식 센서에 포함된 카메라를 이용하여 오브젝트를 촬영하고, 촬영된 영상을 학습된 인공 지능 모델에 적용하여, 적용 결과로서 오브젝트의 종류를 획득할 수 있다. 또한, 청소 로봇(100)은 추락 감지 센서를 이용하여 전방 및 후방으로 주행 시에 바닥의 단차(예로, 거실 바닥과 현관 입구 간의 단차)를 인식할 수 있다. 추락 감지 센서는, 예로, 전방 및 후방에 각각 2개씩 마련될 수 있다. 또한, 청소 로봇(100)은 PSD 센서를 이용하여 근접 거리(예: 15cm 이내)의 오브젝트의 위치를 감지할 수 있다. 예로, 청소 로봇(100)은 PSD 센서를 이용하여 오브젝트를 감지하거나, 벽을 따라 주행하면서 청소를 수행할 수 있다. PSD 센서는, 예로, 전방의 좌우에 45도 바깥 방향으로 각각 마련될 수도 있고, 또한 청소 로봇(100)의 우측면과 좌측면에 각각 마련될 수도 있다.
도 25를 참조하면, 복수 개의 센서들은 청소 로봇(100)의 전방, 후방 또는 측면에 마련될 수 있다. 예로, 청소 로봇(100)의 전방에는 적어도 하나의 초음파 센서(2501 ~ 2504), 적어도 하나의 3D 센서(2511), 적어도 하나의 카메라(예: RGB 카메라)(2521), IR 스테레오 센서(예: 도킹용 IR 스테레오 센서)(2531), PSD 센서(2541, 2542), 라이다 센서(2551) 또는 범퍼 센서(2561) 중 적어도 하나가 마련될 수 있다. 또한, 청소 로봇(100)의 측면에는 또 다른 PSD 센서(미도시)이 마련될 수 있다.
도 26a 및 도 26b는, 본 개시의 일 실시 예에 따른 청소 로봇의 감지 범위를 나타내는 도면이다.
도 26a의 (a)는 각각 청소 로봇(100)의 평면도, 도26a의 (b)는 청소 로봇(100)의 측면도, 도 26b의 (c) 및 (d)는 청소 로봇(100)의 사시도를 나타낸다.
도 26a 및 도 26b에서, 청소 로봇(100)은 복수 개의 센서들을 이용하여 주행 중에 오브젝트 또는 댁 내 구조를 감지할 수 있다.
이 경우, 도 26a 및 도 26b에서, 3D 센서(2511)의 감지 범위는 대략 제1 범위(2510a)이며, 초음파 센서(2501 ~ 2504)의 감지 범위는 대략 제2 범위(2500a)이며, 전면의 PSD 센서의 감지 범위(2541, 2542)는 대략 제3 범위(2540a, 2540b)이며, 측면의 PSD 센서들(2543, 미도시)의 감지 범위는 대략 제4 범위(2540c, 2540d)이며, 라이다 센서(2551)의 감지 범위는 대략 제5 범위(2550a)이고, 카메라(2521)의 촬영 화각은 대략 제6 범위(2520a)가 될 수 있으나, 전술한 예는 일 실시예에 불과하고 복수 개의 센서들의 스펙 또는 실장 위치에 기반하여, 감지 또는 촬영 범위가 다양하게 예측될 수 있다.
청소 로봇(100)은, 오브젝트의 인식 정보에 기반하여, 전술한 복수 개의 센서들 중 적어도 하나의 센서를 선택할 수 있다. 청소 로봇(100)은 선택된 적어도 하나의 센서를 이용하여 오브젝트를 감지하고, 감지된 결과를 이용하여 오브젝트에 대한 추가 정보를 획득할 수 있다. 청소 로봇(100)은 오브젝트에 대한 추가 정보에 기반하여 청소 로봇(100)이 수행할 태스크를 결정할 수 있다.
도 27은, 본 개시의 일 실시 예에 따른 청소 로봇의 흐름도를 나타낸다.
도 27을 참조하면, 청소 로봇(100)은 적어도 하나의 센서가 오브젝트가 배치된 태스크 영역을 감지한 결과를 이용하여, 청소 로봇(100)의 주행을 위한 네비게이션 맵을 생성할 수 있다(2701).
또한, 청소 로봇(100)은 카메라(120)가 오브젝트를 촬영한 영상을 학습된 인공 지능 모델에 적용하여, 오브젝트의 인식 정보를 획득할 수 있다(2702). 이 경우, 오브젝트의 인식 정보를 획득하는 동작은, 동작 2701의 청소 로봇(100)이 네비게이션 맵을 생성하는 동작보다 선행되어 수행될 수도 있으며, 또는 네비게이션 맵을 생성하는 과정에서 오브젝트의 인식 정보가 획득될 수도 있다.
다양한 실시 예로, 청소 로봇(100)은 카메라(120)가 오브젝트를 촬영한 영상을 외부의 서버에 위치한 학습된 인공 지능 모델에 적용하여, 오브젝트의 인식 정보를 획득할 수 있다.
오브젝트의 인식 정보가 획득되면, 청소 로봇(100)은 네비게이션 맵에 포함된 오브젝트의 영역과 오브젝트의 인식 정보를 매핑하여, 태스크 영역의 환경을 나타내는 시맨틱 맵을 생성할 수 있다(2703).
청소 로봇(100)은 시맨틱 맵을 이용한 사용자의 제어 명령에 기반하여, 청소 로봇의 태스크를 수행할 수 있다(2704). 이 때, 사용자의 제어 명령은, 특정 오브젝트에 관한 영역 또는 특정 장소에 대하여 태스크의 수행을 요청하는 명령일 수 있다.
다양한 실시예로, 청소 로봇(100)은 태스크 영역의 각 장소들의 인식 정보를 획득할 수 있다. 청소 로봇(100)은 획득된 각 장소들의 인식 정보 및 매핑된 오브젝트의 인식 정보를 이용하여 태스크 영역의 환경을 나타내는 시맨틱 맵을 생성할 수 있다.
다양한 실시예로, 청소 로봇(100)은 오브젝트의 감지 결과에 따른, 오브젝트의 위치 또는 오브젝트의 형태 중 적어도 하나에 기반하여, 네비게이션 맵에 포함된 오브젝트의 영역과 오브젝트의 인식 정보를 매핑하여, 태스크 영역의 환경을 나타내는 시맨틱 맵을 생성할 수 있다.
다양한 실시예로, 청소 로봇(100)은 네비게이션 맵에서 오브젝트에 대응되는 오브젝트의 바운더리를 식별할 수 있다. 청소 로봇(100)은 오브젝트의 바운더리에 의하여 결정되는 오브젝트의 영역과 오브젝트의 인식 정보를 매핑하여, 태스크 영역의 환경을 나타내는 시맨틱 맵을 생성할 수 있다.
다양한 실시예로, 센싱부(110)에 포함된 복수의 센서들 중에서, 청소 로봇(100)은 오브젝트의 인식 정보에 기반하여 선택된 적어도 하나의 센서를 이용하여 오브젝트를 감지할 수 있다. 청소 로봇(100)은 적어도 하나의 센서가 감지한 결과를 이용하여 상기 오브젝트에 대한 추가 정보를 획득할 수 있다.
다양한 실시예로, 청소 로봇(100)은 오브젝트의 인식 정보에 따라 복수의 센서들에 대한 우선 순위를 설정할 수 있다. 청소 로봇(100)은 복수의 센서들 중에서, 우선 순위에 따라 적어도 하나의 센서가 감지한 결과를 이용하여 오브젝트에 대한 추가 정보를 획득할 수 있다.
도 28은 본 개시의 다른 일 실시 예에 따른 청소 로봇의 흐름도를 나타낸다.
도 28을 참조하면, 청소 로봇(100)은 적어도 하나의 센서가 태스크 영역을 감지한 결과를 이용하여, 청소 로봇(100)의 주행을 위한 네비게이션 맵을 생성할 수 있다(2801).
또한, 청소 로봇(100)은 카메라(120)가 태스크 영역에 포함된 장소를 촬영한 영상을 학습된 인공 지능 모델에 적용하여, 태스크 영역에 포함된 장소의 인식 정보를 획득할 수 있다(2802).
태스크 영역에 포함된 장소의 인식 정보가 획득되면, 청소 로봇(100)은 네비게이션 맵에 포함된 상기 장소에 대응되는 영역과 상기 장소의 인식 정보들을 매핑하여, 태스크 영역의 환경을 나타내는 시맨틱 맵을 생성할 수 있다(2803).
청소 로봇(100)은 시맨틱 맵을 이용한 사용자의 제어 명령에 기반하여, 청소 로봇(100)의 태스크를 수행할 수 있다(2804).
도 29는 본 개시의 또 다른 일 실시 예에 따른 청소 로봇의 흐름도를 나타낸다.
도 29를 참조하면, 청소 로봇(100)은 청소 로봇(100) 주변의 오브젝트를 촬영할 수 있다(2901).
청소 로봇(100)은 촬영된 영상을 학습된 인공지능 모델에 적용하여 영상에 포함된 오브젝트의 인식 정보를 획득할 수 있다(2902). 예로, 청소 로봇(100)은 촬영된 영상을 외부의 서버에 위치한 학습된 인공 지능 모델에 적용하여, 오브젝트의 인식 정보를 획득할 수 있다.
청소 로봇(100)은 복수의 센서들 중에서, 획득된 오브젝트의 인식 정보에 기반하여 선택된 적어도 하나의 센서가 오브젝트를 감지한 결과를 이용하여 오브젝트에 대한 추가 정보를 획득할 수 있다(2903).
예로, 청소 로봇(100)은 복수의 센서들이 일정 시점을 기준으로 일정 시간 내(예로, 10ms)에 감지한 감지 결과들 중에서, 오브젝트의 인식 정보에 기반하여 선택된 적어도 하나의 센서가 감지한 감지 결과만 선택적으로 이용하여 오브젝트에 대한 추가 정보를 획득할 수 있다. 이 때, 오브젝트의 인식 정보에 기반하여 선택된 적어도 하나의 센서는 하나 또는 복수 개일 수도 있다. 오브젝트의 인식 정보에 기반하여 복수 개의 센서들이 선택된 경우, 선택된 복수 개의 센서들은 우선 순위를 가질 수 있다. 이 경우, 청소 로봇(100)은 우선 순위가 높은 센서의 감지 결과에 가중치를 부가하여 오브젝트에 대한 추가 정보를 획득할 수도 있다.
다양한 실시예로, 복수 개의 센서들 중 IR스테레오 센서에 우선 순위가 높게 설정되는 경우, 청소 로봇(100)은 IR 스테레오 센서가 감지한 결과에 대하여 가중치를 부가하여 오브젝트에 대한 추가 정보를 획득할 수 있다. 구체적으로, 청소 로봇(100)은 오브젝트에 대한 바운딩 박스를 판단하고, 바운딩 박스의 판단 결과와 IR 스테레오 센서를 통한 오브젝트 감지 결과가 일치하지 않는 영역에 대하여, IR 스테레오 센서의 임계값을 감소시켜 오브젝트를 감지할 수 있다.
다양한 실시예로, 청소 로봇(100)은 오브젝트의 인식 정보에 따라 복수의 센서들에 대한 우선 순위를 설정하고, 복수의 센서들 중에서, 우선 순위에 따라 적어도 하나의 센서가 감지한 결과를 이용하여 오브젝트에 대한 추가 정보를 획득할 수 있다.
다양한 실시예로, 청소 로봇(100)은 오브젝트의 인식 정보에 따라 복수의 센서들 중 라이다 센서에 우선 순위가 높게 설정되는 경우, 라이다 센서가 감지한 결과에 대하여 가중치를 부가하여 오브젝트에 대한 추가 정보를 획득할 수 있다.
다양한 실시예로, 청소 로봇(100)은 오브젝트의 인식 정보에 따라 복수의 센서들 중 초음파 센서에 우선 순위가 높게 설정되는 경우, 초음파 센서가 감지한 결과에 대하여 가중치를 부가하여 오브젝트에 대한 추가 정보를 획득할 수 있다. 이 때, 오브젝트의 인식 정보에 따라 복수의 센서들 중 초음파 센서에 우선 순위가 높게 설정되는 경우는, 인식된 오브젝트가 투명하거나 검은 색인 오브젝트인 경우일 수 있다.
오브젝트에 대한 추가 정보에 기반하여, 청소 로봇(100)은 청소 로봇(100)이 수행할 태스크를 결정할 수 있다(2904).
본 개시의 다양한 실시예들은, 이동 장치에서도 구현될 수 있다. 이동 장치는, 예로, 공공 장소용 서비스 로봇, 생산 현장에서의 반송 로봇, 작업자 지원 로봇, 가사용 로봇, 보안 로봇 또는 자율주행 차량 등 다양한 형태가 가능할 수 있다.
이 경우, 본 개시의 태스크는 이동 장치의 목적에 따른 태스크가 될 수 있다. 예로, 청소 로봇의 태스크가 오브젝트를 회피하거나 댁 내의 먼지를 흡입하는 기능이라면, 작업자 지원 로봇의 태스크는 오브젝트를 회피하거나 물건을 옮기는 기능일 수 있다. 또한, 보안 로봇의 태스크는 오브젝트를 회피하거나, 침입자를 감지하여 알람을 제공하거나, 침입자를 촬영하는 기능일 수 있다. 또한, 자율주행 차량의 태스크는 타 차량 또는 장애물을 회피하거나, 조향 장치 또는 가속/감속 장치를 제어하는 기능일 수 있다.
본 개시에서 사용된 용어 "모듈"은 하드웨어, 소프트웨어 또는 펌웨어로 구현된 유닛을 포함할 수 있으며, 예를 들면, 로직, 논리 블록, 부품, 또는 회로 등의 용어와 상호 호환적으로 사용될 수 있다. 모듈은, 일체로 구성된 부품 또는 하나 또는 그 이상의 기능을 수행하는, 상기 부품의 최소 단위 또는 그 일부가 될 수 있다. 예를 들면, 일실시예에 따르면, 모듈은 ASIC(application-specific integrated circuit)의 형태로 구현될 수 있다.
본 개시의 다양한 실시예들은 기기(machine)(예: 청소 로봇(100), 청소 로봇(100)과 통신 가능한 서버(미도시))에 의해 읽을 수 있는 저장 매체(storage medium)(예: 메모리(130), 서버의 메모리(미도시))에 저장된 하나 이상의 명령어(instructions)들을 포함하는 소프트웨어(예: 프로그램)로서 구현될 수 있다. 예를 들면, 기기의 프로세서(예: 프로세서(140), 서버의 프로세서(미도시))는, 저장 매체로부터 저장된 하나 이상의 명령어들 중 적어도 하나의 명령을 호출하고, 그것을 실행할 수 있다. 이것은 기기가 상기 호출된 적어도 하나의 명령어에 따라 적어도 하나의 기능을 수행하도록 운영되는 것을 가능하게 한다. 상기 하나 이상의 명령어들은 컴파일러에 의해 생성된 코드 또는 인터프리터에 의해 실행될 수 있는 코드를 포함할 수 있다. 기기로 읽을 수 있는 저장매체 는, 비일시적(non-transitory) 저장매체의 형태로 제공될 수 있다. 여기서, '비일시적'은 저장매체가 실재(tangible)하는 장치이고, 신호(signal)(예: 전자기파)를 포함하지 않는다는 것을 의미할 뿐이며, 이 용어는 데이터가 저장매체에 반영구적으로 저장되는 경우와 임시적으로 저장되는 경우를 구분하지 않는다.
일 실시예에 따르면, 본 개시에 개시된 다양한 실시예들에 따른 방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 상품으로서 판매자 및 구매자 간에 거래될 수 있다. 컴퓨터 프로그램 제품은 기기로 읽을 수 있는 저장 매체(예: compact disc read only memory (CD-ROM))의 형태로 배포되거나, 또는 어플리케이션 스토어(예: 플레이 스토어TM)를 통해 또는 두개의 사용자 장치들(예: 스마트폰들) 간에 직접, 온라인으로 배포(예: 다운로드 또는 업로드)될 수 있다. 온라인 배포의 경우에, 컴퓨터 프로그램 제품의 적어도 일부는 제조사의 서버, 어플리케이션 스토어의 서버, 또는 중계 서버의 메모리와 같은 기기로 읽을 수 있는 저장 매체에 적어도 일시 저장되거나, 임시적으로 생성될 수 있다.
다양한 실시예들에 따르면, 상기 기술한 구성요소들의 각각의 구성요소(예: 모듈 또는 프로그램)는 단수 또는 복수의 개체를 포함할 수 있다. 다양한 실시예들에 따르면, 전술한 해당 구성요소들 중 하나 이상의 구성요소들 또는 동작들이 생략되거나, 또는 하나 이상의 다른 구성요소들 또는 동작들이 추가될 수 있다. 대체적으로 또는 추가적으로, 복수의 구성요소들(예: 모듈 또는 프로그램)은 하나의 구성요소로 통합될 수 있다. 이런 경우, 통합된 구성요소는 상기 복수의 구성요소들 각각의 구성요소의 하나 이상의 기능들을 상기 통합 이전에 상기 복수의 구성요소들 중 해당 구성요소에 의해 수행되는 것과 동일 또는 유사하게 수행할 수 있다. 다양한 실시예들에 따르면, 모듈, 프로그램 또는 다른 구성요소에 의해 수행되는 동작들은 순차적으로, 병렬적으로, 반복적으로, 또는 휴리스틱하게 실행되거나, 상기 동작들 중 하나 이상이 다른 순서로 실행되거나, 생략되거나, 또는 하나 이상의 다른 동작들이 추가될 수 있다.

Claims (15)

  1. 청소 로봇의 태스크 수행 방법에 있어서,
    상기 청소 로봇 주변의 오브젝트를 촬영하는 동작;
    상기 촬영된 영상을 학습된 인공지능 모델에 적용하여 상기 영상에 포함된 오브젝트의 인식 정보를 획득하는 동작;
    복수의 센서들 중에서, 상기 오브젝트의 인식 정보에 기반하여 선택된 적어도 하나의 센서가 상기 오브젝트를 감지한 결과를 이용하여 상기 오브젝트에 대한 추가 정보를 획득하는 동작; 및
    상기 오브젝트에 대한 추가 정보에 기반하여 상기 청소 로봇의 태스크를 수행하는 동작을 포함하는,
    태스크 수행 방법.
  2. 제1항에 있어서,
    상기 오브젝트에 대한 추가 정보를 획득하는 동작은,
    상기 오브젝트의 인식 정보에 기반하여 상기 복수의 센서들에 대한 우선 순위를 설정하는 동작; 및,
    상기 복수의 센서들 중에서, 상기 우선 순위에 따라 선택된 적어도 하나의 센서가 감지한 결과를 이용하여 상기 오브젝트에 대한 추가 정보를 획득하는 동작을 포함하는,
    태스크 수행 방법.
  3. 제2항에 있어서,
    상기 오브젝트에 대한 추가 정보를 획득하는 동작은,
    상기 복수 개의 센서들 중 IR스테레오 센서에 우선 순위가 높게 설정되는 경우, 상기 IR 스테레오 센서가 감지한 결과에 대하여 가중치를 부가하여 상기 오브젝트에 대한 추가 정보를 획득하는 동작을 포함하는,
    태스크 수행 방법.
  4. 제3항에 있어서,
    상기 오브젝트의 인식 정보를 획득하는 동작은,
    상기 오브젝트에 대한 바운딩 박스(bounding box)를 판단하는 동작을 더 포함하고,
    상기 오브젝트에 대한 추가 정보를 획득하는 동작은,
    상기 바운딩 박스의 판단 결과와 상기 IR 스테레오 센서를 통한 상기 오브젝트 감지 결과가 일치하지 않는 영역에 대하여, 상기 IR 스테레오 센서의 임계값을 감소시켜 상기 오브젝트에 대한 추가 정보를 획득하는 동작을 포함하는,
    태스크 수행 방법.
  5. 제2항에 있어서,
    상기 오브젝트에 대한 추가 정보를 획득하는 동작은,
    상기 복수의 센서들 중 라이다 센서에 우선 순위가 높게 설정되는 경우, 상기 라이다 센서가 감지한 결과에 대하여 가중치를 부가하여 상기 오브젝트에 대한 추가 정보를 획득하는 동작을 포함하는,
    태스크 수행 방법.
  6. 제2항에 있어서,
    상기 오브젝트에 대한 추가 정보를 획득하는 동작은,
    상기 복수의 센서들 중 초음파 센서에 우선 순위가 높게 설정되는 경우, 상기 초음파 센서가 감지한 결과에 대하여 가중치를 부가하여 상기 오브젝트에 대한 추가 정보를 획득하는 동작을 포함하는,
    태스크 수행 방법.
  7. 제6항에 있어서,
    상기 복수의 센서들 중 초음파 센서에 우선 순위가 높게 설정되는 경우는,
    상기 인식된 오브젝트가 투명하거나 검은 색인 오브젝트인 경우인 것을 특징으로 하는,
    태스크 수행 방법.
  8. 제1항에 있어서,
    상기 오브젝트의 인식 정보를 획득하는 동작은,
    상기 촬영된 영상을 상기 청소 로봇의 메모리에 위치하거나 또는 외부의 서버에 위치한, 상기 학습된 인공 지능 모델에 적용하여 상기 오브젝트의 인식 정보를 획득하는 동작을 포함하는,
    태스크 수행 방법.
  9. 제1항에 있어서,
    상기 복수의 센서들은,
    IR 스테레오 센서, 초음파 센서, 라이다(LIDAR) 센서 또는 PSD 센서 중 적어도 하나를 포함하는 것을 특징으로 하는,
    태스크 수행 방법.
  10. 제1항에 있어서,
    상기 오브젝트의 인식 정보는,
    상기 오브젝트의 명칭, 상기 오브젝트의 종류, 상기 오브젝트의 크기 또는 상기 오브젝트의 특징 중 적어도 하나를 포함하는,
    태스크 수행 방법.
  11. 청소 로봇에 있어서,
    복수의 센서들을 포함하는 센싱부;
    카메라; 및
    상기 청소 로봇 주변의 오브젝트를 촬영하도록 상기 카메라를 제어하고,
    상기 촬영된 영상을 학습된 인공지능 모델에 적용하여 상기 영상에 포함된 오브젝트의 인식 정보를 획득하고,
    복수의 센서들 중에서, 상기 오브젝트의 인식 정보에 기반하여 선택된 적어도 하나의 센서가 상기 오브젝트를 감지한 결과를 이용하여 상기 오브젝트에 대한 추가 정보를 획득하고,
    상기 오브젝트에 대한 추가 정보에 기반하여 상기 청소 로봇의 태스크를 수행하는 프로세서를 포함하는,
    청소 로봇.
  12. 제11항에 있어서,
    상기 프로세서는,
    상기 오브젝트의 인식 정보에 기반하여 상기 복수의 센서들에 대한 우선 순위를 설정하고,
    상기 복수의 센서들 중에서, 상기 우선 순위에 따라 선택된 적어도 하나의 센서가 감지한 결과를 이용하여 상기 오브젝트에 대한 추가 정보를 획득하는,
    청소 로봇.
  13. 제12항에 있어서,
    상기 프로세서는,
    상기 복수의 센서들 중 IR센서에 우선 순위가 높게 설정되는 경우, 상기 IR 스테레오 센서가 감지한 결과에 대하여 가중치를 부가하여 상기 오브젝트에 대한 추가 정보를 획득하는,
    청소 로봇.
  14. 제13항에 있어서,
    상기 프로세서는,
    상기 인식된 오브젝트에 대한 바운딩 박스(bounding box)를 판단하고,
    상기 바운딩 박스의 판단 결과와 상기 IR 스테레오 센서를 통한 상기 오브젝트 감지 결과가 일치하지 않는 영역에 대하여, 상기 IR 스테레오 센서의 임계값을 감소시켜 상기 오브젝트에 대한 추가 정보를 획득하는,
    청소 로봇.
  15. 제12항에 있어서,
    상기 프로세서는,
    상기 복수의 센서들 중 라이다 센서에 우선 순위가 높게 설정되는 경우, 상기 라이다 센서가 감지한 결과에 대하여 가중치를 부가하여 상기 오브젝트에 대한 추가 정보를 획득하는,
    청소 로봇.
PCT/KR2019/011635 2018-09-20 2019-09-09 청소 로봇 및 그의 태스크 수행 방법 WO2020060091A1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US17/264,085 US20210370511A1 (en) 2018-09-20 2019-09-09 Cleaning robot and task performing method therefor

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR20180113305 2018-09-20
KR10-2018-0113305 2018-09-20
KR1020180136757A KR102577785B1 (ko) 2018-09-20 2018-11-08 청소 로봇 및 그의 태스크 수행 방법
KR10-2018-0136757 2018-11-08

Publications (1)

Publication Number Publication Date
WO2020060091A1 true WO2020060091A1 (ko) 2020-03-26

Family

ID=69887491

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2019/011635 WO2020060091A1 (ko) 2018-09-20 2019-09-09 청소 로봇 및 그의 태스크 수행 방법

Country Status (2)

Country Link
KR (1) KR20230134109A (ko)
WO (1) WO2020060091A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113567550A (zh) * 2021-07-22 2021-10-29 上海高仙自动化科技发展有限公司 地面材质检测方法、装置、电子设备、芯片和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002023297A1 (fr) * 2000-09-11 2002-03-21 Kunikatsu Takase Systeme de commande de mouvement de corps mobiles
KR100792041B1 (ko) * 2007-05-03 2008-01-04 인하대학교 산학협력단 복수 개의 센서를 포함하는 장애물 회피 방향 안내 시스템
KR20160023428A (ko) * 2014-08-22 2016-03-03 에스케이텔레콤 주식회사 복수의 센서를 이용한 동작 인식 방법 및 장치
KR20180058511A (ko) * 2016-11-24 2018-06-01 엘지전자 주식회사 이동 로봇 및 그 제어방법
KR20180087769A (ko) * 2017-01-25 2018-08-02 엘지전자 주식회사 3차원 공간에서 기능 영역을 식별하는 방법 및 이를 구현하는 로봇

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002023297A1 (fr) * 2000-09-11 2002-03-21 Kunikatsu Takase Systeme de commande de mouvement de corps mobiles
KR100792041B1 (ko) * 2007-05-03 2008-01-04 인하대학교 산학협력단 복수 개의 센서를 포함하는 장애물 회피 방향 안내 시스템
KR20160023428A (ko) * 2014-08-22 2016-03-03 에스케이텔레콤 주식회사 복수의 센서를 이용한 동작 인식 방법 및 장치
KR20180058511A (ko) * 2016-11-24 2018-06-01 엘지전자 주식회사 이동 로봇 및 그 제어방법
KR20180087769A (ko) * 2017-01-25 2018-08-02 엘지전자 주식회사 3차원 공간에서 기능 영역을 식별하는 방법 및 이를 구현하는 로봇

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113567550A (zh) * 2021-07-22 2021-10-29 上海高仙自动化科技发展有限公司 地面材质检测方法、装置、电子设备、芯片和存储介质
CN113567550B (zh) * 2021-07-22 2024-05-17 上海高仙自动化科技发展有限公司 地面材质检测方法、装置、电子设备、芯片和存储介质

Also Published As

Publication number Publication date
KR20230134109A (ko) 2023-09-20

Similar Documents

Publication Publication Date Title
WO2020060267A1 (en) Cleaning robot and method for performing task thereof
EP3774202A1 (en) Cleaning robot and method for performing task thereof
WO2021006556A1 (en) Moving robot and control method thereof
WO2021006677A2 (en) Mobile robot using artificial intelligence and controlling method thereof
WO2020139064A1 (en) Cleaning robot and method of performing task thereof
WO2018139796A1 (ko) 이동 로봇 및 그의 제어 방법
WO2018226048A1 (en) Cleaning robot and controlling method thereof
WO2019216578A1 (en) Method and apparatus for executing cleaning operation
WO2018139865A1 (ko) 이동 로봇
WO2017188800A1 (ko) 이동 로봇 및 그 제어방법
WO2018117662A1 (en) Apparatus and method for processing image
WO2020046038A1 (ko) 로봇 및 그의 제어 방법
WO2019151735A1 (en) Vision inspection management method and vision inspection system
WO2019031825A1 (ko) 전자 장치 및 그 동작 방법
WO2018117616A1 (ko) 이동 로봇
AU2018216517B9 (en) Cleaner
WO2020171561A1 (en) Electronic apparatus and controlling method thereof
WO2020027515A1 (ko) 속성 블록을 설정하는 이동 로봇
AU2020362530B2 (en) Robot cleaner and method for controlling the same
WO2020004824A1 (en) Plurality of autonomous cleaner and controlling method for the same
WO2022240274A1 (ko) 로봇 장치, 그 제어 방법, 및 프로그램이 기록된 기록매체
WO2020246640A1 (ko) 사용자의 위치를 결정하는 인공 지능 장치 및 그 방법
WO2020241920A1 (ko) 장치 정보에 기반하여, 다른 장치를 제어할 수 있는 인공 지능 장치
WO2020060091A1 (ko) 청소 로봇 및 그의 태스크 수행 방법
EP3773111A1 (en) Method and apparatus for executing cleaning operation

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19862033

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19862033

Country of ref document: EP

Kind code of ref document: A1