WO2021230466A1 - 차량 위치 결정 방법 및 시스템 - Google Patents
차량 위치 결정 방법 및 시스템 Download PDFInfo
- Publication number
- WO2021230466A1 WO2021230466A1 PCT/KR2021/001318 KR2021001318W WO2021230466A1 WO 2021230466 A1 WO2021230466 A1 WO 2021230466A1 KR 2021001318 W KR2021001318 W KR 2021001318W WO 2021230466 A1 WO2021230466 A1 WO 2021230466A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- vehicle
- location
- bitmap
- vector map
- value
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 86
- 239000013598 vector Substances 0.000 claims abstract description 114
- 230000015654 memory Effects 0.000 claims description 50
- 239000011159 matrix material Substances 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 7
- 238000013519 translation Methods 0.000 claims description 5
- 238000013528 artificial neural network Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 27
- 230000008569 process Effects 0.000 description 24
- 230000010365 information processing Effects 0.000 description 23
- 238000004891 communication Methods 0.000 description 17
- 238000012545 processing Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 239000000284 extract Substances 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 5
- 230000005291 magnetic effect Effects 0.000 description 4
- 235000004522 Pentaglottis sempervirens Nutrition 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000002085 persistent effect Effects 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 240000004050 Pentaglottis sempervirens Species 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 241001300198 Caperonia palustris Species 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 235000000384 Veronica chamaedrys Nutrition 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/26—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
- G01C21/28—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network with correlation of data from several navigational instruments
- G01C21/30—Map- or contour-matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30248—Vehicle exterior or interior
Definitions
- the present disclosure relates to a vehicle positioning method and system, and specifically, acquiring a vector map at an approximate position of a vehicle, imaging a plurality of view images by an image sensor of the vehicle, and acquiring the vector map and the captured plurality It relates to a vehicle positioning method and system for determining the position of a vehicle using a view image of
- the method of estimating the location of an autonomous vehicle using the existing GPS method is difficult to accurately determine the current location of the vehicle due to the low accuracy (eg, error of several meters) of the GPS module used in general vehicles.
- the low accuracy eg, error of several meters
- an error in the estimated location occurs.
- a high-precision GPS module eg, a GPS module that generates an error of several cm
- this high-precision GPS module is expensive equipment. Therefore, a high cost may be incurred for providing a service for estimating the location of the vehicle.
- the existing MAP for autonomous driving needs to acquire wide-area data in order to generate a map using an MMS (Mobile Mapping System) vehicle.
- MMS Mobile Mapping System
- in order to maintain a map generated based on data of a wide area it is necessary to continuously acquire high-capacity data over a wide area. That is, a large amount of cost may be incurred for generating and maintaining a map using such an MMS vehicle.
- a large amount of bandwidth is required in terms of communication cost even when updating a map possessed by an autonomous vehicle for map maintenance. Accordingly, there is a need for a technology capable of estimating the exact location of a vehicle without using a positioning method using an expensive GPS module and/or an expensive map generation method.
- the present disclosure provides a vehicle positioning method, a computer program stored in a recording medium, and an apparatus (system) for solving the above problems.
- a vehicle position for determining a second position of the vehicle by comparing a bitmap converted from a vector map corresponding to an area including the first position of the vehicle with a local submap generated from a plurality of view images captured by an image sensor of the vehicle A determination method and apparatus are provided.
- the present disclosure may be implemented in various ways including a method, an apparatus (system), or a computer program stored in a readable storage medium.
- a vehicle location determination method performed by at least one processor includes: obtaining a vector map representing a plurality of semantic objects in a road area including a first location of the vehicle; to a bitmap, generating a local submap using a plurality of view images captured by an image sensor of the vehicle, and determining a second position of the vehicle based on the converted bitmap and the generated local submap includes steps.
- a vehicle positioning system includes a memory and at least one processor connected to the memory and configured to execute at least one computer-readable program included in the memory, the at least one program comprising: Obtain a vector map representing a plurality of semantic objects in the road area including the first location of and instructions for determining a second position of the vehicle based on the transformed bitmap and the generated local submap.
- the location of the vehicle can be determined at relatively low cost.
- the location of the vehicle may be determined or estimated with the accuracy required for autonomous driving in a downtown shaded area where the use of a GPS module is impossible.
- wide-area vector map information since wide-area vector map information has a low-capacity size, it may be stored in a vehicle storage medium. Accordingly, communication does not need to be performed every time to obtain map information.
- the cost for storing and updating the map may be reduced by storing the semantic object in the road area in the form of a vectorized vector map.
- FIG. 1 is a diagram illustrating an example of determining a location of a vehicle according to an embodiment of the present disclosure.
- FIG. 2 is a block diagram illustrating an internal configuration of a computing device and an information processing system according to an embodiment of the present disclosure.
- FIG. 3 is a block diagram illustrating a configuration of a processor according to an embodiment of the present disclosure.
- FIG. 4 is a diagram illustrating an example of a process of converting a vector map into a bitmap according to an embodiment of the present disclosure.
- FIG. 5 is a diagram illustrating an example of a semantic object in a road area according to an embodiment of the present disclosure.
- FIG. 6 is a diagram illustrating an example of a process of converting a vector map into a bitmap according to an embodiment of the present disclosure.
- FIG. 7 is a diagram illustrating an example of a bitmap converted from a vector map according to an embodiment of the present disclosure.
- FIG. 8 is a diagram illustrating a process of generating a local submap using a plurality of view images according to an embodiment of the present disclosure.
- FIG. 9 is a diagram illustrating an example of generating a local submap using a plurality of IPM images according to an embodiment of the present disclosure.
- FIG. 10 is a diagram illustrating an example of generating a local submap according to another embodiment of the present disclosure.
- FIG. 11 is a diagram illustrating a configuration for determining a current location of a vehicle according to an embodiment of the present disclosure.
- FIG. 12 is a diagram illustrating an example of determining a location of a vehicle based on a bitmap and a local submap according to an embodiment of the present disclosure.
- FIG. 13 is a diagram illustrating an example of an image from which points having a similarity greater than or equal to a predetermined similarity extracted from a cost map according to an embodiment of the present disclosure are extracted.
- FIG. 14 is a flowchart illustrating a vehicle location determination method according to an embodiment of the present disclosure.
- 'module' or 'unit' used in the specification means a software or hardware component, and 'module' or 'unit' performs certain roles.
- 'module' or 'unit' is not meant to be limited to software or hardware.
- a 'module' or 'unit' may be configured to reside on an addressable storage medium or may be configured to refresh one or more processors.
- a 'module' or 'unit' refers to components such as software components, object-oriented software components, class components, and task components, and processes, functions, and properties. , procedures, subroutines, segments of program code, drivers, firmware, microcode, circuitry, data, database, data structures, tables, arrays or at least one of variables.
- Components and 'modules' or 'units' are the functions provided within are combined into a smaller number of components and 'modules' or 'units' or additional components and 'modules' or 'units' can be further separated.
- a 'module' or a 'unit' may be implemented with a processor and a memory.
- 'Processor' should be construed broadly to include general purpose processors, central processing units (CPUs), microprocessors, digital signal processors (DSPs), controllers, microcontrollers, state machines, and the like.
- a 'processor' may refer to an application specific semiconductor (ASIC), a programmable logic device (PLD), a field programmable gate array (FPGA), or the like.
- ASIC application specific semiconductor
- PLD programmable logic device
- FPGA field programmable gate array
- 'Processor' refers to a combination of processing devices, such as, for example, a combination of a DSP and a microprocessor, a combination of a plurality of microprocessors, a combination of one or more microprocessors in combination with a DSP core, or any other such configurations. You may. Also, 'memory' should be construed broadly to include any electronic component capable of storing electronic information.
- RAM random access memory
- ROM read-only memory
- NVRAM non-volatile random access memory
- PROM programmable read-only memory
- EPROM erase-programmable read-only memory
- a memory is said to be in electronic communication with the processor if the processor is capable of reading information from and/or writing information to the memory.
- a memory integrated in the processor is in electronic communication with the processor.
- a 'vector map' may refer to a map including information obtained by vectorizing a road layout generated from an aerial photograph taken for a specific area or road area.
- a road layout may be used to classify a specific road area or location, and may include one or more semantic objects.
- the vector map may include arbitrary objects (eg, road markers, lanes, boundary lines, crosswalks, stop lines, etc.) that can classify road areas as semantic objects.
- a semantic object in this vector map may be assigned a class value, and different semantic objects may be assigned a different class value.
- both the local vector map and the sub vector map may be displayed in the form of a vector map.
- the size of the vector map, the local vector map, and the sub vector map may be different from each other.
- a 'semantic object' may be information in which a semantic class is assigned to an object included in an image and/or a boundary line of the object.
- Semantic classes are, for example, people, drivers, cars, trucks, buses, trains, motorcycles, bicycles, roads, crosswalks, buildings, walls, barbed wire, poles, traffic lights, road signs, plants, land, sky, etc. It may be the type of object to be identified.
- a 'bitmap' may be interpreted as a map of bits, and may include a set of bit information stored in each pixel.
- the bitmap may refer to a map obtained by rasterizing a vector map.
- the bitmap may refer to a map obtained by rasterizing a road layout vector map.
- each pixel in the bitmap may be expressed in the form of '0' and '1', and a class value or attribute code may be assigned to a specific region segmented as a semantic object.
- each pixel in the bitmap may be expressed in RGB format.
- a 'local submap' may include information generated by photographing surrounding environment information through a camera currently mounted on a vehicle.
- a local submap may include a surrounding environment information map built online in real time.
- the local submap since the local submap is collected through real-time high-speed processing, it can be used to measure the location of a vehicle through matching with a pre-processed and stored vector map.
- the vehicle 110 may be any vehicle capable of providing a navigation service while driving in a road area.
- the vehicle 110 may be any vehicle capable of autonomous driving within a road area.
- the road area may include any road and/or road on which a vehicle may travel.
- the vehicle 110 may estimate a first position of the vehicle 110 while driving in a road area.
- the first location of the vehicle 110 may be calculated using a popular GPS module built into or attached to the vehicle 110 .
- the entry-level GPS module may provide the estimated vehicle location with relatively low accuracy (eg, an error of several m level).
- the first position of the vehicle 110 may indicate the position of the vehicle 110 determined at a specific time.
- the specific time point may refer to a time point immediately before the location of the vehicle 110 is determined.
- the first location of the vehicle 110 may be expressed in GPS coordinates and/or orientation.
- the vehicle 110 may obtain a vector map representing a plurality of semantic objects in the road area 120 including the first location of the vehicle 110 .
- the vector map may include vectorized information about the road layout generated from the captured aerial photograph.
- the semantic object in the vector map may represent any object that can be used to distinguish each of a plurality of road areas, including, for example, road markers, lanes, boundaries, crosswalks, stop lines, etc. within the road area. can do.
- a semantic object in this vector map may be assigned a class value, and different semantic objects may be assigned a different class value. According to an embodiment, when the vehicle 110 obtains a vector map for the road area 120 of FIG.
- the vector map is a crosswalk 130 , a stop line 140 , and a lane within the road area 120 . It may contain vectors for semantic objects such as (150). Since such a vector map is low-volume information, the cost of storing or updating the vector map for vehicle positioning is much lower than the cost of generating or updating the map using the MMS vehicle.
- the vehicle 110 may receive a vector map for a specific area including the first location of the vehicle 110 from an external device.
- the external device may refer to any device or system capable of communicating with the vehicle 110 .
- the vector map thus received may be stored in a storage device of the vehicle 110 .
- the vehicle 110 files a region vector map representing a plurality of semantic objects within a specific region (eg, a specific city, city, district, county, etc.) including the first location of the vehicle 110 . can be received in the form
- the vehicle 110 may convert the vector map into a bitmap.
- the vehicle 110 may fetch a rasterized map from a vector map in which a semantic object is expressed as a vector.
- the vehicle 110 selects a class value corresponding to a semantic object useful for determining the location of the vehicle 110 from a vector map, and uses an image form corresponding to the selected class value to generate a bitmap.
- different image types may be associated with different class values. For example, if the class value '3' is selected for bitmap generation and the class value '3' refers to a crosswalk, the pixel area in the bitmap corresponding to the class value '3' is in the crosswalk. It may be expressed in the form of a corresponding image.
- a plurality of pixels in the bitmap may be represented by '0' and '1'. That is, each of the plurality of pixels corresponding to the bitmap may be expressed in white or black.
- the vehicle may generate a local submap by using the plurality of view images captured by the image sensor of the vehicle 110 .
- the image sensor may be included in any imaging device such as a camera, and may be built in or attached to the vehicle 110 .
- such an image sensor may be arranged to capture a front view image of a vehicle.
- a positional relationship between the image sensor of the vehicle 110 and the ground of the road may be calculated and stored in advance.
- the vehicle 110 may extract a plurality of semantic objects after acquiring a plurality of view images using an image sensor built into or attached to the vehicle.
- the local submap including the semantic object extracted based on the positional relationship between the image sensor of the vehicle 110 and the ground of the road may be expressed in the form of a bird eye view. Furthermore, such a local submap may be expressed in the form of an image corresponding to a semantic object in a manner similar to a bitmap.
- the second location of the vehicle 110 may be determined based on the converted bitmap and the generated local submap.
- the vehicle 110 may compare the bitmap and the local submap to determine the second location, which is the current location of the vehicle 110 .
- the vehicle 110 may determine the second location of the vehicle 110 by measuring the similarity between the bitmap and the local submap.
- the vehicle 110 may perform template-based matching when comparing the bitmap and the local submap. Through such template-based matching, robustness against GPS measurement noise and accuracy of estimating location state parameters can be improved.
- reliability for the determined second location may be estimated, and reliability as well as the determined second location may be provided.
- the computing device 210 may refer to any device capable of image processing and wired/wireless communication, and may be included in, for example, the vehicle 110 of FIG. 1 .
- the computing device 210 may include a memory 212 , a processor 214 , a communication module 216 , and an input/output interface 218 .
- the information processing system 230 may include a memory 232 , a processor 234 , a communication module 236 , and an input/output interface 238 . As shown in FIG.
- computing device 210 and information processing system 230 are configured to communicate information and/or data over network 240 using respective communication modules 216 and 236 , respectively.
- the input/output device 220 may be configured to input information and/or data to or output information and/or data generated from the computing device 210 through the input/output interface 218 .
- the memories 212 and 232 may include any non-transitory computer-readable recording medium.
- the memories 212 and 232 are non-volatile mass storage devices such as random access memory (RAM), read only memory (ROM), disk drives, solid state drives (SSDs), flash memory, and the like. (permanent mass storage device) may be included.
- a non-volatile mass storage device such as a ROM, SSD, flash memory, disk drive, etc. may be included in the computing device 210 and/or the information processing system 230 as a separate persistent storage device separate from the memory. .
- the separate persistent storage device may be stored in any external device accessible by the computing device 210 and/or the information processing system 230 .
- an operating system and at least one program code may be stored in the memories 212 and 232 .
- the separate computer-readable recording medium may include a recording medium directly connectable to the computing device 210 and the information processing system 230, for example, a floppy drive, disk, tape, DVD/CD- It may include a computer-readable recording medium such as a ROM drive and a memory card.
- the software components may be loaded into the memories 212 and 232 through a communication module rather than a computer-readable recording medium. For example, at least one program is loaded into the memories 212 and 232 based on a computer program installed by files provided through the network 240 by developers or a file distribution system that distributes installation files of applications. can be
- the processors 214 and 234 may be configured to process instructions of a computer program by performing basic arithmetic, logic, and input/output operations. Instructions may be provided to the processor 214 , 234 by the memory 212 , 232 or the communication module 216 , 236 . For example, the processors 214 and 234 may be configured to execute received instructions according to program code stored in a recording device, such as the memories 212 and 232 .
- the communication modules 216 and 236 may provide a configuration or function for the computing device 210 and the information processing system 230 to communicate with each other via the network 240 , and the computing device 210 and/or information processing
- the system 230 may provide a configuration or function for communicating with another computing device 210 or another system (eg, a separate cloud system, etc.).
- the request or data generated by the processor 214 of the computing device 210 according to program code stored in a recording device such as the memory 212 is information via the network 240 under the control of the communication module 216 . may be passed to the processing system 230 .
- a control signal or command provided under the control of the processor 234 of the information processing system 230 is transmitted through the communication module 236 and the network 240 through the communication module 216 of the computing device 210 . may be received by the computing device 210 .
- the input/output interface 218 may be a means for interfacing with the input/output device 220 .
- an input device may include a device such as a camera, keyboard, microphone, mouse, etc., including an audio sensor and/or an image sensor
- an output device may include a device such as a display, speaker, haptic feedback device, etc.
- the input/output interface 218 may be a means for an interface with a device in which a configuration or function for performing input and output, such as a touch screen, is integrated into one.
- the processor 214 of the computing device 210 processes instructions of a computer program loaded into the memory 212 , the information and/or data provided by the information processing system 230 or other computing device is used.
- a service screen and the like configured by the above may be displayed on the display through the input/output interface 218 .
- the input/output device 220 is illustrated not to be included in the computing device 210 , but is not limited thereto, and may be configured as a single device with the computing device 210 .
- the input/output interface 238 of the information processing system 230 is connected to the information processing system 230 or means for interfacing with a device (not shown) for input or output that the information processing system 230 may include. can be In FIG.
- the input/output interfaces 218 and 238 are illustrated as elements configured separately from the processors 214 and 234 , but the present invention is not limited thereto, and the input/output interfaces 218 and 238 may be configured to be included in the processors 214 and 234 . have.
- the computing device 210 and the information processing system 230 may include more components than those of FIG. 2 . However, there is no need to clearly show most of the prior art components. According to an embodiment, the computing device 210 may be implemented to include at least a portion of the above-described input/output device 220 .
- the input/output device 220 may include any device that can be used to determine the position of the vehicle, for example, a global positioning system (GPS) module, a motion sensor, a lidar, and a wheel encoder. Encoder), an Inertial Measurement Unit (IMU), various sensors, and the like may be included.
- GPS global positioning system
- IMU Inertial Measurement Unit
- the processor 214 of the computing device 210 may be configured to determine the location of a vehicle in which the computing device 210 is embedded or attached. In this case, a program code associated therewith may be loaded into the memory 212 of the computing device 210 . While the program code is being executed, the processor 214 of the computing device 210 receives information and/or data provided from the input/output device 220 via the input/output interface 218 or via the communication module 216 to the information processing system. Information and/or data may be received from 230 , and the received information and/or data may be processed and stored in memory 212 . In addition, such information and/or data may be provided to the information processing system 230 through the communication module 216 .
- the processor 214 is a vehicle location through an input device such as a GPS module, a motion sensor, an image sensor, a touch screen, a keyboard, an audio sensor connected to the input/output interface 218 to determine the location of the vehicle;
- the tracked position shift of the vehicle, a captured image and/or an image, and the like may be received.
- the received image, video, location information, etc. may be stored in the memory 212 and used to determine the location of the vehicle.
- the processor 214 may receive a vector map including an area in which the vehicle is located from an external device (eg, the information processing system 230 ) through the communication module 216 .
- the determined location of the vehicle may be provided to a user of the vehicle through an input/output interface or may be provided to the information processing system 230 .
- the processor 214 of the information processing system 230 may be configured to manage, process, and/or store information and/or data received from a plurality of computing devices and/or a plurality of external systems.
- the processor 234 may be configured to determine, based on data received from the computing device 210 , a location of a vehicle in which the computing device 210 is embedded or mounted. To this end, the processor 234 may receive information and/or data measured from a GPS module, a motion sensor, and an image sensor among the input/output devices 220 .
- the processor 234 may receive a vector map for a specific area or road area in which the vehicle is located from an external device.
- the processor 234 may receive an aerial picture of a specific area or road area, and generate a vector map of the specific area or road area using the received aerial picture.
- the generated vector map and/or the determined location of the vehicle may be provided to the computing device 210 through the network 240 .
- the processor 300 may include a bitmap conversion module 322 , a local submap generation module 324 , and a local submap matching module 326 .
- the processor 300 may refer to the processor 214 of the computing device 210 built into or mounted on a vehicle.
- the processor 300 may refer to the processor 234 of the information processing system 230 .
- the processor 300 may include a processor 214 of a computing device 210 built into or mounted on a vehicle and a processor 234 of the information processing system 230 .
- the bitmap conversion module 322 of the processor 300 may be configured to receive the vector map 318 and transform the received vector map 318 .
- the vector map 318 may include vectorized information representing a plurality of semantic objects within a road area including the first location of the vehicle.
- the first position of the vehicle may correspond to the absolute position value 314 of the vehicle, and the absolute position value 314 is approximately through a GPS module (eg, a GPS module with low accuracy) provided in the vehicle. It may be the location of the enemy vehicle.
- the bitmap conversion module 322 may convert the vector map 318 into a bitmap by selecting a semantic object in the vector map 318 .
- the vector map 318 may include a plurality of semantic objects, and may include a class value corresponding to each object.
- the bitmap conversion module 322 may select a semantic object to be used for estimating the location of the vehicle from among a plurality of semantic objects in the vector map. Then, the bitmap conversion module 322 may obtain a class value corresponding to each of the selected semantic objects, and generate a bitmap by using an image shape corresponding to the obtained class value.
- the bitmap may have the same size and shape as or similar to the size and shape of the local submap used to determine the location of the vehicle.
- the generated bitmap may be stored in a memory connected or accessible by the processor 300 , or may be provided to the local submap matching module 326 of the processor 300 .
- the local submap generating module 324 of the processor 300 may be configured to receive the plurality of view images 312 and the relative position value 316 of the vehicle, and generate a local submap.
- the plurality of view images 312 may be a front view image of the vehicle captured using an image sensor built into or attached to the vehicle.
- the relative position value 316 may be measured by a motion sensor built into or mounted on the vehicle, and may refer to a position value based on a positional relationship between an image sensor disposed in the vehicle and the ground of a road.
- the local submap generation module 324 may extract a plurality of semantic objects (eg, lanes in a road area, a crosswalk, a straight-through sign and a right-turn sign, etc.) from the received plurality of front view images.
- a plurality of semantic objects eg, lanes in a road area, a crosswalk, a straight-through sign and a right-turn sign, etc.
- the local submap generating module 324 inputs each of the plurality of front view images to the input layer of the artificial neural network, and the bit values for the pixels in the plurality of front view images and the plurality of front view images extracted from the plurality of front view images. You can output the class value for the semantic object of
- the local submap generation module 324 generates a plurality of inverse perspective mapping (IPM) masks including a plurality of extracted semantic objects based on the positional relationship between the image sensor disposed in the vehicle and the ground surface of the road.
- IPM inverse perspective mapping
- the plurality of IPM masks may refer to a mask in which a plurality of semantic objects in a plurality of front view images are converted into a bird's-eye view image form. That is, the plurality of IPM masks may refer to masks corresponding to images when the road is viewed from the sky in the front view image.
- the positional relationship between the image sensor and the ground of the road may be stored in a storage device (eg, a memory) accessible by the local submap generating module 324 .
- the local submap generating module 324 may be configured to generate a local submap by using the generated plurality of IPM masks. In this process, the local submap generating module 324 may convert the generated plurality of IPM masks into a plurality of IPM images in which the received relative position value 316 , that is, the relative position of the image sensor of the vehicle is reflected. The local submap generating module 324 may generate a local submap by concatenating a plurality of converted IPM images. For example, the local submap generation module 324 rotates a plurality of IPM images in consideration of the received relative position value 316 and combines some regions of the rotationally moved IPM images to overlap (that is, accumulation) to create a local submap. The generated local submap may be provided to the local submap matching module 326 of the processor 300 .
- the local submap matching module 326 of the processor 300 may determine a second location (eg, a more accurate current location) of the vehicle based on the received bitmap and the local submap. To this end, the local submap matching module 326 may receive the first location of the vehicle (eg, the approximate location of the vehicle) measured through the GPS module of the vehicle. According to an embodiment, the local submap matching module 326 may determine a difference between the bitmap and the local submap by comparing the bitmap and the local submap, and based on the first location of the vehicle and the second of the vehicle based on the difference. location can be estimated.
- the difference between the bitmap and the local submap is the difference in the X axis, the translation in the Y axis, and the rotation in the X axis direction (rotation, that is, the Yaw value) from the first position of the vehicle. It can be expressed as a three-degree-of-freedom value.
- the value representing the rotation from the X-axis direction may include information about the direction in which the vehicle is looking.
- the second location 322 of the vehicle may be displayed as GPS coordinates and/or bearing and output as an estimated location.
- the local submap matching module 326 may extract the confidence 334 for the estimated second location 332 of the vehicle.
- the local submap matching module 326 generates one or more cost maps (ie, similarity maps) using the received bitmap and the local submap, and determines the reliability 334 based on the generated cost map.
- the cost map may include a degree of similarity corresponding to each of the difference values between the bitmap and the local submap.
- the local submap matching module 326 converts at least some of the difference values in the calculated cost map (eg, a difference value having a predetermined similarity or more) into a three-dimensional point, and in the cost map It is possible to determine the distribution of the transformed 3D points around the difference value with the highest similarity.
- the local submap matching module 326 may generate a three-dimensional point by rotating a difference value having a similarity greater than or equal to a predetermined value based on the orientation on the GPS coordinates corresponding to the difference value having the highest similarity. Based on the distribution of the transformed 3D points, the local submap matching module 326 may determine the reliability of the second location 322 of the vehicle. The determined confidence 334 may be output along with the estimated second location 332 of the vehicle.
- the process of converting the vector map into the bitmap may be performed by at least one processor (eg, the processor 300 ).
- the processor transmits a first location (eg, GPS coordinates and/or orientation) of the vehicle to an external device, and retrieves from the external device a plurality of semantic objects within a specific area including the first location of the vehicle. It is possible to receive a local vector map representing the region.
- the processor may obtain the vector map 410 by selecting the first area (eg, 200-1000m) including the first location of the vehicle as the road area from the received local vector map.
- a vector map refers to a map expressed by vectorizing the three-dimensional position values of semantic objects existing in the road area, for example, lanes, road boundaries, stop lines, and road markings (e.g., direction, prohibition, crosswalk, etc.) can do.
- a semantic object formed of solid or dotted lines such as lanes and road boundaries in the vector map, may be vectorized with uniformly spaced position values of the solid or dotted lines.
- a semantic object composed of an image such as a road mark in the vector map may be vectorized in the form of a polygon in which each vertex of the image is connected.
- the vector map 410 in which a semantic object is vectorized and expressed may include a class value corresponding to each of a plurality of semantic objects.
- the class value may be a value indicating what each of the corresponding semantic objects means.
- a crosswalk in an aerial photo may be vectorized in the form of a polygon made of a rectangle, and a class value corresponding to a 'crosswalk' may be assigned.
- the processor may determine, through the assigned class value, that the vector representation in the form of a rectangular polygon refers to an indication of a 'crosswalk'.
- the processor may generate the sub vector map by selecting a second area (eg, 100-200m) that includes the first location of the vehicle and is smaller than the first area. Also, the processor may generate the first bitmap by using the generated sub vector map. In one embodiment, the processor may select a semantic object to be used to estimate the second location of the vehicle from among a plurality of semantic objects in the first bitmap. For example, the processor may select an object useful for determining a second location of the vehicle, such as a crosswalk, a lane, a stop line, an outline, a road marking, etc. from among the plurality of semantic objects. When the object selection for determining the location of the vehicle is completed, the processor may obtain a class value corresponding to the selected semantic object. The processor may generate the first bitmap by using the image shape corresponding to each of the obtained class values. In this case, the first bitmap may be configured to express the image shape corresponding to the class value as '0' and '1'.
- the processor may select a second bitmap from among the first bitmaps.
- the processor may select a second bitmap corresponding to a third area (eg, 1-100m) that includes the first location of the vehicle and is smaller than the second area from among the first bitmaps .
- the second bitmap may be generated by obtaining information on the third area in the first bitmap.
- the second bitmap may be generated based on at least some of the third areas of the first bitmap.
- the processor may select the second bitmap as the bitmap 412 to be used to estimate the location of the vehicle.
- FIG. 5 is a diagram illustrating an example of a semantic object in a road area according to an embodiment of the present disclosure.
- a vector map in which semantic objects are vectorized can be generated through aerial photography.
- a semantic object such as a lane in a road area, a separation merging section, a straight-through mark, a right turn mark, etc. is displayed in each of the aerial photos 510 , 520 , 530 , 540 .
- a semantic object may be vectorized with a class value included, and different class values may be assigned according to the type of the semantic object.
- a lane in the aerial photograph 510 may be vectorized in a sprite form 512 , and a class value of '1' corresponding to the lane may be assigned.
- the separated merging section in the aerial photograph 520 may be vectorized in a curved form 522 and assigned a class value of '2' corresponding to the separated merging section.
- the straight-ahead mark in the aerial photograph 530 may be vectorized into a polygonal form 532 with vertices connected thereto, and a class value of '3' corresponding to the straight-ahead mark may be assigned.
- the right turn mark in the aerial photo 540 may be vectorized in the form of polygons 542 connected to vertices, and a class value of '4' corresponding to the right turn mark may be assigned.
- the straight and right turns are vectorized into the same polygonal shape (532, 542) after being vectorized, it is not possible to check how the straight and right turns appear, but different class values are assigned to the straight and right turns to go straight and right turn may be determined separately.
- the process of converting a vector map into a bitmap may be performed by at least one processor (eg, the processor 300 ).
- the processor may set the storage location differently according to the use time and/or size of the map in order to increase the operation speed for determining or estimating the location of the vehicle.
- the area vector map 610 may be a vector map including a plurality of semantic objects within a specific area (eg, Pangyo area) including the first location of the vehicle.
- the local vector map 610 may be a map covering a wide range from several km to several hundred km, and may be stored in a storage device in the form of a file instead of being directly stored in a memory for efficiency of capacity.
- the storage device may refer to a separate persistent storage device, not a memory.
- the storage device may refer to a memory.
- the processor may load a predetermined range including the first location of the vehicle (eg, a radius of 200-1000m around the first location of the vehicle) into the memory within the stored local vector map 610 .
- the processor may determine the timing of the process of calling up a certain region in the local vector map 610 in consideration of the traveling speed and direction of the vehicle, and in general, this process may be executed at intervals of about once every several tens of seconds.
- the processor may acquire the vector map 612 by selecting the first area including the first location of the vehicle from the local vector map 610 .
- the processor may generate the sub vector map 614 including the second area by selecting the second area including the first location of the vehicle from among the vector maps 612 .
- the second area may be smaller than the first area, for example, the second area may refer to a radius of 100-200m around the first location of the vehicle. Converting a vectormap with an area of several hundred meters into a bitmap is memory efficient and can slow down processing.
- the processor extracts the sub vector map 614 from the vector map 612 to a size that may exist in cache memory (eg, about 1200 x 1200 pixels in size). generated, and the generated sub vector map 614 may be changed to the first bitmap.
- the processor may select a semantic object to be used for estimating the location of a vehicle from among a plurality of semantic objects in the sub vector map 614 , and obtain a class value corresponding to each of the selected semantic objects. Also, the processor may generate the first bitmap 616 by using the image shape corresponding to the obtained class value. The generated first bitmap 616 may be stored in the cache memory. The processor may generate the sub vector map 614 in consideration of the traveling speed and direction of the vehicle and determine a timing of a process of converting the generated sub vector map 614 into the first bitmap 616 . For example, this process may be executed once every predetermined time (eg, several seconds) in a normal driving situation.
- predetermined time eg., several seconds
- the processor may select the second bitmap 618 corresponding to the third area including the first location of the vehicle from the generated first bitmap 616 .
- the third area may be smaller than the second area, for example, the third area may refer to a radius of several tens of meters around the first location of the vehicle.
- the processor obtains information about a partial area of the second area in the first bitmap 616 to select a second bitmap corresponding to the third area including the first location of the vehicle, , the second bitmap 618 may be used using the obtained information.
- the processor generates the second bitmap 618 by sampling an area of several tens of meters (eg, a 32x32m area) around the first location of the vehicle in the first bitmap 616 using an interpolation technique. can do.
- the size of the second bitmap 618 may be about 400 x 400 pixels.
- the processor may select the generated second bitmap 618 as the bitmap to be compared with the local submap to determine the location of the vehicle.
- the processor may generate a first bitmap 616 having a medium size, and may generate a second bitmap 618 having a small size from the generated first bitmap 616 . Accordingly, while the vehicle is being driven, it is possible to prevent redundant calculation of similar regions that may be generated in the process of the processor converting the vector map to the bitmap.
- the second bitmap 618 since the second bitmap 618 within a radius of several tens of meters around the vehicle is generated by performing sampling of a partial region within the first bitmap 616, the generation speed of the second bitmap 618 is improved. can be Due to the improvement in the generation speed, the second bitmap 618 may be adapted to an environment in which the second bitmap 618 needs to be updated every 10 hz to 20 hz according to the driving environment of the vehicle.
- bitmap 7 is a diagram illustrating an example of a bitmap converted from a vector map according to an embodiment of the present disclosure.
- the bitmaps 710 and 720 may be maps in which the selected semantic objects 712 and 722 in the vector map are expressed as bits.
- a semantic object may be an image shape that is composed of '0' and '1' and expressed in black and white.
- bitmaps 710 and 720 are bitmaps (eg, second bitmaps) to be used to estimate the location of the vehicle, for example, a plurality of bits within a 32m x 32m area around the location of the vehicle. It can contain semantic objects.
- the plurality of pixels of the bitmaps 710 and 720 may be an image shape expressed in black and white by being composed of '0' and '1'.
- a region corresponding to a plurality of semantic objects in the bitmaps 710 and 720 may be assigned a class value.
- the semantic objects 712 and 722 are all displayed in the form of polygons.
- different class values may be assigned to each of the semantic objects 712 and 722 , and it may be determined which object corresponds to the semantic objects 712 and 722 based on the assigned class value. For example, if the class value of the semantic object 712 in the bitmap 710 is '5', the semantic object 712 is recognized as an indication of 'prohibit progress', which is a semantic object corresponding to '5'. can be As another example, if the class value of the semantic object 722 in the bitmap 720 is '6', the semantic object 722 is a semantic object corresponding to '6'. can be recognized as
- FIG. 8 is a diagram illustrating a process of generating a local submap using a plurality of view images according to an embodiment of the present disclosure.
- This local submap generating process may be performed by at least one processor (eg, the local submap generating module 324 ).
- the processor may receive a plurality of view images captured through an image sensor of the vehicle ( S810 ).
- the image sensor of the vehicle may be disposed in the vehicle to capture a front view image of the vehicle, and the plurality of view images may include a front view image of the vehicle.
- the processor may extract a plurality of semantic objects from a plurality of front view images captured by an image sensor of the vehicle ( S812 ).
- the plurality of semantic objects may include any object that can be used to determine or estimate the location of a vehicle, for example, the semantic object may include a road marker, a lane, a boundary line, a road marker within a road area, It may include crosswalks, stop lines, and the like.
- any known semantic segmentation method may be used.
- the processor may use any machine learning technique to extract a plurality of semantic objects.
- the processor inputs each of the plurality of front-view images to an input layer of an artificial neural network trained to extract semantic objects from the images, and provides bit values for a plurality of pixels in the plurality of front-view images and a plurality of front-view images.
- a plurality of IPM masks including the semantic object may be generated ( S814 ).
- the processor may generate the IPM mask based on a positional relationship between an image sensor disposed in the vehicle and the ground of the road. For example, a single IPM mask may have a size of 8 x 16 m.
- the processor may be configured to generate a local submap by using the plurality of generated IPM masks (S822).
- the processor may convert the IPM image to which the relative position of the image sensor of the vehicle is reflected, and connect the plurality of IPM images to generate a local submap.
- the relative position of the image sensor of the vehicle may be measured by a motion sensor built into or mounted on the vehicle.
- the processor may receive the previous IPM image and the relative position 820 , and transform the current IPM image according to the relative position.
- the processor may generate a local submap by cumulatively connecting the converted current IPM image with the previously converted IPM image according to the relative position. For example, 20-30 IPM images may be accumulated to generate a local submap.
- the processor may perform refinement on the IPM mask by using the reference image generated from the view image. For example, the processor performs refinement of the IPM mask using a statistical modeling technique for structural prediction such as CRF (Conditional Random Field), thereby improving the image quality of the region corresponding to the semantic object in the local submap. have.
- CRF Consumer Random Field
- the processor may generate a reference image from the view image (S816).
- the processor may select one or more dynamic objects (eg, an external vehicle) from a plurality of semantic objects extracted from a plurality of front view images.
- the processor may generate the plurality of reference images based on the regions in the plurality of view images excluding the regions corresponding to the one or more dynamic objects selected from the regions corresponding to the plurality of semantic objects.
- the reference image may be an RGB image obtained by removing a region corresponding to a dynamic object from a view image.
- the processor may perform refinement on the plurality of IPM masks by using the plurality of generated reference images (S818).
- the processor may change bit values for a plurality of pixels in the IPM mask by using a reference image (eg, an RGB image) generated through the same view image as the IPM mask. Accordingly, each of the semantic objects in the IPM mask may be displayed more clearly or the recognition rate of the semantic object may be further improved.
- the IPM mask on which the refinement has been performed may be used to generate an IPM image for generating a local submap.
- FIG. 9 is a diagram illustrating an example of generating a local submap using a plurality of IPM images according to an embodiment of the present disclosure.
- This local submap generating process may be performed by at least one processor (eg, the local submap generating module 324 ).
- the processor may receive the plurality of IPM images in chronological order, and may connect the plurality of IPM images in consideration of the relative positions of the image sensors obtained by the motion sensor of the vehicle.
- the processor processes the first IPM image 912 , the second IPM image 914 , the third IPM image 916 , the fourth IPM image 918 , and the fifth IPM image 920 in chronological order.
- a portion of the received IPM image may be connected to overlap, that is, cumulatively connected.
- the local submap 930 may be generated using the plurality of IPM images that are accumulated and connected in this way. For example, a single IPM image may have a size of about 8 x 16 m. By accumulating 20 to 30 single IPM images of this size, a local submap having a size of about 32 x 16 m can be finally generated.
- the local submaps 1010 and 1020 may be generated according to the driving direction of the vehicle estimated based on the relative position of the image sensor measured by the motion sensor of the vehicle.
- the first local submap 1010 may be a local submap generated based on a vehicle entering the 'child protection area'.
- the second local submap 1020 may be a local submap generated based on a vehicle entering a curved road.
- FIG. 11 is a diagram illustrating a process of determining a current location of a vehicle according to an embodiment of the present disclosure.
- the process of determining the vehicle location may be performed by at least one processor (eg, the local submap matching module 326 ).
- the processor may determine the second location of the vehicle based on the bitmap and the local submap.
- the bitmap may be converted from a vector map representing a plurality of semantic objects in a road area including the first location of the vehicle.
- the local submap may be generated using a plurality of view images captured by an image sensor of the vehicle.
- the processor may determine a difference between the bitmap and the local submap by comparing the bitmap and the local submap, and may estimate the second position of the vehicle based on the first position of the vehicle and the determined difference.
- the difference between the bitmap and the local submap is 3- representing a translation in the X axis, a translation in the Y axis, and a rotation from the X axis direction from the first position of the vehicle. It can be expressed as a degree of freedom (DoF) value.
- DoF degree of freedom
- the value representing the rotation from the X-axis direction may include information about the direction in which the vehicle is looking.
- the 3-DOF value may include an X-axis difference value, a Y-axis difference value, and a yaw rotation value.
- the processor calculates the bitmap 1110 to a plurality of predetermined angles (eg, a plurality of predetermined intervals between -2 degrees and 2 degrees) to estimate a three-degree-of-freedom value representing the difference between the bitmap and the local submap. angle) to generate the rotated sample bitmap 1112 .
- the processor may generate a costmap by determining a cross correlation 1116 between each of the plurality of sample bitmaps 1112 and the local submap 1114 .
- the processor performs a fast Fourier transform on each of the plurality of sample bitmaps 1112 and the local submap 1114 , and each of the plurality of sample bitmaps 1112 and the local submap 1114 . ) can generate multiple cost maps for the difference.
- such a cost map may refer to a normalized correlation coefficient costmap. Since the processor uses such a fast Fourier transform, a fast operation is possible in determining the difference between the bitmap and the local submap. A 3-DOF value indicating a difference between the bitmap and the local submap may be estimated based on the thus generated cost map.
- the processor may generate a cost volume 1118 (cost volume) by concatenating the generated cost map.
- the processor generates a plurality of costmaps for a difference between each of the plurality of sample bitmaps 1112 and a local submap, and concatenates the generated plurality of costmaps by concatenating the X-axis
- a value representing the rotation from the direction, that is, a cost volume including a similarity to the yaw rotation value may be generated.
- the cost volume may be a set of a plurality of 3-DOF values estimated based on a plurality of cost maps, and may include a degree of similarity to the estimated 3-DOF values.
- the longitudinal axis of the coast volume represents the X axis
- the lateral axis represents the Y axis
- the Yaw value may refer to a rotation value from the X axis direction.
- the processor may estimate a 3-DOF value having the highest similarity in the cost volume as a value representing a difference between the bitmap and the local submap.
- the range of similarity may be expressed as a value between '0' and '1', and the 3-DOF value with the similarity closest to '1' in the cost volume indicates the difference between the local submaps. It may be determined as an estimated value 1120 that is a value.
- the processor applies a predetermined size corresponding to each unit value of the 3-DOF value of the cost volume to the 3-DOF value having the highest similarity in the cost volume (eg, performs multiplication) Accordingly, it is possible to calculate an adjustment value for the 3-DOF value having the highest degree of similarity.
- the predetermined size may refer to a size corresponding to a physical value in the real world, for example, in each case of x and y in the cost volume, 1 unit has a size of 0.8 meter, and yaw in the cost volume In the case of rotation, one unit may have a magnitude of 0.5 degrees.
- the adjustment value for the 3-DOF value may be output as a physical value of the real world, for example, GPS coordinates and/or orientation, and three-dimensional coordinate values (x, y, z).
- the processor may estimate a second location (current location) of the vehicle by applying the calculated adjustment value to the first location of the vehicle (a location corresponding to a value measured by a universal GPS or a used vector map).
- the processor may output the reliability of the second position value of the vehicle as the estimated value 1120 together with estimating the second position value of the vehicle.
- the processor receives information about a plurality of three-degree-of-freedom values having a similarity greater than or equal to a predetermined degree of similarity in the cost volume (eg, a similarity capable of extracting 2% of points among points in the cost volume). can be extracted.
- the processor may extract an x difference value and a y difference value from a plurality of 3-DOF values having a similarity greater than or equal to a predetermined similarity.
- the processor applies a predetermined magnitude corresponding to the unit value of the cost volume of the three-degree-of-freedom value to the information corresponding to the extracted plurality of three-degree-of-freedom values, whereby the extracted plurality of three-degree-of-freedom values are applied. It is possible to calculate an adjustment value for the information corresponding to .
- the processor may rotate or convert an adjustment value for information corresponding to a plurality of three-degree-of-freedom values based on an orientation on the GPS coordinates corresponding to the estimated second location of the vehicle. For example, x and y values extracted from a plurality of 3-DOF values having similarities greater than or equal to a predetermined degree of similarity may be rotated using a specific angle. This specific angle may be calculated based on the orientation on the GPS coordinates corresponding to the second location of the vehicle.
- the processor may calculate a covariance matrix for the rotated adjustment values for the information corresponding to the plurality of three-degree-of-freedom values.
- the covariance matrix may refer to a 3x3 covariance matrix, and in calculating the 3x3 covariance matrix, an x difference value, a y difference value, and a yaw rotation value corresponding to a plurality of 3-DOF values may be used. have.
- the processor may determine the reliability of the estimated second position of the vehicle based on the calculated covariance matrix.
- the covariance matrix may represent a distribution of adjustment values corresponding to the plurality of degrees of freedom values rotated around the estimated second position of the vehicle.
- the local submap 1212 generated from a plurality of view images captured by the image sensor of the vehicle and the vector map corresponding to the road area included in the first position of the vehicle are converted from Comparing the bitmap 1214 may show a relative difference between the first position of the vehicle and the second position of the vehicle.
- a difference may include a difference value on the X-axis and a difference value on the Y-axis in the comparison image 1210 .
- the difference may include a difference value in the X-axis, a difference value in the Y-axis, and a rotation value in the X-axis direction in the comparison image 1210 .
- the processor may determine a relative difference between the local submap 1212 and the bitmap 1214 and generate a cost map 1220 including a degree of similarity for the difference.
- the processor may select a difference value having the highest similarity from the generated cost map 1220 .
- the processor may then move the position of the bitmap 1234 to match the position of the local submap 1232 based on the selected difference value, as shown in the comparison image 1230 . That is, the processor may determine the second position of the vehicle by applying the calculated difference value (relative difference value) to the first position of the vehicle.
- FIG. 13 is a diagram illustrating an example of an image from which points having a similarity greater than or equal to a predetermined similarity extracted from a cost map according to an embodiment of the present disclosure are extracted.
- the processor may generate images 1310 and 1320 in which points (hereinafter, main points) having a similarity greater than or equal to a predetermined similarity extracted from the cost map are displayed.
- main points points
- the processor may generate images 1330 and 1340 in which main points extracted from the cost map are displayed.
- the main points of the images 1310 , 1320 , 1330 , and 1340 may be represented by a set of dots marked with a dark color.
- the main points of the images 1310 , 1320 , 1330 , and 1340 are GPS coordinates corresponding to the second location of the vehicle using the adjustment values for the x and y values extracted from the cost map (that is, the size value in the real world). It can be created by rotating it based on the orientation of the image.
- the processor may calculate a covariance matrix for the generated principal points. Reliability through the covariance matrix may indicate higher reliability as the density of the distribution of adjustment values increases.
- the density of the distribution of image 1310 is higher than the density of distribution of image 1320 , so the vehicle calculated from image 1310 . It may be determined that the reliability of the second position of .
- comparing the distribution of key points in the images 1330 and 1340 since the density of the distribution of the image 1330 is higher than the density of the distribution of the image 1340 , the It may be determined that the reliability of the second position of the vehicle is higher.
- the vehicle location determining method may be executed by a processor mounted on or embedded in a computing device included in the vehicle.
- the vehicle positioning method may be executed by a processor included in the information processing system.
- the vehicle location determination method may be initiated by obtaining a vector map representing a plurality of semantic objects in a road area including a first location of the vehicle ( S1410 ).
- the first location of the vehicle may refer to an approximate location of the vehicle measured by the GPS of the vehicle.
- the vector map may refer to a road layout vector map generated from an aerial photograph.
- the plurality of semantic objects may include any object included within a road area and used to determine the location of a vehicle.
- the processor may convert the vector map into a bitmap (S1420).
- the processor may generate a bitmap by rasterizing the vector map.
- the processor may generate a bitmap by selecting a semantic object from a vectormap and generating an image shape for the selected semantic object.
- the processor may generate a local submap by using the plurality of view images captured by the image sensor of the vehicle ( S1430 ). To this end, the processor may convert the plurality of view images into a plurality of bird's-eye view images based on the positional relationship between the image sensor of the vehicle and the ground of the road. Then, the processor may generate the local submap by accumulatively connecting the plurality of bird's eye view images based on the relative positions of the image sensors measured by the motion sensors of the vehicle.
- the processor may determine the second location of the vehicle based on the converted bitmap and the generated local submap (S1440).
- the second location of the vehicle may refer to the current location of the vehicle.
- the processor may compare the bitmap and the local submap to determine a difference between the bitmap and the local submap. Then, the processor may determine the second position of the vehicle by reflecting the determined difference in the first position of the vehicle.
- the above-described vehicle positioning method may be provided as a computer program stored in a computer-readable recording medium for execution by a computer.
- the medium may continuously store a computer executable program, or may be a temporary storage for execution or download.
- the medium may be various recording means or storage means in the form of a single or several hardware combined, it is not limited to a medium directly connected to any computer system, and may exist distributed on a network. Examples of the medium include a hard disk, a magnetic medium such as a floppy disk and a magnetic tape, an optical recording medium such as CD-ROM and DVD, a magneto-optical medium such as a floppy disk, and those configured to store program instructions, including ROM, RAM, flash memory, and the like.
- examples of other media may include recording media or storage media managed by an app store that distributes applications, sites that supply or distribute various other software, and servers.
- the processing units used to perform the techniques include one or more ASICs, DSPs, digital signal processing devices (DSPDs), programmable logic devices (PLDs). ), field programmable gate arrays (FPGAs), processors, controllers, microcontrollers, microprocessors, electronic devices, other electronic units designed to perform the functions described in this disclosure. , a computer, or a combination thereof.
- a general purpose processor may be a microprocessor, but in the alternative, the processor may be any conventional processor, controller, microcontroller, or state machine.
- a processor may also be implemented as a combination of computing devices, eg, a combination of a DSP and a microprocessor, a plurality of microprocessors, one or more microprocessors in conjunction with a DSP core, or any other configuration.
- the techniques include random access memory (RAM), read-only memory (ROM), non-volatile random access memory (NVRAM), PROM (on computer readable media such as programmable read-only memory), erasable programmable read-only memory (EPROM), electrically erasable PROM (EEPROM), flash memory, compact disc (CD), magnetic or optical data storage devices, etc. It may be implemented as stored instructions. The instructions may be executable by one or more processors, and may cause the processor(s) to perform certain aspects of the functionality described in this disclosure.
- aspects of the subject matter in this disclosure may be implemented in a plurality of processing chips or devices, and storage may be similarly affected across the plurality of devices.
- Such devices may include PCs, network servers, and portable devices.
Landscapes
- Engineering & Computer Science (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Automation & Control Theory (AREA)
- Theoretical Computer Science (AREA)
- Navigation (AREA)
- Multimedia (AREA)
- Electromagnetism (AREA)
- Aviation & Aerospace Engineering (AREA)
- Traffic Control Systems (AREA)
- Image Analysis (AREA)
Abstract
본 개시는 차량 위치 결정 방법에 관한 것이다. 차량 위치 결정 방법은, 차량의 제1 위치가 포함된 도로 영역 내의 복수의 의미론적 객체를 나타내는 벡터맵을 획득하는 단계, 벡터맵을 비트맵으로 변환시키는 단계, 차량의 이미지 센서에 의해 촬상된 복수의 뷰 이미지를 이용하여 로컬 서브맵을 생성하는 단계 및 변환된 비트맵과 생성된 로컬 서브맵을 기초로 차량의 제2 위치를 결정하는 단계를 포함한다.
Description
본 개시는 차량 위치 결정 방법 및 시스템에 관한 것으로, 구체적으로 차량의 대략적인 위치에서의 벡터맵을 획득하고, 차량의 이미지 센서에 의해 복수의 뷰 이미지를 촬상하고, 획득된 벡터맵 및 촬상된 복수의 뷰 이미지를 이용하여 차량의 위치를 결정하는 차량 위치 결정 방법 및 시스템에 관한 것이다.
최근 차량의 현재 위치에 기반하여 서비스를 제공하는 사업 모델이 늘어나고 있다. 대표적으로, 차량 네비게이션 서비스가 제공되고 있으며, 서비스 사용자가 꾸준히 증가하고 있다. 이러한 서비스에서 차량의 현재 위치를 정확하게 파악하는 것이 중요하다. 특히, 자율 주행 자동차의 도입으로 위치 추정 기술의 정확도를 높이기 위한 연구가 활발히 진행되고 있으며, 기존의 자율주행 차량의 위치를 측정하기 위한 방식으로는 GPS (Global Positioning System) 방식과 자율주행용 MAP 방식이 있었다.
기존의 GPS 방식을 이용한 자율주행 차량의 위치를 추정하는 방식은 일반적인 차량에 사용되는 GPS 모듈의 낮은 정확도(예를 들어, 수 m 수준의 오차)에 의해, 차량의 현재 위치를 정확하게 파악하기 어려운 경우가 있다. 특히, 도심지의 건물 밀집 지역, 산간 지역, 주차장, 건물 내부에 위치하는 경우 등에는 GPS 신호를 안정적으로 수신하기 어렵기 때문에 추정 위치의 오차가 크게 발생하는 문제가 있었다. 이러한 기존의 GPS 모듈을 이용한 차량의 위치 추정에 대한 정확도를 높이기 위하여, 고정밀 GPS 모듈(예를 들어, 수 cm 수준의 오차가 발생되는 GPS 모듈)을 사용해야 하는데, 이러한 고정밀 GPS 모듈은 고가의 장비이기 때문에 차량의 위치 추정을 위한 서비스를 제공하기 위한 비용이 많이 발생될 수 있다.
또한, 기존의 자율주행용 MAP는 MMS(Mobile Mapping System) 차량을 이용하여 맵을 생성하기 위해 광역의 데이터를 취득해야 한다. 이때, 광역의 데이터를 기초로 생성된 맵을 유지하기 위하여 넓은 영역에 걸친 고용량의 데이터를 지속적으로 획득하여야 한다. 즉, 이러한 MMS 차량을 이용한 맵을 생성하고 유지하기 위한 비용이 많이 발생될 수 있다. 나아가, 기존의 자율주행용 MAP 환경에서, 맵 유지 보수를 위해 자율주행차량이 보유한 맵 업데이트 시에도 통신 비용면에서 대용량의 대역폭(bandwidth)이 요구된다는 문제점이 있다. 따라서, 고가의 GPS 모듈을 이용한 측위 방식 및/또는 고비용의 맵 생성 방식을 사용하지 않고도 차량의 정확한 위치를 추정할 수 있는 기술이 요구된다.
본 개시는 상기와 같은 문제점을 해결하기 위한 차량 위치 결정 방법, 기록 매체에 저장된 컴퓨터 프로그램 및 장치(시스템)를 제공한다.
차량의 제1 위치가 포함된 영역에 대응하는 벡터맵으로부터 변환된 비트맵과 차량의 이미지 센서에 의해 촬상된 복수의 뷰 이미지로부터 생성된 로컬 서브맵을 비교함으로써 차량의 제2 위치를 결정하는 차량 위치 결정 방법 및 장치가 제공된다.
본 개시는 방법, 장치(시스템) 또는 판독 가능 저장 매체에 저장된 컴퓨터 프로그램을 포함한 다양한 방식으로 구현될 수 있다.
본 개시의 일 실시예에 따르면, 적어도 하나의 프로세서에 의해 수행되는 차량 위치 결정 방법은, 차량의 제1 위치가 포함된 도로 영역 내의 복수의 의미론적 객체를 나타내는 벡터맵을 획득하는 단계, 벡터맵을 비트맵으로 변환시키는 단계, 차량의 이미지 센서에 의해 촬상된 복수의 뷰 이미지를 이용하여 로컬 서브맵을 생성하는 단계 및 변환된 비트맵과 생성된 로컬 서브맵을 기초로 차량의 제2 위치를 결정하는 단계를 포함한다.
본 개시의 일 실시예에 따른 차량 위치 결정 시스템은 메모리 및 메모리와 연결되고, 메모리에 포함된 컴퓨터 판독 가능한 적어도 하나의 프로그램을 실행하도록 구성된 적어도 하나의 프로세서를 포함하고, 적어도 하나의 프로그램은, 차량의 제1 위치가 포함된 도로 영역 내의 복수의 의미론적 객체를 나타내는 벡터맵을 획득하고, 벡터맵을 비트맵으로 변환시키고, 차량의 이미지 센서에 의해 촬상된 복수의 뷰 이미지를 이용하여 로컬 서브맵을 생성하고, 변환된 비트맵과 생성된 로컬 서브맵을 기초로 차량의 제2 위치를 결정하기 위한 명령어를 포함한다.
본 개시의 다양한 실시예에서는 보급형 GPS 모듈, 모션 센서 및 보급형 카메라를 이용하고, 항공 사진 기반의 로드레이아웃 맵(벡터맵)을 차량의 측위를 위해 사용하기 때문에, 상대적으로 저비용으로 차량의 위치를 결정할 수 있다. 또한, 차량의 위치는 GPS 모듈의 사용이 불가능한 도심지 음영 지역에서 자율 주행을 위해 요구되는 정확도로 결정되거나 추정될 수 있다.
본 개시의 다양한 실시예에서는 광역의 벡터맵 정보가 저용량의 크기를 가지기 때문에 차량의 저장 매체에 저장될 수 있다. 이에 따라, 맵 정보를 획득하기 위해 매번 통신이 수행될 필요가 없다.
본 개시의 다양한 실시예에서는 도로 영역 내의 의미론적 객체를 벡터화된 벡터맵 형태로 저장하여, 맵 보관을 위한 비용 및 업데이트 비용을 줄일 수 있다.
본 개시의 실시예들은, 이하 설명하는 첨부 도면들을 참조하여 설명될 것이며, 여기서 유사한 참조 번호는 유사한 요소들을 나타내지만, 이에 한정되지는 않는다.
도 1은 본 개시의 일 실시예에 따라 차량의 위치를 결정하는 예시를 나타내는 도면이다.
도 2는 본 개시의 일 실시예에 따른 컴퓨팅 장치 및 정보 처리 시스템의 내부 구성을 나타내는 블록도이다.
도 3은 본 개시의 일 실시예에 따른 프로세서의 구성을 나타내는 블록도이다.
도 4는 본 개시의 일 실시예에 따른 벡터맵을 비트맵으로 변환하는 과정의 예시를 나타내는 도면이다.
도 5는 본 개시의 일 실시예에 따른 도로 영역 내의 의미론적 객체의 예시를 나타내는 도면이다.
도 6은 본 개시의 일 실시예에 따른 벡터맵을 비트맵으로 변환하는 과정의 예시를 나타내는 도면이다.
도 7은 본 개시의 일 실시예에 따라 벡터맵으로부터 변환된 비트맵의 예시를 나타내는 도면이다.
도 8은 본 개시의 일 실시예에 따른 복수의 뷰 이미지를 이용하여 로컬 서브맵을 생성하는 과정을 나타내는 도면이다.
도 9는 본 개시의 일 실시예에 따른 복수의 IPM 이미지를 이용하여 로컬 서브맵을 생성하는 예시를 나타내는 도면이다.
도 10은 본 개시의 다른 실시예에 따른 로컬 서브맵을 생성하는 예시를 나타내는 도면이다.
도 11은 본 개시의 일 실시예에 따른 차량의 현재 위치를 결정하는 구성을 나타내는 도면이다.
도 12는 본 개시의 일 실시예에 따른 비트맵과 로컬 서브맵을 기초로 차량의 위치를 결정하는 예시를 나타내는 도면이다.
도 13은 본 개시의 일 실시예에 따른 코스트맵으로부터 추출된 미리 결정된 유사도 이상의 유사도를 가진 포인트가 추출된 이미지의 예시를 보여주는 도면이다.
도 14는 본 개시의 일 실시예에 따른 차량 위치 결정 방법을 나타내는 흐름도이다.
이하, 본 개시의 실시를 위한 구체적인 내용을 첨부된 도면을 참조하여 상세히 설명한다. 다만, 이하의 설명에서는 본 개시의 요지를 불필요하게 흐릴 우려가 있는 경우, 널리 알려진 기능이나 구성에 관한 구체적 설명은 생략하기로 한다.
첨부된 도면에서, 동일하거나 대응하는 구성요소에는 동일한 참조부호가 부여되어 있다. 또한, 이하의 실시예들의 설명에 있어서, 동일하거나 대응되는 구성요소를 중복하여 기술하는 것이 생략될 수 있다. 그러나, 구성요소에 관한 기술이 생략되어도, 그러한 구성요소가 어떤 실시예에 포함되지 않는 것으로 의도되지는 않는다.
개시된 실시예의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나, 본 개시는 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 개시가 완전하도록 하고, 본 개시가 통상의 기술자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것일 뿐이다.
본 명세서에서 사용되는 용어에 대해 간략히 설명하고, 개시된 실시예에 대해 구체적으로 설명하기로 한다. 본 명세서에서 사용되는 용어는 본 개시에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 관련 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서, 본 개시에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 개시의 전반에 걸친 내용을 토대로 정의되어야 한다.
본 명세서에서의 단수의 표현은 문맥상 명백하게 단수인 것으로 특정하지 않는 한, 복수의 표현을 포함한다. 또한, 복수의 표현은 문맥상 명백하게 복수인 것으로 특정하지 않는 한, 단수의 표현을 포함한다. 명세서 전체에서 어떤 부분이 어떤 구성요소를 포함한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다.
또한, 명세서에서 사용되는 '모듈' 또는 '부'라는 용어는 소프트웨어 또는 하드웨어 구성요소를 의미하며, '모듈' 또는 '부'는 어떤 역할들을 수행한다. 그렇지만, '모듈' 또는 '부'는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니다. '모듈' 또는 '부'는 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서, '모듈' 또는 '부'는 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로 코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 또는 변수들 중 적어도 하나를 포함할 수 있다. 구성요소들과 '모듈' 또는 '부'들은 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 '모듈' 또는 '부'들로 결합되거나 추가적인 구성요소들과 '모듈' 또는 '부'들로 더 분리될 수 있다.
본 개시의 일 실시예에 따르면, '모듈' 또는 '부'는 프로세서 및 메모리로 구현될 수 있다. '프로세서'는 범용 프로세서, 중앙 처리 장치(CPU), 마이크로프로세서, 디지털 신호 프로세서(DSP), 제어기, 마이크로제어기, 상태 머신 등을 포함하도록 넓게 해석되어야 한다. 몇몇 환경에서, '프로세서'는 주문형 반도체(ASIC), 프로그램가능 로직 디바이스(PLD), 필드 프로그램가능 게이트 어레이(FPGA) 등을 지칭할 수도 있다. '프로세서'는, 예를 들어, DSP와 마이크로프로세서의 조합, 복수의 마이크로프로세서들의 조합, DSP 코어와 결합한 하나 이상의 마이크로프로세서들의 조합, 또는 임의의 다른 그러한 구성들의 조합과 같은 처리 디바이스들의 조합을 지칭할 수도 있다. 또한, '메모리'는 전자 정보를 저장 가능한 임의의 전자 컴포넌트를 포함하도록 넓게 해석되어야 한다. '메모리'는 임의 액세스 메모리(RAM), 판독-전용 메모리(ROM), 비-휘발성 임의 액세스 메모리(NVRAM), 프로그램가능 판독-전용 메모리(PROM), 소거-프로그램가능 판독 전용 메모리(EPROM), 전기적으로 소거가능 PROM(EEPROM), 플래쉬 메모리, 자기 또는 광학 데이터 저장장치, 레지스터들 등과 같은 프로세서-판독가능 매체의 다양한 유형들을 지칭할 수도 있다. 프로세서가 메모리로부터 정보를 판독하고/하거나 메모리에 정보를 기록할 수 있다면 메모리는 프로세서와 전자 통신 상태에 있다고 불린다. 프로세서에 집적된 메모리는 프로세서와 전자 통신 상태에 있다.
본 개시에서, '벡터맵(vector map)'은 특정 지역 또는 도로 영역에 대해 촬상된 항공 사진으로부터 생성된 로드 레이아웃을 벡터화시킨 정보가 포함된 맵을 지칭할 수 있다. 이러한 로드 레이아웃은 특정 도로 영역 또는 위치를 구분하는데 사용될 수 있으며, 하나 이상의 의미론적 객체를 포함할 수 있다. 예를 들어, 벡터맵은 도로 영역을 구분할 수 있는 임의의 객체(예: 도로마커, 차선, 경계선, 횡단보도, 정지선 등)를 의미론적 객체로서 포함할 수 있다. 이러한 벡터맵 내의 의미론적 객체는 클래스값이 할당될 수 있는데, 상이한 의미론적 객체에는 상이한 클래스 값이 할당될 수 있다. 또한, 본 개시에서 '벡터맵'과 함께 '지역 벡터맵', '서브 벡터맵'의 용어가 사용되고 있으나, 지역 벡터맵 및 서브 벡터맵은 모두 벡터맵의 형태로 표시될 수 있다. 다만, 벡터맵, 지역 벡터맵 및 서브 벡터맵의 크기가 서로 상이할 수 있다.
본 개시에서, '의미론적(semantic) 객체'는 이미지에 포함된 객체 및/또는 객체의 경계선에 의미론적 클래스를 부여한 정보일 수 있다. 의미론적 클래스는, 예를 들어, 사람, 운전자, 자동차, 트럭, 버스, 기차, 오토바이, 자전거, 도로, 횡단보도, 건물, 벽, 철조망, 기둥, 신호등, 도로 표지판, 식물, 토지, 하늘 등과 같이 식별하고자 하는 객체의 종류일 수 있다.
본 개시에서, '비트맵(bitmap)'은 비트의 지도라고 해석될 수 있는데, 각 픽셀에 저장된 일련의 비트 정보 집합을 포함할 수 있다. 또한, 비트맵은 벡터맵을 레스터라이즈화(rasterized)시킨 맵을 지칭할 수 있다. 예를 들어, 비트맵은 로드 레이아웃 벡터 맵을 레스터라이즈화시킨 맵을 지칭할 수 있다. 예를 들어, 비트맵 내의 각 픽셀은 '0'과 '1'의 형태로 표현될 수 있으며, 의미론적 객체로 세그맨테이션된 특정 영역에 대해 클래스값 또는 속성코드가 부여될 수 있다. 다른 예로서, 비트맵 내의 각 픽셀은 RGB 형태로 표현될 수 있다.
본 개시에서, '로컬 서브맵(local submap)'은 현재 차량에 장착된 카메라를 통해 주변의 환경정보를 촬영하여 생성된 정보를 포함할 수 있다. 일 실시예에 따르면, 이러한 로컬 서브맵은 온라인 상에서 실시간으로 구축된 주변 환경 정보 맵을 포함할 수 있다. 또한, 로컬 서브맵은 실시간 고속 처리를 통해 수집되기 때문에, 미리 처리되어 저장된 벡터맵과의 매칭을 통한 차량의 위치 측정에 사용될 수 있다.
도 1은 본 개시의 일 실시예에 따라 차량(110)의 위치를 결정하는 예시를 나타내는 도면이다. 일 실시예에 따르면, 차량(110)은 도로 영역을 운행하면서 네비게이션 서비스를 제공할 수 있는 임의의 차량일 수 있다. 다른 실시예에 따르면, 차량(110)은 도로 영역 내에서 자율 주행이 가능한 임의의 차량일 수 있다. 여기서, 도로 영역은 차량이 운행될 수 있는 임의의 도로 및/또는 길을 포함할 수 있다.
차량(110)은 도로 영역을 운행하면서 차량(110)의 제1 위치를 추정할 수 있다. 일 실시예에 따르면, 차량(110)의 제1 위치는 차량(110)에 내장되거나 부착된 보급형 GPS 모듈을 이용하여 산출될 수 있다. 여기서, 보급형 GPS 모듈은 비교적 낮은 정확도(예를 들어, 수 m 수준의 오차)로 추정된 차량의 위치를 제공할 수 있다. 다른 실시예에 따르면, 차량(110)의 제1 위치는 특정 시점에서 결정된 차량(110)의 위치를 나타낼 수 있다. 여기서, 특정 시점은 차량(110)의 위치를 결정한 바로 직전의 시점을 지칭할 수 있다. 또한, 차량(110)의 제1 위치는 GPS 좌표 및/또는 방위로 표현될 수 있다.
차량(110)은 차량(110)의 제1 위치가 포함된 도로 영역(120) 내의 복수의 의미론적(semantic) 객체를 나타내는 벡터맵을 획득할 수 있다. 여기서, 벡터맵은 촬상된 항공 사진으로부터 생성된 로드 레이아웃에 대한 벡터화된 정보를 포함할 수 있다. 또한, 벡터맵 내의 의미론적 객체는 복수의 도로 영역의 각각을 구분하는데 사용될 수 있는 임의의 객체를 나타낼 수 있는데, 예를 들어, 도로 영역 내의 도로 마커, 차선, 경계선, 횡단보도, 정지선 등을 포함할 수 있다. 이러한 벡터맵 내의 의미론적 객체는 클래스값이 할당될 수 있는데, 상이한 의미론적 객체에는 상이한 클래스 값이 할당될 수 있다. 일 실시예에 따르면, 차량(110)이 도 1의 도로 영역(120)에 대해 벡터맵을 획득한 경우, 이러한 벡터맵은 도로 영역(120) 내의 횡단 보도(130), 정지선(140), 차선(150) 등의 의미론적 객체에 대한 벡터를 포함할 수 있다. 이러한 벡터맵은 저용량의 정보이기 때문에, 차량의 측위를 위해 벡터맵 보관 또는 업데이트하는 비용이 MMS 차량을 이용한 맵 생성 또는 업데이트 비용보다 훨씬 저렴하다.
차량(110)은 차량(110)의 제1 위치가 포함된 특정 영역에 대한 벡터맵을 외부 장치로부터 수신할 수 있다. 여기서, 외부 장치는 차량(110)과 통신가능한 임의의 장치, 시스템 등을 지칭할 수 있다. 이렇게 수신된 벡터맵은 차량(110)의 저장 장치에 저장될 수 있다. 예를 들어, 차량(110)은 차량(110)의 제1 위치가 포함된 특정 지역(예를 들어, 특정 도, 시, 구, 군 등) 내의 복수의 의미론적 객체를 나타내는 지역 벡터맵을 파일 형태로 수신할 수 있다.
차량(110)은 벡터맵을 비트맵으로 변환할 수 있다. 일 실시예에서, 차량(110)은 의미론적 객체가 벡터로 표현된 벡터맵으로부터 이미지화된 맵(rasterized map)을 추출(fetch)할 수 있다. 일 실시예에 따르면, 차량(110)은 벡터맵으로부터 차량(110)의 위치를 결정하는데 유용한 의미론적 객체에 대응하는 클래스 값을 선택하고, 선택된 클래스값에 대응하는 이미지 형태를 이용하여 비트맵을 생성할 수 있다. 여기서, 상이한 클래스값에는 상이한 이미지 형태가 연관될 수 있다. 예를 들어, 비트맵 생성을 위해 클래스값인 '3'이 선택되고 클래스값인 '3'이 횡단보도를 지칭할 경우, 클래스값이 '3'에 대응되는 비트맵 내의 픽셀 영역은 횡단보도에 해당하는 이미지 형태로 표현될 수 있다. 여기서, 비트맵 내의 복수의 픽셀은 '0'과 '1'로 표현될 수 있다. 즉, 비트맵에 대응되는 복수의 픽셀의 각각은 흰색 또는 검은색으로 표현될 수 있다.
차량은 차량(110)의 이미지 센서에 의해 촬상된 복수의 뷰 이미지를 이용하여 로컬 서브맵(submap)을 생성할 수 있다. 여기서, 이미지 센서는 카메라 등의 임의의 촬상 장치에 포함될 수 있으며, 차량(110)에 내장되거나 부착될 수 있다. 예를 들어, 이러한 이미지 센서는 차량의 프론트 뷰 이미지(front view image)를 촬상하도록 배치될 수 있다. 차량(110)에 대한 이미지 센서의 배치에 기초하여, 차량(110)의 이미지 센서와 도로의 지면 사이의 위치 관계가 미리 산출되어 저장될 수 있다. 일 실시예에 따르면, 차량(110)은 차량에 내장되거나 부착된 이미지 센서를 이용하여 복수의 뷰 이미지를 획득한 후 복수의 의미론적 객체를 추출할 수 있다. 그리고 나서, 차량(110)의 이미지 센서와 도로의 지면 사이의 위치 관계를 기초로 추출된 의미론적 객체를 포함하는 로컬 서브맵이 조감도(bird eye view) 형태로 표현될 수 있다. 나아가, 이러한 로컬 서브맵은 비트맵과 유사한 방식으로 의미론적 객체에 대응하는 이미지 형태로 표현될 수 있다.
변환된 비트맵과 생성된 로컬 서브맵을 기초로 차량(110)의 제2 위치가 결정될 수 있다. 차량(110)은 비트맵과 로컬 서브맵을 비교하여 차량(110)의 현재 위치인, 제2 위치를 결정할 수 있다. 일 실시예에 따르면, 차량(110)은 비트맵과 로컬 서브맵 사이의 유사도를 측정함으로써, 차량(110)의 제2 위치를 결정할 수 있다. 예를 들어, 차량(110)은 비트맵과 로컬 서브맵을 비교할 시 템플릿(template) 기반의 매칭을 수행할 수 있다. 이러한 템플릿 기반의 매칭을 통해 GPS 측정 노이즈에 대한 강건성과 위치 상태 파라미터 추정의 정확성을 높일 수 있다. 또한, 결정된 제2 위치에 대한 신뢰도가 추정될 수 있으며, 결정된 제2 위치뿐만 아니라 신뢰도가 함께 제공될 수 있다.
도 2는 본 개시의 일 실시예에 따른 컴퓨팅 장치(210) 및 정보 처리 시스템(230)의 내부 구성을 나타내는 블록도이다. 컴퓨팅 장치(210)는 이미지 처리가 가능하고 유/무선 통신이 가능한 임의의 장치를 지칭할 수 있으며, 예를 들어, 도 1의 차량(110) 등에 포함될 수 있다. 도시된 바와 같이, 컴퓨팅 장치(210)는 메모리(212), 프로세서(214), 통신 모듈(216) 및 입출력 인터페이스(218)를 포함할 수 있다. 이와 유사하게, 정보 처리 시스템(230)은 메모리(232), 프로세서(234), 통신 모듈(236) 및 입출력 인터페이스(238)를 포함할 수 있다. 도 2에 도시된 바와 같이, 컴퓨팅 장치(210) 및 정보 처리 시스템(230)은 각각의 통신 모듈(216, 236)을 이용하여 네트워크(240)를 통해 정보 및/또는 데이터를 통신할 수 있도록 구성될 수 있다. 또한, 입출력 장치(220)는 입출력 인터페이스(218)를 통해 컴퓨팅 장치(210)에 정보 및/또는 데이터를 입력하거나 컴퓨팅 장치(210)로부터 생성된 정보 및/또는 데이터를 출력하도록 구성될 수 있다.
메모리(212, 232)는 비-일시적인 임의의 컴퓨터 판독 가능한 기록매체를 포함할 수 있다. 일 실시예에 따르면, 메모리(212, 232)는 RAM(random access memory), ROM(read only memory), 디스크 드라이브, SSD(solid state drive), 플래시 메모리(flash memory) 등과 같은 비소멸성 대용량 저장 장치(permanent mass storage device)를 포함할 수 있다. 다른 예로서, ROM, SSD, 플래시 메모리, 디스크 드라이브 등과 같은 비소멸성 대용량 저장 장치는 메모리와는 구분되는 별도의 영구 저장 장치로서 컴퓨팅 장치(210) 및/또는 정보 처리 시스템(230)에 포함될 수 있다. 또는, 이러한 별도의 영구 저장 장치는 컴퓨팅 장치(210) 및/또는 정보 처리 시스템(230)에 의해 접근 가능한 임의의 외부 장치에 저장될 수 있다. 또한, 메모리(212, 232)에는 운영체제와 적어도 하나의 프로그램 코드가 저장될 수 있다.
이러한 소프트웨어 구성요소들은 메모리(212, 232)와는 별도의 컴퓨터에서 판독 가능한 기록매체로부터 로딩될 수 있다. 이러한 별도의 컴퓨터에서 판독가능한 기록매체는 이러한 컴퓨팅 장치(210) 및 정보 처리 시스템(230)에 직접 연결가능한 기록 매체를 포함할 수 있는데, 예를 들어, 플로피 드라이브, 디스크, 테이프, DVD/CD-ROM 드라이브, 메모리 카드 등의 컴퓨터에서 판독 가능한 기록매체를 포함할 수 있다. 다른 예로서, 소프트웨어 구성요소들은 컴퓨터에서 판독 가능한 기록매체가 아닌 통신 모듈을 통해 메모리(212, 232)에 로딩될 수도 있다. 예를 들어, 적어도 하나의 프로그램은 개발자들 또는 어플리케이션의 설치 파일을 배포하는 파일 배포 시스템이 네트워크(240)를 통해 제공하는 파일들에 의해 설치되는 컴퓨터 프로그램에 기반하여 메모리(212, 232)에 로딩될 수 있다.
프로세서(214, 234)는 기본적인 산술, 로직 및 입출력 연산을 수행함으로써, 컴퓨터 프로그램의 명령을 처리하도록 구성될 수 있다. 명령은 메모리(212, 232) 또는 통신 모듈(216, 236)에 의해 프로세서(214, 234)로 제공될 수 있다. 예를 들어, 프로세서(214, 234)는 메모리(212, 232)와 같은 기록 장치에 저장된 프로그램 코드에 따라 수신되는 명령을 실행하도록 구성될 수 있다.
통신 모듈(216, 236)은 네트워크(240)를 통해 컴퓨팅 장치(210)와 정보 처리 시스템(230)이 서로 통신하기 위한 구성 또는 기능을 제공할 수 있으며, 컴퓨팅 장치(210) 및/또는 정보 처리 시스템(230)이 다른 컴퓨팅 장치(210) 또는 다른 시스템(일례로 별도의 클라우드 시스템 등)과 통신하기 위한 구성 또는 기능을 제공할 수 있다. 일례로, 컴퓨팅 장치(210)의 프로세서(214)가 메모리(212) 등과 같은 기록 장치에 저장된 프로그램 코드에 따라 생성한 요청 또는 데이터는 통신 모듈(216)의 제어에 따라 네트워크(240)를 통해 정보 처리 시스템(230)으로 전달될 수 있다. 역으로, 정보 처리 시스템(230)의 프로세서(234)의 제어에 따라 제공되는 제어 신호나 명령이 통신 모듈(236)과 네트워크(240)를 거쳐 컴퓨팅 장치(210)의 통신 모듈(216)을 통해 컴퓨팅 장치(210)에 수신될 수 있다.
입출력 인터페이스(218)는 입출력 장치(220)와의 인터페이스를 위한 수단일 수 있다. 일 예로서, 입력 장치는 오디오 센서 및/또는 이미지 센서를 포함한 카메라, 키보드, 마이크로폰, 마우스 등의 장치를, 그리고 출력 장치는 디스플레이, 스피커, 햅틱 피드백 디바이스(haptic feedback device) 등과 같은 장치를 포함할 수 있다. 다른 예로, 입출력 인터페이스(218)는 터치스크린 등과 같이 입력과 출력을 수행하기 위한 구성 또는 기능이 하나로 통합된 장치와의 인터페이스를 위한 수단일 수 있다. 예를 들어, 컴퓨팅 장치(210)의 프로세서(214)가 메모리(212)에 로딩된 컴퓨터 프로그램의 명령을 처리함에 있어서 정보 처리 시스템(230)이나 다른 컴퓨팅 장치가 제공하는 정보 및/또는 데이터를 이용하여 구성되는 서비스 화면 등이 입출력 인터페이스(218)를 통해 디스플레이에 표시될 수 있다. 도 2에서는 입출력 장치(220)가 컴퓨팅 장치(210)에 포함되지 않도록 도시되어 있으나, 이에 한정되지 않으며, 컴퓨팅 장치(210)와 하나의 장치로 구성될 수 있다. 또한, 정보 처리 시스템(230)의 입출력 인터페이스(238)는 정보 처리 시스템(230)과 연결되거나 정보 처리 시스템(230)이 포함할 수 있는 입력 또는 출력을 위한 장치(미도시)와의 인터페이스를 위한 수단일 수 있다. 도 2에서는 입출력 인터페이스(218, 238)가 프로세서(214, 234)와 별도로 구성된 요소로서 도시되었으나, 이에 한정되지 않으며, 입출력 인터페이스(218, 238)가 프로세서(214, 234)에 포함되도록 구성될 수 있다.
컴퓨팅 장치(210) 및 정보 처리 시스템(230)은 도 2의 구성요소들보다 더 많은 구성요소들을 포함할 수 있다. 그러나, 대부분의 종래기술적 구성요소들을 명확하게 도시할 필요성은 없다. 일 실시예에 따르면, 컴퓨팅 장치(210)는 상술된 입출력 장치(220) 중 적어도 일부를 포함하도록 구현될 수 있다. 또한, 입출력 장치(220)는 차량의 위치를 결정하는데 사용될 수 있는 임의의 장치를 포함할 수 있는데, 예를 들어, GPS(Global Positioning system) 모듈, 모션 센서, 라이더(Lidar), 휠 인코더(Wheel Encoder), IMU(Inertial Measurement Unit), 각종 센서 등과 같은 다른 구성요소들을 포함할 수 있다.
컴퓨팅 장치(210)의 프로세서(214)는 컴퓨팅 장치(210)가 내장되거나 부착된 차량의 위치를 결정하도록 구성될 수 있다. 이 때, 이와 연관된 프로그램 코드가 컴퓨팅 장치(210)의 메모리(212)에 로딩될 수 있다. 프로그램 코드가 동작되는 동안에, 컴퓨팅 장치(210)의 프로세서(214)는 입출력 장치(220)로부터 제공된 정보 및/또는 데이터를 입출력 인터페이스(218)를 통해 수신하거나 통신 모듈(216)을 통해 정보 처리 시스템(230)으로부터 정보 및/또는 데이터를 수신할 수 있으며, 수신된 정보 및/또는 데이터를 처리하여 메모리(212)에 저장할 수 있다. 또한, 이러한 정보 및/또는 데이터는 통신 모듈(216)을 통해 정보 처리 시스템(230)에 제공할 수 있다.
일 실시예에 따르면, 프로세서(214)는 차량의 위치를 결정하기 위하여 입출력 인터페이스(218)와 연결된 GPS 모듈, 모션 센서, 이미지 센서, 터치 스크린, 키보드, 오디오 센서 등의 입력 장치를 통해 차량 위치, 차량의 추적된 위치 변이, 촬상된 이미지 및/또는 영상 등을 수신할 수 있다. 이렇게 수신된 이미지, 영상, 위치 정보 등은 메모리(212)에 저장되어 차량의 위치를 결정하는데 이용될 수 있다. 또한, 차량의 위치를 결정하기 위하여, 프로세서(214)는 차량이 위치한 영역을 포함한 벡터맵을 통신 모듈(216)을 통해 외부 장치(예: 정보 처리 시스템(230))으로부터 수신할 수 있다. 결정된 차량의 위치는 입출력 인터페이스를 통해 차량의 사용자에게 제공되거나 정보 처리 시스템(230)에 제공될 수 있다.
정보 처리 시스템(230)의 프로세서(214)는 복수의 컴퓨팅 장치 및/또는 복수의 외부 시스템으로부터 수신된 정보 및/또는 데이터를 관리, 처리 및/또는 저장하도록 구성될 수 있다. 일 실시예에서, 프로세서(234)는 컴퓨팅 장치(210)로부터 수신한 데이터에 기초하여, 컴퓨팅 장치(210)가 내장되거나 탑재된 차량의 위치를 결정하도록 구성될 수 있다. 이를 위해, 프로세서(234)는 입출력 장치(220) 중 GPS 모듈, 모션 센서, 이미지 센서로부터 측정된 정보 및/또는 데이터를 수신할 수 있다. 또한, 차량의 위치를 결정하기 위하여 프로세서(234)는 외부 장치로부터 차량이 위치된 특정 지역 또는 도로 영역에 대한 벡터맵을 수신할 수 있다. 또는, 프로세서(234)는 특정 지역 또는 도로 영역에 대한 항공 사진을 수신하고, 수신된 항공 사진을 이용하여 특정 지역 또는 도로 영역에 대한 벡터맵을 생성할 수 있다. 생성된 벡터맵 및/또는 결정된 차량의 위치는 네트워크(240)를 통해 컴퓨팅 장치(210)에 제공될 수 있다.
도 3은 본 개시의 일 실시예에 따른 프로세서(300)의 구성을 나타내는 블록도이다. 도시된 바와 같이, 프로세서(300)는 비트맵 변환 모듈(322), 로컬 서브맵 생성 모듈(324), 로컬 서브맵 매칭 모듈(326)을 포함할 수 있다. 일 실시예에 따르면, 프로세서(300)는 차량에 내장되거나 탑재된 컴퓨팅 장치(210)의 프로세서(214)를 지칭할 수 있다. 다른 실시예에 따르면, 프로세서(300)는 정보 처리 시스템(230)의 프로세서(234)를 지칭할 수 있다. 또 다른 실시예에 따르면, 프로세서(300)는 차량에 내장되거나 탑재된 컴퓨팅 장치(210)의 프로세서(214) 및 정보 처리 시스템(230)의 프로세서(234)를 포함할 수 있다.
프로세서(300)의 비트맵 변환 모듈(322)은 벡터맵(318)을 수신하고, 수신된 벡터맵(318)을 변환시키도록 구성될 수 있다. 일 실시예에 따르면, 벡터맵(318)은 차량의 제1 위치가 포함된 도로 영역 내의 복수의 의미론적(semantic) 객체를 나타내는 벡터화된 정보를 포함할 수 있다. 여기서, 차량의 제1 위치는 차량의 절대 위치값(314)에 대응될 수 있으며, 절대 위치값(314)은 차량에 구비된 GPS 모듈(예를 들어, 낮은 정확도를 가진 GPS 모듈)을 통한 대략적인 차량의 위치일 수 있다.
일 실시예에 따르면, 비트맵 변환 모듈(322)은 벡터맵(318) 내의 의미론적 객체를 선택하는 것을 통해 벡터맵(318)을 비트맵으로 변환할 수 있다. 여기서, 벡터맵(318)은 복수의 의미론적 객체를 포함하고, 각 객체에 대응하는 클래스 값을 포함할 수 있다. 비트맵 변환 모듈(322)은 벡터맵 내의 복수의 의미론적 객체 중에서 차량의 위치 추정에 사용될 의미론적 객체를 선택할 수 있다. 그리고 나서, 비트맵 변환 모듈(322)은 선택된 의미론적 객체 각각에 대응되는 클래스 값을 획득하고, 획득된 클래스 값에 대응하는 이미지 형상을 이용하여 비트맵을 생성할 수 있다. 예를 들어, 비트맵은 차량의 위치를 결정하는데 사용되는 로컬 서브맵의 크기 및 형태와 동일 또는 유사한 크기 및 형태를 가질 수 있다. 이렇게 생성된 비트맵은 프로세서(300)에 의해 연결되거나 접근 가능한 메모리에 저장되거나 프로세서(300)의 로컬 서브맵 매칭 모듈(326)에 제공될 수 있다.
프로세서(300)의 로컬 서브맵 생성 모듈(324)은 복수의 뷰 이미지(312) 및 차량의 상대 위치값(316)을 수신하고, 로컬 서브맵을 생성하도록 구성될 수 있다. 여기서, 복수의 뷰 이미지(312)는 차량에 내장되거나 부착된 이미지 센서를 이용하여 촬상된 차량의 프론트 뷰 이미지일 수 있다. 또한, 상대 위치값(316)은 차량에 내장되거나 탑재된 모션 센서에 의해 측정될 수 있으며, 차량에 배치된 이미지 센서와 도로의 지면 사이의 위치 관계에 기초한 위치 값을 지칭할 수 있다.
일 실시예에 따르면, 로컬 서브맵 생성 모듈(324)은 수신된 복수의 프론트 뷰 이미지로부터 복수의 의미론적 객체(예를 들어, 도로 영역 내의 차선, 횡단 보도, 직진 표시 및 우회전 표시 등)를 추출할 수 있다, 예를 들어, 로컬 서브맵 생성 모듈(324)은 복수의 프론트 뷰 이미지 각각을 인공신경망의 입력층에 입력하여 복수의 프론트 뷰 이미지 내의 픽셀에 대한 비트값과 복수의 프론트 뷰로부터 추출된 복수의 의미론적 객체에 대한 클래스 값을 출력할 수 있다.
그리고 나서, 로컬 서브맵 생성 모듈(324)은 차량에 배치된 이미지 센서와 도로의 지면 사이의 위치 관계에 기초하여, 추출된 복수의 의미론적 객체를 포함하는 복수의 IPM(Inverse perspective mapping) 마스크를 생성할 수 있다. 여기서, 복수의 IPM 마스크는 복수의 프론트 뷰 이미지 내의 복수의 의미론적 객체가 조감도 이미지 형태로 변환된 마스크를 지칭할 수 있다. 즉, 복수의 IPM 마스크는 프론트 뷰 이미지 내의 하늘에서 도로를 바라봤을 때의 이미지에 대응하는 마스크를 지칭할 수 있다. 또한, 이미지 센서와 도로의 지면 사이의 위치 관계는 로컬 서브맵 생성 모듈(324)에서 접근가능한 저장 장치(예: 메모리)에 저장될 수 있다.
로컬 서브맵 생성 모듈(324)은 생성된 복수의 IPM 마스크를 이용하여 로컬 서브맵을 생성하도록 구성될 수 있다. 이러한 과정에서, 로컬 서브맵 생성 모듈(324)은 생성된 복수의 IPM 마스크를, 수신된 상대적 위치값(316), 즉, 차량의 이미지 센서의 상대적 위치가 반영된 복수의 IPM 이미지로 변환할 수 있다. 로컬 서브맵 생성 모듈(324)은 변환된 복수의 IPM 이미지를 연결시킴으로써, 로컬 서브맵을 생성할 수 있다. 예를 들어, 로컬 서브맵 생성 모듈(324)은 수신된 상대적 위치값(316)을 고려하여 복수의 IPM 이미지를 회전 이동시키고, 회전 이동된 복수의 IPM 이미지의 일부 영역을 겹치도록 결합함(즉, 누적시킴)으로써 로컬 서브맵을 생성할 수 있다. 생성된 로컬 서브맵은 프로세서(300)의 로컬 서브맵 매칭 모듈(326)에 제공될 수 있다.
프로세서(300)의 로컬 서브맵 매칭 모듈(326)은 수신된 비트맵과 로컬 서브맵을 기초로 차량의 제2 위치(예: 더 정확한 현재 위치)를 결정할 수 있다. 이를 위해, 로컬 서브맵 매칭 모듈(326)은 차량의 GPS 모듈을 통해 측정된 차량의 제1 위치(예: 차량의 대략적인 위치)를 수신할 수 있다. 일 실시예에 따르면, 로컬 서브맵 매칭 모듈(326)은 비트맵과 로컬 서브맵을 비교함으로써, 비트맵과 로컬 서브맵의 차이를 결정할 수 있고, 차량의 제1 위치 및 이러한 차이를 기초로 차량의 제2 위치를 추정할 수 있다. 여기서, 비트맵과 로컬 서브맵의 차이는 차량의 제1 위치로부터, X 축에서의 차이(translation), Y 축에서의 차이(translation), X 축 방향으로부터의 회전(rotation, 즉, Yaw 값)을 나타내는 3-자유도 값으로 표현될 수 있다. 여기서, X 축 방향으로부터 회전을 나타내는 값은 차량이 바라보고 있는 방향에 대한 정보를 포함할 수 있다. 또한, 차량의 제2 위치(322)는 GPS 좌표 및/또는 방위로 표시되어 추정된 위치로서 출력될 수 있다.
로컬 서브맵 매칭 모듈(326)은 추정된 차량의 제2 위치(332)에 대한 신뢰도(334)를 추출할 수 있다. 일 실시예에 따르면, 로컬 서브맵 매칭 모듈(326)은 수신된 비트맵 및 로컬 서브맵을 이용하여 하나 이상의 코스트 맵(즉, 유사도 맵)을 생성하고, 생성된 코스트 맵을 기초로 신뢰도(334)를 추정할 수 있다. 여기서, 코스트맵은 비트맵과 로컬 서브맵의 차이값의 각각에 대응하는 유사도를 포함할 수 있다. 예를 들어, 로컬 서브맵 매칭 모듈(326)은 산출된 코스트맵 내의 차이값 중 적어도 일부의 차이값(예를 들어, 미리 결정된 유사도 이상을 가진 차이값)을 3차원 포인트로 변환하고, 코스트맵에서 가장 유사도가 높은 차이값 주변에 변환된 3차원 포인트의 분포를 판정할 수 있다. 여기서, 로컬 서브맵 매칭 모듈(326)은 미리 결정된 유사도 이상을 가진 차이값을 가장 유사도가 높은 차이값에 대응하는 GPS 좌표 상의 방위를 기준으로 회전시킴으로써, 3차원 포인트를 생성할 수 있다. 변환된 3차원 포인트의 분포를 기초로, 로컬 서브맵 매칭 모듈(326)은 차량의 제2 위치(322)에 대한 신뢰도를 판정할 수 있다. 판정된 신뢰도(334)는 추정된 차량의 제2 위치(332)와 함께 출력될 수 있다.
도 4는 본 개시의 일 실시예에 따른 벡터맵을 비트맵으로 변환하는 과정의 예시를 나타내는 도면이다. 여기서, 벡터맵을 비트맵으로 변환하는 과정은 적어도 하나의 프로세서(예를 들어, 프로세서(300))에 의해 수행될 수 있다. 일 실시예에 따르면, 프로세서는 차량의 제1 위치(예: GPS 좌표 및/또는 방위)를 외부 장치에 송신하고, 외부 장치로부터 차량의 제1 위치가 포함된 특정 지역 내의 복수의 의미론적 객체를 나타내는 지역 벡터맵을 수신할 수 있다. 프로세서는 수신된 지역 벡터맵으로부터 차량의 제1 위치가 포함된 제1 영역(예를 들어, 200-1000m)을 도로 영역으로써 선택하여 벡터맵(410)을 획득할 수 있다.
벡터맵은 도로 영역에 존재하는 의미론적 객체, 예를 들어, 차선, 도로 경계선, 정지선, 노면 표시(예: 진행 방향, 진행 금지, 횡단보도 등)의 3차원 위치값을 벡터화시켜 표현한 맵을 지칭할 수 있다. 예를 들어, 벡터맵(410)에 도시된 바와 같이, 벡터맵 내의 차선, 도로 경계선과 같이 실선 또는 점선으로 이루어진 의미론적 객체는 실선 또는 점선의 균등 간격의 위치값으로 벡터화될 수 있다. 또 다른 예로서, 벡터맵(410)에 도시된 바와 같이, 벡터맵 내의 노면 표시와 같은 이미지로 이루어진 의미론적 객체는 이미지의 각 꼭지점이 연결된 폴리곤(polygon) 형태로 벡터화될 수 있다.
의미론적 객체가 벡터화되어 표현된 벡터맵(410)은, 복수의 의미론적 객체 각각에 대응되는 클래스 값을 포함할 수 있다. 일 실시예에서, 클래스 값은, 대응되는 의미론적 객체 각각이 무엇을 의미하는 객체인지를 나타내는 값일 수 있다. 예를 들어, 항공 사진에서의 횡단 보도는 사각형으로 이루어진 폴리곤 형태로 벡터화되고, '횡단 보도'에 대응되는 클래스 값이 할당될 수 있다. 프로세서는 할당된 클래스 값을 통해 사각형 폴리곤 형태의 벡터 표현이 '횡단 보도'의 표시를 지칭하는 것으로 판정할 수 있다.
획득된 벡터맵(410) 중에서, 프로세서는 차량의 제1 위치가 포함되고 제1 영역보다 작은 영역인 제2 영역(예를 들어, 100-200m)을 선택함으로써 서브 벡터맵을 생성할 수 있다. 또한, 프로세서는 생성된 서브 벡터맵을 이용하여 제1 비트맵을 생성할 수 있다. 일 실시예에서, 프로세서는 제1 비트맵 내의 복수의 의미론적 객체 중에서 차량의 제2 위치를 추정하는데 사용될 의미론적 객체를 선택할 수 있다. 예를 들어, 프로세서는 복수의 의미론적 객체 중에서 횡단 보도, 차선, 정지선, 외곽선, 노면 표시 등과 같이 차량의 제2 위치를 결정하기 위해 유용한 객체를 선택할 수 있다. 차량의 위치 결정을 위한 객체 선택이 완료되면, 프로세서는 선택된 의미론적 객체에 대응되는 클래스 값을 획득할 수 있다. 프로세서는 획득된 클래스 값 각각에 대응하는 이미지 형상을 이용하여 제1 비트맵을 생성할 수 있다. 이때, 제1 비트맵은 클래스 값에 대응하는 이미지 형상을 '0' 과 '1'로 표현하도록 구성될 수 있다.
제1 비트맵이 생성된 후, 프로세서는 제1 비트맵 중에서 제2 비트맵을 선택할 수 있다. 일 실시예에서, 프로세서는 제1 비트맵 중에서 차량의 제1 위치가 포함되고 제2 영역보다 작은 영역인 제3 영역(예를 들어, 1-100m)에 대응하는 제2 비트맵을 선택할 수 있다. 예를 들어, 제2 비트맵은 제1 비트맵 내의 제3 영역에 대한 정보를 획득하는 것으로 생성될 수 있다. 또 다른 예로서, 제2 비트맵은 제1 비트맵의 제3 영역 중 적어도 일부 영역을 기초로 생성될 수 있다. 프로세서는 제2 비트맵을 차량의 위치를 추정하기 위해 사용될 비트맵(412)으로서 선택할 수 있다.
도 5는 본 개시의 일 실시예에 따른 도로 영역 내의 의미론적 객체의 예시를 나타내는 도면이다. 의미론적 객체가 벡터화된 벡터맵은 항공 사진을 통해 생성될 수 있다. 일 실시예에서, 도 5에 도시된 바와 같이, 도로 영역 내의 차선, 분리 합류 구간, 직진 표시, 우회전 표시 등과 같은 의미론적 객체가 항공 사진(510, 520, 530, 540) 각각에 표시되어 있다. 의미론적 객체는 클래스 값이 포함된 상태로 벡터화될 수 있는데, 의미론적 객체의 종류에 따라 상이한 클래스 값이 할당될 수 있다. 예를 들어, 항공 사진(510) 내의 차선은 스프라이트 형태(512)로 벡터화되고, 차선에 해당하는 클래스 값인 '1'이 할당될 수 있다. 또한, 항공 사진(520) 내의 분리 합류 구간은 곡선 형태(522)로 벡터화되고 분리 합류 구간에 해당하는 클래스 값인 '2'가 할당될 수 있다.
이와 유사하게, 항공 사진(530) 내의 직진 표시는 꼭지점이 연결된 폴리곤 형태(532)로 벡터화될 수 있고, 직진 표시에 해당하는 클래스 값인 '3'이 할당될 수 있다. 또한, 항공 사진(540) 내의 우회전 표시는 꼭지점이 연결된 폴리곤 형태(542)로 벡터화될 수 있고, 우회전 표시에 해당하는 클래스 값인 '4'가 할당될 수 있다. 이 경우, 직진 표시 및 우회전 표시는 벡터화된 후 동일한 폴리곤 형태(532, 542)로 벡터화되기 때문에 직진 및 우회전의 모양이 어떻게 나타나는지 확인할 수 없으나, 직진 및 우회전 표시에 각각 서로 다른 클래스 값이 할당되어 직진 및 우회전은 구분되어 판정될 수 있다.
도 6은 본 개시의 일 실시예에 따른 벡터맵을 비트맵으로 변환하는 과정의 예시를 나타내는 도면이다. 본 개시에서, 벡터맵을 비트맵으로 변환하는 과정은 적어도 하나의 프로세서(예를 들어, 프로세서(300))에 의해 수행될 수 있다. 프로세서는 차량의 위치를 결정하거나 추정하기 위한 연산 속도를 높이기 위해, 맵의 사용시기 및/또는 크기에 따라 저장 위치를 상이하게 설정할 수 있다. 일 실시예에서, 지역 벡터맵(610)은 차량의 제1 위치가 포함된 특정 지역(예를 들어, 판교 지역) 내의 복수의 의미론적 객체가 포함된 벡터맵일 수 있다. 여기서, 지역 벡터맵(610)은 수 km 내지 수백 km까지의 넓은 범위를 포함하는 맵일 수 있는데, 용량의 효율성을 위해 메모리에 직접 저장되는 것이 아닌 파일 형태로 저장 장치에 저장될 수 있다. 여기서, 저장 장치는 메모리가 아닌, 별도의 영구 저장 장치를 지칭할 수 있다. 또는, 저장 장치는 메모리를 지칭할 수도 있다.
프로세서는 저장된 지역 벡터맵(610) 내에서, 차량의 제1 위치가 포함된 일정 범위(예를 들어, 차량의 제1 위치 주변의 200-1000m 반경)을 메모리로 불러올 수 있다. 여기서, 프로세서는 차량의 진행 속도 및 방향을 고려하여 지역 벡터맵(610) 내의 일정 영역을 불러오는 과정의 시점을 결정할 수 있으며, 일반적으로 수십 초에 한 번 정도 간격으로 이러한 과정이 실행될 수 있다. 도시된 바와 같이, 프로세서는 지역 벡터맵(610)으로부터 차량의 제1 위치가 포함된 제1 영역을 선택함으로써, 벡터맵(612)을 획득할 수 있다.
프로세서는 벡터맵(612) 중에서, 차량의 제1 위치가 포함된 제2 영역을 선택함으로써, 제2 영역이 포함된 서브 벡터맵(614)을 생성할 수 있다. 이 때, 제2 영역은 제1 영역보다 작을 수 있는데, 예를 들어, 제2 영역은 차량의 제1 위치 주변의 100-200m 반경을 지칭할 수 있다. 수 백 미터 크기의 영역을 가진 벡터맵을 비트맵으로 변환하는 것은 메모리의 효율이 떨어지고 처리 속도를 느리게 할 수 있다. 메모리 효율 및 처리 속도를 향상시키기 위하여, 프로세서는 벡터맵(612)로부터 캐쉬 메모리(cache memory)에 존재할 수 있는 크기(예를 들어, 약 1200 x 1200 픽셀 크기) 만큼의 서브 벡터맵(614)을 생성하고, 생성된 서브 벡터맵(614)을 제1 비트맵으로 변경할 수 있다. 예를 들어, 프로세서는 서브 벡터맵(614) 내의 복수의 의미론적 객체 중에서 차량의 위치 추정에 사용될 의미론적 객체를 선택하고, 선택된 의미론적 객체 각각에 대응하는 클래스 값을 획득할 수 있다. 또한, 프로세서는 획득된 클래스 값에 대응하는 이미지 형상을 이용하여 제1 비트맵(616)을 생성할 수 있다. 이렇게 생성된 제1 비트맵(616)은 캐시 메모리에 저장될 수 있다. 프로세서는 차량의 진행 속도 및 방향을 고려하여 서브 벡터맵(614)을 생성하고 생성된 서브 벡터맵(614)을 제1 비트맵(616)으로 변환하는 과정의 시점을 결정할 수 있다. 예를 들어, 이러한 과정이 일반 주행상황에서 일정 시간(예를 들어, 수 초)마다 한 번씩 실행될 수 있다.
프로세서는 생성된 제1 비트맵(616)에서 차량의 제1 위치가 포함된 제3 영역에 대응하는 제2 비트맵(618)을 선택할 수 있다. 여기서, 제3 영역은 제2 영역보다 작을 수 있는데, 예를 들어, 제3 영역은 차량의 제1 위치 주변의 수십 m 반경을 지칭할 수 있다. 일 실시예에서, 프로세서는 차량의 제1 위치가 포함된 제3 영역에 대응하는 제2 비트맵을 선택하기 위해, 제1 비트맵(616) 내의 제2 영역의 일부 영역에 대한 정보를 획득하고, 획득된 정보를 이용하여 제2 비트맵(618)을 사용할 수 있다. 예를 들어, 프로세서는 보간 기법을 이용하여 제1 비트맵(616) 내의 차량의 제1 위치 주변의 수십 미터의 영역(예: 32x 32m 영역)을 샘플링함으로써, 제2 비트맵(618)을 생성할 수 있다. 예를 들어, 제2 비트맵(618)의 크기는 약 400 x 400 픽셀 크기일 수 있다. 프로세서는 생성된 제2 비트맵(618)을 차량의 위치를 결정하기 위해 로컬 서브맵과 비교될 비트맵으로서 선택할 수 있다.
본 개시에 따르면, 프로세서가 중간 사이즈의 제1 비트맵(616)을 생성하고, 생성된 제1 비트맵(616)으로부터 작은 사이즈의 제2 비트맵(618)을 생성할 수 있다. 이에 따라, 차량이 운행되는 동안에, 프로세서가 벡터맵을 비트맵으로 변환하는 과정에서 생겨날 수 있는 비슷한 영역에 대한 중복 계산을 방지할 수 있다. 또한, 차량의 주변 반경 수십 미터 이내의 제2 비트맵(618)은 제1 비트맵(616) 내의 일부 영역에 대한 샘플링을 수행함으로써 생성되기 때문에, 제2 비트맵(618)의 생성 속도가 향상될 수 있다. 이러한 생성 속도의 향상에 기인하여, 제2 비트맵(618)이 차량의 주행 환경에 따라 10hz 내지 20hz 마다 갱신되어야 하는 환경에 적응할 수 있다.
도 7은 본 개시의 일 실시예에 따라 벡터맵으로부터 변환된 비트맵의 예시를 나타내는 도면이다. 일 실시예에서, 비트맵(710, 720)은, 벡터맵에서의 선택된 의미론적 객체(712, 722)가 비트로 표현된 맵일 수 있다. 예를 들어, 비트맵에서 의미론적 객체는 '0' 과 '1'로 이루어져 흑과 백으로 표현된 이미지 형상일 수 있다.
도 7은 본 개시의 일 실시예에 따라 벡터맵으로부터 변환된 비트맵의 예시를 나타내는 도면이다. 일 실시예에 따르면, 비트맵(710, 720)은, 차량의 위치를 추정하는데 사용될 비트맵(예: 제2 비트맵)으로서, 예를 들어, 차량의 위치 주변의 32m x 32m 영역 내의 복수의 의미론적 객체를 포함할 수 있다. 예를 들어, 비트맵(710, 720)의 복수의 픽셀은 '0' 과 '1'로 이루어져 흑과 백으로 표현된 이미지 형상일 수 있다. 또한, 비트맵(710, 720) 내의 복수의 의미론적 객체에 대응되는 영역은 클래스 값이 할당될 수 있다.
일 실시예에 따르면, 비트맵(710, 720) 내에 표시된 의미론적 객체 중에서, 의미론적 객체(712, 722)는 모두 폴리곤 형태로 표시된다. 또한, 의미론적 객체(712, 722)의 각각은 서로 다른 클래스 값이 할당될 수 있으며, 할당된 클래스값을 기초로 의미론적 객체(712, 722)에 대응하는 객체가 무엇인지 판정될 수 있다. 예를 들어, 비트맵(710) 내의 의미론적 객체(712)의 클래스 값이 '5'라면, 의미론적 객체(712)는 '5'와 대응되는 의미론적 객체인 '진행 금지'의 표시로 인식될 수 있다. 또 다른 예로서, 비트맵(720) 내의 의미론적 객체(722)의 클래스 값이 '6'이라면, 의미론적 객체(722)는 '6'과 대응되는 의미론적 객체인 'CCTV 단속구간'의 표시로 인식될 수 있다.
도 8은 본 개시의 일 실시예에 따른 복수의 뷰 이미지를 이용하여 로컬 서브맵을 생성하는 과정을 나타내는 도면이다. 이러한 로컬 서브맵 생성 과정은 적어도 하나의 프로세서(예: 로컬 서브맵 생성 모듈(324))에 의해 수행될 수 있다. 일 실시예에 따르면, 프로세서는 차량의 이미지 센서를 통해 촬상된 복수의 뷰 이미지를 수신할 수 있다(S810). 예를 들어, 차량의 이미지 센서는 차량의 프론트 뷰 이미지를 촬상하도록 차량에 배치될 수 있으며, 복수의 뷰 이미지는 차량의 프론트 뷰 이미지를 포함할 수 있다.
프로세서는 차량의 이미지 센서에 의해 촬상된 복수의 프론트 뷰 이미지로부터 복수의 의미론적 객체를 추출할 수 있다(S812). 일 실시예에 따르면, 복수의 의미론적 객체는 차량의 위치를 결정하거나 추정하는데 사용될 수 있는 임의의 객체를 포함할 수 있으며, 예를 들어, 의미론적 객체는 도로 영역 내의 도로 마커, 차선, 경계선, 횡단보도, 정지선 등을 포함할 수 있다.
프로세서는 복수의 프론트 뷰 이미지로부터 복수의 의미론적 객체를 추출하기 위해 미리 알려진 임의의 의미론적 분할(semantic segmentation) 방법이 사용될 수 있다. 일 실시예에 따르면, 프로세서는 복수의 의미론적 객체를 추출하기 위해 임의의 머신 러닝 기법을 이용할 수 있다. 예를 들어, 프로세서는 복수의 프론트 뷰 이미지 각각을, 이미지로부터 의미론적 객체를 추출하도록 학습된 인공신경망의 입력층에 입력하여, 복수의 프론트 뷰 이미지 내의 복수의 픽셀에 대한 비트 값과 복수의 프론트 뷰 이미지 내의 의미론적 객체에 대한 클래스 값을 추출할 수 있다. 예를 들어, 상이한 의미론적 객체에는 상이한 클래스 값이 할당될 수 있다.
의미론적 객체의 클래스 값이 추출되면, 의미론적 객체를 포함하는 복수의 IPM 마스크를 생성할 수 있다(S814). 일 실시예에 따르면, 프로세서는 차량에 배치된 이미지 센서와 도로의 지면 사이의 위치 관계에 기초하여 IPM 마스크를 생성할 수 있다. 예를 들어, 단일 IPM 마스크는 8 x 16 m의 크기를 가질 수 있다.
프로세서는 생성된 복수의 IPM 마스크를 이용하여 로컬 서브맵을 생성하도록 구성될 수 있다(S822). 일 실시예에 따르면, 프로세서는 차량의 이미지 센서의 상대적 위치가 반영된 IPM 이미지로 변환하고, 복수의 IPM 이미지를 연결시켜 로컬 서브맵을 생성할 수 있다. 여기서, 차량의 이미지 센서의 상대적 위치는 차량에 내장되거나 장착된 모션 센서에 의해 측정될 수 있다. 예를 들어, 프로세서는 이전 IPM 이미지 및 상대적 위치(820)를 수신하고, 현재 IPM 이미지를 상대적 위치에 따라 변환할 수 있다. 그리고 나서, 프로세서는 변환된 현재 IPM 이미지를 상대적 위치에 따라 이미 변환된 이전 IPM 이미지와 누적 연결시킴으로써, 로컬 서브맵을 생성할 수 있다. 예를 들어, 20-30개의 IPM 이미지가 누적되어 로컬 서브맵이 생성될 수 있다.
부가적으로, 프로세서는 뷰 이미지로부터 생성된 참조 이미지를 이용하여 IPM 마스크에 대한 리파인먼트(refinement)를 수행할 수 있다. 예를 들어, 프로세서는 CRF(Conditional Random Field)와 같은 구조 예측을 위한 통계적 모델링 기법을 이용하여 IPM 마스크의 리파인먼트를 수행함으로써, 로컬 서브맵 내의 의미론적 객체에 대응하는 영역의 이미지 퀄리티를 향상시킬 수 있다.
일 실시예에 따르면, 프로세서는 뷰 이미지에서 참조 이미지를 생성할 수 있다(S816). 예를 들어, 프로세서는 복수의 프론트 뷰 이미지로부터 추출된 복수의 의미론적 객체로부터 하나 이상의 동적 객체(예를 들어, 외부 차량)를 선택할 수 있다. 그리고 나서, 프로세서는 복수의 뷰 이미지 내에서, 복수의 의미론적 객체에 대응하는 영역으로부터 선택된 하나 이상의 동적 객체에 대응하는 영역을 제외한 영역을 기초로, 복수의 참조 이미지를 생성할 수 있다. 여기서, 참조 이미지는 뷰 이미지로부터 동적 객체에 대응하는 영역을 제거한 RGB 형태의 이미지일 수 있다.
그리고 나서, 프로세서는 생성된 복수의 참조 이미지를 이용하여 복수의 IPM 마스크에 대한 리파인먼트를 수행할 수 있다(S818). 예를 들어, 프로세서는 IPM 마스크와 동일한 뷰 이미지를 통해 생성된 참조 이미지(예: RGB 이미지)를 이용하여, IPM 마스크 내의 복수의 픽셀에 대한 비트 값을 변경할 수 있다. 이에 따라, IPM 마스크 내의 의미론적 객체의 각각은 보다 선명하게 표시되거나 의미론적 객체의 인식율이 보다 향상될 수 있다. 이렇게 리파인먼트가 수행된 IPM 마스크는 로컬 서브맵 생성을 위한 IPM 이미지를 생성하는데 사용될 수 있다.
도 9는 본 개시의 일 실시예에 따른 복수의 IPM 이미지를 이용하여 로컬 서브맵을 생성하는 예시를 나타내는 도면이다. 이러한 로컬 서브맵 생성 과정은 적어도 하나의 프로세서(예: 로컬 서브맵 생성 모듈(324))에 의해 수행될 수 있다. 일 실시예에 따르면, 프로세서는 복수의 IPM 이미지를 시간 순으로 수신할 수 있고, 차량의 모션 센서에 의해 획득된 이미지 센서의 상대적 위치를 고려하여 복수의 IPM 이미지를 연결시킬 수 있다. 도시된 바와 같이, 프로세서는 제1 IPM 이미지(912), 제2 IPM 이미지(914), 제3 IPM 이미지(916), 제4 IPM 이미지(918), 제5 IPM 이미지(920)를 시간 순으로 수신하고, 차량의 모션 센서에 의해 획득된 이미지 센서의 상대적 위치를 고려하여 수신된 IPM 이미지의 일부를 겹치도록 연결, 즉 누적 연결시킬 수 있다.
이렇게 누적 연결된 복수의 IPM 이미지를 이용하여 로컬 서브맵(930)이 생성될 수 있다. 예를 들어, 단일 IPM 이미지는 약 8 x 16 m의 크기를 가질 수 있다. 이러한 크기의 단일 IPM 이미지가 20개 내지 30개 누적되어 최종적으로 약 32 x 16 m 크기의 로컬 서브맵이 생성될 수 있다.
도 10은 본 개시의 다른 실시예에 따른 로컬 서브맵을 생성하는 예시를 나타내는 도면이다. 로컬 서브맵(1010, 1020)은 차량의 모션 센서에 의해 측정된 이미지 센서의 상대적 위치를 기초로 추정된 차량의 주행 방향에 따라 생성될 수 있다. 일 실시예에 따르면, 제1 로컬 서브맵(1010)은 '어린이 보호 구역'으로 진입하고 있는 차량을 기준으로 생성된 로컬 서브맵일 수 있다. 다른 실시예에서, 제2 로컬 서브맵(1020)은 굽은 도로로 진입하고 있는 차량을 기준으로 생성된 로컬 서브맵일 수 있다.
도 11은 본 개시의 일 실시예에 따른 차량의 현재 위치를 결정하는 과정을 나타내는 도면이다. 이러한 차량 위치를 결정하는 과정은 적어도 하나의 프로세서(예: 로컬 서브맵 매칭 모듈(326))에 의해 수행될 수 있다. 프로세서는 비트맵과 로컬 서브맵을 기초로 차량의 제2 위치를 결정할 수 있다. 여기서, 비트맵은 차량의 제1 위치가 포함된 도로 영역 내의 복수의 의미론적 객체를 나타내는 벡터맵으로부터 변환될 수 있다. 또한, 로컬 서브맵은 차량의 이미지 센서에 의해 촬상된 복수의 뷰 이미지를 이용하여 생성될 수 있다. 일 실시예에서, 프로세서는 비트맵과 로컬 서브맵을 비교하여 비트맵과 로컬 서브맵의 차이를 결정하고, 차량의 제1 위치 및 결정된 차이를 기초로 차량의 제2 위치를 추정할 수 있다. 예를 들어, 비트맵과 로컬 서브맵의 차이는, 차량의 제1 위치로부터 X 축에서의 차이(translation), Y 축에서의 차이(translation), X 축 방향으로부터의 회전(rotation)을 나타내는 3-자유도(DoF) 값으로 표현될 수 있다. 이때, X 축 방향으로부터 회전을 나타내는 값은 차량이 바라보고 있는 방향에 대한 정보를 포함할 수 있다. 또한, 3-자유도 값은 X 축 차이값, Y 축 차이값 및 Yaw 회전값을 포함할 수 있다.
프로세서는 비트맵과 로컬 서브맵의 차이를 나타내는 3-자유도 값을 추정하기 위해 비트맵(1110)을 미리 결정된 복수의 각도(예를 들어, -2도에서 2도 사이의 미리 결정된 간격의 복수의 각도)를 이용하여 회전시킨 샘플 비트맵(1112)을 생성할 수 있다. 그리고 나서, 프로세서는 복수의 샘플 비트맵(1112)의 각각과 로컬 서브맵(1114) 사이의 상호 상관(1116, cross correlation)을 결정하여 코스트 맵(costmap)을 생성할 수 있다. 예를 들어, 프로세서는 복수의 샘플 비트맵(1112)의 각각과 로컬 서브맵(1114)을 고속 푸리에 변환(fast Fourier transform)을 수행하고, 복수의 샘플 비트맵(1112)의 각각과 로컬 서브맵(1114)의 차이에 대한 복수의 코스트맵을 생성할 수 있다. 예를 들어, 이러한 코스트맵은 정규화된 상관 계수 코스트맵(normalized correlation coefficient costmap)을 지칭할 수 있다. 프로세서는 이러한 고속 푸리에 변환을 사용하므로, 비트맵과 로컬 서브맵 사이의 차이를 결정하는데 있어서 신속한 연산이 가능하다. 이렇게 생성된 코스트맵을 기초로 비트맵과 로컬 서브맵 사이의 차이를 나타내는 3-자유도 값이 추정될 수 있다.
프로세서는 생성된 코스트 맵을 연결하여 코스트 볼륨(1118, cost volume)을 생성할 수 있다. 일 실시예에 따르면, 프로세서는 복수의 샘플 비트맵(1112)의 각각과 로컬 서브맵 사이의 차이에 대한 복수의 코스트맵을 생성하고, 생성된 복수의 코스트맵을 이어 붙임(concatenate)으로써, X 축 방향으로부터 회전을 나타내는 값, 즉 Yaw 회전값에 대한 유사도를 포함한 코스트 볼륨(cost volume)을 생성할 수 있다. 여기서, 코스트 볼륨은 복수의 코스트 맵을 기초로 추정된 복수의 3-자유도 값의 집합일 수 있으며, 추정된 3-자유도 값에 대한 유사도를 포함할 수 있다. 또한, 도시된 바와 같이, 코스트 볼륨의 longitudinal 축은 X 축, lateral 축은 Y 축을 나타내고 있으며, Yaw 값은 X 축 방향으로부터의 회전값을 지칭할 수 있다.
그리고 나서, 프로세서는, 코스트 볼륨에서 유사도가 가장 높은 3-자유도 값을 비트맵과 로컬 서브맵의 차이를 나타내는 값으로 추정할 수 있다. 예를 들어, 유사도의 범위는 '0'에서 '1' 사이의 값으로 표현될 수 있으며, 코스트 볼륨에서 유사도가 '1'에 가장 가까운 유사도를 가진 3-자유도 값이 로컬 서브맵의 차이를 나타내는 값인 추정값(1120)으로 결정될 수 있다.
그리고 나서, 프로세서는 코스트 볼륨에서의 유사도가 가장 높은 3-자유도 값에 코스트 볼륨의 3-자유도 값의 각각의 단위값에 해당하는 미리 결정된 크기를 적용함(예를 들어, 곱셈을 수행)으로써, 유사도가 가장 높은 3-자유도 값에 대한 조정값을 산출할 수 있다. 여기서, 미리 결정된 크기는 실제 세계의 물리값에 대응되는 크기를 지칭할 수 있으며, 예를 들어, 코스트 볼륨 내의 x, y의 각각의 경우, 1 단위는 0.8 미터의 크기를 가지며, 코스트 볼륨 내의 yaw 회전의 경우, 1 단위는 0.5 도의 크기를 가질 수 있다. 즉, 3-자유도 값에 대한 조정값은 실제 세계의 물리값, 예를 들어, GPS 좌표 및/또는 방위, 3차원의 좌표값(x, y, z) 등으로 출력될 수 있다. 프로세서는 산출된 조정값을 차량의 제1 위치(범용 GPS에 의해 측정된 값 또는 이용된 벡터맵에 대응하는 위치)에 적용함으로써 차량의 제2 위치(현재 위치)를 추정할 수 있다.
프로세서는 차량의 제2 위치값을 추정하는 것과 함께 차량의 제2 위치값에 대한 신뢰도를 추정값(1120)으로서 출력할 수 있다. 일 실시예에 따르면, 프로세서는 코스트 볼륨에서 미리 결정된 유사도(예를 들어, 코스트 볼륨 내의 포인트 중에서 2%의 포인트를 추출할 수 있는 유사도) 이상의 유사도를 가진 복수의 3-자유도 값에 대한 정보를 추출할 수 있다. 예를 들어, 프로세서는 미리 결정된 유사도 이상의 유사도를 가진 복수의 3-자유도 값으로부터 x 차이값 및 y 차이값을 추출할 수 있다. 그리고 나서, 프로세서는 추출된 복수의 3-자유도 값에 대응하는 정보에, 3-자유도 값의 코스트 볼륨의 단위값에 대응하는 미리 결정된 크기를 적용함으로써, 추출된 복수의 3-자유도 값에 대응하는 정보에 대한 조정값을 산출할 수 있다. 프로세서는 추정된 차량의 제2 위치에 대응하는 GPS 좌표 상의 방위를 기준으로 복수의 3-자유도 값에 대응하는 정보에 대한 조정값을 회전 또는 회전 변환시킬 수 있다. 예를 들어, 미리 결정된 유사도 이상의 유사도를 가진 복수의 3-자유도 값으로부터 추출된 x, y값을 특정 각도를 이용해서 회전시킬 수 있다. 이러한 특정 각도는 차량의 제2 위치에 대응하는 GPS 좌표 상의 방위를 기초로 산출될 수 있다.
그리고 나서, 프로세서는 복수의 3-자유도 값에 대응하는 정보에 대한 회전된 조정값에 대한 공분산 행렬을 산출할 수 있다. 여기서, 공분산 행렬(covariance matrix)은 3x3 공분산 행렬을 지칭할 수 있으며, 3x3 공분산 행렬을 산출하는데 있어서 복수의 3-자유도 값에 대응하는 x 차이값, y 차이값 및 yaw 회전값이 이용될 수 있다. 프로세서는 이렇게 산출된 공분산 행렬을 기초로 추정된 차량의 제2 위치에 대한 신뢰도를 결정할 수 있다. 공분산 행렬은 추정된 차량의 제2 위치의 주변에 회전된 복수의 자유도 값에 대응하는 조정값의 분포를 나타낼 수 있다.
도 12는 본 개시의 일 실시예에 따른 비트맵과 로컬 서브맵을 기초로 차량의 위치를 결정하는 예시를 나타내는 도면이다. 이러한 차량 위치를 결정하는 과정은 적어도 하나의 프로세서(예: 로컬 서브맵 매칭 모듈(326))에 의해 수행될 수 있다. 비교 이미지(1210)에 도시된 바와 같이, 차량의 이미지 센서에 의해 촬상된 복수의 뷰 이미지로부터 생성된 로컬 서브맵(1212)과 차량의 제1 위치에 포함된 도로 영역에 대응하는 벡터맵으로부터 변환된 비트맵(1214)을 비교해보면 차량의 제1 위치와 차량의 제2 위치에 대한 상대적인 차이가 나타날 수 있다. 이러한 차이는 비교 이미지(1210) 내의 X 축에서의 차이값 및 Y 축에서의 차이값을 포함할 수 있다. 이와 달리, 이러한 차이는 비교 이미지(1210) 내의 X 축에서의 차이값, Y 축에서의 차이값 및 X 축 방향으로부터의 회전값을 포함할 수 있다.
또한, 프로세서는 로컬 서브맵(1212)과 비트맵(1214)의 상대적인 차이를 결정하는 동시에 이러한 차이에 대한 유사도를 포함한 코스트맵(1220)을 생성할 수 있다. 프로세서는 생성된 코스트맵(1220)으로부터 가장 유사도가 높은 차이값을 선택할 수 있다. 그리고 나서, 프로세서는 비교 이미지(1230)에 도시된 바와 같이, 선택된 차이값을 기초로 비트맵(1234)의 위치를 로컬 서브맵(1232)의 위치와 일치시키도록 이동시킬 수 있다. 즉, 프로세서는 차량의 제1 위치에 산출된 차이값(상대적인 차이값)를 적용함으로써, 차량의 제2 위치를 결정할 수 있다.
도 13은 본 개시의 일 실시예에 따른 코스트맵으로부터 추출된 미리 결정된 유사도 이상의 유사도를 가진 포인트가 추출된 이미지의 예시를 보여주는 도면이다. 프로세서는 직전 차선 정보만 있는 경우에 코스트맵으로부터 추출된 미리 결정된 유사도 이상의 유사도를 가진 포인트(이하, 주요 포인트)가 표시된 이미지(1310, 1320)를 생성할 수 있다. 또한, 프로세서는 교차 상황인 경우 코스트맵으로부터 추출된 주요 포인트가 표시된 이미지(1330, 1340)를 생성할 수 있다. 도시된 바와 같이, 이미지(1310, 1320, 1330, 1340)의 주요 포인트는 짙은 색으로 표시된 점들의 집합으로 나타낼 수 있다. 여기서, 이미지(1310, 1320, 1330, 1340)의 주요 포인트는 코스트맵으로부터 추출된 x, y 값에 대한 조정값(즉, 실제 세계에서의 크기값)을 차량의 제2 위치에 대응하는 GPS 좌표 상의 방위를 기준으로 회전시킴으로써 생성될 수 있다.
프로세서는 이렇게 생성된 주요 포인트에 대한 공분산 행렬을 산출할 수 있다. 공분산 행렬을 통한 신뢰도는 조정값 분포의 밀도가 높을수록 높은 신뢰도를 나타낼 수 있다. 일 실시예에서, 이미지(1310, 1320) 내의 주요 포인트의 분포를 비교해 보면, 이미지(1310)의 분포의 밀도가 이미지(1320)의 분포의 밀도보다 더 높으므로, 이미지(1310)으로부터 산출된 차량의 제2 위치에 대한 신뢰도가 더 높다고 판정될 수 있다. 다른 실시예에 따르면, 이미지(1330, 1340) 내의 주요 포인트의 분포를 비교해보면, 이미지(1330)의 분포의 밀도가 이미지(1340)의 분포의 밀도보다 더 높으므로, 이미지(1330)으로부터 산출된 차량의 제2 위치에 대한 신뢰도가 더 높다고 판정될 수 있다.
도 14는 본 개시의 일 실시예에 따른 차량 위치 결정 방법을 나타내는 흐름도이다. 일 실시예에 따르면, 차량 위치 결정 방법은 차량에 포함된 컴퓨팅 장치에 탑재되거나 내장된 프로세서에 의해 실행될 수 있다. 다른 실시예에 따르면, 차량 위치 결정 방법은 정보 처리 시스템에 포함된 프로세서에 의해 실행될 수 있다. 차량 위치 결정 방법은 차량의 제1 위치가 포함된 도로 영역 내의 복수의 의미론적 객체를 나타내는 벡터맵을 획득하는 단계(S1410)에 의해 개시될 수 있다. 여기서, 차량의 제1 위치는 차량의 GPS에 의해 측정된 차량의 대략적인 위치를 지칭할 수 있다. 예를 들어, 벡터맵은 항공 사진으로부터 생성된 로드 레이아웃 벡터 맵을 지칭할 수 있다. 또한, 복수의 의미론적 객체는 도로 영역 내에 포함되고 차량의 위치를 결정하는데 사용될 수 있는 임의의 객체를 포함할 수 있다.
프로세서는 벡터맵을 비트맵으로 변환할 수 있다(S1420). 일 실시예에 따르면, 프로세서는 벡터맵을 이미지화(rasterize)하여 비트맵을 생성할 수 있다. 예를 들어, 프로세서는 벡터맵으로부터 의미론적 객체를 선택하고 선택된 의미론적 객체에 대한 이미지 형상을 생성함으로써, 비트맵을 생성할 수 있다.
프로세서는 차량의 이미지 센서에 의해 촬상된 복수의 뷰 이미지를 이용하여 로컬 서브맵을 생성할 수 있다(S1430). 이를 위해, 프로세서는 차량의 이미지 센서와 도로의 지면 사이의 위치 관계에 기초하여 복수의 뷰 이미지를 복수의 조감도 이미지로 변환할 수 있다. 그리고 나서, 프로세서는 차량의 모션 센서에 의해 측정된 이미지 센서의 상대적인 위치를 기초로 복수의 조감도 이미지를 누적 연결함으로써, 로컬 서브맵을 생성할 수 있다.
프로세서는 변환된 비트맵과 생성된 로컬 서브맵을 기초로 차량의 제2 위치를 결정할 수 있다(S1440). 여기서, 차량의 제2 위치는 차량의 현재 위치를 지칭할 수 있다. 프로세서는 비트맵과 로컬 서브맵을 비교하여, 비트맵과 로컬 서브맵 사이의 차이를 결정할 수 있다. 그리고 나서, 프로세서는 차량의 제1 위치에 결정된 차이를 반영하여 차량의 제2 위치를 결정할 수 있다.
상술한 차량 위치 결정 방법은 컴퓨터에서 실행하기 위해 컴퓨터 판독 가능한 기록 매체에 저장된 컴퓨터 프로그램으로 제공될 수 있다. 매체는 컴퓨터로 실행 가능한 프로그램을 계속 저장하거나, 실행 또는 다운로드를 위해 임시 저장하는 것일 수도 있다. 또한, 매체는 단일 또는 수개 하드웨어가 결합된 형태의 다양한 기록수단 또는 저장수단일 수 있는데, 어떤 컴퓨터 시스템에 직접 접속되는 매체에 한정되지 않고, 네트워크 상에 분산 존재하는 것일 수도 있다. 매체의 예시로는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM 및 DVD 와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical medium), 및 ROM, RAM, 플래시 메모리 등을 포함하여 프로그램 명령어가 저장되도록 구성된 것이 있을 수 있다. 또한, 다른 매체의 예시로, 애플리케이션을 유통하는 앱 스토어나 기타 다양한 소프트웨어를 공급 내지 유통하는 사이트, 서버 등에서 관리하는 기록매체 내지 저장매체도 들 수 있다.
본 개시의 방법, 동작 또는 기법들은 다양한 수단에 의해 구현될 수도 있다. 예를 들어, 이러한 기법들은 하드웨어, 펌웨어, 소프트웨어, 또는 이들의 조합으로 구현될 수도 있다. 본원의 개시와 연계하여 설명된 다양한 예시적인 논리적 블록들, 모듈들, 회로들, 및 알고리즘 단계들은 전자 하드웨어, 컴퓨터 소프트웨어, 또는 양자의 조합들로 구현될 수도 있음을 통상의 기술자들은 이해할 것이다. 하드웨어 및 소프트웨어의 이러한 상호 대체를 명확하게 설명하기 위해, 다양한 예시적인 구성요소들, 블록들, 모듈들, 회로들, 및 단계들이 그들의 기능적 관점에서 일반적으로 위에서 설명되었다. 그러한 기능이 하드웨어로서 구현되는지 또는 소프트웨어로서 구현되는지의 여부는, 특정 애플리케이션 및 전체 시스템에 부과되는 설계 요구사항들에 따라 달라진다. 통상의 기술자들은 각각의 특정 애플리케이션을 위해 다양한 방식들로 설명된 기능을 구현할 수도 있으나, 그러한 구현들은 본 개시의 범위로부터 벗어나게 하는 것으로 해석되어서는 안된다.
하드웨어 구현에서, 기법들을 수행하는 데 이용되는 프로세싱 유닛들은, 하나 이상의 ASIC들, DSP들, 디지털 신호 프로세싱 디바이스들(digital signal processing devices; DSPD들), 프로그램가능 논리 디바이스들(programmable logic devices; PLD들), 필드 프로그램가능 게이트 어레이들(field programmable gate arrays; FPGA들), 프로세서들, 제어기들, 마이크로제어기들, 마이크로프로세서들, 전자 디바이스들, 본 개시에 설명된 기능들을 수행하도록 설계된 다른 전자 유닛들, 컴퓨터, 또는 이들의 조합 내에서 구현될 수도 있다.
따라서, 본 개시와 연계하여 설명된 다양한 예시적인 논리 블록들, 모듈들, 및 회로들은 범용 프로세서, DSP, ASIC, FPGA나 다른 프로그램 가능 논리 디바이스, 이산 게이트나 트랜지스터 로직, 이산 하드웨어 컴포넌트들, 또는 본원에 설명된 기능들을 수행하도록 설계된 것들의 임의의 조합으로 구현되거나 수행될 수도 있다. 범용 프로세서는 마이크로프로세서일 수도 있지만, 대안으로, 프로세서는 임의의 종래의 프로세서, 제어기, 마이크로제어기, 또는 상태 머신일 수도 있다. 프로세서는 또한, 컴퓨팅 디바이스들의 조합, 예를 들면, DSP와 마이크로프로세서, 복수의 마이크로프로세서들, DSP 코어와 연계한 하나 이상의 마이크로프로세서들, 또는 임의의 다른 구성의 조합으로서 구현될 수도 있다.
펌웨어 및/또는 소프트웨어 구현에 있어서, 기법들은 랜덤 액세스 메모리(random access memory; RAM), 판독 전용 메모리(read-only memory; ROM), 비휘발성 RAM(non-volatile random access memory; NVRAM), PROM(programmable read-only memory), EPROM(erasable programmable read-only memory), EEPROM(electrically erasable PROM), 플래시 메모리, 컴팩트 디스크(compact disc; CD), 자기 또는 광학 데이터 스토리지 디바이스 등과 같은 컴퓨터 판독가능 매체 상에 저장된 명령들로서 구현될 수도 있다. 명령들은 하나 이상의 프로세서들에 의해 실행 가능할 수도 있고, 프로세서(들)로 하여금 본 개시에 설명된 기능의 특정 양태들을 수행하게 할 수도 있다.
이상 설명된 실시예들이 하나 이상의 독립형 컴퓨터 시스템에서 현재 개시된 주제의 양태들을 활용하는 것으로 기술되었으나, 본 개시는 이에 한정되지 않고, 네트워크나 분산 컴퓨팅 환경과 같은 임의의 컴퓨팅 환경과 연계하여 구현될 수도 있다. 또 나아가, 본 개시에서 주제의 양상들은 복수의 프로세싱 칩들이나 장치들에서 구현될 수도 있고, 스토리지는 복수의 장치들에 걸쳐 유사하게 영향을 받게 될 수도 있다. 이러한 장치들은 PC들, 네트워크 서버들, 및 휴대용 장치들을 포함할 수도 있다.
본 명세서에서는 본 개시가 일부 실시예들과 관련하여 설명되었지만, 본 개시의 발명이 속하는 기술분야의 통상의 기술자가 이해할 수 있는 본 개시의 범위를 벗어나지 않는 범위에서 다양한 변형 및 변경이 이루어질 수 있다. 또한, 그러한 변형 및 변경은 본 명세서에 첨부된 특허청구의 범위 내에 속하는 것으로 생각되어야 한다.
Claims (20)
- 적어도 하나의 프로세서에 의해 수행되는 차량 위치 결정 방법에 있어서,차량의 제1 위치가 포함된 도로 영역 내의 복수의 의미론적(semantic) 객체를 나타내는 벡터맵을 획득하는 단계;상기 벡터맵을 비트맵으로 변환시키는 단계;상기 차량의 이미지 센서에 의해 촬상된 복수의 뷰 이미지를 이용하여 로컬 서브맵(submap)을 생성하는 단계; 및상기 변환된 비트맵과 상기 생성된 로컬 서브맵을 기초로 상기 차량의 제2 위치를 결정하는 단계를 포함하는, 차량 위치 결정 방법.
- 제1항에 있어서,상기 차량의 제1 위치가 포함된 도로 영역 내의 복수의 의미론적(semantic) 객체를 나타내는 벡터맵을 획득하는 단계는,상기 차량의 제1 위치가 포함된 특정 지역 내의 복수의 의미론적 객체를 나타내는 지역 벡터맵을 수신하는 단계; 및상기 수신된 지역 벡터맵으로부터 상기 차량의 제1 위치가 포함된 제1 영역을 선택함으로써, 상기 벡터맵을 획득하는 단계를 포함하는, 차량 위치 결정 방법.
- 제2항에 있어서,상기 벡터맵은 상기 복수의 의미론적 객체에 대응하는 클래스 값을 포함하고,상기 벡터맵을 비트맵으로 변환시키는 단계는,상기 생성된 벡터맵 중에서, 상기 차량의 제1 위치가 포함된 제2 영역을 선택함으로써, 상기 제2 영역이 포함된 서브 벡터맵을 생성하는 단계 - 상기 제2 영역은 상기 제1 영역보다 작음 -;상기 서브 벡터맵 내의 복수의 의미론적 객체 중에서, 상기 차량의 위치 추정에 사용될 하나 이상의 의미론적 객체를 선택하는 단계;상기 선택된 하나 이상의 의미론적 객체의 각각에 대응하는 클래스 값을 획득하는 단계; 및상기 획득된 클래스 값의 각각에 대응하는 이미지 형상을 이용하여 제1 비트맵을 생성하는 단계를 포함하는, 차량 위치 결정 방법.
- 제3항에 있어서,상기 벡터맵을 비트맵으로 변환시키는 단계는,상기 생성된 제1 비트맵 중에서, 상기 차량의 제1 위치가 포함된 제3 영역에 대응하는 제2 비트맵을 상기 비트맵으로서 선택하는 단계 - 상기 제3 영역은 상기 제2 영역보다 작음 -를 포함하는, 차량 위치 결정 방법.
- 제4항에 있어서,상기 차량의 제1 위치가 포함된 제3 영역에 대응하는 제2 비트맵을 상기 비트맵으로서 선택하는 단계는,상기 비트맵 내의 제3 영역의 적어도 일부 영역에 대한 정보를 획득하는 단계; 및상기 획득된 정보를 이용하여 상기 제2 비트맵을 생성하는 단계를 포함하는, 차량 위치 결정 방법.
- 제1항에 있어서,상기 차량의 이미지 센서는 상기 차량의 프론트 뷰를 촬상하도록 상기 차량에 배치되고,상기 차량의 이미지 센서에 의해 촬상된 복수의 뷰 이미지를 이용하여 로컬 서브맵을 생성하는 단계는,상기 차량의 이미지 센서에 의해 촬상된 복수의 프론트 뷰 이미지로부터 복수의 의미론적 객체를 추출하는 단계;상기 차량에 배치된 이미지 센서와 상기 도로의 지면 사이의 위치 관계에 기초하여 상기 추출된 복수의 의미론적 객체를 포함한 복수의 IPM(Inverse perspective mapping) 마스크를 생성하는 단계; 및상기 생성된 복수의 IPM 마스크를 이용하여 상기 로컬 서브맵을 생성하는 단계를 포함하는 차량 위치 결정 방법.
- 제6항에 있어서,상기 차량의 이미지 센서에 의해 촬상된 복수의 프론트 뷰 이미지로부터 복수의 의미론적 객체를 추출하는 단계는.상기 복수의 프론트 뷰 이미지의 각각을, 이미지로부터 의미론적 객체를 추출하도록 학습된 인공신경망에 입력하여, 상기 복수의 프론트 뷰 이미지 내의 복수의 픽셀에 대한 비트 값과 상기 복수의 프론트 뷰 이미지로부터 추출된 복수의 의미론적 객체에 대한 클래스 값을 출력하는 단계를 포함하는, 차량 위치 결정 방법.
- 제6항에 있어서,상기 차량은 상기 이미지 센서의 상대적 위치를 측정하도록 구성된 모션 센서를 포함하고,상기 생성된 복수의 IPM 마스크를 이용하여 상기 로컬 서브맵을 생성하는 단계는,상기 복수의 IPM 마스크를, 상기 모션 센서로부터 측정된 상기 이미지 센서의 상대적 위치가 반영된 복수의 IPM 이미지로 변환하는 단계; 및상기 변환된 복수의 IPM 이미지를 연결시킴으로써, 상기 로컬 서브맵을 생성하는 단계를 포함하는, 차량 위치 결정 방법.
- 제8항에 있어서,상기 차량의 이미지 센서에 의해 촬상된 복수의 뷰 이미지를 이용하여 로컬 서브맵을 생성하는 단계는,상기 복수의 프론트 뷰 이미지로부터 추출된 복수의 의미론적 객체 중에서, 하나 이상의 동적 객체를 선택하는 단계; 및상기 복수의 프론트 뷰 이미지 내에서, 상기 복수의 의미론적 객체에 대응하는 영역으로부터 상기 선택된 하나 이상의 동적 객체에 대응하는 영역을 제외한 영역을 기초로 복수의 참조 이미지를 생성하는 단계를 더 포함하고,상기 차량에 배치된 이미지 센서와 상기 도로의 지면 사이의 위치 관계에 기초하여 상기 추출된 복수의 의미론적 객체를 포함한 복수의 IPM 마스크를 생성하는 단계는,상기 생성된 복수의 참조 이미지를 이용하여 복수의 IPM 마스크에 대한 리파인먼트(refinement)를 수행하는 단계를 포함하는, 차량 위치 결정 방법.
- 제1항에 있어서,상기 변환된 비트맵과 상기 생성된 로컬 서브맵을 기초로 상기 차량의 제2 위치를 결정하는 단계는,상기 변환된 비트맵과 상기 생성된 로컬 서브맵을 비교함으로써, 상기 변환된 비트맵과 상기 생성된 로컬 서브맵의 차이를 결정하는 단계; 및상기 차량의 제1 위치 및 상기 결정된 차이를 기초로 상기 차량의 제2 위치를 추정하는 단계를 포함하는, 차량 위치 결정 방법.
- 제10항에 있어서,상기 변환된 비트맵과 상기 생성된 로컬 서브맵을 비교함으로써, 상기 변환된 비트맵과 상기 생성된 로컬 서브맵의 차이를 결정하는 단계는,상기 차량의 제1 위치로부터, X 축에서의 차이(translation), Y 축에서의 차이(translation), X 축 방향으로부터의 회전(rotation)을 나타내는 3-자유도 값을 추정하는 단계를 포함하는, 차량 위치 결정 방법.
- 제11항에 있어서,상기 X 축 방향으로부터 회전을 나타내는 값은 상기 차량이 바라보고 있는 방향에 대한 정보를 포함하는, 차량 위치 결정 방법.
- 제11항에 있어서,상기 변환된 비트맵에 대응하는 위치로부터 X축에서의 차이, Y 축에서의 차이, X 방향으로부터의 회전을 나타내는 3-자유도 값을 추정하는 단계는,상기 비트맵을 미리 결정된 복수의 각도를 이용하여 회전시킨 복수의 샘플 비트맵을 생성하는 단계; 및상기 복수의 샘플 비트맵의 각각과 상기 로컬 서브맵 사이의 상호 상관(cross correlation)를 결정하여 복수의 코스트 맵을 생성하는 단계;상기 생성된 복수의 코스트 맵을 기초로 상기 3-자유도 값을 추정하는 단계를 포함하는, 차량 위치 결정 방법,
- 제13항에 있어서.상기 생성된 복수의 코스트 맵을 기초로 상기 3-자유도 값을 추정하는 단계는,상기 생성된 복수의 코스트 맵을 연결하여 코스트 볼륨(cost volume)을 생성하는 단계 - 상기 코스트 볼륨은 추정된 복수의 3-자유도 값에 대한 유사도를 포함함 -; 및상기 코스트 볼륨에서 유사도가 가장 높은 3-자유도 값을 상기 3-자유도 값으로 추정하는 단계를 포함하는, 차량 위치 결정 방법.
- 제14항에 있어서,상기 차량의 제1 위치 및 상기 결정된 차이를 기초로 상기 차량의 제2 위치를 추정하는 단계는,상기 코스트 볼륨에서의 유사도가 가장 높은 3-자유도 값에 상기 코스트 볼륨의 3-자유도 값의 각각의 단위값에 해당하는 미리 결정된 크기를 적용함으로써, 상기 유사도가 가장 높은 3-자유도 값에 대한 조정값을 산출하는 단계; 및상기 차량의 제1 위치에 상기 산출된 조정값을 적용함으로써, 상기 차량의 제2 위치를 추정하는 단계를 포함하는,차량 위치 결정 방법.
- 제15항에 있어서,상기 추정된 차량의 제2 위치에 대한 신뢰도를 추출하는 단계를 더 포함하고,상기 추정된 차량의 제2 위치는 GPS 상의 좌표로 표시되는, 차량 위치 결정 방법.
- 제16항에 있어서.상기 추정된 차량의 제2 위치에 대한 신뢰도를 추출하는 단계는,상기 코스트 볼륨에서 미리 결정된 유사도 이상의 유사도를 가진 복수의 3-자유도 값에 대응하는 정보를 추출하는 단계;상기 추출된 복수의 3-자유도 값에 대응하는 정보에 상기 코스트 볼륨의 단위값에 대응하는 미리 결정된 크기를 적용함으로써, 상기 추출된 복수의 3-자유도 값에 대응하는 정보에 대한 조정값을 산출하는 단계;상기 추정된 차량의 제2 위치에 대응하는 GPS 좌표 상의 방위를 기준으로 상기 복수의 3-자유도 값에 대응하는 정보에 대한 조정값을 회전시키는 단계;상기 회전된 조정값에 대한 공분산 행렬을 산출하는 단계 및상기 산출된 공분산 행렬을 기초로 상기 차량의 제2 위치에 대한 신뢰도를 결정하는 단계를 포함하는,차량 위치 결정 방법.
- 제17항에 있어서,상기 공분산 행렬은 상기 추정된 차량의 제2 위치의 주변에 상기 회전된 복수의 3-자유도 값에 대응하는 정보에 대한 조정값의 분포를 나타내는, 차량 위치 결정 방법.
- 제1항 내지 제18항 중 어느 한 항에 따른 차량 위치 결정 방법을 컴퓨터에서 실행하기 위해 컴퓨터 판독 가능한 기록 매체에 저장된 컴퓨터 프로그램.
- 차량 위치 결정 시스템으로서,메모리; 및상기 메모리와 연결되고, 상기 메모리에 포함된 컴퓨터 판독 가능한 적어도 하나의 프로그램을 실행하도록 구성된 적어도 하나의 프로세서를 포함하고,상기 적어도 하나의 프로그램은,차량의 제1 위치가 포함된 도로 영역 내의 복수의 의미론적 객체를 나타내는 벡터맵을 획득하고,상기 벡터맵을 비트맵으로 변환시키고,상기 차량의 이미지 센서에 의해 촬상된 복수의 뷰 이미지를 이용하여 로컬 서브맵을 생성하고,상기 변환된 비트맵과 상기 생성된 로컬 서브맵을 기초로 상기 차량의 제2 위치를 결정하기 위한 명령어를 포함하는,차량 위치 결정 시스템.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022565783A JP7269453B2 (ja) | 2020-05-11 | 2021-02-01 | 車両位置決定方法及びシステム |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200055975A KR102218881B1 (ko) | 2020-05-11 | 2020-05-11 | 차량 위치 결정 방법 및 시스템 |
KR10-2020-0055975 | 2020-05-11 |
Related Child Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
US17/621,393 A-371-Of-International US11530078B2 (en) | 2020-10-27 | 2021-09-28 | Contents container |
US17/989,279 Continuation US11820561B2 (en) | 2020-10-27 | 2022-11-17 | Contents container |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2021230466A1 true WO2021230466A1 (ko) | 2021-11-18 |
Family
ID=74688059
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/KR2021/001318 WO2021230466A1 (ko) | 2020-05-11 | 2021-02-01 | 차량 위치 결정 방법 및 시스템 |
Country Status (3)
Country | Link |
---|---|
JP (2) | JP7269453B2 (ko) |
KR (2) | KR102218881B1 (ko) |
WO (1) | WO2021230466A1 (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113191323A (zh) * | 2021-05-24 | 2021-07-30 | 上海商汤临港智能科技有限公司 | 一种语义元素处理的方法、装置、电子设备及存储介质 |
CN118485738A (zh) * | 2024-07-16 | 2024-08-13 | 湖北芯擎科技有限公司 | Ipm图像生成方法、装置、设备及计算机可读存储介质 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102218881B1 (ko) * | 2020-05-11 | 2021-02-23 | 네이버랩스 주식회사 | 차량 위치 결정 방법 및 시스템 |
KR20230086073A (ko) | 2021-12-08 | 2023-06-15 | 위드로봇 주식회사 | 오브젝트의 삼차원 정보 특정 방법 및 그 시스템 |
KR102506411B1 (ko) * | 2022-02-21 | 2023-03-07 | 포티투닷 주식회사 | 차량의 위치 및 자세 추정 방법, 장치 및 이를 위한 기록매체 |
WO2024043772A1 (en) * | 2022-08-23 | 2024-02-29 | Samsung Electronics Co., Ltd. | Method and electronic device for determining relative position of one or more objects in image |
KR102544640B1 (ko) * | 2022-12-01 | 2023-06-21 | 한국건설기술연구원 | 차선 감지 및 예측 시스템, 장치 및 방법 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100516119B1 (ko) * | 2003-10-30 | 2005-09-21 | (유)하나지리정보 | 고정밀 위성 영상의 자동 분석 방법 |
US20190050648A1 (en) * | 2017-08-09 | 2019-02-14 | Ydrive, Inc. | Object localization within a semantic domain |
KR20190053355A (ko) * | 2017-11-10 | 2019-05-20 | 연세대학교 산학협력단 | 도로 기호 및 차선 인식 방법 및 장치 |
KR20190134231A (ko) * | 2018-05-25 | 2019-12-04 | 에스케이텔레콤 주식회사 | 차량의 위치 추정 장치, 차량의 위치 추정 방법, 및 이러한 방법을 수행하도록 프로그램된 컴퓨터 프로그램을 저장하는 컴퓨터 판독가능한 기록매체 |
KR20200039853A (ko) * | 2018-09-28 | 2020-04-17 | 전자부품연구원 | 벡터맵과 카메라를 이용한 자율주행 차량이 위치한 차선 추정 방법 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5589900B2 (ja) * | 2011-03-03 | 2014-09-17 | 株式会社豊田中央研究所 | 局所地図生成装置、グローバル地図生成装置、及びプログラム |
US8280414B1 (en) * | 2011-09-26 | 2012-10-02 | Google Inc. | Map tile data pre-fetching based on mobile device generated event analysis |
KR102218881B1 (ko) * | 2020-05-11 | 2021-02-23 | 네이버랩스 주식회사 | 차량 위치 결정 방법 및 시스템 |
-
2020
- 2020-05-11 KR KR1020200055975A patent/KR102218881B1/ko active IP Right Grant
-
2021
- 2021-02-01 JP JP2022565783A patent/JP7269453B2/ja active Active
- 2021-02-01 WO PCT/KR2021/001318 patent/WO2021230466A1/ko active Application Filing
- 2021-02-16 KR KR1020210020315A patent/KR102518257B1/ko active IP Right Grant
-
2023
- 2023-04-21 JP JP2023069947A patent/JP7481534B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100516119B1 (ko) * | 2003-10-30 | 2005-09-21 | (유)하나지리정보 | 고정밀 위성 영상의 자동 분석 방법 |
US20190050648A1 (en) * | 2017-08-09 | 2019-02-14 | Ydrive, Inc. | Object localization within a semantic domain |
KR20190053355A (ko) * | 2017-11-10 | 2019-05-20 | 연세대학교 산학협력단 | 도로 기호 및 차선 인식 방법 및 장치 |
KR20190134231A (ko) * | 2018-05-25 | 2019-12-04 | 에스케이텔레콤 주식회사 | 차량의 위치 추정 장치, 차량의 위치 추정 방법, 및 이러한 방법을 수행하도록 프로그램된 컴퓨터 프로그램을 저장하는 컴퓨터 판독가능한 기록매체 |
KR20200039853A (ko) * | 2018-09-28 | 2020-04-17 | 전자부품연구원 | 벡터맵과 카메라를 이용한 자율주행 차량이 위치한 차선 추정 방법 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113191323A (zh) * | 2021-05-24 | 2021-07-30 | 上海商汤临港智能科技有限公司 | 一种语义元素处理的方法、装置、电子设备及存储介质 |
CN118485738A (zh) * | 2024-07-16 | 2024-08-13 | 湖北芯擎科技有限公司 | Ipm图像生成方法、装置、设备及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP7269453B2 (ja) | 2023-05-08 |
KR102218881B1 (ko) | 2021-02-23 |
KR20210137893A (ko) | 2021-11-18 |
JP7481534B2 (ja) | 2024-05-10 |
JP2023099547A (ja) | 2023-07-13 |
JP2023516821A (ja) | 2023-04-20 |
KR102518257B1 (ko) | 2023-04-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021230466A1 (ko) | 차량 위치 결정 방법 및 시스템 | |
CN105512646B (zh) | 一种数据处理方法、装置及终端 | |
EP3759562B1 (en) | Camera based localization for autonomous vehicles | |
WO2020098316A1 (zh) | 基于视觉点云的语义矢量地图构建方法、装置和电子设备 | |
US11094112B2 (en) | Intelligent capturing of a dynamic physical environment | |
JP5435306B2 (ja) | 画像処理システム及び位置測位システム | |
CN109961522B (zh) | 图像投射方法、装置、设备和存储介质 | |
EP2208021B1 (en) | Method of and arrangement for mapping range sensor data on image sensor data | |
EP3660737A1 (en) | Method, apparatus, and system for providing image labeling for cross view alignment | |
EP3644013B1 (en) | Method, apparatus, and system for location correction based on feature point correspondence | |
CN109061703A (zh) | 用于定位的方法、装置、设备和计算机可读存储介质 | |
EP3671623B1 (en) | Method, apparatus, and computer program product for generating an overhead view of an environment from a perspective image | |
US11055862B2 (en) | Method, apparatus, and system for generating feature correspondence between image views | |
WO2021003487A1 (en) | Training data generation for dynamic objects using high definition map data | |
US20180211111A1 (en) | Unsupervised online learning of overhanging structure detector for map generation | |
CN108428254A (zh) | 三维地图的构建方法及装置 | |
JP2016157197A (ja) | 自己位置推定装置、自己位置推定方法およびプログラム | |
US10949707B2 (en) | Method, apparatus, and system for generating feature correspondence from camera geometry | |
WO2020156923A2 (en) | Map and method for creating a map | |
TWI725681B (zh) | 無人載具語意地圖建置系統及其建置方法 | |
US11461944B2 (en) | Region clipping method and recording medium storing region clipping program | |
CN110827340B (zh) | 地图的更新方法、装置及存储介质 | |
WO2022116572A1 (zh) | 一种目标定位方法及装置 | |
KR20220096162A (ko) | 항공영상 기반 도로 검출장치 및 그 방법 | |
WO2023282571A1 (ko) | 차량용 ar 디스플레이 장치 및 ar 서비스 플랫폼 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 21805317 Country of ref document: EP Kind code of ref document: A1 |
|
ENP | Entry into the national phase |
Ref document number: 2022565783 Country of ref document: JP Kind code of ref document: A |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 21805317 Country of ref document: EP Kind code of ref document: A1 |