WO2023013811A1 - 오브젝트 검출 방법 및 그 방법을 수행하는 전자 장치 - Google Patents
오브젝트 검출 방법 및 그 방법을 수행하는 전자 장치 Download PDFInfo
- Publication number
- WO2023013811A1 WO2023013811A1 PCT/KR2021/012884 KR2021012884W WO2023013811A1 WO 2023013811 A1 WO2023013811 A1 WO 2023013811A1 KR 2021012884 W KR2021012884 W KR 2021012884W WO 2023013811 A1 WO2023013811 A1 WO 2023013811A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- distance
- target object
- camera
- difference
- image
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 32
- 238000001514 detection method Methods 0.000 title claims description 25
- 235000004522 Pentaglottis sempervirens Nutrition 0.000 claims description 44
- 240000004050 Pentaglottis sempervirens Species 0.000 claims description 28
- 238000004590 computer program Methods 0.000 claims description 2
- 238000004891 communication Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 5
- 230000014509 gene expression Effects 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 201000007694 Athabaskan brainstem dysgenesis syndrome Diseases 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 208000020006 human HOXA1 syndromes Diseases 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000003973 paint Substances 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W30/00—Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units
- B60W30/14—Adaptive cruise control
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W40/00—Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
- B60W40/02—Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models related to ambient conditions
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/02—Control of position or course in two dimensions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T15/00—3D [Three Dimensional] image rendering
- G06T15/10—Geometric effects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/50—Depth or shape recovery
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30248—Vehicle exterior or interior
- G06T2207/30252—Vehicle exterior; Vicinity of vehicle
Definitions
- the following embodiments relate to a technique of detecting an object, and specifically to a technique of detecting an object using an image.
- Vehicles supporting advanced driver assistance systems (ADAS) or self-driving vehicles need to automatically detect objects around the vehicle in order to assist a user or create a path for the vehicle.
- a vehicle may generate an image by photographing the front of the vehicle using a camera of the vehicle. Roads, other vehicles, traffic lights, and people may be included in the generated image. The vehicle may detect an object in the image and assist the user or create a path based on the detected object.
- An embodiment may provide an object detection method performed by an electronic device.
- An embodiment may provide an electronic device for detecting an object in an image.
- an object detection method performed by an electronic device, includes a first distance to a first area of a target object in a first image captured at a first time point using a camera and a second area of the target object. Calculating a second distance to, a third distance to the first area of the target object in a second image captured at a second time using the camera, and a third distance to the second area of the target object 4 Calculating a distance, calculating a first difference between the first distance and the third distance, calculating a second difference between the second distance and the fourth distance, and calculating the first difference and the second difference. and determining whether the target object is a 3D object based on the difference between the two.
- the camera may be a monocular camera.
- the first area may include a lowermost end of the target object, and the second area may include an uppermost end of the target object.
- the object detection method may include detecting a first object in the first image, detecting a second object in the second image, and whether the first object and the second object are the same object as the target object.
- the step of determining whether or not may be further included.
- the method may include calculating the second distance to the second area of the target object in the image.
- the object detection method further includes acquiring a first attitude of the camera at the first time point, and generating a first bird's-eye view image by changing the viewpoint of the first image, the first attitude It may include generating a first bird's-eye view image by changing the viewpoint of the first image based on.
- Calculating a third distance to the first area of the target object and a fourth distance to the second area of the target object in a second image captured at a second time using the camera Obtaining a second attitude of the camera at 2 points of view, generating a second bird's-eye view image by changing the viewpoint of the second image based on the second attitude, It may include calculating the third distance to the first area of the target object, and calculating the fourth distance from the camera to the second area of the target object in the second bird's eye view image. there is.
- Determining whether the target object is a 3D object based on the first difference and the second difference may include determining that the target object is a 2D object when the first difference and the second difference are the same. steps may be included.
- Determining whether the target object is a 3D object based on the first difference and the second difference may include determining that the target object is a 3D object if the first difference and the second difference are not the same. It may include a decision-making step.
- the target object may be used to generate a path of the vehicle.
- an electronic device includes a memory in which a program for detecting an object is recorded, and a processor that executes the program, wherein the program includes a target in a first image captured at a first time using a camera. Calculating a first distance to a first area of an object and a second distance to a second area of the target object, wherein the first distance of the target object in a second image captured at a second viewpoint using the camera calculating a third distance to an area and a fourth distance to the second area of the target object; calculating a first difference between the first distance and the third distance; Calculating a second difference between distances, and determining whether the target object is a 3D object based on the first difference and the second difference may be performed.
- the electronic device may be included in a vehicle supporting autonomous driving or a vehicle supporting an advanced driver assistance system (ADAS).
- ADAS advanced driver assistance system
- the program may further perform a step of controlling the vehicle based on the target object.
- the electronic device may further include the camera that is a monocular camera.
- the first area may include a lowermost end of the target object, and the second area may include an uppermost end of the target object.
- the program includes detecting a first object in the first image, detecting a second object in the second image, and whether the first object and the second object are the same object as the target object. Further determining steps may be taken.
- the step of calculating a first distance to a first area of a target object and a second distance to a second area of the target object in a first image captured at the first time point using the camera Obtaining a first attitude of the camera in , Generating a first bird's-eye view image by changing a viewpoint of the first image based on the first attitude,
- the target object in the first bird's-eye view image from the camera It may include calculating the first distance to the first area of , and calculating the second distance from the camera to the second area of the target object in the first bird's-eye image.
- Determining whether the target object is a 3D object based on the first difference and the second difference may include determining that the target object is a 2D object when the first difference and the second difference are the same. and determining that the target object is a 3D object when the first difference and the second difference are not equal.
- an object detection method performed by an electronic device, includes calculating a first distance to a target feature point in a first image captured at a first point of view using a camera; Calculating a second distance to the target feature point in a second image captured at a second point of view, and based on the movement speed of the camera, the first distance, and the second distance, the object including the target feature point is 3D and determining whether it is an object.
- An object detection method performed by an electronic device may be provided.
- An electronic device for detecting an object in an image may be provided.
- FIG. 1 illustrates a two-dimensional object drawn on a ground according to an example.
- FIG. 2 illustrates a 2D object and a 3D object appearing in a subsequent image according to an example.
- 3 illustrates a projected object in an image represented by a 3D object according to an example.
- FIG. 4 illustrates an object in an image represented by a 2D object according to an example.
- FIG. 5 is a configuration diagram of an electronic device according to an embodiment.
- FIG. 6 is a flowchart of a method of detecting an object according to an exemplary embodiment.
- FIG. 7 is a flowchart of a method of determining whether objects in images are the same object according to an example.
- FIG. 8 is a flowchart of a method of calculating a first distance to a first area and a second distance to a second area of a target object in a first image according to an example.
- FIG 9 illustrates a first difference and a second difference calculated when a target object is a 3D object according to an example.
- FIG. 10 illustrates a first difference and a second difference calculated when a target object is a 2D object according to an example.
- FIG. 11 illustrates a method of determining whether a target object is a 3D object based on a first difference and a second difference according to an example.
- FIG. 12 illustrates a vehicle including an electronic device according to an example.
- FIG. 13 is a flowchart of a method of controlling a vehicle based on a 3D object according to an example.
- FIG. 14 is a flowchart of a method of detecting an object according to another embodiment.
- first or second may be used to describe various components, such terms should only be construed for the purpose of distinguishing one component from another.
- a first element may be termed a second element, and similarly, a second element may be termed a first element.
- FIG. 1 illustrates a two-dimensional object drawn on a ground according to an example.
- the deep learning method can detect not only the position and size of a pedestrian/vehicle through learning of an object detection model, but also a general object that may interfere while driving on the road using an image.
- an object detection model using an image of a monocular camera is a radar
- motion parallax may be used to determine whether the object 110 is a 2D object or a 3D object.
- Motion parallax is a phenomenon in which a near object appears to move fast and a distant object appears to move slowly when the observer moves, or when the observer is stationary and the distance between two objects moving at the same speed is different, a near object appears to move slowly. A phenomenon in which objects appear to move faster than distant objects.
- a camera for capturing images captures a plurality of images while moving with respect to an object
- FIG. 2 illustrates a 2D object and a 3D object appearing in a subsequent image according to an example.
- the object 210 may be detected based on a preceding image captured by a camera at a first time point. However, it may not be determined whether the object 210 is a 2D image or a 3D image using only the preceding image. Subsequently, the object 220 or the object 230 may be detected based on a subsequent image captured by the camera at a second point of view.
- the object 210 When the object 210 is a 3D object, it appears like the object 220 in subsequent images, and when the object 210 is a 2D object, it appears like the object 230 in subsequent images.
- whether the object is a 3D object may be determined through a comparison between the shape of the object 210 in the preceding image and the shape of the object 220 or 230 appearing in the subsequent image.
- 3 illustrates a projected object in an image represented by a 3D object according to an example.
- the object 313 onto which the 3D object is projected appears in the first image obtained by capturing a scene including the 3D object.
- the length (d ap -d) of the projected object 313 may vary according to the distance between the camera and the 3D object. As the distance between the camera and the 3D object increases, the length of the projected object 313 increases.
- the object 314 onto which the 3D object is projected appears in the second image obtained by capturing the scene including the 3D object at the second time. It may be the length of the projected object 314 (d' ap -d'). The length (d' ap -d') may be shorter than the length (d ap -d).
- FIG. 4 illustrates an object in an image represented by a 2D object according to an example.
- the 2D object 413 appears in the first image obtained by capturing the scene including the 2D object.
- the length (d ap -d) of the 2D object 413 may be invariant according to the distance between the camera and the 2D object.
- the 2D object 414 When the position of the camera moves in a direction closer to the 2D object, the 2D object 414 appears in the second image obtained by capturing a scene including the 2D object at the second time. It may be the length (d'' ap -d'') of the 2D object 414. Since the 2D object is a picture drawn on the ground, the length (d'' ap -d'') is equal to the length (d ap -d).
- FIG. 5 is a configuration diagram of an electronic device according to an embodiment.
- the electronic device 500 includes a communication unit 510, a processor 520, and a memory 530. Additionally, the electronic device 500 may further include a camera 540 .
- the electronic device 500 may be included in a vehicle.
- the electronic device 200 may be a device such as an electronic control unit (ECU) or a body control module (BCM). As another example, the electronic device 200 may be an independent device connected to the ECU/BCM.
- ECU electronice control unit
- BCM body control module
- the communication unit 510 is connected to the processor 520, the memory 530, and the camera 540 to transmit and receive data.
- the communication unit 510 may transmit/receive data by being connected to another external device.
- the expression “transmitting and receiving “A” may indicate transmitting and receiving “information or data indicating A”.
- the communication unit 510 may be implemented as circuitry within the electronic device 500 .
- the communication unit 510 may include an internal bus and an external bus.
- the communication unit 510 may be an element that connects the electronic device 500 and an external device.
- the communication unit 510 may be an interface.
- the communication unit 510 may receive data from an external device and transmit the data to the processor 520 and the memory 530 .
- the processor 520 processes data received by the communication unit 510 and data stored in the memory 530 .
- a “processor” may be a data processing device implemented in hardware having circuitry having a physical structure for executing desired operations.
- desired operations may include codes or instructions included in a program.
- a data processing unit implemented in hardware includes a microprocessor, a central processing unit, a processor core, a multi-core processor, and a multiprocessor. , Application-Specific Integrated Circuit (ASIC), and Field Programmable Gate Array (FPGA).
- ASIC Application-Specific Integrated Circuit
- FPGA Field Programmable Gate Array
- Processor 520 executes computer readable code (eg, software) stored in memory (eg, memory 530 ) and instructions invoked by processor 520 .
- computer readable code eg, software
- the memory 530 stores data received by the communication unit 510 and data processed by the processor 520 .
- the memory 530 may store a program (or application or software).
- the stored program may be a set of syntaxes that are coded to detect objects and are executable by the processor 520 .
- the memory 530 may include one or more of volatile memory, non-volatile memory and random access memory (RAM), flash memory, a hard disk drive, and an optical disk drive.
- volatile memory non-volatile memory and random access memory (RAM)
- flash memory non-volatile memory and random access memory (RAM)
- hard disk drive hard disk drive
- optical disk drive optical disk drive
- the memory 530 stores a command set (eg, software) for operating the electronic device 500 .
- a set of instructions for operating the electronic device 500 is executed by the processor 220 .
- the camera 540 creates an image by capturing a scene.
- Camera 540 may be a monocular camera.
- the camera 540 may be placed in front of the vehicle.
- the communication unit 510, the processor 520, the memory 530 and the camera 540 will be described in detail with reference to FIGS. 6 to 13 below.
- FIG. 6 is a flowchart of a method of detecting an object according to an exemplary embodiment.
- Steps 610 to 640 below are performed by the electronic device 500 described above with reference to FIG. 5 .
- the electronic device 500 uses a camera (eg, the camera 540) to a first distance to a first area of a target object in a first image captured at a first point of view and to a second area.
- a camera eg, the camera 540
- the first area may include the lowermost end of the target object
- the second area may include the uppermost end of the target object.
- the lowermost part may be a part connected to the ground.
- the first distance and the second distance may be calculated based on a first bird's eye view image generated by changing a viewpoint of the first image to a bird's eye view view.
- a method of calculating a first distance and a second distance based on a first bird's-eye image will be described in detail with reference to FIGS. 8 and 9 .
- the electronic device 500 calculates a third distance to the first area and a fourth distance to the second area of the target object in the second image captured at the second viewpoint using the camera.
- the second time may be a time after the first time. As the camera moves, the distance between the camera and the target object at the second time point may be closer than the distance between the camera and the target object at the first time point.
- the third distance and the fourth distance may be calculated based on a second bird's eye view image generated by changing a viewpoint of the second image to a bird's eye view view.
- step 630 the electronic device 500 calculates a first difference between the first distance and the third distance, and calculates a second difference between the second distance and the fourth distance.
- a method for calculating the first difference and the second difference will be described in detail with reference to FIG. 10 below.
- the electronic device 500 determines whether the target object is a 3D object based on the first difference and the second difference. For example, when the first difference and the second difference are the same, the target object may be determined as a 2D object. For example, when the first difference and the second difference are not the same, the target object may be determined as a 2D object.
- the first difference and the second difference are not the same, the target object may be determined as a 2D object.
- control of the vehicle may vary depending on whether the target object is a 3D object.
- a 3D object may be an avoidance target as a risk object.
- FIG. 7 is a flowchart of a method of determining whether objects in images are the same object according to an example.
- the target object before determining whether the target object is a 3D object, it should be determined whether the object in the first image and the object in the second image are the same object. For object matching, the following steps 710 to 750 may be further performed.
- step 710 the electronic device 500 generates a first image of the first time using a camera.
- the electronic device 500 detects a first object in the first image.
- One or more objects may be detected in the first image.
- the electronic device 500 may detect one or more objects in the first image using an object detection algorithm, and the object detection algorithm is not limited to a particular type.
- step 610 described above with reference to FIG. 6 may be performed.
- the electronic device 500 may calculate a first distance and a second distance for each of one or more detected objects.
- steps 710, 720 and 610 may be performed before step 730 is performed.
- step 730 the electronic device 500 generates a second image of a second view using a camera.
- step 740 the electronic device 500 detects a second object in the second image.
- One or more objects may be detected in the second image.
- step 620 described above with reference to FIG. 6 may be performed.
- the electronic device 500 may calculate a third distance and a fourth distance for each of one or more detected objects.
- the distances to the object calculated through step 620 are named as the third distance and the fourth distance, but a third image of a third time point, which is a time after the second time point, is generated, in relation to the third image Since the second image is a preceding image, the distances to the object calculated through step 620 may be treated as the first distance and the second distance.
- step 750 may be performed.
- step 750 the electronic device 500 determines whether the first object and the second object are the same object as the target object. That is, the electronic device 500 may determine whether the first object and the second object match.
- step 630 described above with reference to FIG. 6 may be performed.
- FIG. 8 is a flowchart of a method of calculating a first distance to a first area and a second distance to a second area of a target object in a first image according to an example.
- step 810 may be further performed before step 610 described above with reference to FIG. 6 is performed.
- the electronic device 500 may obtain a first posture of the camera at the first time.
- the pose of the camera may be obtained by a gyroscope or an acceleration sensor.
- Step 610 may include steps 820 to 840 below.
- the electronic device 500 may generate a first bird's eye view image by changing the view point of the first image to a bird's eye view view point.
- the first attitude of the camera or the obtained (or estimated) inclination of the ground may be additionally used.
- the electronic device 500 may calculate a first distance from a reference point (eg, the position of a camera) to a first area of the target object in the first bird's eye view image.
- a reference point eg, the position of a camera
- the electronic device 500 may calculate a second distance from the reference point to a second area of the target object in the first bird's eye view image.
- a method of calculating a first distance and a second distance based on a first bird's-eye view of a first image has been described with reference to FIG. 2 It can be replaced with a description for calculating the third distance and the fourth distance using a bird's-eye image.
- FIG 9 illustrates a first difference and a second difference calculated when a target object is a 3D object according to an example.
- a first distance 912 between a first area, which is the lowermost area of the target object 911 in the first bird's-eye view 910 at the first time, and a reference point is calculated, and a first distance 912, which is the uppermost area of the target object 911, is calculated.
- a second distance 913 between the second area and the reference point may be calculated.
- the reference point may be a position of a camera from a bird's eye view.
- the reference point may be the lowest coordinate of the bird's-eye view image.
- the third distance 922 between the reference point and the first area which is the lowermost area of the target object 921 in the second bird's-eye view 920 for the second view, is calculated, and A fourth distance 923 between the uppermost second area and the reference point may be calculated.
- the position of the target object 921 in the second bird's-eye image 920 may be located at a lower position than the position of the target object 911 in the first bird's-eye image 910 .
- the first difference 932 which is the difference between the first distance and the third distance
- the second difference 933 which is the difference between the second distance and the fourth distance
- the second difference 933 may be greater than the first difference 932 .
- FIG. 10 illustrates a first difference and a second difference calculated when a target object is a 2D object according to an example.
- a first distance 1012 between a first area, which is the lowermost area of the target object 1011 in the first bird's-eye view 1010 at the first time, and a reference point is calculated, and a first distance 1012, which is the uppermost area of the target object 1011, is calculated.
- a second distance 1013 between the second area and the reference point may be calculated.
- the third distance 1022 between the reference point and the first area which is the lowermost area of the target object 1021 in the second bird's-eye view 1020 for the second view, is calculated, and A fourth distance 1023 between the uppermost second area and the reference point may be calculated.
- the position of the target object 1021 in the second bird's-eye image 1020 may be located at a lower position than the position of the target object 1011 in the first bird's-eye image 1010.
- the first difference 1032 which is the difference between the first distance and the third distance
- the second difference 1033 which is the difference between the second distance and the fourth distance
- FIG. 11 illustrates a method of determining whether a target object is a 3D object based on a first difference and a second difference according to an example.
- the step 640 described above with reference to FIG. 6 may include the following steps 1110 to 1130.
- the electronic device 500 may determine whether the first difference and the second difference are the same.
- the electronic device 500 may determine that the target object is a 2D object when the first difference and the second difference are the same.
- the electronic device 500 may determine that the target object is a 3D object when the first difference and the second difference are not the same.
- FIG. 12 illustrates a vehicle including an electronic device according to an example.
- the electronic device 500 may be included in a vehicle 1200 supporting autonomous driving or a vehicle 1200 supporting an advanced driver assistance system (ADAS).
- ADAS advanced driver assistance system
- the vehicle 1200 may drive in an autonomous mode according to a perceived driving environment even when there is little or no input from a driver.
- the driving environment may be recognized through one or more sensors attached or installed in the vehicle 1200 .
- the one or more sensors may include camera, lidar, radar, and voice recognition sensors, and are not limited to the examples described.
- the driving environment may include roads, road conditions, lane types, presence or absence of surrounding vehicles, distance from adjacent vehicles, weather, presence or absence of obstacles, and the like, but is not limited to the described examples.
- the vehicle 1200 recognizes the driving environment and creates an autonomous driving route suitable for the driving environment.
- Self-driving vehicles control internal and external mechanical elements to follow the self-driving path.
- the vehicle 1200 may periodically generate an autonomous driving route.
- the vehicle 1200 may assist the driver in driving using advanced driver assistance systems (ADAS).
- ADAS includes the Autonomous Emergency Braking (AEB) system, which reduces or stops the speed on its own without the driver stepping on the brakes when there is a risk of collision, and the Lane Keep Assist system, which maintains the lane by adjusting the driving direction when the driver leaves the lane.
- AEB Autonomous Emergency Braking
- Lane Keep Assist which maintains the lane by adjusting the driving direction when the driver leaves the lane.
- LKAS LKAS
- ASCC Advanced Smart Cruise Control
- ABSD Blind-Spot Collision Avoidance Assistance
- AVM Around View Monitoring System
- the electronic device 500 included in the vehicle 1200 controls mechanical devices of the vehicle 1200 to autonomously drive or assist driver's driving, and may include ECUs, BCMs, and various types of controllers other than the described embodiments. It can be used for sensors, etc.
- FIG. 13 is a flowchart of a method of controlling a vehicle based on a 3D object according to an example.
- step 1310 when the electronic device 500 is included in the vehicle 1200 described above with reference to FIG. 12, after the step 640 described above with reference to FIG. 6 is performed, the following step 1310 can be performed
- the electronic device may control the vehicle based on the target object. For example, when the object in the image is determined to be a 3D object, the electronic device 500 may control the vehicle 1200 to avoid the 3D object.
- FIG. 14 is a flowchart of a method of detecting an object according to another embodiment.
- Steps 1410 to 1430 below are performed by the electronic device 500 described above with reference to FIGS. 5 to 13 .
- the electronic device 500 calculates a first distance to a target feature point in a first image captured at a first point of view using a camera (eg, the camera 540).
- a camera eg, the camera 540
- SIFT scale-invariant feature transform
- ORB descriptor may be used to detect a feature point in an image, and is not limited to the described embodiment.
- the electronic device 500 may convert the first image into a first bird's-eye view image to calculate the first distance. Descriptions related to this may be similarly applied to the descriptions of the steps 810 to 840 described above with reference to FIG. 8, and thus are omitted below.
- the electronic device 500 calculates a second distance to a target feature point in a second image captured at a second viewpoint using a camera.
- the electronic device 500 determines whether the object including the target feature point is a 3D object based on the moving speed of the camera, the first distance, and the second distance.
- the electronic device 500 may calculate a moving speed of the feature point.
- the moving speed of the feature point may be calculated based on the time between the first time and the second time and the difference between the first distance and the second distance.
- the electronic device 500 may acquire the moving speed of the camera.
- a moving speed of a vehicle including the electronic device 500 may correspond to a moving speed of a camera.
- the object including the corresponding feature point may be determined as a 2D object.
- a group of feature points may be considered as one object using clustering.
- the object including the corresponding feature point may be determined as a 3D object.
- the method according to the embodiment may be implemented in the form of program instructions that can be executed through various computer means and recorded on a computer readable medium.
- the computer readable medium may include program instructions, data files, data structures, etc. alone or in combination.
- Program commands recorded on the medium may be specially designed and configured for the embodiment or may be known and usable to those skilled in computer software.
- Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks and magnetic tapes, optical media such as CD-ROMs and DVDs, and magnetic media such as floptical disks.
- - includes hardware devices specially configured to store and execute program instructions, such as magneto-optical media, and ROM, RAM, flash memory, and the like.
- program instructions include high-level language codes that can be executed by a computer using an interpreter, as well as machine language codes such as those produced by a compiler.
- the hardware devices described above may be configured to operate as one or more software modules to perform the operations of the embodiments, and vice versa.
- Software may include a computer program, code, instructions, or a combination of one or more of the foregoing, which configures a processing device to operate as desired or processes independently or collectively. You can command the device.
- Software and/or data may be any tangible machine, component, physical device, virtual equipment, computer storage medium or device, intended to be interpreted by or provide instructions or data to a processing device. , or may be permanently or temporarily embodied in a transmitted signal wave.
- Software may be distributed on networked computer systems and stored or executed in a distributed manner.
- Software and data may be stored on one or more computer readable media.
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Automation & Control Theory (AREA)
- Transportation (AREA)
- Mechanical Engineering (AREA)
- Computer Graphics (AREA)
- Mathematical Physics (AREA)
- Geometry (AREA)
- Aviation & Aerospace Engineering (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Image Analysis (AREA)
Abstract
일 예에 따른, 오브젝트를 검출하기 위해, 제1 시각에서 촬영된 제1 영상 내의 타겟 오브젝트의 제1 영역까지의 제1 거리 및 제2 영역까지의 제2 거리를 계산하고, 제2 시각에서 촬영된 제2 영상 내의 타겟 오브젝트의 제1 영역까지의 제3 거리 및 제2 영역까지의 제4 거리를 계산하고, 제1 거리 및 제3 거리 간의 제1 차이를 계산하고, 제2 거리 및 제4 거리 간의 제2 차이를 계산하고, 제1 차이 및 제2 차이에 기초하여 타겟 오브젝트가 3차원 오브젝트인지 여부를 결정할 수 있다.
Description
아래의 실시예들은 오브젝트를 검출하는 기술에 관한 것이고, 구체적으로 영상을 이용하여 오브젝트를 검출하는 기술에 관한 것이다.
ADAS(Advanced Driver Assistance Systems)를 지원하는 차량 또는 자율주행 차량은, 사용자를 보조하거나 또는 차량의 경로를 생성하기 위해 차량 주변의 오브젝트를 자동으로 검출해야 한다. 예를 들어, 차량은 차량의 카메라를 이용하여 차량의 정면을 촬영함으로써 영상을 생성할 수 있다. 생성된 영상 내에는 도로, 다른 차량, 신호등 및 사람 등이 포함될 수 있다. 차량은 영상 내의 오브젝트를 검출하고, 검출된 오브젝트에 기초하여 사용자를 보조하거나, 경로를 생성할 수 있다.
일 실시예는 전자 장치에 의해 수행되는 오브젝트 검출 방법을 제공할 수 있다.
일 실시예는 영상 내의 오브젝트를 검출하는 전자 장치를 제공할 수 있다.
다만, 기술적 과제는 상술한 기술적 과제들로 한정되는 것은 아니며, 또 다른 기술적 과제들이 존재할 수 있다.
일 측면에 따른, 전자 장치에 의해 수행되는, 오브젝트 검출 방법은, 카메라를 이용하여 제1 시각에서 촬영된 제1 영상 내의 타겟 오브젝트의 제1 영역까지의 제1 거리 및 상기 타겟 오브젝트의 제2 영역까지의 제2 거리를 계산하는 단계, 상기 카메라를 이용하여 제2 시각에서 촬영된 제2 영상 내의 상기 타겟 오브젝트의 상기 제1 영역까지의 제3 거리 및 상기 타겟 오브젝트의 상기 제2 영역까지의 제4 거리를 계산하는 단계, 상기 제1 거리 및 상기 제3 거리 간의 제1 차이를 계산하고, 상기 제2 거리 및 상기 제4 거리 간의 제2 차이를 계산하는 단계, 및 상기 제1 차이 및 상기 제2 차이에 기초하여 상기 타겟 오브젝트가 3차원 오브젝트인지 여부를 결정하는 단계를 포함할 수 있다.
상기 카메라는 단안(mono) 카메라일 수 있다.
상기 제1 영역은 상기 타겟 오브젝트의 최하단을 포함하고, 상기 제2 영역은 상기 타겟 오브젝트의 최상단을 포함할 수 있다.
상기 오브젝트 검출 방법은, 상기 제1 영상 내의 제1 오브젝트를 검출하는 단계, 상기 제2 영상 내의 제2 오브젝트를 검출하는 단계, 및 상기 제1 오브젝트 및 상기 제2 오브젝트가 상기 타겟 오브젝트로서 동일한 오브젝트인지 여부를 결정하는 단계를 더 포함할 수 있다.
상기 카메라를 이용하여 상기 제1 시각에서 촬영된 제1 영상 내의 타겟 오브젝트의 제1 영역까지의 제1 거리 및 상기 타겟 오브젝트의 제2 영역까지의 제2 거리를 계산하는 단계는, 상기 제1 영상의 시점을 변경함으로써 제1 조감 영상을 생성하는 단계, 상기 카메라부터 상기 제1 조감 영상 내의 상기 타겟 오브젝트의 상기 제1 영역까지의 상기 제1 거리를 계산하는 단계, 및 상기 카메라부터 상기 제1 조감 영상 내의 상기 타겟 오브젝트의 상기 제2 영역까지의 상기 제2 거리를 계산하는 단계를 포함할 수 있다.
상기 오브젝트 검출 방법은, 상기 제1 시각에서의 상기 카메라의 제1 자세를 획득하는 단계를 더 포함하고, 상기 제1 영상의 시점을 변경함으로써 제1 조감 영상을 생성하는 단계는, 상기 제1 자세에 기초하여 상기 제1 영상의 시점을 변경함으로써 제1 조감 영상을 생성하는 단계를 포함할 수 있다.
상기 카메라를 이용하여 제2 시각에서 촬영된 제2 영상 내의 상기 타겟 오브젝트의 상기 제1 영역까지의 제3 거리 및 상기 타겟 오브젝트의 상기 제2 영역까지의 제4 거리를 계산하는 단계는, 상기 제2 시각에서의 상기 카메라의 제2 자세를 획득하는 단계, 상기 제2 자세에 기초하여 상기 제2 영상의 시점을 변경함으로써 제2 조감 영상을 생성하는 단계, 상기 카메라부터 상기 제2 조감 영상 내의 상기 타겟 오브젝트의 상기 제1 영역까지의 상기 제3 거리를 계산하는 단계, 및 상기 카메라부터 상기 제2 조감 영상 내의 상기 타겟 오브젝트의 상기 제2 영역까지의 상기 제4 거리를 계산하는 단계를 포함할 수 있다.
상기 제1 차이 및 상기 제2 차이에 기초하여 상기 타겟 오브젝트가 3차원 오브젝트인지 여부를 결정하는 단계는, 상기 제1 차이 및 상기 제2 차이가 동일한 경우 상기 타겟 오브젝트가 2차원 오브젝트인 것으로 결정하는 단계를 포함할 수 있다.
상기 제1 차이 및 상기 제2 차이에 기초하여 상기 타겟 오브젝트가 3차원 오브젝트인지 여부를 결정하는 단계는, 상기 제1 차이 및 상기 제2 차이가 동일하지 않은 경우 상기 타겟 오브젝트가 3차원 오브젝트인 것으로 결정하는 단계를 포함할 수 있다.
상기 전자 장치가 차량에 포함되고, 상기 타겟 오브젝트가 3차원 오브젝트로 결정된 경우, 상기 타겟 오브젝트는 차량의 경로를 생성하기 위해 이용될 수 있다.
다른 일 측면에 따른, 전자 장치는, 오브젝트를 검출하는 프로그램이 기록된 메모리, 및 상기 프로그램을 수행하는 프로세서를 포함하고, 상기 프로그램은, 카메라를 이용하여 제1 시각에서 촬영된 제1 영상 내의 타겟 오브젝트의 제1 영역까지의 제1 거리 및 상기 타겟 오브젝트의 제2 영역까지의 제2 거리를 계산하는 단계, 상기 카메라를 이용하여 제2 시각에서 촬영된 제2 영상 내의 상기 타겟 오브젝트의 상기 제1 영역까지의 제3 거리 및 상기 타겟 오브젝트의 상기 제2 영역까지의 제4 거리를 계산하는 단계, 상기 제1 거리 및 상기 제3 거리 간의 제1 차이를 계산하고, 상기 제2 거리 및 상기 제4 거리 간의 제2 차이를 계산하는 단계, 및 상기 제1 차이 및 상기 제2 차이에 기초하여 상기 타겟 오브젝트가 3차원 오브젝트인지 여부를 결정하는 단계를 수행할 수 있다.
상기 전자 장치는, 자율 주행을 지원하는 차량 또는 ADAS(advanced driver assistance system)을 지원하는 차량에 포함될 수 있다.
상기 프로그램은, 상기 타겟 오브젝트가 3차원 오브젝트로 결정된 경우, 상기 타겟 오브젝트에 기초하여 상기 차량을 제어하는 단계를 더 수행할 수 있다.
상기 전자 장치는, 단안 카메라인 상기 카메라를 더 포함할 수 있다.
상기 제1 영역은 상기 타겟 오브젝트의 최하단을 포함하고, 상기 제2 영역은 상기 타겟 오브젝트의 최상단을 포함할 수 있다.
상기 프로그램은, 상기 제1 영상 내의 제1 오브젝트를 검출하는 단계, 상기 제2 영상 내의 제2 오브젝트를 검출하는 단계, 및 상기 제1 오브젝트 및 상기 제2 오브젝트가 상기 타겟 오브젝트로서 동일한 오브젝트인지 여부를 결정하는 단계를 더 수행할 수 있다.
상기 카메라를 이용하여 상기 제1 시각에서 촬영된 제1 영상 내의 타겟 오브젝트의 제1 영역까지의 제1 거리 및 상기 타겟 오브젝트의 제2 영역까지의 제2 거리를 계산하는 단계는, 상기 제1 시각에서의 상기 카메라의 제1 자세를 획득하는 단계, 상기 제1 자세에 기초하여 상기 제1 영상의 시점을 변경함으로써 제1 조감 영상을 생성하는 단계, 상기 카메라부터 상기 제1 조감 영상 내의 상기 타겟 오브젝트의 상기 제1 영역까지의 상기 제1 거리를 계산하는 단계, 및 상기 카메라부터 상기 제1 조감 영상 내의 상기 타겟 오브젝트의 상기 제2 영역까지의 상기 제2 거리를 계산하는 단계를 포함할 수 있다.
상기 제1 차이 및 상기 제2 차이에 기초하여 상기 타겟 오브젝트가 3차원 오브젝트인지 여부를 결정하는 단계는, 상기 제1 차이 및 상기 제2 차이가 동일한 경우 상기 타겟 오브젝트가 2차원 오브젝트인 것으로 결정하는 단계, 및 상기 제1 차이 및 상기 제2 차이가 동일하지 않은 경우 상기 타겟 오브젝트가 3차원 오브젝트인 것으로 결정하는 단계를 포함할 수 있다.
또 다른 일 측면에 따른, 전자 장치에 의해 수행되는, 오브젝트 검출 방법은, 카메라를 이용하여 제1 시각에서 촬영된 제1 영상 내의 타겟 특징점까지의 제1 거리를 계산하는 단계, 상기 카메라를 이용하여 제2 시각에서 촬영된 제2 영상 내의 상기 타겟 특징점까지의 제2 거리를 계산하는 단계, 및 상기 카메라의 이동 속도, 제1 거리 및 제2 거리에 기초하여 상기 타겟 특징점을 포함하는 오브젝트가 3차원 오브젝트인지 여부를 결정하는 단계를 포함한다.
전자 장치에 의해 수행되는 오브젝트 검출 방법이 제공될 수 있다.
영상 내의 오브젝트를 검출하는 전자 장치가 제공될 수 있다.
도 1은 일 예에 따른 지면에 그려진 2차원 오브젝트를 도시한다.
도 2는 일 예에 따른 후속 영상에서 나타나는 2차원 오브젝트 및 3차원 오브젝트를 도시한다.
도 3은 일 예에 따른 3차원 오브젝트에 의해 나타나는 영상 내의 투사된 오브젝트를 도시한다.
도 4는 일 예에 따른 2차원 오브젝트에 의해 나타나는 영상 내의 오브젝트를 도시한다.
도 5는 일 실시 예에 따른 전자 장치의 구성도이다.
도 6은 일 실시 예에 따른 오브젝트를 검출하는 방법의 흐름도이다.
도 7은 일 예에 따른 영상들 내의 오브젝트들이 동일한 오브젝트인지 여부를 결정하는 방법의 흐름도이다.
도 8은 일 예에 따른 제1 영상 내의 타겟 오브젝트의 제1 영역까지의 제1 거리 및 제2 영역까지의 제2 거리를 계산하는 방법의 흐름도이다.
도 9는 일 예에 따른 타겟 오브젝트가 3차원 오브젝트인 경우, 계산되는 제1 차이 및 제2 차이를 도시한다.
도 10은 일 예에 따른 타겟 오브젝트가 2차원 오브젝트인 경우, 계산되는 제1 차이 및 제2 차이를 도시한다.
도 11은 일 예에 따른 제1 차이 및 제2 차이에 기초하여 타겟 오브젝트가 3차원 오브젝트인지 여부를 결정하는 방법을 도시한다.
도 12는 일 예에 따른 전자 장치를 포함하는 차량을 도시한다.
도 13은 일 예에 따른 3차원 오브젝트에 기초하여 차량을 제어하는 방법의 흐름도이다.
도 14는 다른 일 실시 예에 따른, 오브젝트를 검출하는 방법의 흐름도이다.
실시예들에 대한 특정한 구조적 또는 기능적 설명들은 단지 예시를 위한 목적으로 개시된 것으로서, 다양한 형태로 변경되어 구현될 수 있다. 따라서, 실제 구현되는 형태는 개시된 특정 실시예로만 한정되는 것이 아니며, 본 명세서의 범위는 실시예들로 설명한 기술적 사상에 포함되는 변경, 균등물, 또는 대체물을 포함한다.
제1 또는 제2 등의 용어를 다양한 구성요소들을 설명하는데 사용될 수 있지만, 이런 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 해석되어야 한다. 예를 들어, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소는 제1 구성요소로도 명명될 수 있다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 설명된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함으로 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 해당 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 갖는 것으로 해석되어야 하며, 본 명세서에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하, 실시예들을 첨부된 도면들을 참조하여 상세하게 설명한다. 첨부 도면을 참조하여 설명함에 있어, 도면 부호에 관계없이 동일한 구성 요소는 동일한 참조 부호를 부여하고, 이에 대한 중복되는 설명은 생략하기로 한다.
도 1은 일 예에 따른 지면에 그려진 2차원 오브젝트를 도시한다.
최근 자동차 업계에서도 자율 주행을 위한 하나의 방식으로서, 영상에 기반한 딥러닝 방식들이 사용되고 있는 추세이다. 딥러닝 방식은 오브젝트 검출 모델의 학습을 통한 보행자/차량의 위치, 크기 검출 뿐만 아니라, 도로 주행 중 방해가 될 수 있는 일반적인 오브젝트(general object)까지도 영상을 이용하여 검출할 수 있다.
일 예에 따르면, 아트 도로 또는 시차 도로와 같이 차량이 주행하는 도로상에 페인트 등을 이용하여 가상의 오브젝트를 그린 상황에서, 단안 카메라(mono camera)의 영상을 이용하는 오브젝트 검출 모델은 레이더(radar) 또는 라이다(lidar)와 같은 추가 센서의 도움 없이는 영상(100) 내의 오브젝트(110)가 지면 면에 존재하는 2차원 오브젝트(즉, 그림)인지 또는 지면 위에 솟아 있는 3차원 오브젝트인지를 결정하지 못할 수 있다.
일 실시 예에 따르면, 오브젝트(110)가 2차원 오브젝트인지 또는 3차원 오브젝트인지 여부를 결정하기 위해 운동 시차(motion parallax)가 이용될 수 있다. 운동 시차는 관찰자가 움직일 때 가까운 오브젝트는 빨리 움직이는 것처럼 보이고, 멀리 있는 오브젝트는 느리게 움직이는 것처럼 보이는 현상, 또는 관찰자는 고정되어 있는 상태에서 동일한 속도로 움직이는 두 오브젝트들 간의 거리가 다른 경우, 가까운 거리에 있는 오브젝트가 멀리 있는 오브젝트에 비해 더 빨리 움직이는 것처럼 보이는 현상을 의미한다.
일 실시 예에 따르면, 영상을 촬영하는 카메라가 오브젝트에 대해 이동하면서 복수의 영상들을 촬영하는 경우, 영상들 내의 오브젝트들의 크기를 비교함으로써 오브젝트가 높이가 있는 3차원 오브젝트인지 여부가 결정될 수 있다.
아래에서 도 2 내지 도 11을 참조하여 영상 내의 오브젝트를 검출하는 방법에 대해 상세히 설명된다.
도 2는 일 예에 따른 후속 영상에서 나타나는 2차원 오브젝트 및 3차원 오브젝트를 도시한다.
일 예에 따르면, 카메라에 의해 제1 시각에서 촬영된 선행 영상에 기초하여 오브젝트(210)가 검출될 수 있다. 다만, 선행 영상 만으로는 오브젝트(210)가 2차원 영상인지 또는 3차원 영상인지 여부가 결정되지 않을 수 있다. 이어서, 카메라에 의해 제2 시각에서 촬영된 후속 영상에 기초하여 오브젝트(220) 또는 오브젝트(230)가 검출될 수 있다.
오브젝트(210)가 3차원 오브젝트인 경우에는 후속 영상에서 오브젝트(220)와 같이 나타나고, 오브젝트(210)가 2차원 오브젝트인 경우에는 후속 영상에서 오브젝트(230)와 같이 나타난다.
일 실시예에 따르면, 선행 영상의 오브젝트(210)의 형태와 후속 영상에서 나타나는 오브젝트(220 또는 230)의 형태 간의 비교를 통해 오브젝트가 3차원 오브젝트인지 여부가 결정될 수 있다.
도 3은 일 예에 따른 3차원 오브젝트에 의해 나타나는 영상 내의 투사된 오브젝트를 도시한다.
제1 시각에서, 3차원 오브젝트를 포함하는 장면을 촬영한 제1 영상에는 3차원 오브젝트가 투사된 오브젝트(313)가 나타난다. 투사된 오브젝트(313)의 길이(dap-d)는 카메라 및 3차원 오브젝트 간의 거리에 따라 달라질 수 있다. 카메라 및 3차원 오브젝트 간의 거리가 멀수록 투사된 오브젝트(313)의 길이는 길어진다.
카메라의 위치가 3차원 오브젝트와 가까워지는 방향으로 이동한 경우, 제2 시각에서 3차원 오브젝트를 포함하는 장면을 촬영한 제2 영상에는 3차원 오브젝트가 투사된 오브젝트(314)가 나타난다. 투사된 오브젝트(314)의 길이(d'ap-d')일 수 있다. 길이(d'ap-d')는 길이(dap-d)에 비해 짧을 수 있다.
도 4는 일 예에 따른 2차원 오브젝트에 의해 나타나는 영상 내의 오브젝트를 도시한다.
제1 시각에서, 2차원 오브젝트를 포함하는 장면을 촬영한 제1 영상에는 2차원 오브젝트(413)가 나타난다. 2차원 오브젝트(413)의 길이(dap-d)는 카메라 및 2차원 오브젝트 간의 거리에 따라 불변할 수 있다.
카메라의 위치가 2차원 오브젝트와 가까워지는 방향으로 이동한 경우, 제2 시각에서 2차원 오브젝트를 포함하는 장면을 촬영한 제2 영상에는 2차원 오브젝트(414)가 나타난다. 2차원 오브젝트(414)의 길이(d''ap-d'')일 수 있다. 2차원 오브젝트는 지면에 그려진 그림이므로, 길이(d''ap-d'')는 길이(dap-d)와 동일하다.
도 5는 일 실시 예에 따른 전자 장치의 구성도이다.
일 측면에 따른, 전자 장치(500)는 통신부(510), 프로세서(520), 및 메모리(530)를 포함한다. 추가적으로 전자 장치(500)는 카메라(540)를 더 포함할 수 있다. 전자 장치(500)는 차량 내에 포함될 수 있다. 예를 들어, 전자 장치(200)는 ECU(electronic control unit) 또는 BCM(body control module)과 같은 장치일 수 있다. 다른 예로, 전자 장치(200)는 ECU/BCM과 연결된 독립적인 장치일 수 있다.
통신부(510)는 프로세서(520), 메모리(530) 및 카메라(540)와 연결되어 데이터를 송수신한다. 통신부(510)는 외부의 다른 장치와 연결되어 데이터를 송수신할 수 있다. 이하에서 "A"를 송수신한다라는 표현은 "A를 나타내는 정보(information) 또는 데이터"를 송수신하는 것을 나타낼 수 있다.
통신부(510)는 전자 장치(500) 내의 회로망(circuitry)으로 구현될 수 있다. 예를 들어, 통신부(510)는 내부 버스(internal bus) 및 외부 버스(external bus)를 포함할 수 있다. 다른 예로, 통신부(510)는 전자 장치(500)와 외부의 장치를 연결하는 요소일 수 있다. 통신부(510)는 인터페이스(interface)일 수 있다. 통신부(510)는 외부의 장치로부터 데이터를 수신하여, 프로세서(520) 및 메모리(530)에 데이터를 전송할 수 있다.
프로세서(520)는 통신부(510)가 수신한 데이터 및 메모리(530)에 저장된 데이터를 처리한다. "프로세서"는 목적하는 동작들(desired operations)을 실행시키기 위한 물리적인 구조를 갖는 회로를 가지는 하드웨어로 구현된 데이터 처리 장치일 수 있다. 예를 들어, 목적하는 동작들은 프로그램에 포함된 코드(code) 또는 인스트럭션들(instructions)을 포함할 수 있다. 예를 들어, 하드웨어로 구현된 데이터 처리 장치는 마이크로프로세서(microprocessor), 중앙 처리 장치(central processing unit), 프로세서 코어(processor core), 멀티-코어 프로세서(multi-core processor), 멀티프로세서(multiprocessor), ASIC(Application-Specific Integrated Circuit), FPGA(Field Programmable Gate Array)를 포함할 수 있다.
프로세서(520)는 메모리(예를 들어, 메모리(530))에 저장된 컴퓨터로 읽을 수 있는 코드(예를 들어, 소프트웨어) 및 프로세서(520)에 의해 유발된 인스트럭션들을 실행한다.
메모리(530)는 통신부(510)가 수신한 데이터 및 프로세서(520)가 처리한 데이터를 저장한다. 예를 들어, 메모리(530)는 프로그램(또는 어플리케이션, 소프트웨어)을 저장할 수 있다. 저장되는 프로그램은 오브젝트를 검출할 수 있도록 코딩되어 프로세서(520)에 의해 실행 가능한 신텍스(syntax)들의 집합일 수 있다.
일 측면에 따르면, 메모리(530)는 하나 이상의 휘발성 메모리, 비휘발성 메모리 및 RAM(Random Access Memory), 플래시 메모리, 하드 디스크 드라이브 및 광학 디스크 드라이브를 포함할 수 있다.
메모리(530)는 전자 장치(500)를 동작 시키는 명령어 세트(예를 들어, 소프트웨어)를 저장한다. 전자 장치(500)를 동작 시키는 명령어 세트는 프로세서(220)에 의해 실행된다.
카메라(540)는 장면을 촬영함으로써 영상을 생성한다. 카메라(540)는 단안 카메라일 수 있다. 예를 들어, 카메라(540)는 차량의 전방에 배치될 수 있다.
통신부(510), 프로세서(520), 메모리(530) 및 카메라(540)에 대해, 아래에서 도 6 내지 도 13을 참조하여 상세히 설명된다.
도 6은 일 실시 예에 따른 오브젝트를 검출하는 방법의 흐름도이다.
아래의 단계들(610 내지 640)은 도 5를 참조하여 전술된 전자 장치(500)에 의해 수행된다.
단계(610)에서, 전자 장치(500)는 카메라(예: 카메라(540))를 이용하여 제1 시각에서 촬영된 제1 영상 내의 타겟 오브젝트의 제1 영역까지의 제1 거리 및 제2 영역까지의 제2 거리를 계산한다. 예를 들어, 제1 영역은 타겟 오브젝트의 최하단을 포함하고, 제2 영역은 타겟 오브젝트의 최상단을 포함할 수 있다. 최하단은 지면과 연결된 부분일 수 있다.
일 실시 예에 따르면, 제1 거리 및 제2 거리는 제1 영상의 시점을 조감 시점으로 변경함으로써 생성된 제1 조감 영상에 기초하여 계산될 수 있다. 아래에서 도 8 및 9를 참조하여 제1 조감 영상에 기초하여 제1 거리 및 제2 거리를 계산하는 방법이 상세히 설명된다.
단계(620)에서, 전자 장치(500)는 카메라를 이용하여 제2 시각에서 촬영된 제2 영상 내의 타겟 오브젝트의 제1 영역까지의 제3 거리 및 제2 영역까지의 제4 거리를 계산한다. 제2 시각은 제1 시각 이후의 시각일 수 있다. 카메라가 이동함으로써 제1 시각에서 카메라 및 타겟 오브젝트 간의 거리 보다 제2 시각에서 카메라 및 타겟 오브젝트 간의 거리가 가까워질 수 있다.
일 실시 예에 따르면, 제3 거리 및 제4 거리는 제2 영상의 시점을 조감 시점으로 변경함으로써 생성된 제2 조감 영상에 기초하여 계산될 수 있다.
단계(630)에서, 전자 장치(500)는 제1 거리 및 제3 거리 간의 제1 차이를 계산하고, 제2 거리 및 제4 거리 간의 제2 차이를 계산한다. 제1 차이 및 제2 차이를 계산하는 방법에 대해, 아래에서 도 10을 참조하여 상세히 설명된다.
단계(640)에서, 전자 장치(500)는 제1 차이 및 제2 차이에 기초하여 타겟 오브젝트가 3차원 오브젝트인지 여부를 결정한다. 예를 들어, 제1 차이 및 제2 차이가 동일한 경우, 타겟 오브젝트가 2차원 오브젝트로 결정될 수 있다. 예를 들어, 제1 차이 및 제2 차이가 동일하지 않은 경우, 타겟 오브젝트가 2차원 오브젝트로 결정될 수 있다. 아래에서, 도 11을 참조하여 타겟 오브젝트가 3차원 오브젝트인지 여부를 결정하는 방법에 대해 상세히 설명된다.
일 실시 예에 따르면, 전자 장치(500)가 차량에 포함된 경우, 타겟 오브젝트가 3차원 오브젝트인지 여부에 따라 차량의 제어가 달라질 수 있다. 예를 들어, 3차원 오브젝트는 위험 오브젝트로서 회피 대상일 수 있다.
아래에서 도 12 내지 13을 참조하여, 차량을 제어하는 방법에 대해 상세히 설명된다.
도 7은 일 예에 따른 영상들 내의 오브젝트들이 동일한 오브젝트인지 여부를 결정하는 방법의 흐름도이다.
일 예에 따르면, 타겟 오브젝트가 3차원 오브젝트인지 여부를 결정하기 전에, 제1 영상 내의 오브젝트와 제2 영상 내의 오브젝트가 동일한 오브젝트인지 여부가 결정되어야 한다. 오브젝트 매칭을 위해 아래의 단계들(710 내지 750)이 더 수행될 수 있다.
단계(710)에서, 전자 장치(500)는 카메라를 이용하여 제1 시각의 제1 영상을 생성한다.
단계(720)에서, 전자 장치(500)는 제1 영상 내의 제1 오브젝트를 검출한다. 제1 영상 내에서 검출되는 오브젝트는 하나 이상일 수 있다. 예를 들어, 전자 장치(500)는 오브젝트 검출 알고리즘을 이용하여 제1 영상 내의 하나 이상의 오브젝트를 검출할 수 있고, 오브젝트 검출 알고리즘은 특별한 종류로 한정되지 않는다.
일 예에 따르면, 단계(720)가 수행된 후, 도 6을 참조하여 전술된 단계(610)가 수행될 수 있다. 예를 들어, 단계(610)에서, 전자 장치(500)는 검출된 하나 이상의 오브젝트들 각각에 대해 제1 거리 및 제2 거리를 계산할 수 있다.
일 예에 따르면, 단계들(710, 720, 610)은 단계(730)가 수행되기 전에 수행될 수 있다.
단계(730)에서, 전자 장치(500)는 카메라를 이용하여 제2 시각의 제2 영상을 생성한다.
단계(740)에서, 전자 장치(500)는 제2 영상 내의 제2 오브젝트를 검출한다. 제2 영상 내에서 검출되는 오브젝트는 하나 이상일 수 있다.
일 예에 따르면, 단계(740)가 수행된 후, 도 6을 참조하여 전술된 단계(620)가 수행될 수 있다. 예를 들어, 단계(620)에서, 전자 장치(500)는 검출된 하나 이상의 오브젝트들 각각에 대해 제3 거리 및 제4 거리를 계산할 수 있다. 단계(620)를 통해 계산되는 오브젝트에 대한 거리들이 제3 거리 및 제4 거리로 명명되었으나, 제2 시각 이후의 시각인 제3 시각의 제3 영상이 생성된 경우, 제3 영상과의 관계에서 제2 영상은 선행 영상이므로, 단계(620)를 통해 계산되는 오브젝트에 대한 거리들이 제1 거리 및 제2 거리로 취급될 수 있다.
일 예에 따르면, 단계(620)가 수행된 후, 단계(750)가 수행될 수 있다.
단계(750)에서, 전자 장치(500)는 제1 오브젝트 및 제2 오브젝트가 타겟 오브젝트로서 동일한 오브젝트인지 여부를 결정한다. 즉, 전자 장치(500)는 제1 오브젝트 및 제2 오브젝트가 매칭되는지 여부를 결정할 수 있다. 제1 오브젝트 및 제2 오브젝트가 매칭되는 경우, 도 6을 참조하여 전술된 단계(630)가 수행될 수 있다.
도 8은 일 예에 따른 제1 영상 내의 타겟 오브젝트의 제1 영역까지의 제1 거리 및 제2 영역까지의 제2 거리를 계산하는 방법의 흐름도이다.
일 실시 예에 따르면, 도 6을 참조하여 전술된 단계(610)가 수행되기 전에 단계(810)가 더 수행될 수 있다.
단계(810)에서, 전자 장치(500)는 제1 시각에서의 카메라의 제1 자세를 획득할 수 있다. 예를 들어, 카메라의 자세는 자이로스코프 또는 가속도 센서에 의해 획득될 수 있다.
단계(610)는 아래의 단계들(820 내지 840)을 포함할 수 있다.
단계(820)에서, 전자 장치(500)는 제1 영상의 시점을 조감 시점으로 변경함으로써 제1 조감 영상을 생성할 수 있다. 정확한 제1 조감 영상을 생성하기 위해 카메라의 제1 자세 또는 획득(또는, 추정)된 지면의 경사도 등이 추가로 이용될 수 있다.
단계(830)에서, 전자 장치(500)는 기준점(예: 카메라의 위치)으로부터 제1 조감 영상 내의 타겟 오브젝트의 제1 영역까지의 제1 거리를 계산할 수 있다.
단계(840)에서, 전자 장치(500)는 기준점으로부터 제1 조감 영상 내의 타겟 오브젝트의 제2 영역까지의 제2 거리를 계산할 수 있다.
도 8을 참조하여 제1 영상의 제1 조감 영상에 기초하여 제1 거리 및 제2 거리를 계산하는 방법이 설명되었으나, 상기의 설명은 제2 영상에 기초하여 제2 조감 영상을 생성하고, 제2 조감 영상을 이용하여 제3 거리 및 제4 거리를 계산하기 위한 설명으로 대체될 수 있다.
도 9는 일 예에 따른 타겟 오브젝트가 3차원 오브젝트인 경우, 계산되는 제1 차이 및 제2 차이를 도시한다.
제1 시각에 대한 제1 조감 영상(910) 내의 타겟 오브젝트(911)의 최하단의 영역인 제1 영역과 기준점 간의 제1 거리(912)가 계산되고, 타겟 오브젝트(911)의 최상단의 영역인 제2 영역과 기준점 간의 제2 거리(913)가 계산될 수 있다. 예를 들어, 기준점은 조감 시점에서의 카메라의 위치일 수 있다. 다른 예로, 기준점은 조감 영상의 가장 하단 좌표일 수 있다.
상기와 유사하게, 제2 시각에 대한 제2 조감 영상(920) 내의 타겟 오브젝트(921)의 최하단의 영역인 제1 영역과 기준점 간의 제3 거리(922)가 계산되고, 타겟 오브젝트(921)의 최상단의 영역인 제2 영역과 기준점 간의 제4 거리(923)가 계산될 수 있다. 카메라가 실제 오브젝트와 가까워 짐에 따라 제2 조감 영상(920) 내의 타겟 오브젝트(921)의 위치는 제1 조감 영상(910) 내의 타겟 오브젝트(911)의 위치보다 상대적으로 하단에 위치할 수 있다.
실제 오브젝트가 3차원 오브젝트인 경우에는 운동 시차가 나타나므로, 제1 거리 및 제3 거리 간의 차이인 제1 차이(932)와 제2 거리 및 제4 거리 간의 차이인 제2 차이(933)는 다르게 나타날 수 있다. 예를 들어, 제1 차이(932) 보다 제2 차이(933)가 더 클 수 있다.
도 10은 일 예에 따른 타겟 오브젝트가 2차원 오브젝트인 경우, 계산되는 제1 차이 및 제2 차이를 도시한다.
제1 시각에 대한 제1 조감 영상(1010) 내의 타겟 오브젝트(1011)의 최하단의 영역인 제1 영역과 기준점 간의 제1 거리(1012)가 계산되고, 타겟 오브젝트(1011)의 최상단의 영역인 제2 영역과 기준점 간의 제2 거리(1013)가 계산될 수 있다.
상기와 유사하게, 제2 시각에 대한 제2 조감 영상(1020) 내의 타겟 오브젝트(1021)의 최하단의 영역인 제1 영역과 기준점 간의 제3 거리(1022)가 계산되고, 타겟 오브젝트(1021)의 최상단의 영역인 제2 영역과 기준점 간의 제4 거리(1023)가 계산될 수 있다. 카메라가 실제 오브젝트와 가까워 짐에 따라 제2 조감 영상(1020) 내의 타겟 오브젝트(1021)의 위치는 제1 조감 영상(1010) 내의 타겟 오브젝트(1011)의 위치보다 상대적으로 하단에 위치할 수 있다.
실제 오브젝트가 2차원 오브젝트인 경우에는 운동 시차가 나타나지 않으므로, 제1 거리 및 제3 거리 간의 차이인 제1 차이(1032)와 제2 거리 및 제4 거리 간의 차이인 제2 차이(1033)는 동일할 수 있다.
도 11은 일 예에 따른 제1 차이 및 제2 차이에 기초하여 타겟 오브젝트가 3차원 오브젝트인지 여부를 결정하는 방법을 도시한다.
일 실시 예에 따르면, 도 6을 참조하여 전술된 단계(640)는 아래의 단계들(1110 내지 1130)을 포함할 수 있다.
단계(1110)에서, 전자 장치(500)는 제1 차이 및 제2 차이가 동일한지 여부를 결정할 수 있다.
단계(1120)에서, 전자 장치(500)는 제1 차이 및 제2 차이가 동일한 경우, 타겟 오브젝트가 2차원 오브젝트인 것으로 결정할 수 있다.
단계(1130)에서, 전자 장치(500)는 제1 차이 및 제2 차이가 동일하지 않은 경우, 타겟 오브젝트가 3차원 오브젝트인 것으로 결정할 수 있다.
도 12는 일 예에 따른 전자 장치를 포함하는 차량을 도시한다.
일 실시 예에 따르면, 전자 장치(500)는 자율 주행을 지원하는 차량(1200) 또는 ADAS(advanced driver assistance system)을 지원하는 차량(1200)에 포함될 수 있다.
일 측면에 따른, 차량(1200)은 운전자로부터의 입력이 거의 없거나 또는 전혀 없는 상황에서도, 인지된 주행 환경에 따라서 자율 모드(autonomous mode)로 주행할 수 있다. 주행 환경은 차량(1200)에 부착 또는 설치된 하나 이상의 센서들을 통해 인지될 수 있다. 예를 들어, 하나 이상의 센서들은 카메라, 라이다, 레이더 및 음성 인식 센서들을 포함할 수 있고, 기재된 예들로 제한되는 것은 아니다. 주행 환경은 도로, 도로의 상태, 차선의 종류, 주변 차량의 유무, 근접한 차량과의 거리, 날씨, 장애물의 유무 등을 포함할 수 있고, 기재된 예들로 제한되는 것은 아니다.
차량(1200)은 주행 환경을 인식하고, 주행 환경에 적합한 자율 주행 경로를 생성한다. 자율 주행 경로를 따라가도록 자율 주행 차량은 내외부의 기계적인 요소들을 제어한다. 차량(1200)은 자율 주행 경로를 주기적으로 생성할 수 있다.
다른 일 측면에 따른, 차량(1200)은 어드밴스드 운전자 지원 시스템(advanced driver assistance systems: ADAS)을 이용하여 운전자의 운전을 보조할 수 있다. ADAS는 충돌 위험시 운전자가 제동장치를 밟지 않아도 스스로 속도를 줄이거나 멈추는 자동 긴급제동 시스템(Autonomous Emergency Braking: AEB), 차선 이탈 시 주행 방향을 조절해 차선을 유지하는 주행 조향보조 시스템(Lane Keep Assist System: LKAS), 사전에 정해 놓은 속도로 달리면서도 앞차와 간격을 알아서 유지하는 어드밴스드 스마트 크루즈 컨트롤(Advanced Smart Cruise Control: ASCC), 사각지대 충돌 위험을 감지해 안전한 차로 변경을 돕는 후측방 충돌 회피 지원 시스템(Active Blind Spot Detection: ABSD), 차량 주변 상황을 시각적으로 보여주는 어라운드 뷰 모니터링 시스템(Around View Monitor: AVM) 등을 포함한다.
차량(1200)에 포함된 전자 장치(500)는 차량(1200)의 기계적 장치를 제어하여, 자율 주행하거나 운전자의 운전을 보조할 수 있고, 기재된 실시예 이외의 ECU, BCM 및 다양한 종류의 컨트롤러나 센서 등에 사용될 수 있다.
도 13은 일 예에 따른 3차원 오브젝트에 기초하여 차량을 제어하는 방법의 흐름도이다.
일 실시 예에 따르면, 전자 장치(500)가 도 12를 참조하여 전술된 차량(1200)에 포함된 경우, 도 6을 참조하여 전술된 단계(640)가 수행된 후 아래의 단계(1310)가 수행될 수 있다.
단계(1310)에서, 전자 장치는 타겟 오브젝트가 3차원 오브젝트로 결정된 경우 타겟 오브젝트에 기초하여 차량을 제어할 수 있다. 예를 들어, 전자 장치(500)는 영상 내의 오브젝트가 3차원 오브젝트로 결정되는 경우, 3차원 오브젝트를 회피하도록 차량(1200)을 제어할 수 있다.
도 14는 다른 일 실시 예에 따른, 오브젝트를 검출하는 방법의 흐름도이다.
아래의 단계들(1410 내지 1430)은 도 5 내지 도 13을 참조하여 전술된 전자 장치(500)에 의해 수행된다.
단계(1410)에서, 전자 장치(500)는 카메라(예: 카메라(540))를 이용하여 제1 시각에서 촬영된 제1 영상 내의 타겟 특징점까지의 제1 거리를 계산한다. 예를 들어, 영상 내의 특징점을 검출하기 위해 SIFT(scale-invariant feature transform) 또는 ORB descriptor 가 이용될 수 있고, 기재된 실시예로 한정되지 않는다.
일 실시 예에 따르면, 전자 장치(500)는 제1 거리를 계산하기 위해 제1 영상을 제1 조감 영상으로 변환할 수 있다. 이와 관련된 설명은 도 8을 참조하여 전술된 단계들(810 내지 840)에 대한 설명이 유사하게 적용될 수 있으므로, 이하에서 생략한다.
단계(1420)에서, 전자 장치(500)는 카메라를 이용하여 제2 시각에서 촬영된 제2 영상 내의 타겟 특징점까지의 제2 거리를 계산한다.
단계(1430)에서, 전자 장치(500)는 카메라의 이동 속도, 제1 거리 및 제2 거리에 기초하여 타겟 특징점을 포함하는 오브젝트가 3차원 오브젝트인지 여부를 결정한다.
전자 장치(500)는 제1 영상 내의 특징점 및 제2 영상 내의 특징점이 매칭된 경우, 특징점이 이동한 속도를 계산할 수 있다. 예를 들어, 제1 시각 및 제2 시각 간의 시간과 제1 거리 및 제2 거리 간의 차이에 기초하여 특징점이 이동한 속도가 계산될 수 있다.
전자 장치(500)는 카메라의 이동 속도를 획득할 수 있다. 예를 들어, 전자 장치(500)를 포함하는 차량의 이동 속도가 카메라의 이동 속도에 대응할 수 있다.
일 실시 예에 따르면, 카메라의 이동 속도와 특징점의 이동 속도가 동일한 경우 해당 특징점을 포함하는 오브젝트가 2차원 오브젝트로 결정될 수 있다. 예를 들어, 클러스터링을 이용하여 특징점들의 그룹이 하나의 오브젝트로 고려될 수 있다.
일 실시 예에 따르면, 카메라의 이동 속도와 특징점의 이동 속도가 동일하지 않은 경우 해당 특징점을 포함하는 오브젝트가 3차원 오브젝트로 결정될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
이상과 같이 실시예들이 비록 한정된 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기를 기초로 다양한 기술적 수정 및 변형을 적용할 수 있다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 청구범위의 범위에 속한다.
Claims (20)
- 전자 장치에 의해 수행되는, 오브젝트 검출 방법은,카메라를 이용하여 제1 시각에서 촬영된 제1 영상 내의 타겟 오브젝트의 제1 영역까지의 제1 거리 및 상기 타겟 오브젝트의 제2 영역까지의 제2 거리를 계산하는 단계;상기 카메라를 이용하여 제2 시각에서 촬영된 제2 영상 내의 상기 타겟 오브젝트의 상기 제1 영역까지의 제3 거리 및 상기 타겟 오브젝트의 상기 제2 영역까지의 제4 거리를 계산하는 단계;상기 제1 거리 및 상기 제3 거리 간의 제1 차이를 계산하고, 상기 제2 거리 및 상기 제4 거리 간의 제2 차이를 계산하는 단계; 및상기 제1 차이 및 상기 제2 차이에 기초하여 상기 타겟 오브젝트가 3차원 오브젝트인지 여부를 결정하는 단계를 포함하는,오브젝트 검출 방법.
- 제1항에 있어서,상기 카메라는 단안(mono) 카메라인,3차원 오브젝트 검출 방법.
- 제1항에 있어서,상기 제1 영역은 상기 타겟 오브젝트의 최하단을 포함하고,상기 제2 영역은 상기 타겟 오브젝트의 최상단을 포함하는,3차원 오브젝트 검출 방법.
- 제1항에 있어서,상기 제1 영상 내의 제1 오브젝트를 검출하는 단계;상기 제2 영상 내의 제2 오브젝트를 검출하는 단계; 및상기 제1 오브젝트 및 상기 제2 오브젝트가 상기 타겟 오브젝트로서 동일한 오브젝트인지 여부를 결정하는 단계를 더 포함하는,3차원 오브젝트 검출 방법.
- 제1항에 있어서,상기 카메라를 이용하여 상기 제1 시각에서 촬영된 제1 영상 내의 타겟 오브젝트의 제1 영역까지의 제1 거리 및 상기 타겟 오브젝트의 제2 영역까지의 제2 거리를 계산하는 단계는,상기 제1 영상의 시점을 변경함으로써 제1 조감 영상을 생성하는 단계;상기 카메라부터 상기 제1 조감 영상 내의 상기 타겟 오브젝트의 상기 제1 영역까지의 상기 제1 거리를 계산하는 단계; 및상기 카메라부터 상기 제1 조감 영상 내의 상기 타겟 오브젝트의 상기 제2 영역까지의 상기 제2 거리를 계산하는 단계를 포함하는,3차원 오브젝트 검출 방법.
- 제5항에 있어서,상기 제1 시각에서의 상기 카메라의 제1 자세를 획득하는 단계를 더 포함하고,상기 제1 영상의 시점을 변경함으로써 제1 조감 영상을 생성하는 단계는,상기 제1 자세에 기초하여 상기 제1 영상의 시점을 변경함으로써 제1 조감 영상을 생성하는 단계를 포함하는,3차원 오브젝트 검출 방법.
- 제1항에 있어서,상기 카메라를 이용하여 제2 시각에서 촬영된 제2 영상 내의 상기 타겟 오브젝트의 상기 제1 영역까지의 제3 거리 및 상기 타겟 오브젝트의 상기 제2 영역까지의 제4 거리를 계산하는 단계는,상기 제2 시각에서의 상기 카메라의 제2 자세를 획득하는 단계;상기 제2 자세에 기초하여 상기 제2 영상의 시점을 변경함으로써 제2 조감 영상을 생성하는 단계;상기 카메라부터 상기 제2 조감 영상 내의 상기 타겟 오브젝트의 상기 제1 영역까지의 상기 제3 거리를 계산하는 단계; 및상기 카메라부터 상기 제2 조감 영상 내의 상기 타겟 오브젝트의 상기 제2 영역까지의 상기 제4 거리를 계산하는 단계를 포함하는,3차원 오브젝트 검출 방법.
- 제1항에 있어서,상기 제1 차이 및 상기 제2 차이에 기초하여 상기 타겟 오브젝트가 3차원 오브젝트인지 여부를 결정하는 단계는,상기 제1 차이 및 상기 제2 차이가 동일한 경우 상기 타겟 오브젝트가 2차원 오브젝트인 것으로 결정하는 단계를 포함하는,3차원 오브젝트 검출 방법.
- 제1항에 있어서,상기 제1 차이 및 상기 제2 차이에 기초하여 상기 타겟 오브젝트가 3차원 오브젝트인지 여부를 결정하는 단계는,상기 제1 차이 및 상기 제2 차이가 동일하지 않은 경우 상기 타겟 오브젝트가 3차원 오브젝트인 것으로 결정하는 단계를 포함하는,3차원 오브젝트 검출 방법.
- 제1항에 있어서,상기 전자 장치가 차량에 포함되고, 상기 타겟 오브젝트가 3차원 오브젝트로 결정된 경우, 상기 타겟 오브젝트는 차량의 경로를 생성하기 위해 이용되는,3차원 오브젝트 검출 방법.
- 하드웨어와 결합되어 제1항의 항의 방법을 실행시키기 위하여 컴퓨터 판독 가능한 기록매체에 저장된 컴퓨터 프로그램.
- 전자 장치는,오브젝트를 검출하는 프로그램이 기록된 메모리; 및상기 프로그램을 수행하는 프로세서를 포함하고,상기 프로그램은,카메라를 이용하여 제1 시각에서 촬영된 제1 영상 내의 타겟 오브젝트의 제1 영역까지의 제1 거리 및 상기 타겟 오브젝트의 제2 영역까지의 제2 거리를 계산하는 단계;상기 카메라를 이용하여 제2 시각에서 촬영된 제2 영상 내의 상기 타겟 오브젝트의 상기 제1 영역까지의 제3 거리 및 상기 타겟 오브젝트의 상기 제2 영역까지의 제4 거리를 계산하는 단계;상기 제1 거리 및 상기 제3 거리 간의 제1 차이를 계산하고, 상기 제2 거리 및 상기 제4 거리 간의 제2 차이를 계산하는 단계; 및상기 제1 차이 및 상기 제2 차이에 기초하여 상기 타겟 오브젝트가 3차원 오브젝트인지 여부를 결정하는 단계를 수행하는,전자 장치.
- 제12항에 있어서,상기 전자 장치는, 자율 주행을 지원하는 차량 또는 ADAS(advanced driver assistance systems)을 지원하는 차량에 포함되는,전자 장치.
- 제13항에 있어서,상기 프로그램은,상기 타겟 오브젝트가 3차원 오브젝트로 결정된 경우, 상기 타겟 오브젝트에 기초하여 상기 차량을 제어하는 단계를 더 수행하는,전자 장치.
- 제12항에 있어서,상기 전자 장치는,단안 카메라인 상기 카메라를 더 포함하는,전자 장치.
- 제12항에 있어서,상기 제1 영역은 상기 타겟 오브젝트의 최하단을 포함하고,상기 제2 영역은 상기 타겟 오브젝트의 최상단을 포함하는,전자 장치.
- 제12항에 있어서,상기 프로그램은,상기 제1 영상 내의 제1 오브젝트를 검출하는 단계;상기 제2 영상 내의 제2 오브젝트를 검출하는 단계; 및상기 제1 오브젝트 및 상기 제2 오브젝트가 상기 타겟 오브젝트로서 동일한 오브젝트인지 여부를 결정하는 단계를 더 수행하는,전자 장치.
- 제12항에 있어서,상기 카메라를 이용하여 상기 제1 시각에서 촬영된 제1 영상 내의 타겟 오브젝트의 제1 영역까지의 제1 거리 및 상기 타겟 오브젝트의 제2 영역까지의 제2 거리를 계산하는 단계는,상기 제1 시각에서의 상기 카메라의 제1 자세를 획득하는 단계;상기 제1 자세에 기초하여 상기 제1 영상의 시점을 변경함으로써 제1 조감 영상을 생성하는 단계;상기 카메라부터 상기 제1 조감 영상 내의 상기 타겟 오브젝트의 상기 제1 영역까지의 상기 제1 거리를 계산하는 단계; 및상기 카메라부터 상기 제1 조감 영상 내의 상기 타겟 오브젝트의 상기 제2 영역까지의 상기 제2 거리를 계산하는 단계를 포함하는,전자 장치.
- 제12항에 있어서,상기 제1 차이 및 상기 제2 차이에 기초하여 상기 타겟 오브젝트가 3차원 오브젝트인지 여부를 결정하는 단계는,상기 제1 차이 및 상기 제2 차이가 동일한 경우 상기 타겟 오브젝트가 2차원 오브젝트인 것으로 결정하는 단계; 및상기 제1 차이 및 상기 제2 차이가 동일하지 않은 경우 상기 타겟 오브젝트가 3차원 오브젝트인 것으로 결정하는 단계를 포함하는,전자 장치.
- 전자 장치에 의해 수행되는, 오브젝트 검출 방법은,카메라를 이용하여 제1 시각에서 촬영된 제1 영상 내의 타겟 특징점까지의 제1 거리를 계산하는 단계;상기 카메라를 이용하여 제2 시각에서 촬영된 제2 영상 내의 상기 타겟 특징점까지의 제2 거리를 계산하는 단계; 및상기 카메라의 이동 속도, 제1 거리 및 제2 거리에 기초하여 상기 타겟 특징점을 포함하는 오브젝트가 3차원 오브젝트인지 여부를 결정하는 단계를 포함하는,오브젝트 검출 방법.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2021-0102749 | 2021-08-04 | ||
KR1020210102749A KR20230020853A (ko) | 2021-08-04 | 2021-08-04 | 오브젝트 검출 방법 및 그 방법을 수행하는 전자 장치 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2023013811A1 true WO2023013811A1 (ko) | 2023-02-09 |
Family
ID=85154584
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/KR2021/012884 WO2023013811A1 (ko) | 2021-08-04 | 2021-09-17 | 오브젝트 검출 방법 및 그 방법을 수행하는 전자 장치 |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR20230020853A (ko) |
WO (1) | WO2023013811A1 (ko) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20060021922A (ko) * | 2006-01-26 | 2006-03-08 | 한민홍 | 두 개의 카메라를 이용한 장애물 감지 기술 및 장치 |
US20120274762A1 (en) * | 2011-04-29 | 2012-11-01 | International Business Machines Corporation | Obtaining distance between different points on an imaged object |
KR20150051546A (ko) * | 2013-11-04 | 2015-05-13 | 현대오트론 주식회사 | 스테레오 비전을 이용한 과속 방지턱 감지장치 및 그 제어 방법 |
KR20190106846A (ko) * | 2019-08-26 | 2019-09-18 | 엘지전자 주식회사 | 자율주행시스템에서 긴급단계에 따른 제어방법 및 이를 위한 장치 |
KR20210006825A (ko) * | 2019-07-09 | 2021-01-19 | 삼성전자주식회사 | 와핑된 이미지를 통해 바닥 객체를 식별하는 전자 장치 및 그 제어 방법 |
-
2021
- 2021-08-04 KR KR1020210102749A patent/KR20230020853A/ko not_active Application Discontinuation
- 2021-09-17 WO PCT/KR2021/012884 patent/WO2023013811A1/ko unknown
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20060021922A (ko) * | 2006-01-26 | 2006-03-08 | 한민홍 | 두 개의 카메라를 이용한 장애물 감지 기술 및 장치 |
US20120274762A1 (en) * | 2011-04-29 | 2012-11-01 | International Business Machines Corporation | Obtaining distance between different points on an imaged object |
KR20150051546A (ko) * | 2013-11-04 | 2015-05-13 | 현대오트론 주식회사 | 스테레오 비전을 이용한 과속 방지턱 감지장치 및 그 제어 방법 |
KR20210006825A (ko) * | 2019-07-09 | 2021-01-19 | 삼성전자주식회사 | 와핑된 이미지를 통해 바닥 객체를 식별하는 전자 장치 및 그 제어 방법 |
KR20190106846A (ko) * | 2019-08-26 | 2019-09-18 | 엘지전자 주식회사 | 자율주행시스템에서 긴급단계에 따른 제어방법 및 이를 위한 장치 |
Also Published As
Publication number | Publication date |
---|---|
KR20230020853A (ko) | 2023-02-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2017196062A1 (en) | Distance sensor, and calibration method performed by device and system including the distance sensor | |
WO2019143040A1 (en) | Device and method for assisting with driving of vehicle | |
WO2014163307A1 (ko) | 자동차 자동 운행 시스템 | |
WO2020085881A1 (en) | Method and apparatus for image segmentation using an event sensor | |
WO2020004817A1 (ko) | 차선 정보 검출 장치, 방법 및 이러한 방법을 수행하도록 프로그램된 컴퓨 프로그램을 저장하는 컴퓨터 판독가능한 기록매체 | |
WO2011052826A1 (ko) | 이동 로봇의 위치 인식을 위한 지도 생성 및 갱신 방법 | |
WO2019172645A1 (ko) | 차량의 주행을 보조하는 전자 장치 및 방법 | |
WO2020159076A1 (ko) | 랜드마크 위치 추정 장치와 방법 및 이러한 방법을 수행하도록 프로그램된 컴퓨터 프로그램을 저장하는 컴퓨터 판독 가능한 기록매체 | |
WO2020067751A1 (ko) | 이종 센서 간의 데이터 융합 장치 및 방법 | |
WO2020241954A1 (ko) | 차량용 전자 장치 및 차량용 전자 장치의 동작 방법 | |
WO2020138760A1 (ko) | 전자 장치 및 그의 제어 방법 | |
WO2020189831A1 (ko) | 자율주행 차량의 모니터링 및 제어 방법 | |
WO2020235734A1 (ko) | 모노카메라를 이용한 자율주행 차량의 거리 및 위치 추정 방법 | |
WO2015147371A1 (ko) | 차량의 위치 보정 장치 및 방법과 이를 이용한 차량 위치 보정 시스템 및 무인 운행이 가능한 차량 | |
WO2022255677A1 (ko) | 다중 관측정보를 이용한 고정객체의 위치 결정 방법 | |
WO2020171605A1 (ko) | 주행 정보 제공 방법, 차량맵 제공 서버 및 방법 | |
WO2019112296A1 (ko) | 이미지 처리 장치, 및 이를 구비하는 이동 로봇 | |
WO2013022153A1 (en) | Apparatus and method for detecting lane | |
WO2016163590A1 (ko) | 적외선 영상 기반의 차량 보조 장치 및 방법 | |
WO2023013811A1 (ko) | 오브젝트 검출 방법 및 그 방법을 수행하는 전자 장치 | |
WO2023038445A1 (ko) | 뉴럴 네트워크 모델을 이용하여 차선 폴리라인을 생성하는 장치 및 방법 | |
WO2021177555A1 (ko) | 스티어링 휠에 구비되는 조향 보조 시스템 및 그를 이용한 조향 제어 방법 | |
CN112567726B (zh) | 信息处理设备,信息处理方法和计算机可读记录介质 | |
WO2020145440A1 (ko) | 차량용 전자 장치 및 차량용 전자 장치의 동작 방법 | |
WO2022255678A1 (ko) | 다중 관측정보를 이용한 신호등 배치정보 추정 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 21952933 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |