WO2017145600A1 - 画像処理装置、撮像装置、移動体機器制御システム、画像処理方法、及びプログラム - Google Patents

画像処理装置、撮像装置、移動体機器制御システム、画像処理方法、及びプログラム Download PDF

Info

Publication number
WO2017145600A1
WO2017145600A1 PCT/JP2017/001914 JP2017001914W WO2017145600A1 WO 2017145600 A1 WO2017145600 A1 WO 2017145600A1 JP 2017001914 W JP2017001914 W JP 2017001914W WO 2017145600 A1 WO2017145600 A1 WO 2017145600A1
Authority
WO
WIPO (PCT)
Prior art keywords
distance
area
image
unit
parallax
Prior art date
Application number
PCT/JP2017/001914
Other languages
English (en)
French (fr)
Inventor
元気 渡邊
Original Assignee
株式会社リコー
元気 渡邊
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社リコー, 元気 渡邊 filed Critical 株式会社リコー
Priority to JP2018501055A priority Critical patent/JP6705496B2/ja
Priority to EP17756042.2A priority patent/EP3422289A4/en
Publication of WO2017145600A1 publication Critical patent/WO2017145600A1/ja
Priority to US16/105,529 priority patent/US10860867B2/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • G06T7/55Depth or shape recovery from multiple images
    • G06T7/593Depth or shape recovery from multiple images from stereo images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/16Anti-collision systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/204Image signal generators using stereoscopic image cameras
    • H04N13/239Image signal generators using stereoscopic image cameras using two 2D image sensors having a relative position equal to or related to the interocular distance
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/271Image signal generators wherein the generated image signals comprise depth maps or disparity maps
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2554/00Input parameters relating to objects
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W30/00Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units
    • B60W30/08Active safety systems predicting or avoiding probable or impending collision or attempting to minimise its consequences
    • B60W30/09Taking automatic action to avoid collision, e.g. braking and steering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10012Stereo images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30248Vehicle exterior or interior
    • G06T2207/30252Vehicle exterior; Vicinity of vehicle
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30248Vehicle exterior or interior
    • G06T2207/30252Vehicle exterior; Vicinity of vehicle
    • G06T2207/30261Obstacle
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/34Smoothing or thinning of the pattern; Morphological operations; Skeletonisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N2013/0074Stereoscopic image analysis
    • H04N2013/0081Depth or disparity estimation from stereoscopic image signals

Definitions

  • the present invention relates to an image processing apparatus, an imaging apparatus, a mobile device control system, an image processing method, and a program.
  • reduction is performed to reduce the number of pixels of a distance image having a pixel value according to the distance of an object located within a predetermined distance from the plurality of imaging units in accordance with frames captured by the plurality of imaging units.
  • a rejection unit configured to reject data of the detected object based on the number of pixels included in the region of the object in the advancing region.
  • FIG. 1 is a view showing the configuration of an in-vehicle device control system as a mobile device control system according to an embodiment of the present invention.
  • the on-vehicle device control system 1 is mounted on a host vehicle 100 such as a car which is a moving body, and includes an imaging unit 101, an image analysis unit 102, a display monitor 103, and a vehicle travel control unit 104. Then, the imaging unit 101 detects an object in front of the host vehicle from a plurality of captured image data (frames) of the area ahead of the host vehicle in the traveling direction (imaging area). Control mobiles and various in-vehicle devices.
  • the control of the moving body includes, for example, notification of a warning, control of the steering wheel of the own vehicle 100 (self-moving body), or a brake of the own vehicle 100 (self-moving body).
  • the imaging unit 101 is installed, for example, in the vicinity of a rearview mirror (not shown) of the windshield 105 of the vehicle 100.
  • Various data such as captured image data obtained by imaging of the imaging unit 101 is input to an image analysis unit 102 as an image processing unit.
  • the image analysis unit 102 analyzes the data transmitted from the imaging unit 101, and on the traveling road surface ahead of the vehicle with respect to the road surface portion on which the vehicle 100 is traveling (a road surface portion located directly below the vehicle). The relative height (position information) at each point is detected, and the three-dimensional shape of the traveling road surface ahead of the host vehicle is grasped. In addition, other objects ahead of the host vehicle, pedestrians, and various obstacles and other objects to be recognized are recognized.
  • the analysis result of the image analysis unit 102 is sent to the display monitor 103 and the vehicle travel control unit 104.
  • the display monitor 103 displays the captured image data and the analysis result obtained by the imaging unit 101.
  • the vehicle travel control unit 104 notifies, for example, a warning to the driver of the own vehicle 100 based on the recognition result of the recognition target such as another vehicle ahead of the own vehicle, a pedestrian, and various obstacles by the image analysis unit 102.
  • driving support control such as controlling the steering wheel and brake of the host vehicle.
  • FIG. 2 is a diagram showing the configuration of the imaging unit 101 and the image analysis unit 102.
  • the imaging unit 101 is configured of a stereo camera including two imaging units 110a and 110b as imaging means, and the two imaging units 110a and 110b are the same.
  • the respective imaging units 110a and 110b respectively include imaging lenses 111a and 111b, sensor substrates 114a and 114b including image sensors 113a and 113b on which light receiving elements are two-dimensionally arranged, and analog signals output from the sensor substrates 114a and 114b.
  • Electric signal (electrical signal corresponding to the amount of light received by each light receiving element on the image sensors 113a, 113b) is converted into digital electric signal, and it is composed of signal processing units 115a, 115b for generating and outputting captured image data ing. For example, luminance image data is output from the imaging unit 101.
  • the imaging unit 101 also includes a processing hardware unit 120 configured of an FPGA (Field-Programmable Gate Array) or the like.
  • the processing hardware unit 120 calculates the parallax values of corresponding image portions between the imaged images captured by the imaging units 110a and 110b.
  • a disparity calculating unit 121 is provided as a disparity image information generating unit to calculate.
  • the parallax value referred to here is a comparison image with respect to an image portion on a reference image corresponding to the same point in the imaging region, with one of the images taken by each of the imaging units 110a and 110b as a reference image and the other as a comparison image.
  • the positional displacement amount of the upper image portion is calculated as the parallax value of the image portion.
  • FIG. 3 is a diagram for explaining the principle of calculating the distance from the parallax value by using the principle of triangulation.
  • f is the focal length of each of the imaging lenses 111a and 111b
  • D is the distance between the optical axes.
  • Z is the distance from the imaging lenses 111a and 111b to the subject 301 (the distance in the direction parallel to the optical axis).
  • the imaging positions in the left and right images with respect to the point O on the subject 301 are respectively ⁇ 1 and ⁇ 2 from the imaging center.
  • the image analysis unit 102 is configured of an image processing board or the like, and includes a storage unit 122 configured of a RAM, a ROM, or the like that stores luminance image data and parallax image data and the like output from the imaging unit 101; And a central processing unit (CPU) 123 for executing a computer program for performing parallax calculation control and the like, a data I / F (interface) 124, and a serial I / F 125.
  • CPU central processing unit
  • the FPGA that configures the processing hardware unit 120 performs processing that requires real-time processing on image data, such as gamma correction, distortion correction (parallelization of right and left captured images), and parallax calculation by block matching to generate a parallax image. And the like, and performs processing such as writing out in the RAM of the image analysis unit 102.
  • the CPU of the image analysis unit 102 is responsible for control of the image sensor controller of each imaging unit 110A, 110B and overall control of the image processing board, detection processing of the three-dimensional shape of the road surface, guardrails and other various objects (objects)
  • a program for executing detection processing of the image is loaded from ROM, and various processing is executed with luminance image data and parallax image data stored in RAM as input, and the processing result is data I / F 124 and serial I / F 125 Output from the outside.
  • vehicle operation information such as the vehicle speed, acceleration (acceleration mainly generated in the front and rear direction of the vehicle) of the vehicle 100, steering angle, yaw rate etc. It can also be used as a processing parameter.
  • the data output to the outside is used as input data for performing control (brake control, vehicle speed control, warning control, etc.) of various devices of the host vehicle 100.
  • the imaging unit 101 and the image analysis unit 102 may be configured as an imaging device 2 that is an integrated device.
  • FIG. 4 is a functional block diagram of an imaging apparatus including an image processing apparatus that performs object detection processing implemented by the processing hardware unit 120 and the image analysis unit 102 in FIG.
  • the imaging apparatus includes a stereo camera image acquisition unit 130, a short distance processing unit 140, a normal distance processing unit 150, and an object data list 170.
  • the stereo camera image acquisition unit 130 acquires an image captured by a stereo camera.
  • the short distance processing unit 140 detects and tracks an object located at a short distance (within a predetermined distance from the host vehicle).
  • the normal distance processing unit 150 detects and tracks an object located at a distance greater than the short distance.
  • the object data list 170 stores data of an object (object) detected by the short distance processing unit 140 and the normal distance processing unit 150, and outputs the data to the display monitor 103 and the vehicle travel control unit 104.
  • processing may be executed at least partially in parallel, or processing is sequentially performed. It is also good.
  • the processing by the disparity calculation unit 121 of the processing hardware unit 120 may be performed by performing near-field disparity image generation processing after performing disparity image generation processing and performing processing by the other image analysis units 102 in parallel. Good.
  • the stereo camera image acquisition unit 130 acquires luminance image data from the two imaging units 110 a and 110 b constituting the stereo camera. At this time, when the imaging units 110a and 110b are in color, color luminance conversion to obtain a luminance signal (Y) from the RGB signals is performed using, for example, the following formula [1].
  • FIG. 5 is a functional block diagram of the short distance processing unit 140.
  • the short distance processing unit 140 detects and tracks an object in a short distance (within a predetermined distance from the host vehicle).
  • the short distance processing unit 140 includes a short distance parallax image generation unit 141, a reduced parallax image generation unit 142, a short distance object detection unit 143, a short distance object rejection unit 144, and a short distance object tracking unit 145.
  • the short distance parallax image generation unit 141 may be realized by, for example, the parallax calculation unit 121 of the processing hardware unit 120.
  • the short distance parallax image generation unit 141 performs short distance parallax image generation processing for generating parallax image data (parallax image information) for an object positioned within a predetermined distance from the host vehicle (stereo camera).
  • the short distance parallax image generation process first, luminance image data of one of the two imaging units 110a and 110b is used as reference image data, and luminance image data of the other imaging unit 110b is used as comparative image data, Using these, the parallax for the object located within a predetermined distance from the host vehicle is calculated, and parallax image data is generated and output.
  • the parallax image data represents a parallax image in which pixel values corresponding to the parallax value d calculated for each image portion on the reference image data are represented as pixel values of the respective image portions.
  • the short distance parallax image generation unit 141 defines a block including a plurality of pixels (for example, 16 pixels ⁇ 1 pixel) centered on one target pixel for a row of reference image data. Then, in the same row in the comparison image data, a block having the same size as the block of the defined reference image data is shifted in the horizontal line direction (x direction) by one pixel. At this time, in the short distance parallax image generation processing, the range in the horizontal line direction in which the blocks are shifted is set as a range corresponding to within a predetermined distance (for example, within 1 m to 6 m) from the host vehicle. Thereby, the parallax with respect to the object located within the predetermined distance from the host vehicle is searched.
  • a predetermined distance for example, within 1 m to 6 m
  • the short distance parallax image generation unit 141 generates a correlation value indicating the correlation between the feature amount indicating the feature of the pixel value of the block defined in the reference image data and the feature amount indicating the feature of the pixel value of each block in the comparison image data. Are calculated respectively. Then, based on the calculated correlation value, a matching process is performed to select a block of comparison image data having the highest correlation with the block of reference image data among the blocks of comparison image data. Thereafter, the amount of positional deviation between the target pixel of the block of the reference image data and the corresponding pixel of the block of the comparison image data selected in the matching process is calculated as the parallax value d. It is possible to obtain parallax image data by performing such a process of calculating the parallax value d for the entire area of the reference image data or a specific area.
  • the short-distance parallax image generation unit 141 brings the correlation value with the block of the reference image data closer to the highest value among the blocks in the comparison image data (the highest value Within a value) It is determined whether there are a plurality of blocks, and if there are a plurality of blocks, it is determined that a repeated pattern such as a fence has been detected, and a value indicating a repeated pattern is set as the parallax value d.
  • the value (brightness value) of each pixel in the block can be used as the feature amount of the block used for the matching process, and the correlation value can be, for example, the value of each pixel in the block of the reference image data (brightness A sum of absolute values of differences between the values) and the values (brightness values) of the respective pixels in the block of the comparison image data respectively corresponding to these pixels can be used. In this case, it can be said that the block with the smallest total sum is most correlated.
  • the matching processing in the short distance parallax image generation unit 141 is realized by hardware processing, for example, SSD (Sum of Squared Difference), ZSSD (Zero-mean Sum of Squared Difference), SAD (Sum of Absolute Difference), A method such as Zero-mean Sum of Absolute Difference (ZSAD) or Normalized cross correlation (NCC) can be used.
  • ZSAD Zero-mean Sum of Absolute Difference
  • NCC Normalized cross correlation
  • the reduced parallax image generation unit 142 is reduced by extracting pixels at predetermined intervals from the parallax image for the object located within the predetermined distance from the own vehicle, which is generated by the short distance parallax image generation unit 141 ( Create a reduced parallax image with a small number of pixels. For example, when the parallax image of 1280 ⁇ 640 pixels is reduced to, for example, 1/10 vertically and horizontally, the reduced parallax image is 128 ⁇ 64 pixels.
  • the reduced parallax image generation unit 142 extracts pixels from the parallax image at constant intervals, and the parallax value of the extracted pixels is, for example, a value indicating that the distance is infinity, or a repeated pattern In the case of an invalid value such as a value indicating that there is a value, the value of the extracted pixel is determined (complemented) based on the pixel value around the extracted pixel.
  • the reduced parallax image generation unit 142 searches for a pixel having a valid value in the predetermined priority order around the extracted pixel, and if there is a pixel having a non-valid (valid) value, A non-ineffective value is taken as the value of the extracted pixel.
  • the predetermined priority order may be, for example, an order of closest distance among a predetermined pixel group separated by a predetermined distance (pixel) from the extracted pixel 661.
  • the reduced parallax image generation unit 142 may set, for example, the average value of the extracted pixels and the peripheral pixels thereof as the value of the extracted pixels.
  • the parallax value of the extracted pixel when the reliability as parallax is low for example, when the repeated pattern of a fence or the like is detected by the short distance parallax image generation unit 141, for example. Is determined to be an invalid value, and the value of the extracted pixel is determined based on the surrounding pixel values.
  • FIGS. 6A and 6B are diagrams for describing a reference image and a parallax image.
  • a parallax image is generated for an image in which a preceding vehicle appears as shown in FIG. 6A, the difference in luminance is small in the same color part, so that the parallax value can not be calculated and becomes an invalid value (for example, infinity).
  • an invalid value for example, infinity
  • the short distance object detection unit 143 detects an object based on the reduced parallax image for the object located within a predetermined distance from the host vehicle, which is generated by the reduced parallax image generation unit 142.
  • the short distance object detection unit 143 calculates the actual distance from the vehicle of the object shown in each pixel based on the parallax value of each pixel of the reduced parallax image, and calculates the actual distance from the vehicle of adjacent pixels If the difference is within a predetermined value (for example, 20 cm), the same label is added.
  • a predetermined value for example, 20 cm
  • “adjacent” may be four directions including upper and lower, right and left, or eight directions including upper right, upper left, lower right, and lower left.
  • the short distance object detection unit 143 detects a unit labeled (with the same label added) as one object. Then, when the adjacent objects satisfy the predetermined coupling condition, the short distance object detection unit 143 detects the adjacent objects as one object.
  • the predetermined combining condition is, for example, that “any one side of the vertical or horizontal sides of adjacent objects overlaps by half or more, and the difference in actual distance between the adjacent objects from the vehicle is less than 1 m”, etc. Do. Thus, it is possible to capture an object, such as a wall, located obliquely to the traveling direction of the host vehicle as a single object.
  • the short distance object detection unit 143 detects a rectangular or square area including an object in the reduced parallax image as an area of the object.
  • the short-distance object discarding unit 144 discards (discards) data of objects that are not targeted for tracking among the objects detected by the short-distance object detection unit 143.
  • the short-distance object discarding unit 144 calculates the size of the object based on the number of vertical and horizontal pixels of the region of the object detected by the short-distance object detection unit 143 and the parallax value of the pixels included in the region. . Then, objects that are too large (greater than or equal to a predetermined threshold) and objects that are too small (equal to or less than a predetermined threshold) are rejected (data is discarded) as compared with the size of a person or vehicle set in advance.
  • the short-distance object discarding unit 144 calculates the three-dimensional position of the object based on the position (coordinates) of the vertical and horizontal pixels of the area of the object and the parallax value of the pixels included in the area. Note that the calculation method of the three-dimensional position may be the same as the calculation method by the three-dimensional position determination unit 161 described later. Then, based on the previous frame (the image of the stereo camera), the height from the road surface is too high by referring to the height of each road surface portion tabulated by the road surface height table calculation unit 154 described later. Objects that are above the threshold) are rejected.
  • the short-distance object discarding unit 144 calculates the parallax density of the area of the object, and discards the object whose parallax density is too low.
  • the parallax density in this case is, for example, the number (A) of pixels having parallax values according to the object among the pixels contained in the area of the object, the total number of pixels (S) included in the area including the object Calculated by dividing (A / S) by.
  • the short-distance object discarding unit 144 performs a progressing area object discarding process that discards the object based on the parallax density of the object in the area in which the host vehicle travels.
  • the short distance object discarding unit 144 counts the number of pixels having a parallax value according to the object in the traveling area in which the host vehicle is traveling, and the number of pixels included in the area of the object in the traveling area. And discards (discards) the data of the object detected by the short distance object detection unit 143.
  • the short distance object discarding unit 144 calculates the traveling area based on the height and width of the own vehicle and the distance (actual distance) from the own vehicle of the object detected by the short range object detection unit 143.
  • FIG. 7 is a flow chart showing an example of the process of discarding the progress area object.
  • the short-distance object discarding unit 144 initializes (for example, 0) the number of advancing area elements corresponding to the object (step S201).
  • the short-distance object discarding unit 144 determines that the pixel is a component of the object by the short-distance object detection unit 143, and a label indicating the component of the object is added to the pixel. Is detected (step S202).
  • the short-distance object discarding unit 144 determines whether the position (coordinates) of the pixel to which the label is added is within a region (traveling region, central region) where the host vehicle travels (step S203).
  • step S203 If the position (coordinates) of the pixel to which the label is added is not within the advancing area (NO in step S203), the process proceeds to step S205 described later.
  • Step S204 If the position (coordinates) of the pixel to which the label is added is within the advancing area (YES in step S203), the number of advancing area elements stored in association with the object is incremented (increased by 1) Step S204).
  • the short-distance object discarding unit 144 determines whether or not there is another pixel that is determined to be the object and is added with the label in the frame of one reduced parallax image by the short-distance object detection unit 143 (Step S205).
  • step S205 If there is another pixel that is determined to be the object and to which the label is added in the frame of one reduced parallax image (YES in step S205), the process proceeds to step S202.
  • step S205 if there is no other pixel determined to be the object and to which the label is attached (NO in step S205), the area of the object (area such as the smallest rectangle including the object) The total number of pixels in the area included in the advancing area is calculated (step S206).
  • the short-distance object discarding unit 144 calculates the parallax density of the object in the area overlapping the moving area, based on the number of moving area elements described above and the total number of pixels included in the moving area calculated in step S206 (Ste S207). Note that the parallax density of an object in the area overlapping the advancing area is calculated, for example, by dividing the number of elements of the advancing area of the object by the total number of pixels included in the advancing area within the minimum rectangular area including the object. Do.
  • the short-distance object discarding unit 144 determines whether the parallax density of the object in the area overlapping the advancing area is equal to or less than a predetermined threshold (for example, 20%) (step S208).
  • a predetermined threshold for example, 20%
  • step S208 If the parallax density of the object in the area overlapping the advancing area is not less than or equal to the predetermined threshold (NO in step S208), the process ends.
  • step S208 If the parallax density of the object in the area overlapping the advancing area is less than or equal to the predetermined threshold (YES in step S208), it is determined that the object does not prevent the progress of the own vehicle, and the object is rejected (step S209) , End the process.
  • the traveling area may be set in advance as, for example, a predetermined area in the reduced parallax image, or from the own vehicle of the pixel to which the height and width of the own vehicle and the label which have been preset are added. It may be calculated based on the actual distance of
  • the traveling area When the travel area is calculated based on the height and width of the vehicle and the actual distance of the labeled pixel from the vehicle, the reduction corresponding to the height and width of the vehicle at the actual distance
  • the area of the parallax image may be set as the advancing area.
  • the actual distance from the vehicle of the pixel to which the label is added instead of using the value of the actual distance from the vehicle of the pixel to which the label is added, the actual distance from the vehicle of the object including the pixel to which the label is added (for example, each pixel included in the object
  • the traveling region may be calculated using the average value of the actual distances of
  • FIG. 8 is a diagram for explaining the traveling area object discarding process.
  • the short-distance object discarding unit 144 calculates the parallax density of the object in the area overlapping the advancing area as described above in the area 254 where the area 253 such as the smallest rectangle including the object overlaps the advancing area 252.
  • FIG. 9A to FIG. 9D are diagrams for explaining the traveling area object discarding process when the tunnel is detected.
  • FIG. 9A is a view showing an example of a tunnel shown in a reference image.
  • FIG. 9B is a diagram showing an example of a minimum rectangular area 253 a including a tunnel.
  • FIG. 9C is a diagram showing an example in which the traveling area 252a is set in advance.
  • the traveling area 252a of the host vehicle before the host vehicle enters the tunnel, the traveling area 252a of the host vehicle is included in the area 253a such as the smallest rectangle including the tunnel. Therefore, in the area 253a such as the smallest rectangle including the tunnel, the area 254a included in the advancing area 252a is the entire advancing area 252a.
  • the parallax density of the object in the area overlapping the advancing area is, for example, the pixels of the area 255 having the parallax value for the tunnel included in the advancing area 252a (pixels labeled by near-field object detection processing, advancing area element Is calculated by dividing the number of pixels by the number of pixels included in the region 254a.
  • FIG. 9D is a diagram showing an example in which the traveling area 252a is calculated based on the height and width of the vehicle and the actual distance from the vehicle of the pixel to which the label is added.
  • the predetermined threshold used in step S208 of FIG. 7 may be, for example, 0%.
  • the short-distance object tracking unit 145 tracks the objects detected by the short-distance object detection unit 143 and not rejected by the short-distance object discarding unit 144.
  • the near distance object tracking unit 145 refers to the object data list 170, and determines that the object detected by the near distance object detection unit 143 is a new detection if it is not stored in the object data list 170.
  • the objects are stored in the object data list 170. If the detected object is stored in the object data list 170, the data for the object stored in the object data list 170 is updated to data based on the detected object.
  • the determination as to whether the detected object is stored in the object data list 170 may be made, for example, of the actual distance of the detected object from the vehicle and the actual distance of the object stored in the object data list 170 from the vehicle. It is judged according to whether the difference with the distance is equal to or less than a predetermined value.
  • FIG. 10 is a functional block diagram of the normal distance processing unit 150. As shown in FIG. The normal distance processing unit 150 detects and tracks an object at a normal distance which is equal to or greater than a predetermined distance (for example, 2 m) from the host vehicle.
  • a predetermined distance for example, 2 m
  • the parallax image generation unit 151 may be realized by, for example, the parallax calculation unit 121 of the processing hardware unit 120.
  • the parallax image generation unit 151 generates parallax image data (parallax image information) for an object located in a range (for example, about 2 m to 80 m from the host vehicle) farther than the short distance parallax image generation unit 141 described above. I do.
  • the parallax image generation process is similar to the short distance parallax image generation process by the short distance parallax image generation unit 141 described above, but the parallax image generation process is different from the short distance parallax image generation process, for example, in the following.
  • the parallax image generation unit 151 shifts blocks defined in the reference image data in the same row in the comparison image data in the horizontal line direction
  • the range in the horizontal line direction in which the blocks are shifted is within a predetermined distance (for example, 2 m) from the host vehicle
  • the range corresponds to ⁇ 80m).
  • V map generation unit 152 executes V map generation processing for generating a V map.
  • Each piece of parallax pixel data included in parallax image data is indicated by a set (x, y, d) of an x-direction position, a y-direction position, and a parallax value d.
  • the parallax histogram information of the present embodiment includes three-dimensional coordinate information (d, y, f), and the three-dimensional histogram information distributed in an XY two-dimensional coordinate system is a V map (parallax histogram map , V-disparity map).
  • the V map generation unit 152 calculates a disparity value frequency distribution for each row region of disparity image data obtained by dividing an image into a plurality of pieces in the vertical direction.
  • Information indicating this disparity value frequency distribution is disparity histogram information.
  • FIG. 11A and 11B are diagrams for explaining parallax image data and a V map generated from the parallax image data.
  • FIG. 11A is a diagram showing an example of the parallax value distribution of the parallax image
  • FIG. 11B is a diagram showing a V map showing the parallax value frequency distribution for each row of the parallax image of FIG. 11A.
  • the V map generation unit 152 calculates a parallax value frequency distribution that is a distribution of the number of data of each parallax value for each row, This is output as disparity histogram information.
  • a V map as shown in FIG. 11B can be obtained.
  • This V map can also be expressed as an image in which pixels having pixel values according to the frequency f are distributed on the two-dimensional orthogonal coordinate system.
  • FIG. 12A and 12B are diagrams showing an image example of a captured image as a reference image captured by one imaging unit and a V map corresponding to the captured image.
  • FIG. 12A is a captured image
  • FIG. 12B is a V map. That is, the V map shown in FIG. 12B is generated from the photographed image as shown in FIG. 12A.
  • the V map since parallax is not detected in the area below the road surface, parallax is not counted in the hatched area A.
  • FIG. 12A In the example of an image shown to FIG. 12A, the road surface 401 in which the own vehicle is drive
  • This image example is a virtual reference obtained by extending the surface in front of the host vehicle relatively flat, ie, the surface in front of the host vehicle parallel to the road surface portion directly below the host vehicle to the front of the host vehicle It corresponds to the road surface (virtual reference movement surface).
  • the high frequency points are distributed in a substantially straight line with an inclination such that the parallax value d becomes smaller toward the upper side of the image. Pixels showing such a distribution are present at approximately the same distance in each row on the parallax image and have the highest occupancy rate, and pixels that project an object of identification whose distance increases continuously as they move upward in the image It can be said that
  • the parallax value d of the road surface decreases toward the upper side of the image as shown in FIG. 12A.
  • the high-frequency points distributed in a substantially straight line on the V map correspond to the features possessed by the pixels projecting the road surface (moving surface). Therefore, it is possible to estimate that the pixels of the point distributed on the approximate straight line obtained by straight line approximation of the high frequency points on the V map or in the vicinity thereof are the pixels showing the road surface with high accuracy. Further, the distance to the road surface portion shown in each pixel can be determined with high accuracy from the parallax value d of the corresponding point on the approximate straight line.
  • the road surface shape detection unit 153 detects the three-dimensional shape of the road surface ahead of the vehicle 100 from the information (parallax histogram information) of the V map generated by the V map generation unit 152. Processing is performed.
  • working the preceding vehicle 402 which exists in front of the own vehicle 100, and the utility pole 403 which exists out of a road are shown.
  • This image example can be obtained by a road surface in which the front surface of the vehicle 100 is relatively flat, that is, a surface in front of the vehicle 100 extends a plane parallel to the road surface portion directly below the vehicle 100 to the front of the vehicle. It is a case where it corresponds to a virtual reference road surface (virtual reference movement surface).
  • the high frequency points (road surface 501) are distributed in a substantially straight line with an inclination such that the parallax value d becomes smaller toward the upper side of the image. Pixels showing such a distribution are present at approximately the same distance in each row on the parallax image and have the highest occupancy ratio, and pixels that project a detection target whose distance is continuously farther away toward the upper side of the image It can be said that
  • the parallax value d of the road surface decreases toward the upper side of the image as shown in FIG. 12B. Further, in the same line (horizontal line), pixels projecting the road surface have substantially the same parallax value d. Therefore, the high-frequency points (road surface 501) distributed in a substantially straight line on the V map correspond to the features possessed by the pixels projecting the road surface (moving surface). Therefore, it is possible to estimate that the pixels of the point distributed on the approximate straight line obtained by straight line approximation of the high frequency points on the V map or in the vicinity thereof are the pixels showing the road surface with high accuracy. Further, the distance to the road surface portion shown in each pixel can be determined with high accuracy from the parallax value d of the corresponding point on the approximate straight line.
  • the road surface height table calculation unit 154 performs road surface height table calculation processing of calculating the road surface height (relative height with respect to the road surface portion immediately below the vehicle) and converting it into a table. From the information on the approximate straight line on the V map generated by the road surface shape detection unit 153, it is possible to calculate the distance to each road surface portion shown in each row region (each position in the vertical direction of the image) on the captured image. On the other hand, each surface portion in the vehicle's traveling direction of a virtual plane extending forward to the vehicle's traveling direction so that the road surface portion located directly below the vehicle is parallel to that surface is shown in any row region in the captured image.
  • the virtual plane (reference road surface) is represented by a straight line (reference straight line) on the V map.
  • a straight line reference straight line
  • the height of each road surface portion ahead of the host vehicle can be obtained.
  • the road surface height table calculation unit 154 the heights of the road surface portions obtained from the approximate straight line are tabulated for the necessary parallax range.
  • the height from the road surface of the object shown in the captured image portion corresponding to the point where the Y-axis position is y ′ at a certain parallax value d is equal to the Y-axis position on the approximate straight line in the parallax value d And can be calculated from (y'-y0).
  • the height H from the road surface for the object corresponding to the coordinates (d, y ′) on the V map can be calculated by the following equation (2).
  • “f” is the camera focal length (y′ ⁇ It is a value converted into the same unit as y0).
  • BF is a value obtained by multiplying the base length of the stereo camera and the focal length
  • “offset” is a parallax value when an object at infinity is photographed.
  • the U map generation unit 155 executes frequency U map generation processing and height U map generation processing as U map generation processing for generating a U map (U-disparity map).
  • a pair (x, y, d) of an x-direction position, a y-direction position, and a parallax value d in each parallax pixel data included in parallax image data is Set the frequency on the Z-axis, and create XY 2D histogram information. This is called a frequency U map.
  • the height H from the road surface is in a predetermined height range (for example, 20 cm to 3 m) based on the height of each road surface portion tabulated by the road surface height table calculation unit 154.
  • the frequency U map is created only for the point (x, y, d) of the parallax image in. In this case, an object present in the predetermined height range can be appropriately extracted from the road surface.
  • a pair (x, y, d) of the x-direction position, the y-direction position, and the parallax value d in each parallax pixel data included in parallax image data Set the d axis on the axis and the height from the road surface on the Z axis to create XY two-dimensional histogram information. This is called a height U map.
  • the value of the height at this time is the highest from the road surface.
  • FIG. 13 is an example of an image schematically representing an example of a reference image captured by the imaging unit 110a
  • FIGS. 14A and 14B are U maps corresponding to the example of the image in FIG.
  • FIG. 14A is a frequency U map
  • FIG. 14B is a height U map.
  • guard rails 413 and 414 exist on the left and right sides of the road surface, and as the other vehicle, one leading vehicle 411 and one oncoming vehicle 412 exist.
  • high frequency points corresponding to the left and right guard rails 413 and 414 are substantially straight lines 603 and 604 extending upward from the left and right ends toward the center.
  • high frequency points corresponding to the leading vehicle 411 and the oncoming vehicle 412 are distributed between the left and right guardrails in the states 601 and 602 of line segments extending substantially parallel to the X-axis direction.
  • a high frequency point corresponding to another vehicle is a state in which a line segment extending parallel to the substantially X axis direction and a line segment inclined to the substantially X axis direction are connected.
  • the height U map points having the highest height from the road surface in the left and right guard rails 413 and 414, the leading vehicle 411, and the oncoming vehicle 412 are distributed similarly to the frequency U map.
  • the heights of the distribution 701 of points corresponding to the leading vehicle and the distribution 702 of points corresponding to the oncoming vehicle are higher than the distributions 703 and 704 of points corresponding to the guardrail.
  • the real U map generation unit 156 generates a real frequency U map generation process and a real height U map generation process as a U map generation process of generating a real U map (an example of “distribution data”). Run.
  • the real U map is obtained by converting the horizontal axis in the U map from the pixel unit of the image to an actual distance, and converting the parallax value on the vertical axis into a thinned parallax having a thinning ratio according to the distance.
  • the real U map generation unit 156 In the real frequency U map generation process, the real U map generation unit 156 generates a pair (x, y, d) of the x direction position, the y direction position, and the parallax value d in each parallax pixel data included in parallax image data.
  • the two-dimensional histogram information of XY is created by setting the actual distance in the horizontal direction to the X axis, the thinning parallax to the Y axis, and the frequency to the Z axis.
  • the real U map generation unit 156 of the present embodiment is based on the heights of the road surface portions tabulated by the road surface height table calculation unit 154, and the height from the road surface.
  • a real frequency U map is created only for the point (x, y, d) of the parallax image in which H is in a predetermined height range.
  • the real U map generation unit 156 may be configured to generate the real U map based on the U map generated by the U map generation unit 155.
  • FIG. 15 is a diagram showing a real U map (hereinafter, real frequency U map) corresponding to the frequency U map shown in FIG. 14A.
  • the left and right guardrails are represented by vertical linear patterns 803 and 804, and the preceding vehicle and the oncoming vehicle are also represented by patterns 801 and 802 close to the actual shape.
  • the thinning parallax on the vertical axis is not thinned for a long distance (here, 50 m or more), 1/2 for an intermediate distance (20 m or more and less than 50 m), and 1 / l for a short distance (10 m or more and less than 20 m) It is thinned out to 3 and thinned out to 1/8 for a short distance (10 m or more and less than 20 m).
  • the amount of thinning is reduced as the distance increases.
  • the reason is that since the object appears small at a distance, there is little parallax data and the distance resolution is small, so thinning is reduced, and conversely, an object is large at a short distance, so there is much parallax data and the distance resolution is large.
  • a width of 10 m on each side is set as the object detection range. Assuming that the width of one pixel in the horizontal direction of the real U map is 10 cm, the horizontal size of the real U map is 200 pixels.
  • the focal length of the camera is f
  • the lateral position of the sensor from the camera center is p
  • the distance from the camera to the subject is Z
  • the lateral position from the camera center to the subject is X.
  • Z Bf / d”.
  • a real U map (hereinafter, real height U map) corresponding to the height U map shown in FIG. 14B can also be created in the same procedure.
  • the real U map has an advantage that the processing becomes faster because the vertical and horizontal lengths can be made smaller than the U map.
  • the horizontal direction becomes independent of distance, the same object can be detected with the same width in both far and near areas, and it is possible to judge the processing branch to the peripheral area removal, horizontal separation, and vertical separation in the latter stage.
  • FIG. 17 is a flowchart showing the flow of the isolated area detection process performed by the isolated area detection unit 157.
  • the isolated area detection unit 157 first smoothes the information of the real frequency U map generated by the real U map generation unit 156 (step S111).
  • the real U map differs from the schematic diagram shown in FIG. Contains. Therefore, the real U map is smoothed to remove noise and to facilitate separation of the object to be detected. This is considered to be noise by applying a smoothing filter (for example, a simple average of 3 ⁇ 3 pixels) to a frequency value (real frequency U map) of the real U map as in the case of image smoothing. The frequency is reduced, and in the part of the object, the group is grouped more frequently than the surroundings, which has the effect of facilitating the subsequent isolated area detection processing.
  • a smoothing filter for example, a simple average of 3 ⁇ 3 pixels
  • a real frequency U map is used to detect isolated regions (referred to as islands) whose frequency is higher than that of the surroundings.
  • the real frequency U map is first binarized (step S113).
  • binarization is performed with a threshold value of 0. This is a measure against the fact that some islands are isolated and some are connected to other islands because of the height of the object, its shape, and the separation from the road surface parallax. That is, by binarizing the real frequency U map from a small threshold, an island of an appropriately isolated size is detected at first, and then the connected islands are separated by increasing the threshold, and the island is isolated. It is possible to detect as an island of appropriate size.
  • the method of detecting the island after binarization uses labeling (step S114). Coordinates that are black after binarization (coordinates whose frequency value is higher than the binarization threshold) are labeled based on their connectivity, and areas with the same label are regarded as islands.
  • Size determination is performed for each of the plurality of isolated areas detected (step S115). This is because the object to be detected is a pedestrian to a large car, so it is determined whether the width of the isolated area is within the range of its size. If the size is large (step S115: YES), the binarization threshold is incremented by 1 (step S112), and binarization is performed only in the isolated region of the real frequency U map (step S113). Then, labeling is performed, a smaller isolated area is detected (step S114), and the size is determined (step S115).
  • step S115 peripheral area removal is performed next (step S116). This is an object at a distance, the road surface detection accuracy is poor, the parallax of the road surface is introduced into the real U map, and the parallax between the object and the road surface is the height when it is detected as one mass Is a process of deleting the area near the road surface (the peripheral area in the isolated area). If there is a removal area (step S117: YES), labeling is performed again to reset the isolated area (step S114).
  • step S117 If there is no more removal area (step S117: NO), the size (width, height, distance) of the isolated area subjected to the removal of the surrounding area is determined (step S118), and the separation in the lateral direction is performed S119) or vertical separation (step S120) or nothing is registered as an object candidate. If horizontal separation or vertical separation has been performed (step S121: YES, step S122: YES), labeling is performed again to reset the isolated area (step S114).
  • FIG. 18 is a view showing a real frequency U map in which a rectangular area inscribed in the isolated area detected by the isolated area detection unit is set.
  • FIG. 19 is a diagram in which a scanning range corresponding to the rectangular area in FIG.
  • FIG. 20 is a diagram showing an image
  • FIG. 20 is a diagram showing a parallax image in which an object region is set by searching for the scanning range in FIG.
  • the width of the rectangular area corresponds to the width of the identification target (object) corresponding to the isolated area.
  • the height of the set rectangular area corresponds to the depth (the length in the traveling direction of the host vehicle) of the identification target (object) corresponding to the isolated area.
  • the height of the identification object (object) corresponding to each isolated area is unknown at this stage.
  • the corresponding area detection unit 158 of the parallax image detects the corresponding area on the parallax image corresponding to the isolated area in order to obtain the height of the object corresponding to the isolated area related to the object candidate area.
  • the corresponding area detection unit 158 of the parallax image detects the positions, widths, and minimums of the first detection island 811 and the second detection island 812 detected from the real U map based on the information of the isolated area output from the isolated area detection unit 157. From the parallax, the x-direction range (xmin, xmax) of the first detected island corresponding area scanning range 481 and the second detected island corresponding area scanning range 482 which are ranges to be detected in the parallax image shown in FIG. 19 can be determined.
  • the set scanning range is scanned, and a pixel having a value of a range of rectangular depth (minimum parallax dmin, maximum parallax dmax) detected by the isolated area detection unit 157 as parallax Are extracted as candidate pixels. Then, among the extracted candidate pixel groups, a line having a predetermined ratio or more in the horizontal direction with respect to the detection width is set as a candidate line.
  • scanning is performed in the vertical direction, and when there is a predetermined density or more of another object candidate line around a certain focused object candidate line, the focused object candidate line is determined as an object line .
  • the object area extraction unit 159 searches for an object line in the search area of the parallax image to determine the lowermost end and the uppermost end of the object line, and as shown in FIG.
  • the area 462 is determined as the areas 451 and 452 of the objects (first and second vehicles) in the parallax image.
  • FIG. 21 is a flowchart showing the flow of processing performed by the corresponding area detection unit 158 and the object area extraction unit 159 of the parallax image.
  • the search range in the x-axis direction with respect to the parallax image is set based on the position, width and minimum parallax of the island in the real U map (step S161).
  • the maximum search value ymax in the y-axis direction with respect to the parallax image is set (step S162).
  • the minimum search value ymin in the y-axis direction for the parallax image is obtained and set from the maximum height of the island in the real height U map and the ymax and dmax set in step S172, thereby the y-axis for the parallax image
  • the search range of the direction is set (step S163).
  • the parallax image is searched in the set search range, and pixels in the range of the minimum parallax dmin of the island and the maximum parallax dmax are extracted, and are set as object candidate pixels (step S164).
  • the object candidate pixel is in the horizontal direction at a certain ratio or more, the line is extracted as an object candidate line (step S165).
  • the density of the object candidate line is calculated, and if the density is larger than a predetermined value, the line is determined as an object line (step S166). Finally, a circumscribed rectangle of the object line group is detected as an object area in the parallax image (step S167).
  • an identification object object, object
  • object object
  • the identification object (object) displayed in the image area corresponding to the object area The actual height Ho can be calculated.
  • “zo” is the distance between the object corresponding to the object area and the vehicle calculated from the minimum parallax value d in the object area
  • “f” is the focal length of the camera (yomax-yomin) It is a value converted to the same unit as the unit of.
  • the object type classification unit 160 classifies the object type based on the information on the height, width, and depth of the object corresponding to the object area that can be calculated in this manner.
  • the table shown in FIG. 22 shows an example of table data for classifying object types. According to this, it is possible to distinguish and recognize whether an identification target (object) existing ahead of the host vehicle is a pedestrian, a bicycle, a small car, a truck or the like.
  • the three-dimensional position determination unit 161 Since the distance to the object corresponding to the detected object region and the distance on the image between the image center of the parallax image and the center of the object region on the parallax image are also grasped, the three-dimensional position of the object is determined. Can.
  • the relative lateral to the imaging units 110a and 110b of the identification target (object) can be calculated from the following equation [8] and equation [9].
  • the object tracking unit 162 executes processing of tracking (tracking) an object (object) detected from a frame of a previous (past) parallax image, using the object data list 170.
  • the object selection unit 163 selects whether or not to track the object based on whether the object stored in the object data list 170 is at a position suitable for tracking, or the like. Specifically, after a prediction range in parallax image data in which the object is predicted to be located is set based on the object prediction data of the object data list 170 and the height of the object within the prediction range is specified, The width of the object is identified from the identified height with reference to the object feature amount of the object data list 170, and the lateral position of the object on the parallax image data is estimated from the identified width.
  • the lateral position of the object estimated in this way is a predetermined tracking target condition (when the object is in a position where the probability of being present in the image is high, the position is appropriate for the object to be the tracking target, etc.) If the above is satisfied, the object is selected as a tracking target.
  • the object selection unit 163 may delete data of an object not selected as a tracking target from the object data list 170.
  • the object data list 170 is used, for example, to track data of each object detected from one frame over a plurality of subsequent frames.
  • the object data list 170 includes data of “object data”, “object prediction data”, and “object feature amount”, as shown in FIG.
  • Object data includes data of "position”, “size”, “distance”, “relative velocity”, “actual position”, and “actual size”.
  • “Position” is the upper left coordinates of the object in the parallax image.
  • the “size” is the size (the number of pixels of the width and the height) of the object in the parallax image.
  • “Distance” is an actual distance from the host vehicle to the object.
  • the “relative velocity” is the relative velocity between the vehicle and the object, which is calculated based on the previous and current frames.
  • the “relative speed” includes data of the amount of movement (m: meters) per frame in the traveling direction Z (depth direction) of the host vehicle and in the horizontal direction X (lateral direction).
  • the "actual position” is the actual relative position of the object relative to the host vehicle calculated based on the current frame.
  • the “actual position” includes, for example, data of the position in the lateral direction Z (m: meter) and the position in the depth Z direction (m: meter) of the center of the left and right ends of the object.
  • the "actual size” is the actual size of the object relative to the host vehicle calculated based on the current frame.
  • the “actual size” includes data of the width (m: meter) and the height (m: meter) of the object.
  • the “object prediction data” includes data such as “position”, “size”, “distance”, “relative velocity” and the like.
  • the “object prediction data” is data which is calculated based on the previous frame (for example, the immediately preceding frame) and which predicts the position of the object in the next frame.
  • the “object feature amount” includes data of “histogram peak position” and “distance between peaks”.
  • the “histogram peak position” is coordinates of a position where the value of disparity frequency in the real U map is relatively large.
  • the “peak-to-peak distance” is an actual distance between “histogram peak positions” in the real U map.
  • the data of the object data list 170 is sent to the display monitor 103 and the vehicle travel control unit 104 as an analysis result of the image analysis unit 102.
  • the display monitor 103 displays, for example, a green frame of the area of the object in the current frame based on, for example, the "position” and the "size” of the "object data” among the data of the object data list 170 which is the analysis result. Display with.
  • the "position” and the "size” of the "object data” are data indicating an area including the object.
  • the display monitor 103 corresponds to the predicted position of the object in the current frame based on, for example, the “position” and the “size” of the “object predicted data” among the data of the object data list 170 which is the analysis result.
  • An area to be displayed (hereinafter referred to as "tracking frame") is displayed, for example, with a red frame.
  • a parallax image for an object located at a distance of about 2 m to 80 m (normal distance) from the host vehicle is generated at high speed to detect and track the object. It is conceivable.
  • an object in a short distance is detected by an area such as the smallest rectangle including the object in the parallax image, for example, an area such as a tunnel is different from a bar at an entrance of a parking lot etc. Since the area is high, the area in which the host vehicle travels may be detected as an obstacle although it is vacant.
  • the value of the invalid pixel is complemented based on the pixel value of the periphery. Density is higher.
  • an object detected based on the number of pixels having a parallax value according to the object in the advancing area of the vehicle and the number of pixels included in the area of the object in the advancing area Reject the data of Thereby, highly accurate detection can be performed at high speed.
  • a distance image may be generated by integrating distance information generated using a detection device such as a millimeter wave radar or laser radar with respect to parallax images generated using a stereo camera.
  • detection and tracking of an object located at a distance of about 0.5 m to 60 m may be performed.
  • the detection accuracy may be further enhanced by using a stereo camera and a detection device such as a millimeter wave radar or a laser radar in combination and combining it with the above-described detection result of an object by the stereo camera.
  • a detection device such as a millimeter wave radar or a laser radar in combination and combining it with the above-described detection result of an object by the stereo camera.
  • each functional unit of the processing hardware unit 120 and the image analysis unit 102 may be configured to be realized by hardware, or may be configured to be realized by execution of a program stored in a storage device by a CPU. Good.
  • This program may be recorded in a computer readable recording medium and distributed by a file in an installable format or an executable format.
  • a CD-R Compact Disc Recordable
  • DVD Digital Versatile Disk
  • Blu-ray Disc etc.
  • recording media such as CD-ROM in which each program is stored, and HD 504 in which these programs are stored can be provided domestically or abroad as a program product (Program Product).
  • In-vehicle device control system (an example of "mobile device control system) 100 Self-vehicle 101 Imaging unit 102 Image analysis unit (an example of “image processing apparatus”) 103 Display monitor 104 Vehicle traveling control unit (an example of “control unit”) 110a, 110b imaging unit 120 processing hardware unit 140 short-distance processing unit 141 short-distance parallax image generating unit (an example of “generating unit”) 142 Reduced parallax image generation unit (an example of “reduction unit”) 143 Near object detection unit (an example of “detection unit”) 144 Short range object rejection part (an example of "rejection part”) 145 Short-distance object tracking unit 151 Parallax image generation unit 152 V map generation unit 153 Road surface shape detection unit 154 Road surface height table calculation unit 155 U map generation unit 156 Real U map generation unit 157 Isolated area detection unit 158 Correspondence area detection unit 159 Object region extraction unit 160 Object type classification unit 161 Three-dimensional position determination unit 162 Object tracking unit 163

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Traffic Control Systems (AREA)
  • Image Analysis (AREA)
  • Closed-Circuit Television Systems (AREA)
  • Image Processing (AREA)

Abstract

画像処理装置において、複数の撮像部で各々撮影されたフレームに応じた、前記複数の撮像部から所定距離内に位置する物体の距離に応じた画素値を有する距離画像の画素数を縮小する縮小部と、前記縮小された距離画像に基づいて、前記物体を検出する検出部と、前記複数の撮像部を備える移動体の進行する進行領域における前記物体に応じた距離の値を有する画素の数と、前記進行領域における前記物体の領域に含まれる画素の数に基づいて、前記検出された前記物体のデータを棄却する棄却部と、を備える。

Description

画像処理装置、撮像装置、移動体機器制御システム、画像処理方法、及びプログラム
 本発明は、画像処理装置、撮像装置、移動体機器制御システム、画像処理方法、及びプログラムに関する。
 自動車の安全性において、従来は歩行者や自動車と衝突したときに、いかに歩行者を守れるか、乗員を保護できるかの観点から自動車のボディー構造などの開発が行われてきた。しかしながら近年、情報処理技術、画像処理技術の発達により、高速に人や自動車等を検出する技術が開発されてきている。これらの技術を応用して、衝突する前に自動的にブレーキをかけ、衝突を未然に防ぐという自動車もすでに発売されている。
 自動的にブレーキをかけるには人や他車等の物体までの距離を測定する必要があり、そのために、ミリ波レーダ、レーザレーダ、ステレオカメラを用いた測定が実用化されている。
 このステレオカメラを用いた測定において、遠距離と近距離とで重複して検出した立体物のデータを整理して統合する技術が知られている(例えば、特許文献1参照)。
特開平11-039596号公報
 しかし、従来技術では、物体を検出する処理を高速に行う場合、検出の精度が下がるという問題がある。
 そこで、精度の高い検出を高速に行う技術を提供することを目的とする。
 画像処理装置において、複数の撮像部で各々撮影されたフレームに応じた、前記複数の撮像部から所定距離内に位置する物体の距離に応じた画素値を有する距離画像の画素数を縮小する縮小部と、前記縮小された距離画像に基づいて、前記物体を検出する検出部と、前記複数の撮像部を備える移動体の進行する進行領域における前記物体に応じた距離の値を有する画素の数と、前記進行領域における前記物体の領域に含まれる画素の数に基づいて、前記検出された前記物体のデータを棄却する棄却部と、を備える。
 開示の技術によれば、精度の高い検出を高速に行うことが可能となる。
実施形態に係る車載機器制御システムの構成を示す模式図である。 撮像ユニット及び画像解析ユニットの構成を示す模式図である。 三角測量の原理を利用することで視差値から距離を算出する原理を説明するための図である。 画像処理装置を含む撮像装置の機能ブロック図である。 近距離処理部の機能ブロック図である。 基準画像と視差画像について説明する図である。 基準画像と視差画像について説明する図である。 進行領域物体棄却処理の一例を示すフローチャートである。 進行領域物体棄却処理について説明する図である。 トンネルを検出した場合の進行領域物体棄却処理について説明する図である。 トンネルを検出した場合の進行領域物体棄却処理について説明する図である。 トンネルを検出した場合の進行領域物体棄却処理について説明する図である。 トンネルを検出した場合の進行領域物体棄却処理について説明する図である。 通常距離処理部の機能ブロック図である。 視差画像データ、及びその視差画像データから生成されるVマップについて説明するための図である。 視差画像データ、及びその視差画像データから生成されるVマップについて説明するための図である。 一方の撮像部で撮像された基準画像としての撮影画像の画像例と、その撮影画像に対応するVマップを示す図である。 一方の撮像部で撮像された基準画像としての撮影画像の画像例と、その撮影画像に対応するVマップを示す図である。 基準画像の一例を模式的に表した画像例を示す図である。 画像例に対応するUマップを示す図である。 画像例に対応するUマップを示す図である。 Uマップに対応するリアルUマップを示す図である。 Uマップの横軸の値からリアルUマップの横軸の値を求める方法を説明するための図である。 孤立領域検出部で行う孤立領域検出処理の流れを示すフローチャートである。 孤立領域検出部で検出された孤立領域が内接する矩形領域を設定したリアル頻度Uマップを示す図である。 矩形領域に対応する走査範囲を設定した視差画像を示す図である。 走査範囲を探索してオブジェクト領域を設定した視差画像を示す図である。 視差画像の対応領域検出部及びオブジェクト領域抽出部で行われる処理の流れを示すフローチャートである。 オブジェクトタイプの分類を行うためのテーブルデータの一例を示す図である。 オブジェクトデータリストのデータ項目の一例を示す説明図である。
 以下、実施形態に係る画像処理装置を有する移動体機器制御システムについて説明する。
 〈車載機器制御システムの構成〉
 図1は、本発明の実施形態に係る移動体機器制御システムとしての車載機器制御システムの構成を示す図である。
 この車載機器制御システム1は、移動体である自動車などの自車両100に搭載されており、撮像ユニット101、画像解析ユニット102、表示モニタ103、及び車両走行制御ユニット104からなる。そして、撮像ユニット101で、移動体の前方を撮像した自車両進行方向前方領域(撮像領域)の複数の撮像画像データ(フレーム)から、自車両前方の物体を検出し、その検出結果を利用して移動体や各種車載機器の制御を行う。移動体の制御には、例えば、警告の報知、自車両100(自移動体)のハンドルの制御、または自車両100(自移動体)のブレーキが含まれる。
 撮像ユニット101は、例えば、自車両100のフロントガラス105のルームミラー(図示せず)付近に設置される。撮像ユニット101の撮像によって得られる撮像画像データ等の各種データは、画像処理手段としての画像解析ユニット102に入力される。
 画像解析ユニット102は、撮像ユニット101から送信されてくるデータを解析して、自車両100が走行している路面部分(自車両の真下に位置する路面部分)に対する自車両前方の走行路面上の各地点における相対的な高さ(位置情報)を検出し、自車両前方の走行路面の3次元形状を把握する。また、自車両前方の他車両、歩行者、各種障害物などの認識対象物を認識する。
 画像解析ユニット102の解析結果は、表示モニタ103及び車両走行制御ユニット104に送られる。表示モニタ103は、撮像ユニット101で得られた撮像画像データ及び解析結果を表示する。車両走行制御ユニット104は、画像解析ユニット102による自車両前方の他車両、歩行者、各種障害物などの認識対象物の認識結果に基づいて、例えば、自車両100の運転者へ警告を報知したり、自車両のハンドルやブレーキを制御するなどの走行支援制御を行う。
 〈撮像ユニット101及び画像解析ユニット102の構成〉
 図2は、撮像ユニット101及び画像解析ユニット102の構成を示す図である。
 撮像ユニット101は、撮像手段としての2つの撮像部110a,110bを備えたステレオカメラで構成されており、2つの撮像部110a,110bは同一のものである。各撮像部110a,110bは、それぞれ、撮像レンズ111a,111bと、受光素子が2次元配置された画像センサ113a,113bを含んだセンサ基板114a,114bと、センサ基板114a,114bから出力されるアナログ電気信号(画像センサ113a,113b上の各受光素子が受光した受光量に対応する電気信号)をデジタル電気信号に変換した撮像画像データを生成して出力する信号処理部115a,115bとから構成されている。撮像ユニット101からは、例えば輝度画像データが出力される。
 また、撮像ユニット101は、FPGA(Field-Programmable Gate Array)等からなる処理ハードウェア部120を備えている。この処理ハードウェア部120は、各撮像部110a,110bから出力される輝度画像データから視差画像を得るために、各撮像部110a,110bでそれぞれ撮像した撮像画像間の対応画像部分の視差値を演算する視差画像情報生成手段としての視差演算部121を備えている。
 ここでいう視差値とは、各撮像部110a,110bでそれぞれ撮像した撮像画像の一方を基準画像、他方を比較画像とし、撮像領域内の同一地点に対応した基準画像上の画像部分に対する比較画像上の画像部分の位置ズレ量を、当該画像部分の視差値として算出したものである。三角測量の原理を利用することで、この視差値から当該画像部分に対応した撮像領域内の当該同一地点までの距離を算出することができる。
 図3は、三角測量の原理を利用することで視差値から距離を算出する原理を説明するための図である。図において、fは撮像レンズ111a,111bのそれぞれの焦点距離であり、Dは光軸間の距離である。また、Zは撮像レンズ111a,111bから被写体301までの距離(光軸に平行な方向の距離)である。この図において、被写体301上にある点Oに対する左右画像での結像位置は、結像中心からの距離がそれぞれΔ1とΔ2となる。このときの視差値dは、d=Δ1+Δ2と規定することができる。
 図2の説明に戻る。画像解析ユニット102は、画像処理基板等から構成され、撮像ユニット101から出力される輝度画像データ及び視差画像データ等を記憶するRAMやROM等で構成される記憶手段122と、識別対象の認識処理や視差計算制御などを行うためのコンピュータプログラムを実行するCPU(Central Processing Unit)123と、データI/F(インタフェース)124と、シリアルI/F125を備えている。
 処理ハードウェア部120を構成するFPGAは、画像データに対してリアルタイム性が要求される処理、例えばガンマ補正、ゆがみ補正(左右の撮像画像の平行化)、ブロックマッチングによる視差演算を行って視差画像の情報を生成し、画像解析ユニット102のRAMに書き出す処理などを行う。画像解析ユニット102のCPUは、各撮像部110A,110Bの画像センサコントローラの制御および画像処理基板の全体的な制御を担うとともに、路面の3次元形状の検出処理、ガードレールその他の各種オブジェクト(物体)の検出処理などを実行するプログラムをROMからロードして、RAMに蓄えられた輝度画像データや視差画像データ等を入力として各種処理を実行し、その処理結果をデータI/F124やシリアルI/F125から外部へと出力する。このような処理の実行に際し、データI/F124を利用して、自車両100の車速、加速度(主に自車両前後方向に生じる加速度)、操舵角、ヨーレートなどの車両動作情報を入力し、各種処理のパラメータとして使用することもできる。外部に出力されるデータは、自車両100の各種機器の制御(ブレーキ制御、車速制御、警告制御など)を行うための入力データとして使用される。
 なお、撮像ユニット101及び画像解析ユニット102は、一体の装置である撮像装置2として構成してもよい。
 図4は、図2における処理ハードウェア部120及び画像解析ユニット102で実現される物体検出処理を行う画像処理装置を含む撮像装置の機能ブロック図である。
 この撮像装置は、ステレオカメラ画像取得部130、近距離処理部140、通常距離処理部150、オブジェクトデータリスト170を有する。
 ステレオカメラ画像取得部130は、ステレオカメラで撮影した画像を取得する。近距離処理部140は、近距離(自車両から所定距離内)に位置する物体の検出や追跡を行う。通常距離処理部150は、近距離よりも遠い距離に位置する物体の検出や追跡を行う。オブジェクトデータリスト170は、近距離処理部140、及び通常距離処理部150が検出した物体(オブジェクト)のデータを記憶するとともに、表示モニタ103及び車両走行制御ユニット104に出力する。
 なお、近距離処理部140の近距離物体検出処理と、通常距離処理部150の通常距離物体検出処理は、少なくとも一部を並列に処理を実行してもよいし、順番に処理を実行してもよい。例えば、処理ハードウェア部120の視差演算部121による処理は、視差画像生成処理を行った後に、近距離視差画像生成処理を行い、その他の画像解析ユニット102による処理は並列に行うようにしてもよい。
 以下、本実施形態における物体検出処理について説明する。
 〈ステレオカメラ画像取得〉
 ステレオカメラ画像取得部130は、ステレオカメラを構成する2つの撮像部110a,110bから、輝度画像データを取得する。このとき、撮像部110a,110bがカラーの場合には、そのRGB信号から輝度信号(Y)を得るカラー輝度変換を、例えば下記の式〔1〕を用いて行う。
 Y=0.3R+0.59G+0.11B …式〔1〕
 〈近距離処理〉
 次に、図5を参照し、近距離処理部140の機能について説明する。図5は、近距離処理部140の機能ブロック図である。近距離処理部140は、近距離(自車両から所定距離内)の物体の検出や追跡を行う。近距離処理部140は、近距離視差画像生成部141、縮小視差画像生成部142、近距離物体検出部143、近距離物体棄却部144、近距離物体追跡部145を有する。
 《近距離視差画像生成処理》
 近距離視差画像生成部141は、例えば、処理ハードウェア部120の視差演算部121によって実現してもよい。
 近距離視差画像生成部141は、自車両(ステレオカメラ)から所定距離内に位置する物体に対する視差画像データ(視差画像情報)を生成する近距離視差画像生成処理を行う。近距離視差画像生成処理では、まず、2つの撮像部110a,110bのうちの一方の撮像部110aの輝度画像データを基準画像データとし、他方の撮像部110bの輝度画像データを比較画像データとし、これらを用いて、自車両から所定距離内に位置する物体に対する視差を演算し、視差画像データを生成して出力する。この視差画像データは、基準画像データ上の各画像部分について算出される視差値dに応じた画素値をそれぞれの画像部分の画素値として表した視差画像を示すものである。
 具体的には、近距離視差画像生成部141は、基準画像データのある行について、一つの注目画素を中心とした複数画素(例えば16画素×1画素)からなるブロックを定義する。そして、比較画像データにおける同じ行において、定義した基準画像データのブロックと同じサイズのブロックを1画素ずつ横ライン方向(x方向)へずらす。この際、近距離視差画像生成処理では、ブロックをずらす横ライン方向の範囲を、自車両から所定距離内(例えば1m~6m以内)に対応する範囲とする。それにより、自車両から所定距離内に位置する物体に対する視差が探索される。
 そして、近距離視差画像生成部141は、基準画像データにおいて定義したブロックの画素値の特徴を示す特徴量と比較画像データにおける各ブロックの画素値の特徴を示す特徴量との相関を示す相関値を、それぞれ算出する。そして、算出した相関値に基づき、比較画像データにおける各ブロックの中で最も基準画像データのブロックと相関が高い比較画像データのブロックを選定するマッチング処理を行う。その後、基準画像データのブロックの注目画素と、マッチング処理で選定された比較画像データのブロックの対応画素との位置ズレ量を視差値dとして算出する。このような視差値dを算出する処理を基準画像データの全域又は特定の一領域について行うことで、視差画像データを得ることができる。
 また、近距離視差画像生成部141は、上述のマッチング処理を行う際、比較画像データにおける各ブロックの中で、基準画像データのブロックとの相関値が最も高い値に近い(最も高い値から所定値以内)ブロックが複数あるか否か判断し、複数ある場合は、フェンス等の繰り返しパターンが検知されたと判断し、視差値dとして、繰り返しパターンであることを示す値を設定する。
 マッチング処理に用いるブロックの特徴量としては、例えば、ブロック内の各画素の値(輝度値)を用いることができ、相関値としては、例えば、基準画像データのブロック内の各画素の値(輝度値)と、これらの画素にそれぞれ対応する比較画像データのブロック内の各画素の値(輝度値)との差分の絶対値の総和を用いることができる。この場合、当該総和が最も小さくなるブロックが最も相関があると言える。
 近距離視差画像生成部141でのマッチング処理をハードウェア処理によって実現する場合には、例えばSSD(Sum of Squared Difference)、ZSSD(Zero-mean Sum of Squared Difference)、SAD(Sum of Absolute Difference)、ZSAD(Zero-mean Sum of Absolute Difference)、NCC(Normalized cross correlation)などの方法を用いることができる。なお、マッチング処理では画素単位での視差値しか算出できないので、1画素未満のサブピクセルレベルの視差値が必要な場合には推定値を用いる必要がある。その推定方法としては、例えば、等角直線方式、二次曲線方式等を利用することができる。
 《縮小視差画像生成処理》
 次に、縮小視差画像生成部142について説明する。縮小視差画像生成部142は、近距離視差画像生成部141により生成された、自車両から所定距離内に位置する物体に対する視差画像から、所定の間隔で画素を抽出することにより、縮小された(画素数が少ない)縮小視差画像を作成する。例えば1280×640画素の視差画像を、縦及び横に例えば1/10に縮小する場合、縮小視差画像は128×64画素となる。
 縮小視差画像生成部142は、視差画像を縮小する際、視差画像から一定間隔で画素を抽出し、抽出した画素の視差値が、例えば無限遠であることを示す値の場合、または繰り返しパターンであることを示す値等の無効な値の場合、当該抽出した画素の周辺の画素値に基づいて、当該抽出した画素の値を決定(補完)する。
 縮小視差画像生成部142は、例えば、当該抽出した画素の周辺において、所定の優先順位順で、有効な値を有する画素を探索し、無効でない(有効な)値を有する画素があれば、当該無効でない値を、当該抽出した画素の値とする。
 所定の優先順位としては、例えば、抽出した画素661から所定距離(画素)づつ離れた所定の画素群のうち、距離が近い順としてもよい。
 縮小視差画像生成部142は、例えば、当該抽出した画素、及びその周辺の画素の平均値を、当該抽出した画素の値としてもよい。
 また、縮小視差画像生成部142は、近距離視差画像生成部141により、例えば、フェンス等の繰り返しパターンが検知された場合等、視差としての信頼性が低い場合に、当該抽出した画素の視差値が無効な値と判断し、周辺の画素値に基づいて、抽出した画素の値を決定する。
 上述のような、周辺の画素値に基づいて、抽出した画素の値を決定する処理を行う理由について、以下に説明する。視差画像を縮小する際、単純に一定間隔で画素を抽出すると、物体の視差の値が算出されていない画素ばかりが抽出される可能性がある。
 物体が存在する領域において、物体の視差の値が算出されていない画素が抽出される理由について、図6A、図6Bを参照して説明する。図6A、図6Bは、基準画像と視差画像について説明する図である。図6Aのような、先行車両が写っている画像に対する視差画像を生成する場合、同色の部分は輝度の差が少ないため、視差値の算出ができず、無効な値(例えば無限遠)となることが多い。そのため、図6Bのように、先行車両が写っている領域において、黒色で示す無効な値を有する画素が多くなる。
 図6Bにおいて、黒色で示される画素ばかりが抽出された場合、物体が存在しないと判断される場合がある。そのため、上述のような、周辺の画素値を基に、抽出された画素値を補完する処理を行う。
 《近距離物体検出処理》
 近距離物体検出部143は、縮小視差画像生成部142により生成された、自車両から所定距離内に位置する物体に対する縮小視差画像に基づいて、物体を検出する。
 近距離物体検出部143は、縮小視差画像の各画素の視差値に基づいて、各画素に写っている物体の自車両からの実距離を算出し、隣り合う画素の自車両からの実距離の差が所定値(例えば20cm)以内であれば、同一のラベルを付加する。ここで、「隣り合う」とは、上下左右の4方向でも、右上、左上、右下、左下を含む8方向でも良い。
 近距離物体検出部143は、ラベリング(同一のラベルを付加)された単位を一つのオブジェクトとして検出する。そして、近距離物体検出部143は、隣接するオブジェクト同士が所定の結合条件を満たしている場合は、当該隣接するオブジェクト同士を1つのオブジェクトとして検出する。所定の結合条件は、例えば、「隣接するオブジェクト同士の縦または横のいずれか一辺が半分以上重なっており、隣接するオブジェクト同士の自車両からの実距離の差が1m未満であること」等とする。それにより、壁などの、自車両の進行方向に対して斜めに沿って位置する物体を1つのオブジェクトとして捉えることができる。
 近距離物体検出部143は、縮小視差画像における、オブジェクトを含む矩形または正方形の領域を、当該オブジェクトの領域として検出する。
 《近距離物体棄却処理》
 近距離物体棄却部144は、近距離物体検出部143により検出されたオブジェクトのうち、トラッキングの対象としないオブジェクトのデータを棄却(破棄)する。
 近距離物体棄却部144は、近距離物体検出部143に検出されたオブジェクトの領域の縦及び横の画素数と、当該領域に含まれる画素の視差値に基づき、当該オブジェクトの大きさを算出する。そして、予め設定されている、人や車両の大きさと比較し、大き過ぎる(所定の閾値以上である)オブジェクトや、小さ過ぎる(所定の閾値以下である)オブジェクトは棄却(データを破棄)する。
 また、近距離物体棄却部144は、オブジェクトの領域の縦及び横の画素の位置(座標)と、当該領域に含まれる画素の視差値に基づき、当該オブジェクトの3次元位置を算出する。なお、3次元位置の算出方法は、後述する3次元位置決定部161による算出方法と同様でも良い。そして、前回のフレーム(ステレオカメラの画像)に基づいて、後述する路面高さテーブル算出部154によってテーブル化された各路面部分の高さを参照し、路面からの高さが高すぎる(所定の閾値以上である)オブジェクトは棄却する。
 また、近距離物体棄却部144は、オブジェクトの領域の視差密度を算出し、視差密度が低すぎるオブジェクトは棄却する。なお、この際の視差密度は、例えば、オブジェクトの領域に含まれる画素のうち、当該オブジェクトに応じた視差値を有する画素の数(A)を、オブジェクトを含む領域に含まれる全画素数(S)で除算(A/S)することにより算出する。それにより、例えば駐車場の出入り口のバーが斜めに上がっている際に、当該バーを含む矩形領域を、障害物と判断しないようにすることができる。
 また、近距離物体棄却部144は、自車両が進行する領域におけるオブジェクトの視差密度に基づいて、オブジェクトを棄却する、進行領域物体棄却処理を行う。
 この進行領域物体棄却処理において、近距離物体棄却部144は、自車両の進行する進行領域における物体に応じた視差値を有する画素の数と、進行領域における当該物体の領域に含まれる画素の数に基づいて、近距離物体検出部143により検出された物体のデータを棄却(破棄)する。
 また、近距離物体棄却部144は、自車両の高さ及び幅と、近距離物体検出部143により検出された物体の自車両からの距離(実距離)に基づいて、進行領域を算出する。
 次に、図7を参照して、近距離物体棄却部144による、進行領域物体棄却処理の詳細例について説明する。図7は、進行領域物体棄却処理の一例を示すフローチャートである。
 まず、近距離物体棄却部144は、例えば近距離物体検出部143によりラベリングが行われる際、オブジェクトに対応する進行領域要素数を初期化(例えば0)する(ステップS201)。
 続いて、近距離物体棄却部144は、近距離物体検出部143により、画素が当該オブジェクトの構成要素であると判断され、当該画素に当該オブジェクトの構成要素であることを示すラベルを付加されたことを検知する(ステップS202)。
 続いて、近距離物体棄却部144は、当該ラベルを付加された画素の位置(座標)が、自車両が進行する領域(進行領域、中央領域)内であるか判断する(ステップS203)。
 当該ラベルを付加された画素の位置(座標)が、進行領域内でなければ(ステップS203でNO)、後述するステップS205の処理に進む。
 当該ラベルを付加された画素の位置(座標)が、進行領域内であれば(ステップS203でYES)、当該オブジェクトに対応付けて記憶している進行領域要素数をインクリメント(1つ増加)する(ステップS204)。
 続いて、近距離物体棄却部144は、近距離物体検出部143により、一の縮小視差画像のフレームにおいて、当該オブジェクトであると判断されて当該ラベルを付加される画素が他にあるか判断する(ステップS205)。
 一の縮小視差画像のフレームにおいて、当該オブジェクトであると判断されて当該ラベルを付加される画素が他にあれば(ステップS205でYES)、ステップS202の処理に進む。
 一の縮小視差画像のフレームにおいて、当該オブジェクトであると判断され当該ラベルを付加される画素が他になければ(ステップS205でNO)、当該オブジェクトの領域(オブジェクトを含む最少の矩形等の領域)内で、進行領域に含まれる領域の画素の総数を算出する(ステップS206)。
 続いて、近距離物体棄却部144は、上述した進行領域要素数と、ステップS206で算出した進行領域に含まれる画素の総数に基づいて、進行領域と重なる領域におけるオブジェクトの視差密度を算出する(ステップS207)。なお、進行領域と重なる領域におけるオブジェクトの視差密度は、例えば、オブジェクトの進行領域要素数を、当該オブジェクトを含む最少の矩形等の領域内で進行領域に含まれる画素の総数で除算することにより算出する。
 続いて、近距離物体棄却部144は、進行領域と重なる領域におけるオブジェクトの視差密度が、所定の閾値(例えば20%)以下であるか判断する(ステップS208)。
 進行領域と重なる領域におけるオブジェクトの視差密度が、所定の閾値以下でなければ(ステップS208でNO)、処理を終了する。
 進行領域と重なる領域におけるオブジェクトの視差密度が、所定の閾値以下であれば(ステップS208でYES)、自車両の進行を妨げない物体であると判断して、当該オブジェクトを棄却し(ステップS209)、処理を終了する。
 ここで、進行領域は、例えば、縮小視差画像における所定の領域として予め設定してもよいし、予め設定されている自車両の高さ、及び幅と、ラベルを付加された画素の自車両からの実距離に基づいて算出してもよい。
 進行領域を予め設定する場合、例えば、図8に示すように、縮小視差画像の全領域251における上辺、左辺、及び右辺からそれぞれ1/4の長さの領域以外の領域を、進行領域252としてもよい。
 進行領域を、自車両の高さ、及び幅と、ラベルを付加された画素の自車両からの実距離に基づいて算出する場合、当該実距離における自車両の高さ、及び幅に対応する縮小視差画像の領域を、進行領域すればよい。なおこの場合、ラベルを付加された画素の自車両からの実距離の値を用いる代わりに、ラベルを付加された画素が含まれるオブジェクトの自車両からの実距離(例えば、オブジェクトに含まれる各画素の実距離の平均値)を用いて、進行領域を算出してもよい。
 次に、図8を参照し、近距離物体棄却部144による進行領域物体棄却処理について説明する。図8は、進行領域物体棄却処理について説明する図である。
 近距離物体棄却部144は、オブジェクトを含む最少の矩形等の領域253と、進行領域252とが重なる領域254において、上述したように、進行領域と重なる領域におけるオブジェクトの視差密度を算出する。
 次に、図9A乃至図9Dを参照し、オブジェクトとしてトンネルを検出した場合の、近距離物体棄却部144による進行領域物体棄却処理について説明する。図9A乃至図9Dは、トンネルを検出した場合の進行領域物体棄却処理について説明する図である。
 図9Aは、基準画像に写ったトンネルの例を示す図である。図9Bは、トンネルを含む最少の矩形等の領域253aの例を示す図である。
 図9Cは、進行領域252aが予め設定されている場合の例を示す図である。図9Cの例では、自車両がトンネルに入る前であり、自車両の進行領域252aが、トンネルを含む最少の矩形等の領域253aに含まれる。そのため、トンネルを含む最少の矩形等の領域253a内で、進行領域252aに含まれる領域254aは、進行領域252aの全体となる。この場合、進行領域と重なる領域におけるオブジェクトの視差密度は、例えば、進行領域252aに含まれるトンネルに対する視差値を有する領域255の画素(近距離物体検出処理によりラベルを付加された画素、進行領域要素)の数を、領域254aに含まれる画素の数で除算することにより算出する。
 図9Dは、進行領域252aを、自車両の高さ、及び幅と、ラベルを付加された画素の自車両からの実距離に基づいて算出する場合の例を示す図である。この場合、図7のステップS208で使用する所定の閾値を、例えば0%としてもよい。
 なお、トンネルの奥に先行車両等のオブジェクトが存在する場合、先行車両等の自車両からの実距離と、トンネルの自車両からの実距離との差は十分大きくなるため、近距離物体検出部143により、同一のラベルは付加されない。そのため、トンネルの奥に先行車両等のオブジェクトが存在する場合であっても、上述の、進行領域と重なる領域におけるオブジェクトの視差密度には影響しない。
 《近距離物体追跡処理》
 近距離物体追跡部145は、近距離物体検出部143により検出され、近距離物体棄却部144に棄却されなかったオブジェクトの追跡を行う。
 近距離物体追跡部145は、オブジェクトデータリスト170を参照し、近距離物体検出部143により検出されたオブジェクトが、オブジェクトデータリスト170に記憶されていなければ、新規の検出であると判断し、当該オブジェクトをオブジェクトデータリスト170に記憶する。検出されたオブジェクトが、オブジェクトデータリスト170に記憶されていれば、オブジェクトデータリスト170に記憶されている当該オブジェクトに対するデータを、検出されたオブジェクトに基づくデータに更新する。
 検出されたオブジェクトが、オブジェクトデータリスト170に記憶されているかの判断は、例えば、検出されたオブジェクトの自車両からの実距離と、オブジェクトデータリスト170に記憶されているオブジェクトの自車両からの実距離との差が、所定値以下であるかに応じて判断する。
 〈通常距離物体検出処理〉
 次に、図10を参照し、図4の通常距離処理部150の機能について説明する。図10は、通常距離処理部150の機能ブロック図である。通常距離処理部150は、自車両から所定距離(例えば2m)以上である通常距離の物体の検出や追跡を行う。
 《視差画像生成処理》
 視差画像生成部151は、例えば、処理ハードウェア部120の視差演算部121によって実現してもよい。
 視差画像生成部151は、上述した近距離視差画像生成部141よりも遠い範囲(自車両から例えば2m~80m程度)に位置する物体に対する視差画像データ(視差画像情報)を生成する視差画像生成処理を行う。
 この視差画像生成処理は、上述した近距離視差画像生成部141による近距離視差画像生成処理と同様であるが、この視差画像生成処理においては、近距離視差画像生成処理と例えば以下が異なる。視差画像生成部151は、基準画像データにおいて定義したブロックを、比較画像データにおける同じ行において、横ライン方向へずらす際、ブロックをずらす横ライン方向の範囲を、自車両から所定距離内(例えば2m~80m)に対応する範囲とする。それにより、自車両から、比較的遠い距離に位置する物体に対する視差が探索される。
 《Vマップ生成処理》
 視差画像補間処理を行ったら、次に、Vマップ生成部152において、Vマップを生成するVマップ生成処理を実行する。視差画像データに含まれる各視差画素データは、x方向位置とy方向位置と視差値dとの組(x,y,d)で示される。これを、X軸にd、Y軸にy、Z軸に頻度fを設定した三次元座標情報(d,y,f)に変換したもの、又はこの三次元座標情報(d,y,f)から所定の頻度閾値を超える情報に限定した三次元座標情報(d,y,f)を、視差ヒストグラム情報として生成する。本実施形態の視差ヒストグラム情報は、三次元座標情報(d,y,f)からなり、この三次元ヒストグラム情報をX-Yの2次元座標系に分布させたものを、Vマップ(視差ヒストグラムマップ、V-disparity map)と呼ぶ。
 具体的に説明すると、Vマップ生成部152は、画像を上下方向に複数分割して得られる視差画像データの各行領域について、視差値頻度分布を計算する。この視差値頻度分布を示す情報が視差ヒストグラム情報である。
 図11A、図11Bは視差画像データ、及びその視差画像データから生成されるVマップについて説明するための図である。ここで、図11Aは視差画像の視差値分布の一例を示す図であり、図11Bは、図11Aの視差画像の行毎の視差値頻度分布を示すVマップを示す図である。
 図11Aに示すような視差値分布をもった視差画像データが入力されたとき、Vマップ生成部152は、行毎の各視差値のデータの個数の分布である視差値頻度分布を計算し、これを視差ヒストグラム情報として出力する。このようにして得られる各行の視差値頻度分布の情報を、Y軸に視差画像上のy方向位置(撮像画像の上下方向位置)をとりX軸に視差値をとった二次元直交座標系上に表すことで、図11Bに示すようなVマップを得ることができる。このVマップは、頻度fに応じた画素値をもつ画素が前記二次元直交座標系上に分布した画像として表現することもできる。
 図12A、図12Bは、一方の撮像部で撮像された基準画像としての撮影画像の画像例と、その撮影画像に対応するVマップを示す図である。ここで、図12Aが撮影画像であり、図12BがVマップである。即ち、図12Aに示すような撮影画像から図12Bに示すVマップが生成される。Vマップでは、路面より下の領域には視差は検出されないので、斜線で示した領域Aで視差がカウントされることはない。
 図12Aに示す画像例では、自車両が走行している路面401と、自車両の前方に存在する先行車両402と、路外に存在する電柱403が映し出されている。また、図12Bに示すVマップには、画像例に対応して、路面501、先行車両502、及び電柱503がある。
 この画像例は、自車両の前方路面が相対的に平坦な路面、即ち、自車両の前方路面が自車両の真下の路面部分と平行な面を自車両前方へ延長して得られる仮想の基準路面(仮想基準移動面)に一致している場合のものである。この場合、画像の下部に対応するVマップの下部において、高頻度の点は、画像上方へ向かうほど視差値dが小さくなるような傾きをもった略直線状に分布する。このような分布を示す画素は、視差画像上の各行においてほぼ同一距離に存在していてかつ最も占有率が高く、しかも画像上方へ向かうほど距離が連続的に遠くなる識別対象物を映し出した画素であると言える。
 撮像部110aでは自車両前方領域を撮像するため、その撮像画像の内容は、図12Aに示すように、画像上方へ向かうほど路面の視差値dは小さくなる。また、同じ行(横ライン)内において、路面を映し出す画素はほぼ同じ視差値dを持つことになる。従って、Vマップ上において上述した略直線状に分布する高頻度の点は、路面(移動面)を映し出す画素が持つ特徴に対応したものである。よって、Vマップ上における高頻度の点を直線近似して得られる近似直線上又はその近傍に分布する点の画素は、高い精度で、路面を映し出している画素であると推定することができる。また、各画素に映し出されている路面部分までの距離は、当該近似直線上の対応点の視差値dから高精度に求めることができる。
 《路面形状検出処理》
次に、本実施形態では、Vマップ生成部152が生成したVマップの情報(視差ヒストグラム情報)から、路面形状検出部153において、自車両100の前方路面の3次元形状を検出する路面形状検出処理が実行される。
 図12Aに示す画像例では、自車両100が走行している路面401と、自車両100の前方に存在する先行車両402と、路外に存在する電柱403が映し出されている。この画像例は、自車両100の前方路面が相対的に平坦な路面、すなわち、自車両100の前方路面が自車両100の真下の路面部分と平行な面を自車前方へ延長して得られる仮想の基準路面(仮想基準移動面)に一致している場合のものである。この場合、画像の下部に対応するVマップの下部において、高頻度の点(路面501)は、画像上方へ向かうほど視差値dが小さくなるような傾きをもった略直線状に分布する。このような分布を示す画素は、視差画像上の各行においてほぼ同一距離に存在していてかつ最も占有率が高く、しかも画像上方へ向かうほど距離が連続的に遠くなる検出対象物を映し出した画素であると言える。
 撮像部110Aでは自車前方領域を撮像するため、その撮像画像の内容は、図12Bに示すように、画像上方へ向かうほど路面の視差値dは小さくなる。また、同じ行(横ライン)内において、路面を映し出す画素はほぼ同じ視差値dを持つことになる。したがって、Vマップ上において上述した略直線状に分布する高頻度の点(路面501)は、路面(移動面)を映し出す画素が持つ特徴に対応したものである。よって、Vマップ上における高頻度の点を直線近似して得られる近似直線上又はその近傍に分布する点の画素は、高い精度で、路面を映し出している画素であると推定することができる。また、各画素に映し出されている路面部分までの距離は、当該近似直線上の対応点の視差値dから高精度に求めることができる。
 《路面高さテーブル算出処理》
 次に、路面高さテーブル算出部154において、路面高さ(自車の真下の路面部分に対する相対的な高さ)を算出してテーブル化する路面高さテーブル算出処理を行う。路面形状検出部153により生成されたVマップ上の近似直線の情報から、撮像画像上の各行領域(画像上下方向の各位置)に映し出されている各路面部分までの距離を算出できる。一方、自車の真下に位置する路面部分をその面に平行となるように自車進行方向前方へ延長した仮想平面の自車進行方向における各面部分が、撮像画像中のどの各行領域に映し出されるかは予め決まっており、この仮想平面(基準路面)はVマップ上で直線(基準直線)により表される。路面形状検出部153から出力される近似直線を基準直線と比較することで、自車前方の各路面部分の高さを得ることができる。簡易的には、路面形状検出部153から出力される近似直線上のY軸位置から、これに対応する視差値から求められる距離だけ自車前方に存在する路面部分の高さを算出できる。路面高さテーブル算出部154では、近似直線から得られる各路面部分の高さを、必要な視差範囲についてテーブル化する。
 なお、ある視差値dにおいてY軸位置がy'である地点に対応する撮像画像部分に映し出されている物体の路面からの高さは、当該視差値dにおける近似直線上のY軸位置をy0としたとき、(y'-y0)から算出することができる。一般に、Vマップ上における座標(d,y')に対応する物体についての路面からの高さHは、下記の式(2)より算出することができる。ただし、下記の式(2)において、「z」は、視差値dから計算される距離(z=BF/(d-offset))であり、「f」はカメラの焦点距離を(y'-y0)の単位と同じ単位に変換した値である。ここで、「BF」は、ステレオカメラの基線長と焦点距離を乗じた値であり、「offset」は無限遠の物体を撮影したときの視差値である。
 H = z×(y'-y0)/f ・・・(2)
 《Uマップ生成処理》
 次に、Uマップ生成部155は、Uマップ(U-disparity map)を生成するUマップ生成処理として、頻度Uマップ生成処理及び高さUマップ生成処理を実行する。
 頻度Uマップ生成処理では、視差画像データに含まれる各視差画素データにおけるx方向位置とy方向位置と視差値dとの組(x,y,d)を、X軸にx、Y軸にd、Z軸に頻度を設定し、X-Yの2次元ヒストグラム情報を作成する。これを頻度Uマップと呼ぶ。本実施形態のUマップ生成部155では、路面高さテーブル算出部154によってテーブル化された各路面部分の高さに基づいて、路面からの高さHが所定の高さ範囲(たとえば20cmから3m)にある視差画像の点(x,y,d)についてだけ頻度Uマップを作成する。この場合、路面から当該所定の高さ範囲に存在する物体を適切に抽出することができる。
 また、高さUマップ生成処理では、視差画像データに含まれる各視差画素データにおけるx方向位置とy方向位置と視差値dとの組(x,y,d)を、X軸にx、Y軸にd、Z軸に路面からの高さを設定して、X-Yの2次元ヒストグラム情報を作成する。これを高さUマップと呼ぶ。このときの高さの値は路面からの高さが最高のものである。
 図13は、撮像部110aで撮像される基準画像の一例を模式的に表した画像例であり、図14A、図14Bは、図13の画像例に対応するUマップである。ここで、図14Aは頻度Uマップであり、図14Bは高さUマップである。
 図13に示す画像例では、路面の左右両側にガードレール413,414が存在し、他車両としては、先行車両411と対向車両412がそれぞれ1台ずつ存在する。このとき、頻度Uマップにおいては、図14Aに示すように、左右のガードレール413,414に対応する高頻度の点は、左右両端側から中央に向かって上方へ延びるような略直線状603,604に分布する。一方、先行車両411と対向車両412に対応する高頻度の点は、左右のガードレールの間で、略X軸方向に平行に延びる線分の状態601,602で分布する。なお、先行車両411の背面部分又は対向車両412の前面部分以外に、これらの車両の側面部分が映し出されているような状況にあっては、同じ他車両を映し出している画像領域内において視差が生じる。このような場合、図14Aに示すように、他車両に対応する高頻度の点は、略X軸方向に平行に延びる線分と略X軸方向に対して傾斜した線分とが連結した状態の分布を示す。
 また、高さUマップにおいては、左右のガードレール413,414、先行車両411、及び対向車両412における路面からの高さが最高の点が頻度Uマップと同様に分布する。ここで、先行車両に対応する点の分布701及び対向車両に対応する点の分布702の高さはガードレールに対応する点の分布703,704よりも高くなる。これにより、高さUマップにおける物体の高さ情報を物体検出に利用することができる。
 《リアルUマップ生成処理》
 次に、リアルUマップ生成部156について説明する。リアルUマップ生成部156では、リアルUマップ(Real U-disparity map)(「分布データ」の一例)を生成するUマップ生成処理として、リアル頻度Uマップ生成処理及びリアル高さUマップ生成処理を実行する。
 リアルUマップは、Uマップにおける横軸を画像の画素単位から実際の距離に変換し、縦軸の視差値を距離に応じた間引き率を有する間引き視差に変換したものである。
 リアルUマップ生成部156は、リアル頻度Uマップ生成処理において、視差画像データに含まれる各視差画素データにおけるx方向位置とy方向位置と視差値dとの組(x,y,d)を、X軸に水平方向の実際の距離、Y軸に間引き視差、Z軸に頻度を設定して、X-Yの2次元ヒストグラム情報を作成する。なお、本実施形態のリアルUマップ生成部156は、Uマップ生成部155と同様に、路面高さテーブル算出部154によってテーブル化された各路面部分の高さに基づいて、路面からの高さHが所定の高さ範囲にある視差画像の点(x,y,d)についてだけリアル頻度Uマップを作成する。なお、リアルUマップ生成部156は、Uマップ生成部155が生成したUマップに基づいて、リアルUマップを生成する構成としてもよい。
 図15は、図14Aに示す頻度Uマップに対応するリアルUマップ(以下、リアル頻度Uマップ)を示す図である。図示のように、左右のガードレールは垂直の線状のパターン803,804で表され、先行車両、対向車両も実際の形に近いパターン801、802で表される。
 縦軸の間引き視差は、遠距離(ここでは50m以上)については間引きなし、中距離(20m以上、50m未満)については1/2に間引き、近距離(10m以上、20m未満)については1/3に間引き、近距離(10m以上、20m未満)については1/8に間引いたものである。
 つまり、遠方ほど、間引く量を少なくしている。その理由は、遠方では物体が小さく写るため、視差データが少なく、距離分解能も小さいので間引きを少なくし、逆に近距離では、物体が大きく写るため、視差データが多く、距離分解能も大きいので間引きを多くする。
 横軸を画像の画素単位から実際の距離へ変換する方法、Uマップの(x,d)からリアルUマップの(X,d)を求める方法の一例について図16を用いて説明する。
 カメラから見て左右10mずつ、即ち20mの幅をオブジェクト検出範囲として設定する。リアルUマップの横方向1画素の幅を10cmとすると、リアルUマップの横方向サイズは200画素となる。
 カメラの焦点距離をf、カメラ中心からのセンサの横方向の位置をp、カメラから被写体までの距離をZ、カメラ中心から被写体までの横方向の位置をXとする。センサの画素サイズをsとすると、xとpの関係は「x=p/s」で表される。また、ステレオカメラの特性から、「Z=Bf/d」の関係がある。
 また、図より、「x=p*Z/f」の関係があるから、「X=sxB/d」で表すことができる。Xは実距離であるが、リアルUマップ上での横方向1画素の幅が10cmあるので、容易にXのリアルUマップ上での位置を計算することができる。
 図14Bに示す高さUマップに対応するリアルUマップ(以下、リアル高さUマップ)も同様の手順で作成することができる。
 リアルUマップには、縦横の長さをUマップより小さくできるので処理が高速になるというメリットがある。また、横方向が距離に非依存になるため、遠方、近傍いずれでも同じ物体は同じ幅で検出することが可能になり、後段の周辺領域除去や、横分離、縦分離への処理分岐の判定(幅の閾値処理)が簡単になるというメリットもある。
 Uマップにおける縦方向の長さは、測定可能な最短距離を何メートルにするかで決定される。つまり、「d=Bf/Z」であるから、測定可能な最短のZに応じて、dの最大値は決定される。また、視差値dはステレオ画像を扱うため、通常画素単位で計算されるが、少数を含むため、視差値に所定値を乗じて小数部分を四捨五入して整数化した視差値を使用する。
 測定可能な最短のZが1/2になると、dは2倍になるので,それだけUマップのデータは巨大となる。そこで、リアルUマップを作成するときには、近距離ほど画素を間引いてデータを圧縮し、Uマップよりもデータ量を削減する。そのため、ラベリングによるオブジェクト検出を高速に行うことができる。
 《孤立領域検出》
 次に、孤立領域検出部157について説明する。図17は、孤立領域検出部157で行う孤立領域検出処理の流れを示すフローチャートである。孤立領域検出部157では、まずリアルUマップ生成部156で生成されたリアル頻度Uマップの情報の平滑化を行う(ステップS111)。
 これは、頻度値を平均化することで、有効な孤立領域を検出しやすくするためである。即ち、視差値には計算誤差等もあって分散があり、かつ、視差値がすべての画素について計算されているわけではないので、リアルUマップは図14に示した模式図とは異なり、ノイズを含んでいる。そこで、ノイズを除去するためと、検出したいオブジェクトを分離しやすくするため、リアルUマップを平滑化する。これは画像の平滑化と同様に、平滑化フィルタ(例えば3×3画素の単純平均)をリアルUマップの頻度値(リアル頻度Uマップ)に対して適用することで、ノイズと考えられるような頻度は減少し、オブジェクトの部分では頻度が周囲より高い、まとまったグループとなり、後段の孤立領域検出処理を容易にする効果がある。
 次に、二値化の閾値を設定する(ステップS112)。最初は小さい値(=0)を用いて、平滑化されたリアルUマップの二値化を行う(ステップS113)。その後、値のある座標のラベリングを行って、孤立領域を検出する(ステップS114)。
 この二つのステップでは、リアル頻度Uマップで頻度が周囲より高い孤立領域(島と呼ぶことにする)を検出する。検出には、リアル頻度Uマップをまず二値化する(ステップS113)。最初は閾値0で二値化を行う。これは、オブジェクトの高さや、その形状、路面視差との分離などがあるため、島は孤立しているものもあれば他の島と連結しているものもあることの対策である。即ち、小さい閾値からリアル頻度Uマップを二値化することで最初は孤立した適切な大きさの島を検出し、その後、閾値を増加させていくことで連結している島を分離し、孤立した適切な大きさの島として検出することを可能にしたものである。
 二値化後の島を検出する方法はラベリングを用いる(ステップS114)。二値化後の黒である座標(頻度値が二値化閾値より高い座標)をその連結性に基づいてラベリングして、同一ラベルが付いた領域を島とする。
 検出された複数の孤立領域についてそれぞれ大きさの判定を行う(ステップS115)。これは、検出対象が歩行者から大型自動車であるため、孤立領域の幅がそのサイズの範囲であるか否かを判定するのである。もし、その大きさが大きければ(ステップS115:YES)、二値化閾値を1だけインクリメントして(ステップS112)、リアル頻度Uマップの当該孤立領域内だけ二値化を行う(ステップS113)。そしてラベリングを行い、より小さな孤立領域を検出して(ステップS114)、その大きさを判定する(ステップS115)。
 上記の閾値設定からラベリングの処理を繰り返し行い、所望の大きさの孤立領域を検出するのである。所望の大きさの孤立領域が検出できたなら(ステップS115:NO)、次に周辺領域除去を行う(ステップS116)。これは、遠方にある物体で、路面検出の精度が悪く、路面の視差がリアルUマップ内に導入され、物体と路面の視差が一塊になって検出された場合のその左右、近傍の高さが路面に近い部分の領域(孤立領域内の周辺部分)を削除する処理である。除去領域が存在する場合は(ステップS117:YES)、もう一度ラベリングを行って孤立領域の再設定を行う(ステップS114)。
 除去領域がなくなったら(ステップS117:NO)、周辺領域除去を行った孤立領域の大きさ(幅と高さ、距離)を判定し(ステップS118)、その結果に応じて、横方向分離(ステップS119)又は縦方向分離(ステップS120)又は何もしないでオブジェクト候補として登録する。横方向分離又は縦方向分離を行った場合は(ステップS121:YES、ステップS122:YES)、もう一度ラベリングを行って孤立領域の再設定を行う(ステップS114)。
 物体同士が横に並んで近接している(自動車とバイク、自動車と歩行者、自動車同士など)場合、リアル頻度Uマップの平滑化が原因で一つの孤立領域として検出されることがある。或いは視差画像の視差補間の悪影響で異なる物体同士の視差がつながってしまうことがある。横方向分離はこのようなケースを検出して分離する処理である(詳細については後述)。
 また、複数の先行車両が隣の車線を走行しているときに、それらが遠方にいる場合、ステレオ画像から得られる視差の分散が大きい場合、リアル頻度Uマップ上では物体それぞれの視差値が上下に伸び、連結してしまうことがある。このため、これを一つの孤立領域として検出してしまう場合がある。縦方向分離はこのようなケースを検出して、手前を走る先行車両とその向こうを走る先行車両とに分離する処理である(詳細については後述)。
 《視差画像の対応領域検出、及びオブジェクト領域抽出》
 次に、視差画像の対応領域検出部158及びオブジェクト領域抽出部159について説明する。図18は、孤立領域検出部で検出された孤立領域が内接する矩形領域を設定したリアル頻度Uマップを示す図であり、図19は、図18における矩形領域に対応する走査範囲を設定した視差画像を示す図であり、図20は、図19における走査範囲を探索してオブジェクト領域を設定した視差画像を示す図である。
 孤立領域検出部157によりオブジェクト候補領域として決定された孤立領域について、図18に示すように、当該孤立領域としての第1車両801、第2車両802が内接する矩形領域として第1検出島811及び第2検出島812を設定したとき、この矩形領域の幅(Uマップ上のX軸方向長さ)は、当該孤立領域に対応する識別対象物(オブジェクト)の幅に対応する。また、設定した矩形領域の高さは、当該孤立領域に対応する識別対象物(オブジェクト)の奥行き(自車両進行方向長さ)に対応している。一方で、各孤立領域に対応する識別対象物(オブジェクト)の高さについては、この段階では不明である。視差画像の対応領域検出部158は、オブジェクト候補領域に係る孤立領域に対応したオブジェクトの高さを得るために、当該孤立領域に対応する視差画像上の対応領域を検出する。
 視差画像の対応領域検出部158は、孤立領域検出部157から出力される孤立領域の情報に基づき、リアルUマップから検出した第1検出島811及び第2検出島812島の位置、幅と最小視差から、図19に示す視差画像で検出すべき範囲である第1検出島対応領域走査範囲481及び第2検出島対応領域走査範囲482のx方向範囲(xmin,xmax)を決定できる。また、視差画像においてオブジェクトの高さと位置(ymin="最大視差dmaxの時の路面からの最大高さに相当するy座標"からymax="最大視差dmaxから得られる路面の高さを示すy"まで)を決定できる。
 次に、オブジェクトの正確な位置を検出するため、設定した走査範囲を走査し、孤立領域検出部157で検出した矩形の奥行き(最小視差dmin,最大視差dmax)の範囲の値を視差にもつ画素を候補画素として抽出する。そして、抽出した候補画素群の中で検出幅に対して横方向に所定の割合以上あるラインを候補ラインとする。
 次に、縦方向に走査して、ある注目しているオブジェクト候補ラインの周囲に他のオブジェクト候補ラインが所定の密度以上ある場合には、その注目しているオブジェクト候補ラインをオブジェクトラインとして判定する。
 次に、オブジェクト領域抽出部159は、視差画像の探索領域でオブジェクトラインを探索して、オブジェクトラインの最下端、最上端を決定し、図20に示すように、オブジェクトライン群の外接矩形461,462を視差画像におけるオブジェクト(第1車両、第2車両)の領域451,452として決定する。
 図21は、視差画像の対応領域検出部158及びオブジェクト領域抽出部159で行われる処理の流れを示すフローチャートである。まずリアルUマップにおける島の位置、幅と最小視差から、視差画像に対するx軸方向の探索範囲を設定する(ステップS161)。
 次に島の最大視差dmaxと路面高さの関係から、視差画像に対するy軸方向の最大探索値ymaxを設定する(ステップS162)。次にリアル高さUマップにおける島の最大高さ、及びステップS172で設定したymaxとdmaxとから、視差画像に対するy軸方向の最小探索値yminを求めて設定することで、視差画像に対するy軸方向の探索範囲を設定する(ステップS163)。
 次いで設定した探索範囲で視差画像を探索して、島の最小視差dmin,最大視差dmaxの範囲内にある画素を抽出し、オブジェクト候補画素とする(ステップS164)。そのオブジェクト候補画素が横方向に一定以上の割合にあるとき、そのラインをオブジェクト候補ラインとして抽出する(ステップS165)。
 オブジェクト候補ラインの密度を計算して、密度が所定の値より大きい場合はそのラインをオブジェクトラインと決定する(ステップS166)。最後にオブジェクトライン群の外接矩形を視差画像内のオブジェクト領域として検出する(ステップS167)。
 それにより、識別対象物(オブジェクト、物体)を認識することができる。
 《オブジェクトタイプ分類》
 次に、オブジェクトタイプ分類部160について説明する。
 前記オブジェクト領域抽出部159で抽出されるオブジェクト領域の高さ(yomax-yomin)から、下記の式〔5〕より、そのオブジェクト領域に対応する画像領域に映し出されている識別対象物(オブジェクト)の実際の高さHoを計算できる。ただし、「zo」は、当該オブジェクト領域内の最小視差値dから計算される当該オブジェクト領域に対応するオブジェクトと自車両との距離であり、「f」はカメラの焦点距離を(yomax-yomin)の単位と同じ単位に変換した値である。
 Ho=zo×(yomax-yomin)/f …式〔5〕
 同様に、オブジェクト領域抽出部159で抽出されるオブジェクト領域の幅(xomax-xomin)から、下記の式〔6〕より、そのオブジェクト領域に対応する画像領域に映し出されている識別対象物(オブジェクト)の実際の幅Woを計算できる。
 Wo=zo×(xomax-xomin)/f …式〔6〕
 また、当該オブジェクト領域に対応する画像領域に映し出されている識別対象物(オブジェクト)の奥行きDoは、当該オブジェクト領域に対応した孤立領域内の最大視差dmaxと最小視差dminから、下記の式〔7〕より計算することができる。
 Do=BF×{(1/(dmin-offset)-1/(dmax-offset)} …式〔7〕
 オブジェクトタイプ分類部160は、このようにして計算できるオブジェクト領域に対応するオブジェクトの高さ、幅、奥行きの情報から、そのオブジェクトタイプの分類を行う。図22に示す表は、オブジェクトタイプの分類を行うためのテーブルデータの一例を示すものである。これによれば、自車両前方に存在する識別対象物(オブジェクト)が、歩行者なのか、自転車なのか、小型車なのか、トラックなどか等を区別して認識することが可能となる。
 《3次元位置決定》
 次に、3次元位置決定部161について説明する。検出されたオブジェクト領域に対応するオブジェクトまでの距離や、視差画像の画像中心と視差画像上のオブジェクト領域の中心との画像上の距離も把握されることから、オブジェクトの3次元位置を決定することができる。
 視差画像上のオブジェクト領域の中心座標を(region_centerX,region_centerY)とし、視差画像の画像中心座標を(image_centerX,image_centerY)としたとき、識別対象物(オブジェクト)の撮像部110a,110bに対する相対的な横方向位置および高さ方向位置は、下記の式〔8〕及び式〔9〕より計算できる。
 Xo=Z×(region_centerX-image_centerX)/f …式〔8〕
 Yo=Z×(region_centerY-image_centerY)/f …式〔9〕
 《オブジェクトトラッキング》
 次に、オブジェクトトラッキング部162について説明する。オブジェクトトラッキング部162は、オブジェクトデータリスト170を用いて、以前(過去)の視差画像のフレームから検出されたオブジェクト(物体)をトラッキング(追跡)する処理を実行する。
 《オブジェクト選択》
 次に、オブジェクト選択部163について説明する。オブジェクト選択部163は、オブジェクトデータリスト170に保存されているオブジェクトについて、当該オブジェクトが追跡対象とするのにふさわしい位置にいるか等を判断基準にして、当該オブジェクトを追跡するか否かを選択する。具体的には、オブジェクトデータリスト170のオブジェクト予測データに基づいて当該オブジェクトが位置すると予測される視差画像データ中の予測範囲を設定し、その予測範囲内における当該オブジェクトの高さを特定した後、オブジェクトデータリスト170のオブジェクト特徴量を参照して、特定した高さから当該オブジェクトの幅を特定し、特定した幅から視差画像データ上におけるオブジェクトの横方向位置を推定する。このようにして推定したオブジェクトの横方向位置が所定の追跡対象条件(当該オブジェクトが画像内に存在する確度が高い位置である場合、当該オブジェクトが追跡対象とするのにふさわしい位置である場合等)を満たせば、当該オブジェクトを追跡対象として選択する。なお、オブジェクト選択部163は、追跡対象として選択しなかったオブジェクトのデータを、オブジェクトデータリスト170から削除してもよい。
 《オブジェクトデータリスト》
 次に、オブジェクトデータリスト170について説明する。オブジェクトデータリスト170は、例えば、一のフレームから検出された各オブジェクトのデータを、それ以降の複数のフレームに渡って追跡するために使用される。
 オブジェクトデータリスト170は、図23に示すように、「オブジェクトデータ」、「オブジェクト予測データ」、「オブジェクト特徴量」のデータを含む。
 「オブジェクトデータ」は、「位置」、「大きさ」、「距離」、「相対速度」、「実位置」、「実際の大きさ」のデータを含む。「位置」は、視差画像における当該オブジェクトの左上の座標である。「大きさ」は、視差画像における当該オブジェクトの大きさ(幅、及び高さの画素数)である。「距離」は、自車両から当該オブジェクトまでの実距離である。「相対速度」は、前回と今回のフレームに基づいて算出された、自車両と当該オブジェクトとの相対速度である。「相対速度」は、自車両の進行方向Z(奥行き方向)及び水平方向X(横方向)の1フレーム当たりの移動量(m:メートル)のデータを含む。「実位置」は、今回のフレームに基づいて算出された、自車両に対する当該オブジェクトの相対的な実際の位置である。「実位置」は、例えば、当該オブジェクトの左端と右端の中心の、横方向Zの位置(m:メートル)と奥行きZ方向の位置(m:メートル)のデータを含む。「実際の大きさ」は、今回のフレームに基づいて算出された、自車両に対する当該オブジェクトの実際の大きさである。「実際の大きさ」は、当該オブジェクトの幅(m:メートル)と高さ(m:メートル)のデータを含む。
 「オブジェクト予測データ」は、「位置」、「大きさ」、「距離」、「相対速度」等のデータを含む。「オブジェクト予測データ」は、以前のフレーム(例えば直前のフレーム)に基づいて算出された、次回のフレームにおいて当該オブジェクトがどの位置にいるかを予測するデータである。
 「オブジェクト特徴量」は、「ヒストグラムピーク位置」、「ピーク間距離」のデータを含む。「ヒストグラムピーク位置」は、リアルUマップにおける視差頻度の値が比較的大きい位置の座標である。「ピーク間距離」は、リアルUマップにおける「ヒストグラムピーク位置」間の実距離である。
 なお、オブジェクトデータリスト170のデータは、画像解析ユニット102の解析結果として、表示モニタ103及び車両走行制御ユニット104に送られる。表示モニタ103は、解析結果であるオブジェクトデータリスト170のデータのうち、例えば、「オブジェクトデータ」の「位置」、「大きさ」に基づいて、今回のフレームにおけるオブジェクトの領域を、例えば緑の枠で表示する。ここで、「オブジェクトデータ」の「位置」、「大きさ」は、オブジェクトを含む領域を示すデータである。
 また、表示モニタ103は、解析結果であるオブジェクトデータリスト170のデータのうち、例えば、「オブジェクト予測データ」の「位置」、「大きさ」に基づいて、今回のフレームにおけるオブジェクトの予測位置に対応する領域(以下で「トラッキング枠」と称する)を、例えば赤の枠で表示する。
 <まとめ>
 ステレオカメラを用いて生成した視差画像において、自車両(ステレオカメラ)に近い距離に位置する物体に対する視差は大きいため、一方のカメラで撮像した画像における当該物体の画素の位置と、他方のカメラで撮像した画像における当該物体の画素の位置との距離は大きくなる。そのため、一方の画像の一の画素に対応する画素を他方の画像から探索する距離(当該一の画素の位置からの距離)が長くなり、視差画像を作る処理に時間がかかる。
 そのため、画素を探索する距離を所定範囲で区切ることにより、自車両から例えば2m~80m程度(通常距離)の距離に位置する物体に対する視差画像を高速に生成して、物体の検出や追跡を行うことが考えられる。
 しかし、衝突等を防止するためには、自車両から例えば1m~6m程度(近距離)の距離に位置する物体の検出や追跡を行う必要がある。その場合、近距離の物体に対する視差画像を作る処理には時間がかかるため、それ以降の検出等の処理を、非常に高速で行う必要がある。また、近距離の物体に対する検出等は、例えばアクセルとブレーキの踏み間違え(誤踏み)等の際の、移動体の制御判断にも使用され得るため、高速かつ高精度に検出等を行う必要がある。
 近距離の物体を、視差画像におけるオブジェクトを含む最少の矩形等の領域により検出する場合、例えば、トンネル等の領域は、駐車場の出入り口のバー等とは異なり、当該領域全体の視差の密度は高いため、自車両が進行する領域は空いているにも関わらず、障害物として検知される場合がある。また、上述した近距離視差画像生成処理により、近距離の物体に対する視差画像を縮小する際、無効な画素の値を、周辺の画素値に基づいて補完するため、トンネル等の領域全体の視差の密度は、より高まる。
 上述した実施形態によれば、自車両の進行する進行領域における物体に応じた視差値を有する画素の数と、進行領域における当該物体の領域に含まれる画素の数に基づいて、検出された物体のデータを棄却する。それにより、精度の高い検出を高速に行うことができる。
 なお、距離の値(距離値)と視差値は等価に扱えることから、本実施形態においては距離画像の一例として視差画像を用いて説明しているが、これに限られない。例えば、ステレオカメラを用いて生成した視差画像に対して、ミリ波レーダやレーザレーダ等の検出装置を用いて生成した距離情報を統合して、距離画像を生成してもよい。
 上述した実施形態におけるシステム構成は一例であり、用途や目的に応じて様々なシステム構成例があることは言うまでもない。
 例えば、上述した近距離として、例えば、0.5m~60m程度の距離に位置する物体の検出や追跡を行うようにしてもよい。
 また、ステレオカメラと、ミリ波レーダやレーザレーダ等の検出装置を併用し、上述したステレオカメラによる物体の検出結果と組み合わせることにより、検出の精度をさらに高める構成としてもよい。
 例えば、処理ハードウェア部120及び画像解析ユニット102の各機能部は、ハードウェアによって実現される構成としてもよいし、CPUが記憶装置に格納されたプログラムを実行することによって実現される構成としてもよい。このプログラムは、インストール可能な形式又は実行可能な形式のファイルによって、コンピュータで読み取り可能な記録メディアに記録されて流通されるようにしても良い。また、上記記録メディアの例として、CD-R(Compact Disc Recordable)、DVD(Digital Versatile Disk)、ブルーレイディスク等が挙げられる。また、各プログラムが記憶されたCD-ROM等の記録メディア、並びに、これらプログラムが記憶されたHD504は、プログラム製品(Program Product)として、国内又は国外へ提供されることができる。
 以上、本発明を実施例に基づいて説明したが、本発明は上記実施例に限定されるものではなく、特許請求の範囲に記載の範囲内で様々な変形が可能である。
 本願は、日本特許庁に2016年2月23日に出願された基礎出願2016―032118号の優先権を主張するものであり、その全内容を参照によりここに援用する。
1 車載機器制御システム(「移動体機器制御システム」の一例)
100 自車両
101 撮像ユニット
102 画像解析ユニット(「画像処理装置」の一例)
103 表示モニタ
104 車両走行制御ユニット(「制御部」の一例)
110a,110b 撮像部
120 処理ハードウェア部
140 近距離処理部
141 近距離視差画像生成部(「生成部」の一例)
142 縮小視差画像生成部(「縮小部」の一例)
143 近距離物体検出部(「検出部」の一例)
144 近距離物体棄却部(「棄却部」の一例)
145 近距離物体追跡部
151 視差画像生成部
152 Vマップ生成部
153 路面形状検出部
154 路面高さテーブル算出部
155 Uマップ生成部
156 リアルUマップ生成部
157 孤立領域検出部
158 対応領域検出部
159 オブジェクト領域抽出部
160 オブジェクトタイプ分類部
161 3次元位置決定部
162 オブジェクトトラッキング部
163 オブジェクト選択部
170 オブジェクトデータリスト
2 撮像装置

Claims (8)

  1.  複数の撮像部で各々撮影されたフレームに応じた、前記複数の撮像部から所定距離内に位置する物体の距離に応じた画素値を有する距離画像の画素数を縮小する縮小部と、
     前記縮小された距離画像に基づいて、前記物体を検出する検出部と、
     前記複数の撮像部を備える移動体の進行する進行領域における前記物体に応じた距離の値を有する画素の数と、前記進行領域における前記物体の領域に含まれる画素の数に基づいて、前記検出された前記物体のデータを棄却する棄却部と、
    を備えることを特徴とする画像処理装置。
  2.  前記棄却部は、前記移動体の高さ及び幅と、前記物体の前記移動体からの距離に基づいて、前記進行領域を算出することを特徴とする、請求項1記載の画像処理装置。
  3.  前記検出部は、前記縮小された距離画像における前記物体を含む矩形または正方形の領域を、前記物体の領域として検出することを特徴とする、請求項1または2記載の画像処理装置。
  4.  前記縮小部は、前記距離画像から所定の間隔で画素を抽出し、当該抽出した画素の値が無効である場合、当該抽出した画素の周辺の画素の値に基づいて、当該抽出した画素の値を決定することを特徴とする、請求項1乃至3のいずれか一項に記載の画像処理装置。
  5.  複数の撮像部と、
     前記複数の撮像部で各々撮影されたフレームに応じた、前記複数の撮像部から所定距離内に位置する物体の視差に応じた画素値を有する距離画像を生成する生成部と、
     前記距離画像の画素数を縮小する縮小部と、
     前記縮小された距離画像に基づいて、前記物体を検出する検出部と、
     前記複数の撮像部を備える移動体の進行する進行領域における前記物体に応じた距離の値を有する画素の数と、前記進行領域における前記物体の領域に含まれる画素の数に基づいて、前記検出された前記物体のデータを棄却する棄却部と、
    を備えることを特徴とする撮像装置。
  6.  移動体に搭載され、前記移動体の前方を撮像する複数の撮像部と、
     前記複数の撮像部で各々撮影されたフレームに応じた、前記複数の撮像部から所定距離内に位置する物体の視差に応じた画素値を有する距離画像を生成する生成部と、
     前記距離画像の画素数を縮小する縮小部と、
     前記縮小された距離画像に基づいて、前記物体を検出する検出部と、
     前記複数の撮像部を備える移動体の進行する進行領域における前記物体に応じた距離の値を有する画素の数と、前記進行領域における前記物体の領域に含まれる画素の数に基づいて、前記検出された前記物体のデータを棄却する棄却部と、
     前記検出部及び前記棄却部による検出及び棄却結果に基づいて、前記移動体の制御を行う制御部と、
    を備える移動体機器制御システム。
  7.  画像処理装置が、
     複数の撮像部で各々撮影されたフレームに応じた、前記複数の撮像部から所定距離内に位置する物体の距離に応じた画素値を有する距離画像の画素数を縮小するステップと、
     前記縮小された距離画像に基づいて、前記物体を検出するステップと、
     前記複数の撮像部を備える移動体の進行する進行領域における前記物体に応じた距離の値を有する画素の数と、前記進行領域における前記物体の領域に含まれる画素の数に基づいて、前記検出された前記物体のデータを棄却するステップと、
    を実行する、画像処理方法。
  8.  画像処理装置に、
     複数の撮像部で各々撮影されたフレームに応じた、前記複数の撮像部から所定距離内に位置する物体の距離に応じた画素値を有する距離画像の画素数を縮小するステップと、
     前記縮小された距離画像に基づいて、前記物体を検出するステップと、
     前記複数の撮像部を備える移動体の進行する進行領域における前記物体に応じた距離の値を有する画素の数と、前記進行領域における前記物体の領域に含まれる画素の数に基づいて、前記検出された前記物体のデータを棄却するステップと、
    を実行させるプログラム。
PCT/JP2017/001914 2016-02-23 2017-01-20 画像処理装置、撮像装置、移動体機器制御システム、画像処理方法、及びプログラム WO2017145600A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2018501055A JP6705496B2 (ja) 2016-02-23 2017-01-20 画像処理装置、撮像装置、移動体機器制御システム、移動体、画像処理方法、及びプログラム
EP17756042.2A EP3422289A4 (en) 2016-02-23 2017-01-20 IMAGE PROCESSING DEVICE, IMAGING DEVICE, MOBILE ENTITY DEVICE CONTROL SYSTEM, IMAGE PROCESSING METHOD, AND PROGRAM
US16/105,529 US10860867B2 (en) 2016-02-23 2018-08-20 Image processing apparatus, imaging apparatus, mobile device control system, and recording medium

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2016032118 2016-02-23
JP2016-032118 2016-02-23

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US16/105,529 Continuation US10860867B2 (en) 2016-02-23 2018-08-20 Image processing apparatus, imaging apparatus, mobile device control system, and recording medium

Publications (1)

Publication Number Publication Date
WO2017145600A1 true WO2017145600A1 (ja) 2017-08-31

Family

ID=59686251

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2017/001914 WO2017145600A1 (ja) 2016-02-23 2017-01-20 画像処理装置、撮像装置、移動体機器制御システム、画像処理方法、及びプログラム

Country Status (4)

Country Link
US (1) US10860867B2 (ja)
EP (1) EP3422289A4 (ja)
JP (1) JP6705496B2 (ja)
WO (1) WO2017145600A1 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021054341A1 (ja) * 2019-09-19 2021-03-25 京セラ株式会社 物体検出装置、物体検出システム、移動体及び物体検出方法
JP2021051476A (ja) * 2019-09-24 2021-04-01 京セラ株式会社 物体検出装置、物体検出システム、移動体及び物体検出方法
JP2021086265A (ja) * 2019-11-26 2021-06-03 株式会社Subaru 画像処理装置
JP7138265B1 (ja) * 2021-06-17 2022-09-15 ヌヴォトンテクノロジージャパン株式会社 物体検知装置、物体検知方法およびプログラム
WO2022264894A1 (ja) * 2021-06-17 2022-12-22 ヌヴォトンテクノロジージャパン株式会社 物体検知装置、物体検知方法およびプログラム
WO2024121911A1 (ja) * 2022-12-05 2024-06-13 日立Astemo株式会社 画像処理装置

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6743882B2 (ja) * 2016-03-14 2020-08-19 株式会社リコー 画像処理装置、機器制御システム、撮像装置、画像処理方法及びプログラム
JP6795027B2 (ja) * 2016-03-15 2020-12-02 株式会社リコー 情報処理装置、物体認識装置、機器制御システム、移動体、画像処理方法およびプログラム
JP6904346B2 (ja) * 2016-06-22 2021-07-14 ソニーグループ株式会社 画像処理装置、画像処理システム、および画像処理方法、並びにプログラム
US10347030B2 (en) 2017-05-15 2019-07-09 Envisics Ltd Adjusting depth of augmented reality content on a heads up display
US10929986B2 (en) * 2018-12-19 2021-02-23 Fca Us Llc Techniques for using a simple neural network model and standard camera for image detection in autonomous driving
JP2020160914A (ja) * 2019-03-27 2020-10-01 株式会社豊田自動織機 物体検出装置
CN111192283A (zh) * 2019-12-26 2020-05-22 昆山伟宇慧创智能科技有限公司 一种限高杆检测和高度计算方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001319224A (ja) * 2000-05-08 2001-11-16 Fujitsu Ltd 3次元物体検出装置と3次元物体検出方法及び記録媒体
US20070071311A1 (en) * 2005-09-28 2007-03-29 Deere & Company, A Delaware Corporation Method for processing stereo vision data using image density
JP2011185664A (ja) * 2010-03-05 2011-09-22 Panasonic Electric Works Co Ltd 対象物検出装置
JP2013250907A (ja) * 2012-06-04 2013-12-12 Ricoh Co Ltd 視差算出装置、視差算出方法及び視差算出用プログラム
JP2015170306A (ja) * 2014-03-10 2015-09-28 サクサ株式会社 画像処理装置

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1139596A (ja) 1997-07-17 1999-02-12 Fuji Heavy Ind Ltd 車外監視装置
JP4624594B2 (ja) * 2000-06-28 2011-02-02 パナソニック株式会社 物体認識方法および物体認識装置
US7068815B2 (en) * 2003-06-13 2006-06-27 Sarnoff Corporation Method and apparatus for ground detection and removal in vision systems
EP1779295A4 (en) * 2004-07-26 2012-07-04 Automotive Systems Lab SYSTEM FOR PROTECTING USERS OF THE ROAD IN A DANGER SITUATION
JP4900103B2 (ja) * 2007-07-18 2012-03-21 マツダ株式会社 歩行者検出装置
US8774512B2 (en) * 2009-02-11 2014-07-08 Thomson Licensing Filling holes in depth maps
US8861842B2 (en) * 2010-02-05 2014-10-14 Sri International Method and apparatus for real-time pedestrian detection for urban driving
US9053562B1 (en) * 2010-06-24 2015-06-09 Gregory S. Rabin Two dimensional to three dimensional moving image converter
US8824733B2 (en) * 2012-03-26 2014-09-02 Tk Holdings Inc. Range-cued object segmentation system and method
US8768007B2 (en) * 2012-03-26 2014-07-01 Tk Holdings Inc. Method of filtering an image
EP2669846B1 (en) 2012-06-01 2017-11-01 Ricoh Company, Ltd. Target recognition system and target recognition method executed by the target recognition system, target recognition program executed on the target recognition system, and recording medium storing the target recognition program
EP2946336B1 (en) * 2013-01-15 2023-06-21 Mobileye Vision Technologies Ltd. Stereo assist with rolling shutters
JP6519262B2 (ja) * 2014-04-10 2019-05-29 株式会社リコー 立体物検出装置、立体物検出方法、立体物検出プログラム、及び移動体機器制御システム
US10079827B2 (en) 2015-03-16 2018-09-18 Ricoh Company, Ltd. Information processing apparatus, information processing method, and information processing system
US9727793B2 (en) * 2015-12-15 2017-08-08 Honda Motor Co., Ltd. System and method for image based vehicle localization
JP6583527B2 (ja) 2016-02-22 2019-10-02 株式会社リコー 画像処理装置、撮像装置、移動体機器制御システム、画像処理方法、及びプログラム
US10638109B2 (en) * 2017-09-15 2020-04-28 Elphel, Inc. Method for the FPGA-based long range multi-view stereo with differential image rectification

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001319224A (ja) * 2000-05-08 2001-11-16 Fujitsu Ltd 3次元物体検出装置と3次元物体検出方法及び記録媒体
US20070071311A1 (en) * 2005-09-28 2007-03-29 Deere & Company, A Delaware Corporation Method for processing stereo vision data using image density
JP2011185664A (ja) * 2010-03-05 2011-09-22 Panasonic Electric Works Co Ltd 対象物検出装置
JP2013250907A (ja) * 2012-06-04 2013-12-12 Ricoh Co Ltd 視差算出装置、視差算出方法及び視差算出用プログラム
JP2015170306A (ja) * 2014-03-10 2015-09-28 サクサ株式会社 画像処理装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP3422289A4 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021054341A1 (ja) * 2019-09-19 2021-03-25 京セラ株式会社 物体検出装置、物体検出システム、移動体及び物体検出方法
JP2021047741A (ja) * 2019-09-19 2021-03-25 京セラ株式会社 物体検出装置、物体検出システム、移動体及び物体検出方法
JP7308112B2 (ja) 2019-09-19 2023-07-13 京セラ株式会社 物体検出装置、物体検出システム、移動体及び物体検出方法
JP2021051476A (ja) * 2019-09-24 2021-04-01 京セラ株式会社 物体検出装置、物体検出システム、移動体及び物体検出方法
WO2021060117A1 (ja) * 2019-09-24 2021-04-01 京セラ株式会社 物体検出装置、物体検出システム、移動体及び物体検出方法
JP7308115B2 (ja) 2019-09-24 2023-07-13 京セラ株式会社 物体検出装置、物体検出システム、移動体及び物体検出方法
JP2021086265A (ja) * 2019-11-26 2021-06-03 株式会社Subaru 画像処理装置
JP7406962B2 (ja) 2019-11-26 2023-12-28 株式会社Subaru 画像処理装置
JP7138265B1 (ja) * 2021-06-17 2022-09-15 ヌヴォトンテクノロジージャパン株式会社 物体検知装置、物体検知方法およびプログラム
WO2022264894A1 (ja) * 2021-06-17 2022-12-22 ヌヴォトンテクノロジージャパン株式会社 物体検知装置、物体検知方法およびプログラム
WO2024121911A1 (ja) * 2022-12-05 2024-06-13 日立Astemo株式会社 画像処理装置

Also Published As

Publication number Publication date
US20180357495A1 (en) 2018-12-13
JPWO2017145600A1 (ja) 2018-12-06
EP3422289A1 (en) 2019-01-02
EP3422289A4 (en) 2019-02-27
JP6705496B2 (ja) 2020-06-03
US10860867B2 (en) 2020-12-08

Similar Documents

Publication Publication Date Title
WO2017145600A1 (ja) 画像処理装置、撮像装置、移動体機器制御システム、画像処理方法、及びプログラム
US10984509B2 (en) Image processing apparatus, imaging device, moving body device control system, image information processing method, and program product
JP6657789B2 (ja) 画像処理装置、撮像装置、機器制御システム、頻度分布画像生成方法、及びプログラム
JP6662388B2 (ja) 画像処理装置、撮像装置、機器制御システム、分布データ生成方法、及びプログラム
JP6583527B2 (ja) 画像処理装置、撮像装置、移動体機器制御システム、画像処理方法、及びプログラム
US11004215B2 (en) Image processing apparatus, imaging device, moving body device control system, image information processing method, and program product
WO2017145634A1 (ja) 画像処理装置、撮像装置、移動体機器制御システム、画像処理方法、及びプログラム
JP6769477B2 (ja) 画像処理装置、撮像装置、移動体機器制御システム、画像処理方法、及びプログラム
US10628960B2 (en) Information processing apparatus, imaging apparatus, device control system, moving object, information processing method, and recording medium
JP2018088233A (ja) 情報処理装置、撮像装置、機器制御システム、移動体、情報処理方法、及びプログラム
JP6812701B2 (ja) 画像処理装置、移動体機器制御システム、画像処理方法、及びプログラム
JP2018088234A (ja) 情報処理装置、撮像装置、機器制御システム、移動体、情報処理方法、及びプログラム

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 2018501055

Country of ref document: JP

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2017756042

Country of ref document: EP

ENP Entry into the national phase

Ref document number: 2017756042

Country of ref document: EP

Effective date: 20180924

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17756042

Country of ref document: EP

Kind code of ref document: A1