WO2017159082A1 - 画像処理装置、機器制御システム、撮像装置、画像処理方法及びプログラム - Google Patents

画像処理装置、機器制御システム、撮像装置、画像処理方法及びプログラム Download PDF

Info

Publication number
WO2017159082A1
WO2017159082A1 PCT/JP2017/003445 JP2017003445W WO2017159082A1 WO 2017159082 A1 WO2017159082 A1 WO 2017159082A1 JP 2017003445 W JP2017003445 W JP 2017003445W WO 2017159082 A1 WO2017159082 A1 WO 2017159082A1
Authority
WO
WIPO (PCT)
Prior art keywords
map
image
distance
image processing
pixels
Prior art date
Application number
PCT/JP2017/003445
Other languages
English (en)
French (fr)
Inventor
高橋 禎郎
洋義 関口
Original Assignee
株式会社リコー
高橋 禎郎
洋義 関口
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社リコー, 高橋 禎郎, 洋義 関口 filed Critical 株式会社リコー
Priority to EP17766090.9A priority Critical patent/EP3432265A4/en
Priority to JP2018505319A priority patent/JP6743882B2/ja
Publication of WO2017159082A1 publication Critical patent/WO2017159082A1/ja
Priority to US16/127,934 priority patent/US10679388B2/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/20Drawing from basic elements, e.g. lines or circles
    • G06T11/203Drawing of straight lines or curves
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • G06V10/507Summing image-intensity values; Histogram projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
    • G06V20/584Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads of vehicle lights or traffic lights
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/16Anti-collision systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10028Range image; Depth image; 3D point clouds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30248Vehicle exterior or interior
    • G06T2207/30252Vehicle exterior; Vicinity of vehicle
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30248Vehicle exterior or interior
    • G06T2207/30252Vehicle exterior; Vicinity of vehicle
    • G06T2207/30261Obstacle

Definitions

  • the present invention relates to an image processing device, a device control system, an imaging device, an image processing method, and a program.
  • Patent Document 1 discloses a technique for detecting an approaching object such as a person approaching the own vehicle or an automobile by using a camera or the like and surrounding the detected approaching object with a detection frame.
  • An object of the present invention is to speed up the object detection process and shorten the image processing time for surrounding the detected object with a detection frame.
  • the image processing apparatus includes a map generation unit configured to generate a map composed of pixels having left-right position information and distance information and associated with frequency values, and the pixels having a common feature amount in the map
  • a detection unit for detecting a plurality of pixel clusters, and a search target region for detecting an object from the distance information based on information indicated by the pixels constituting the pixel cluster detected by the detection unit
  • a frame generation means for generating a detection frame to be performed.
  • the present invention it is possible to speed up the object detection process and shorten the image processing time for surrounding the detected object with the detection frame.
  • An image processing apparatus is used by using an example of recognizing an object such as another vehicle traveling in front of the vehicle, which is captured by an imaging apparatus such as a stereo camera attached to the vehicle as a moving body.
  • the moving body is not limited to a vehicle, and can be applied to a ship, an aircraft, and the like.
  • the image processing apparatus controls the operation of the vehicle using the result of the processing executed by the image processing apparatus.
  • this control includes a function of controlling predetermined devices (for example, devices such as a brake system, a steering system, and an engine control system) provided in the vehicle.
  • the image processing apparatus may be configured as an information processing apparatus alone, for example. Or it is good also as a structure which incorporated the function which an image processing apparatus has in the processing board etc. which imaging devices, such as a stereo camera, have.
  • FIG. 1 the apparatus control system which concerns on one Embodiment is demonstrated.
  • the apparatus control system which concerns on one Embodiment is demonstrated.
  • an outline of the device control system will be described using an example of a vehicle control system that controls a vehicle as the device control system.
  • the arrow A direction is the forward direction of the vehicle 1.
  • the vehicle 1 includes an imaging unit 2, an image processing unit 3, and a control unit 4.
  • the imaging unit 2 is installed, for example, in the vicinity of a room mirror inside the vehicle, and images other vehicles traveling in front of the vehicle 1 through the windshield 5.
  • the image processing unit 3 Based on the image picked up by the image pickup unit 2, the image processing unit 3 as the object detection means detects an object in front of the vehicle 1. Based on the detection result from the image processing unit 3, the control unit 4 controls the traveling speed of the vehicle 1, the traveling interval with other vehicles, the traveling lane, the timing of the brake, and the like.
  • the terms imaging unit, image processing unit, and control unit are terms used for convenience of explanation. That is, the terms imaging device (or imaging means), image processing device (or image processing means), and control device (or control means) may be used instead of the terms imaging unit, image processing unit, and control unit, respectively. Good.
  • This imaging apparatus includes a stereo camera 10 and an image processing board 20.
  • the stereo camera 10 is configured by assembling two cameras in parallel.
  • the stereo camera 10 includes an image sensor 12L and an image sensor controller 13L corresponding to the left lens 11L, and includes an image sensor 12R and an image sensor controller 13R corresponding to the right lens 11R.
  • the stereo camera 10 is composed of two cameras, but the stereo camera according to the present invention may be composed of three or more cameras.
  • the image sensor controllers 13L and 13R have functions of exposure control, A / D conversion, image readout control, communication with external circuits, and image data transmission of the image sensors 12L and 12R, respectively.
  • the stereo camera 10 is connected to the image processing board 20 via a data bus 27 and a serial bus 28. Luminance image data and parallax image data are output from the stereo camera 10 to the image processing board 20.
  • the luminance image data output from the image sensors 12L and 12R of the stereo camera 10 is transferred to the image processing board 20 via the data bus 27. Further, a sensor exposure control value change, an image read parameter change, and various setting data are transmitted and received from the image processing board 20 via the serial bus 28.
  • the image processing board 20 includes a CPU (central processing unit) 21, an FPGA (field-programmable gate array) 22, a RAM (random access memory) 23, a ROM (read-only memory) 24, and a serial I / F ( A serial interface (25), a data I / F (data interface) 26, a data bus (data bus) 27, and a serial bus (serial bus) 28 are provided.
  • CPU central processing unit
  • FPGA field-programmable gate array
  • RAM random access memory
  • ROM read-only memory
  • serial I / F A serial interface (25), a data I / F (data interface) 26, a data bus (data bus) 27, and a serial bus (serial bus) 28 are provided.
  • the CPU 21 executes overall operation control, image processing, and image recognition processing of the image processing board 20.
  • the FPGA 22 executes processing that requires real-time performance for the image data stored in the RAM 23.
  • the FPGA 22 performs a parallax calculation by, for example, gamma correction, distortion correction (that is, parallelization of left and right images) and block matching to generate a parallax image, and stores the data in the RAM 23.
  • the CPU 21 executes control of the image sensor controllers 13L and 13R of the stereo camera 10 and overall control of the image processing board 20.
  • the CPU 21 loads a program for executing road surface shape detection, guardrail detection, and object detection from the ROM 24, and executes various processes using the luminance image and the parallax image stored in the RAM 23 as inputs.
  • the CPU 21 outputs the detection data from the serial I / F 25 or the data I / F 26 to the outside.
  • the CPU 21 uses the data I / F 26 to input vehicle information such as vehicle speed, acceleration, rudder angle, and yaw rate and use it as parameters for various processes such as road surface shape detection.
  • vehicle information such as vehicle speed, acceleration, rudder angle, and yaw rate
  • the data output to the outside is used as input data for executing vehicle control such as automatic emergency braking and automatic speed control.
  • vehicle control such as automatic emergency braking and automatic speed control. Note that some of the functions realized by the CPU 21 and the FPGA 22 may be provided outside the image processing board 20.
  • the image processing apparatus 30 includes a map generation unit 31, a detection unit 32, a frame generation unit 33, and an end determination unit 34.
  • the image processing apparatus 30 calculates a parallax value of a corresponding image portion between captured images captured by the stereo camera 10 in order to obtain a parallax image from the luminance image data acquired from the stereo camera 10.
  • the parallax value means that one image captured by the stereo camera 10 is a reference image, the other is a comparison image, and an image portion on the comparison image with respect to an image portion on the reference image corresponding to the same point in the imaging region.
  • the positional deviation amount is calculated as the parallax value of the image portion.
  • the distance to the same point in the imaging region corresponding to the image portion can be calculated from the parallax value. Since the parallax value can be treated as equivalent to the distance value, in this embodiment, the parallax image is described as an example of the distance image, and the parallax information is described as an example of the distance information.
  • the luminance image data is output from the stereo camera 10 as a captured image.
  • color luminance conversion for obtaining a luminance signal (Y) from the RGB signal is performed.
  • the luminance signal is obtained by the following equation [1].
  • the image processing device 30 performs parallel image generation processing on the luminance image data acquired from the stereo camera 10.
  • the stereo images output from each camera are parallelized by the two cameras based on the distortion of the optical system in the two cameras constituting the stereo camera 10 and the relative positional relationship between the left and right cameras. This is a process of converting to an ideal parallel stereo image obtained when the image is attached.
  • the image processing device 30 After performing the parallelized image generation processing in this way, the image processing device 30 performs parallax image generation processing for generating parallax image data.
  • the parallax image generation processing first, the luminance image data acquired from one of the two cameras is used as reference image data, and the luminance image data acquired from the other camera is used as comparison image data. Parallax is calculated, and parallax image data is generated and output.
  • the parallax image data indicates a parallax image in which pixel values corresponding to the parallax value d calculated for each image portion on the reference image data are represented as pixel values of the respective image portions.
  • the image processing device 30 defines a block composed of a plurality of pixels, for example, 16 pixels ⁇ 1 pixel, centered on one target pixel, for a certain row of reference image data.
  • the image processing apparatus 30 shifts a block having the same size as the defined reference image data block by one pixel in the horizontal line direction in the same row of the comparison image data, and features of pixel values of the blocks defined in the reference image data And a correlation value indicating a correlation between the feature amount indicating the feature amount indicating the feature of the pixel value of each block in the comparison image data.
  • the image processing apparatus 30 performs matching processing for selecting a block of comparison image data that is most correlated with the block of reference image data among the blocks in the comparison image data. Thereafter, the image processing apparatus 30 calculates a positional deviation amount between the target pixel of the block of the reference image data and the corresponding pixel of the block of the comparison image data selected by the matching process as the parallax value d.
  • the parallax image data can be obtained by performing such processing for calculating the parallax value d for the entire area of the reference image data or a specific area.
  • a luminance value that is a value of each pixel in the block can be used as the feature amount of the block used for the matching processing, and the correlation value is, for example, the value of each pixel in the block of the reference image data.
  • the sum of absolute values of differences between the luminance values and the luminance values that are the values of the respective pixels in the block of comparison image data corresponding to these pixels can be used. In this case, it can be said that the block having the smallest sum is most correlated.
  • SSD Sud of Squared Difference
  • ZSSD Zero-mean Sum of Squared Difference
  • SAD Sum of Absolute Difference
  • ZSAD Zero -mean Sum of Absolute Difference
  • the parallax value can be calculated only in units of pixels in the matching process, it is necessary to use an estimated value when a sub-pixel level parallax value less than one pixel is required.
  • the estimation method for example, an equiangular straight line method, a quadratic curve method, or the like can be used.
  • EEC estimated error correction
  • the map generation unit 31 has position information indicating the relative positional relationship between the upper, lower, left, and right, and has left and right position information and distance information from a distance image composed of pixels indicating distance information, and has a frequency value. It is a map production
  • the coordinate information of x and y in the xy coordinate system is described as an example of “position information indicating the relative positional relationship between the upper, lower, left, and right”.
  • the position information is not limited to the coordinate information of x and y as long as the position information indicates the relative positional relationship between the top, bottom, left, and right of the pixel.
  • the position information indicating the relative positional relationship between the left and right of the pixel is referred to as “left / right position information”, and the position information indicating the relative positional relationship between the upper and lower pixels is referred to as “up / down position information”.
  • the function of the map generator 31 is realized by the CPU 21 shown in FIG.
  • the “map” generated by the map generation unit 31 includes a U map and a real U map described later.
  • the map generation unit 31 generates a V map when generating a U map. Further, the map generation unit 31 generates a real U map obtained by converting the x-axis direction of the U map into an actual distance from the U map.
  • a plurality of maps are described as being generated in order with each other.
  • the present invention is not limited to this.
  • a real U map may be directly generated from parallax images obtained by two imaging means.
  • the V map is generated to estimate the position of the road surface in the parallax image.
  • this is another method that can estimate the position of the road surface without using the V map. Also good.
  • the map generation unit 31 generates a V map based on the generated parallax image.
  • the generation of the V map is performed in order to estimate the road surface position in the parallax image and recognize an object existing on the road surface. By specifying the road surface position, height information from the road surface can be obtained, and the size of an object existing on the road surface can be specified.
  • Each parallax pixel data included in the parallax image data is indicated by a set (x, y, d) of an x-direction position, a y-direction position, and a parallax value d.
  • the map generation unit 31 generates a two-dimensional histogram by setting d on the X axis, y on the Y axis, and frequencies on the Z axis in the set (x, y, d). This two-dimensional histogram corresponds to a V map. That is, the map generation unit 31 increments the frequency by one when each pixel of the parallax image has (d, y).
  • FIG. 4A shows a captured image obtained by imaging a situation in which the vehicle 101 is traveling in the direction of arrow C on the road surface 103 and the utility pole 102 is present on the left side of the road surface 103.
  • a V map generated by the map generation unit 31 is shown in FIG. 4B.
  • FIG. 4B when a parallax image is converted to a V map, an object on the road surface can be recognized by clustering the parallax values at a certain height from the road surface in association with the V map. . By clustering, the vehicle 101v, the utility pole 102v, and the road surface 103v can be recognized on the V map.
  • voting area an area for associating the parallax value on the V map.
  • a region B indicated by hatching in FIG. 4B indicates a portion below the road surface 103. Since no parallax is detected in a portion below the road surface 103, the region B is not associated with a parallax value.
  • the map generation unit 31 performs a road surface shape detection process for detecting the shape of the road surface 103. This is a process for linearly approximating a position estimated as a road surface in the V map.
  • a method of linear approximation for example, a least square method or a Hough transform may be used.
  • a least square method or a Hough transform may be used.
  • the road surface is flat, it can be approximated by a single straight line.
  • the gradient changes in the middle it is necessary to divide the map section and perform linear approximation with high accuracy.
  • the road surface shape detection may be performed by dividing the voting area as described above into two areas of a high parallax area and a low parallax area.
  • the map generation unit 31 performs a road surface height table calculation process for calculating the height of the road surface 103 and creating a table.
  • a linear expression representing the road surface is obtained from the V map, and when the parallax d is determined, the y coordinate at that time is determined. This y coordinate becomes the height of the road surface, and this is tabulated in the required parallax range.
  • the map generation unit 31 generates a U map in order to estimate the presence of a guard rail, a standing wall along the road surface, and the like, for example.
  • the first map generation unit 31 sets a set (x, y, d) of the x-direction position, the y-direction position, and the parallax value d in each parallax pixel data included in the parallax image data, and the x-axis and x-axis
  • the frequency is set on the d and Z axes, and XY two-dimensional histogram information is generated. This two-dimensional histogram information is a U map.
  • the map generation unit 31 has a predetermined height range (for example, 20 cm to 3 m) from the road surface based on the height of each road surface portion tabulated by the above-described road surface height table.
  • the frequency U map is generated for the point (x, y, d) of the parallax image at).
  • FIG. 5A shows a captured image obtained by imaging a state in which the vehicle 101a travels in the left lane in the direction of arrow D and the vehicle 101b travels in the direction of arrow E in the left lane on the road of one lane on one side.
  • Guard rails 105a and 105b are installed on both sides of the road.
  • FIG. 5B shows a frequency U map converted from the captured image shown in FIG. 5A.
  • the guard rails 105a and 105b are on a straight line extending from the left and right ends to the upper center.
  • the guard rails 105a and 105b after the U map conversion are expressed as 105au and 105bu.
  • the vehicle 101a and the vehicle 101b have a shape in which the diagonal line is connected to the horizontal line segment when the parallax is detected between the guard rails 105au and 105bu with the horizontal line segment and the side surface of the vehicle visible.
  • the vehicles 101a and 101b after the U map conversion are expressed as 101au and 101bu.
  • FIG. 5C shows a height U map.
  • the map generation unit 31 generates a height U map simultaneously with the generation of the frequency U map.
  • the map generation unit 31 sets a set (x, y, d) of the x-direction position, the y-direction position, and the parallax value d in each piece of parallax pixel data included in the parallax image data, x on the X axis, d on the Y axis, X-Y two-dimensional histogram information is generated by setting the height from the road surface on the Z axis.
  • This two-dimensional histogram information is a height U map.
  • the height value at this time is the maximum value from the road surface.
  • the hatching of the vehicles 101au and 101bu is darker than the hatching of the guard rails 105au and 105bu, and the height of the vehicles 101au and 101bu is larger than the height of the guardrails 105au and 105bu.
  • the height information of the object can be used for object recognition.
  • the map generation unit 31 generates a real U map obtained by converting the x-axis direction of the U map into an actual distance.
  • a procedure for generating a real U map will be described with reference to FIGS. 6A and 6B.
  • the real U map is a map in which the horizontal axis of the U map described above is converted from a pixel unit of an image into an actual distance unit, and the parallax value on the vertical axis is converted into a thinned parallax to which a thinning rate corresponding to the distance is applied.
  • . 6A is the same as FIG. 5B.
  • an example in which the horizontal axis is converted into an actual distance is shown, but it is only necessary to convert it into a unit equivalent to the actual distance.
  • the thinning parallax on the vertical axis is not thinned for a long distance (here, 50 m or more), thinned to 1/2 for a medium distance (20 m or more and less than 50 m), and 1 / for a short distance (10 m or more and less than 20 m). 3 was thinned out, and the nearest distance (less than 10 m) was thinned out to 1/8.
  • the farther away the smaller the amount of thinning out.
  • the reason for this is that because the object appears small in the distance, the parallax information is small, and the distance resolution is small, so the thinning is reduced.In the short distance, the object is large, so the parallax information is large and the distance resolution is large. To increase.
  • FIG. 6B shows an example of a real U map generated by the map generation unit 31.
  • a state is shown in which a road surface, a vehicle traveling on the road surface, and the like are viewed from above.
  • the guard rails 105au and 105bu are represented by vertical lines, and the converted guard rails 105au and 105bu are 105aru and 105bru.
  • the shapes of the vehicles 101au and 101bu are also converted to shapes that are close to the actual shapes.
  • the converted vehicles 101au and 101bu are denoted as 101aru and 101bru.
  • the detection unit 32 is a detection unit that detects a pixel block including a plurality of pixels having a common feature amount in the U map or the real U map generated by the map generation unit 31, and includes the CPU 21, the RAM 23, and the like illustrated in FIG.
  • the function is realized by.
  • the “common feature amount” refers to, for example, a pixel having a frequency value larger than a predetermined threshold, and the frequency values are close to each other.
  • a pixel group in which a plurality of these pixels are connected (or assembled) to each other is referred to as a “pixel block”.
  • the pixel block may be a pixel having a frequency value greater than a predetermined threshold, or a set thereof.
  • the frame generation unit 33 is a frame generation unit that generates a detection frame that defines a search target region for detecting an object from a distance image based on information indicated by pixels constituting the pixel block detected by the detection unit 32.
  • the functions are realized by the CPU 21 and the RAM 23 shown in FIG.
  • “information indicated by a pixel” is, for example, a frequency value or distance information.
  • the “detection frame” refers to a search target for performing a detection process, which will be described later, for specifying the width and height of the object corresponding to the pixel block detected by the detection unit 32 in the U map, for example. It is a frame defined as an area.
  • the detection frame is a frame generated based on information indicated by the pixels constituting the detected pixel block.
  • the detection frame functions as a temporary frame (hereinafter referred to as “temporary frame”) in order to specify the width, height, etc. of the object.
  • frame here does not mean a visually recognizable rectangle, but simply means information such as the coordinate position, width, and height for specifying an area on the image.
  • the object detection process can be speeded up and the processing time can be shortened.
  • the edge determination unit 34 is an edge determination unit that searches the distance image from the outside toward the center based on the detection frame, and uses the position where the frequency of the distance information is equal to or higher than a predetermined threshold as the edge of the object.
  • the functions are realized by the CPU 21, the RAM 23, and the like shown in FIG. This processing is processing for specifying the width and height of the object, and details will be described later.
  • the edge determination unit 34 searches the distance image from the left and right toward the center in the x-axis direction based on the detection frame, and sets the position where the frequency of distance information in the x-axis direction is equal to or greater than a predetermined threshold as the left and right edges of the object. To do. This process is a process for specifying the width of the object, and details will be described later.
  • the edge determination unit 34 searches the distance image from the top and bottom toward the center in the y-axis direction based on the detection frame, and sets the position where the frequency of distance information in the y-axis direction is equal to or higher than a predetermined threshold as the upper and lower ends of the object. decide. This process is a process for specifying the height of the object, and details will be described later.
  • the edge determination unit 34 preferably sets the distance image search start position to a position away from the outside of the detection frame by a predetermined distance. Moreover, it is preferable that the edge part determination part 34 searches the predetermined range in a y-axis direction toward the center of a x-axis direction from right and left of a distance image based on a detection frame. These processes are processes for specifying the width and height of the object as accurately as possible, and details will be described later.
  • the edge determination unit 34 changes the resolution of the distance image to be searched according to the distance information indicated by the pixels constituting the pixel block detected by the detection unit 32.
  • the processing speed can be improved by thinning out pixels and accessing the parallax image.
  • FIGS. 7C and 7D A detection procedure according to an embodiment will be described with reference to FIGS. 7C and 7D.
  • the detection procedure according to this embodiment will be described by comparison with the prior art (see FIGS. 7A and 7B).
  • FIG. 7A in order to detect an object in the search target area, it is necessary to access the entire image area (that is, all pixels) in the parallax image.
  • FIG. 7B in order to specify the width of the object in the search target area detected by this, the search target area is searched or rescanned.
  • the search target area may be extracted based on the detection frame described above, and only the search target area may be searched as shown in FIG. 7D.
  • access processing to all the pixels in the prior art is not required, it is possible to speed up the object detection processing and shorten the processing time.
  • FIG. 8A shows an image 201 obtained by photographing the vehicle 101 traveling in the left lane of the road surface 103 shown in FIG. 4A from the rear, for example.
  • An example of a pixel block converted from the image 201 onto the real U map is shown on the right side of FIG. 8B.
  • FIG. 8B shows an example of a pixel block converted on the real U map.
  • the frame generation unit 33 creates a line unit frame as shown on the left side of FIG. 8B. Generate. Specifically, the frame generation unit 33 generates a frame in each line based on the parallax information of the pixel block indicated by the rectangular frame shown on the right side of FIG. 8B and the left and right edges of the label. Further, the frame generation unit 33 converts the parallax at the line position where the frequency integrated value of each line is maximized into a distance. Further, the frame generation unit 33 generates a temporary frame [15] by integrating the generated line-by-line frames (see FIG. 8C).
  • the frame [1] ′ to line unit generated so as to correspond to the pixel information of the pixels arbitrarily selected from the pixels [1] to [5] constituting the pixel block. [5] ' is shown. This is for convenience of illustration, and actually, the frame generation unit 33 generates a frame corresponding to all the pixels shown on the right side of FIG. 8B.
  • [5] is a wide pixel corresponding to the rear surface of the vehicle, so that the generated line frame is also wide.
  • the heights of the generated line unit frames [1] ′ to [5] ′ are shown to be kept constant. This is because the U map is generated when the upper limit of the height from the road surface is set.
  • the height upper limit is set to 3 m when generating the U map
  • the height of the generated frame does not exceed 3 m even if the actual vehicle height is 3 m or more.
  • the detection frame when generating a detection frame that defines a search target region for detecting an object, the detection frame does not need to completely surround the entire vehicle that is the search target object.
  • the image processing device 30 generates a parallax image from a captured image captured by the stereo camera 10 (step S1).
  • the map generation unit 31 generates a V map, a U map, or a real U map based on the generated parallax image (step S2).
  • the detecting unit 32 detects a pixel block in the generated U map or real U map (step S3).
  • the frame generation unit 33 generates a temporary frame based on the detected pixel block (step S4).
  • the image processing apparatus 30 determines a temporary bottom of the object based on the generated temporary frame (step S5). For example, as shown in FIG. 10, a position that is a predetermined distance (for example, p [cm]) from the bottom (lower end) of the temporary frame is set as the search start position of the temporary bottom search. This is because, for example, when the road surface estimated by the V map is shifted above a predetermined position, it is desired to start the search from a position as close as possible to the lower end of the object.
  • the image processing apparatus 30 searches upward from the search start position, and when there is parallax information of 4 counts or more in one line, for example, determines that line as a temporary bottom of the object. Needless to say, the unit [cm] is an example.
  • the end determination unit 34 determines the left and right ends of the object (step S6). For example, as illustrated in FIG. 11, the edge determination unit 34 determines from the outside of the left and right ends of the temporary frame from the right to the left as indicated by the arrow RL, based on the horizontal parallax frequency histogram. Search from left to right as shown. Next, when a predetermined number of histograms having a frequency equal to or higher than a predetermined threshold value continue, the end determination unit 34 determines the position as the left and right ends of the object. Note that the edge determination unit 34 may process a histogram whose frequency is less than the threshold as noise.
  • the end determination unit 34 sets the search range to determine the left and right ends to q [mm] from the temporary bottom, r [mm] from the top, and s [mm] from the temporary bottom. It is preferable to be in the range. This is because, for example, it is difficult to be affected by the parallax information on the road surface or the parallax information of other objects above the object.
  • the end determining unit 34 determines the upper end of the object (step S7). For example, as illustrated in FIG. 12, the end determination unit 34 searches from the outside of the upper end of the temporary frame as indicated by an arrow UD, based on the frequency parallax histogram in the height direction. Next, when a predetermined number of histograms having a frequency equal to or higher than a predetermined threshold value are continued, the end determination unit 34 determines the position as the upper end of the object.
  • the edge determination unit 34 may process a histogram whose frequency is less than the threshold as noise. Further, the threshold may be varied depending on the shape of another object above the object, the roof of the object, or the like.
  • the end determination unit 34 determines the bottom of the object (step S8). For example, as shown in FIGS. 13A and 13B, the edge determination unit 34 searches the parallax up and down with reference to the temporary bottom, and when a predetermined number of parallaxes of one line are detected, the position is determined as the main bottom of the object. Determine as.
  • the above-described image processing By executing the above-described image processing, it is possible to obtain desirable effects such as reducing unnecessary processing as much as possible in both speeding up the object detection processing and accurately grasping the width of the object.
  • the above-described embodiment is image processing for obtaining the effects of the present invention, and the image processing that solves the problems of the present invention is not limited to the above-described embodiment.
  • image processing in which the left and right end determination procedures are replaced with the upper end determination procedure may be executed.
  • the procedure for determining the temporary bottom is performed in step S5, but this may be replaced with the procedure for determining the temporary top.
  • the procedure for determining the upper end of step S7 may be replaced with the procedure for determining the lower end.
  • the frequency histogram in the height direction is searched from the bottom to the top.
  • the procedure for determining the bottom in step S8 may be replaced with a procedure for determining the top.
  • the procedure for searching the horizontal frequency histogram from the left and right sides of the temporary frame has been described as an example, but this is an effective procedure for speeding up the detection process.
  • the present invention is not limited to this, and a procedure for searching from the center in the x-axis direction of the horizontal frequency histogram in the horizontal direction may be used.
  • the embodiment described above is a preferred embodiment of the present invention, and various changes and modifications can be made without departing from the scope of the present invention.
  • the image processing by the image processing apparatus of the above-described embodiment can be executed using hardware, software, or a combined configuration of both.
  • the stereo camera is described as a premise, but the present invention is not limited to this.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)
  • Traffic Control Systems (AREA)
  • Image Processing (AREA)

Abstract

画像処理装置は、左右位置情報と距離情報を有し、頻度値が対応付けられた画素で構成されるマップを生成するマップ生成手段と、マップにおいて共通する特徴量を有する画素の複数からなる画素塊を検出する検出手段と、検出手段により検出された画素塊を構成する画素が示す情報に基づいて、距離画像から物体を検出するための検索対象領域を規定する検出枠を生成する枠生成手段とを備えることを特徴とする。

Description

画像処理装置、機器制御システム、撮像装置、画像処理方法及びプログラム
 本発明は、画像処理装置、機器制御システム、撮像装置、画像処理方法及びプログラムに関する。
 自動車の安全性において、従来は歩行者や自動車と衝突したときに、いかに歩行者を守れるか、乗員を保護できるかの観点から自動車のボディー構造などの開発が行われてきた。しかしながら近年、情報処理技術、画像処理技術の発達により、人や自動車を高速に検出する技術が開発されてきている。これらの技術を自動車等に応用して、衝突する前に自動的にブレーキをかけ、衝突を未然に防ぐ技術が既に知られている。
 ところで、自車両に接近する人や自動車等の接近物をカメラ等を利用することにより検出し、検出した接近物を検知枠で囲む技術が、例えば特許文献1に開示されている。
特許第5329582号公報
 本発明は、物体の検出処理を高速化し、検出した物体を検出枠で囲むための画像処理時間を短縮することを目的とする。本発明の画像処理装置は、左右位置情報と距離情報を有し、頻度値が対応付けられた画素で構成されるマップを生成するマップ生成手段と、前記マップにおいて共通する特徴量を有する前記画素の複数からなる画素塊を検出する検出手段と、前記検出手段により検出された前記画素塊を構成する前記画素が示す情報に基づいて、前記距離情報から物体を検出するための検索対象領域を規定する検出枠を生成する枠生成手段とを備えることを特徴とする。
 本発明によれば、物体の検出処理を高速化し、検出した物体を検出枠で囲むための画像処理時間を短縮できる。
一実施形態に係る機器制御システムの概略構成図である。 一実施形態に係る撮像装置の概略構成図である。 一実施形態に係る画像処理装置の機能ブロック図である。 一実施形態に係るVマップを生成する手順を説明するための図である。 一実施形態に係るVマップを生成する手順を説明するための図である。 一実施形態に係るUマップを生成する手順を説明するための図である。 一実施形態に係るUマップを生成する手順を説明するための図である。 一実施形態に係るUマップを生成する手順を説明するための図である。 一実施形態に係るリアルUマップを生成する手順を説明するための図である。 一実施形態に係るリアルUマップを生成する手順を説明するための図である。 従来技術の課題を説明するための図である。 従来技術の課題を説明するための図である。 一実施形態に係る検出手順を説明するための図である。 一実施形態に係る検出手順を説明するための図である。 一実施形態に係る検出枠を生成する手順を説明するための図である。 一実施形態に係る検出枠を生成する手順を説明するための図である。 一実施形態に係る検出枠を生成する手順を説明するための図である。 一実施形態に係る画像処理を説明するためのフローチャートである。 一実施形態に係るボトム側の検索開始位置を決定する手順を説明するための図である。 一実施形態に係る物体の左右位置を決定する手順を説明するための図である。 一実施形態に係る物体の上端を決定する手順を説明するための図である。 一実施形態に係る物体のボトムを決定する手順を説明するための図である。 一実施形態に係る物体のボトムを決定する手順を説明するための図である。
 図面を用いて、本発明の実施形態に係る画像処理装置を説明する。この説明は、本発明の趣旨を越えない限り、下記の実施形態のみに限定されるものではない。なお、各図中、同一又は相当する部分には同一の符号を付しており、その重複説明は適宜に簡略化乃至省略する。また、下記の実施形態は本発明の最良の形態であって、本発明に係る特許請求の範囲を限定するものではない。
 移動体としての車両に取り付けられたステレオカメラ等の撮像装置により撮像された、当該車両の前方を走行する他の車両等の物体を認識する例を用いて、一実施形態に係る画像処理装置を説明する。ここで、移動体としては車両に限定されず、船舶、航空機等にも適用可能である。
 例えば、画像処理装置は、画像処理装置が実行した処理の結果を用いて車両の運行等を制御する。なお、この制御には、車両自体を制御する機能に加え、車両等が備える所定の機器(例えば、ブレーキシステム、操舵システム、エンジン制御システム等の機器)を制御する機能も含まれる。
 また、画像処理装置は、例えば情報処理装置等として単独で構成してもよい。あるいは、画像処理装置が有する機能をステレオカメラ等の撮像装置が有する処理基板等に組み込んだ構成としてもよい。
 <機器制御システム>
 図1を参照して、一実施形態に係る機器制御システムを説明する。ここでは、機器制御システムとして車両を制御する車両制御システムの例を用いて、機器制御システムの概略を説明する。図1に示す車両1において、矢印A方向が車両1の前進方向である。車両1は、撮像ユニット2と、画像処理ユニット3と、制御ユニット4とを備える。撮像ユニット2は、例えば車内のルームミラー付近に設置され、フロントガラス5越しに車両1の前方を走行する他の車両等を撮像する。
 撮像ユニット2により撮像された画像に基づき、物体検出手段としての画像処理ユニット3は車両1の前方の物体を検出する。画像処理ユニット3からの検出結果に基づき、制御ユニット4は車両1の走行スピード、他の車両との走行間隔、走行レーン、ブレーキのタイミング等を制御する。ここで、撮像ユニット、画像処理ユニット、制御ユニットという用語は、説明の便宜上用いた用語である。すなわち、撮像ユニット、画像処理ユニット、制御ユニットという用語の代りに、それぞれ、撮像装置(又は撮像手段)、画像処理装置(又は画像処理手段)、制御装置(又は制御手段)という用語を用いてもよい。
 <撮像装置>
 図2を参照して、一実施形態に係る撮像装置を説明する。この撮像装置は、ステレオカメラ10と、画像処理基板20とを備える。
 ステレオカメラ10は、2台のカメラを平行に組み付けられて構成される。ステレオカメラ10は、左レンズ11Lに対応して、画像センサ12L及び画像センサコントローラ13Lを備え、右レンズ11Rに対応して、画像センサ12R及び画像センサコントローラ13Rを備える。なお、この実施形態においては、2台のカメラによりステレオカメラ10を構成しているが、本発明に係るステレオカメラを、3台以上のカメラにより構成してもよい。
 画像センサコントローラ13L、13Rは、それぞれ、画像センサ12L、12Rの露光制御、A/D変換、画像読み出し制御、外部回路との通信、画像データの送信の機能を有する。ステレオカメラ10は、画像処理基板20と、データバス27及びシリアルバス28を介して接続される。ステレオカメラ10から、輝度画像データと視差画像データが画像処理基板20に出力される。
 ステレオカメラ10の画像センサ12L、12Rから出力される輝度画像データはデータバス27を介して画像処理基板20に転送される。また、シリアルバス28を介して、画像処理基板20からのセンサ露光制御値変更、画像読み出しパラメータ変更、各種設定データの送受信が行われる。
 画像処理基板20は、CPU(central processing unit)21と、FPGA(field-programmable gate array)22と、RAM(random access memory)23と、ROM(read-only memory)24と、シリアルI/F(serial interface)25と、データI/F(data interface)26と、データバス(data bus)27と、シリアルバス(serial bus)28とを備える。
 CPU21は、画像処理基板20の全体の動作制御、画像処理、及び画像認識処理を実行する。FPGA22は、RAM23に保存された画像データに対してリアルタイム性が要求される処理を実行する。FPGA22は、例えばガンマ補正、歪み補正(すなわち左右画像の平行化)、ブロックマッチングによる視差演算を行って視差画像を生成し、データをRAM23に格納する。
 CPU21は、ステレオカメラ10の画像センサコントローラ13L、13Rの制御、及び画像処理基板20の全体的な制御を実行する。また、CPU21は、路面形状検出、ガードレール検出、オブジェクト検出を実行するプログラムをROM24からロードして、RAM23に格納された輝度画像及び視差画像を入力として各種処理を実行する。さらに、CPU21は、検出データをシリアルI/F25又はデータI/F26から外部へ出力する。
 CPU21は、処理の実行に際し、データI/F26を利用して、車速、加速度、舵角、ヨーレートなど車両の情報を入力して路面形状検出などの各種処理のパラメータとして使用する。外部に出力されるデータは自動緊急ブレーキや自動速度制御等の車両の制御を実行するための入力データとして使用される。なお、CPU21やFPGA22で実現される機能の一部は、画像処理基板20の外部に持たせてもよい。
 <画像処理装置の機能ブロック>
 図3を参照して、一実施形態に係る画像処理装置の機能ブロックを説明する。図3に示すように、この画像処理装置30は、マップ生成部31と、検出部32と、枠生成部33と、端部決定部34とを備える。
 まず、画像処理装置30が、2つの撮像手段としての2台のカメラを有するステレオカメラ10により撮像された撮像画像から視差画像を生成する手順を説明する。この手順は、図2に示したFPGA22の機能により実行される。
 より具体的には、画像処理装置30は、ステレオカメラ10から取得した輝度画像データから視差画像を得るために、ステレオカメラ10で撮像した撮像画像間の対応画像部分の視差値を演算する。
 ここで、視差値とは、ステレオカメラ10で撮像した一方の画像を基準画像、他方を比較画像とし、撮像領域内の同一地点に対応した基準画像上の画像部分に対する比較画像上の画像部分の位置ズレ量を、当該画像部分の視差値として算出したものである。次に、三角測量の原理を利用することで、この視差値から当該画像部分に対応した撮像領域内の当該同一地点までの距離を算出することができる。視差値は距離値と等価として扱えるため、この実施形態においては、視差画像を距離画像の一例として、また、視差情報を距離情報の一例として説明している。
 ステレオカメラ10からは撮像画像として輝度画像データが出力されるが、このときステレオカメラ10がカラーの場合は、RGB信号から輝度信号(Y)を得るカラー輝度変換を行う。例えば、下記の式〔1〕により輝度信号を得る。
   Y=0.3R+0.59G+0.11B・・・〔1〕
 なお、ステレオカメラ10から取得した輝度画像データに対して、画像処理装置30は、平行化画像生成処理を行う。この平行化画像生成処理は、ステレオカメラ10を構成する2つのカメラにおける光学系の歪みや左右のカメラの相対的な位置関係から、各カメラから出力されるステレオ画像を、2つのカメラが平行に取り付けられたときに得られる理想的な平行化ステレオ画像となるように変換する処理である。
 このように平行化画像生成処理を行った後、画像処理装置30は、視差画像データを生成する視差画像生成処理を行う。視差画像生成処理では、まず、2つのカメラのうちの一方のカメラから取得した輝度画像データを基準画像データとし、他方のカメラから取得した輝度画像データを比較画像データとし、これらを用いて両者の視差を演算して、視差画像データを生成して出力する。この視差画像データは、基準画像データ上の各画像部分について算出される視差値dに応じた画素値をそれぞれの画像部分の画素値として表した視差画像を示す。
 具体的には、画像処理装置30は、基準画像データのある行について、一つの注目画素を中心とした複数画素、例えば16画素×1画素からなるブロックを定義する。一方、画像処理装置30は、比較画像データにおける同じ行において、定義した基準画像データのブロックと同じサイズのブロックを1画素ずつ横ライン方向へずらし、基準画像データにおいて定義したブロックの画素値の特徴を示す特徴量と比較画像データにおける各ブロックの画素値の特徴を示す特徴量との相関を示す相関値を、それぞれ算出する。
 次に、画像処理装置30は、算出した相関値に基づき、比較画像データにおける各ブロックの中で最も基準画像データのブロックと相関があった比較画像データのブロックを選定するマッチング処理を行う。その後、画像処理装置30は、基準画像データのブロックの注目画素と、マッチング処理で選定された比較画像データのブロックの対応画素との位置ズレ量を視差値dとして算出する。このような視差値dを算出する処理を基準画像データの全域又は特定の一領域について行うことで、視差画像データを得ることができる。
 マッチング処理に用いるブロックの特徴量としては、例えば、ブロック内の各画素の値である輝度値を用いることができ、相関値としては、例えば、基準画像データのブロック内の各画素の値である輝度値と、これらの画素にそれぞれ対応する比較画像データのブロック内の各画素の値である輝度値との差分の絶対値の総和を用いることができる。この場合、当該総和が最も小さくなるブロックが最も相関があるといえる。
 画像処理装置30でのマッチング処理をハードウェア処理によって実現する場合には、例えばSSD(Sum of Squared Difference)、ZSSD(Zero-mean Sum of Squared Difference)、SAD(Sum of Absolute Difference)、ZSAD(Zero-mean Sum of Absolute Difference)などの方法を用いることができる。
 なお、マッチング処理では画素単位での視差値しか算出できないため、1画素未満のサブピクセルレベルの視差値が必要な場合には推定値を用いる必要がある。その推定方法としては、例えば、等角直線方式、二次曲線方式等を利用することができる。ただし、このサブピクセルレベルの推定視差値には誤差が発生するため、この推定誤差を減少させるEEC(推定誤差補正)などを用いてもよい。
 マップ生成部31は、上下左右の相対的な位置関係を示す位置情報を有し、かつ、距離情報を示す画素で構成される距離画像から、左右位置情報と距離情報を有し、頻度値が対応付けられた画素で構成されるマップを生成するマップ生成手段である。この実施形態においては、xy座標系におけるx、yの座標情報を「上下左右の相対的な位置関係を示す位置情報」の一例として説明している。他方、画素の上下左右の相対的な位置関係を示す位置情報であれば、x、yの座標情報に限定されない。また、この実施形態においては、画素の左右の相対的な位置関係を示す位置情報を「左右位置情報」とし、画素の上下の相対的な位置関係を示す位置情報を「上下位置情報」とする。マップ生成部31は、図2に示したCPU21によりその機能が実現される。マップ生成部31が生成する「マップ」には、後述するUマップ及びリアルUマップが含まれる。
 マップ生成部31は、Uマップを生成するにあたり、Vマップを生成する。さらに、マップ生成部31は、Uマップから、Uマップのx軸方向を実距離に変換したリアルUマップを生成する。なお、この実施形態では、複数のマップは互いに順序立てて生成されるものとして説明しているが、これに限られない。例えば、リアルUマップを、2つの撮像手段によって得られる視差画像から直接生成しても良い。また、この実施形態では、後述のとおり視差画像における路面の位置を推定するためにVマップを生成しているが、Vマップによらずとも、路面の位置が推定可能なその他の手法であってもよい。
 図4A及び図4Bを参照して、マップ生成部31によりVマップを生成する手順を説明する。マップ生成部31は、生成された視差画像に基づいてVマップを生成する。Vマップの生成は、視差画像における路面位置を推定し、路面上に存在する物体を認識するために行われる。路面位置を特定することで路面からの高さ情報を得ることができ、路面上に存在する物体の大きさを特定することができる。
 視差画像データに含まれる各視差画素データは、x方向位置とy方向位置と視差値dとの組(x、y、d)で示される。マップ生成部31は、この組(x、y、d)のうち、X軸にd、Y軸にy、Z軸に頻度を設定して、2次元のヒストグラムを生成する。この2次元のヒストグラムがVマップに相当する。つまり、マップ生成部31は、視差画像の各画素において、(d、y)を持つときにその度数を一つカウントアップする。
 図4Aは、路面103上を車両101が矢印C方向に走行しており、路面103の左側に電柱102が存在する様子を撮像した撮像画像を示す。これをマップ生成部31により生成したVマップが図4Bである。図4Bに示すように、視差画像からVマップに変換するとき、路面から一定の高さにある視差値をVマップ上に対応付けてクラスタリングすることによって、路面上の物体を認識することができる。クラスタリングにより、Vマップ上において車両101v、電柱102v、路面103vを認識することができる。
 また、視差値をVマップ上に対応付ける領域(以下「投票領域」という)を設定する必要がある。この実施形態において、図4Bに斜線で示す領域Bは、路面103より下の部分を示している。路面103より下の部分において視差が検出されることはないため、領域Bには視差値の対応付けはされない。その他、カメラを搭載した車両の走行状態によって、路面推定範囲が変化すること等を考慮して投票領域を決定することが好ましい。
 また、マップ生成部31は、路面103の形状を検出する路面形状検出処理を行う。これは、Vマップにおいて路面と推定される位置を直線近似する処理である。直線近似の方法としては、例えば最小二乗法やハフ変換を用いればよい。例えば、路面が平坦な場合は一本の直線で近似可能であるが、途中で勾配が変わる場合には、マップの区間を分割して精度よく直線近似する必要がある。
 なお、Vマップにおいて路面形状検出処理を行う場合、上述した投票領域の制限を行っても、視差の大きい領域と視差の小さい領域の2領域に分けて路面形状検出を行ってもよい。
 マップ生成部31は、路面103の高さを算出してテーブル化する路面高さテーブル算出処理を行う。Vマップから路面を表す直線式が得られ、視差dが決まればそのときのy座標が決定される。このy座標が路面の高さとなり、これを必要な視差の範囲でテーブル化する。
 次に、図5A、図5B及び図5Cを参照して、マップ生成部31によりUマップを生成する手順の概略を説明する。マップ生成部31は、例えばガードレールや路面に沿った立ち壁等の存在を推定するためにUマップを生成する。第1のマップ生成部31は、視差画像データに含まれる各視差画素データにおけるx方向位置とy方向位置と視差値dとの組(x、y、d)を、X軸にx、Y軸にd、Z軸に頻度を設定して、X-Yの2次元ヒストグラム情報を生成する。この2次元ヒストグラム情報がUマップである。
 この実施形態においては、マップ生成部31は、上述の路面高さテーブルによってテーブル化された各路面部分の高さに基づいて、路面からの高さが所定の高さの範囲(たとえば20cmから3m)にある視差画像の点(x、y、d)について頻度Uマップを生成する。
 図5Aは、片側1車線の道路上のうち、左車線を車両101aが矢印D方向に走行し、右車線を車両101bが矢印E方向に走行している状態を撮像した撮像画像を示す。また、道路両脇には、ガードレール105a、105bが設置されている。
 図5Bは、図5Aに示す撮像画像から変換された頻度Uマップを示す。ガードレール105a、105bは左右端から中央上部に延びる直線上になる。ここでは、Uマップ変換後のガードレール105a、105bを105au、105buと表記している。
 他方、車両101a、車両101bはガードレール105au、105buの間で、水平線分と、車の側面が見えて視差が検出されている場合は斜め線が水平線分に連結した形状となる。ここでは、Uマップ変換後の車両101a、車両101bを101au、101buと表記している。
 図5Cは、高さUマップを示す。マップ生成部31は、頻度Uマップの生成と同時に高さUマップを生成する。マップ生成部31は、視差画像データに含まれる各視差画素データにおけるx方向位置とy方向位置と視差値dとの組(x、y、d)を、X軸にx、Y軸にd、Z軸に路面からの高さを設定して、X-Yの2次元ヒストグラム情報を生成する。この2次元ヒストグラム情報が高さUマップである。このときの高さの値は路面からの高さの最大値である。
 図5Cに異なる濃さのハッチングで示すように、車両101au、101buのハッチングはガードレール105au、105buのハッチングより濃く、車両101au、101buの高さはガードレール105au、105buの高さよりも大きい。これにより物体の高さ情報を物体認識に使用することができる。
 マップ生成部31は、Uマップのx軸方向を実距離に変換したリアルUマップを生成する。図6A及び図6Bを参照して、リアルUマップを生成する手順を説明する。リアルUマップは、上述したUマップの横軸を画像の画素単位から実際の距離単位に変換し、縦軸の視差値を距離に応じた間引き率が適用された間引き視差に変換したマップである。なお、図6Aは図5Bと同じ図である。ここでは横軸を実距離に変換した例を示しているが、実距離相当の単位に変換できればよい。
 縦軸の間引き視差は、遠距離(ここでは50m以上)については間引きなし、中距離(20m以上、50m未満)については1/2に間引き、近距離(10m以上、20m未満)については1/3に間引き、最近距離(10m未満)については、1/8に間引いた。
 つまり、遠方ほど、間引く量を少なくしている。その理由は、遠方では物体が小さく写るため、視差情報が少ない、距離の分解能も小さいため間引きを少なくし、近距離の場合は物体が大きく写るため、視差情報が多く距離の分解能も大きいため間引きを多くする。
 図6Bは、マップ生成部31により生成されたリアルUマップの例を示す。図6BのリアルUマップにおいては、路面や路面上を走行する車両等を上から俯瞰したような状態が示されている。ガードレール105au、105buは垂直の線状で表され、変換後のガードレール105au、105buを105aru、105bruとしている。また、車両101au、101buの形状も実際の形状に近い形状に変換されている。変換後の車両101au、101buを101aru、101bruと表記している。
 なお、図5Cの高さUマップと同様に、リアルUマップについても頻度マップだけでなく、高さリアルUマップを生成することも可能である。
 検出部32は、マップ生成部31により生成されたUマップ又はリアルUマップにおいて共通する特徴量を有する画素の複数からなる画素塊を検出する検出手段であり、図2に示したCPU21、RAM23等によってその機能が実現される。この実施形態において、「共通する特徴量」とは、例えば、所定の閾値より大きい頻度値を有する画素であって、その頻度値が互いに近似している場合等をいう。また、この実施形態においては、それらの画素の複数が互いに連結した(あるいは集合した)画素群を「画素塊」としている。なお、画素塊としては、所定の閾値より大きい頻度値を有する画素、またはそれらの集合としてもよい。
 枠生成部33は、検出部32により検出された画素塊を構成する画素が示す情報に基づいて距離画像から物体を検出するための検索対象領域を規定する検出枠を生成する枠生成手段であり、図2に示したCPU21、RAM23等によってその機能が実現される。この実施形態において「画素が示す情報」とは、例えば頻度値や距離情報等である。また、この実施形態において「検出枠」とは、例えばUマップ等において検出部32により検出された画素塊に対応する物体の幅や高さ等を特定する後述の検出処理を行うために検索対象領域として規定される枠である。詳細は後述するが、検出枠は、検出された画素塊を構成する画素が示す情報に基づいて生成される枠である。この実施形態において、検出枠は、物体の幅や高さ等を特定するために仮の枠(以下、「仮枠」という)として機能する。
 なお、ここでいう「枠」とは視覚的に認識可能な矩形を意味するのではなく、単に画像上の領域を特定する座標位置や幅、高さ等の情報を意味するものとする。
 この実施形態によれば、枠生成部33により生成された検出枠に対応する物体の幅や高さ等を特定することにより、全ての視差画像にアクセスする必要がなくなる。その結果、物体の検出処理を高速化し、処理時間を短縮することが可能になる。
 端部決定部34は、検出枠に基づいて距離画像を外側から中心に向かって検索し、距離情報の頻度が所定の閾値以上となる位置を物体の端部とする端部決定手段であり、図2に示したCPU21、RAM23等によってその機能が実現される。本処理は、物体の幅や高さを特定するための処理であり、詳細については後述する。
 端部決定部34は、検出枠に基づいて距離画像を左右からx軸方向の中心に向かって検索し、x軸方向における距離情報の頻度が所定の閾値以上となる位置を物体の左右端とする。本処理は、物体の幅を特定するための処理であり、詳細については後述する。
 端部決定部34は、検出枠に基づいて距離画像を上下からy軸方向の中心に向かって検索し、y軸方向における距離情報の頻度が所定の閾値以上となる位置を物体の上下端として決定する。この処理は、物体の高さを特定するための処理であり、詳細については後述する。
 端部決定部34は、距離画像の検索開始位置を検出枠の外側から所定距離だけ離れた位置とすることが好ましい。また、端部決定部34は、検出枠に基づいて距離画像の左右からx軸方向の中心に向かってy軸方向における所定範囲を検索することが好ましい。これらの処理は、物体の幅や高さ等をできるだけ正確に特定するための処理であり、詳細については後述する。
 さらに、端部決定部34は、検出部32により検出された画素塊を構成する画素が示す距離情報に応じて、検索対象とする距離画像の解像度を変更することが好ましい。撮像視点から近い近距離の物体については、画素を間引いて視差画像にアクセスすることで、処理速度を向上させることが可能となる。
 <検出手順>
 図7C及び図7Dを参照して、一実施形態に係る検出手順を説明する。ここでは、この実施形態に係る検出手順を従来技術(図7A及び図7B参照)との比較により説明する。従来技術においては、図7Aに示すように、検索対象領域の物体を検出するためには、視差画像中の全画像領域(すなわち全画素)にアクセスする必要があった。従来技術においては、図7Bに示すように、これにより検出された検索対象領域の物体の幅を特定するために、検索対象領域を検索あるいは再走査する処理を行っていた。
 一方、この実施形態においては、図7Cに示すように、上述した検出枠に基づいて検索対象領域を抽出し、図7Dに示すように、検索対象領域のみを検索すればよい。この実施形態によれば、従来技術における全画素へのアクセス処理が不要になるので、物体の検出処理を高速化し、処理時間を短縮することが可能になる。
 <検出枠を生成する手順>
 図8A、図8B及び図8Cを参照して、一実施形態に係る検出枠を生成する手順を説明する。図8Aは、例えば図4Aに示した路面103の左車線を走行する車両101を後方から撮影した画像201を示す。図8Bの右側に、画像201からリアルUマップ上に変換された画素塊の例を示す。なお、ここではリアルUマップ上に変換された画素塊の例を用いているが、これに限定されず、Uマップ上に変換された画素塊を用いてもよい。
 ここでは、例えば図8Bの右側に示すような、リアルUマップ上に変換された画素塊が有する画素情報に基づいて、枠生成部33は、図8Bの左側に示すようなライン単位の枠を生成する。具体的には、枠生成部33は、図8Bの右側に示す矩形枠で示される画素塊の視差情報とラベルの左右端に基づいて、各ラインにおける枠を生成する。また、枠生成部33は、各ラインの頻度積算値が最大になるライン位置における視差を距離に変換する。また、枠生成部33は、生成したライン単位の枠を統合することにより、仮枠[15]を生成する(図8C参照)。
 なお、図8Bにおいては、画素塊を構成する画素[1]~[5]のうちから任意に選択した画素の画素情報にそれぞれ対応するように、生成されたライン単位の枠[1]'~[5]'が示されている。これは図示上の便宜を図るためであり、実際には、枠生成部33は図8Bの右側に示す全画素に対応する枠を生成する。なお、図8Bにおいて[5]は、幅のある、車両の背面に対応する画素であるため、生成されるラインの枠も幅広となっている。また、図8Bの左側においては、生成されたライン単位の枠[1]'~[5]'の高さを一定に保つように示されている。これは、路面からの高さの上限を設定した場合のUマップを生成しているからである。例えば、Uマップを生成する際に高さ上限を3mに設定した場合、実際の車両の高さが3m以上あったとしても、生成される枠の高さは3mを超えることはない。この実施形態においては、物体を検出するための検索対象領域を規定する検出枠を生成する場合、検出枠が、検索対象の物体である車両の全体を完全に囲む必要はない。
 <画像処理>
 次に、図9のフローチャート及び図10~図13Bを参照して、一実施形態に係る画像処理を説明する。まず、画像処理装置30は、ステレオカメラ10で撮像された撮像画像から視差画像を生成する(ステップS1)。次に、マップ生成部31は、生成された視差画像に基づいて、Vマップ、Uマップ又はリアルUマップを生成する(ステップS2)。
 検出部32は、生成されたUマップ又はリアルUマップにおける画素塊を検出する(ステップS3)。枠生成部33は、検出された画素塊に基づいて仮枠を生成する(ステップS4)。
 画像処理装置30は、生成された仮枠に基づいて物体の仮ボトムを決定する(ステップS5)。例えば、図10に示すように、仮枠のボトム(下端)から所定の距離(例えばp[cm])だけ下方の位置を、仮ボトム検索の検索開始位置とする。これは、例えばVマップにより推定された路面が所定の位置より上にずれた場合にできる限り物体の下端に近い位置から検索を開始したいからである。画像処理装置30は、検索開始位置から上方へ検索し、例えば1ラインに4カウント以上の視差情報があるとき、そのラインを物体の仮ボトムとして決定する。なお、単位[cm]が一例であることは言うまでもない。
 次に、端部決定部34は、物体の左右端を決定する(ステップS6)。例えば、図11に示すように、端部決定部34は、横方向の視差の頻度ヒストグラムに基づいて、仮枠の左右端の外側から、矢印RLで示すように右から左へ、矢印LRで示すように左から右へ検索する。次に、端部決定部34は、所定の閾値以上の頻度を有するヒストグラムが所定数連続した場合に、その位置を物体の左右端として決定する。なお、端部決定部34は、頻度が閾値に満たないヒストグラムについては、ノイズとして処理すればよい。
 なお、上述したステップS6において、端部決定部34は、左右端を決定するために検索する範囲を、仮ボトムからq[mm]又はトップからr[mm]、仮ボトムからs[mm]の範囲とすることが好ましい。これは、例えば、路面上の視差情報や、物体の上方にある他の物体等の視差情報の影響を受け難くするためである。
 次に、端部決定部34は、物体の上端を決定する(ステップS7)。例えば、図12に示すように、端部決定部34は、高さ方向の視差の頻度ヒストグラムに基づいて、仮枠の上端の外側から、矢印UDで示すように検索する。次に、端部決定部34は、所定の閾値以上の頻度を有するヒストグラムが所定数連続した場合に、その位置を物体の上端として決定する。なお、端部決定部34は、頻度が閾値に満たないヒストグラムについては、ノイズとして処理すればよい。また、物体の上方にある他物体や物体の屋根等の形状等によって、閾値を可変させてもよい。
 最後に、端部決定部34は、物体の本ボトムを決定する(ステップS8)。例えば、図13A及び図13Bに示すように、端部決定部34は、仮ボトムを基準として上下に視差を検索し、1ラインの視差が所定数検出されたとき、その位置を物体の本ボトムとして決定する。
 上述した画像処理を実行することにより、物体の検出処理の高速化と、物体の幅等の正確な把握の両立において、無駄な処理を極力低減させる等の望ましい効果を得ることができる。なお、上述した実施形態は、本発明の効果を得るための画像処理であり、本発明の課題を解決する画像処理が上述した実施形態に限定されるものではない。例えば、左右端の決定手順と上端の決定手順を入れ替えた画像処理を実行してもよい。
 また、上述した実施形態においては、ステップS5において仮ボトムを決定する手順を行っているが、これを仮トップを決定する手順に代えてもよい。その場合、ステップS7の上端を決定する手順を、下端を決定する手順に代えてもよい。この場合、高さ方向の頻度ヒストグラムを下から上に検索することになる。さらに、その場合、ステップS8のボトムを決定する手順を、トップを決定する手順に代えてもよい。
 なお、図11では、横方向の頻度ヒストグラムを仮枠の左右から検索する手順を例に説明したが、これは検出処理の高速化のために有効な手順である。他方、これに限定されず、横方向の頻度ヒストグラムのx軸方向の中央から左右方向へ検索する手順としてもよい。
 なお、上述した実施形態は、本発明の好適な実施形態であり、本発明の要旨を逸脱しない範囲内において種々の変更や変形が可能である。例えば、上述した実施形態の画像処理装置による画像処理を、ハードウェア、又は、ソフトウェア、あるいは、両者の複合構成を用いて実行することも可能である。
 なお、ソフトウェアを用いて画像処理を実行する場合、画像処理シーケンスを記録したプログラムを、専用のハードウェアに組み込まれているコンピュータ内のメモリにインストールして実行させることが可能である。あるいは、各種処理が実行可能な汎用コンピュータに上述したプログラムをインストールして実行させることが可能である。
 また、上述した実施形態においては、ステレオカメラを前提として記載しているが、これに限られない。例えば、レーザーレーダ等の距離情報と視差画像を組み合わせて距離画像を生成し、生成された距離画像に対して上述した実施形態の画像処理装置を適用することができる。
 この国際出願は、日本特許庁に2016年3月14日に出願された特許出願2016-049795号に基づく優先権を主張するものであり、その全内容をここに援用する。
 1  車両
 2  撮像ユニット
 3  画像処理ユニット
 4  制御ユニット
 5  フロントガラス
 10  ステレオカメラ
 11L  左レンズ
 11R  右レンズ
 12L、12R  画像センサ
 13L、13R  画像センサコントローラ
 20  画像処理基板
 21  CPU
 22  FPGA
 23  RAM
 24  ROM
 25  シリアルI/F
 26  データI/F
 27  データバス
 28  シリアルバス
 30  画像処理装置
 31  マップ生成部
 32  検出部
 33  枠生成部
 34  端部決定部

Claims (12)

  1.  左右位置情報と距離情報を有し、頻度値が対応付けられた画素で構成されるマップを生成するマップ生成手段と、
     前記マップにおいて共通する特徴量を有する前記画素の複数からなる画素塊を検出する検出手段と、
     前記検出手段により検出された前記画素塊を構成する前記画素が示す情報に基づいて、前記距離情報から物体を検出するための検索対象領域を規定する検出枠を生成する枠生成手段と、
     を備えることを特徴とする画像処理装置。
  2.  前記検出枠に基づいて、前記距離情報を示す画素で構成される距離画像を外側から中心に向かって検索し、距離情報の頻度が所定の閾値以上となる位置を前記物体の端部とする端部決定手段を備えることを特徴とする請求項1に記載の画像処理装置。
  3.  前記端部決定手段は、前記検出枠に基づいて前記距離画像を左右からx軸方向の中心に向かって検索し、x軸方向における距離情報の頻度が所定の閾値以上となる位置を前記物体の左右端とすることを特徴とする請求項2に記載の画像処理装置。
  4.  前記端部決定手段は、前記検出枠に基づいて前記距離画像を上下からy軸方向の中心に向かって検索し、y軸方向における距離情報の頻度が所定の閾値以上となる位置を前記物体の上下端とすることを特徴とする請求項2または3に記載の画像処理装置。
  5.  前記端部決定手段は、前記距離画像の検索開始位置を前記検出枠の外側から所定の距離だけ離れた位置とすることを特徴とする請求項2から4の何れか1項に記載の画像処理装置。
  6.  前記端部決定手段は、前記検出枠に基づいて前記距離画像の左右からx軸方向の中心に向かってy軸方向における所定範囲を検索することを特徴とする請求項2から5の何れか1項に記載の画像処理装置。
  7.  前記端部決定手段は、前記検出手段により検出された前記画素塊を構成する前記画素が示す距離情報に応じて、検索対象とする前記距離画像の解像度を変更することを特徴とする請求項2から6の何れか1項に記載の画像処理装置。
  8.  左右位置情報と距離情報を有し、頻度値が対応付けられた画素で構成されるマップを生成するマップ生成手段と、
     前記マップにおいて共通する特徴量を有する前記画素の複数からなる画素塊を検出する検出手段と、
     前記検出手段により検出された画素塊を構成する前記画素が示す情報に基づいて、前記距離情報から物体を検出するための検索対象領域を規定する検出枠を生成する枠生成手段と、
     前記枠生成手段により生成された検出枠に基づいて物体を検出する物体検出手段と、
     前記物体検出手段による検出結果に基づいて所定の機器を制御する制御手段と、
    を備えることを特徴とする機器制御システム。
  9.  2つの撮像手段と、
     前記2つの撮像手段により撮像された撮像画像から生成された、左右位置情報と距離情報を有し、頻度値が対応付けられた画素で構成されるマップを生成するマップ生成手段と、
     前記マップにおいて共通する特徴量を有する前記画素の複数からなる画素塊を検出する検出手段と、
     前記検出手段により検出された画素塊を構成する前記画素が示す情報に基づいて、前記距離情報から物体を検出するための検索対象領域を規定する検出枠を生成する枠生成手段と、
     を備えることを特徴とする撮像装置。
  10.  コンピュータに、
     左右位置情報と距離情報を有し、頻度値が対応付けられた画素で構成されるマップを生成する手順と、
     前記マップにおいて共通する特徴量を有する前記画素の複数からなる画素塊を検出する手順と、
     検出された前記画素塊を構成する前記画素が示す情報に基づいて、前記距離情報から物体を検出するための検索対象領域を規定する検出枠を生成する手順と、
     を含む処理を実行させることを特徴とする画像処理方法。
  11.  前記検出枠を生成する手順は、
     前記検出枠に基づいて検索する、前記距離情報を示す画素で構成される距離画像の検索開始位置を前記検出枠の下端から所定の距離だけ下方の位置とする手順と、
     前記検出枠に基づいて前記距離画像を左右からx軸方向の中心に向かって検索し、x軸方向における距離情報の頻度が所定の閾値以上となる位置を前記物体の左右端とする手順と、
     前記検出枠に基づいて前記距離画像を上方から下方に向かって検索し、y軸方向における距離情報の頻度が所定の閾値以上となる位置を前記物体の上端とする手順と、
     前記検出枠に基づいて前記距離画像を下方から上方に向かって検索し、y軸方向における距離情報の頻度が所定の閾値以上となる位置を前記物体の下端とする手順と、
     を含むことを特徴とする請求項10記載の画像処理方法。
  12.  コンピュータに、
     左右位置情報と距離情報を有し、頻度値が対応付けられた画素で構成されるマップを生成する手順と、
     前記マップにおいて共通する特徴量を有する前記画素の複数からなる画素塊を検出する手順と、
     検出された前記画素塊を構成する前記画素が示す情報に基づいて、前記距離情報から物体を検出するための検索対象領域を規定する検出枠を生成する手順と、
     を含む処理を実行させることを特徴とするプログラム。
PCT/JP2017/003445 2016-03-14 2017-01-31 画像処理装置、機器制御システム、撮像装置、画像処理方法及びプログラム WO2017159082A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
EP17766090.9A EP3432265A4 (en) 2016-03-14 2017-01-31 IMAGE PROCESSING DEVICE, DEVICE CONTROL SYSTEM, IMAGE CAPTURE DEVICE, IMAGE PROCESSING METHOD, AND PROGRAM
JP2018505319A JP6743882B2 (ja) 2016-03-14 2017-01-31 画像処理装置、機器制御システム、撮像装置、画像処理方法及びプログラム
US16/127,934 US10679388B2 (en) 2016-03-14 2018-09-11 Image processing apparatus, device control system, imaging apparatus, and recording medium

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2016049795 2016-03-14
JP2016-049795 2016-03-14

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US16/127,934 Continuation US10679388B2 (en) 2016-03-14 2018-09-11 Image processing apparatus, device control system, imaging apparatus, and recording medium

Publications (1)

Publication Number Publication Date
WO2017159082A1 true WO2017159082A1 (ja) 2017-09-21

Family

ID=59852257

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2017/003445 WO2017159082A1 (ja) 2016-03-14 2017-01-31 画像処理装置、機器制御システム、撮像装置、画像処理方法及びプログラム

Country Status (4)

Country Link
US (1) US10679388B2 (ja)
EP (1) EP3432265A4 (ja)
JP (1) JP6743882B2 (ja)
WO (1) WO2017159082A1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019135365A1 (ja) * 2018-01-05 2019-07-11 ソニー株式会社 画像処理装置、画像処理方法、及び、プログラム
JP2020154523A (ja) * 2019-03-19 2020-09-24 株式会社Subaru 車外環境検出装置
US11030761B2 (en) 2016-11-30 2021-06-08 Ricoh Company, Ltd. Information processing device, imaging device, apparatus control system, movable body, information processing method, and computer program product
US11527075B2 (en) 2016-11-28 2022-12-13 Ricoh Company, Ltd. Information processing apparatus, imaging apparatus, apparatus control system, movable object, information processing method, and computer-readable recording medium
CN115578382A (zh) * 2022-11-23 2023-01-06 季华实验室 图像异常检测方法、装置、设备及计算机可读存储介质

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10795024B2 (en) * 2016-09-16 2020-10-06 Sony Semiconductor Solutions Corporation Imaging device and electronic device
CN113094453B (zh) * 2019-12-23 2023-09-29 百度在线网络技术(北京)有限公司 护栏构建方法、装置、设备和介质
US11741718B2 (en) * 2021-05-18 2023-08-29 Hitachi Astemo, Ltd. Light interference detection during vehicle navigation

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012208887A (ja) * 2011-03-30 2012-10-25 Denso Corp 対象物追跡装置および対象物追跡システム
JP2016029557A (ja) * 2014-07-14 2016-03-03 株式会社リコー 立体物検出装置、立体物検出方法、立体物検出プログラム、及び移動体機器制御システム

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3660819A (en) 1970-06-15 1972-05-02 Intel Corp Floating gate transistor and method for charging and discharging same
JPS5628393A (en) 1979-07-03 1981-03-19 Tlv Co Ltd Downwarddopened bucket float
JP2007102545A (ja) 2005-10-05 2007-04-19 Ricoh Co Ltd 電子文書作成装置、電子文書作成方法及び電子文書作成プログラム
JP4647515B2 (ja) 2006-02-20 2011-03-09 株式会社リコー 座標検出装置、筆記具および座標入力システム
JP5316805B2 (ja) 2009-03-16 2013-10-16 株式会社リコー 車載カメラ装置の画像調整装置及び車載カメラ装置
JP5376313B2 (ja) 2009-09-03 2013-12-25 株式会社リコー 画像処理装置及び画像撮像装置
JP5329582B2 (ja) 2011-02-09 2013-10-30 本田技研工業株式会社 車両用周辺監視装置
JP5718080B2 (ja) 2011-02-09 2015-05-13 本田技研工業株式会社 車両用周辺監視装置
JP6150164B2 (ja) * 2013-07-01 2017-06-21 株式会社リコー 情報検出装置、移動体機器制御システム、移動体及び情報検出用プログラム
JP6519262B2 (ja) 2014-04-10 2019-05-29 株式会社リコー 立体物検出装置、立体物検出方法、立体物検出プログラム、及び移動体機器制御システム
JP2016001170A (ja) 2014-05-19 2016-01-07 株式会社リコー 処理装置、処理プログラム、及び、処理方法
JP2016001464A (ja) 2014-05-19 2016-01-07 株式会社リコー 処理装置、処理システム、処理プログラム、及び、処理方法
JP6417729B2 (ja) 2014-06-09 2018-11-07 株式会社リコー 画像処理装置、画像処理方法、プログラム、視差データの生産方法、機器制御システム
US20160019429A1 (en) 2014-07-17 2016-01-21 Tomoko Ishigaki Image processing apparatus, solid object detection method, solid object detection program, and moving object control system
US9726604B2 (en) 2014-11-12 2017-08-08 Ricoh Company, Ltd. Adhering detection apparatus, adhering substance detection method, storage medium, and device control system for controlling vehicle-mounted devices
JP6657789B2 (ja) * 2015-10-29 2020-03-04 株式会社リコー 画像処理装置、撮像装置、機器制御システム、頻度分布画像生成方法、及びプログラム
WO2017145605A1 (ja) * 2016-02-22 2017-08-31 株式会社リコー 画像処理装置、撮像装置、移動体機器制御システム、画像処理方法、及びプログラム
EP3422289A4 (en) * 2016-02-23 2019-02-27 Ricoh Company, Ltd. IMAGE PROCESSING DEVICE, IMAGING DEVICE, MOBILE ENTITY DEVICE CONTROL SYSTEM, IMAGE PROCESSING METHOD, AND PROGRAM
JP6705497B2 (ja) * 2016-02-23 2020-06-03 株式会社リコー 画像処理装置、撮像装置、移動体機器制御システム、画像処理方法、プログラム、及び移動体
EP3428902A4 (en) * 2016-03-10 2019-08-14 Ricoh Company, Ltd. IMAGE PROCESSING DEVICE, IMAGING DEVICE, MOBILE DEVICE CONTROL SYSTEM, PICTURE PROCESSING PROCESS AND PROGRAM

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012208887A (ja) * 2011-03-30 2012-10-25 Denso Corp 対象物追跡装置および対象物追跡システム
JP2016029557A (ja) * 2014-07-14 2016-03-03 株式会社リコー 立体物検出装置、立体物検出方法、立体物検出プログラム、及び移動体機器制御システム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP3432265A4 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11527075B2 (en) 2016-11-28 2022-12-13 Ricoh Company, Ltd. Information processing apparatus, imaging apparatus, apparatus control system, movable object, information processing method, and computer-readable recording medium
US11030761B2 (en) 2016-11-30 2021-06-08 Ricoh Company, Ltd. Information processing device, imaging device, apparatus control system, movable body, information processing method, and computer program product
WO2019135365A1 (ja) * 2018-01-05 2019-07-11 ソニー株式会社 画像処理装置、画像処理方法、及び、プログラム
JP2020154523A (ja) * 2019-03-19 2020-09-24 株式会社Subaru 車外環境検出装置
JP7291505B2 (ja) 2019-03-19 2023-06-15 株式会社Subaru 車外環境検出装置
CN115578382A (zh) * 2022-11-23 2023-01-06 季华实验室 图像异常检测方法、装置、设备及计算机可读存储介质

Also Published As

Publication number Publication date
US20190005691A1 (en) 2019-01-03
EP3432265A1 (en) 2019-01-23
US10679388B2 (en) 2020-06-09
JP6743882B2 (ja) 2020-08-19
JPWO2017159082A1 (ja) 2019-01-31
EP3432265A4 (en) 2019-03-20

Similar Documents

Publication Publication Date Title
WO2017159082A1 (ja) 画像処理装置、機器制御システム、撮像装置、画像処理方法及びプログラム
US8908924B2 (en) Exterior environment recognition device and exterior environment recognition method
CN109997148B (zh) 信息处理装置、成像装置、设备控制系统、移动对象、信息处理方法和计算机可读记录介质
JP6614247B2 (ja) 画像処理装置、物体認識装置、機器制御システム、画像処理方法およびプログラム
JP6687039B2 (ja) 物体検出装置、機器制御システム、撮像装置、物体検出方法、及びプログラム
JP6597792B2 (ja) 画像処理装置、物体認識装置、機器制御システム、画像処理方法およびプログラム
US11270133B2 (en) Object detection device, object detection method, and computer-readable recording medium
JP6769477B2 (ja) 画像処理装置、撮像装置、移動体機器制御システム、画像処理方法、及びプログラム
WO2017104574A1 (ja) 画像処理装置、物体認識装置、機器制御システム、画像処理方法およびプログラム
JP6816401B2 (ja) 画像処理装置、撮像装置、移動体機器制御システム、画像処理方法、及びプログラム
JP6547841B2 (ja) 画像処理装置、物体認識装置、機器制御システム、画像処理方法およびプログラム
JP2018092596A (ja) 情報処理装置、撮像装置、機器制御システム、移動体、情報処理方法、およびプログラム
WO2017047282A1 (ja) 画像処理装置、物体認識装置、機器制御システム、画像処理方法およびプログラム
US11054245B2 (en) Image processing apparatus, device control system, imaging apparatus, image processing method, and recording medium
JP2017207874A (ja) 画像処理装置、撮像装置、移動体機器制御システム、画像処理方法、及びプログラム
JP6763198B2 (ja) 画像処理装置、撮像装置、移動体機器制御システム、画像処理方法、及びプログラム
JP7052265B2 (ja) 情報処理装置、撮像装置、機器制御システム、移動体、情報処理方法、及び、情報処理プログラム
JP2017167970A (ja) 画像処理装置、物体認識装置、機器制御システム、画像処理方法およびプログラム
WO2018097269A1 (en) Information processing device, imaging device, equipment control system, mobile object, information processing method, and computer-readable recording medium
JP6561688B2 (ja) 検出装置、検出方法、撮像装置、機器制御システム、及びプログラム
JP6943092B2 (ja) 情報処理装置、撮像装置、機器制御システム、移動体、情報処理方法、及び、情報処理プログラム
JP2018088237A (ja) 情報処理装置、撮像装置、機器制御システム、移動体、情報処理方法、及び、情報処理プログラム

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 2018505319

Country of ref document: JP

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2017766090

Country of ref document: EP

ENP Entry into the national phase

Ref document number: 2017766090

Country of ref document: EP

Effective date: 20181015

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17766090

Country of ref document: EP

Kind code of ref document: A1