WO2017217411A1 - 画像処理装置、画像処理方法、及び記憶媒体 - Google Patents

画像処理装置、画像処理方法、及び記憶媒体 Download PDF

Info

Publication number
WO2017217411A1
WO2017217411A1 PCT/JP2017/021824 JP2017021824W WO2017217411A1 WO 2017217411 A1 WO2017217411 A1 WO 2017217411A1 JP 2017021824 W JP2017021824 W JP 2017021824W WO 2017217411 A1 WO2017217411 A1 WO 2017217411A1
Authority
WO
WIPO (PCT)
Prior art keywords
image
viewpoint
fisheye
compensation vector
normalized
Prior art date
Application number
PCT/JP2017/021824
Other languages
English (en)
French (fr)
Inventor
航介 吉見
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to JP2018509865A priority Critical patent/JP6330987B2/ja
Priority to US15/753,741 priority patent/US10269092B2/en
Publication of WO2017217411A1 publication Critical patent/WO2017217411A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/04Context-preserving transformations, e.g. by using an importance map
    • G06T3/047Fisheye or wide-angle transformations
    • GPHYSICS
    • G02OPTICS
    • G02BOPTICAL ELEMENTS, SYSTEMS OR APPARATUS
    • G02B13/00Optical objectives specially designed for the purposes specified below
    • G02B13/06Panoramic objectives; So-called "sky lenses" including panoramic objectives having reflecting surfaces
    • GPHYSICS
    • G02OPTICS
    • G02BOPTICAL ELEMENTS, SYSTEMS OR APPARATUS
    • G02B27/00Optical systems or apparatus not provided for by any of the groups G02B1/00 - G02B26/00, G02B30/00
    • G02B27/0025Optical systems or apparatus not provided for by any of the groups G02B1/00 - G02B26/00, G02B30/00 for optical correction, e.g. distorsion, aberration
    • GPHYSICS
    • G02OPTICS
    • G02BOPTICAL ELEMENTS, SYSTEMS OR APPARATUS
    • G02B27/00Optical systems or apparatus not provided for by any of the groups G02B1/00 - G02B26/00, G02B30/00
    • G02B27/0025Optical systems or apparatus not provided for by any of the groups G02B1/00 - G02B26/00, G02B30/00 for optical correction, e.g. distorsion, aberration
    • G02B27/0037Optical systems or apparatus not provided for by any of the groups G02B1/00 - G02B26/00, G02B30/00 for optical correction, e.g. distorsion, aberration with diffracting elements
    • GPHYSICS
    • G02OPTICS
    • G02BOPTICAL ELEMENTS, SYSTEMS OR APPARATUS
    • G02B27/00Optical systems or apparatus not provided for by any of the groups G02B1/00 - G02B26/00, G02B30/00
    • G02B27/64Imaging systems using optical elements for stabilisation of the lateral and angular position of the image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/73Deblurring; Sharpening
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/80Geometric correction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/698Control of cameras or camera modules for achieving an enlarged field of view, e.g. panoramic image capture
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/80Camera processing pipelines; Components thereof
    • H04N23/81Camera processing pipelines; Components thereof for suppressing or minimising disturbance in the image signal generation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N25/00Circuitry of solid-state image sensors [SSIS]; Control thereof
    • H04N25/60Noise processing, e.g. detecting, correcting, reducing or removing noise
    • H04N25/61Noise processing, e.g. detecting, correcting, reducing or removing noise the noise originating only from the lens unit, e.g. flare, shading, vignetting or "cos4"

Definitions

  • the present invention relates to an image processing apparatus, an image processing method, and a storage medium for storing a program for realizing the normalization processing for a fisheye image.
  • the fish-eye camera has a feature that can capture and acquire a wide viewing angle exceeding 180 ° as one image, and is used in industrial fields such as monitoring, map generation, and rear view monitor for automobiles.
  • fisheye cameras are known to cause large optical distortion in captured images. For this reason, with a fish-eye camera, it may be difficult to detect a task such as detecting a specific object such as a pedestrian on the image.
  • a detection method using a statistical discriminator by machine learning is generally known, and these are discrimination methods based on similarity of features such as pedestrian shape patterns. Therefore, it is designed on the premise of an image acquired by a normal camera (an optical system that can be approximated to a pinhole model or a perspective projection model) to a fisheye image in which the shape of the same object is greatly deformed depending on the position on the image due to optical distortion It is difficult to apply statistical identification.
  • a fish-eye image is modeled as a mapping of a virtual image projected onto a spherical surface onto a plane, and a correction image (“perspective projection correction image” approximating an image captured by a perspective projection model with a part cut out) ").
  • the straight line in the real space is restored as a straight line, and it is an approximation of a good perspective camera image in the center, but the object is unnaturally enlarged due to projective distortion toward the periphery. It becomes an image.
  • a viewpoint image exceeding 90 ° in an arbitrary direction with the optical axis being 0 ° cannot be projected in principle. For this reason, the perspective projection corrected image can be used only for an application that requires only an image of a central portion with little projection distortion.
  • Patent Document 1 and Patent Document 2 disclose a technique for correcting distortion of a person or the like in a fisheye camera image.
  • Patent Document 1 discloses an image conversion apparatus.
  • the image conversion apparatus disclosed in Patent Document 1 corrects distortion by modeling a fisheye image on a virtual sphere surface and projecting it onto a cylindrical coordinate system to generate a curved regular image.
  • the horizontal direction is set to the tangential direction of the spherical surface
  • the vertical direction is set to the axial direction of the spherical surface.
  • Patent Document 2 discloses an image presentation apparatus using the image conversion apparatus disclosed in Patent Document 1.
  • the image processing apparatus disclosed in Patent Document 2 uses the curved regular image disclosed in Patent Document 1 to correct a plurality of human images in the horizontal visual field range from the central visual field of the fisheye image.
  • the camera optical axis is not necessarily in a positional relationship such as parallel or perpendicular to the grounding plane of the object. For this reason, in order to normalize an image of a pedestrian or the like as a target object, it is necessary to correct a difference between a direction vector parallel to a plane (target horizontal plane) on which the target object contacts and an optical axis vector of the camera. .
  • Patent Documents 1 and 2 since the apparatus disclosed in Patent Documents 1 and 2 does not correct such a difference between the direction vector and the optical axis vector, it is difficult to remove distortion from an actual fisheye image. It is.
  • Patent Documents 1 and 2 describe the pixels on the fisheye image with simple mathematical expressions in the coordinates on the corresponding virtual sphere surface. That is, these apparatuses formulate the correspondence of pixels on the fisheye image to the virtual sphere surface on the assumption that the fisheye optical system follows an ideal model.
  • a general fisheye optical system does not necessarily have a design model, and it does not necessarily have optical properties as the model due to a shift between the image sensor and the optical axis, distortion of the lens itself, and the like. There may not be.
  • an ideal model may not be established in a general fisheye optical system.
  • this tendency is conspicuous in an inexpensive fish-eye camera used for in-vehicle rear or side viewing.
  • it is difficult to remove distortion from the fisheye image even when the difference between the direction vector and the optical axis vector is not required to be corrected. There is.
  • the object of the present invention is to solve the above-mentioned problems, without being affected by the fish-eye optical system, and when the positional relationship between the optical axis of the fish-eye camera and the plane on which the object is grounded does not satisfy a certain condition. Even if it exists, it is providing the image processing apparatus, the image processing method, and program which can normalize distortion in a fish-eye image.
  • an image processing apparatus uses a fish-eye image acquisition unit that acquires a fish-eye image in which an object is captured, and a plane parallel to the ground contact surface of the object. Based on the roll angle around the optical axis of the imaging device and the pitch angle of the optical axis, the fisheye image is converted into an image obtained by photographing the object from a direction parallel to the ground plane.
  • a viewpoint compensation vector acquisition means for acquiring a viewpoint compensation vector, and a plurality of viewpoints parallel to the ground plane along the horizontal direction of the fisheye image converted using the viewpoint compensation vector.
  • the fisheye image after conversion is subjected to distortion correction by perspective projection approximation based on a coordinate system including a line of sight from the viewpoint as an axis, and the corrected fish Vertical extracted from each eye image Using image elements of direction, to produce a single normalized image, characterized in that it comprises an image generating means.
  • an image processing method provides a fisheye image in which an object is captured, and an imaging apparatus that uses a plane parallel to the ground contact surface of the object as a reference.
  • a viewpoint compensation vector for converting the fisheye image into an image obtained by photographing the object from a direction parallel to the ground plane.
  • the fisheye image after conversion is subjected to distortion correction by perspective projection approximation based on a coordinate system including the line of sight from the viewpoint as an axis, and extracted from each of the corrected fisheye images.
  • Vertical image elements There are, to generate one of the normalized image, performs image generation, characterized in that.
  • a storage medium includes a fish-eye image acquisition process for acquiring a fish-eye image in which a target object is captured and a plane parallel to the ground contact surface of the target object Based on the roll angle around the optical axis of the imaging device and the pitch angle of the optical axis, the fisheye image is converted into an image obtained by photographing the object from a direction parallel to the ground plane.
  • a viewpoint compensation vector obtaining process for obtaining a viewpoint compensation vector, and a fisheye image converted by using the viewpoint compensation vector, a viewpoint parallel to the ground contact surface along a horizontal direction thereof.
  • a program stored in the storage medium is also an aspect of the present invention.
  • FIG. 1 is a block diagram showing a schematic configuration of an image processing apparatus according to an embodiment of the present invention.
  • FIG. 2 is a block diagram showing a specific configuration of the image processing apparatus 10 according to the embodiment of the present invention.
  • FIG. 3 is a diagram showing the definition of the coordinate system of the imaging apparatus used in the embodiment of the present invention.
  • FIG. 4 is a diagram for explaining viewpoint compensation vectors expressed using the Roll-Pitch-Yaw expression.
  • FIG. 5 is a diagram for explaining coordinate conversion between two viewpoints performed in the embodiment of the present invention.
  • FIG. 6 is a diagram for explaining the coordinate system at the original viewpoint and the parallelized viewpoint coordinate system used in the embodiment of the present invention.
  • FIG. 1 is a block diagram showing a schematic configuration of an image processing apparatus according to an embodiment of the present invention.
  • FIG. 2 is a block diagram showing a specific configuration of the image processing apparatus 10 according to the embodiment of the present invention.
  • FIG. 3 is a diagram showing the definition of the coordinate system of the imaging apparatus used
  • FIG. 7 is a diagram schematically showing an example of a fish-eye image (I F ) that is a target in the embodiment of the present invention.
  • FIG. 8 is a diagram showing an example of a parallelized viewpoint coordinate system defined in the embodiment of the present invention.
  • FIG. 9 shows two perspective projection corrected images with different parallelized viewpoints and a normalized panoramic image obtained from these perspective projection corrected images.
  • FIG. 10 is a flowchart showing the operation of the image processing apparatus according to the embodiment of the present invention.
  • FIG. 11 is a block diagram illustrating an example of a computer that implements the image processing apparatus according to the embodiment of the present invention.
  • FIG. 1 is a block diagram showing a schematic configuration of an image processing apparatus according to an embodiment of the present invention.
  • the image processing apparatus 10 includes a fisheye image acquisition unit 11, a viewpoint compensation vector acquisition unit 12, and an image generation unit 13. Among these, the fish-eye image acquisition unit 11 acquires a fish-eye image in which the object is shown.
  • the viewpoint compensation vector acquisition unit 12 acquires a viewpoint compensation vector.
  • the viewpoint compensation vector is based on the roll angle around the optical axis of the imaging device and the pitch angle of the optical axis based on a plane parallel to the ground plane of the object, and the fisheye image is parallel to the ground plane. This is a vector for converting to an image obtained by photographing from various directions.
  • the image generation unit 13 first sets a plurality of viewpoints parallel to the ground contact surface of the target object along the horizontal direction of the fisheye image converted using the viewpoint compensation vector. Subsequently, the image generation unit 13 performs distortion correction by perspective projection approximation on the converted fisheye image based on a coordinate system including the line of sight from each viewpoint as an axis for each set viewpoint. Then, the image generation unit 13 generates one normalized image using the vertical image elements extracted from the fisheye images after distortion correction.
  • the conversion is performed using the viewpoint compensation vector, even if the positional relationship between the optical axis of the fisheye camera and the plane on which the object is grounded does not satisfy a certain condition, the fisheye The distortion in the image can be normalized.
  • distortion correction is performed for each of a plurality of coordinate systems, and a corrected image is obtained by changing the viewpoint. Then, the elements in the vertical direction of the obtained corrected images are connected to form a final normalized image. For this reason, in this embodiment, even if the design model of the fisheye optical system is not disclosed, distortion can be removed, and the removal of distortion is not affected by the fisheye optical system.
  • FIG. 2 is a block diagram showing a specific configuration of the image processing apparatus 10 according to the embodiment of the present invention.
  • the viewpoint is set on a horizontal plane, and a plane (target plane: target plane) serving as a reference for the horizontal plane is determined.
  • a plane ground plane
  • a vertically long target object that is a target to be normalized (Target) is grounded is selected.
  • the normalization target is, for example, a pedestrian
  • examples of the target plane include a road surface and a floor surface.
  • the target plane may be defined as a vertical wall surface or an inclined road surface, and does not necessarily coincide with an actual horizontal plane.
  • the target plane is the road surface and the normalization target (the subject of the fisheye image) is a pedestrian will be described, but the scope of application of the present invention is limited by these restrictions. There is nothing.
  • the image processing apparatus 10 is connected to an image output apparatus 20, a sensor apparatus 30, and a terminal apparatus 40, and constitutes an image processing system 1 together with these.
  • the image output device 20 is a device that outputs image information to the image processing device 10.
  • an imaging device is used as the image output device 20.
  • the imaging device is a device that captures images in real time, and continuously outputs images to be captured.
  • Specific examples of the imaging device include a NTSC (National Television Standards Committee) format, a PAL (Phase Alternate Line) format, or a camcorder that outputs various digital images.
  • the image output device 20 outputs image data of a fisheye image as image information. Therefore, a fish-eye lens system is an example of the optical system used in the imaging apparatus.
  • a fish-eye camera provided with a fish-eye lens and an imaging device can be mentioned.
  • the image output device 20 may be a device other than the imaging device, for example, an image capture device.
  • the image capture device reads image information stored in the storage medium, converts the read image information into an NTSC format, a PAL format, or an image format that can be read by other electronic control devices, and outputs the image format.
  • the image output apparatus 20 can also be realized as a software program that runs on a computer that constructs the image processing apparatus 10. The computer that constructs the image processing apparatus 10 will be described later. The computer executes image processing based on a predetermined program in accordance with image information sent from the image output device 20.
  • the sensor device 30 includes, for example, an angle sensor, and outputs information for measuring a relative vector between an optical axis vector of the imaging device and a vector parallel to the ground plane of the target object. .
  • the output information includes the roll angle around the optical axis, the pitch angle of the optical axis, and the yaw angle of the optical axis in the imaging apparatus (see FIG. 3 described later).
  • the sensor device 30 When the ground plane (target plane) of the object is assumed to be a horizontal plane (ground), the sensor device 30 has the optical axis of the imaging device parallel to the horizontal direction and zero tilt of the imaging device (imaging element).
  • the horizontal direction is a value parallel to the horizontal plane) (for example, angle sensor information to be described later) as an initial value, and the difference between the obtained angle sensor information and the initial value is output.
  • the sensor device 30 considers the angle of the grounding surface of the target object measured in advance with respect to the horizontal plane, and the obtained angle sensor information described above. And the difference between the initial value.
  • a sensor device that measures the angle of the ground contact surface of the object may be installed.
  • the sensor device 30 may include its own sensor data and another sensor. The difference with the sensor data of the device is output.
  • angle sensor information is also created in advance, and the angle sensor information is provided from a storage device that stores the angle sensor information in synchronization with the image. Is done.
  • the information of the angle sensor in this case includes a roll angle around the optical axis, a pitch angle of the optical axis, and a yaw angle of the optical axis in the imaging apparatus that outputs image information to be read.
  • software for calculating a relative vector may be used instead of using the sensor device 30.
  • the difference vector with respect to the ground plane of the object is estimated by software, for example, from the position and shape of the reference object in the image.
  • data defining the relative relationship measured in advance instead of this software May be used.
  • the terminal device 40 provides a user interface on the screen.
  • the user interface is used for operation of the image processing apparatus 10 by the user, monitoring of the internal state and output of the image processing apparatus 10. Further, the terminal device 40 presents a fisheye image input from the image output device 20, a converted image after image processing by the image processing device 10, various image processing results using the converted image, and the like on the screen. You can also
  • the terminal device 40 receives instructions from the user to the image processing apparatus 10 via the input device, for example, start of processing, end of processing, specification of parameters, selection of information presented on the screen, and the like.
  • the received command is input to the image processing apparatus 10.
  • the input device include a switch board, a keyboard, a mouse, and a touch panel.
  • the image processing system 1 may not include the terminal device 40. Further, the image processing system 1 may include a device that uses information output from the image processing device 10 as an input. Such an apparatus can also be realized as a software program that operates on a computer that constructs the image processing apparatus 10. Examples of such an apparatus include various image processing apparatuses and image recognition apparatuses that receive a converted image generated by the image processing apparatus 10 as an input.
  • the image processing apparatus 10 includes a viewpoint compensation vector generation unit 14 in addition to the fisheye image acquisition unit 11, the viewpoint compensation vector acquisition unit 12, and the image generation unit 13 described above. Yes. Each part generally operates as follows.
  • the fish-eye image acquisition unit 11 acquires image information output from the image output device 20 to the image processing device 10, specifically, image data of a fish-eye image.
  • the image acquisition unit 11 acquires the image data
  • the image data is extracted from the image data
  • Adjustment processing for the image format such as image quality improvement processing can also be executed.
  • the viewpoint compensation vector acquisition unit 12 acquires a viewpoint compensation vector from the viewpoint compensation vector generation unit 14.
  • the viewpoint compensation vector generation unit 14 generates a relative vector between the optical axis vector of the imaging device and a vector parallel to the target plane as a viewpoint compensation vector.
  • This relative vector is a vector expressing the rotation between the two coordinate systems.
  • Rotation expression methods generally include Quaternion, Euler angle expression, Roll-Pitch-Yaw angle expression, etc., and any expression method may be employed in this embodiment. As an example, the following description will be made using the Roll-Pitch-Yaw angle expression.
  • the relative vector includes at least a two-dimensional numerical value composed of a roll angle and a pitch angle.
  • the roll angle and the pitch angle are rotation angles necessary for making the horizontal plane (xz plane) including the optical axis of the camera coincide with the target plane.
  • an arbitrary angle included in the range of the horizontal viewing angle of the fisheye image is designated as the yaw angle.
  • the yaw angle determines the central viewpoint (in the horizontal direction) of the finally generated image. Therefore, in order to make maximum use of the horizontal viewing angle of the original fisheye image, it is preferable that the yaw angle on the optical axis of an actual imaging device (camera) is used as it is.
  • FIG. 4 is a diagram for explaining viewpoint compensation vectors expressed using the Roll-Pitch-Yaw expression.
  • the roll angle and pitch angle are defined as follows with reference to FIG. Note that the roll angle and pitch angle constituting the viewpoint compensation vector are particularly expressed as “relative roll angle” and “relative pitch angle”.
  • the rotation angle around the z-axis from the xz plane to the x′-z plane whose roll angle coincides with the target plane is the relative roll angle ⁇ 0 .
  • the rotation angle around the x ′ axis from the x′-z plane to the plane parallel to the target plane is defined as a relative pitch angle ⁇ 0 .
  • the viewpoint compensation vector V is expressed by the following formula 1, for example.
  • ⁇ 0 0 holds in the following formula 1.
  • FIG. 5 is a diagram for explaining coordinate conversion between two viewpoints performed in the embodiment of the present invention. Referring to FIG. 5, generally, coordinate transformation for a certain point in the physical space can be described by the following equation 2 using an external parameter matrix K for the coordinate system 1 to the coordinate system 2.
  • p tilde (i) is a homogeneous representation of position coordinates in the coordinate system i.
  • the homogeneous expression is represented by the following equation (3).
  • K in the above equation 2 is generally described by the following equation 4 using the rotation matrix R and the translation vector t.
  • the rotation matrix R is described by the following Equation 5 using the roll angle ⁇ , pitch angle ⁇ , and yaw angle ⁇ in the definition in Roll-Pitch-Yaw expression.
  • the viewpoint converted by the viewpoint compensation vector V defined by the above equation 1 is referred to as “parallelized central viewpoint (central horizontalized viewpoint)”, and the coordinate system in which the viewpoint exists is referred to as “parallelized central viewpoint coordinate system”. It shall be written as
  • FIG. 6 is a diagram for explaining the coordinate system at the original viewpoint and the parallelized viewpoint coordinate system used in the embodiment of the present invention.
  • the collimated viewpoint coordinate system is obtained from coordinate transformation by an arbitrary ⁇ and ( ⁇ 0 , ⁇ 0 ) of viewpoint compensation vectors.
  • the viewpoint compensation vector generation unit 14 generates a parallel transformation matrix K hrz ( ⁇ ) and supplies this to the viewpoint compensation vector acquisition unit.
  • the image generation unit 13 sets the viewpoint according to the total number of pixels in the horizontal direction of the generated normalized image. In addition, after performing distortion correction for each viewpoint, the image generation unit 13 cuts out the corrected fisheye image in the vertical direction, and extracts a slice image on which the line of sight from each viewpoint is incident. Then, the image generation unit 13 arranges the extracted slice images in the horizontal direction in a predetermined order, and generates one normalized image.
  • the image generation unit 13 first sets a set of parallelized viewpoints using the viewpoint compensation vector V for the fisheye image acquired by the fisheye image acquisition unit 11. Next, the image generation unit 13 arbitrarily divides the visual field range in the horizontal direction, and executes distortion correction by perspective projection approximation in each parallelized viewpoint coordinate system of each set of parallelized viewpoints (parallelized viewpoint sequence). . Then, the image generation unit 13 generates a single composite image by arranging vertical image elements passing through the center of each viewpoint in the horizontal direction in the order of the parallelized viewpoint rows and connecting them.
  • processing by the image generation unit 13 will be described in detail.
  • Distortion correction by perspective projection approximation Here, the distortion correction by perspective projection approximation will be specifically described.
  • distortion correction (perspective projection correction) by perspective projection approximation can be obtained by the following method if the camera model and calibrated internal parameters in the camera model are known. Note that distortion correction by perspective projection approximation can be realized by existing techniques, but will be briefly described below for reference.
  • (u ′, v ′) in the above formulas (9) and (11) indicate the coordinates of the ideal fisheye image without the affine distortion (center is the origin).
  • (u ′′, v ′′) indicates the coordinates of the actual fisheye image (the upper left is the origin), and (u 0 ′′, v 0 ′′) indicates the center coordinates of the actual fisheye image.
  • the 2 ⁇ 2 positive matrix in Equation 11 is an affine transformation matrix.
  • the parameters obtained by approximating the coefficient of the above formula 10 to the fourth order are internal parameters of the camera determined from the distortion characteristics of the fisheye lens, the positional relationship between the optical axis of the fisheye lens and the image sensor, and the like.
  • the parameter is shown in the following equation (13).
  • the image coordinates (u d, v d) the coordinates of the corresponding fisheye image (u ", v") with reference to the pixel Value of the image coordinates (u d, v d) a pixel value in fish
  • perspective projection corrected image By substituting the pixel values of the coordinates (u ′′, v ′′) of the eye image, it is possible to generate an image after distortion correction by the perspective projection approximation (referred to as “perspective projection corrected image”).
  • the pixel value of the fisheye image coordinates is a luminance value of 1 channel for a monochrome image, and a luminance value of RGB 3 channels for a color image.
  • the image generation unit 130 extracts only the central row of the generated perspective projection corrected image for each viewpoint, and connects these central rows in the horizontal direction.
  • a continuous single image is generated in which horizontal scale distortion is suppressed and vertical linearity is maintained.
  • a single normalized image is synthesized in which all of the vertically long three-dimensional objects existing on the target plane imaged by the original fisheye image have a consistent scale and little shape distortion.
  • the image generation unit 13 defines a parallelized viewpoint sequence used for synthesizing the normalized panoramic image. Since the viewpoint roll angle and pitch angle are determined by the viewpoint compensation vector vector V, a set ⁇ of yaw angles ⁇ i may be defined here.
  • the parallelized viewpoint having the yaw angle ⁇ i may be referred to as the parallelized viewpoint ⁇ i .
  • is a series of the same number as the number of horizontal pixels of the image, and is represented by the following Expression 14.
  • can be set arbitrarily within the horizontal field of view of the original fisheye image.
  • the upper and lower limits of ⁇ determine the horizontal visual field range (FOV_H) drawn in the normalized panoramic image.
  • FOV_H horizontal visual field range
  • the range of the collimated viewpoint row is a range shown in the following Expression 15.
  • a fish-eye image is modeled as a map in one direction of a point cloud projected onto a spherical surface model in real space.
  • Equation 17 the points on each parallelized viewpoint coordinate system ( Equation 17) are obtained by using the parallelization transformation matrix K hrz ( ⁇ ) and the point m tilde of the original camera coordinate system is “(x, y, z, 1)”. Since it is expressed as “ T ”, it is obtained by the following equation (18).
  • Equation 20 an image plane (Equation 20) perpendicular to the z-axis (Equation 19) of the collimated viewpoint coordinate system (Equation 17)
  • the image coordinates (Equation 20) defined on the image plane (Equation 20) are set.
  • 21 correspondence to the pixel (u ′′, v ′′) on the original fisheye image is required.
  • An image in which the pixel points on the fisheye image are projected onto the image coordinates (Equation 21) is the perspective projection corrected image.
  • the constant of Equation 20 represents the distance from the projection plane and the focal point, and this is a parameter that determines the scale of the perspective projection corrected image.
  • a vertical image sequence passing through the center of the perspective projection corrected image (I P ) is a normalized slice image (I S ).
  • the normalized slice image (I S ) is generated under the condition that the horizontal size of the projection image is set to 1 pixel when the perspective projection correction image (I P ) is projected onto the perspective projection image plane. It is a special variation of (I P ). Note that it is not necessary to cut out after generating another perspective projection corrected image (I P ) having a larger lateral size in order to generate a normalized slice image (I S ).
  • the scale parameter (Equation 23) used to generate the normalized slice image (Equation 22) is usually defined with the same value in each collimated viewpoint coordinate system. It is necessary to set in consideration of the aspect ratio of vertical and horizontal in a typical normalized panoramic image.
  • the scale parameter can be defined not only directly but also indirectly from other parameters as will be described later.
  • a synthesized image obtained by arranging the normalized slice images (Equation 22) in each parallelized viewpoint coordinate system (Equation 17) in the order of the series ⁇ of the parallelized viewpoint yaw angles ⁇ i Let it be a normalized panoramic image (I H ).
  • FIG. 7 is a diagram schematically illustrating an example of a fish-eye image (I F ) that is a target in the embodiment of the present invention.
  • the fish-eye image includes persons (Person A, Person B, and Person C) photographed from a downward viewpoint with the ground as the target plane.
  • FIG. 8 is a diagram showing an example of the parallelized viewpoint coordinate system defined in the embodiment of the present invention. Further, the coordinates on the perspective projection image plane are expressed by Equation 21 above. Then, on the perspective projection image plane, a perspective projection corrected image (I P : Formula 25) having an arbitrary image size including the normalized slice image (I S ) is generated.
  • FIG. 9 shows two perspective projection corrected images with different parallelized viewpoints and a normalized panoramic image obtained from these perspective projection corrected images.
  • FIG. 9 shows a perspective projection corrected image (Equation 27) and a normalized slice image (Equation 28) generated at the parallelized viewpoint (Equation 26). Further, the central view of FIG. 9 illustrates a perspective projection corrected image (Equation 30) and a normalized slice image (Equation 31) generated at a parallelized viewpoint (Equation 29).
  • the right diagram of FIG. 9 shows an example of a normalized panoramic image (I H ) generated by all the normalized slice images in the defined parallel viewpoint sequence (Equation 32).
  • the normalized panorama image (I H ) is synthesized with all the normalized slice images including the normalized slice images (the above equation 28) and (the above equation 31) as elements.
  • the image generation unit 13 calculates the distance from the origin of the projection plane in the parallelized viewpoint coordinate system, the size of the generated normalized panoramic image, and the viewing angle in the horizontal direction in distortion correction by perspective projection approximation for each viewpoint. Determine based on range and aspect ratio.
  • the image scale for generating the perspective projection corrected image and the normalized slice image is determined by the projection plane distance
  • the size (width, height) of the normalized panoramic image is (W 0 , H 0 )
  • the horizontal viewing angle projected onto the normalized panoramic image is A X
  • the vertical viewing angle is represented by the following Expression 33.
  • the upper limit value of Ay is set to 180 degrees (expression 34).
  • is determined by the following steps (a) and (b).
  • the viewpoint compensation vector acquisition unit 12 corresponds to the coordinates on the image obtained by photographing the object from the direction parallel to the ground plane and the coordinates on the fisheye image as the viewpoint compensation vector. You can get a table that describes the date.
  • the viewpoint compensation vector generation unit 14 responds from the coordinates (u H , v H ) on the normalized panoramic image.
  • a reference table describing the correspondence to the coordinates (u ′′, v ′′) on the original fisheye image is generated in advance.
  • the actual normalized panorama image generation process for the input image sequence is replaced with a table reference (LUT: Look-Up-Table) process that generates a normalized panorama image while referring to the reference table.
  • LUT Look-Up-Table
  • the generation of normalized panoramic images from fisheye images can be performed at high speed. Can be processed.
  • a two-channel matrix (referred to as an index map) having the width and height of the original fisheye image size (W in , H in ) is prepared.
  • Each column of the X index map (X ind ) which is the matrix of the first channel is given the corresponding coordinate value (u ′′), and the Y index map (Y ind) which is the matrix of the second channel. ) Is given a corresponding coordinate value of (v ′′).
  • Equation 44 is a condition.
  • the viewpoint compensation vector generation unit 14 calculates the LUT map from each normalized panorama image.
  • the values of the corresponding original fisheye image coordinates (u ′′) and (v ′′) are stored in the coordinates (u H , v H ) of (X LUT ) and (Y LUT ), respectively. ing. Therefore, a one-to-one correspondence between the coordinates of (u H , v H ) and the coordinates (u ′′, v ′′) on the fisheye image is obtained.
  • the LUT map created in this way can be saved as a reference table file, for example, in a text file format in which one-to-one correspondences (Equation 45) are listed line by line.
  • the image generation unit 13 first reads a reference table file generated in advance. Then, the image generation unit 13 associates the coordinates (u H , v H ) on the normalized panoramic image described in the reference table with the coordinates (u ′′, v ′′) in the acquired original fisheye image. In accordance with the information, a normalized panorama image is generated by sequentially referring to pixel values on the fisheye image corresponding to the normalized panorama image coordinates.
  • FIG. 10 is a flowchart showing the operation of the image processing apparatus according to the embodiment of the present invention.
  • FIGS. 1 to 9 are referred to as appropriate.
  • the image processing method is performed by operating the image processing apparatus 10. Therefore, the description of the image processing method in the present embodiment is replaced with the following description of the operation of the image processing apparatus 10.
  • the fisheye image acquisition unit 11 acquires a fisheye image from the image output device 20 (step S1).
  • the viewpoint compensation vector acquisition unit 12 acquires a viewpoint compensation vector (step S2).
  • the image generation unit 13 generates a normalized panoramic image using the fisheye image acquired in step S1 and the viewpoint compensation vector acquired in step S2 (step S3).
  • the image generation unit 13 first sets a set of parallelized viewpoints for the fisheye image using the viewpoint compensation vector. Next, the image generation unit 13 arbitrarily divides the visual field range in the horizontal direction, and executes distortion correction by perspective projection approximation in the parallelized viewpoint coordinate system of each parallelized viewpoint. Then, the image generation unit 13 arranges the vertical image elements passing through the centers of the viewpoints in the horizontal direction in the order of the parallelized viewpoint columns, and connects the arranged image elements, thereby obtaining one normalized panorama. Generate an image.
  • one normalized panoramic image is generated by executing steps S1 to S3. Further, in the present embodiment, steps S1 to S3 are repeatedly executed at set intervals, so that normalized panoramic images are continuously output.
  • the positional relationship between the fisheye camera and the ground plane is compensated, and then the shape distortion of the pedestrian image in the fisheye image is corrected, and the pedestrian image is Normalized to look like a normal camera image.
  • the image obtained by normalization is obtained by connecting normalized slice images of the perspective projection correction images obtained for each parallelized viewpoint in the range of the entire horizontal visual field. For this reason, according to the present embodiment, the accuracy of distortion correction is not affected by the optical system of the imaging apparatus. Further, even when the positional relationship between the optical axis of the fisheye camera and the ground plane of the object does not satisfy a certain condition, distortion in the fisheye image is accurately removed.
  • the LUT format that refers to the conversion table can also be adopted.
  • high-speed processing is possible, which is suitable for applications that require low power consumption and real-time processing, such as in-vehicle processors.
  • the program in the present embodiment may be a program that causes a computer to execute steps S1 to S3 shown in FIG.
  • a CPU Central Processing Unit
  • the image processing apparatus 10 and the image processing method in the present embodiment can be realized.
  • a CPU Central Processing Unit
  • Examples of the computer include not only a general-purpose computer such as a personal computer but also a computer mounted in an automobile, a household appliance, a work device, or the like.
  • each computer may function as any one of the fisheye image acquisition unit 11, the viewpoint compensation vector acquisition unit 12, the image generation unit 13, and the viewpoint compensation vector generation unit 14, respectively.
  • FIG. 11 is a block diagram illustrating an example of a computer that implements the image processing apparatus according to the embodiment of the present invention.
  • the computer 110 includes a CPU 111, a main memory 112, a storage device 113, an input interface 114, a display controller 115, a data reader / writer 116, and a communication interface 117. These units are connected to each other via a bus 121 so that data communication is possible.
  • the CPU 111 performs various operations by developing the program (code) in the present embodiment stored in the storage device 113 in the main memory 112 and executing them in a predetermined order.
  • the main memory 112 is typically a volatile storage device such as a DRAM (Dynamic Random Access Memory).
  • the program in the present embodiment is provided in a state of being stored in a computer-readable storage medium 120. Note that the program in the present embodiment may be distributed on the Internet connected via the communication interface 117.
  • the storage device 113 includes a hard disk drive and a semiconductor storage device such as a flash memory.
  • the input interface 114 mediates data transmission between the CPU 111 and an input device 118 such as a keyboard and a mouse.
  • the display controller 115 is connected to the display device 119 and controls display on the display device 119.
  • the data reader / writer 116 mediates data transmission between the CPU 111 and the storage medium 120, and reads a program from the storage medium 120 and writes a processing result in the computer 110 to the storage medium 120.
  • the communication interface 117 mediates data transmission between the CPU 111 and another computer.
  • the storage medium 120 include general-purpose semiconductor storage devices such as CF (Compact Flash (registered trademark)) and SD (Secure Digital (registered trademark)), magnetic storage media such as a flexible disk (Flexible Disk), Alternatively, an optical storage medium such as a CD-ROM (Compact Disk Read Only Memory) may be used.
  • CF Compact Flash
  • SD Secure Digital
  • magnetic storage media such as a flexible disk (Flexible Disk)
  • an optical storage medium such as a CD-ROM (Compact Disk Read Only Memory) may be used.
  • the image processing apparatus 10 can be realized by using hardware corresponding to each unit instead of a computer in which a program is installed. Further, part of the image processing apparatus 10 may be realized by a program, and the remaining part may be realized by hardware.
  • Viewpoint compensation vector acquisition means for acquiring a viewpoint compensation vector for conversion into an image obtained by shooting from a direction;
  • a plurality of viewpoints parallel to the ground contact plane are set along the horizontal direction for the fisheye image converted using the viewpoint compensation vector, For each of the set viewpoints, with respect to the converted fisheye image, based on a coordinate system including a line of sight from the viewpoint as an axis, distortion correction by perspective projection approximation is performed,
  • Image generation means for generating one normalized image using vertical image elements extracted from each of the corrected fisheye images;
  • An image processing apparatus comprising:
  • the image generating means The viewpoint is set according to the total number of pixels in the horizontal direction of the normalized image to be generated, Further, after performing distortion correction for each viewpoint, the fisheye image after correction is cut out in the vertical direction, and a slice image on which the line of sight from the viewpoint enters is extracted, Each of the extracted slice images is arranged in a horizontal direction in a predetermined order to generate one normalized image;
  • the image processing apparatus according to appendix 1.
  • the image generating means In distortion correction by perspective projection approximation for each viewpoint, the distance from the origin of the projection plane in the coordinate system is Determined based on the size of the normalized image to be generated, the range of the viewing angle in the horizontal direction of the normalized image, and the aspect ratio of the normalized image.
  • the image processing apparatus according to appendix 1 or 2.
  • the viewpoint compensation vector acquisition means associates coordinates on an image obtained by photographing the object from a direction parallel to the ground plane and coordinates on the fisheye image as the viewpoint compensation vector. Get the described table, The image processing apparatus according to any one of appendices 1 to 3.
  • (Appendix 6) Get a fisheye image of the object, Based on the roll angle around the optical axis of the imaging apparatus and the pitch angle of the optical axis with respect to a plane parallel to the ground plane of the object, the fisheye image is parallel to the ground plane.
  • a viewpoint compensation vector is obtained for conversion into an image obtained by shooting from a direction, a viewpoint compensation vector is obtained, and the fisheye image converted using the viewpoint compensation vector is aligned along the horizontal direction.
  • a plurality of viewpoints parallel to the ground plane For each of the set viewpoints, with respect to the converted fisheye image, based on a coordinate system including a line of sight from the viewpoint as an axis, distortion correction by perspective projection approximation is performed, An image processing method for generating an image by generating one normalized image using vertical image elements extracted from each of the corrected fisheye images.
  • the viewpoint is set according to the total number of pixels in the horizontal direction of the normalized image to be generated, Further, after performing distortion correction for each viewpoint, the fisheye image after correction is cut out in the vertical direction, and a slice image on which the line of sight from the viewpoint enters is extracted, Each of the extracted slice images is arranged in a horizontal direction in a predetermined order to generate one normalized image;
  • a roll angle around the optical axis of the imaging device and a pitch angle of the optical axis of the imaging device are obtained from an angle sensor attached to the imaging device, and the viewpoint compensation vector is based on the obtained roll angle and the pitch angle.
  • Item 10 The image processing method according to any one of items 6 to 9.
  • Viewpoint compensation vector acquisition processing for acquiring a viewpoint compensation vector for conversion into an image obtained by shooting from a direction;
  • a plurality of viewpoints parallel to the ground contact plane are set along the horizontal direction for the fisheye image converted using the viewpoint compensation vector,
  • Image generation processing for generating one normalized image using vertical image elements extracted from each of the corrected fisheye images,
  • a storage medium for storing a program for executing the program.
  • the image generation process includes: The viewpoint is set according to the total number of pixels in the horizontal direction of the normalized image to be generated, Further, after performing distortion correction for each viewpoint, the fisheye image after correction is cut out in the vertical direction, and a slice image on which the line of sight from the viewpoint enters is extracted, Each of the extracted slice images is arranged in a horizontal direction in a predetermined order to generate one normalized image; The storage medium according to appendix 11.
  • the image generation process includes: In distortion correction by perspective projection approximation for each viewpoint, the distance from the origin of the projection plane in the coordinate system is Determined based on the size of the normalized image to be generated, the range of the viewing angle in the horizontal direction of the normalized image, and the aspect ratio of the normalized image.
  • the storage medium according to appendix 11 or 12.
  • Appendix 15 The program is stored in a computer.
  • the roll angle around the optical axis of the image pickup device and the pitch angle of the optical axis are acquired from an angle sensor attached to the image pickup device, and the viewpoint compensation vector is calculated based on the acquired roll angle and pitch angle. Further executing the viewpoint compensation vector generation processing to 15.
  • the storage medium according to any one of appendices 11 to 14.
  • the present invention there is no influence on the fisheye optical system, and the positional relationship between the optical axis of the fisheye camera and the grounding plane of the object does not satisfy a certain condition. Can also normalize distortion in fisheye images.
  • the present invention is useful in various fields where fisheye cameras are used.

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Optics & Photonics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)
  • Studio Devices (AREA)

Abstract

魚眼光学系に影響されることなく、且つ、魚眼カメラの光軸と対象物の接地する平面との位置関係が一定条件を満たさない場合であっても、魚眼画像における歪みを正規化し得る、画像処理装置、画像処理方法、及びプログラムを提供する。 画像処理装置10は、魚眼画像を取得する魚眼画像取得部11と、撮像装置の光軸回りのロール角及び光軸のピッチ角に基づいて、魚眼画像を対象物の接地面に平行な方向から撮影して得られる画像に変換するための、視点補償ベクトルを取得する、視点補償ベクトル取得部12と、視点補償ベクトルによる変換後の魚眼画像に対して、接地面に平行な視点を複数設定し、視点毎に、視点からの視線を軸に含む座標系に基づいて、透視投影近似による歪み補正を行ない、補正後の魚眼画像から抽出された垂直方向の画像要素を用いて、1つの正規化画像を生成する、画像生成部13と、を備えている。

Description

画像処理装置、画像処理方法、及び記憶媒体
 本発明は、魚眼画像に対して正規化処理を実行するための、画像処理装置、画像処理方法、及びこれらを実現するためのプログラムを記憶する記憶媒体に関する。
 魚眼カメラは、180°を超える広視野角を一つの画像として撮像及び取得できる特徴を備えており、その特徴から、監視、地図生成、自動車のリアビューモニタなどの産業分野で利用されている。
 一方、魚眼カメラは、撮像画像に大きな光学歪を生じることが知られている。このため、魚眼カメラでは、画像上の歩行者など特定の物体を検出するようなタスクにおいては、検出が困難となることがある。
 例えば、物体の検出方法として、機械学習による統計的識別器を用いた検出方法が一般的に知られているが、これらは歩行者の形状パタンなどの特徴の類似性に基づく判別方法である。従って、光学歪により画像上の位置によって同一物体の形状が大きく変形する魚眼画像に、通常のカメラ(ピンホールモデル、透視投影モデルに近似できる光学系)によって取得された画像を前提に設計された統計的識別を適用することは困難である。
 また、魚眼画像の光学歪を補正して対象を見やすく提示する方法が提案されている。この方法では、魚眼画像を、球体面に投影された仮想画像の平面への写像としてモデル化し、一部を切り出して透視投影モデルで撮像された画像に近似した補正画像(「透視投影補正画像」と呼ぶ)に変換する。
 但し、透視投影補正画像では、実空間における直線が直線として復元され、中心部では良い透視投影カメラ画像の近似となるが、周辺部に向かうにしたがって射影歪により対象物が不自然に拡大された画像となる。また、透視投影補正画像では、光軸を0°として任意の方向に向かって90°を超える視点の画像は原理的に投影できない。このため、透視投影補正画像は、射影歪の少ない中心部の画像のみを必要とする用途にしか用いることができない。
 このような問題を解消するため、例えば、特許文献1及び特許文献2は、魚眼カメラ画像に写る人物などの歪みを補正する技術を開示している。
 具体的には、特許文献1は画像変換装置を開示している。特許文献1に開示された画像変換装置は、魚眼画像を仮想球体面上にモデル化し、これを円柱座標系に投影して湾曲正則画像を生成することで、歪みを補正している。なお、円柱座標系では、水平方向は球体面の接線方向に設定され、垂直方向を球対面の軸方向に設定されている。
 また、特許文献2は、特許文献1に開示された画像変換装置を用いた画像提示装置を開示している。特許文献2に開示された画像処理装置は、特許文献1に開示された湾曲正則画像を用いて、魚眼画像の中心視野から水平方向の視野範囲において複数の人物画像を補正している。
特許第4629131号公報 特許第5569329号公報
 ところで、現実の魚眼カメラを備えたシステムでは、カメラ光軸は、必ずしも対象物の接地する平面と平行又は直角などの位置関係にない。このため、対象物である歩行者などの画像を正規化するためには、対象物の接地する平面(対象水平面)に平行な方向ベクトルとカメラの光軸ベクトルとの差分を補正する必要がある。
 しかしながら、上記特許文献1及び2に開示された装置では、このような方向ベクトルと光軸ベクトルとの差分を補正することは行なわれていないため、実際の魚眼画像から歪みを取り除くことが困難である。
 加えて、上記特許文献1及び2に開示された装置は、魚眼画像上の画素を、対応する仮想球体面上の座標において単純な数式で記述している。即ち、これらの装置は、魚眼光学系が理想的なモデルに従うことを前提として、魚眼画像上の画素の仮想球体面への対応付けを定式化している。
 しかしながら、一般的な魚眼光学系は、設計モデルが非公開である場合があることに加え、撮像素子と光軸とのずれ、レンズ自体の歪等により、必ずしもモデル通りの光学的性質を持たないことがある。言い換えると、一般的な魚眼光学系では、理想的なモデルが成立しない場合がある。特に、この傾向は、車載用の後方又は側面の視認用に用いられる安価な魚眼カメラなどにおいて顕著である。この結果、上記特許文献1及び2に開示された装置では、上述の方向ベクトルと光軸ベクトルとの差分の補正が必要ない場合であっても、魚眼画像から歪みを取り除くことが困難な場合がある。
 本発明の目的は、上記問題を解消し、魚眼光学系に影響されることなく、且つ、魚眼カメラの光軸と対象物の接地する平面との位置関係が一定条件を満たさない場合であっても、魚眼画像における歪みを正規化し得る、画像処理装置、画像処理方法、及びプログラムを提供することにある。
 上記目的を達成するため、本発明の一側面における画像処理装置は、対象物が写った魚眼画像を取得する、魚眼画像取得手段と、前記対象物の接地面に平行な面を基準とした、撮像装置の光軸回りのロール角及び光軸のピッチ角に基づいて、前記魚眼画像を、前記対象物を前記接地面に平行な方向から撮影して得られる画像に変換するための、視点補償ベクトルを取得する、視点補償ベクトル取得手段と、前記視点補償ベクトルを用いて変換された前記魚眼画像に対して、その水平方向に沿って、前記接地面に平行な視点を複数設定し、設定された前記視点毎に、変換後の前記魚眼画像に対して、当該視点からの視線を軸に含む座標系に基づいて、透視投影近似による歪み補正を行ない、補正後の前記魚眼画像それぞれから抽出された垂直方向の画像要素を用いて、1つの正規化画像を生成する、画像生成手段と、を備えていることを特徴とする。
 また、上記目的を達成するため、本発明の一側面における画像処理方法は、対象物が写った魚眼画像を取得し、前記対象物の接地面に平行な面を基準とした、撮像装置の光軸回りのロール角及び光軸のピッチ角に基づいて、前記魚眼画像を、前記対象物を前記接地面に平行な方向から撮影して得られる画像に変換するための、視点補償ベクトルを取得する、視点補償ベクトル取得を行い、前記視点補償ベクトルを用いて変換された前記魚眼画像に対して、その水平方向に沿って、前記接地面に平行な視点を複数設定し、設定された前記視点毎に、変換後の前記魚眼画像に対して、当該視点からの視線を軸に含む座標系に基づいて、透視投影近似による歪み補正を行ない、補正後の前記魚眼画像それぞれから抽出された垂直方向の画像要素を用いて、1つの正規化画像を生成する、画像生成を行う、ことを特徴とする。
 更に、上記目的を達成するため、本発明の一側面における記憶媒体は、コンピュータに、対象物が写った魚眼画像を取得する魚眼画像取得処理と、前記対象物の接地面に平行な面を基準とした、撮像装置の光軸回りのロール角及び光軸のピッチ角に基づいて、前記魚眼画像を、前記対象物を前記接地面に平行な方向から撮影して得られる画像に変換するための、視点補償ベクトルを取得する視点補償ベクトル取得処理と、前記視点補償ベクトルを用いて変換された前記魚眼画像に対して、その水平方向に沿って、前記接地面に平行な視点を複数設定し、設定された前記視点毎に、変換後の前記魚眼画像に対して、当該視点からの視線を軸に含む座標系に基づいて、透視投影近似による歪み補正を行ない、補正後の前記魚眼画像それぞれから抽出された垂直方向の画像要素を用いて、1つの正規化画像を生成する画像生成処理と、を実行させるプログラムを記憶する。上記記憶媒体に格納されたプログラムも、本発明の一側面である。
 以上のように本発明によれば、魚眼光学系に影響されることなく、且つ、魚眼カメラの光軸と対象物の接地する平面との位置関係が一定条件を満たさない場合であっても、魚眼画像における歪みを正規化することができる。
図1は、本発明の実施の形態における画像処理装置の概略構成を示すブロック図である。 図2は、本発明の実施の形態における画像処理装置10の具体的構成を示すブロック図である。 図3は、本発明の実施の形態で用いられる撮像装置の座標系の定義を示す図である。 図4は、Roll-Pitch-Yaw表現を用いて表現される視点補償ベクトルを説明するための図である。 図5は、本発明の実施の形態において行なわれる2視点間の座標変換を説明するための図である。 図6は、本発明の実施の形態で用いられる元の視点での座標系と平行化視点座標系とを説明するための図である。 図7は、本発明の実施の形態において対象となる魚眼画像(IF)の一例を模式的に示した図である。 図8は、本発明の実施の形態で定義される平行化視点座標系の一例を示す図である。 図9は、平行化視点が異なる2つの透視投影補正画像と、これら透視投影補正画像から得られる正規化パノラマ画像とを示している。 図10は、本発明の実施形態における画像処理装置の動作を示すフロー図である。 図11は、本発明の実施の形態における画像処理装置を実現するコンピュータの一例を示すブロック図である。
 (実施の形態)
 以下、本発明の実施の形態における、画像処理装置、画像処理方法、及びプログラムについて、図1~図11を参照しながら説明する。
 [装置構成]
 最初に、図1を用いて、本実施の形態における画像処理装置の概略構成について説明する。図1は、本発明の実施の形態における画像処理装置の概略構成を示すブロック図である。
 図1に示すように、本実施の形態における画像処理装置10は、魚眼画像取得部11と、視点補償ベクトル取得部12と、画像生成部13とを備えている。このうち、魚眼画像取得部11は、対象物が写った魚眼画像を取得する。
 視点補償ベクトル取得部12は、視点補償ベクトルを取得する。視点補償ベクトルは、対象物の接地面に平行な面を基準とした、撮像装置の光軸回りのロール角及び光軸のピッチ角に基づいて、魚眼画像を、対象物を接地面に平行な方向から撮影して得られる画像に変換するための、ベクトルである。
 画像生成部13は、先ず、視点補償ベクトルを用いて変換された魚眼画像に対して、その水平方向に沿って、対象物の接地面に平行な視点を複数設定する。続いて、画像生成部13は、設定された視点毎に、変換後の魚眼画像に対して、各視点からの視線を軸に含む座標系に基づいて、透視投影近似による歪み補正を行なう。そして、画像生成部13は、歪み補正後の魚眼画像それぞれから抽出された垂直方向の画像要素を用いて、1つの正規化画像を生成する。
 このように本実施の形態では、視点補償ベクトルによる変換が行なわれるので、魚眼カメラの光軸と対象物の接地する平面との位置関係が一定条件を満たさない場合であっても、魚眼画像における歪みを正規化することができる。
 また、本実施の形態では、複数の座標系毎に歪み補正が行なわれ、視点を変えて補正された画像が得られる。そして、得られた補正後の各画像の垂直方向の要素が連結されて最終的な正規化画像となる。このため、本実施の形態では、魚眼光学系の設計モデルが非公開である場合であっても、歪みの除去が可能となり、歪みの除去が魚眼光学系に影響されることがない。
 続いて、図2~図9を用いて、本実施の形態における画像処理装置10の具体的構成について説明する。図2は、本発明の実施の形態における画像処理装置10の具体的構成を示すブロック図である。
 まず、図2について説明する前に、本実施の形態で用いる用語について説明する。本実施の形態では、魚眼画像の正規化(歪みの除去)において、視点は水平面に設定され、更に、この水平面の基準となる平面(対象平面:target plane)が定められる。対象平面としては、正規化を行いたい対象(Target)である縦長の対象物が接地している平面(接地面)が選択される。そして、正規化の対象が、例えば歩行者であるならば、対象平面としては、道路面、床面などが挙げられる。また、対象平面は、垂直の壁面、又は傾斜のある路面に定義されていても良く、必ずしも現実の水平面と一致していなくても良い。
 また、以降では、対象平面が路面であり、正規化の対象(魚眼画像の被写体)が歩行者である場合について、説明を行うが、本発明の適用範囲は、これらの制約によって限定されることはない。
 図2に示すように、本実施の形態における画像処理装置10は、画像出力装置20、センサ装置30、及び端末装置40に接続されており、これらと共に、画像処理システム1を構成している。
 画像出力装置20は、画像情報を、画像処理装置10に向けて出力する装置である。図2の例では、画像出力装置20として、撮像装置が用いられている。撮像装置は、リアルタイムで画像を撮像する装置であり、撮影対象の画像を連続的に出力する。撮像装置の具体例として、例えば、NTSC(National Television Standards Committee)形式、PAL(Phase Alternating Line)形式、または各種デジタル画像を出力するカムコーダ等が挙げられる。
 但し、本実施の形態では、画像出力装置20は、画像情報として、魚眼画像の画像データを出力する。従って、撮像装置に用いられる光学系としては、魚眼レンズ系が挙げられる。撮像装置としては、魚眼レンズと撮像素子とを備えた魚眼カメラが挙げられる。
 また、画像出力装置20は、撮像装置以外の装置、例えば、画像キャプチャ装置であっても良い。画像キャプチャ装置は、記憶媒体に保存された画像情報を読み出し、読み出した画像情報を、NTSC形式、PAL形式、又は、その他の電子制御装置が読み取ることのできる画像形式に変換して出力する。この場合、画像出力装置20は、画像処理装置10を構築するコンピュータで動作するソフトウェアプログラムとして実現することもできる。なお、画像処理装置10を構築するコンピュータについては後述する。コンピュータは、画像出力装置20から送られてくる画像情報に応じて、所定のプログラムに基づく画像処理を実行する。
 センサ装置30は、例えば、角度センサを備えており、撮像装置の光軸ベクトルと、被写体となっている対象物の接地面に平行なベクトルと、の相対ベクトルを計測するための情報を出力する。出力される情報としては、撮像装置における、光軸回りのロール角、光軸のピッチ角、光軸のヨー角が挙げられる(後述の図3参照)。
 対象物の接地面(対象平面)を水平面(地面)と想定する場合には、センサ装置30は、撮像装置の光軸が水平方向に平行であり、且つ、撮像装置の傾きがゼロ(撮像素子の水平方向が水平面と平行の状態)であるときの値(例えば後述の角度センサの情報)を初期値として、得られた角度センサの情報と初期値との差分を出力する。
 一方、対象物の接地面が水平面(地面)ではない場合は、センサ装置30は、予め測定された対象物の接地面の水平面に対する角度を考慮して、上述の、得られた角度センサの情報と初期値との差分を出力する。また、センサ装置30とは別に、対象物の接地面の角度を測定するセンサ装置(角度センサ)が設置されていても良く、このとき、センサ装置30は、自身のセンサデータと、別のセンサ装置のセンサデータとの差分を出力する。
 また、画像出力装置20が、上述した画像キャプチャ装置である場合には、予め角度センサの情報も作成され、角度センサの情報は、角度センサの情報を画像と同期して記憶する記憶デバイスから提供される。なお、この場合の角度センサの情報とは、読み出しの対象となる画像情報を出力した撮像装置における、光軸回りのロール角、光軸のピッチ角、光軸のヨー角が挙げられる。
 また、本実施の形態では、センサ装置30を用いる代わりに、相対ベクトルを算出するソフトウェアが用いられていても良い。この場合は、ソフトウェアによって、例えば、画像中の基準オブジェクトの位置及び形状から、対象物の接地面に対する差分ベクトルが推定される。なお、撮像装置の光軸ベクトルと対象物の接地面との相対関係が、撮像中に変化しないことが想定できる場合には、このソフトウェアの代わりに、予め測定された上記相対関係を規定するデータが用いられても良い。
 端末装置40は、その画面上に、ユーザインタフェースを提供する。ユーザインタフェースは、ユーザによる画像処理装置10の操作、画像処理装置10の内部状態及び出力のモニタリングに利用される。また、端末装置40は、その画面上に、画像出力装置20から入力された魚眼画像、画像処理装置10による画像処理後の変換画像、及び変換画像を用いた各種画像処理結果、等を提示することもできる。
 更に、端末装置40は、その入力デバイスを介して、ユーザから画像処理装置10への指令、例えば、処理の開始、処理の終了、パラメータの指定、画面上に提示される情報の選択等を受け付け、受け付けた指令を画像処理装置10に入力する。入力デバイスとしては、例えば、スイッチボード、キーボード、マウス、タッチパネル等が挙げられる。
 但し、本実施の形態においては、画像処理システム1は、端末装置40を備えていない態様であってもよい。また、画像処理システム1は、画像処理装置10が出力した情報を入力として利用する装置を備えていても良い。また、そのような装置は、画像処理装置10を構築するコンピュータで動作するソフトウェアプログラムとして実現することもできる。また、そのような装置の例としては、画像処理装置10によって生成される変換画像を入力とする、各種画像処理装置、画像認識装置などが考えられる。
 また、図2に示すように、画像処理装置10は、上述した、魚眼画像取得部11、視点補償ベクトル取得部12、及び画像生成部13に加えて、視点補償ベクトル生成部14を備えている。各部は概略つぎのように動作する。
 魚眼画像取得部11は、本実施の形態では、画像出力装置20から画像処理装置10へと出力された画像情報、具体的には、魚眼画像の画像データを取得する。また、画像取得部11は、画像データを取得すると、画像データに対して、必要な画像領域の切り出し処理、解像度及びサイズの調整処理、NTSC形式画像からの奇数(又は偶数)フィールドの抽出処理、画質改善処理といった、画像形式についての調整処理を実行することもできる。
 視点補償ベクトル取得部12は、本実施の形態では、視点補償ベクトル生成部14から視点補償ベクトルを取得する。視点補償ベクトル生成部14は、撮像装置の光軸ベクトルと対象平面に平行なベクトルとの相対ベクトルを、視点補償ベクトルとして生成する。この相対ベクトルは、2つの座標系間の回転を表現するベクトルである。
 回転の表現手法としては、一般に、Quaternion、オイラー角表現、Roll-Pitch-Yaw角表現などが挙げられ、本実施の形態では、いずれの表現手法が採用されていてもよい。例として、以降では、Roll-Pitch-Yaw角表現を用いて説明する。
 図3を用いて、撮像装置の座標と回転軸とについて説明する。図3は、本発明の実施の形態で用いられる撮像装置の座標系の定義を示す図である。まず、本実施の形態において、相対ベクトルは、少なくとも、ロール(roll)角、およびピッチ(pitch)角からなる2次元の数値を含んでいる。ロール角及びピッチ角は、カメラの光軸を含む水平面(x-z平面)と対象平面とを一致させるために必要な回転角度である。
 本実施の形態では、ヨー(yaw)角としては、魚眼画像の水平視野角の範囲に含まれる任意の角度が指定される。ヨー角は、最終的に生成される画像の(水平方向の)中心視点を定めるものである。よって、元の魚眼画像の水平視野角を最大限利用するためには、ヨー角としては、現実の撮像装置(カメラ)の光軸におけるヨー角がそのまま用いられていることが好ましい。
 図4を用いて、視点補償ベクトルの表現形式について説明する。図4は、Roll-Pitch-Yaw表現を用いて表現される視点補償ベクトルを説明するための図である。ロール角とピッチ角は、図4を参照すると次のように定義される。なお、視点補償ベクトルを構成するロール角及びピッチ角を、特に「相対ロール角」及び「相対ピッチ角」と表記する。
 すなわち、図4に示すように、撮像装置の座標において、x-z平面から、対象平面とロール角の一致したx’-z平面へのz軸回りの回転角度は、相対ロール角αと定義される。また、x’-z平面から、対象平面と平行な平面へのx’軸回りの回転角度は、相対ピッチ角βと定義される。
 そして、任意のヨー角γが与えられたとすると、視点補償ベクトルVは、例えば、下記の数1で表される。なお、任意のヨー角γがカメラ光軸によって規定される場合には、下記の数1において、γ=0が成立する。
Figure JPOXMLDOC01-appb-M000001
 視点補償ベクトルVを用いれば、2視点間の座標変換を行うことが出来る。図5は、本発明の実施の形態において行なわれる2視点間の座標変換を説明するための図である。図5を参照すると、一般に、物理空間上のある点に対する座標変換は、座標系1から座標系2に対する外部パラメータ行列Kを用いて、下記の数2で記述できる。
Figure JPOXMLDOC01-appb-M000002
 ただし、pチルダ(i)は、座標系iにおける位置座標の同次表現である。同次表現は、下記の数3によって表される。
Figure JPOXMLDOC01-appb-M000003
 また、上記数2におけるKは、一般に回転行列R、および並進ベクトルtを用いて、下記の数4で記述される。
Figure JPOXMLDOC01-appb-M000004
 回転行列Rは、Roll-Pitch-Yaw表現においては、定義におけるロール角α、ピッチ角β、ヨー角γを用いて、下記の数5で記述される。
Figure JPOXMLDOC01-appb-M000005
 ここで、上記数1で規定された視点補償ベクトルVによって変換された視点を「平行化中心視点(central horizontalized viewpoint)」と表記し、視点が存在する座標系を「平行化中心視点座標系」と表記することとする。
 また、対象平面に平行であり、且つ、平行化中心視点から任意のヨー角γだけ回転させて得られた視点の集合を「平行化視点(horizontalized viewpoints)」と表記し、それぞれの視点における座標系を「平行化視点座標系」と表記することとする。図6は、本発明の実施の形態で用いられる元の視点での座標系と平行化視点座標系とを説明するための図である。
 平行化視点座標系は、任意のγ、及び視点補償ベクトルの(α)による座標変換から得られている。平行化視点座標への座標変換は、上記数4及び数5において(α,β)=(α,β)とした外部パラメータ行列Khrz(γ)を用いて、下記の数6によって記述できる。
Figure JPOXMLDOC01-appb-M000006
 但し、元の視点(original viewpoint)での座標系の座標と、平行化視点座標系における座標とは、それぞれ下記の数7及び数8とする。
Figure JPOXMLDOC01-appb-M000007
Figure JPOXMLDOC01-appb-M000008
 また、平行化中心視点は、元の視点との間で原点を共有するとすれば、Khrz(γ)において並進ベクトルtは、t=(0,0,0)とおくことができる。
 以上のように、視点補償ベクトルVが与えられると、元の視点での座標系から、平行化視点座標系への座標変換Khrz(γ)を定義することができる。本実施の形態では、視点補償ベクトル生成部14は、平行化変換行列(horizontal transform matrix)Khrz(γ)を生成し、これを視点補償ベクトル取得部に与える。
 画像生成部13は、本実施の形態では、生成される正規化画像の水平方向の全画素数に応じて、視点を設定する。また、画像生成部13は、視点毎に、歪み補正を行なった後に、補正後の魚眼画像を垂直方向に切り出して、各視点からの視線が入射するスライス画像を抽出する。そして、画像生成部13は、抽出したスライス画像それぞれを、予め定めた順序で、水平方向に配置して、1つの正規化画像を生成する。
 具体的には、画像生成部13は、まず、魚眼画像取得部11で取得された魚眼画像に対し、視点補償ベクトルVを用いて、平行化視点の集合を設定する。次いで、画像生成部13は、水平方向の視野範囲を任意に分割し、各平行化視点の集合(平行化視点列)のそれぞれの平行化視点座標系において、透視投影近似による歪補正を実行する。そして、画像生成部13は、各視点の中心を通る垂直方向の画像要素を、平行化視点列の順序で水平方向に並べ、これらを連結することで、一枚の合成画像を生成する。以下、画像生成部13による処理について詳細に説明する。
 透視投影近似による歪み補正:
 ここで、透視投影近似による歪み補正について具体的に説明する。透視投影近似による歪補正(透視投影補正)は、一般にカメラモデル、及びカメラモデルにおける校正済みの内部パラメータが既知であれば、以下の方法で求めることが出来る。なお、透視投影近似による歪み補正は、既存の技術で実現できるものであるが、参考として以下で簡単に説明する。
 一般のカメラ座標系における実空間上の点p=(x,y,z)と、魚眼画像上の点との関係式は以下の数9~数11によってモデル化できる。但し、数9におけるρ’は数12によって表される。
Figure JPOXMLDOC01-appb-M000009
Figure JPOXMLDOC01-appb-M000010
Figure JPOXMLDOC01-appb-M000011
Figure JPOXMLDOC01-appb-M000012
 また、上記数9及び数11における(u’,v’)は、affine歪のない理想的な魚眼画像の座標(中心を原点とする)を示している。数12における(u”,v”)は、実際の魚眼画像の座標(左上を原点とする)を示し、(u”,v”)は、実際の魚眼画像の中心座標を示している。更に、数11における2×2の正方向行列は、affine変換行列である。
 そして、上記数10の係数を4次までに近似して得られるパラメータは、魚眼レンズの歪特性、及び魚眼レンズの光軸と撮像素子との位置関係のずれ、等から決まるカメラの内部パラメータである。なお、当該パラメータを下記の数13に示す。
Figure JPOXMLDOC01-appb-M000013
 そして、上記数13に示すパラメータは、下記の参考文献1に開示されているキャリブレーション手法によって予め求めることができる。
 [参考文献]
 Davide Scaramuzza、 Agostino Martinelli and Roland Siegwart、 “A Toolbox for Easily Calibrating Omnidirectional Cameras”、 IROS、 2006。
 ここで、座標系のz軸に垂直な画像平面(z=z)を設定すると、画像平面(z=z)上で定義される画像の座標(u,v)に対して、上記数9~数11の関係式を用いることで、対応する魚眼画像の座標(u”,v”)を求めることが出来る。従って、画像の座標(u,v)に対応する魚眼画像の座標(u”,v”)の画素値を参照して、画像の座標(u,v)における画素値を魚眼画像の座標(u”,v”)の画素値に置き換えることで、透視投影近似による歪み補正後の画像(「透視投影補正画像」と表記する。)を生成することができる。
 なお、魚眼画像座標の画素値は、モノクロ画像であれば1チャンネルの輝度値、カラー画像ではRGB3チャンネルの輝度値である。そして、z=zの値は投影面と焦点からの距離を表し、これが透視投影補正画像のスケールを決定するパラメータである。
 透視投影近似による歪み補正の効果:
 視点補償ベクトルによって平行化変換行列が与えられるため、任意の平行化視点における透視投影画像平面を定義できる。その結果、画像生成部13は、平行化視点毎に、それぞれの視点における透視投影補正画像を上記の方法を用いて生成することになる。
 透視投影補正画像では、直線性が復元される一方で、周辺部に向かうにしたがって射影歪により被写体のスケール歪が大きくなることが知られている。従って、画像生成部130は、視点毎に、生成された透視投影補正画像の中心列のみを抽出し、これら中心列を水平方向に連結する。これにより、水平方向のスケール歪が抑制され、且つ、垂直方向の直線性が保たれた、連続した一枚画像が生成される。これによって、元の魚眼画像に撮像された対象平面上に存在する縦長の立体物が全て一貫したスケールを持ち、且つ、形状歪の少ない、一枚の正規化画像が合成される。
 <画像生成部による具体的処理>
 ここで、画像生成部13による処理の具体例について以下に説明する。元の魚眼画像(I)から各平行化視点座標系で生成される透視投影補正画像(I)において、その中心を通る画像列を「正規化スライス画像(I)」と表記する。また、最終的な出力画像を「正規化パノラマ画像(I)」、と表記する。本実施の形態では、正規化パノラマ画像を生成するまでの一連の機能が画像生成部13の機能である。
 まず、画像生成部13において、最終的に出力される画像のサイズ(幅、高さ)=(W、H)が定義される。次に、画像生成部13は、正規化パノラマ画像の合成に用いる平行化視点列を定義する。視点のロール角及びピッチ角は、視点補償ベクトルベクトルVによって決定されているので、ここではヨー角φiの組Φを定義すればよい。以下では、ヨー角がφiである平行化視点を、平行化視点φiとも表記することもある。Φは、画像の横ピクセル数と同数の系列とし、下記の数14で表される。
Figure JPOXMLDOC01-appb-M000014
 Φは、元の魚眼画像の水平視野範囲内で任意に設定できる。Φの上限と下限とが、正規化パノラマ画像で描画される水平視野範囲(FOV_H)を決定する。例えば、水平視野範囲がFOV_H=185°を確保するとき、平行化視点列の範囲は、下記の数15に示す範囲となる。
Figure JPOXMLDOC01-appb-M000015
 一般に魚眼画像は実空間上の球体面モデルに投影された点群の一方向への写像としてモデル化される。このとき球体中心は光学中心と一致すると仮定できる。各平行化視点座標系の原点は光学中心と一致させているため、Φは、下記数16に示すように、等分解能で定義できる。但し、下記数16において、i=0,・・・,W-1である。
Figure JPOXMLDOC01-appb-M000016
 また、各平行化視点座標系(数17)上の点は、平行化変換行列Khrz(γ)を用いて、元のカメラ座標系の点mチルダが「(x,y,z,1)」と表されることから、下記の数18で求められる。
Figure JPOXMLDOC01-appb-M000017
Figure JPOXMLDOC01-appb-M000018
 上述したように、平行化視点座標系(数17)のz軸(数19)に垂直な画像平面(数20)を設定すると、この画像平面(数20)上で定義される画像座標(数21)において、元の魚眼画像上の画素(u”,v”)への対応が求められる。魚眼画像上の画素の点が、画像座標(数21)上へ投影された画像が透視投影補正画像である。また、数20の定数は、投影面と焦点からの距離を表し、これが透視投影補正画像のスケールを決定するパラメータである。
Figure JPOXMLDOC01-appb-M000019
Figure JPOXMLDOC01-appb-M000020
Figure JPOXMLDOC01-appb-M000021
 透視投影補正画像(I)の中心を通る垂直方向の画像列が、正規化スライス画像(I)である。正規化スライス画像(I)は、透視投影補正画像(I)を透視投影画像平面に投影する際に、投影画像の横サイズを1ピクセルに設定する条件で生成される、透視投影補正画像(I)の特別なバリエーションである。なお、正規化スライス画像(I)を生成するためにより大きな横サイズをもつ別の透視投影補正画像(I)を生成した上で切り出しを行う必要はない。
 各平行化視点座標系(数17)において、正規化スライス画像(数22)を生成するときのスケールパラメータ(数23)は、通常、各平行化視点座標系において、同じ値で定義され、最終的な正規化パノラマ画像における縦横のアスペクト比を考慮して設定する必要がある。スケールパラメータは、直接値を定義するだけでなく、後述するようにその他のパラメータから間接的に定義することもできる。
Figure JPOXMLDOC01-appb-M000022
Figure JPOXMLDOC01-appb-M000023
 本実施の形態では、各平行化視点座標系(数17)における正規化スライス画像(数22)を、左から平行化視点のヨー角φiの系列Φの順に並べて得られた合成画像を、正規化パノラマ画像(I)とする。正規化パノラマ画像(I)の各要素は、下記の数24で定義される。但し、数24において、かっこ内は画像座標を示している。また、i=0,1,・・・W-1、j=0,1,・・・H-1である。
Figure JPOXMLDOC01-appb-M000024
 ここで、図7~図9を用いて、魚眼画像の一例とそれに対する画像生成処理について説明する。図7は、本発明の実施の形態において対象となる魚眼画像(I)の一例を模式的に示した図である。図7の例では、魚眼画像には、地面を対象平面として、下向きの視点で撮影された人物(Person A、Person B、Person C)が写っている。
 図7に示す魚眼画像に対して画像処理装置10による処理が実行される。これにより、図8に示すように、各平行化視点座標系(数17)において、透視投影画像平面が定義される。図8は、本発明の実施の形態において定義される平行化視点座標系の一例を示す図である。また、透視投影画像平面における座標は、上記数21によって表される。そして、この透視投影画像平面上に、正規化スライス画像(I)を含む任意の画像サイズの透視投影補正画像(I:数25)が生成される。
Figure JPOXMLDOC01-appb-M000025
 図9は、平行化視点が異なる2つの透視投影補正画像と、これら透視投影補正画像から得られる正規化パノラマ画像とを示している。
 具体的には、図9の左図には、平行化視点(数26)で生成される、透視投影補正画像(数27)及び正規化スライス画像(数28)が示されている。また、図9の中央図には、平行化視点(数29)で生成される、透視投影補正画像(数30)、及び正規化スライス画像(数31)が例示されている.
Figure JPOXMLDOC01-appb-M000026
Figure JPOXMLDOC01-appb-M000027
Figure JPOXMLDOC01-appb-M000028
Figure JPOXMLDOC01-appb-M000029
Figure JPOXMLDOC01-appb-M000030
Figure JPOXMLDOC01-appb-M000031
 また、図9の右図には、定義された平行視点列(数32)における全ての正規化スライス画像によって生成された正規化パノラマ画像(I)の一例が示されている。図9に示したように、正規化スライス画像(上記数28)及び(上記数31)を含むすべての正規化スライス画像を要素として、正規化パノラマ画像(I)が合成される。
Figure JPOXMLDOC01-appb-M000032
 スケールパラメータの間接的決定処理:
 また、画像生成部13は、視点毎の透視投影近似による歪み補正において、平行化視点座標系における投影平面の原点に対する距離を、生成される正規化パノラマ画像における、サイズ、水平方向における視野角の範囲、及びアスペクト比に基づいて決定する。
 つまり、透視投影補正画像及び正規化スライス画像を生成する際の画像スケールは、上述したように各座標における投影面の距離|z|によって決まる。しかし、実用上はこれを直接指定するよりも、正規化パノラマ画像の視野範囲及び画像サイズなどの拘束条件を満たすように間接的に決定した方が便利な場合がある。
 ここでは、画像のサイズ、水平方向における視野角の範囲、画像のアスペクト比を指定してスケールを求める方法を示す。ここで、正規化パノラマ画像のサイズ(幅、高さ)を、(W,H)とし、正規化パノラマ画像に投影する水平方向の視野角の大きさをA、垂直方向の視野角の大きさをAとする。また、正規化パノラマ画像における縦/横の(角度/ピクセル)比を下記の数33とする。ただし、上記数33において、Aの上限値を180度とする(数34)。
Figure JPOXMLDOC01-appb-M000033
Figure JPOXMLDOC01-appb-M000034
 また、スケール|z|は、次のステップ(a)及び(b)によって決定される。
 ステップ(a):
 (W,H,A,μ)を拘束条件として、下記の数35及び数36を用いて、(|z|,A)を決定する。
Figure JPOXMLDOC01-appb-M000035
Figure JPOXMLDOC01-appb-M000036
 ステップ(b):
 以下の数37が成立するときに、下記の数38~数40を用いた再計算により、(A,A,|z|)を下記の数41で置き換える。
Figure JPOXMLDOC01-appb-M000037
Figure JPOXMLDOC01-appb-M000038
Figure JPOXMLDOC01-appb-M000039
Figure JPOXMLDOC01-appb-M000040
Figure JPOXMLDOC01-appb-M000041
 LUT処理による高速化:
 本実施の形態では、視点補償ベクトル取得部12は、視点補償ベクトルとして、対象物を接地面に平行な方向から撮影して得られる画像上の座標と、魚眼画像上の座標と、の対応付けを記述したテーブルを取得することができる。
 具体的には、本実施の形態では、予め定められた固定の視点補償ベクトルが用いられる場合は、視点補償ベクトル生成部14は、正規化パノラマ画像上の座標(u,v)から対応する元の魚眼画像上の座標(u”,v”)への対応付けを記述した参照テーブルを予め生成する。この場合、入力画像系列に対する実際の正規化パノラマ画像の生成処理は、参照テーブルを参照しながら、正規化パノラマ画像を生成する、テーブル参照(LUT: Look-Up-Table)処理に置き換えられる。
 例えば、オフラインで参照テーブルを生成し、オンラインの画像入力系列に対して、順次正規化パノラマ画像を生成する処理をLUT処理で実行することにより、魚眼画像から正規化パノラマ画像の生成を高速に処理することが出来る。この態様では、処理クロックの低いプロセッサ上への実装を必要とする用途に好適な画像処理システムを構築できる。
 具体的な参照テーブルの生成方法としては、概略下記のような方法が考えられる。まず、元の魚眼画像のサイズ(Win,Hin)の幅と高さを持つ、2チャンネルの行列(インデックスマップと呼ぶ)を用意する。そして、1つ目のチャンネルの行列であるXインデックスマップ(Xind)の各列には、対応する(u”)の座標値を与え、2つめのチャンネルの行列であるYインデックスマップ(Yind)の各行には対応する(v”)の座標値を与える。
 すなわち、インデックスマップを、下記の数42及び数43で定義する。但し、数44が条件となる。
Figure JPOXMLDOC01-appb-M000042
Figure JPOXMLDOC01-appb-M000043
Figure JPOXMLDOC01-appb-M000044
 そして、画像生成部13が、(Xind)及び(Yind)それぞれを入力として、正規化パノラマ画像の生成を実行すると、視点補償ベクトル生成部14は、それぞれの正規化パノラマ画像から、LUTマップ(XLUT)及び(YLUT)を生成する。LUTマップにおいては、(XLUT)及び(YLUT)の各座標(u,v)には、それぞれ対応する元の魚眼画像座標(u”)及び(v”)の値が格納されている。よって、(u,v)の各座標と魚眼画像上の座標(u”,v”)との一対一の対応関係が得られることになる。
 また、このようにして作成されたLUTマップは、例えば、1対1の対応関係(数45)を一行ずつ列挙したテキストファイル形式等によって、参照テーブルファイルとして保存することができる。
Figure JPOXMLDOC01-appb-M000045
 LUT処理では、画像生成部13は、まず、予め生成された参照テーブルファイルを読み込む。そして、画像生成部13は、参照テーブルに記述された正規化パノラマ画像上の座標(u,v)と、取得された元の魚眼画像における座標(u”,v”)とを対応付ける情報に従って、逐次、正規化パノラマ画像座標に対応する魚眼画像上の画素値を参照し、正規化パノラマ画像を生成する。
 [装置動作]
 次に、本実施の形態における画像処理装置10の動作について図10を用いて説明する。図10は、本発明の実施の形態における画像処理装置の動作を示すフロー図である。以下の説明においては、適宜図1~図9を参酌する。また、本実施の形態では、画像処理装置10を動作させることによって、画像処理方法が実施される。よって、本実施の形態における画像処理方法の説明は、以下の画像処理装置10の動作説明に代える。
 図10に示すように、まず、魚眼画像取得部11は、画像出力装置20から魚眼画像を取得する(ステップS1)。次に、視点補償ベクトル取得部12は、視点補償ベクトルを取得する(ステップS2)。
 次に、画像生成部13は、ステップS1で取得された魚眼画像と、ステップS2で取得された視点補償ベクトルとを用いて、正規化パノラマ画像を生成する(ステップS3)。
 具体的には、画像生成部13は、まず、魚眼画像に対し、視点補償ベクトルを用いて、平行化視点の集合を設定する。次いで、画像生成部13は、水平方向の視野範囲を任意に分割し、各平行化視点それぞれの平行化視点座標系において、透視投影近似による歪補正を実行する。そして、画像生成部13は、各視点の中心を通る垂直方向の画像要素を、平行化視点列の順序で水平方向に並べ、並べられた画像要素を連結することで、一枚の正規化パノラマ画像を生成する。
 以上、ステップS1~S3の実行により、一枚の正規化パノラマ画像が生成される。また、本実施の形態では、ステップS1~S3は、設定された間隔で繰り返し実行されるので、正規化パノラマ画像は連続して出力される。
 [実施の形態における効果]
 以上のように、本実施の形態では、魚眼カメラと接地平面との位置関係が補償され、その上で、魚眼画像中の歩行者の画像の形状歪が補正され、歩行者の画像は、通常のカメラ画像と同様に見えるように正規化される。また、正規化によって得られた画像は、全水平視野の範囲での平行化視点毎に得られた透視投影補正画像の正規化スライス画像を連結して得られている。このため、本実施の形態によれば、歪み補正の精度が撮像装置の光学系から影響を受けることもない。また、魚眼カメラの光軸と対象物の接地平面との位置関係が一定条件を満たさない場合であっても、魚眼画像における歪みが精度良く除去される。
 そして、この結果、本実施の形態によれば、魚眼カメラを用いた監視システム、車載のリアビューモニタシステムにおいて、歩行者の視認が容易な画像をユーザに提示することが出来る。また、本実施の形態における処理を前処理として用いれば、既存の通常カメラ画像を想定して設計及び学習されたパタン認識技術を適用した歩行者検知が適用可能となる。
 更に、本実施の形態では、上述したように、視点補償ベクトルを用いた画像変換処理において、変換テーブルを参照するLUT形式を採用することもできる。この場合は、高速処理が可能となり、車載プロセッサ等といった、低消費電力と実時間処理とが求められる用途に好適である。
 [プログラム]
 本実施の形態におけるプログラムは、コンピュータに、図10に示すステップS1~S3を実行させるプログラムであれば良い。このプログラムをコンピュータにインストールし、実行することによって、本実施の形態における画像処理装置10と画像処理方法とを実現することができる。この場合、コンピュータのCPU(Central Processing Unit)は、魚眼画像取得部11、視点補償ベクトル取得部12、画像生成部13、及び視点補償ベクトル生成部14として機能し、処理を行なう。また、コンピュータとしては、パーソナルコンピュータといった汎用のコンピュータだけでなく、自動車、家電、作業用機器等に搭載されるコンピュータも挙げられる。
 また、本実施の形態におけるプログラムは、複数のコンピュータによって構築されたコンピュータシステムによって実行されても良い。この場合は、例えば、各コンピュータが、それぞれ、魚眼画像取得部11、視点補償ベクトル取得部12、画像生成部13、及び視点補償ベクトル生成部14のいずれかとして機能しても良い。
 [物理構成]
 ここで、本実施の形態におけるプログラムを実行することによって、画像処理装置10を実現するコンピュータについて図11を用いて説明する。図11は、本発明の実施の形態における画像処理装置を実現するコンピュータの一例を示すブロック図である。
 図11に示すように、コンピュータ110は、CPU111と、メインメモリ112と、記憶装置113と、入力インターフェイス114と、表示コントローラ115と、データリーダ/ライタ116と、通信インターフェイス117とを備える。これらの各部は、バス121を介して、互いにデータ通信可能に接続される。
 CPU111は、記憶装置113に格納された、本実施の形態におけるプログラム(コード)をメインメモリ112に展開し、これらを所定順序で実行することにより、各種の演算を実施する。メインメモリ112は、典型的には、DRAM(Dynamic Random Access Memory)等の揮発性の記憶装置である。また、本実施の形態におけるプログラムは、コンピュータ読み取り可能な記憶媒体120に格納された状態で提供される。なお、本実施の形態におけるプログラムは、通信インターフェイス117を介して接続されたインターネット上で流通するものであっても良い。
 また、記憶装置113の具体例としては、ハードディスクドライブの他、フラッシュメモリ等の半導体記憶装置が挙げられる。入力インターフェイス114は、CPU111と、キーボード及びマウスといった入力機器118との間のデータ伝送を仲介する。表示コントローラ115は、ディスプレイ装置119と接続され、ディスプレイ装置119での表示を制御する。
 データリーダ/ライタ116は、CPU111と記憶媒体120との間のデータ伝送を仲介し、記憶媒体120からのプログラムの読み出し、及びコンピュータ110における処理結果の記憶媒体120への書き込みを実行する。通信インターフェイス117は、CPU111と、他のコンピュータとの間のデータ伝送を仲介する。
 また、記憶媒体120の具体例としては、CF(Compact Flash(登録商標))及びSD(Secure Digital、登録商標)等の汎用的な半導体記憶デバイス、フレキシブルディスク(Flexible Disk)等の磁気記憶媒体、又はCD-ROM(Compact Disk Read Only Memory)などの光学記憶媒体が挙げられる。
 また、本実施の形態における画像処理装置10は、プログラムがインストールされたコンピュータではなく、各部に対応したハードウェアを用いることによっても実現可能である。更に、画像処理装置10は、一部がプログラムで実現され、残りの部分がハードウェアで実現されていてもよい。
 ここで、本明細書中に使われている主な記号を以下にまとめる。
 集合のある要素に対するインデックス:i,j,・・・
 カメラ座標系における回転角度(roll、pitch、yaw):α,β,γ
 回転行列:R
 並進ベクトル:t
 一般的な座標変換におけるカメラ外部パラメータ行列:K
 任意のヨー角γに対する平行化変換行列:Khrz(γ)
 元のカメラ座標系の点:mチルダ=(x,y,z,1)
 元の魚眼画像:I
 元の魚眼画像の座標:(u”,v”)
 正規化パノラマ画像:I
 正規化パノラマ画像の出力サイズ(幅、高さ):(W,H)
 平行化視点におけるヨー角の系列:Φ={φ}
 ある平行化視点φに対する平行化視点座標系:(数46)
 ある平行化視点φに対する透視投影画像平面座標:(数47)
 ある平行化視点φに対する透視投影補正画像:(数48)
 ある平行化視点に対する正規化スライス画像:(数49)
 スケールパラメータ:(数50)
Figure JPOXMLDOC01-appb-M000046
Figure JPOXMLDOC01-appb-M000047
Figure JPOXMLDOC01-appb-M000048
Figure JPOXMLDOC01-appb-M000049
Figure JPOXMLDOC01-appb-M000050
 上述した実施の形態の一部又は全部は、以下に記載する(付記1)~(付記15)によって表現することができるが、以下の記載に限定されるものではない。
(付記1)
 対象物が写った魚眼画像を取得する、魚眼画像取得手段と、
 前記対象物の接地面に平行な面を基準とした、撮像装置の光軸回りのロール角及び光軸のピッチ角に基づいて、前記魚眼画像を、前記対象物を前記接地面に平行な方向から撮影して得られる画像に変換するための、視点補償ベクトルを取得する、視点補償ベクトル取得手段と、
 前記視点補償ベクトルを用いて変換された前記魚眼画像に対して、その水平方向に沿って、前記接地面に平行な視点を複数設定し、
 設定された前記視点毎に、変換後の前記魚眼画像に対して、当該視点からの視線を軸に含む座標系に基づいて、透視投影近似による歪み補正を行ない、
 補正後の前記魚眼画像それぞれから抽出された垂直方向の画像要素を用いて、1つの正規化画像を生成する、画像生成手段と、
 を備えていることを特徴とする画像処理装置。
(付記2)
 前記画像生成手段が、
 生成される前記正規化画像の水平方向の全画素数に応じて、前記視点を設定し、
 更に、前記視点毎に、歪み補正を行なった後に、補正後の前記魚眼画像を垂直方向に切り出して、当該視点からの視線が入射するスライス画像を抽出し、
 抽出した前記スライス画像それぞれを、予め定めた順序で、水平方向に配置して、1つの正規化画像を生成する、
 付記1に記載の画像処理装置。
(付記3)
 前記画像生成手段が、
 視点毎の透視投影近似による歪み補正において、前記座標系における投影平面の原点に対する距離を、
 生成される前記正規化画像のサイズ、前記正規化画像の水平方向における視野角の範囲、及び前記正規化画像のアスペクト比に基づいて決定する、
 付記1または2に記載の画像処理装置。
(付記4)
 前記視点補償ベクトル取得手段が、前記視点補償ベクトルとして、前記対象物を前記接地面に平行な方向から撮影して得られる画像上の座標と、前記魚眼画像上の座標と、の対応付けを記述したテーブルを取得する、
 付記1から3のいずれか1項に記載の画像処理装置。
(付記5)
 前記撮像装置に取り付けられた角度センサから、前記撮像装置の光軸回りのロール角及び光軸のピッチ角を取得し、取得した前記ロール角及び前記ピッチ角に基づいて、前記視点補償ベクトルを生成する、視点補償ベクトル生成手段を更に備えている、
 付記1から4のいずれか1項に記載の画像処理装置。
(付記6)
 対象物が写った魚眼画像を取得し、
 前記対象物の接地面に平行な面を基準とした、撮像装置の光軸回りのロール角及び光軸のピッチ角に基づいて、前記魚眼画像を、前記対象物を前記接地面に平行な方向から撮影して得られる画像に変換するための、視点補償ベクトルを取得する、視点補償ベクトル取得を行い
 前記視点補償ベクトルを用いて変換された前記魚眼画像に対して、その水平方向に沿って、前記接地面に平行な視点を複数設定し、
 設定された前記視点毎に、変換後の前記魚眼画像に対して、当該視点からの視線を軸に含む座標系に基づいて、透視投影近似による歪み補正を行ない、
 補正後の前記魚眼画像それぞれから抽出された垂直方向の画像要素を用いて、1つの正規化画像を生成する、画像生成を行う
 ことを特徴とする画像処理方法。
(付記7)
 前記画像生成において、
 生成される前記正規化画像の水平方向の全画素数に応じて、前記視点を設定し、
 更に、前記視点毎に、歪み補正を行なった後に、補正後の前記魚眼画像を垂直方向に切り出して、当該視点からの視線が入射するスライス画像を抽出し、
 抽出した前記スライス画像それぞれを、予め定めた順序で、水平方向に配置して、1つの正規化画像を生成する、
 付記6に記載の画像処理方法。
(付記8)
 前記画像生成において、
 視点毎の透視投影近似による歪み補正において、前記座標系における投影平面の原点に対する距離を、
 生成される前記正規化画像のサイズ、前記正規化画像の水平方向における視野角の範囲、及び前記正規化画像のアスペクト比に基づいて決定する、
 付記6または7に記載の画像処理方法。
(付記9)
 前記視点補償ベクトル取得において、前記視点補償ベクトルとして、前記対象物を前記接地面に平行な方向から撮影して得られる画像上の座標と、前記魚眼画像上の座標と、の対応付けを記述したテーブルを取得する、
 付記6から8のいずれか1項に記載の画像処理方法。
(付記10)
 更に、前記撮像装置に取り付けられた角度センサから、前記撮像装置の光軸回りのロール角及び光軸のピッチ角を取得し、取得した前記ロール角及び前記ピッチ角に基づいて、前記視点補償ベクトルを算出する、
 付記6から9のいずれか1項に記載の画像処理方法。
(付記11)
 コンピュータに、
 対象物が写った魚眼画像を取得する魚眼画像取得処理と、
 前記対象物の接地面に平行な面を基準とした、撮像装置の光軸回りのロール角及び光軸のピッチ角に基づいて、前記魚眼画像を、前記対象物を前記接地面に平行な方向から撮影して得られる画像に変換するための、視点補償ベクトルを取得する視点補償ベクトル取得処理と、
 前記視点補償ベクトルを用いて変換された前記魚眼画像に対して、その水平方向に沿って、前記接地面に平行な視点を複数設定し、
 設定された前記視点毎に、変換後の前記魚眼画像に対して、当該視点からの視線を軸に含む座標系に基づいて、透視投影近似による歪み補正を行ない、
 補正後の前記魚眼画像それぞれから抽出された垂直方向の画像要素を用いて、1つの正規化画像を生成する画像生成処理と、
 を実行させるプログラムを記憶する記憶媒体。
(付記12)
 前記画像生成処理は、
 生成される前記正規化画像の水平方向の全画素数に応じて、前記視点を設定し、
 更に、前記視点毎に、歪み補正を行なった後に、補正後の前記魚眼画像を垂直方向に切り出して、当該視点からの視線が入射するスライス画像を抽出し、
 抽出した前記スライス画像それぞれを、予め定めた順序で、水平方向に配置して、1つの正規化画像を生成する、
 付記11に記載の記憶媒体。
(付記13)
 前記画像生成処理は、
 視点毎の透視投影近似による歪み補正において、前記座標系における投影平面の原点に対する距離を、
 生成される前記正規化画像のサイズ、前記正規化画像の水平方向における視野角の範囲、及び前記正規化画像のアスペクト比に基づいて決定する、
 付記11または12に記載の記憶媒体。
(付記14)
 前記視点補償ベクトル取得処理は、前記視点補償ベクトルとして、前記対象物を前記接地面に平行な方向から撮影して得られる画像上の座標と、前記魚眼画像上の座標と、の対応付けを記述したテーブルを取得する、
 付記11から13のいずれか1項に記載の記憶媒体。
(付記15)
 前記プログラムは、コンピュータに、
 前記撮像装置に取り付けられた角度センサから、前記撮像装置の光軸回りのロール角及び光軸のピッチ角を取得し、取得した前記ロール角及び前記ピッチ角に基づいて、前記視点補償ベクトルを算出する視点補償ベクトル生成処理を更に実行させる、
 付記11から14のいずれか1項に記載の記憶媒体。
 以上、実施形態参照して本発明を説明したが、本発明は上記実施形態に限定されるものではない。本発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
 この出願は、2016年6月17日に出願された日本出願特願2016-120984を基礎とする優先権を主張し、その開示の全てをここに取り込む。
 以上のように本発明によれば、魚眼光学系に影響されることなく、且つ、魚眼カメラの光軸と対象物の接地する平面との位置関係が一定条件を満たさない場合であっても、魚眼画像における歪みを正規化することができる。本発明は、魚眼カメラが用いられる種々の分野に有用である。
 1  画像処理システム
 10 画像処理装置
 11 魚眼画像取得部
 12 視点補償ベクトル取得部
 13 画像生成部
 14 視点補償ベクトル生成部
 20 画像出力装置
 30 センサ装置
 40 端末装置
 110 コンピュータ
 111 CPU
 112 メインメモリ
 113 記憶装置
 114 入力インターフェイス
 115 表示コントローラ
 116 データリーダ/ライタ
 117 通信インターフェイス
 118 入力機器
 119 ディスプレイ装置
 120 記憶媒体
 121 バス

Claims (15)

  1.  対象物が写った魚眼画像を取得する、魚眼画像取得手段と、
     前記対象物の接地面に平行な面を基準とした、撮像装置の光軸回りのロール角及び光軸のピッチ角に基づいて、前記魚眼画像を、前記対象物を前記接地面に平行な方向から撮影して得られる画像に変換するための、視点補償ベクトルを取得する、視点補償ベクトル取得手段と、
     前記視点補償ベクトルを用いて変換された前記魚眼画像に対して、その水平方向に沿って、前記接地面に平行な視点を複数設定し、
     設定された前記視点毎に、変換後の前記魚眼画像に対して、当該視点からの視線を軸に含む座標系に基づいて、透視投影近似による歪み補正を行ない、
     補正後の前記魚眼画像それぞれから抽出された垂直方向の画像要素を用いて、1つの正規化画像を生成する、画像生成手段と、
     を備えていることを特徴とする画像処理装置。
  2.  前記画像生成手段が、
     生成される前記正規化画像の水平方向の全画素数に応じて、前記視点を設定し、
     更に、前記視点毎に、歪み補正を行なった後に、補正後の前記魚眼画像を垂直方向に切り出して、当該視点からの視線が入射するスライス画像を抽出し、
     抽出した前記スライス画像それぞれを、予め定めた順序で、水平方向に配置して、1つの正規化画像を生成する、
     請求項1に記載の画像処理装置。
  3.  前記画像生成手段が、
     視点毎の透視投影近似による歪み補正において、前記座標系における投影平面の原点に対する距離を、
     生成される前記正規化画像のサイズ、前記正規化画像の水平方向における視野角の範囲、及び前記正規化画像のアスペクト比に基づいて決定する、
     請求項1または2に記載の画像処理装置。
  4.  前記視点補償ベクトル取得手段が、前記視点補償ベクトルとして、前記対象物を前記接地面に平行な方向から撮影して得られる画像上の座標と、前記魚眼画像上の座標と、の対応付けを記述したテーブルを取得する、
     請求項1から3のいずれか1項に記載の画像処理装置。
  5.  前記撮像装置に取り付けられた角度センサから、前記撮像装置の光軸回りのロール角及び光軸のピッチ角を取得し、取得した前記ロール角及び前記ピッチ角に基づいて、前記視点補償ベクトルを生成する、視点補償ベクトル生成手段を更に備えている、
     請求項1から4のいずれか1項に記載の画像処理装置。
  6.  対象物が写った魚眼画像を取得し、
     前記対象物の接地面に平行な面を基準とした、撮像装置の光軸回りのロール角及び光軸のピッチ角に基づいて、前記魚眼画像を、前記対象物を前記接地面に平行な方向から撮影して得られる画像に変換するための、視点補償ベクトルを取得する、視点補償ベクトル取得を行い、
     前記視点補償ベクトルを用いて変換された前記魚眼画像に対して、その水平方向に沿って、前記接地面に平行な視点を複数設定し、
     設定された前記視点毎に、変換後の前記魚眼画像に対して、当該視点からの視線を軸に含む座標系に基づいて、透視投影近似による歪み補正を行ない、
     補正後の前記魚眼画像それぞれから抽出された垂直方向の画像要素を用いて、1つの正規化画像を生成する、画像生成を行う、
     ことを特徴とする画像処理方法。
  7.  前記画像生成において、
     生成される前記正規化画像の水平方向の全画素数に応じて、前記視点を設定し、
     更に、前記視点毎に、歪み補正を行なった後に、補正後の前記魚眼画像を垂直方向に切り出して、当該視点からの視線が入射するスライス画像を抽出し、
     抽出した前記スライス画像それぞれを、予め定めた順序で、水平方向に配置して、1つの正規化画像を生成する、
     請求項6に記載の画像処理方法。
  8.  前記画像生成において、
     視点毎の透視投影近似による歪み補正において、前記座標系における投影平面の原点に対する距離を、
     生成される前記正規化画像のサイズ、前記正規化画像の水平方向における視野角の範囲、及び前記正規化画像のアスペクト比に基づいて決定する、
     請求項6または7に記載の画像処理方法。
  9.  前記視点補償ベクトル取得において、前記視点補償ベクトルとして、前記対象物を前記接地面に平行な方向から撮影して得られる画像上の座標と、前記魚眼画像上の座標と、の対応付けを記述したテーブルを取得する、
     請求項6から8のいずれか1項に記載の画像処理方法。
  10.  更に、前記撮像装置に取り付けられた角度センサから、前記撮像装置の光軸回りのロール角及び光軸のピッチ角を取得し、取得した前記ロール角及び前記ピッチ角に基づいて、前記視点補償ベクトルを算出する、
     請求項6から9のいずれか1項に記載の画像処理方法。
  11.  コンピュータに、
     対象物が写った魚眼画像を取得する魚眼画像取得処理と、
     前記対象物の接地面に平行な面を基準とした、撮像装置の光軸回りのロール角及び光軸のピッチ角に基づいて、前記魚眼画像を、前記対象物を前記接地面に平行な方向から撮影して得られる画像に変換するための、視点補償ベクトルを取得する視点補償ベクトル取得処理と、
     前記視点補償ベクトルを用いて変換された前記魚眼画像に対して、その水平方向に沿って、前記接地面に平行な視点を複数設定し、
     設定された前記視点毎に、変換後の前記魚眼画像に対して、当該視点からの視線を軸に含む座標系に基づいて、透視投影近似による歪み補正を行ない、
     補正後の前記魚眼画像それぞれから抽出された垂直方向の画像要素を用いて、1つの正規化画像を生成する画像生成処理と、
     を実行させるプログラムを記憶する記憶媒体。
  12.  前記画像生成処理は、
     生成される前記正規化画像の水平方向の全画素数に応じて、前記視点を設定し、
     更に、前記視点毎に、歪み補正を行なった後に、補正後の前記魚眼画像を垂直方向に切り出して、当該視点からの視線が入射するスライス画像を抽出し、
     抽出した前記スライス画像それぞれを、予め定めた順序で、水平方向に配置して、1つの正規化画像を生成する、
     請求項11に記載の記憶媒体。
  13.  前記画像生成処理は、
     視点毎の透視投影近似による歪み補正において、前記座標系における投影平面の原点に対する距離を、
     生成される前記正規化画像のサイズ、前記正規化画像の水平方向における視野角の範囲、及び前記正規化画像のアスペクト比に基づいて決定する、
     請求項11または12に記載の記憶媒体。
  14.  前記視点補償ベクトル取得処理は、前記視点補償ベクトルとして、前記対象物を前記接地面に平行な方向から撮影して得られる画像上の座標と、前記魚眼画像上の座標と、の対応付けを記述したテーブルを取得する、
     請求項11から13のいずれか1項に記載の記憶媒体。
  15.  前記プログラムは、コンピュータに、
     前記撮像装置に取り付けられた角度センサから、前記撮像装置の光軸回りのロール角及び光軸のピッチ角を取得し、取得した前記ロール角及び前記ピッチ角に基づいて、前記視点補償ベクトルを算出する視点補償ベクトル生成処理を更に実行させる、
     請求項11から14のいずれか1項に記載の記憶媒体。
PCT/JP2017/021824 2016-06-17 2017-06-13 画像処理装置、画像処理方法、及び記憶媒体 WO2017217411A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2018509865A JP6330987B2 (ja) 2016-06-17 2017-06-13 画像処理装置、画像処理方法、及び記憶媒体
US15/753,741 US10269092B2 (en) 2016-06-17 2017-06-13 Image processing device, image processing method, and storage medium

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2016120984 2016-06-17
JP2016-120984 2016-06-17

Publications (1)

Publication Number Publication Date
WO2017217411A1 true WO2017217411A1 (ja) 2017-12-21

Family

ID=60663696

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2017/021824 WO2017217411A1 (ja) 2016-06-17 2017-06-13 画像処理装置、画像処理方法、及び記憶媒体

Country Status (3)

Country Link
US (1) US10269092B2 (ja)
JP (1) JP6330987B2 (ja)
WO (1) WO2017217411A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020507879A (ja) * 2018-01-15 2020-03-12 株式会社ストリス 魚眼レンズおよび全方位映像の歪み除去のための装置および方法
JP2020068513A (ja) * 2018-10-26 2020-04-30 キヤノン株式会社 画像処理装置および画像処理方法
JP2022522638A (ja) * 2019-02-15 2022-04-20 トヨタ モーター ヨーロッパ 画像正規化のためのシステムと方法

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105791882B (zh) * 2016-03-22 2018-09-18 腾讯科技(深圳)有限公司 视频编码方法及装置
US10999602B2 (en) 2016-12-23 2021-05-04 Apple Inc. Sphere projected motion estimation/compensation and mode decision
US11259046B2 (en) 2017-02-15 2022-02-22 Apple Inc. Processing of equirectangular object data to compensate for distortion by spherical projections
US10924747B2 (en) 2017-02-27 2021-02-16 Apple Inc. Video coding techniques for multi-view video
US11093752B2 (en) 2017-06-02 2021-08-17 Apple Inc. Object tracking in multi-view video
US20190005709A1 (en) * 2017-06-30 2019-01-03 Apple Inc. Techniques for Correction of Visual Artifacts in Multi-View Images
US10754242B2 (en) 2017-06-30 2020-08-25 Apple Inc. Adaptive resolution and projection format in multi-direction video
WO2019009750A1 (en) * 2017-07-05 2019-01-10 Huawei Technologies Co., Ltd APPARATUS AND METHOD FOR PANORAMIC VIDEO CODING
KR102442449B1 (ko) * 2017-09-01 2022-09-14 삼성전자주식회사 영상 처리 장치, 영상 처리 방법 및 컴퓨터 판독가능 기록 매체
JP6688277B2 (ja) * 2017-12-27 2020-04-28 本田技研工業株式会社 プログラム、学習処理方法、学習モデル、データ構造、学習装置、および物体認識装置
JP6795637B2 (ja) * 2019-02-20 2020-12-02 ミネベアミツミ株式会社 アンテナ装置、及び、給電装置
CN111612812B (zh) * 2019-02-22 2023-11-03 富士通株式会社 目标物检测方法、检测装置和电子设备
JP7192582B2 (ja) * 2019-03-11 2022-12-20 オムロン株式会社 物体追跡装置および物体追跡方法
CN112116530B (zh) * 2019-06-19 2023-08-18 杭州海康威视数字技术股份有限公司 鱼眼图像畸变矫正方法、装置和虚拟显示系统
US11797854B2 (en) * 2019-07-08 2023-10-24 Sony Semiconductor Solutions Corporation Image processing device, image processing method and object recognition system
CN110728622B (zh) * 2019-10-22 2023-04-25 珠海研果科技有限公司 鱼眼图像处理方法、装置、电子设备及计算机可读介质
CN111127361B (zh) * 2019-12-24 2023-07-28 中山大学 一种面向视频拼接的透视畸变矫正方法
US11699216B2 (en) * 2020-03-09 2023-07-11 Nec Corporation Automatic fisheye camera calibration for video analytics
NL2025575B1 (en) * 2020-05-13 2021-11-30 Microsoft Technology Licensing Llc Correcting distortion from camera pitch angle
CN111861904A (zh) * 2020-06-16 2020-10-30 浙江大华技术股份有限公司 等比例鱼眼矫正方法、装置和计算机设备和可读存储介质
US11978177B2 (en) * 2020-09-25 2024-05-07 Intel Corporation Method and system of image processing of omnidirectional images with a viewpoint shift
CN112668505A (zh) * 2020-12-30 2021-04-16 北京百度网讯科技有限公司 基于路侧相机的外参的三维感知信息获取方法和路侧设备
US11663704B2 (en) 2021-04-28 2023-05-30 Microsoft Technology Licensing, Llc Distortion correction via modified analytical projection
US20220392109A1 (en) * 2021-06-07 2022-12-08 Qualcomm Incorporated Methods and apparatus for dynamic distortion correction
US20230230379A1 (en) * 2022-01-19 2023-07-20 Target Brands, Inc. Safety compliance system and method

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005086279A (ja) * 2003-09-04 2005-03-31 Equos Research Co Ltd 撮像装置、及び撮像装置を備えた車両
JP2007249967A (ja) * 2006-03-10 2007-09-27 Sony Taiwan Ltd 広角画像用遠近補正カメラ移動方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6833843B2 (en) * 2001-12-03 2004-12-21 Tempest Microsystems Panoramic imaging and display system with canonical magnifier
US7058237B2 (en) * 2002-06-28 2006-06-06 Microsoft Corporation Real-time wide-angle image correction system and method for computer image viewing
WO2006040687A2 (en) * 2004-07-19 2006-04-20 Grandeye, Ltd. Automatically expanding the zoom capability of a wide-angle video camera
JP4629131B2 (ja) 2008-09-03 2011-02-09 大日本印刷株式会社 画像変換装置
JP5569329B2 (ja) 2010-10-15 2014-08-13 大日本印刷株式会社 会議システム、監視システム、画像処理装置、画像処理方法及び画像処理プログラム等
US10652466B2 (en) * 2015-02-16 2020-05-12 Applications Solutions (Electronic and Vision) Ltd Method and device for stabilization of a surround view image

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005086279A (ja) * 2003-09-04 2005-03-31 Equos Research Co Ltd 撮像装置、及び撮像装置を備えた車両
JP2007249967A (ja) * 2006-03-10 2007-09-27 Sony Taiwan Ltd 広角画像用遠近補正カメラ移動方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020507879A (ja) * 2018-01-15 2020-03-12 株式会社ストリス 魚眼レンズおよび全方位映像の歪み除去のための装置および方法
JP2020068513A (ja) * 2018-10-26 2020-04-30 キヤノン株式会社 画像処理装置および画像処理方法
JP7249755B2 (ja) 2018-10-26 2023-03-31 キヤノン株式会社 画像処理システムおよびその制御方法、プログラム
JP2022522638A (ja) * 2019-02-15 2022-04-20 トヨタ モーター ヨーロッパ 画像正規化のためのシステムと方法
JP7316620B2 (ja) 2019-02-15 2023-07-28 トヨタ モーター ヨーロッパ 画像正規化のためのシステムと方法

Also Published As

Publication number Publication date
JP6330987B2 (ja) 2018-05-30
US10269092B2 (en) 2019-04-23
US20190012766A1 (en) 2019-01-10
JPWO2017217411A1 (ja) 2018-07-26

Similar Documents

Publication Publication Date Title
JP6330987B2 (ja) 画像処理装置、画像処理方法、及び記憶媒体
JP6891954B2 (ja) 物体検知装置、物体検知方法、及びプログラム
CN109561296B (zh) 图像处理装置、图像处理方法、图像处理系统和存储介质
US10594941B2 (en) Method and device of image processing and camera
JP6764533B2 (ja) キャリブレーション装置、キャリブレーション用チャート、チャートパターン生成装置、およびキャリブレーション方法
US8755624B2 (en) Image registration device and method thereof
WO2019035155A1 (ja) 画像処理システム、画像処理方法、及びプログラム
CN103839227B (zh) 鱼眼图像校正方法和装置
JP6874850B2 (ja) 物体検知装置、物体検知方法、及びプログラム
JP2007129709A (ja) イメージングデバイスをキャリブレートするための方法、イメージングデバイスの配列を含むイメージングシステムをキャリブレートするための方法およびイメージングシステム
JPH08233556A (ja) 撮像画像処理装置および撮像画像処理方法
JP6594170B2 (ja) 画像処理装置、画像処理方法、画像投影システムおよびプログラム
KR20140090775A (ko) 어안 렌즈를 사용하여 얻은 왜곡영상에 대한 보정방법 및 이를 구현하기 위한 영상 디스플레이 시스템
CN113538587A (zh) 一种相机坐标变换方法、终端以及存储介质
JP2011155412A (ja) 投影システムおよび投影システムにおける歪み修正方法
JP7298687B2 (ja) 物体認識装置及び物体認識方法
JP5955003B2 (ja) 画像処理装置および画像処理方法、プログラム
JP7474137B2 (ja) 情報処理装置およびその制御方法
JP2020004219A (ja) 3次元形状データを生成する装置、方法、及びプログラム
JP2002094849A (ja) 広視野画像撮像装置
JP2019205133A (ja) 画像処理装置、画像処理方法、画像投影システム、およびプログラム
WO2022044806A1 (ja) 情報処理装置および方法
JP6835665B2 (ja) 情報処理装置及びプログラム
CN115482182A (zh) 人脸深度图像的面部变形补偿方法、成像装置和存储介质
JP2001175860A (ja) フィードバック処理のある3次元物体認識装置及び方法並びに記録媒体

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref document number: 2018509865

Country of ref document: JP

Kind code of ref document: A

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17813307

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 17813307

Country of ref document: EP

Kind code of ref document: A1