WO2013190814A1 - 画像処理装置、撮像装置および画像処理プログラム - Google Patents

画像処理装置、撮像装置および画像処理プログラム Download PDF

Info

Publication number
WO2013190814A1
WO2013190814A1 PCT/JP2013/003750 JP2013003750W WO2013190814A1 WO 2013190814 A1 WO2013190814 A1 WO 2013190814A1 JP 2013003750 W JP2013003750 W JP 2013003750W WO 2013190814 A1 WO2013190814 A1 WO 2013190814A1
Authority
WO
WIPO (PCT)
Prior art keywords
image
parallax
viewpoint
pixel
image data
Prior art date
Application number
PCT/JP2013/003750
Other languages
English (en)
French (fr)
Inventor
石賀 健一
Original Assignee
株式会社ニコン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社ニコン filed Critical 株式会社ニコン
Priority to CN201380026360.2A priority Critical patent/CN104322061B/zh
Priority to JP2014520942A priority patent/JP6003983B2/ja
Publication of WO2013190814A1 publication Critical patent/WO2013190814A1/ja
Priority to US14/539,631 priority patent/US9723288B2/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/111Transformation of image signals corresponding to virtual viewpoints, e.g. spatial image interpolation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/97Determining parameters from multiple pictures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • G06T7/55Depth or shape recovery from multiple images
    • G06T7/593Depth or shape recovery from multiple images from stereo images
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/204Image signal generators using stereoscopic image cameras
    • H04N13/207Image signal generators using stereoscopic image cameras using a single 2D image sensor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/204Image signal generators using stereoscopic image cameras
    • H04N13/207Image signal generators using stereoscopic image cameras using a single 2D image sensor
    • H04N13/214Image signal generators using stereoscopic image cameras using a single 2D image sensor using spectral multiplexing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/282Image signal generators for generating image signals corresponding to three or more geometrical viewpoints, e.g. multi-view systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10012Stereo images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20228Disparity calculation for image-based rendering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N2013/0074Stereoscopic image analysis
    • H04N2013/0081Depth or disparity estimation from stereoscopic image signals

Definitions

  • the present invention relates to an image processing device, an imaging device, and an image processing program.
  • An image processing program acquires first image data corresponding to a first viewpoint acquired through an optical system at least partially shared, and second image data corresponding to a second viewpoint.
  • An image data acquisition step, and a ratio between a value obtained by adding and calculating the corresponding pixel values of the first image data and the second image data is calculated, and an evaluation relating to parallax between the first viewpoint and the second viewpoint
  • An evaluation data generation step for generating data corresponding to the first image data and the second image data is executed by a computer.
  • FIG. 1 is a diagram illustrating a configuration of a digital camera 10.
  • FIG. 2 is a diagram illustrating a cross-sectional configuration of an image sensor 100.
  • FIG. It is a figure explaining the concept of defocus in a pixel without parallax. It is a figure explaining the concept of defocus in a parallax pixel. It is a figure which shows the light intensity distribution of a parallax pixel and a parallax pixel. It is a figure explaining the opening shape of the opening part 104 in case there are two types of parallax pixels. It is a figure which shows the point image distribution of the object point which exists in a non-focusing area
  • the digital camera according to the present embodiment which is a form of the image processing apparatus and the imaging apparatus, is configured to be able to generate a left viewpoint image and a right viewpoint image for one scene by one shooting. Each image having a different viewpoint is called a parallax image.
  • FIG. 1 is a diagram illustrating a configuration of a digital camera 10 according to an embodiment of the present invention.
  • the digital camera 10 includes a photographic lens 20 as a photographic optical system, and guides a subject light beam incident along the optical axis 21 to the image sensor 100.
  • the photographing lens 20 may be an interchangeable lens that can be attached to and detached from the digital camera 10.
  • the digital camera 10 includes an image sensor 100, a control unit 201, an A / D conversion circuit 202, a memory 203, a drive unit 204, an image processing unit 205, a memory card IF 207, an operation unit 208, a display unit 209, and an LCD drive circuit 210. Prepare.
  • the A / D conversion circuit 202 converts the image signal output from the image sensor 100 into a digital image signal and outputs the digital image signal to the memory 203.
  • the image processing unit 205 performs various image processing using the memory 203 as a work space, and generates image data. For example, image data corresponding to the left viewpoint and image data corresponding to the right viewpoint are generated.
  • the image processing unit 205 also has general image processing functions such as adjusting image data according to the selected image format.
  • a series of shooting sequences is started when the operation unit 208 receives a user operation and outputs an operation signal to the control unit 201.
  • Various operations such as AF and AE accompanying the imaging sequence are executed under the control of the control unit 201.
  • the control unit 201 analyzes the evaluation data and executes focus control for moving a focus lens that forms a part of the photographing lens 20.
  • FIG. 2 is a schematic diagram showing a cross section of the image sensor 100 according to the embodiment of the present invention.
  • the imaging element 100 is configured by arranging a micro lens 101, a color filter 102, an aperture mask 103, a wiring layer 105, and a photoelectric conversion element 108 in order from the subject side.
  • the photoelectric conversion element 108 is configured by a photodiode that converts incident light into an electrical signal.
  • a plurality of photoelectric conversion elements 108 are two-dimensionally arranged on the surface of the substrate 109.
  • the image signal converted by the photoelectric conversion element 108, the control signal for controlling the photoelectric conversion element 108, and the like are transmitted / received via the wiring 106 provided in the wiring layer 105.
  • an opening mask 103 having openings 104 arranged in a one-to-one correspondence with each photoelectric conversion element 108 and repeatedly arranged two-dimensionally is provided in contact with the wiring layer.
  • the opening 104 is shifted for each corresponding photoelectric conversion element 108 so that the relative position is precisely determined.
  • parallax occurs in the subject light beam received by the photoelectric conversion element 108 by the action of the opening mask 103 including the opening 104.
  • the aperture mask 103 does not exist on the photoelectric conversion element 108 that does not generate parallax.
  • an aperture mask 103 having an aperture 104 that does not limit the subject luminous flux incident on the corresponding photoelectric conversion element 108, that is, allows the entire incident luminous flux to pass therethrough is provided.
  • the aperture 107 formed by the wiring 106 defines the incident light flux that is incident, so the wiring 106 is regarded as an aperture mask that allows the entire incident light flux that does not cause parallax to pass.
  • the opening mask 103 may be arranged separately and independently corresponding to each photoelectric conversion element 108, or may be formed collectively for a plurality of photoelectric conversion elements 108 in the same manner as the manufacturing process of the color filter 102. .
  • the color filter 102 is provided on the opening mask 103.
  • the color filter 102 is a filter provided in a one-to-one correspondence with each photoelectric conversion element 108, which is colored so as to transmit a specific wavelength band to each photoelectric conversion element 108.
  • a green filter (G filter) that transmits the green wavelength band
  • a blue filter (B filter) that transmits the blue wavelength band may be arranged in a grid pattern.
  • the color filter may be not only a combination of primary colors RGB, but also a combination of YCMg complementary color filters. A specific arrangement will be described later.
  • one unit of the aperture mask 103, the color filter 102, and the microlens 101 provided on a one-to-one basis corresponding to each photoelectric conversion element 108 is referred to as a pixel.
  • a pixel provided with the opening mask 103 that generates parallax is referred to as a parallax pixel
  • a pixel that is not provided with the opening mask 103 that generates parallax is referred to as a non-parallax pixel.
  • the effective pixel area of the image sensor 100 is about 24 mm ⁇ 16 mm, the number of pixels reaches about 12 million.
  • the microlens 101 may not be provided.
  • the wiring layer 105 is provided on the side opposite to the photoelectric conversion element 108.
  • the opening 104 of the opening mask 103 has a color component, the color filter 102 and the opening mask 103 can be formed integrally. Note that the color filter 102 is not provided when a monochrome image signal may be output.
  • the opening mask 103 and the wiring 106 are provided as separate bodies, but the wiring 106 may be responsible for the function of the opening mask 103 in the parallax pixels. That is, a prescribed opening shape is formed by the wiring 106, and the incident light beam is limited by the opening shape to guide only a specific partial light beam to the photoelectric conversion element 108. In this case, the wiring 106 that forms the opening shape is preferably closest to the photoelectric conversion element 108 in the wiring layer 105.
  • the opening mask 103 may be formed by a permeation blocking film provided to overlap the photoelectric conversion element 108.
  • the opening mask 103 is formed, for example, by sequentially laminating a SiN film and a SiO 2 film to form a permeation blocking film and removing a region corresponding to the opening 104 by etching.
  • FIG. 3 is a diagram for explaining the concept of defocus in a pixel without parallax.
  • FIG. 3A when an object point that is a subject exists at the focal position, the subject luminous flux that reaches the image sensor light receiving surface through the lens pupil is steep with the pixel at the corresponding image point as the center. The light intensity distribution is shown.
  • the subject luminous flux is received by the image sensor compared to the case where the object point exists at the focus position. It shows a gentle light intensity distribution on the surface. That is, the output value at the pixel of the corresponding image point is lowered, and a distribution having output values up to the peripheral pixels is shown.
  • FIG. 4 is a diagram for explaining the concept of defocusing in a parallax pixel.
  • the parallax Lt pixel and the parallax Rt pixel receive the subject luminous flux that arrives from one of the two parallax virtual pupils set as the optical axis target as a partial region of the lens pupil.
  • a method of capturing a parallax image by receiving subject light fluxes that arrive from different virtual pupils in a single lens pupil is referred to as a monocular pupil division imaging method.
  • the light intensity indicated by the parallax Lt pixel is greater than when the object point exists at the focal position.
  • the distribution peak appears at a position away from the pixel corresponding to the image point in one direction, and its output value decreases.
  • the width of the pixel having the output value is increased. That is, since the point image spreads in the horizontal direction of the light receiving surface of the image sensor, the amount of blur increases.
  • the peak of the light intensity distribution indicated by the parallax Rt pixel appears at a position away from the pixel corresponding to the image point in the opposite direction to the one direction in the parallax Lt pixel and at an equal distance, and the output value similarly decreases. Similarly, the width of the pixel having the output value is increased. That is, the same light intensity distribution that is gentler than that in the case where the object point exists at the focal position appears at an equal distance from each other.
  • the shift amount between the peaks of the light intensity distribution indicated by the parallax Lt pixel and the parallax Rt pixel corresponds to the parallax amount.
  • the light intensity indicated by the parallax Rt pixel is opposite to the state of FIG.
  • the distribution peak appears at a position away from the pixel corresponding to the image point in the one direction.
  • the peak of the light intensity distribution indicated by the parallax Lt pixel appears at a position away from the one direction in the parallax Rt pixel. That is, it is determined in which direction the peak of the light intensity distribution indicated by the parallax Lt pixel and the parallax Rt pixel appears in the direction away from the pixel corresponding to the image point according to the direction of deviation of the object point.
  • FIG. 5 is a graph showing the change in the light intensity distribution explained in FIG. 3 and the change in the light intensity distribution explained in FIG.
  • FIG. 5 is a diagram illustrating the light intensity distribution of the non-parallax pixel and the parallax pixel.
  • the horizontal axis represents the pixel position, and the center position is the pixel position corresponding to the image point.
  • the vertical axis represents the output value of each pixel. Since this output value is substantially proportional to the light intensity, it is shown as the light intensity in the figure.
  • FIG. 5B is a graph showing changes in the light intensity distribution described in FIG.
  • a distribution curve 1804 and a distribution curve 1805 represent the light intensity distribution of the parallax Lt pixel and the light intensity distribution of the parallax Rt pixel in FIG. 4B, respectively. As can be seen from the figure, these distributions have a line-symmetric shape with respect to the center position. Further, a combined distribution curve 1806 obtained by adding them shows a similar shape to the distribution curve 1802 of FIG. 3B which is in a defocus state equivalent to that of FIG.
  • the distribution curve 1807 and the distribution curve 1808 respectively represent the light intensity distribution of the parallax Lt pixel and the light intensity distribution of the parallax Rt pixel in FIG. As can be seen from the figure, these distributions are also symmetrical with respect to the center position. Further, a combined distribution curve 1809 obtained by adding them shows a similar shape to the distribution curve 1803 in FIG. 3C which is in a defocus state equivalent to that in FIG. Note that the light intensity distribution of the parallax Lt pixel and the light intensity distribution of the parallax Rt pixel in FIG. 4D are interchanged with the positions of the light intensity distribution of the parallax Lt pixel and the light intensity distribution of the parallax Rt pixel in FIG. Therefore, they correspond to the distribution curve 1808 and the distribution curve 1807, respectively.
  • FIG. 6 is a diagram illustrating the opening shape of the opening 104 when there are two types of parallax pixels.
  • the shape of the opening 104l of the parallax Lt pixel and the shape of the opening 104r of the parallax Rt pixel are respectively obtained by dividing the shape of the opening 104n of the non-parallax pixel by the center line 322. The example which is the same is shown. That is, in FIG. 6A, the area of the opening 104n of the non-parallax pixel is the sum of the area of the opening 104l of the parallax Lt pixel and the area of the opening 104r of the parallax Rt pixel.
  • the opening 104n of the non-parallax pixel is referred to as a full-opening opening, and the opening 104l and the opening 104r are referred to as half-opening openings.
  • the opening 104l of the parallax Lt pixel and the opening 104r of the parallax Rt pixel are displaced in opposite directions with respect to a virtual center line 322 passing through the center (pixel center) of the corresponding photoelectric conversion element 108. Yes. Accordingly, the opening 104l of the parallax Lt pixel and the opening 104r of the parallax Rt pixel each generate parallax in one direction with respect to the center line 322 and in the other direction opposite to the one direction.
  • FIG. 6B shows a light intensity distribution when the object point is deviated from the focal position in the direction away from the light receiving surface of the image sensor in the pixel having each opening shown in FIG.
  • the horizontal axis represents the pixel position
  • the center position is the pixel position corresponding to the image point.
  • the curve Lt corresponds to the distribution curve 1804 in FIG. 5B
  • the curve Rt corresponds to the distribution curve 1805 in FIG.
  • a curve N corresponds to a pixel without parallax, and shows a similar shape to the combined distribution curve 1806 in FIG.
  • Each of the openings 104n, 104l, and 104r functions as an aperture stop.
  • the blur width of the non-parallax pixel having the opening 104n having an area double the opening 104l (opening 104r) is the Lt pixel and the parallax Rt pixel indicated by the composite distribution curve 1806 in FIG. It is about the same as the blur width of the added curve.
  • FIG. 6C shows the light intensity distribution when the object point deviates from the focal position in the direction approaching the image sensor light receiving surface in the pixel having each opening shown in FIG. 6A.
  • the horizontal axis represents the pixel position
  • the center position is the pixel position corresponding to the image point.
  • the curves Lt and Rt in FIG. 6C maintain the relationship that the blur width of the non-parallax pixel having the opening 104n is approximately the same as the blur width of the curve obtained by adding the Lt pixel and the parallax Rt pixel. The positional relationship is reversed with respect to the curve Lt and the curve Rt in FIG.
  • the concept of the parallax detection method will be described. As will be described in detail later, in the monocular pupil division imaging method, the amount of parallax is detected equivalently by estimating the blur width of the subject image.
  • FIG. 7 is a diagram showing a point image distribution of object points existing in the out-of-focus area.
  • the horizontal axis represents the pixel position
  • the center position is the pixel position corresponding to the image point.
  • the vertical axis represents the pixel value.
  • 7A and 7B, the left viewpoint point image distribution Lt and the right viewpoint point image distribution Rt are in the horizontal direction when the left and right parallax pixel openings shown in FIG. 6 are half openings.
  • the blur width is shown.
  • the arithmetic mean of the left viewpoint point image distribution Lt and the right viewpoint point image distribution Rt is also expressed as a function of the pixel position x. For example, at the pixel position x1, since Lt and Rt have pixel values, the calculation result is a positive value. At the pixel position x2, Lt does not have a pixel value, but Rt has a pixel value, so that the calculation result is still a positive value. As described above, when calculating the arithmetic mean, if either Lt or Rt has a pixel value, the calculation result is a positive value.
  • the arithmetic mean of the point image distribution Lt and the point image distribution Rt at each pixel position is the sum of the spread widths of the point image distributions Lt and Rt as shown in FIG. This corresponds to the blur width corresponding to the non-parallax pixel having the openings of all the openings shown in FIG.
  • the geometric mean of the point image distribution Lt at the left viewpoint and the point image distribution Rt at the right viewpoint is also expressed as a function of the pixel position x. For example, at the pixel position x1, since Lt and Rt have pixel values, the calculation result is a positive value. On the other hand, at the pixel position x2, although Rt has a pixel value, Lt does not have a pixel value, so the calculation result is 0. As described above, when calculating the geometric mean, if both Lt and Rt have pixel values, the calculation result is a positive value.
  • the geometric mean of the point image distribution Lt and the point image distribution Rt at each pixel position is a product of the spread widths of the point image distributions Lt and Rt as shown in FIG. 7B as a whole.
  • the spread range of the geometric mean is narrower than the arithmetic mean and becomes relatively smaller as the amount of parallax increases, so it can be said that there is a correlation with the amount of parallax.
  • the geometric mean is an example of a calculation for capturing the product of the spread widths of the point image distributions Lt and Rt. Other computations may be used as long as the product of the spread widths of the point spreads Lt and Rt can be captured.
  • an image can be said to be an integration of point images for each object point. Therefore, the blur of the image can be considered in the same manner as the blur of the point image distribution described above.
  • the blur width and parallax amount of the subject image are affected by optical conditions. For example, when the aperture value is shot at F1.4, the blur width is wider than when the aperture value is shot at F8. That is, the blur width is affected by the aperture value at the time of shooting. In addition, when the aperture value is shot at F1.4, the amount of parallax becomes larger than when shot at F8. That is, the amount of parallax is also affected by the aperture value at the time of shooting. Accordingly, the blur width and the amount of parallax differ depending on the aperture value. When the ratio of the arithmetic mean and the geometric mean is taken for each pixel, a parallax amount corresponding to the aperture value is calculated. Information regarding the ratio of the blur width of the subject image expresses distance information from the focal plane when the relationship shown in FIG. 4 is used.
  • the ratio between the arithmetic mean and the geometric mean increases as the parallax increases.
  • the arithmetic mean and the geometric mean correspond to the sum and product relationship.
  • the point image distribution of the left parallax and the point image distribution of the right parallax match, so the results of the arithmetic mean and the geometric mean also match. Therefore, the value of the ratio of the arithmetic mean and the geometric mean is 1 or more.
  • the value of the ratio of the arithmetic mean and the geometric mean is 1 at the in-focus position, and the value increases as the subject is farther from the in-focus position.
  • the ratio value is within a range of about 2 at the maximum.
  • a subject image located in front of the subject image located at the focal position of the optical system is blurred on the right side in the left parallax image and on the left side in the right parallax image.
  • the subject image in the back is blurred on the left side in the left parallax image and on the right side in the right parallax image.
  • a signed parallax map can be obtained by newly defining the following quantities. As shown on the right side of (Equation 10), by multiplying the ratio of the difference between parallax images and the geometric mean by the sign of the first derivative, the sign of the ratio can be corrected.
  • sign (x) is as shown in the following (Formula 11).
  • the image processing unit 205 generates a disparity map using (Expression 2), but here generates an unsigned disparity map using (Expression 5). That is, the intensity distribution of positive values of 0 or more in (Expression 5) is used as the parallax map.
  • (Formula 5) is as follows.
  • FIG. 11 shows a display example of a parallax map when (Equation 5) is used.
  • (Expression 5) a parallax map that changes on a scale that is obtained by squaring the ratio of the blur width of the arithmetic mean and the geometric mean is extracted. Therefore, the edge portions of the rectangle 301 and the circle 303 shown in FIG. 11 are more emphasized than the edge portions of the rectangle 301 and the circle 303 shown in FIG.
  • the image processing unit 205 generates a signed parallax map using (Equation 10). That is, the intensity distribution of the positive and negative values in (Expression 10) is used as the parallax map.
  • (Formula 10) is as follows.
  • FIG. 12 is a diagram illustrating a case where the intensity distribution of positive and negative values is a parallax map.
  • FIG. 12A shows a display example of a parallax map when (Equation 8) is used. In the edge portion, a positive value area is indicated by hatching in the lower right direction, and a negative value area is indicated by hatching in the lower left direction.
  • the square 301 exists in the front pin area.
  • the front pin area has a negative sign in an area where the background area changes from white in the background area to black in the rectangle 301 as it moves to the right in the horizontal direction, that is, in an area that becomes darker toward the right side.
  • a positive sign is obtained in a region where the black color of the rectangle 301 changes from black to white in the background region as it moves to the right in the horizontal direction, that is, a region that becomes brighter toward the right side.
  • the circle 303 exists in the back pin area.
  • a positive sign is obtained in an area where the white color of the background area changes from black in the background area 301 to the right in the horizontal direction.
  • the sign is negative.
  • a positive value and a negative value are mixed in each of the front pin region and the rear pin region.
  • FIG. 12B shows a display example of a parallax map when (Equation 10) is used.
  • the front pin area has a positive sign in the area where the white color of the background area changes from black in the background area 301 to the black in the horizontal direction, that is, in the area that becomes darker toward the right side.
  • a positive sign is obtained in an area where the black color of the square 301 changes from white to white in the background area as it moves to the right in the horizontal direction, that is, an area that becomes brighter toward the right side.
  • a negative sign is obtained in an area where the white color of the background area changes from black in the background area to the right in the horizontal direction.
  • the sign is negative.
  • only a positive value is obtained in the front pin region and only a negative value is obtained in the rear pin region. Since the anteroposterior relationship of the subject with respect to the in-focus position appears as the sign of the ratio value, the position of the subject can be determined. Therefore, the parallax map can also be used as information for guiding at the time of shooting.
  • horizontal differentiation can also be defined as follows in consideration of left-right symmetry.
  • disparity information can be captured not only for vertical line subject images but also for subject images that have a slight component in the vertical direction of diagonal lines.
  • the blur width is separated. It is only the completely horizontal subject image that no parallax information is generated. Accordingly, it is possible to extend in an oblique direction in which parallax can be detected as a differential of the subject image in the horizontal direction. That is, the horizontal differential can be defined as follows.
  • the monocular pupil division imaging method corresponds to the fact that the blur of the subject image increases as the parallax increases. The value becomes more stable.
  • D (x, y) shown in the first embodiment. That is, when Expression 14 is expanded in this way, the following (Expression 16) is obtained.
  • D is an integer value.
  • the image processing unit 205 generates a signed parallax map using (Equation 18). That is, only the code of (Equation 10) is taken out, and (Equation 2) is multiplied by the code. That is, the intensity distribution of the positive and negative values in (Equation 18) below is used as the parallax map.
  • the image processing unit 205 generates a signed parallax map using (Equation 19). That is, only the code of (Equation 10) is taken out, and (Equation 5) is multiplied by the code. In other words, the intensity distribution of the positive and negative values in (Equation 19) below is used as the parallax map.
  • Embodiment 4 can be inserted alternately on the right and left sides as the structure of the monocular lens, the left parallax image and the right in order of two exposures with respect to a normal monochrome imaging element with no parallax Also in the case of obtaining a parallax image, in Embodiment 1, 2) the interpolation processing at the time of generating the left and right parallax images is not necessary.
  • the same method as in the first embodiment is used.
  • FIG. 13 is a diagram showing variations of the pixel arrangement.
  • the image pickup devices 200 and 300 have 2 ⁇ 2 pixel patterns 120 and 130 indicated by thick lines in the drawing as a basic lattice.
  • a non-parallax pixel is assigned to the upper left pixel and the lower right pixel.
  • the parallax Lt pixel is assigned to the lower left pixel
  • the parallax Rt pixel is assigned to the upper right pixel.
  • the image sensor 300 employs a Bayer array. Specifically, the green filter is assigned to the upper left and lower right pixels, the red filter is assigned to the lower left pixel, and the blue filter is assigned to the upper right pixel. In the pattern 130, the parallax Lt pixel is assigned to the upper left pixel, and the parallax Rt pixel is assigned to the lower right pixel.
  • the point image distribution Lt of the left viewpoint + the point image distribution Rt of the right viewpoint the point image distribution N of pixels without parallax”.
  • the geometric mean value of Lt and Rt becomes 0, and the value of D (x, y) diverges. Therefore, it can be seen that there is no overlap between Lt and Rt when the value of D (x, y) diverges.
  • the parallax map is used as a guide during autofocus and shooting.
  • subjects are separated in the depth direction, and processing such as white balance is performed on each subject. May be performed.

Abstract

 1つの光学系を通して撮像された被写体像の第1視点方向の画像と第2視点方向の画像の少なくとも2つの視差画像を入力する手段と、各画素で第1視点方向の画像と第2視点方向の画像の間の相加平均と相乗平均を算出する手段と、各画素で相加平均と相乗平均の比を算出する手段と、比に基づいて第1視点方向の画像と第2視点方向の画像の間の視差量を各々の画素について算出する手段とを備えたことを特徴とする画像処理装置。

Description

画像処理装置、撮像装置および画像処理プログラム
 本発明は、画像処理装置、撮像装置および画像処理プログラムに関する。
 単一の撮影光学系を用いて、互いに視差を有する左右の視差画像を一度の撮影で生成する撮像装置が知られている。
[先行技術文献]
[特許文献]
  [特許文献1] 特開2003-7994号公報
 左右の視差に関する情報を生成する場合には、左右の視差画像におけるぼけ領域をパターンマッチングする必要がある。パターンマッチングは、視差画像におけるエッジ部分を利用して行われる。しかしながら、ぼけ領域ではエッジ部分が抑制されるので、パターンマッチングの精度が悪いという問題があった。
 本発明の第1の態様における画像処理装置は、1つの光学系を通して撮像された被写体像の第1視点方向の画像と第2視点方向の画像の少なくとも2つの視差画像を入力する手段と、各画素で第1視点方向の画像と第2視点方向の画像の間の相加平均と相乗平均を算出する手段と、各画素で相加平均と相乗平均の比を算出する手段と、比に基づいて第1視点方向の画像と第2視点方向の画像の間の視差量を各々の画素について算出する手段とを備える。
 本発明の第2の態様における画像処理装置は、1つの光学系を通して撮像された被写体像の第1視点方向の画像と第2視点方向の画像の少なくとも2つの視差画像を入力する手段と、各画素で第2視点方向の画像と第1視点方向の画像の間の差分を算出する手段と、第1視点方向の画像と第2視点方向の画像の平均値からなる中間視点の画像に対して、視点が変化する方向に成分をもつ一次微分を各々の画素について算出する手段と、差分の符号と一次微分の符号の積に基づいて、光学系の合焦位置より手前にある被写体像か奥にある被写体像かを区別する手段とを備える。
 本発明の第3の態様における画像処理装置は、少なくとも一部が共通する光学系を通して取得された第1視点に対応する第1画像データと、第2視点に対応する第2画像データを取得する画像データ取得部と、第1画像データと第2画像データの対応するそれぞれの画素値を加算演算した値と積算演算した値の比を算出して、第1視点と第2視点の視差に関する評価データを第1画像データおよび第2画像データに対応させて生成する評価データ生成部とを備える。
 本発明の第4の態様における撮像装置は、撮像素子と、上記の画像処理装置とを備える撮像装置であって、第1画像データおよび第2画像データは、撮像素子の出力に基づいて生成される。
 本発明の第5の態様における画像処理プログラムは、少なくとも一部が共通する光学系を通して取得された第1視点に対応する第1画像データと、第2視点に対応する第2画像データを取得する画像データ取得ステップと、第1画像データと第2画像データの対応するそれぞれの画素値を加算演算した値と積算演算した値の比を算出して、第1視点と第2視点の視差に関する評価データを第1画像データおよび第2画像データに対応させて生成する評価データ生成ステップとをコンピュータに実行させる。
 なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。
デジタルカメラ10の構成を説明する図である。 撮像素子100の断面の構成を説明する図である。 視差なし画素におけるデフォーカスの概念を説明する図である。 視差画素におけるデフォーカスの概念を説明する図である。 視差なし画素と視差画素の光強度分布を示す図である。 視差画素の種類が2つである場合における開口部104の開口形状を説明する図である。 非合焦領域に存在する物点の点像分布を示す図である。 画素配列の一例を示す図である。 撮影状況および撮影画像を説明するための図である。 正の値の強度分布を視差マップとした場合を説明する図である。 正の値の強度分布を視差マップとした場合を説明する図である。 正負の値の強度分布を視差マップとした場合を説明する図である。 画素配列のバリエーションを示す図である。
 以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
 画像処理装置および撮像装置の一形態である本実施形態に係るデジタルカメラは、1つのシーンについて左視点および右視点の画像を一度の撮影により生成できるように構成されている。互いに視点の異なるそれぞれの画像を視差画像と呼ぶ。
 図1は、本発明の実施形態に係るデジタルカメラ10の構成を説明する図である。デジタルカメラ10は、撮影光学系としての撮影レンズ20を備え、光軸21に沿って入射する被写体光束を撮像素子100へ導く。撮影レンズ20は、デジタルカメラ10に対して着脱できる交換式レンズであっても構わない。デジタルカメラ10は、撮像素子100、制御部201、A/D変換回路202、メモリ203、駆動部204、画像処理部205、メモリカードIF207、操作部208、表示部209、およびLCD駆動回路210を備える。
 なお、図示するように、撮像素子100へ向かう光軸21に平行な方向を+Z軸方向と定め、Z軸と直交する平面において紙面奥へ向かう方向を+X軸方向、紙面上方向+Y軸と定める。撮影における構図との関係は、X軸が水平方向、Y軸が垂直方向となる。以降のいくつかの図においては、図1の座標軸を基準として、それぞれの図の向きがわかるように座標軸を表示する。
 撮影レンズ20は、複数の光学レンズ群から構成され、シーンからの被写体光束をその焦点面近傍に結像させる。なお、図1では撮影レンズ20を説明の都合上、瞳近傍に配置された仮想的な1枚のレンズで代表して表している。撮像素子100は、撮影レンズ20の焦点面近傍に配置されている。撮像素子100は、二次元的に複数の光電変換素子が画素として配列された、例えばCCD、CMOSセンサ等のイメージセンサである。撮像素子100は、駆動部204によりタイミング制御されて、受光面上に結像された被写体像を画像信号に変換し、A/D変換回路202へ出力する。A/D変換回路202へ出力される画像信号は、左視点および右視点の画像信号を含む。
 A/D変換回路202は、撮像素子100が出力する画像信号をデジタル画像信号に変換してメモリ203へ出力する。画像処理部205は、メモリ203をワークスペースとして種々の画像処理を施し、画像データを生成する。例えば、左視点に対応する画像データと右視点に対応する画像データを生成する。画像処理部205は、他にも選択された画像フォーマットに従って画像データを調整するなどの画像処理一般の機能も担う。
 画像処理部205はさらに、左視点と右視点の視差に関する評価データを生成する。詳しくは後述するが、評価データは、合焦位置に対する被写体の奥行きに関する位置情報を示す視差マップデータと捉えることができる。
 画像処理部205によって生成された画像データは、LCD駆動回路210により表示信号に変換され、表示部209に表示される。評価データも表示部209に表示されてもよい。また、生成された画像データおよび評価データは、メモリカードIF207に装着されているメモリカード220に記録される。
 一連の撮影シーケンスは、操作部208がユーザの操作を受け付けて、制御部201へ操作信号を出力することにより開始される。撮影シーケンスに付随するAF,AE等の各種動作は、制御部201に制御されて実行される。例えば、制御部201は、評価データを解析して、撮影レンズ20の一部を構成するフォーカスレンズを移動させる合焦制御を実行する。
 次に、撮像素子100の構成について詳細に説明する。図2は、本発明の実施形態に係る撮像素子100の断面を表す概略図である。
 撮像素子100は、被写体側から順に、マイクロレンズ101、カラーフィルタ102、開口マスク103、配線層105および光電変換素子108が配列されて構成されている。光電変換素子108は、入射する光を電気信号に変換するフォトダイオードにより構成される。光電変換素子108は、基板109の表面に二次元的に複数配列されている。
 光電変換素子108により変換された画像信号、光電変換素子108を制御する制御信号等は、配線層105に設けられた配線106を介して送受信される。また、各光電変換素子108に一対一に対応して設けられ、二次元的に繰り返し配列された開口部104を有する開口マスク103が、配線層に接して設けられている。開口部104は、後述するように、対応する光電変換素子108ごとにシフトされて、相対的な位置が厳密に定められている。詳しくは後述するが、この開口部104を備える開口マスク103の作用により、光電変換素子108が受光する被写体光束に視差が生じる。
 一方、視差を生じさせない光電変換素子108上には、開口マスク103が存在しない。別言すれば、対応する光電変換素子108に対して入射する被写体光束を制限しない、つまり入射光束の全体を通過させる開口部104を有する開口マスク103が設けられているとも言える。視差を生じさせることはないが、実質的には配線106によって形成される開口107が入射する被写体光束を規定するので、配線106を、視差を生じさせない入射光束の全体を通過させる開口マスクと捉えることもできる。開口マスク103は、各光電変換素子108に対応して別個独立に配列しても良いし、カラーフィルタ102の製造プロセスと同様に複数の光電変換素子108に対して一括して形成しても良い。
 カラーフィルタ102は、開口マスク103上に設けられている。カラーフィルタ102は、各光電変換素子108に対して特定の波長帯域を透過させるように着色された、光電変換素子108のそれぞれに一対一に対応して設けられるフィルタである。カラー画像を出力するには、互いに異なる少なくとも2種類のカラーフィルタが配列されれば良いが、より高画質のカラー画像を取得するには3種類以上のカラーフィルタを配列すると良い。例えば赤色波長帯を透過させる赤フィルタ(Rフィルタ)、緑色波長帯を透過させる緑フィルタ(Gフィルタ)、および青色波長帯を透過させる青フィルタ(Bフィルタ)を格子状に配列すると良い。カラーフィルタは原色RGBの組合せのみならず、YCMgの補色フィルタの組合せであっても良い。具体的な配列については後述する。
 マイクロレンズ101は、カラーフィルタ102上に設けられている。マイクロレンズ101は、入射する被写体光束のより多くを光電変換素子108へ導くための集光レンズである。マイクロレンズ101は、光電変換素子108のそれぞれに一対一に対応して設けられている。マイクロレンズ101は、撮影レンズ20の瞳中心と光電変換素子108の相対的な位置関係を考慮して、より多くの被写体光束が光電変換素子108に導かれるようにその光軸がシフトされていることが好ましい。さらには、開口マスク103の開口部104の位置と共に、後述の特定の被写体光束がより多く入射するように配置位置が調整されても良い。
 このように、各々の光電変換素子108に対応して一対一に設けられる開口マスク103、カラーフィルタ102およびマイクロレンズ101の一単位を画素と呼ぶ。特に、視差を生じさせる開口マスク103が設けられた画素を視差画素、視差を生じさせる開口マスク103が設けられていない画素を視差なし画素と呼ぶ。例えば、撮像素子100の有効画素領域が24mm×16mm程度の場合、画素数は1200万程度に及ぶ。
 なお、集光効率、光電変換効率が良いイメージセンサの場合は、マイクロレンズ101を設けなくても良い。また、裏面照射型イメージセンサの場合は、配線層105が光電変換素子108とは反対側に設けられる。また、開口マスク103の開口部104に色成分を持たせれば、カラーフィルタ102と開口マスク103を一体的に形成することもできる。なお、白黒画像信号を出力すればよい場合にはカラーフィルタ102は設けない。
 また、本実施形態においては、開口マスク103と配線106を別体として設けているが、視差画素における開口マスク103の機能を配線106が担っても良い。すなわち、規定される開口形状を配線106により形成し、当該開口形状により入射光束を制限して特定の部分光束のみを光電変換素子108へ導く。この場合、開口形状を形成する配線106は、配線層105のうち最も光電変換素子108側であることが好ましい。
 また、開口マスク103は、光電変換素子108に重ねて設けられる透過阻止膜によって形成されても良い。この場合、開口マスク103は、例えば、SiN膜とSiO膜を順次積層して透過阻止膜とし、開口部104に相当する領域をエッチングで除去して形成される。
 次に、視差Lt画素および視差Rt画素が受光する場合のデフォーカスの概念を説明する。まず、視差なし画素におけるデフォーカスの概念について簡単に説明する図である。図3は、視差なし画素におけるデフォーカスの概念を説明する図である。図3(a)で示すように、被写体である物点が焦点位置に存在する場合、レンズ瞳を通って撮像素子受光面に到達する被写体光束は、対応する像点の画素を中心として急峻な光強度分布を示す。すなわち、レンズ瞳を通過する有効光束の全体を受光する視差なし画素が像点近傍に配列されていれば、像点に対応する画素の出力値が最も大きく、周辺に配列された画素の出力値は急激に低下する。
 一方、図3(b)に示すように、撮像素子受光面から遠ざかる方向に、物点が焦点位置からずれると、被写体光束は、物点が焦点位置に存在する場合に比べて、撮像素子受光面においてなだらかな光強度分布を示す。すなわち、対応する像点の画素における出力値が低下する上に、より周辺画素まで出力値を有する分布を示す。
 図3(c)に示すように、さらに物点が焦点位置からずれると、被写体光束は、撮像素子受光面においてよりなだらかな光強度分布を示す。すなわち、対応する像点の画素における出力値がさらに低下する上に、より周辺画素まで出力値を有する分布を示す。
 図3(d)に示すように、撮像素子受光面に近づく方向に、物点が焦点位置からずれた場合にも、撮像素子受光面から遠ざかる方向に物点がずれた場合と同じような光強度分布を示す。
 図4は、視差画素におけるデフォーカスの概念を説明する図である。視差Lt画素および視差Rt画素は、レンズ瞳の部分領域としてそれぞれ光軸対象に設定された2つの視差仮想瞳のいずれかから到達する被写体光束を受光する。本明細書において、単一のレンズ瞳における互いに異なる仮想瞳から到達する被写体光束を受光することによって視差画像を撮像する方式を単眼瞳分割撮像方式という。
 図4(a)で示すように、被写体である物点が焦点位置に存在する場合、いずれの視差仮想瞳を通った被写体光束であっても、対応する像点の画素を中心として急峻な光強度分布を示す。像点付近に視差Lt画素が配列されていれば、像点に対応する画素の出力値が最も大きく、周辺に配列された画素の出力値が急激に低下する。また、像点付近に視差Rt画素が配列されていても、像点に対応する画素の出力値が最も大きく、周辺に配列された画素の出力値が急激に低下する。すなわち、被写体光束がいずれの視差仮想瞳を通過しても、像点に対応する画素の出力値が最も大きく、周辺に配列された画素の出力値が急激に低下する分布を示し、それぞれの分布は互いに一致する。
 一方、図4(b)に示すように、撮像素子受光面から遠ざかる方向に、物点が焦点位置からずれると、物点が焦点位置に存在した場合に比べて、視差Lt画素が示す光強度分布のピークは、像点に対応する画素から一方向に離れた位置に現れ、かつその出力値は低下する。また、出力値を有する画素の幅も広がる。すなわち、撮像素子受光面の水平方向に対して点像の広がりを有することになるので、ぼけ量は増す。視差Rt画素が示す光強度分布のピークは、像点に対応する画素から、視差Lt画素における一方向とは逆向きかつ等距離に離れた位置に現れ、同様にその出力値は低下する。また、同様に出力値を有する画素の幅も広がる。すなわち、物点が焦点位置に存在した場合に比べてなだらかとなった同一の光強度分布が、互いに等距離に離間して現れる。視差Lt画素および視差Rt画素が示す光強度分布のピーク間のずれ量は、視差量に相当する。
 また、図4(c)に示すように、さらに物点が焦点位置からずれると、図4(b)の状態に比べて、さらになだらかとなった同一の光強度分布が、より離間して現れる。点像の広がりがより大きくなるので、ぼけ量は増す。また、視差Lt画素および視差Rt画素が示す光強度分布のピーク間のずれも大きくなっているので、視差量も増す。つまり、物点が焦点位置から大きくずれる程、ぼけ量と視差量が増すと言える。
 図4(d)に示すように、撮像素子受光面に近づく方向に、物点が焦点位置からずれた場合には、図4(c)の状態とは逆に、視差Rt画素が示す光強度分布のピークは、像点に対応する画素から上記一方向に離れた位置に現れる。視差Lt画素が示す光強度分布のピークは、視差Rt画素における一方向とは逆向きに離れた位置に現れる。すなわち、物点のずれの方向に応じて、視差Lt画素および視差Rt画素が示す光強度分布のピークが、像点に対応する画素からどちらの方向に離れた位置に現れるかが決まる。
 図3で説明した光強度分布の変化と、図4で説明した光強度分布の変化をそれぞれグラフ化すると、図5のように表される。図5は、視差なし画素と視差画素の光強度分布を示す図である。図において、横軸は画素位置を表し、中心位置が像点に対応する画素位置である。縦軸は各画素の出力値を表し、この出力値は実質的に光強度に比例するので、図においては光強度として示す。
 なお、上述のように、撮像素子受光面に近づく方向に、物点が焦点位置からずれた場合も、撮像素子受光面から遠ざかる方向に物点がずれた場合と同じような光強度分布を示すので、図において、撮像素子受光面に近づく方向にずれた場合の光強度分布の変化を省略している。撮像素子受光面に近づく方向に、物点が焦点位置からずれた場合の視差Lt画素および視差Rt画素が示す光強度分布のピークについても、撮像素子受光面から遠ざかる方向に物点がずれた場合の視差Lt画素および視差Rt画素が示す光強度分布のピークと同様であるので、省略している。
 図5(a)は、図3で説明した光強度分布の変化を表すグラフである。分布曲線1801は、図3(a)に対応する光強度分布を表し、最も急峻な様子を示す。分布曲線1802は、図3(b)に対応する光強度分布を表し、また、分布曲線1803は、図3(c)に対応する光強度分布を表す。分布曲線1801に比較して、徐々にピーク値が下がり、広がりを持つ様子がわかる。
 図5(b)は、図4で説明した光強度分布の変化を表すグラフである。分布曲線1804と分布曲線1805は、それぞれ図4(b)の視差Lt画素の光強度分布と視差Rt画素の光強度分布を表す。図からわかるように、これらの分布は中心位置に対して線対称の形状を成す。また、これらを足し合わせた合成分布曲線1806は、図4(b)に対して同等のデフォーカス状態である図3(b)の分布曲線1802と相似形状を示す。
 分布曲線1807と分布曲線1808は、それぞれ図4(c)の視差Lt画素の光強度分布と視差Rt画素の光強度分布を表す。図からわかるように、これらの分布も中心位置に対して線対称の形状を成す。また、これらを足し合わせた合成分布曲線1809は、図4(c)に対して同等のデフォーカス状態である図3(c)の分布曲線1803と相似形状を示す。なお、図4(d)の視差Lt画素の光強度分布と視差Rt画素の光強度分布は、図4(c)の視差Lt画素の光強度分布と視差Rt画素の光強度分布の位置を入れ替えた関係になるので、それぞれ分布曲線1808と分布曲線1807に相当する。
 図6は、視差画素の種類が2つである場合における開口部104の開口形状を説明する図である。図6(a)は、視差Lt画素の開口部104lの形状と、視差Rt画素の開口部104rの形状とが、視差なし画素の開口部104nの形状を中心線322で分割したそれぞれの形状と同一である例を示している。つまり、図6(a)では、視差なし画素の開口部104nの面積は、視差Lt画素の開口部104lの面積と視差Rt画素の開口部104rの面積の和になっている。本実施形態においては、視差なし画素の開口部104nを全開口の開口部といい、開口部104lおよび開口部104rを半開口の開口部という。視差Lt画素の開口部104lおよび視差Rt画素の開口部104rは、それぞれ対応する光電変換素子108の中心(画素中心)を通る仮想的な中心線322に対して、互いに反対方向に偏位している。したがって、視差Lt画素の開口部104lおよび視差Rt画素の開口部104rはそれぞれ、中心線322に対する一方向、当該一方向とは反対の他方向に視差を生じさせる。
 図6(b)は、図6(a)で示した各開口部を有する画素において、撮像素子受光面から遠ざかる方向に、物点が焦点位置からずれた場合の光強度分布を示す。図中において、横軸は画素位置を表し、中心位置が像点に対応する画素位置である。また、曲線Ltは図5(b)の分布曲線1804、曲線Rtは図5(b)の分布曲線1805にそれぞれ相当する。曲線Nは視差なし画素に対応しており、図5(b)の合成分布曲線1806と相似形状を示す。また、それぞれの開口部104n、開口部104l、開口部104rは、開口絞りとしての機能を発揮する。したがって、開口部104l(開口部104r)の倍の面積を持つ開口部104nを有する視差なし画素のぼけ幅は、図5(b)の合成分布曲線1806で示される、Lt画素と視差Rt画素を足し合わせた曲線のぼけ幅と同程度となる。
 図6(c)は、図6(a)で示した各開口部を有する画素において、撮像素子受光面に近づく方向に、物点が焦点位置からずれた場合の光強度分布を示す。図において、横軸は画素位置を表し、中心位置が像点に対応する画素位置である。図6(c)の曲線Lt、曲線Rtは、開口部104nを有する視差なし画素のぼけ幅がLt画素と視差Rt画素を足し合わせた曲線のぼけ幅と同程度となるという関係を維持しつつ、図6(b)の曲線Lt、曲線Rtに対して位置関係が逆転している。
 次に、視差の検出方法の考え方について述べる。詳しくは後述するが、単眼瞳分割撮像方式では、被写体像のぼけ幅を推定すれば等価的に視差量を検知したことになる。
 図7は、非合焦領域に存在する物点の点像分布を示す図である。図において、横軸は画素位置を表し、中心位置が像点に対応する画素位置である。縦軸は、画素値を表す。図7(a)、(b)では、左視点の点像分布Ltと右視点の点像分布Rtは、図6で示した左右の視差画素の開口部が半開口である場合における、水平方向のぼけ幅を示している。
 図7(a)の左視点の点像分布Ltと右視点の点像分布Rtは、画素位置xの関数で表される。左視点の点像分布Ltと右視点の点像分布Rtの相加平均も画素位置xの関数で表される。例えば、画素位置x1においては、LtもRtも画素値を持つので、演算結果は正の値となる。画素位置x2においては、Ltは画素値を持たないものの、Rtは画素値を持つので、演算結果はやはり正の値となる。以上のように、相加平均を算出する場合には、LtとRtのいずれかが画素値を持てば、その演算結果は正の値となる。したがって、各画素位置における点像分布Ltと点像分布Rtの相加平均は、全体としてみると、図7(a)に示すように、点像分布LtおよびRtの広がり幅の和となる。これは、図6で示した全開口の開口部を有する視差なし画素に対応したぼけ幅に相当する。
 なお、相加平均は、点像分布LtおよびRtの広がり幅の和を捉えるための演算の一例である。点像分布LtおよびRtの広がり幅の和を捉えることができるのであれば、他の演算を利用してもよい。
 左視点の点像分布Ltと右視点の点像分布Rtの相乗平均も画素位置xの関数で表される。例えば、画素位置x1においては、LtもRtも画素値を持つので、演算結果は正の値となる。一方、画素位置x2においては、Rtは画素値を持つものの、Ltは画素値を持たないので、演算結果は0となる。以上のように、相乗平均を算出する場合には、LtとRtのいずれもが画素値を持つ場合に、その演算結果は正の値となる。したがって、各画素位置における点像分布Ltと点像分布Rtの相乗平均は、全体としてみると、図7(b)に示すように、点像分布LtおよびRtの広がり幅の積となる。相乗平均の広がり幅は、相加平均に比べて狭くなり、視差量が増えると相対的に更に小さくなるので、視差量に相関を持つといえる。
 なお、相乗平均は、点像分布LtおよびRtの広がり幅の積を捉えるための演算の一例である。点像分布LtおよびRtの広がり幅の積を捉えることができるのであれば、他の演算を利用してもよい。なお、一般的に、被写体は物点の集合と考えることができるので、画像は各物点に対する点像の積分ということができる。よって、画像のぼけは、上述した点像分布のぼけと同様に考えることができる。
Figure JPOXMLDOC01-appb-I000001
 また、被写体像のぼけ幅、視差量は、光学的な条件に影響される。例えば、絞り値をF1.4で撮影した場合は、F8で撮影した場合よりぼけ幅は広くなる。つまり、ぼけ幅は、撮影時の絞り値に影響される。また、絞り値をF1.4で撮影した場合は、F8で撮影した場合より視差量は大きくなる。つまり、視差量も撮影時の絞り値に影響される。したがって、ぼけ幅および視差量のそれぞれは、絞り値によって差が生じる。各画素において相加平均と相乗平均の比を取ると、絞り値に応じた視差量が算出される。被写体像のぼけ幅の比に関する情報は、図4に示した関係を用いると、焦点面からの距離情報を表現することになる。
 単眼瞳分割撮像方式に固有の特性である、ぼけ幅が大きくなるほど視差が大きくなる性質を考えると、視差が大きくなるほど相加平均と相乗平均の比が大きくなるといえる。相加平均と相乗平均は、和と積の関係に相当するからである。合焦位置の被写体では、左視差の点像分布と右視差の点像分布が一致するので、相加平均と相乗平均の結果も一致する。したがって、相加平均と相乗平均の比の値は、1以上となる。相加平均と相乗平均の比の値が1になるのは合焦位置であり、合焦位置から離れた被写体になるほど、その値は大きくなる。実験的に、視差が最も大きくなるレンズの絞りを開放位置に持ってきた条件で求めてみると、最大でもその比の値は、2程度の範囲に収まる。
 したがって、下記の(式2)を定義すると、合焦位置では視差がゼロで、非合焦位置では視差の値が大きくなる指標が得られる。ここでは、合焦位置における相加平均と相乗平均の比の値(基準値)が0となるよう、相加平均と相乗平均の比の値を-1している。
Figure JPOXMLDOC01-appb-M000001
 (式2)は、各画素の2次元マップを表すので、そのまま視差マップとして定義することができる。(式2)の右辺における第1項の分子は、全開口の画素のぼけ幅を表し、分母は半開口の画素のぼけ幅を表していると考えると、以下のような2つの比もぼけ幅の比を捉えていると考えることができる。
Figure JPOXMLDOC01-appb-M000002
Figure JPOXMLDOC01-appb-M000003
 ただし、式(3)、(4)では、画像構造に関する情報は完全に排除されていない。なぜなら、分母と分子の間で視差が存在するため同じ画素位置で異なる被写体の画像構造の比をとっている。そこで、画像構造に関する情報を排除するために、以下のような2つの共役な式を定義する。
Figure JPOXMLDOC01-appb-M000004
Figure JPOXMLDOC01-appb-M000005
 (式5)と(式6)は、(式2)を用いて表すことができる。
Figure JPOXMLDOC01-appb-M000006
Figure JPOXMLDOC01-appb-M000007
 (式7)の右辺に着目すると、相加平均と相乗平均のぼけ幅の比を二乗したようなスケールで変化する視差マップを抽出している。(式8)の右辺に着目すると、第2項で相加平均と相乗平均のぼけ幅の比を捉えつつ、第1項では画像構造に関する要因を分母で排除しながら、左視差画像と右視差画像の信号変化に起因した何らかの符号要因を分子で捉えている。
 一般に、立体撮像光学系において、光学系の焦点位置に位置する被写体像に対して、それより手前にある被写体像は、左視差画像においては右側に、右視差画像においては左側に像がぶれる。一方、それより奥にある被写体像は、左視差画像においては左側に、右視差画像においては右側に像がぶれる。(式8)には、その変化方向を捉えた情報が含まれている。
 実験的に、(式8)が表す意味を分析した結果、次の事実が判明した。すなわち、合焦域より前に存在する被写体領域(前ピン領域)では、被写体像が右側に行くほど明るくなる領域では正の符号となり、被写体像が右側に行くほど暗くなる領域では負の符号となる。それとは反対に、合焦域より後ろに存在する被写体領域(後ピン領域)では、被写体像が右側に行くほど明るくなる領域では負の符号となり、被写体像が右側に行くほど暗くなる領域では正の符号となる。
 したがって、右側に行くほど暗くなる被写体領域の符号を反転する操作を加えれば、合焦点より手前にある被写体なのか奥にある被写体なのかを判別することが可能になる。すなわち、(式8)の右辺の第1項の符号から、被写体の画像構造に起因する符号要因を排除することができれば、(式8)は、合焦点から前後の位置関係を符号として捉え、かつ、合焦点からの距離に比例して視差量が増える符号付き視差情報を捉えることできるようになる。
 (式8)の符号から画像構造要因の符号を排除するには、被写体像の水平方向の一次微分の符号を掛け合わせるとうまく排除することができる。被写体像の代表として、視差のない画像を参照することにする。左視差画像と右視差画像の相加平均画像をNで表すと以下の(式9)となる。
Figure JPOXMLDOC01-appb-M000008
 したがって、新たに以下の量を定義すると符号付き視差マップを得ることできる。
Figure JPOXMLDOC01-appb-M000009
 (式10)の右辺に示すように、一次微分の符号を視差画像間の差分と相乗平均の比に乗算することによって、当該比の値の正負を補正することができる。ここで、sign(x)は、以下の(式11)で示す通りである。
Figure JPOXMLDOC01-appb-M000010
 (式11)を一般化して、閾値Thに対して以下のように定義することもできる。閾値Thの大きさは、画像データのノイズの揺らぎを基準に設定される。
Figure JPOXMLDOC01-appb-M000011
 このように、単眼瞳分割撮像方式においては、ぼけの中に視差が含まれることに着目して、極めて単純な平均操作をするだけの演算でぼけ幅を推定し、各点の視差情報を得ることが可能になる。
 なお、得られる視差情報は、平坦部領域ではゼロとなる視差情報である。すなわち、被写体のエッジ部領域で検出されるぼけ幅が同定される。したがって、画像のエッジ部領域に着眼した視差マップ情報となる。これは、画像の領域単位の視差マップ情報ではない。ゆえに、被写体像がエッジ領域から平坦部領域に移行するにしたがって、視差が消滅するような視差の分布情報が得られる。
<実施形態1>
 画像処理の手順は、およそ以下の通りである。
 1)モノクロ・視差多重化モザイク画像データ入力
 2)左右の視差画像の生成
 3)視差マップの生成
 以下、順に説明する。
 1)モノクロ・視差多重化モザイク画像データ入力
 図8は、画素配列の一例を示す図である。撮像素子100は、図の太線で示す2×2画素のパターン110を基本格子とする。パターン110において、左上の画素および右下の画素に視差Lt画素が割り当てられている。左下の画素および右上の画素に視差Rt画素が割り当てられている。
 図8の画素配列の画像データを入力する。視差の多重化された単板式モザイク画像データをM(x,y)で表す。これをRAWデータと呼ぶこともある。
 2)左右の視差画像の生成
 画像処理部205は、モザイク画像データM(x,y)から左視差画素のみの画素データを取り出した左視差画像データと、右視差画素のみの画素データを取り出した右視差画像データとを作成する。左視差画像データおよび右視差画像データのそれぞれの空格子点に相当する画素値を周辺の画素値を用いて補間処理を行う。最も単純には、上下左右に存在する4点の単純平均値を採用する。あるいは、縦方向と横方向の間で方向判定を行って、相関の高い方向から補間値を算出するようにしてもよい。このようにして全画素に画素値を有するよう生成された左視差画像データと右視差画像データをそれぞれLt(x,y)、Rt(x,y)で表す。
 3)視差マップの生成
 画像処理部205は、左視差画像データLt(x,y)と右視差画像データRt(x,y)を生成すると、左視差画像データLt(x,y)および右視差画像データRt(x,y)の対応するそれぞれの画素値を用いて、相加平均と相乗平均の比による符号なし視差マップを生成する。すなわち、(式2)の0以上の正の値の強度分布を視差マップとする。もう一度、定義式を書くと、(式2)は以下の通りである。
Figure JPOXMLDOC01-appb-M000012
 次に、視差マップの表示の具体例について説明する。図9は、撮影状況および撮影画像を説明するための図である。図9(a)は、デジタルカメラ10と各被写体との距離を示す概念図である。手前から順に四角形301、三角形302および円303が存在している。図9(b)は、表示部209に表示される撮影画像を示す図である。ここでは、四角形301、三角形302および円303のうち、三角形302にピントが合った状態で撮影されたものとする。また、四角形301、三角形302および円303は黒色であり、背景領域は白色である。
 図10は、正の値の強度分布を視差マップとした場合を説明する図である。図10は、(式2)を利用した場合の視差マップの表示例を示す。四角形301および円303は非合焦位置に存在するので、(式2)においてD(x、y)の値は0より大きくなる。したがって、図10に示すように、四角形301および円303のエッジ部分がD(x、y)の値に応じた強度で現れる。一方、三角形302は合焦位置に存在するので、D(x、y)の値は0となる。したがって、三角形302のエッジ部分は現れない。
<実施形態2>
 実施形態1では、画像処理部205は、(式2)を用いて視差マップを生成したが、ここでは、(式5)を用いて符号なし視差マップを生成する。すなわち、(式5)の0以上の正の値の強度分布を視差マップとする。もう一度、定義式を書くと、(式5)は以下の通りである。
Figure JPOXMLDOC01-appb-M000013
 図11は、(式5)を利用した場合の視差マップの表示例を示す。上述したように、(式5)では、相加平均と相乗平均のぼけ幅の比を二乗したようなスケールで変化する視差マップを抽出する。したがって、図10に示す四角形301および円303のエッジ部分に比べて、図11に示す四角形301および円303のエッジ部分がより強調される。
<実施形態3>
 画像処理部205は、(式10)を用いて符号付き視差マップを生成する。すなわち、(式10)の正負の値の強度分布を視差マップとする。もう一度、定義式を書くと、(式10)は以下の通りである。
Figure JPOXMLDOC01-appb-M000014
 ここに、水平方向の微分は次のように定義する。
Figure JPOXMLDOC01-appb-M000015
 図12は、正負の値の強度分布を視差マップとした場合を説明する図である。図12(a)は、(式8)を利用した場合の視差マップの表示例を示す。エッジ部分において、正の値の領域を右斜め下方向のハッチング、負の値の領域を左斜め下方向のハッチングで表している。
 四角形301は前ピン領域に存在している。前ピン領域では、水平方向右側に移るにつれて背景領域の白色から四角形301の黒色に変わる領域、すなわち右側に行くほど暗くなる領域において、負の符号となる。一方、水平方向右側に移るにつれて四角形301の黒色から背景領域の白色に変わる領域、すなわち右側に行くほど明るくなる領域において、正の符号となる。
 円303は後ピン領域に存在している。後ピン領域では、水平方向右側に移るにつれて背景領域の白色から四角形301の黒色に変わる領域において、正の符号となる。一方、水平方向右側に移るにつれて四角形301の黒色から背景領域の白色に変わる領域において、負の符号となる。以上のように、前ピン領域および後ピン領域のそれぞれにおいて、正の値と負の値が混在している。
 図12(b)は、(式10)を利用した場合の視差マップの表示例を示す。前ピン領域では、水平方向右側に移るにつれて背景領域の白色から四角形301の黒色に変わる領域、すなわち右側に行くほど暗くなる領域において、正の符号となる。同様に、水平方向右側に移るにつれて四角形301の黒色から背景領域の白色に変わる領域、すなわち右側に行くほど明るくなる領域において、正の符号となる。
 後ピン領域では、水平方向右側に移るにつれて背景領域の白色から四角形301の黒色に変わる領域において、負の符号となる。同様に、水平方向右側に移るにつれて四角形301の黒色から背景領域の白色に変わる領域において、負の符号となる。以上のように、前ピン領域においては正の値のみが、後ピン領域においては負の値のみが得られる。合焦位置に対する被写体の前後関係が比の値の正負として表れるので、被写体の位置を判別することができる。したがって、視差マップを撮影時のガイドのための情報として利用することもできる。
 なお、水平方向の微分は、左右の対称性を考えて次のように定義することもできる。
Figure JPOXMLDOC01-appb-M000016
 左視差画像と右視差画像で捉える被写体像の分布の内、視差情報を捉えることができるのは、縦線の被写体像のみならず、斜め線の縦方向に僅かでも成分をもつ被写体像も左右にぼけ幅が分離する。視差情報が全く発生しないのは、完全に横線の被写体像だけである。したがって、被写体像の水平方向の微分として、視差の検知が可能な斜め方向にも拡張を行うことができる。すなわち、水平方向の微分を次のように定義することもできる。
Figure JPOXMLDOC01-appb-M000017
 (式15)の右辺の分子3項はいずれも水平方向に微分の成分を持つ。
 水平方向の一次微分の分母の区間の取り方として、単眼瞳分割撮像方式では視差が増えるほど被写体像のぼけが増えることに対応して、ぼけ幅が大きいほど微分区間を広くとるようにすると微分値がより安定化する。そのとき、各画素のぼけ幅の情報として、実施形態1で示したD(x,y)を参照するのがよい。すなわち、式14をそのように拡張すると、下記の(式16)となる。 ただし、dxは整数値とする。
Figure JPOXMLDOC01-appb-M000018
 ここに、NXは単眼瞳分割撮像方式の水平方向の最大視差量の半分程度の大きさにとり、画像全体の水平画素数に対して2.5%程度の画素幅にとる。例えば、水平画素数が2000画素程度の場合は、NX=50程度の値をとる。(式15)の場合は、次のようになる。
Figure JPOXMLDOC01-appb-M000019
<実施形態4>
 画像処理部205は、(式18)を用いて符号付き視差マップを生成する。すなわち、(式10)の符号だけを取り出し、その符号を(式2)に乗算する。つまり、下記の(式18)の正負の値の強度分布を視差マップとする。
Figure JPOXMLDOC01-appb-M000020
 本実施形態においても、前ピン領域においては正の値のみが、後ピン領域においては負の値のみが得られる。合焦位置に対する被写体の前後関係が比の値の正負として表れるので、被写体の位置を判別することができる。本実施形態では、実施形態1に符号を拡張した視差マップが得られる。
<実施形態5>
 画像処理部205は、(式19)を用いて符号付き視差マップを生成する。すなわち、(式10)の符号だけを取り出し、その符号を(式5)に乗算する。つまり、下記の(式19)の正負の値の強度分布を視差マップとする。
Figure JPOXMLDOC01-appb-M000021
 本実施形態においても、前ピン領域においては正の値のみが、後ピン領域においては負の値のみが得られる。合焦位置に対する被写体の前後関係が比の値の正負として表れるので、被写体の位置を判別することができる。さらに(式19)では、D(x、y)+D(x、y)が存在するので、実施形態1に比べて、相加平均と相乗平均のぼけ幅の比を二乗したようなスケールで変化する視差マップを抽出できる。すなわち、エッジ部分をより強調することができる。
 なお、上記の第1~第5の実施形態では、モノクロ・視差多重化の単板撮像方式の例を示した。しかし、撮像素子として以下のような変形例も考えられる。
 1)モノクロ・片側視差画像データの二板式撮像のとき
 ・単眼レンズの入射光をプリズムで半々に光強度が2方向に分離するようにし、各々に片側視差画素のみを敷き詰めた左視差撮像素子と右視差撮像素子によって二板式撮像を行う。この場合には、各画素に右視差画素値と左視差画素値の2つの情報をもっているので、実施形態1における2)左右の視差画像の生成時の補間処理は不要となる。
 ・単眼レンズの構造として、図4の仮想瞳に相当する絞りを右側と左側に交互に挿入できる場合、通常の視差なし画素のモノクロ撮像素子に対して、2回露光で順に左視差画像と右視差画像を取得する場合も、実施形態1において2)左右の視差画像の生成時の補間処理は不要となる。
 2)色・視差多重化モザイク画像データの単板式撮像のとき
 a)Bayer面のG画素が視差画素になっている場合
 ・G視差画素を実施形態1のモノクロ視差画素と同じ扱いをし、補間処理を施す。
 b)特許文献1で示した撮像装置における視差画素配列がRGB全てにある場合
 ・RGBの各色成分毎に視差マップを作成することができる。
 ・輝度面のみの視差マップを生成するときは、各色面の視差マップをY=0.3R+0.6G+0.1Bで合成する。
 ・あるいは、先に輝度面をこの比で生成した後、実施形態1と同じ方法を用いる。
 また、以下に説明する撮像素子を用いることもできる。図13は、画素配列のバリエーションを示す図である。撮像素子200、300は、図の太線で示す2×2画素のパターン120、130を基本格子とする。図13(a)に示すように、撮像素子200では、パターン120において、左上の画素および右下の画素に視差なし画素が割り当てられている。また、左下の画素に視差Lt画素が割り当てられ、右上の画素に視差Rt画素が割り当てられている。
 図13(b)に示すように、撮像素子300では、ベイヤー配列が採用されている。具体的には、緑フィルタが左上と右下の2画素に、赤フィルタが左下の1画素に、青フィルタが右上の1画素に割り当てられている。また、パターン130において左上の画素に視差Lt画素が、右下の画素に視差Rt画素が割り当てられている。
 以上の説明では、「左視点の点像分布Lt+右視点の点像分布Rt=視差なし画素の点像分布N」であることを前提とした。しかしながら、この関係が成立しない場合であっても、点像分布の広がりがどのような状況にあるかを判定することができる。具体的には、上記の関係が成立しない場合には、LtとRtの相乗平均の値は0になるので、D(x、y)の値は発散する。したがって、D(x、y)の値が発散することによって、LtとRtの重なりがないことがわかる。
 以上の説明では、視差マップは、オートフォーカスおよび撮影時のガイドとして使用されるとしたが、視差マップを距離情報として使用することによって奥行き方向に被写体を分離し、各被写体にホワイトバランス等の処理を行ってもよい。
 以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
 特許請求の範囲、明細書、および図面中において示した装置、システム、プログラム、および方法における動作、手順、ステップ、および段階等の各処理の実行順序は、特段「より前に」、「先立って」等と明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、および図面中の動作フローに関して、便宜上「まず、」、「次に、」等を用いて説明したとしても、この順で実施することが必須であることを意味するものではない。
10 デジタルカメラ、20 撮影レンズ、21 光軸、100 撮像素子、101 マイクロレンズ、102 カラーフィルタ、103 開口マスク、104 開口部、104l 開口部、104r 開口部、104n 開口部、105 配線層、106 配線、107 開口、108 光電変換素子、109 基板、110 パターン、120 パターン、130 パターン、200 撮像素子、201 制御部、202 A/D変換回路、203 メモリ、204 駆動部、205 画像処理部、207 メモリカードIF、208 操作部、209 表示部、210 LCD駆動回路、220 メモリカード、300 撮像素子、322 中心線、301 四角形、302 三角形、303 円、1801 分布曲線、1802 分布曲線、1803 分布曲線、1804 分布曲線、1805 分布曲線、1806 合成分布曲線、1807 分布曲線、1808 分布曲線、1809 合成分布曲線

Claims (12)

  1.  1つの光学系を通して撮像された被写体像の第1視点方向の画像と第2視点方向の画像の少なくとも2つの視差画像を入力する手段と、
     各画素で前記第1視点方向の画像と前記第2視点方向の画像の間の相加平均と相乗平均を算出する手段と、
     各画素で前記相加平均と前記相乗平均の比を算出する手段と、
     前記比に基づいて前記第1視点方向の画像と前記第2視点方向の画像の間の視差量を各々の画素について算出する手段と
    を備えたことを特徴とする画像処理装置。
  2.  請求項1に記載の画像処理装置において、
     各画素で前記第2視点方向の画像と前記第1視点方向の画像の間の差分を算出する手段と、
     前記第1視点方向の画像と前記第2視点方向の画像の平均値からなる中間視点の画像に対して、前記視点が変化する方向に成分をもつ一次微分を各々の画素について算出する手段と、
     前記差分の符号と前記一次微分の符号の積に基づいて、前記光学系の合焦位置より手前にある被写体像か奥にある被写体像かを区別する符号を前記視差量に付ける手段と
    を更に備えたことを特徴とする。
  3.  1つの光学系を通して撮像された被写体像の第1視点方向の画像と第2視点方向の画像の少なくとも2つの視差画像を入力する手段と、
     各画素で前記第2視点方向の画像と前記第1視点方向の画像の間の差分を算出する手段と、
     前記第1視点方向の画像と前記第2視点方向の画像の平均値からなる中間視点の画像に対して、前記視点が変化する方向に成分をもつ一次微分を各々の画素について算出する手段と、
     前記差分の符号と前記一次微分の符号の積に基づいて、前記光学系の合焦位置より手前にある被写体像か奥にある被写体像かを区別する手段と
    を備えたことを特徴とする画像処理装置。
  4.  請求項3に記載の画像処理装置において、
     前記第1視点方向の画像が左視点の画像に、前記第2視点方向の画像が右視点の画像に対応し、前記一次微分を左から右へ変化する方向にとるとき、
     前記差分の符号と前記一次微分の符号の積が正の値を示すとき、前記光学系の合焦位置より手前にある被写体像と判断し、負の値を示すとき、前記光学系の合焦位置より奥にある被写体像と判断することを特徴とする。
  5.  請求項1、3に記載の画像処理装置において、
     前記第1視点方向の画像と前記第2視点方向の画像は、前記1つの光学系を通して1つの撮像面に入射する入射光束のうち、第1視点方向の部分光束を通過させる開口マスクを有する第1視差画素と、第2視点方向の部分光束を通過させる開口マスクを有する第2視差画素の少なくとも2種類の画素が1つの撮像面上に周期的に配置された撮像素子を用いて撮像された画像であることを特徴とする。
  6.  少なくとも一部が共通する光学系を通して取得された第1視点に対応する第1画像データと、第2視点に対応する第2画像データを取得する画像データ取得部と、
     前記第1画像データと前記第2画像データの対応するそれぞれの画素値を加算演算した値と積算演算した値の比を算出して、前記第1視点と前記第2視点の視差に関する評価データを前記第1画像データおよび前記第2画像データに対応させて生成する評価データ生成部と
    を備える画像処理装置。
  7.  前記評価データ生成部は、前記加算演算した値として前記それぞれの画素値の相加平均を算出し、前記積算演算した値として前記それぞれの画素値の相乗平均を算出する請求項6に記載の画像処理装置。
  8.  前記評価データ生成部は、前記光学系の合焦位置に対する被写体の前後関係が、前記比の値の正負として表れるように演算する請求項6または7に記載の画像処理装置。
  9.  前記評価データ生成部は、前記比に、前記それぞれの画素値の差分値と、前記加算演算した値の視差方向における微分値とを乗じて演算する請求項8に記載の画像処理装置。
  10.  撮像素子と、
     請求項6から9のいずれか1項に記載の画像処理装置と
    を備える撮像装置であって、
     前記第1画像データおよび第2画像データは、前記撮像素子の出力に基づいて生成される撮像装置。
  11.  少なくとも一部が共通する光学系を通して取得された第1視点に対応する第1画像データと、第2視点に対応する第2画像データを取得する画像データ取得ステップと、
     前記第1画像データと前記第2画像データの対応するそれぞれの画素値を加算演算した値と積算演算した値の比を算出して、前記第1視点と前記第2視点の視差に関する評価データを前記第1画像データおよび前記第2画像データに対応させて生成する評価データ生成ステップと
    をコンピュータに実行させる画像処理プログラム。
  12.  少なくとも一部が共通する光学系を通して取得された第1視点に対応する第1画像データと、第2視点に対応する第2画像データを取得する画像データ取得部と、
     互いに異なる平均化処理によって前記第1画像データおよび前記第2画像データの視差情報を消滅させ、画像構造を排除すべく前記平均化処理の結果を対比することにより、新たな視差に関するデータを生成して視差マップを生成する生成部と
    を備える画像処理装置。
PCT/JP2013/003750 2012-06-22 2013-06-14 画像処理装置、撮像装置および画像処理プログラム WO2013190814A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201380026360.2A CN104322061B (zh) 2012-06-22 2013-06-14 图像处理装置、摄像装置及图像处理方法
JP2014520942A JP6003983B2 (ja) 2012-06-22 2013-06-14 画像処理装置、撮像装置および画像処理プログラム
US14/539,631 US9723288B2 (en) 2012-06-22 2014-11-12 Image processing apparatus, image-capturing apparatus and image processing method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2012-141445 2012-06-22
JP2012141445 2012-06-22

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US14/539,631 Continuation US9723288B2 (en) 2012-06-22 2014-11-12 Image processing apparatus, image-capturing apparatus and image processing method

Publications (1)

Publication Number Publication Date
WO2013190814A1 true WO2013190814A1 (ja) 2013-12-27

Family

ID=49768428

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2013/003750 WO2013190814A1 (ja) 2012-06-22 2013-06-14 画像処理装置、撮像装置および画像処理プログラム

Country Status (4)

Country Link
US (1) US9723288B2 (ja)
JP (1) JP6003983B2 (ja)
CN (1) CN104322061B (ja)
WO (1) WO2013190814A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013187890A (ja) * 2012-03-12 2013-09-19 Sony Corp 画像処理装置と画像処理方法
CN104521231B (zh) 2012-08-10 2016-12-21 株式会社尼康 图像处理装置和摄像装置
CN105122793B (zh) 2013-03-29 2017-05-10 株式会社尼康 图像处理装置、摄像装置及图像处理程序
CN105359519B (zh) 2013-07-05 2017-07-04 株式会社尼康 摄像装置
KR101825687B1 (ko) * 2015-04-24 2018-02-05 한국전자통신연구원 차영상을 이용한 장애물 검출장치 및 그 방법
US11288522B2 (en) 2019-12-31 2022-03-29 Woven Planet North America, Inc. Generating training data from overhead view images
US11244500B2 (en) 2019-12-31 2022-02-08 Woven Planet North America, Inc. Map feature extraction using overhead view images
US11037328B1 (en) 2019-12-31 2021-06-15 Lyft, Inc. Overhead view image generation

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012017585A1 (ja) * 2010-08-06 2012-02-09 パナソニック株式会社 撮像装置
WO2012032826A1 (ja) * 2010-09-10 2012-03-15 富士フイルム株式会社 立体撮像装置および立体撮像方法
WO2012042963A1 (ja) * 2010-09-29 2012-04-05 富士フイルム株式会社 固体撮像素子及び撮像装置
JP2012094997A (ja) * 2010-10-25 2012-05-17 Olympus Imaging Corp 撮影機器

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003007994A (ja) 2001-06-27 2003-01-10 Konica Corp 固体撮像素子、立体カメラ装置及び測距装置
JP3746506B2 (ja) * 2004-03-08 2006-02-15 一成 江良 立体視化パラメータ埋込装置及び立体視画像再生装置
US20070285554A1 (en) * 2005-10-31 2007-12-13 Dor Givon Apparatus method and system for imaging
JP5426174B2 (ja) * 2006-02-13 2014-02-26 スリーエム イノベイティブ プロパティズ カンパニー 単眼三次元撮像
US9031130B2 (en) * 2007-04-09 2015-05-12 Ntt Docomo, Inc. Image prediction/encoding device, image prediction/encoding method, image prediction/encoding program, image prediction/decoding device, image prediction/decoding method, and image prediction decoding program
US8422559B2 (en) * 2007-10-10 2013-04-16 Mediatek Inc. Matching-pixel sub-sampling motion estimation method for video compression
CN101226325B (zh) * 2008-02-03 2010-06-02 李志扬 基于随机相长干涉的三维显示方法及装置
WO2010048632A1 (en) * 2008-10-24 2010-04-29 Real D Stereoscopic image format with depth information
JP5491786B2 (ja) * 2009-07-21 2014-05-14 富士フイルム株式会社 画像再生装置及び方法
US9380292B2 (en) * 2009-07-31 2016-06-28 3Dmedia Corporation Methods, systems, and computer-readable storage media for generating three-dimensional (3D) images of a scene
JP5761522B2 (ja) * 2009-12-04 2015-08-12 Nltテクノロジー株式会社 立体表示装置、立体表示用画像データ生成方法、及びそのプログラム
JP5387377B2 (ja) * 2009-12-14 2014-01-15 ソニー株式会社 画像処理装置、および画像処理方法、並びにプログラム
US9344701B2 (en) * 2010-07-23 2016-05-17 3Dmedia Corporation Methods, systems, and computer-readable storage media for identifying a rough depth map in a scene and for determining a stereo-base distance for three-dimensional (3D) content creation
JP6061150B2 (ja) * 2011-03-18 2017-01-18 ソニー株式会社 画像処理装置、画像処理方法、及び、プログラム
US8873813B2 (en) * 2012-09-17 2014-10-28 Z Advanced Computing, Inc. Application of Z-webs and Z-factors to analytics, search engine, learning, recognition, natural language, and other utilities
JP6131546B2 (ja) * 2012-03-16 2017-05-24 株式会社ニコン 画像処理装置、撮像装置および画像処理プログラム
US9030594B1 (en) * 2012-04-19 2015-05-12 Southern Methodist University Applying phase transfer function
JP6016061B2 (ja) * 2012-04-20 2016-10-26 Nltテクノロジー株式会社 画像生成装置、画像表示装置及び画像生成方法並びに画像生成プログラム
CN104521231B (zh) * 2012-08-10 2016-12-21 株式会社尼康 图像处理装置和摄像装置
WO2014024500A1 (ja) * 2012-08-10 2014-02-13 株式会社ニコン 画像処理方法、画像処理装置、撮像装置および画像処理プログラム
JP5949314B2 (ja) * 2012-08-20 2016-07-06 株式会社日本自動車部品総合研究所 視差マップ生成装置および視差マップ生成装置用のプログラム
US8619082B1 (en) * 2012-08-21 2013-12-31 Pelican Imaging Corporation Systems and methods for parallax detection and correction in images captured using array cameras that contain occlusions using subsets of images to perform depth estimation
CN105122793B (zh) * 2013-03-29 2017-05-10 株式会社尼康 图像处理装置、摄像装置及图像处理程序

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012017585A1 (ja) * 2010-08-06 2012-02-09 パナソニック株式会社 撮像装置
WO2012032826A1 (ja) * 2010-09-10 2012-03-15 富士フイルム株式会社 立体撮像装置および立体撮像方法
WO2012042963A1 (ja) * 2010-09-29 2012-04-05 富士フイルム株式会社 固体撮像素子及び撮像装置
JP2012094997A (ja) * 2010-10-25 2012-05-17 Olympus Imaging Corp 撮影機器

Also Published As

Publication number Publication date
US9723288B2 (en) 2017-08-01
JP6003983B2 (ja) 2016-10-05
CN104322061B (zh) 2017-01-18
US20150062308A1 (en) 2015-03-05
JPWO2013190814A1 (ja) 2016-02-08
CN104322061A (zh) 2015-01-28

Similar Documents

Publication Publication Date Title
JP6003983B2 (ja) 画像処理装置、撮像装置および画像処理プログラム
JP6036829B2 (ja) 画像処理装置、撮像装置および画像処理装置の制御プログラム
WO2014024500A1 (ja) 画像処理方法、画像処理装置、撮像装置および画像処理プログラム
JP6354838B2 (ja) 撮像素子、撮像装置および画像処理装置
JP6131546B2 (ja) 画像処理装置、撮像装置および画像処理プログラム
JP6131545B2 (ja) 画像処理装置、撮像装置および画像処理プログラム
WO2013136819A1 (ja) 撮像素子、撮像装置および撮像システム
WO2014192300A1 (ja) 撮像素子、撮像装置、および画像処理装置
US9838665B2 (en) Image processing device, imaging device, and image processing program
JP6288088B2 (ja) 撮像装置
WO2012132270A1 (ja) 画像処理装置、撮像装置および画像処理プログラム
JP6197316B2 (ja) 撮像素子および撮像装置
JP5978736B2 (ja) 画像処理装置、撮像装置および画像処理プログラム
JP5887845B2 (ja) 画像処理方法および画像処理プログラム
JP2014107594A (ja) 撮像素子および撮像装置
JP5978737B2 (ja) 画像処理装置、撮像装置および画像処理プログラム
JP6205770B2 (ja) 撮像素子および撮像システム
JP6476630B2 (ja) 撮像装置
JP5978738B2 (ja) 画像処理装置、撮像装置および画像処理プログラム
JP2014085608A (ja) 撮像装置
JP5978735B2 (ja) 画像処理装置、撮像装置および画像処理プログラム
JP6051568B2 (ja) 撮像素子および撮像装置
JP2013090265A (ja) 画像処理装置および画像処理プログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13806984

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2014520942

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 13806984

Country of ref document: EP

Kind code of ref document: A1