WO2013094329A1 - 画像処理装置、方法およびプログラムならびにその記録媒体 - Google Patents

画像処理装置、方法およびプログラムならびにその記録媒体 Download PDF

Info

Publication number
WO2013094329A1
WO2013094329A1 PCT/JP2012/078933 JP2012078933W WO2013094329A1 WO 2013094329 A1 WO2013094329 A1 WO 2013094329A1 JP 2012078933 W JP2012078933 W JP 2012078933W WO 2013094329 A1 WO2013094329 A1 WO 2013094329A1
Authority
WO
WIPO (PCT)
Prior art keywords
parallax
scene
representative
stereoscopic image
width
Prior art date
Application number
PCT/JP2012/078933
Other languages
English (en)
French (fr)
Inventor
智紀 増田
Original Assignee
富士フイルム株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 富士フイルム株式会社 filed Critical 富士フイルム株式会社
Priority to JP2013550179A priority Critical patent/JP5571257B2/ja
Priority to CN201280062910.1A priority patent/CN104054333A/zh
Publication of WO2013094329A1 publication Critical patent/WO2013094329A1/ja
Priority to US14/280,138 priority patent/US9094671B2/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/204Image signal generators using stereoscopic image cameras
    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03BAPPARATUS OR ARRANGEMENTS FOR TAKING PHOTOGRAPHS OR FOR PROJECTING OR VIEWING THEM; APPARATUS OR ARRANGEMENTS EMPLOYING ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ACCESSORIES THEREFOR
    • G03B35/00Stereoscopic photography
    • G03B35/08Stereoscopic photography by simultaneous recording
    • G03B35/10Stereoscopic photography by simultaneous recording having single camera with stereoscopic-base-defining system
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/128Adjusting depth or disparity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/204Image signal generators using stereoscopic image cameras
    • H04N13/239Image signal generators using stereoscopic image cameras using two 2D image sensors having a relative position equal to or related to the interocular distance
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/296Synchronisation thereof; Control thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N2013/0074Stereoscopic image analysis
    • H04N2013/0081Depth or disparity estimation from stereoscopic image signals

Definitions

  • the present invention relates to image processing, and more particularly, to binocular parallax adjustment of each stereoscopic image frame of a stereoscopic video.
  • the stereoscopic image processing apparatus of Patent Document 1 When the displayed subject reaches the limit parallax, the stereoscopic image processing apparatus of Patent Document 1 generates a parallax image so as to realize the appropriate parallax in the subsequent stereoscopic display according to the acquired appropriate parallax information.
  • the parallax control is realized by optimally setting the camera parameters retroactively to the three-dimensional data.
  • an observation viewpoint sensor that detects an observation viewpoint of an observer who is facing is provided on a display that displays a three-dimensional image seen through a viewpoint coordinate system, and is detected by the observation viewpoint sensor.
  • the computer moves the viewpoint coordinate system of the displayed image according to the observed viewpoint, so that the perspective viewpoint of the three-dimensional image displayed on the display moves following the observer's observation viewpoint, and the perspective viewpoint is always observed. Display the image according to the viewpoint.
  • the three-dimensional image display device disclosed in Patent Literature 3 separately projects a viewpoint detection device that detects the viewpoint position of an observer, a video generation device that generates two videos with parallax for the left and right eyes, and two videos. And a video projection device that projects the two displayed videos separately to the left and right eyes of the observer, the video generation device is based on the output signal of the viewpoint detection device, A video reflecting the change in the observation direction of the observation target is generated in response to the movement of the observer's viewpoint.
  • the video generation device reflects a change in the observation direction of the observation target corresponding to the movement of the observer's viewpoint based on the output signal of the viewpoint detection device, and has a fictitious parallax with respect to the left and right eyes of the observer Generate an image of the object.
  • a liquid crystal shutter is provided in front of the display, a display unit in which a lenticular lens is disposed in front of the liquid crystal shutter, and a control unit to which an observer's viewpoint position is input,
  • the parallax images corresponding to the right and left eyes are displayed on the display in a time-sharing manner, and the width and position of the liquid crystal shutter in the translucent state are changed according to the viewpoint position of the observer while synchronizing with the parallax images.
  • the image is observed with a corresponding eye through a lenticular lens.
  • JP 2004-221699 A Japanese Patent Laid-Open No. 6-028452 Japanese Patent Laid-Open No. 9-238369 JP-A-8-327948
  • parallax If stereoscopic video using parallax is not displayed with an appropriate amount of parallax, viewers may be fatigued.
  • the appropriate amount of parallax varies depending on the size of the display to be displayed, the viewer's stereoscopic fusion limit, etc., and it is necessary to adjust the parallax accordingly.
  • parallax adjustment if a stereoscopic image is reproduced with a parallax different from the parallax at the time of shooting, there is a possibility that the viewer may feel uncomfortable. For this reason, it is preferable to perform parallax adjustment so as to keep the original parallax at the time of shooting a stereoscopic video as much as possible.
  • Patent Document 1 since the depth Fxy that satisfies the appropriate parallax is calculated and rounded off, the parallax is the same between frames, and there is no change in stereoscopic effect due to frame transition, or conversely, a large parallax between frames. There is a risk that viewers will be exhausted by too much change.
  • An object of the present invention is to prevent the original parallax from being greatly damaged by the parallax adjustment of the stereoscopic video.
  • the present invention relates to a representative parallax acquisition unit that acquires a representative parallax for each of a plurality of stereoscopic image frames that constitute a whole or a predetermined partial range of a stereoscopic video, and the representative parallax of each stereoscopic image frame acquired by the representative parallax acquisition unit
  • a scene separation unit that separates a stereoscopic video into a plurality of scenes when the parallax width defined by the maximum value and the minimum value is not compatible with a predetermined allowable parallax width specified by the maximum allowable parallax and the minimum allowable parallax; For each scene separated by the scene separation unit, it is determined whether or not the scene parallax width defined by the maximum and minimum values of the representative parallax of the stereoscopic image frame constituting the scene matches the allowable parallax width, and the determination result
  • a parallax adjustment unit that uniformly adjusts the representative parallax of each stereoscopic image frame that configures the
  • the parallax adjustment unit configures a scene when the scene parallax width of a certain scene matches the allowable parallax width, but the maximum value of the representative parallax of the stereoscopic image frame constituting the scene exceeds a predetermined upper limit of the representative parallax.
  • the representative parallax is adjusted so that the representative parallax of each stereoscopic image frame is below the upper limit of the representative parallax.
  • each scene parallax width corresponding to two or more continuous scenes matches the allowable parallax width, but the maximum value of the representative parallax of the stereoscopic image frames constituting the two or more continuous scenes is the upper limit of the representative parallax. Is greater than, the representative parallax is uniformly adjusted so that the representative parallax of each stereoscopic image frame constituting two or more consecutive scenes is lower than the upper limit of the representative parallax.
  • the parallax adjustment unit configures a scene when the scene parallax width of a certain scene matches the allowable parallax width, but the minimum value of the representative parallax of the stereoscopic image frame constituting the scene is below a predetermined lower limit of the representative parallax.
  • the representative parallax is adjusted so that the representative parallax of each stereoscopic image frame exceeds the lower limit of the representative parallax.
  • each scene parallax width corresponding to two or more continuous scenes matches the allowable parallax width, but the minimum value of the representative parallax of the stereoscopic image frames constituting the two or more continuous scenes is the lower limit of the representative parallax. If the value is less than, the representative parallax is uniformly adjusted so that the representative parallax of each stereoscopic image frame constituting two or more consecutive scenes exceeds the lower limit of the representative parallax.
  • the scene separation unit When the scene parallax width of the scene separated according to the predetermined first criterion does not match the allowable parallax width, the scene separation unit performs stereoscopic processing according to the second criterion different from the predetermined first criterion and the predetermined first criterion. Separate videos.
  • the second standard has a lower estimated accuracy of scene change than the first standard.
  • the parallax adjustment unit determines whether or not the scene parallax width of the scene matches the allowable parallax width for each scene separated by the scene separation unit according to the first reference and the second reference. If it is determined that it does not match the allowable parallax width, the representative parallax of each stereoscopic image frame constituting the scene is adjusted to match the allowable parallax width.
  • the parallax adjustment unit smoothes the adjustment amount of the representative parallax between the two adjacent scenes when the difference in the adjustment amount of the representative parallax between the two adjacent scenes exceeds a predetermined threshold.
  • the statistical calculation value includes at least one of an average value, a maximum value, a minimum value, a mode value, and a median value of the parallax of the stereoscopic image frame.
  • the representative parallax for each stereoscopic image frame is an average value, a maximum value, a minimum value, and a mode of parallax of a subject existing on a distant view side that is a direction away from the imaging device from the cross point among the parallaxes of the stereoscopic image frame. It includes at least one of the average value, the maximum value, the minimum value, the mode value, or the median value of the parallax of the subject existing on the near view side that is closer to the imaging device than the value or the median value and the cross point.
  • the parallax that satisfies the predetermined condition includes the parallax of the gaze position with respect to the stereoscopic image frame.
  • the gaze position includes a gaze point of the viewer of the stereoscopic image frame, a gaze point of the photographer of the stereoscopic image frame, or a gaze point arbitrarily designated in the stereoscopic image frame.
  • the disparity satisfying the predetermined condition is a distant view that is a direction away from the imaging device from the cross point among the disparity of the face region, the disparity of the focus evaluation value calculation region, the disparity of the image center region, and the disparity of the stereoscopic image frame
  • the parallax of the subject existing on the near view side which is closer to the imaging device than the cross point, among the parallax of the subject existing on the side or the parallax of the stereoscopic image frame.
  • the representative parallax for each stereoscopic image frame is a first representative parallax that is a maximum value of the parallax satisfying a predetermined condition among the parallaxes of the stereoscopic image frame and a parallax satisfying the predetermined condition among the parallaxes of the stereoscopic image frame.
  • the scene separation unit includes a parallax width defined by the maximum value of the first representative parallax and the minimum value of the second representative parallax as a predetermined maximum. If the permissible parallax width defined by the permissible parallax and the minimum permissible parallax is not met, the stereoscopic video is separated into a plurality of scenes.
  • the present invention provides an image processing apparatus including a representative parallax acquisition unit, a scene separation unit, a parallax adjustment unit, and an output unit, wherein the representative parallax acquisition unit configures all or a predetermined range of a stereoscopic video
  • the present invention provides an image processing apparatus including a representative parallax acquisition unit, a scene separation unit, a parallax adjustment unit, and an output unit, wherein the representative parallax acquisition unit configures all or a predetermined range of a stereoscopic video
  • the present invention separates the stereoscopic video into a plurality of scenes when the parallax width of the stereoscopic video does not match the output allowable parallax width, determines whether or not the scene parallax width for each scene matches the output allowable parallax width, The representative parallax of the scene is adjusted according to the determination result.
  • the entire parallax width of the stereoscopic video is not adjusted uniformly, but the parallax width is adjusted for each scene, so that the stereoscopic effect of the stereoscopic video can be prevented from being lost as a whole.
  • FIG. 1 is a front perspective view showing an external configuration of a digital camera 10 according to an embodiment of the present invention.
  • FIG. 2 is a rear perspective view showing an external configuration of an example of the digital camera.
  • the digital camera 10 includes a plurality of imaging means (two are illustrated in FIG. 1), and can photograph the same subject from a plurality of viewpoints (two left and right viewpoints in FIG. 1).
  • a case where two imaging units are provided will be described as an example.
  • the present invention is not limited to this, and the same applies even when three or more imaging units are provided. It is applicable to.
  • the camera body 112 of the digital camera 10 of this example is formed in a rectangular box shape, and a pair of photographing optical systems 11R and 11L and a strobe 116 are provided on the front surface thereof as shown in FIG. Yes.
  • a release button 14 On the top surface of the camera body 112, a release button 14, a power / mode switch 120, a mode dial 122, and the like are provided.
  • a monitor 13 composed of a liquid crystal display (LCD), a zoom button 126, a cross button 128, a MENU / OK button 130, a DISP button 132, a BACK A button 134 and the like are provided.
  • the monitor 13 may be built in the digital camera 10 or an external device.
  • the pair of left and right photographing optical systems 11R and 11L are configured to include retractable zoom lenses (18R and 18L in FIG. 3), respectively, and are fed out from the camera body 112 when the power of the digital camera 10 is turned on.
  • the zoom mechanism and the retracting mechanism in the photographing optical system are known techniques, a specific description thereof is omitted here.
  • the monitor 13 is a display device such as a color liquid crystal panel in which a so-called lenticular lens having a semi-cylindrical lens group is arranged on the front surface.
  • the monitor 13 is used as an image display unit for displaying captured images, and is used as a GUI during various settings. Further, at the time of shooting, a live view image captured by the image sensor is displayed and used as an electronic viewfinder.
  • the stereoscopic image display method of the monitor 13 is not limited to the parallax barrier method. For example, a stereoscopic image display method using glasses such as an anaglyph method, a polarizing filter method, and a liquid crystal shutter method may be used.
  • the release button 14 is composed of a two-stroke switch composed of so-called “half press” and “full press”.
  • a shooting preparation process that is, AE (Automatic Exposure), AF (Auto Focus) and AWB (Automatic White Balance) processing are performed, and when fully pressed, image shooting / recording processing is performed.
  • stereoscopic video shooting when stereoscopic video shooting is performed (for example, when the stereoscopic video shooting mode is selected by the mode dial 122 or the menu), when the release button 14 is fully pressed, shooting of the stereoscopic video is started, and when the release button 14 is fully pressed again, shooting is ended.
  • a release button dedicated to still image shooting and a release button dedicated to stereoscopic video shooting may be provided.
  • the power / mode switch 120 functions as a power switch of the digital camera 10 and also functions as a switching unit that switches between the playback mode and the shooting mode of the digital camera 10.
  • the mode dial 122 is used for setting the shooting mode.
  • the digital camera 10 is set to a 2D still image shooting mode for shooting a 2D still image by setting the mode dial 122 to “2D still image position”, and set to “3D still image position”.
  • the 3D still image shooting mode for shooting a 3D still image is set.
  • the 3D moving image shooting mode for shooting a 3D moving image is set by setting the “3D moving image position”.
  • the zoom button 126 is used for zoom operation of the photographing optical systems 11R and 11L, and includes a zoom tele button for instructing zooming to the telephoto side and a zoom wide button for instructing zooming to the wide angle side.
  • the cross button 128 is provided so that it can be pressed in four directions, up, down, left, and right, and a function corresponding to the setting state of the camera is assigned to the pressing operation in each direction.
  • the MENU / OK button 130 is used to call a menu screen (MENU function), and to confirm selection contents, execute a process, etc. (OK function).
  • the DISP button 132 is used to input an instruction to switch the display contents of the monitor 13 and the BACK button 134 is used to input an instruction to cancel the input operation.
  • FIG. 3 is a block diagram showing the main part of the digital camera 10.
  • the digital camera 10 includes a right viewpoint imaging unit having a right viewpoint imaging optical system 11R and an imaging element 29R, and a left viewpoint imaging unit having a left viewpoint imaging optical system 11L and an imaging element 29L.
  • the two photographing optical systems 11 include a zoom lens 18 (18R, 18L), a focus lens 19 (19R, 19L), and a diaphragm 20 (20R, 20L), respectively.
  • the zoom lens 18, the focus lens 19, and the aperture 20 are respectively controlled by a zoom lens control unit 22 (22R, 22L), a focus lens control unit 23 (23R, 23L), and an aperture control unit 24 (24R, 24L).
  • Each of the control units 22, 23, and 24 is composed of a stepping motor, and is controlled by a drive pulse given from a motor driver (not shown) connected to the CPU 26.
  • CCD image sensors (hereinafter simply referred to as “CCD”) 29 (29R, 29L) are disposed behind the two photographing optical systems 11 (11R, 11L), respectively.
  • a MOS type image sensor may be used instead of the CCD 29, a MOS type image sensor may be used.
  • the CCD 29 has a photoelectric conversion surface on which a plurality of photoelectric conversion elements are arranged. Subject light is incident on the photoelectric conversion surface via the photographing optical system 11 so that a subject image is formed.
  • the A timing generator: TG31 (31R, 31L) controlled by the CPU 26 is connected to the CCD 29, and the shutter speed of the electronic shutter (the charge accumulation time of each photoelectric conversion element) is determined by a timing signal (clock pulse) input from the TG31. Is determined).
  • the imaging signal output from the CCD 29 is input to the analog signal processing circuit 33 (33R, 33L).
  • the analog signal processing circuit 33 includes a correlated double sampling circuit (CDS), an amplifier (AMP), and the like.
  • the CDS generates R, G, and B image data corresponding to the accumulated charge time of each pixel from the imaging signal.
  • the AMP amplifies the generated image data.
  • the AMP functions as a sensitivity adjustment means for adjusting the sensitivity of the CCD 29.
  • the ISO sensitivity of the CCD 29 is determined by the gain of the AMP.
  • the A / D converter 36 (36R, 36L) converts the amplified image data from analog to digital.
  • the digital image data output from the A / D converter 36 (36R, 36L) is supplied to the right viewpoint image data by the SDRAM 39, which is a working memory, via the image input controller 38 (38R, 38L). Temporarily stored as image data of the left viewpoint.
  • the digital signal processing unit 41 reads out image data from the SDRAM 39, performs various image processing such as gradation conversion, white balance correction, ⁇ correction processing, YC conversion processing, and stores the image data in the SDRAM 39 again.
  • Image data that has been subjected to image processing by the digital signal processing unit 41 is acquired as a through image in the VRAM 65, converted into an analog signal for video output by the display control unit 42, and displayed on the monitor 13.
  • the image processed image data obtained by fully pressing the release button 14 is compressed in a predetermined compression format (for example, JPEG format) by the compression / decompression processing unit 43 and then passed through the media control unit 15. Thus, it is recorded on the memory card 16 as a recording image.
  • a predetermined compression format for example, JPEG format
  • the operation unit 25 is for performing various operations of the digital camera 10, and includes various buttons and switches 120 to 134 shown in FIGS.
  • the CPU 26 is provided to control the digital camera 10 in an integrated manner.
  • the CPU 26 uses a battery 70 based on various control programs and setting information stored in a computer-readable non-temporary recording medium such as the flash ROM 60 or the ROM 61, input signals from the attitude detection sensor 73 and the operation unit 25, and the like. Control each unit such as the power supply control unit 71 and the clock unit 72.
  • the digital camera 10 includes an AE / AWB control unit 47 that performs AE (Auto-Exposure) / AWB (Auto-White Balance) control, and a parallax detection unit 49 that detects representative parallax of each of a plurality of stereoscopic image frames. It has been.
  • the digital camera 10 also includes a flash control unit 23 that controls the light emission timing and the light emission amount of the flash 5.
  • the AE / AWB control unit 47 analyzes the image (captured image) obtained by the CCD 29 when the release button 14 is half-pressed, and based on the luminance information of the subject, the aperture value of the aperture 20 and the CCD 29 The shutter speed of the electronic shutter is calculated. Based on these calculation results, the AE / AWB control unit 47 controls the aperture value via the aperture control unit 24 and the shutter speed via the TG 31.
  • the apertures of both the imaging optical systems 11R and 11L calculateate the value and shutter speed.
  • the aperture value and the shutter speed of each of the imaging optical systems 11R and 11L may be calculated.
  • the AF control unit 45 performs AF search control for calculating the contrast value by moving the focus lenses 19R and 19L along the optical axis direction when the release button 14 is half-pressed, and a focusing lens based on the contrast value. Focus control for moving the focus lenses 19R and 19L to the position is performed.
  • the “contrast value” is calculated based on an image signal in a predetermined focus evaluation value calculation area of the captured image obtained by the CCDs 29R and 29L.
  • the “focus lens position” is the position of the focus lenses 19R and 19L at which the focus lenses 19R and 19L are focused on at least the main subject.
  • a captured image (right viewpoint image or The contrast value is calculated in (left viewpoint image).
  • the focus lens positions of the focus lenses 19R and 19L of the two photographing optical systems 11R and 11L are determined, respectively, and the motor drivers 27R and 27L are respectively driven so that the focus lenses 19R and 19L are respectively set.
  • An AF search may be performed in both the photographing optical systems 11R and 11L, and the respective focusing lens positions may be determined.
  • the posture detection sensor 73 detects the direction and angle in which the photographing optical systems 11R and 11L are rotated with respect to a predetermined posture.
  • the camera shake control unit 62 drives a correction lens (not shown) provided in the photographing optical systems 11R and 11L by a motor, thereby correcting a shift of the optical axis detected by the posture detection sensor 73 and preventing camera shake.
  • the CPU 26 controls the face recognition unit 64 to perform face recognition from left and right image data corresponding to the subject images of the photographing optical systems 11R and 11L.
  • the face recognition unit 64 starts face recognition under the control of the CPU 26 and performs face recognition from the left and right image data.
  • the face recognition unit 64 stores face area information including position information of face areas recognized from the left and right image data in the SDRAM 39.
  • the face recognition unit 64 can recognize a face area from an image stored in the SDRAM 39 by a known method such as template matching.
  • the face area of the subject includes a face area of a person or animal in the captured image.
  • the face correspondence determination unit 66 determines the correspondence between the face area recognized from the right image data and the face area recognized from the left image data. That is, the face correspondence determination unit 66 specifies a set of face areas in which the position information of the face areas recognized from the left and right image data are closest to each other. Then, the face correspondence determination unit 66 matches the image information of the face areas constituting the set, and when the accuracy of the identity between the two exceeds a predetermined threshold, the face areas constituting the set are associated with each other. It is determined that
  • the parallax detection unit 49 calculates a representative parallax between predetermined areas of the left and right image data.
  • the predetermined area may include a partial area or an entire area of the image.
  • the predetermined area includes a face area detected by known face detection, a face area that matches an arbitrarily registered face area of a specific person, a gaze point of an observer or a photographer of the monitor 13, an operation unit 25, and the like. 3, a gazing point or subject area of a stereoscopic video within the display surface of the monitor 13 that is arbitrarily designated from the user interface, an area near the gazing point, or the like.
  • the observer's gaze point can be detected by well-known gaze point detection in Patent Documents 2 to 4 and the like. If there are a plurality of observers on the monitor 13, a known gazing point detection can be applied to an observer who satisfies a specific condition, such as an observer closest to the monitor 13, and the gazing point can be detected.
  • the gazing point of the photographer may be all or part of the subject area designated at the time of photographing or at other timing.
  • the point-of-gaze detection may be performed by the digital camera 10 or may be performed by other devices such as an external display device such as a television or a head mounted display.
  • the representative parallax is calculated as follows. First, the parallax detection unit 49 calculates a position difference (corresponding point distance) between specific points (corresponding points) corresponding to the face regions constituting the set. And the parallax detection part 49 calculates the average value of the parallax of the point contained in the face area
  • the main face area is a face area closest to the center of the screen, a face area closest to the focus evaluation value calculation area, a face area having the largest size, or the like.
  • the parallax detection unit 49 creates a parallax histogram from the parallax of each corresponding point in a predetermined area (for example, a partial area such as a face area or the entire area) of the left and right image data.
  • a predetermined area for example, a partial area such as a face area or the entire area
  • the class is arbitrary.
  • the class value of the class having the highest frequency, that is, the mode value may be used as the representative parallax in the predetermined area.
  • the parallax detection unit 49 selects the maximum or minimum value of parallax from the parallax of each corresponding point in the predetermined area of the left and right image data, and uses the maximum or minimum value of the parallax as the representative parallax in the predetermined area. Good. If the predetermined area is a single point such as a gazing point, the representative parallax is the maximum value and the minimum value of the parallax of the gazing point.
  • the parallax detection unit 49 may use the median parallax of each corresponding point in the predetermined area of the left and right image data as the representative parallax in the predetermined area.
  • the parallax detection unit 49 may use the average parallax value of each corresponding point in the predetermined area of the left and right image data as the representative parallax in the predetermined area.
  • the representative parallax can be calculated by various statistical calculations. Note that those that do not satisfy a predetermined condition may be excluded from the sample values of parallax used for calculating the representative parallax. For example, the parallax of the corresponding point in an area where the sharpness (spatial frequency) of the image is lower than a predetermined reference value (so-called out-of-focus area) or the parallax exceeding a predetermined limit value is used for calculating the representative parallax.
  • the representative parallax may be calculated from the parallax of the corresponding points in the region that satisfies the predetermined condition by excluding the sample value of the parallax to be used.
  • This condition may be determined based on photographing conditions such as the zoom magnification of the photographing optical systems 11R and 11L. This is because the parallax of the same corresponding point is enlarged or reduced according to the enlargement or reduction of the zoom magnification. Note that there may be no predetermined condition for exclusion (unconditional).
  • the parallax detection unit 49 may detect a subject located on the back side (distant view side) that is a direction away from the digital camera 10 from the cross point of the left and right image data or on the near side (near view side) that is a direction approaching the digital camera 10.
  • the representative parallax may be calculated from the parallax using the statistical calculation described above.
  • the cross point is a convergence point where the optical axis of the photographing optical system 11R and the optical axis of the photographing optical system 11L intersect on the photographing symmetry plane.
  • the representative parallax may be calculated with a statistical calculation formula unified for different frames or across different scenes, or a plurality of types of representative parallax are calculated from the same frame with a plurality of statistical calculation formulas. Also good.
  • a plurality of types of representative parallax are obtained from one frame, for example, the maximum parallax value of any one frame F is the first representative parallax, and the minimum parallax value of the frame F is the second representative parallax. May be.
  • the representative parallax of each frame constituting the distant scene X is calculated from the parallax of the corresponding point of the subject located on the back side (distant view side) with respect to the cross point, using the above statistical calculation
  • the representative parallax of each frame constituting the foreground scene Y may be calculated from the parallax of the corresponding point of the subject located on the near side (near side) with respect to the cross point by using the above statistical calculation.
  • the maximum parallax value of the corresponding point on the far side from the cross point is obtained as the first representative parallax
  • the maximum parallax value of the corresponding point on the near side from the cross point is obtained as the second representative parallax.
  • the maximum parallax of the corresponding point on the far side from the cross point is the first representative parallax
  • the maximum parallax of the corresponding point on the near side from the cross point is the second representative parallax
  • the corresponding point on the far side from the cross point It is also possible to obtain the minimum parallax value as the third representative parallax and the minimum parallax value of the corresponding point closer to the foreground than the cross point as the fourth representative parallax.
  • the maximum value of all parallaxes in any frame included in the same scene can be obtained as the first representative parallax, and the minimum value of all parallaxes can be obtained as the second representative parallax.
  • only one type of representative parallax may be obtained by one statistical calculation, or a plurality of types may be obtained by a plurality of different statistical operations.
  • the parallax detection unit 49 calculates an average value of parallax between corresponding points in a predetermined area that is in a correspondence relationship between the left and right images, for example, the image center area or the focus evaluation value calculation area, The representative parallax.
  • the positional information of the predetermined area having the correspondence and the representative parallax thereof are stored in the SDRAM 39 in association with the left and right image data.
  • the positional information and the representative parallax of the face area having a correspondence relationship are stored as supplementary information (header, tag, meta information, etc.) of the image data.
  • tag information such as Exif
  • the position information of the face area and the representative parallax are combined and recorded in the incidental information of the recording image.
  • the display allowable parallax width acquisition unit 204 acquires the display allowable minimum parallax Dmin and the display allowable maximum parallax Dmax and inputs them to the parallax adjustment unit 202.
  • the mode of acquisition is arbitrary, and may be input from the operation unit 25, may be input from the ROM 61, auxiliary information of stereoscopic video data, or may be input from the monitor 13 as control information.
  • the display allowable maximum parallax Dmax defines the limit of the parallax in the spreading direction (the direction in which the stereoscopic image on the monitor 13 is retracted). As illustrated in part (a) of FIG. 4, since the human eye does not open outward, the left and right images having parallax exceeding the interpupillary distance are not fused, and the viewer cannot recognize as one image. Causes eye strain. Considering a child viewer, the interpupillary distance is about 5 cm, and the number of pixels of the monitor 13 corresponding to this distance is the display allowable maximum parallax Dmax.
  • the monitor 13 is a 16: 9-inch high-definition television and the resolution is 1920 ⁇ 1080
  • the display allowable minimum parallax Dmin for each size of the monitor 13 is as shown in FIG. If the size of the monitor 13 is small like a built-in screen of a digital camera or a mobile phone, the parallax in the spreading direction is unlikely to be a problem. However, in the case of the monitor 13 having a large display surface size such as a television, Parallax becomes a problem.
  • the display allowable minimum parallax Dmin defines the limit of excessive parallax (the direction in which the stereoscopic image on the monitor 13 pops out). Unlike the display allowable maximum parallax Dmax, the display allowable minimum parallax Dmin cannot be uniquely determined from the interpupillary distance. For example, output conditions for determining the display allowable minimum parallax Dmin include (1) the size of the monitor 13, (2) the resolution of the monitor 13, (3) viewing distance (distance from the viewer to the monitor 13), (4 ) There are three-dimensional fusion limits of individual viewers.
  • the threshold setting unit 205 may input the information (1) to (4) from the outside based on the user operation, the setting information of the monitor 13, or the like. For example, the user can input the resolution, viewing distance, and stereoscopic fusion limit of the monitor 13 he / she is viewing via the operation unit 25. However, when there is no particular input from (2) to (4) from the outside, the threshold value setting unit 205 reads the standard example from the ROM 61 or the like and inputs it to the parallax adjustment unit 202.
  • the parallax adjustment unit 202 performs adjustment so that the width of the representative parallax of the left and right image data falls within the display allowable parallax width including the range from the display allowable minimum parallax Dmin to the display allowable maximum parallax Dmax.
  • FIG. 5 shows a flowchart of parallax adjustment processing. This process is controlled by the CPU 26. A program for causing the CPU 26 to execute this processing is recorded on a computer-readable recording medium such as the ROM 61. This process is executed after the position information of the area and the representative parallax are stored in the incidental information of the image data.
  • the parallax adjustment unit 202 uses the left and right image data of each stereoscopic image frame that constitutes the entire or predetermined part of the stereoscopic moving image stored in the SDRAM 39 or the memory card 16 and the incidental information of the stereoscopic moving image. Attempts to read the representative parallax for each stereoscopic image frame.
  • a predetermined partial range of the stereoscopic video may be specified by the operation unit 25 or may be defined in the ROM 61 or the like.
  • the unit of the position and length of the range is also arbitrary, and can be specified by a frame number, shooting time, time interval, number of frames, and the like.
  • the display allowable parallax width acquisition unit 204 acquires the display allowable parallax width in the SDRAM 39.
  • the display allowable parallax width is a range from the display allowable minimum parallax Dmin to the display allowable maximum parallax Dmax.
  • the acquisition source of the display allowable parallax width includes the operation unit 25, the built-in ROM 61, the external monitor 13, an electronic device, and the like.
  • the maximum value among all types of representative parallaxes is set to pmax, and the representative parallax among all types of representative parallaxes.
  • parallax maximum value maxk of each frame Fk is the first type of representative parallax and the minimum parallax value of each frame Fk is the second type of representative parallax mink
  • pmax is the maximum parallax of each frame Fk.
  • the maximum value MAX (maxk) and pmin among the values are the minimum value MIN (mink) among the minimum parallax values of each frame Fk.
  • the parallax adjustment unit 202 determines whether or not the representative parallax maximum value pmax> the display allowable maximum parallax Dmax. If Yes, the process proceeds to S6. If No, the process proceeds to S5.
  • the parallax adjusting unit 202 determines whether or not the representative parallax minimum value pmin ⁇ display allowable minimum parallax Dmin. If Yes, the process proceeds to S6. If No, the process proceeds to S16.
  • the parallax adjustment unit 202 shifts the representative parallax of each stereoscopic image frame so that the stereoscopic moving image parallax width falls within the display allowable parallax width. That is, if it is determined Yes in S4, each representative parallax is shifted in the negative (downward) direction so that each representative parallax falls within the range of Dmax to Dmin. If it is determined Yes in S5, each representative parallax is shifted in the positive (upward) direction so that each representative parallax falls within the range of Dmax to Dmin.
  • the scene separation unit 206 detects a scene change of each stereoscopic image frame.
  • the level of scene detection by the scene separation unit 206 is variable.
  • the scene detection level is variable stepwise between levels 1 to 3.
  • the initial detection level at the time of the first execution of S7 is level 1, and a scene change is detected at the initial detection level until the level is changed in S13 described later. Further, it is assumed that the estimation accuracy of scene change detection decreases in the order of level 1> level 2> level 3.
  • the scene change detection method varies depending on the level.
  • a scene change is detected based on a user's explicit scene delimiter designation operation input from the operation unit 25 or the like.
  • the stereoscopic image frame specified in (2) is detected as a stereoscopic image frame having a scene change.
  • the editing operation includes designation of a cutout part of a stereoscopic image frame in a stereoscopic video, designation of a joint part of different stereoscopic videos, and the like.
  • a stereoscopic image frame in which the release button 14 is turned on / off can also be detected as a stereoscopic image frame having a scene change.
  • the stereoscopic image frame acquired at the time when the zoom lens 18 is zoomed by the zoom button 126 is detected as a stereoscopic image frame having a scene change.
  • the stereoscopic image frame b is converted to a stereoscopic image with a scene change.
  • This image information includes luminance information, color information, or information (such as a histogram) obtained by statistically processing such information.
  • the scene detection method corresponding to each level may be freely set by the user via the scene separation information input unit 207.
  • the scene separation information input unit 207 and the operation unit 25 may be a common means.
  • the scene separation unit 206 inputs scene information indicating the first stereoscopic image frame and the last stereoscopic image frame of each scene S (k) to the parallax adjustment unit 202.
  • k 1 to n, but the initial value of k is 1, and the value of k is incremented by 1 each time the loop of S7 to S15 is repeated.
  • the parallax adjustment unit 202 determines whether or not the maximum value pmax (k) of the representative parallax of the scene S (k)> the display allowable maximum parallax Dmax. If Yes, the process proceeds to S11. If No, the process proceeds to S10.
  • the parallax adjustment unit 202 determines whether or not the representative parallax minimum value pmin of the scene S (k) ⁇ the display allowable minimum parallax Dmin. If Yes, the process proceeds to S11. If No, the process proceeds to S15.
  • the parallax adjustment unit 202 shifts the representative parallax of each stereoscopic image frame of the scene S (k) in the positive or negative direction so that the representative parallax of the scene S (k) falls within the range of Dmax to Dmin.
  • the scene separation unit 206 determines whether or not a scene detection method having a lower separation level than the currently set scene separation level can be set. For example, if the scene detection level is variable between levels 1 to 3 as described above, it is determined as Yes if the current setting level is level 1 or 2, and No if the current setting level is level 3. To be judged.
  • the scene separation unit 206 changes the scene separation level. For example, the scene separation unit 206 sets a level having a one-step estimation accuracy lower than the current level as a new detection level. Thereafter, the process returns to S7, and a change in the scene of the stereoscopic video is detected at a new detection level. Alternatively, the scene change may be detected at both the previously set level and the currently set level.
  • the parallax adjustment unit 202 adjusts the representative parallax of each stereoscopic image frame of the scene S (k) so that the stereoscopic video parallax width of the scene S (k) falls within the display allowable parallax width. For example, when the stereoscopic video parallax width of the scene S (k) is X, the display allowable parallax width is Y, and X> Y, the representative parallax of each stereoscopic image frame of the scene S (k) is uniformly reduced. Reduce by (XY) / X.
  • the parallax adjustment unit 202 reads the stereoscopic video parallax-output parallax conversion table stored in the ROM 61 or the like into the SDRAM 39.
  • FIG. 6 shows an example of a stereoscopic video parallax-output parallax conversion table.
  • This table defines an integer output parallax corresponding to a representative parallax of an arbitrary value of each stereoscopic image frame.
  • the representative parallax of M to M + t corresponds to N output parallax
  • the representative parallax of M to M + 2t corresponds to N + 1 output parallax. Note that since the minimum display unit of an image is one pixel, the output parallax is expressed as an integer when expressed in pixel units.
  • the parallax adjustment unit 202 determines the output parallax corresponding to the representative parallax (including the shifted or reduced representative parallax) of each stereoscopic image frame according to the stereoscopic video parallax-output parallax conversion table stored in the ROM 61 or the like.
  • the display control unit 42 reproduces a stereoscopic video by sequentially displaying each stereoscopic image frame on the monitor 13 with the determined output parallax.
  • FIG. 7 illustrates the state of parallax width adjustment by this processing.
  • FIG. 7B illustrates a separated scene.
  • one stereoscopic moving image is separated into three scenes SN1 to SN3.
  • the moving image parallax width for each scene is compared with the display allowable parallax width in S8.
  • the result is No in S8
  • the scene change detection level is changed in S13, and the scene change is detected again at the changed level.
  • the result in S8 is Yes, and it is determined in S9 and / or S10 whether the representative parallax needs to be shifted or not. If it is determined in S9 that the maximum parallax of the scene exceeds the display allowable maximum parallax, or if it is determined in S10 that the minimum parallax of the scene is below the display allowable minimum parallax, in S11 The representative parallax of each stereoscopic image frame included in the scene is shifted so as to be within the range of the minimum value of the display allowable parallax.
  • FIG. 7 illustrates the shift of the representative parallax for each separated scene.
  • each representative parallax of the scene SN1 is shifted downward by a uniform ⁇ 1
  • each representative parallax of the scene SN2 is shifted downward by a uniform ⁇ 2
  • each representative parallax of the scene SN3 is shifted downward by a uniform ⁇ 3. It has been shifted.
  • the blocks necessary for executing the above processing may be provided in an electronic device other than the digital camera.
  • This processing can be executed by an image processing apparatus provided with a block for displaying.
  • the stereoscopic video input by the image input unit 201 is not limited to that directly output from the imaging means.
  • the media control unit 15 may read data from a medium such as the memory card 16 or may be received via a network.
  • the destination to which the image output unit 208 outputs the image for which the parallax adjustment has been completed is not limited to the display control unit 42 and the monitor 13, and the image may not be displayed immediately after the parallax adjustment.
  • the media control unit 15 may record the adjusted representative parallax for each stereoscopic image frame, that is, output parallax, as stereoscopic moving image data in association with each stereoscopic image frame on a medium such as the memory card 16.
  • the stereoscopic video data may be transmitted via a network.
  • each stereoscopic image frame can be a printed material such as a lenticular print.
  • the mode setting and timing of whether or not to operate the parallax adjustment process are arbitrary.
  • the parallax adjustment processing is not performed at the start of the shooting mode, but the parallax adjustment processing is started when the release button 14 is fully pressed.
  • the parallax adjustment processing is started when the stereoscopic video data of the memory card 16 is displayed on an external monitor 13 such as a television.
  • parallax adjustment processing can be executed for each of different types of representative parallax.
  • the parallax adjustment results for different types of representative parallax may not match, but in that case, an appropriate result for the observer can be selected and executed, or the parallax adjustment and the parallax width adjustment can be canceled. May be.
  • the disparity maximum disparity on the far side from the cross point is the first maximum representative disparity
  • the disparity minimum disparity on the distant side from the cross point is the first minimum representative disparity
  • the distant side is closer to the cross point.
  • the parallax adjustment processing is performed for the first maximum / minimum representative parallax
  • the maximum parallax value of the first parallax is the second maximum representative parallax
  • the minimum parallax value in the foreground from the cross point is the second minimum representative parallax
  • It is assumed that the parallax adjustment processing is performed for the two maximum / minimum representative parallaxes.
  • the moving image parallax width (second moving image parallax width) of the scene S (k) determined by the second maximum / minimum representative parallax is determined by the first maximum / minimum representative parallax even if YES in S8. It is assumed that the moving image parallax width (first moving image parallax width) of the scene S (k) is NO in S8, NO in S12, proceeds to S14, and parallax adjustment is performed in S14. In this case, returning to S1, the second maximum / minimum representative parallax and the second moving image parallax width are calculated from the scene S (k) after parallax adjustment, and the scene S (k) after parallax adjustment is calculated.
  • the parallax adjustment may be canceled and the moving image parallax adjustment may be restored.
  • the first moving image parallax width is YES in S8 and the second moving image parallax width is NO in S8. In this way, the adjustment of the disparity on the distant view side and the adjustment of the disparity on the near view side can be matched.
  • the parallax adjustment unit 202 determines which scene S (k ⁇ 1) for the previous scene S (k ⁇ 1) and the current scene S (k) (where 2 ⁇ k ⁇ n). ) ⁇ S (k) further determines whether the parallax width of the scene does not exceed the display allowable parallax width, and the parallax width of any of the scenes S (k ⁇ 1) ⁇ S (k) does not exceed the display allowable parallax width.
  • the scene S (k) may be shifted within the display allowable parallax width by a shift amount common to the scene S (k ⁇ 1). This process is repeated as k is incremented, and if the moving image parallax widths of two or more consecutive scenes do not exceed the display allowable parallax width, the two or more scenes fall within the display allowable parallax range. , Up or down with a common shift amount.
  • Part (b) of FIG. 9 illustrates a scene separated from this stereoscopic moving image.
  • one stereoscopic moving image is separated into three scenes SN1 to SN3.
  • the parallax width W1 in the two scenes SN1 and SN2 exceeds the display allowable parallax width W0.
  • the parallax width W2 in the two scenes SN2 and SN3 does not exceed the display allowable parallax width W0. In this case, it is determined in S9 and / or S10 whether the representative parallax needs to be shifted for the two scenes SN2 and SN3.
  • FIG. 9 part of FIG. 9 illustrates the shift of the representative parallax for each separated scene.
  • each representative parallax of the scene SN1 is uniformly shifted downward by ⁇ 1
  • each representative parallax of the scenes SN2 and SN3 is both shifted downward by ⁇ 2.
  • the scene A and the scene B are temporally adjacent to each other, the representative parallax adjustment amount of the scene A is a, and the representative parallax adjustment amount of the scene B is b.
  • the parallax adjustment unit 202 determines whether or not
  • the parallax adjustment unit 202 gradually changes the parallax adjustment amount from a to b from the first stereoscopic image frame of the scene B to the stereoscopic image frame about 100 frames later.
  • the parallax adjustment unit 202 gradually changes the parallax adjustment amount from a to b from a stereoscopic image frame that goes back about 50 frames from the end of the scene A to a stereoscopic image frame that advances about 50 frames from the beginning of the scene B.
  • a sudden change in the parallax adjustment amount associated with a scene change can be mitigated.
  • the change in the parallax adjustment amount between scenes may be performed according to a predetermined function using the time axis as a parameter, for example, a linear function.
  • parallax detection unit 202: parallax adjustment unit
  • 204 display allowable parallax width acquisition unit
  • 206 scene separation unit
  • 207 scene separation information input unit

Abstract

 本発明は、立体動画の視差幅が出力許容視差幅に適合しない場合、立体動画を複数のシーンに分離し、シーンごとのシーン視差幅が出力許容視差幅に適合するか否かを判断し、その判断結果に応じてシーンの代表視差を調整する。立体動画の視差幅の全体が一律に調整されるのではなく、シーンごとに視差幅が調整されるため、立体動画の立体感が全体的に失われるのを防げる。

Description

画像処理装置、方法およびプログラムならびにその記録媒体
 本発明は、画像処理に関し、特に、立体動画の各立体画像フレームの両眼視差の調整に関する。
 特許文献1の立体画像処理装置は、表示された被写体が限界視差に達すると、取得された適正視差情報に従い、以降の立体表示において当該適正視差を実現するよう視差画像を生成する。視差の制御は、3次元データに遡ってカメラパラメータを最適設定することで実現する。ここで、立体画像処理装置の二次元画像生成部は、適正視差を満たすデプスFxyを計算する。デプスの範囲をK1~K2とし、各画素のデプス値をGxyとすると、Fxy=J1+(Gxy-K1)×(J2-J1)/(K2-K1)である。Fxyが整数にならない場合は、四捨五入や近置視差が小さくなるような処理を施す。
 特許文献2の3次元画像処理装置では、視点座標系をもって透視された3次元画像を表示するディスプレイに、対面する観察者の観察視点を検出する観察視点センサを設け、この観察視点センサにより検出された観察視点に合わせてコンピュータが表示画像の視点座標系を移動することにより、ディスプレイに表示される3次元画像の透視視点を、観察者の観察視点に追従させて移動し、透視視点を常に観察視点に一致させて画像表示する。
 特許文献3の3次元像表示装置は、観察者の視点位置を検出する視点検知装置と、左右の目に対する視差をもった2つの映像を生成する映像生成装置と、2つの映像を別々に投影するために表示する映像表示装置と、表示された2つの映像を観察者の左右の目に別々に投影する映像投影装置とを備え、映像生成装置は、視点検知装置の出力信号に基づいて、観察者の視点の移動に対応して観察対象の観察方向の変化を反映した映像を生成する。また、映像生成装置は、視点検知装置の出力信号に基づいて観察者の視点の移動に対応した観察対象の観察方向の変化を反映し、且つ観察者の左右の目に対する視差をもった架空の物体の映像を生成する。
 特許文献4の立体画像表示方法では、ディスプレイの前方に液晶シャッタを設け、該液晶シャッタの前方にレンチキュラレンズを配置した表示部と観察者の視点位置が入力される制御部を備えた構成で、ディスプレイに右目・左目に対応した視差画像を時分割で表示するとともに、視差画像に同期しながら観察者の視点位置に応じて液晶シャッタの透光状態にする部分の幅と位置を変化させ、視差画像をレンチキュラレンズを介し対応する目で観察させる。
特開2004-221699号公報 特開平6-028452号公報 特開平9-238369号公報 特開平8-327948号公報
 視差を用いた立体動画は、適切な視差量で表示しないと、視聴者の疲労を誘発するおそれがある。適切な視差量は表示するディスプレイのサイズや視聴者の立体融合限界などによって変わるため、それに合わせた視差調整を行う必要がある。
 視差調整の結果、撮影時の視差とは異なった視差で立体画像が再生されると、視聴者に違和感を与えるおそれがある。このため、立体動画の撮影時の本来の視差をなるべく保つように視差調整を行うことが好ましい。
 特許文献1では、適正視差を満たすデプスFxyを計算して四捨五入するため、フレーム間で視差が同じになり、フレーム遷移に伴う立体感の変化が感じられなかったり、逆にフレーム間で大きな視差の変化がつきすぎて視聴者に疲労を与えるおそれがある。
 本発明は、立体動画の視差調整によって、元々の視差が大きく損なわれるのを防止することを目的とする。
 本発明は、立体動画の全部または所定の一部の範囲を構成する複数の立体画像フレームごとの代表視差を取得する代表視差取得部と、代表視差取得部の取得した各立体画像フレームの代表視差の最大値および最小値で規定される視差幅が、予め定められた最大許容視差および最小許容視差で規定される許容視差幅に適合しない場合、立体動画を複数のシーンに分離するシーン分離部と、シーン分離部の分離したシーンごとに、シーンを構成する立体画像フレームの代表視差の最大値および最小値で規定されるシーン視差幅が許容視差幅に適合するか否かを判断し、判断結果に応じてシーンを構成する各立体画像フレームの代表視差を許容視差幅に適合するよう一律に調整する視差調整部と、視差調整部が代表視差を調整した立体画像フレームを出力する出力部と、を備え、立体画像フレームごとの代表視差は、立体画像フレームの視差のうち所定の条件を満たす視差に基づいて算出された統計的演算値を含む画像処理装置を提供する。
 視差調整部は、あるシーンのシーン視差幅が許容視差幅に適合するが、シーンを構成する立体画像フレームの代表視差の最大値が予め定められた代表視差の上限を上回る場合、シーンを構成する各立体画像フレームの代表視差が代表視差の上限を下回るよう代表視差を調整する。
 視差調整部は、連続する2以上のシーンに対応する各シーン視差幅が許容視差幅に適合するが、連続する2以上のシーンを構成する立体画像フレームの代表視差の最大値が代表視差の上限を上回る場合、連続する2以上のシーンを構成する各立体画像フレームの代表視差が代表視差の上限を下回るよう代表視差を一律に調整する。
 視差調整部は、あるシーンのシーン視差幅が許容視差幅に適合するが、シーンを構成する立体画像フレームの代表視差の最小値が予め定められた代表視差の下限を下回る場合、シーンを構成する各立体画像フレームの代表視差が代表視差の下限を上回るよう代表視差を調整する。
 視差調整部は、連続する2以上のシーンに対応する各シーン視差幅が許容視差幅に適合するが、連続する2以上のシーンを構成する立体画像フレームの代表視差の最小値が代表視差の下限を下回る場合、連続する2以上のシーンを構成する各立体画像フレームの代表視差が代表視差の下限を上回るよう代表視差を一律に調整する。
 シーン分離部は、所定の第1の基準に従って分離されたシーンのシーン視差幅が許容視差幅に適合しない場合、所定の第1の基準および所定の第1の基準と異なる第2の基準に従って立体動画を分離する。
 第2の基準は、第1の基準よりもシーンの変化の推定確度が低い。
 視差調整部は、シーン分離部が第1の基準および第2の基準に従って分離したシーンごとに、シーンのシーン視差幅が許容視差幅に適合するか否かを判断し、シーンのシーン視差幅が許容視差幅に適合しないと判断した場合、シーンを構成する各立体画像フレームの代表視差を許容視差幅に適合するよう調整する。
 視差調整部は、隣接する2つのシーン間での代表視差の調整量の差が所定の閾値を超える場合、隣接する2つのシーン間での代表視差の調整量を平滑化する。
 好ましくは、統計的演算値は、立体画像フレームの視差の平均値、最大値、最小値、最頻値および中央値のうち少なくとも1つを含む。
 好ましくは、立体画像フレームごとの代表視差は、立体画像フレームの視差のうちクロスポイントよりも撮像装置から遠ざかる方向である遠景側に存在する被写体の視差の平均値、最大値、最小値、最頻値もしくは中央値およびクロスポイントよりも撮像装置に近づく方向である近景側に存在する被写体の視差の平均値、最大値、最小値、最頻値もしくは中央値のうち少なくとも1つを含む。
 好ましくは、所定の条件を満たす視差は、立体画像フレームに対する注視位置の視差を含む。
 好ましくは、注視位置は、立体画像フレームの視聴者の注視点、立体画像フレームの撮影者の注視点または立体画像フレーム内で任意に指定された注視点を含む。
 好ましくは、所定の条件を満たす視差は、顔領域の視差、合焦評価値算出領域の視差、画像中央領域の視差、立体画像フレームの視差のうちクロスポイントよりも撮像装置から遠ざかる方向である遠景側に存在する被写体の視差、または立体画像フレームの視差のうちクロスポイントよりも撮像装置に近づく方向である近景側に存在する被写体の視差を含む。
 好ましくは、立体画像フレームごとの代表視差は、立体画像フレームの視差のうち所定の条件を満たす視差の最大値である第1の代表視差と、立体画像フレームの視差のうち所定の条件を満たす視差の最小値である第2の代表視差の双方を含み、シーン分離部は、第1の代表視差の最大値および第2の代表視差の最小値で規定される視差幅が、予め定められた最大許容視差および最小許容視差で規定される許容視差幅に適合しない場合、立体動画を複数のシーンに分離する。
 本発明は、代表視差取得部と、シーン分離部と、視差調整部と、出力部と、を備える画像処理装置において、代表視差取得部が、立体動画の全部または所定の一部の範囲を構成する複数の立体画像フレームごとの代表視差を取得するステップと、シーン分離部が、代表視差取得部の取得した各立体画像フレームの代表視差の最大値および最小値で規定される視差幅が、予め定められた最大許容視差および最小許容視差で規定される許容視差幅に適合しない場合、立体動画を複数のシーンに分離するステップと、視差調整部が、シーン分離部の分離したシーンごとに、シーンを構成する立体画像フレームの代表視差の最大値および最小値で規定されるシーン視差幅が許容視差幅に適合するか否かを判断し、判断結果に応じてシーンを構成する各立体画像フレームの代表視差を許容視差幅に適合するよう一律に調整するステップと、出力部が、視差調整部が代表視差を調整した立体画像フレームを出力するステップと、を実行し、立体画像フレームごとの代表視差は、立体画像フレームの視差のうち所定の条件を満たす視差に基づいて算出された統計的演算値を含む画像処理方法を提供する。
 本発明は、代表視差取得部と、シーン分離部と、視差調整部と、出力部と、を備える画像処理装置において、代表視差取得部が、立体動画の全部または所定の一部の範囲を構成する複数の立体画像フレームごとの代表視差を取得するステップと、シーン分離部が、代表視差取得部の取得した各立体画像フレームの代表視差の最大値および最小値で規定される視差幅が、予め定められた最大許容視差および最小許容視差で規定される許容視差幅に適合しない場合、立体動画を複数のシーンに分離するステップと、視差調整部が、シーン分離部の分離したシーンごとに、シーンを構成する立体画像フレームの代表視差の最大値および最小値で規定されるシーン視差幅が許容視差幅に適合するか否かを判断し、判断結果に応じてシーンを構成する各立体画像フレームの代表視差を許容視差幅に適合するよう一律に調整するステップと、出力部が、視差調整部が代表視差を調整した立体画像フレームを出力するステップと、を実行し、立体画像フレームごとの代表視差は、立体画像フレームの視差のうち所定の条件を満たす視差に基づいて算出された統計的演算値を含む画像処理プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な非一時的記録媒体(non-transitory computer-readable medium)を提供する。
 本発明は、立体動画の視差幅が出力許容視差幅に適合しない場合、立体動画を複数のシーンに分離し、シーンごとのシーン視差幅が出力許容視差幅に適合するか否かを判断し、その判断結果に応じてシーンの代表視差を調整する。立体動画の視差幅の全体が一律に調整されるのではなく、シーンごとに視差幅が調整されるため、立体動画の立体感が全体的に失われるのを防げる。
デジタルカメラの正面斜視図 デジタルカメラの背面斜視図 デジタルカメラのブロック図 開散方向の視差の限界の模式図 視差調整処理のフローチャート 立体動画の代表視差-出力視差変換表の一例を示す図 第1実施形態に係る視差シフトの模式図 第2実施形態に係る視差シフトの模式図 表示再生装置のブロック図
 図1は、本発明の一実施形態であるデジタルカメラ10の外観構成を示す正面斜視図である。図2は、そのデジタルカメラの一例の外観構成を示す背面斜視図である。
 デジタルカメラ10は、複数の撮像手段(図1では二つを例示)を備えており、同一被写体を複数視点(図1では左右二つの視点を例示)から撮影可能となっている。なお、本例では、説明の便宜のため2つの撮像手段を備えた場合を例に説明するが、本発明はこれに限定されず、3つ以上の撮像手段を備えた場合であっても同様に適用可能である。
 本例のデジタルカメラ10のカメラボディ112は、矩形の箱状に形成されており、その正面には、図1に示すように、一対の撮影光学系11R、11Lと、ストロボ116が設けられている。また、カメラボディ112の上面には、レリーズボタン14、電源/モードスイッチ120、モードダイヤル122等が設けられている。また、カメラボディ112の背面には、図2に示すように、液晶表示装置(LCD)などで構成されたモニタ13、ズームボタン126、十字ボタン128、MENU/OKボタン130、DISPボタン132、BACKボタン134等が設けられている。モニタ13はデジタルカメラ10に内蔵されていてもよいし外部機器でもよい。
 左右一対の撮影光学系11R、11Lは、それぞれ沈胴式のズームレンズ(図3の18R、18L)を含んで構成されており、デジタルカメラ10の電源をONすると、カメラボディ112から繰り出される。なお、撮影光学系におけるズーム機構や沈胴機構については、公知の技術なので、ここでは、その具体的な説明を省略する。
 モニタ13は、半円筒状のレンズ群を有したいわゆるレンチキュラレンズが前面に配置されたカラー液晶パネル等の表示装置である。このモニタ13は、撮影済み画像を表示するための画像表示部として利用されるとともに、各種設定時にGUIとして利用される。また、撮影時には、撮像素子で捉えたライブビュー画像が表示され、電子ファインダとして利用される。なお、モニタ13の立体画像の表示方式は、パララックスバリア方式に限られない。例えば、アナグリフ方式、偏光フィルタ方式、液晶シャッタ方式など、めがねを利用した立体画像の表示方式でもよい。
 レリーズボタン14は、いわゆる「半押し」と「全押し」とからなる二段ストローク式のスイッチで構成されている。デジタルカメラ10は、静止画撮影時(例えば、モードダイヤル122またはメニューによる静止画撮影モード選択時)、このレリーズボタン14を半押しすると撮影準備処理、すなわち、AE(Automatic Exposure:自動露出)、AF(Auto Focus:自動焦点合わせ)、AWB(Automatic White Balance:自動ホワイトバランス)の各処理を行い、全押しすると、画像の撮影・記録処理を行う。また、立体動画撮影時(例えば、モードダイヤル122またはメニューにより立体動画撮影モード選択時)、このレリーズボタン14を全押しすると、立体動画の撮影を開始し、再度全押しすると、撮影を終了する。なお、設定により、レリーズボタン14を全押ししている間、立体動画の撮影を行い、全押しを解除すると、撮影を終了するようにもできる。なお、静止画撮影専用のレリーズボタンおよび立体動画撮影専用のレリーズボタンを設けてもよい。
 電源/モードスイッチ120(電源スイッチ及びモードスイッチ)は、デジタルカメラ10の電源スイッチとして機能するとともに、デジタルカメラ10の再生モードと撮影モードとを切り替える切替手段として機能する。モードダイヤル122は、撮影モードの設定に用いられる。デジタルカメラ10は、このモードダイヤル122を「2D静止画位置」にセットすることにより、2Dの静止画を撮影する2D静止画撮影モードに設定され、「3D静止画位置」にセットすることにより、3Dの静止画を撮影する3D静止画撮影モードに設定される。さらに、「3D動画位置」にセットすることにより、3Dの動画を撮影する3D動画撮影モードに設定される。
 ズームボタン126は、撮影光学系11R、11Lのズーム操作に用いられ、望遠側へのズームを指示するズームテレボタンと、広角側へのズームを指示するズームワイドボタンとで構成されている。十字ボタン128は、上下左右4方向に押圧操作可能に設けられており、各方向の押圧操作に対して、カメラの設定状態に応じた機能が割り当てられる。MENU/OKボタン130は、メニュー画面の呼び出し(MENU機能)に用いられるとともに、選択内容の確定、処理の実行指示等(OK機能)に用いられる。DISPボタン132は、モニタ13の表示内容の切り替え指示等の入力に用いられ、BACKボタン134は入力操作のキャンセル等の指示の入力に用いられる。
 図3は、デジタルカメラ10の要部を示すブロック図である。
 デジタルカメラ10は、右視点用の撮影光学系11Rおよび撮像素子29Rを有する右視点用の撮像手段と、左視点用の撮影光学系11Lおよび撮像素子29Lを有する左視点用の撮像手段を備える。
 2つの撮影光学系11(11R、11L)は、それぞれ、ズームレンズ18(18R、18L)、フォーカスレンズ19(19R、19L)、および、絞り20(20R、20L)を有する。これらのズームレンズ18、フォーカスレンズ19、および、絞り20は、それぞれ、ズームレンズ制御部22(22R、22L)、フォーカスレンズ制御部23(23R、23L)、絞り制御部24(24R、24L)により駆動される。各制御部22、23、24は、ステッピングモータからなり、CPU26に接続された不図示のモータドライバから与えられる駆動パルスにより制御される。
 2つの撮影光学系11(11R、11L)の背後には、それぞれ、CCDイメージセンサ(以下単に「CCD」という)29(29R、29L)が配置されている。なお、CCD29の代りに、MOS型のイメージセンサを用いるようにしてもよい。CCD29は、周知のように、複数の光電変換素子が並べられた光電変換面を有し、この光電変換面に撮影光学系11を介して被写体光が入射することにより、被写体像が結像される。CCD29には、CPU26によって制御されるタイミングジェネレータ:TG31(31R、31L)が接続され、このTG31から入力されるタイミング信号(クロックパルス)により、電子シャッタのシャッタ速度(各光電変換素子の電荷蓄積時間である)が決定される。
 CCD29から出力された撮像信号は、アナログ信号処理回路33(33R、33L)に入力される。アナログ信号処理回路33は、相関二重サンプリング回路(CDS)、増幅器(AMP)などを有する。CDSは、撮像信号から各画素の蓄積電荷時間に対応したR、G、Bの画像データを生成する。AMPは、生成された画像データを増幅する。
 AMPは、CCD29の感度を調節する感度調節手段として機能する。CCD29のISO感度は、AMPのゲインによって決定される。A/D変換器36(36R、36L)は、増幅された画像データをアナログからデジタルに変換する。A/D変換器36(36R、36L)から出力されたデジタルの画像データは、画像入力コントローラ38(38R、38L)を介して、作業用のメモリであるSDRAM39によりそれぞれ右の視点の画像データ、左の視点の画像データとして一時的に記憶される。
 デジタル信号処理部41は、SDRAM39から画像データを読み出して、階調変換、ホワイトバランス補正、γ補正処理、YC変換処理などの各種画像処理を施し、この画像データを再度SDRAM39に記憶させる。デジタル信号処理部41による画像処理済みの画像データは、VRAM65にスルー画として取得されたのち、表示制御部42で映像出力用のアナログ信号に変換され、モニタ13に表示される。また、レリーズボタン14の全押しに伴って取得された画像処理済みの画像データは、圧縮伸張処理部43で所定の圧縮形式(例えばJPEG形式)で圧縮された後、メディア制御部15を経由して、記録用画像としてメモリカード16に記録される。
 操作部25は、デジタルカメラ10の各種操作を行うためのものであり、図1および図2に示した各種のボタン・スイッチ120~134から構成されている。
 CPU26は、デジタルカメラ10を統括的に制御するために設けられている。CPU26は、フラッシュROM60やROM61などのコンピュータ読み取り可能な非一時的記録媒体に記憶された各種制御用のプログラムや設定情報、姿勢検出センサ73や操作部25からの入力信号などに基づいて、バッテリー70、電源制御部71、時計部72など各部を制御する。
 また、デジタルカメラ10には、AE(Auto Exposure)/AWB(Auto White Balance)制御を行うAE/AWB制御部47、複数の立体画像フレームの各々の代表視差の検出を行う視差検出部49が設けられている。また、デジタルカメラ10は、フラッシュ5の発光タイミングや発光量を制御するフラッシュ制御部23を備える。
 AE/AWB制御部47は、レリーズボタン14が半押しされたときに、CCD29により得られた画像(撮像画像)を解析して、被写体の輝度情報等に基づき、絞り20の絞り値およびCCD29の電子シャッタのシャッタ速度を算出する。そして、これらの算出結果に基づきAE/AWB制御部47は、絞り制御部24を介して絞り値を制御し、TG31を介してシャッタ速度を制御する。
 例えば、ふたつの撮影光学系11R、11Lのうち一方の撮影光学系のCCD29Rまたは29Lにより得られた撮像画像(右視点画像または左視点画像)に基づいて、両方の撮影光学系11R、11Lの絞り値およびシャッタ速度を算出する。両方の撮影光学系11Rおよび11Lにより得られた撮像画像(右視点画像および左視点画像)に基づいて、それぞれの撮影光学系11R、11Lの絞り値およびシャッタ速度を算出してもよい。
 AF制御部45は、レリーズボタン14が半押しされたときに、フォーカスレンズ19R、19Lを光軸方向に沿って移動させてコントラスト値を算出するAFサーチ制御、および、コントラスト値に基づく合焦レンズ位置にフォーカスレンズ19R、19Lを移動させる合焦制御を行う。ここで、「コントラスト値」は、CCD29R、29Lにより得られた撮像画像の所定の合焦評価値算出領域内の画像信号に基づいて算出される。「合焦レンズ位置」は、フォーカスレンズ19R、19Lが少なくとも主要被写体に合焦するフォーカスレンズ19R、19Lの位置である。
 例えば、ふたつの撮影光学系11R、11Lのフォーカスレンズ19R、19Lのうち少なくとも一方を、モータドライバ27Rまたは27Lの駆動により移動させながら、一方の撮影光学系11Rまたは11Lの撮像画像(右視点画像または左視点画像)にて、コントラスト値を算出する。そのコントラスト値に基づき、ふたつの撮影光学系11R、11Lのフォーカスレンズ19R、19Lの合焦レンズ位置をそれぞれ決定し、モータドライバ27Rおよび27Lをそれぞれ駆動して、各フォーカスレンズ19R、19Lをそれぞれの合焦レンズ位置に移動させる。両方の撮影光学系11R、11LにてそれぞれAFサーチを行って、それぞれの合焦レンズ位置を決定してもよい。
 姿勢検出センサ73は、撮影光学系11R、11Lが予め決められた姿勢に対して回転された方向および角度を検出する。
 手ブレ制御部62は、撮影光学系11R、11Lに設けられた図示しない補正レンズをモータによって駆動することで、姿勢検出センサ73の検出した光軸のずれを補正して手ブレを防止する。
 CPU26は、撮影光学系11R、11Lの被写体像に対応する左右の画像データから顔認識を行うよう顔認識部64を制御する。顔認識部64は、CPU26の制御に応じて顔認識を開始し、左右の画像データからそれぞれ顔認識を行う。顔認識部64は、顔認識の結果、左右の画像データからそれぞれから認識された顔領域の位置情報を含む顔領域情報をSDRAM39に記憶する。顔認識部64は、テンプレートマッチングなど公知の方法により、SDRAM39に記憶された画像から顔領域を認識することができる。なお被写体の顔領域とは、撮像画像中の人物や動物の顔領域が挙げられる。
 顔対応判定部66は、右の画像データから認識された顔領域と左の画像データから認識された顔領域の対応関係を判定する。すなわち、顔対応判定部66は、左右の画像データからそれぞれから認識された顔領域の位置情報同士が最も近接する顔領域の組を特定する。そして、顔対応判定部66は、当該組を構成する顔領域同士の画像情報をマッチングし、両者の同一性の確度が所定の閾値を超えた場合、当該組を構成する顔領域同士は対応関係にあると判定する。
 視差検出部49は、左右画像データの所定の領域間の代表視差を算出する。所定領域は、画像の一部領域または全体領域を含みうる。また、所定領域は、公知の顔検出により検出された顔領域、任意に登録された特定の人物の顔領域にマッチする顔領域、モニタ13の観察者や撮影者の注視点、操作部25などのユーザインターフェースから任意に指定されたモニタ13の表示面内での立体動画の注視点や被写体領域、あるいは注視点の近傍領域などを含みうる。モニタ13の観察者が単数であれば、特許文献2~4などの公知の注視点検出により、その観察者の注視点が検出されうる。モニタ13の観察者が複数であれば、モニタ13に最も近い観察者などのように、特定の条件を満たす観察者について、公知の注視点検出を適用し、その注視点が検出されうる。撮影者の注視点は、撮影時やそれ以外のタイミングで指定された被写体領域の全部または一部としてもよい。注視点検出は、デジタルカメラ10で行われてもよいし、その他の機器、例えばテレビやヘッドマウントディスプレイなどの外部の表示機器で行われてもよい。
 例えば、代表視差の算出は、次のようにする。まず、視差検出部49は、組を構成する顔領域間で対応する特定の点(対応点)間の位置の差(対応点間距離)を算出する。そして、視差検出部49は、当該組の顔領域に含まれる点の視差の平均値を算出し、これを当該組の代表視差とする。視差検出部49は、対応関係にあると判定された顔領域が複数存在する場合、それらの顔領域のうち、主要な顔領域についてのみ代表視差の算出を行い、この主要な顔領域の代表視差をSDRAM39に記憶する。主要な顔領域とは、画面中央に最も近い顔領域、合焦評価値算出領域に最も近い顔領域、サイズの最も大きい顔領域などである。
 あるいは、視差検出部49は、左右画像データの所定領域(例えば顔領域などの一部領域か、全体領域)の各対応点の視差から視差のヒストグラムを作成する。階級は任意である。そして、度数が最大の階級の階級値すなわち最頻値を、その所定領域における代表視差としてもよい。
 あるいは、視差検出部49は、左右画像データの所定領域の各対応点の視差から、視差の最大値または最小値を選択し、この視差の最大値または最小値をその所定領域における代表視差としてもよい。なお、所定領域が注視点のような一点であれば、代表視差は、その注視点の視差の最大値かつ最小値である。
 あるいは、視差検出部49は、左右画像データの所定領域の各対応点の視差の中央値を、その所定領域における代表視差としてもよい。
 あるいは、視差検出部49は、左右画像データの所定領域の各対応点の視差の平均値を、その所定領域における代表視差としてもよい。
 上記に限らず、代表視差は、各種の統計的演算にて算出されることができる。なお、代表視差の算出に用いる視差のサンプル値から、所定の条件を満たさないものを除外してもよい。例えば、画像の鮮鋭度(空間周波数)が所定の基準値よりも低い領域(いわゆるピンボケの領域)の対応点の視差や、所定の限界値を超過している視差などは、代表視差の算出に用いる視差のサンプル値から除外し、所定の条件を満たす領域の対応点の視差から代表視差を算出してもよい。この条件は、撮影光学系11R、11Lのズーム倍率などの撮影条件に基づいて決定されてもよい。これは、ズーム倍率の拡大または縮小に応じて、同じ対応点の視差が拡大したり縮小したりするからである。なお、除外の所定の条件がない(無条件)としてもよい。
 あるいは、視差検出部49は、左右画像データのクロスポイントよりもデジタルカメラ10から遠ざかる方向である奥側(遠景側)またはデジタルカメラ10に近づく方向である手前側(近景側)に位置する被写体の視差から、上記の統計的演算を用いて、代表視差を算出してもよい。ここで、クロスポイントとは、撮影光学系11Rの光軸と、撮影光学系11Lの光軸とを撮影対称面上で交差させた収束点である。
 さらに、代表視差は、異なるフレームごとあるいは異なるシーンに渡って統一された統計的演算式で算出されてもよいし、複数の統計的演算式にて同じフレームから複数種類の代表視差が算出されてもよい。
 例えば、任意の1つのフレームFの視差の最大値を第1の代表視差、そのフレームFの視差の最小値を第2の代表視差とするなど、1つのフレームから複数の種類の代表視差を求めてもよい。
 あるいは、遠景のシーンXを構成する各フレームの代表視差はクロスポイントよりも奥側(遠景側)に位置する被写体の対応点の視差から、上記の統計的演算を用いて代表視差を算出し、近景のシーンYを構成する各フレームの代表視差はクロスポイントよりも手前側(近景側)に位置する被写体の対応点の視差から、上記の統計的演算を用いて代表視差を算出してもよい。例えば、任意の1つのフレームにおいて、クロスポイントより遠景側の対応点の視差の最大値を第1の代表視差、クロスポイントより近景側の対応点の視差の最大値を第2の代表視差として求めることができる。
 あるいは、クロスポイントより遠景側の対応点の視差の最大値を第1の代表視差、クロスポイントより近景側の対応点の視差の最大値を第2の代表視差、クロスポイントより遠景側の対応点の視差の最小値を第3の代表視差、クロスポイントより近景側の対応点の視差の最小値を第4の代表視差として求めることもできる。
 あるいは、同一のシーンに含まれる任意のフレームにおける全ての視差の最大値を第1の代表視差、全ての視差の最小値を第2の代表視差として求めることができる。
 つまり、代表視差は1つの統計的演算により単一の種類だけ求められてもよいし、複数の異なる統計的演算により複数種類求められてもよい。
 あるいは、視差検出部49は、左右の画像で対応関係にある所定の領域、例えば、画像中央領域や合焦評価値算出領域内の対応点間の視差の平均値を算出し、これを当該組の代表視差とする。
 対応関係にある所定の領域の位置情報とその代表視差は、左右の画像データと対応づけられてSDRAM39に記憶される。例えば、対応関係にある顔領域の位置情報とその代表視差は、画像データの付帯情報(ヘッダ、タグ、メタ情報など)として記憶される。画像データがメモリカード16に記録用画像として圧縮記録される際は、例えば、Exifなどのタグ情報として、この顔領域の位置情報と代表視差が合わせて記録用画像の付帯情報に記録される。
 表示許容視差幅取得部204は、表示許容最小視差Dminおよび表示許容最大視差Dmaxを取得し、視差調整部202に入力する。取得の態様は任意であり、操作部25から入力されてもよいし、ROM61や立体動画データの付帯情報などから入力してもよいし、モニタ13から制御情報として入力されてもよい。
 表示許容最大視差Dmaxは、開散方向の視差(モニタ13上の立体画像が引っ込む方向)の限界を規定する。図4の(a)部分に例示するように、人の目は外側には開かないので、瞳孔間距離を超える視差を有する左右像は融合せず、視聴者が1つの像として認識できないので、眼精疲労を引き起こす。子供の視聴者を考慮すると、瞳孔間距離は、約5cmであるので、この距離に相当するモニタ13のピクセル数が表示許容最大視差Dmaxとなる。例えば、モニタ13が16:9インチサイズのハイビジョンテレビであり、解像度が1920×1080とすると、モニタ13のサイズごとの表示許容最小視差Dminは、図4の(b)部分のようになる。デジタルカメラや携帯電話の内蔵画面のようにモニタ13のサイズが小さければ、開散方向の視差は問題となりにくいが、テレビのように表示面のサイズが大きいモニタ13の場合は、開散方向の視差が問題になる。
 表示許容最小視差Dminは、過大視差(モニタ13上の立体画像が飛び出す方向)の限界を規定する。表示許容最小視差Dminは表示許容最大視差Dmaxと異なり瞳孔間距離から一意に決定することができない。例えば、表示許容最小視差Dminを決定する出力条件としては、(1)モニタ13のサイズ、(2)モニタ13の解像度、(3)観視距離(視聴者からモニタ13までの距離)、(4)視聴者個人の立体融合限界がある。
 標準的な例として、(2)ハイビジョンテレビのモニタ13の解像度は1920×1080、(3)観視距離はモニタ13の画面高さの3倍である。これらを前提とすると、(4)一般的な立体融合限界は57ピクセル(視差角1度程度)である。閾値設定部205は、(1)~(4)の情報をユーザ操作やモニタ13の設定情報などに基づいて外部から入力してもよい。例えば、ユーザは操作部25を介して、自分の観ているモニタ13の解像度、観視距離、立体融合限界を入力できる。ただし、(2)~(4)について特に外部から入力がない場合、閾値設定部205は、上記標準的な例をROM61などから読み出して視差調整部202に入力する。
 視差調整部202は、左右の画像データの代表視差の幅を、表示許容最小視差Dminから表示許容最大視差Dmaxまでの範囲からなる表示許容視差幅に収まる調整を行う。
 図5は視差調整処理のフローチャートを示す。この処理はCPU26によって制御される。この処理をCPU26に実行させるプログラムはROM61などのコンピュータ読み取り可能な記録媒体に記録されている。この処理は、画像データの付帯情報に上記の領域の位置情報と代表視差が記憶された後に実行される。
 S1では、視差調整部202は、SDRAM39またはメモリカード16に記憶された立体動画の全部または所定の一部の範囲を構成する各立体画像フレームの左右の画像データと、当該立体動画の付帯情報から、各立体画像フレームごとの代表視差の読み出しを試みる。立体動画の所定の一部の範囲は、操作部25で指定されてもよいし、ROM61などに規定されてもよい。当該範囲の位置と長さの単位も任意であり、フレーム番号、撮影時刻、時間間隔、フレーム数などで指定されうる。
 S2では、表示許容視差幅取得部204は、表示許容視差幅をSDRAM39に取得する。表示許容視差幅は、表示許容最小視差Dminから表示許容最大視差Dmaxまでの範囲をいう。表示許容視差幅の取得元は、操作部25、内蔵のROM61、外部のモニタ13や電子機器などを含む。
 S3では、視差調整部202は、各立体画像フレームの代表視差から、代表視差の最大値pmaxと代表視差の最小値pminを特定し、立体動画視差幅=pmax-pminを計算する。そして、視差調整部202は、立体動画視差幅<表示許容視差幅であるか否かを判断する。Yesの場合はS4に進み、Noの場合はS7に進む。
 ここで、代表視差が複数の演算式で求められ、複数種類の代表視差が存在する場合は、全ての種類の代表視差の中のうちの最大値をpmax、全ての種類の代表視差の中のうちの最小値をpminとして特定し、立体動画視差幅=pmax-pminを計算する。
 特に、各フレームFkの視差の最大値maxkを第1の種類の代表視差とし、各フレームFkの視差の最小値を第2の種類の代表視差minkとすると、pmaxは各フレームFkの視差の最大値の中の最大値MAX(maxk)、pminは各フレームFkの視差の最小値の中の最小値MIN(mink)となる。
 S4では、視差調整部202は、代表視差の最大値pmax>表示許容最大視差Dmaxであるか否かを判断する。Yesの場合はS6に進み、Noの場合はS5に進む。
 S5では、視差調整部202は、代表視差の最小値pmin<表示許容最小視差Dminであるか否かを判断する。Yesの場合はS6に進み、Noの場合はS16に進む。
 S6では、視差調整部202は、立体動画視差幅が表示許容視差幅に収まるよう各立体画像フレームの代表視差をシフトする。すなわち、S4でYesと判断された場合は、各代表視差を負(下)の方向にシフトし、各代表視差がDmax~Dminの範囲に収まるようにする。S5でYesと判断された場合は、各代表視差を正(上)の方向にシフトし、各代表視差がDmax~Dminの範囲に収まるようにする。
 S7では、シーン分離部206は、各立体画像フレームのシーンの変化の検出を行う。シーン分離部206によるシーンの検出のレベルは可変である。ここでは、シーンの検出のレベルは、レベル1~3の間で段階的に可変であるとする。最初のS7の実行時の初期検出レベルはレベル1であり、後述のS13でレベルが変更されるまでは初期検出レベルでシーン変化が検出される。また、レベル1>レベル2>レベル3の順に、シーン変化の検出の推定確度が低下するものとする。
 シーン変化の検出方法はレベルに応じて異なる。最もシーン変化の検出の推定確度が高いレベル1では、操作部25などから入力されたユーザの明示的なシーンの区切り指定操作を基準にシーン変化が検出される、例えば、編集操作によってシーンの区切りに指定された立体画像フレームをシーン変化のあった立体画像フレームと検出する。編集操作は、立体動画の中での立体画像フレームの切り取り箇所の指定や、異なる立体動画の接合箇所の指定などを含む。レリーズボタン14のオン・オフのあった立体画像フレームをシーン変化のあった立体画像フレームと検出することもできる。
 レベル1よりも検出の推定確度が低いレベル2では、ズームボタン126によるズームレンズ18の変倍操作のあった時点で取得された立体画像フレームをシーン変化のあった立体画像フレームと検出する。
 レベル2よりも検出の推定確度が低いレベル3では、隣り合う2つの立体画像フレームa・b間の画像情報の相違が所定の閾値を超えた場合、立体画像フレームbをシーン変化のあった立体画像フレームと検出する。この画像情報には、輝度情報、色情報、あるいはそれらの情報を統計処理した情報(ヒストグラムなど)などが含まれる。
 各レベルに対応するシーン検出方法は、シーン分離情報入力部207を介してユーザが自由に設定できてもよい。シーン分離情報入力部207と操作部25は共通の手段でもよい。
 シーン分離部206は、シーン変化の検出された立体画像フレームを基準に立体動画をn個(n=2、3・・)のセクションに分離する。シーン変化の検出された立体画像フレームを境に立体動画を区切ることで、分離された立体動画の各セクションがそれぞれ異なるシーンを構成する。シーン分離部206は、各シーンS(k)の最初の立体画像フレームと最後の立体画像フレームを示すシーン情報を視差調整部202に入力する。ここで、k=1~nであるが、kの初期値は1であり、S7~S15のループが繰り返される度にkの値は1だけインクリメントされるものとする。
 S8では、視差調整部202は、シーン情報に従って識別されるシーンS(k)内の各立体画像フレームの代表視差から、代表視差の最大値pmax(k)と代表視差の最小値pmin(k)を特定し、シーンS(k)の立体動画視差幅=pmax(k)-pmin(k)を計算する。そして、視差調整部202は、シーンS(k)の立体動画視差幅<表示許容視差幅であるか否かを判断する。Yesの場合はS9に進み、Noの場合はS12に進む。
 S9では、視差調整部202は、シーンS(k)の代表視差の最大値pmax(k)>表示許容最大視差Dmaxであるか否かを判断する。Yesの場合はS11に進み、Noの場合はS10に進む。
 S10では、視差調整部202は、シーンS(k)の代表視差の最小値pmin<表示許容最小視差Dminであるか否かを判断する。Yesの場合はS11に進み、Noの場合はS15に進む。
 S11では、視差調整部202は、シーンS(k)の代表視差がDmax~Dminの範囲に収まるよう、シーンS(k)の各立体画像フレームの代表視差を正または負の方向にシフトする。
 S12では、シーン分離部206は、現在設定されているシーンの分離レベルよりも低い分離レベルのシーンの検出方法が設定可能であるか否かを判断する。例えば、上記のようにシーンの検出のレベルがレベル1~3の間で可変の場合、現在の設定レベルがレベル1または2ならばYesと判断され、現在の設定レベルがレベル3ならばNoと判断される。
 S13では、シーン分離部206は、シーンの分離レベルを変更する。例えば、シーン分離部206は、現在のレベルよりも1段階推定確度の低いレベルを、新たな検出レベルに設定する。その後S7に戻り、新たな検出レベルで立体動画のシーンの変化の検出が行われる。あるいは、以前に設定されたレベルと今回設定されたレベルの双方でシーンの変化の検出が行われてもよい。
 S14では、視差調整部202は、シーンS(k)の立体動画視差幅が表示許容視差幅に収まるようシーンS(k)の各立体画像フレームの代表視差を調整する。例えば、シーンS(k)の立体動画視差幅がX、表示許容視差幅がYであり、かつX>Yである場合、シーンS(k)の各立体画像フレームの代表視差を一律な縮減率(X-Y)/Xで縮減する。
 S15では、CPU26は、k=n、すなわち、S7~S15のループが全てのシーンS(1)~S(n)に対して実行されたか否かを判断する。Yesの場合はS16に進み、Noの場合はkの値を1だけインクリメントしてS8に戻る。
 S16では、視差調整部202は、ROM61などに記憶されている立体動画視差-出力視差変換表をSDRAM39に読み出す。図6は立体動画視差-出力視差変換表の一例を示す。この表は、各立体画像フレームの任意の値の代表視差に対応する整数の出力視差を規定する。例えば、この表によると、M~M+tの代表視差はNの出力視差,M~M+2tの代表視差はN+1の出力視差に対応する。なお、画像の最小表示単位は1画素であるため、画素単位で出力視差を示すと整数となる。
 視差調整部202は、ROM61などに記憶された立体動画視差-出力視差変換表に従って、各立体画像フレームの代表視差(シフト後あるいは縮減後の代表視差も含む)に対応する出力視差を決定する。
 表示制御部42は、決定された出力視差で各立体画像フレームを順次モニタ13に表示することで立体動画を再生する。
 図7は本処理による視差幅調整の様子を例示する。
 例えば、図7の(a)部分に示すように、ある立体動画の動画視差幅が表示許容視差幅を超えているとする。この場合、S3でNoとなり、S7にてこの動画のシーン分離が行われる。図7の(b)部分は分離されたシーンを例示する。この図では、1つの立体動画が3つのシーンSN1~SN3に分離されている。
 シーンの分離後、S8にて、シーンごとの動画視差幅が表示許容視差幅と比較される。シーンの動画視差幅が表示許容視差幅を超える場合、S8でNoとなり、S13にてシーン変化の検出レベルが変更され、変更後のレベルで再びシーン変化が検出される。
 シーンの動画視差幅が表示許容視差幅を超えない場合、S8でYesとなり、S9および/またはS10にて、当該シーンについて代表視差のシフトの要否が判断される。S9にて当該シーンの最大視差が表示許容最大視差を超えていると判断されるか、S10にて当該シーンの最小視差が表示許容最小視差を下回っていると判断された場合は、S11にて当該シーンに含まれる各立体画像フレームの代表視差が表示許容視差の最小値から最大値の範囲に収まるようシフトされる。
 図7の(c)部分は分離されたシーンごとの代表視差のシフトを例示する。この図では、シーンSN1の各代表視差は一律Δ1だけ下側にシフトされ、シーンSN2の各代表視差は一律Δ2だけ下側にシフトされて、シーンSN3の各代表視差は一律Δ3だけ下側にシフトされている。
 上記の処理を実行するのに必要なブロックは、デジタルカメラ以外の電子機器に備えられていてもよい。例えば、図8に示すような、CPU26、VRAM65、SDRAM39、フラッシュROM60、ROM61、圧縮伸張処理部43、メディア制御部15、視差検出部49、視差調整部202、画像入力部201(例えば画像入力コントローラ38、メディア制御部15など)、表示許容視差幅取得部204、シーン分離部206、シーン分離情報入力部207、画像出力部208(例えばモニタ13、メディア制御部15など)などの平面または立体画像を表示するブロックを備えた画像処理装置がこの処理を実行することもできる。
 画像入力部201の入力する立体動画は、撮像手段から直接出力されたものに限られない。例えば、メディア制御部15がメモリカード16などのメディアから読み出したものや、ネットワーク経由で受信したものでもよい。
 画像出力部208が視差調整の完了した画像を出力する先は、表示制御部42およびモニタ13に限られず、画像は視差調整後に即時に表示されなくてもよい。例えば、メディア制御部15は、各立体画像フレームごとの調整後の代表視差すなわち出力視差を各立体画像フレームと対応づけた立体動画データとしてメモリカード16などのメディアに記録してもよい。あるいは、当該立体動画データをネットワーク経由で送信してもよい。あるいはそれぞれの立体画像フレームをレンチキュラプリントのような印刷物とすることもできる。
 また、視差調整処理を動作させるか否かのモード設定やタイミングも任意である。例えば、撮影モードの開始時は視差調整処理を行わないが、レリーズボタン14が全押しされたときから視差調整処理を開始する。あるいは、メモリカード16の立体動画データをテレビなどの外部のモニタ13に表示する際に、視差調整処理を開始する。
 以上の処理により、各立体画像フレームの代表視差が表示許容視差幅を超える場合は、シーンごとに視差幅圧縮の可否が判断され、シーン単位で視差幅が調整される。よって、撮影時の立体動画の代表視差を保って出力することができる。
 特に、pmax=MAX(maxk)、pmin=MIN(mink)とすると、観察者が感得する可能性のある最大視差から最小視差までの範囲が表示許容視差幅に調整され、疲労感を与える可能性がさらに低くなる。
 なお、上記の視差調整処理は、異なる種類の代表視差の各々について実行されることができる。この場合、異なる種類の代表視差について、視差調整の結果が整合しないことが考えられるが、その際には、観察者にとって適切な結果を選択して実行したり、視差調整および視差幅調整をキャンセルしてもよい。
 例えば、任意の1つのフレームにおいて、クロスポイントより遠景側の視差の最大値を第1の最大代表視差、クロスポイントより遠景側の視差の最小値を第1の最小代表視差、クロスポイントより近景側の視差の最大値を第2の最大代表視差、クロスポイントより近景側の視差の最小値を第2の最小代表視差とし、第1の最大・最小代表視差について視差調整処理が行われ、かつ第2の最大・最小代表視差について視差調整処理が行われるとする。
 そして例えば、第2の最大・最小代表視差で定まるシーンS(k)の動画視差幅(第2の動画視差幅)について、S8でYESとなっても、第1の最大・最小代表視差で定まるシーンS(k)の動画視差幅(第1の動画視差幅)についてS8でNOとなり、かつS12でNOとなってS14に進み、S14で視差調整が行われたとする。この場合、再びS1に戻って、視差調整後のシーンS(k)から第2の最大・最小代表視差と第2の動画視差幅を算出して、この視差調整後のシーンS(k)の第2の動画視差幅について、S8でNOとなった場合、視差調整をキャンセルし、動画の視差調整を行っていない状態に戻してもよい。同様なことは、第1の動画視差幅について、S8でYESとなっても、第2の動画視差幅についてS8でNOとなった場合も行うことができる。こうすれば、遠景側の視差の調整、近景側の視差の調整を整合させることができる。
 <第2実施形態>
 シーンごとに視差量の調整を行うと、シーンの変化に伴う出力視差の変動が撮影時のオリジナルの視差の変動と異なったものとなり、視聴者に違和感を与える可能性がある。そこで、S11において、視差調整部202は、1つ前のシーンS(k-1)と現在のシーンS(k)(ただしここでは2<k≦n)について、いずれのシーンS(k-1)・S(k)の視差幅も表示許容視差幅を超えないか否かをさらに判断し、いずれのシーンS(k-1)・S(k)の視差幅も表示許容視差幅を超えないと判断した場合、シーンS(k)をシーンS(k-1)と共通のシフト量で表示許容視差幅内にシフトするとよい。この処理をkのインクリメントに伴って繰り返し、連続する2以上のシーンの動画視差幅がいずれも表示許容視差幅を超えなければ、それらの2以上のシーンは、表示許容視差の範囲内に収まるよう、上にまたは下に共通のシフト量でシフトされる。
 例えば、図9の(a)部分に示すように、ある立体動画の立体画像フレームの代表視差が推移しているとする。図9の(b)部分はこの立体動画から分離されたシーンを例示する。この図では、1つの立体動画が3つのシーンSN1~SN3に分離されている。
 2つのシーンSN1・SN2における視差幅W1は、表示許容視差幅W0を超える。一方、2つのシーンSN2・SN3における視差幅W2は、表示許容視差幅W0を超えない。この場合、S9および/またはS10にて、2つのシーンSN2・SN3について代表視差のシフトの要否が判断される。S9にて当該シーンの最大視差が表示許容最大視差を超えていると判断されるか、S10にて当該シーンの最小視差が表示許容最小視差を下回っていると判断された場合は、S11にて、2つのシーンSN2・SN3に含まれる各立体画像フレームの代表視差が表示許容視差幅に収まるようシフトされる。
 図9の(c)部分は分離されたシーンごとの代表視差のシフトを例示する。この図では、シーンSN1の各代表視差は一律Δ1だけ下側にシフトされ、シーンSN2・SN3の各代表視差ははともにΔ2だけ下側にシフトされている。
 このように、連続するシーンの代表視差の視差幅が表示許容視差幅に収まる場合、それらのシーンの代表視差のシフト量を共通の値にすれば、シーンの変化の前後における視差の遷移が撮影時のものと同様となり、視聴者にとって観やすい立体画像となる。
 <第3実施形態>
 第1または2実施形態において、隣接するシーン間での代表視差の調整量(視差幅縮減による代表視差の変動量および/または代表視差のシフトによる変動量)の差異が大きいと、当該シーン間でのシーンの変化時に被写体の距離が急激に変化する可能性が高い。そこで、当該シーン間での代表視差の調整量の差異が所定の閾値以上である場合、当該シーン間での代表視差の調整量を平滑化するとよい。
 具体的には、シーンAとシーンBが時間的に隣接し、シーンAの代表視差の調整量がa、シーンBの代表視差の調整量がbとする。視差調整部202は、|a-b|<所定の閾値(例えば5画素)であるかを判断する。Noの場合、視差調整部202は、シーンAの代表視差の調整量aとシーンBの視差調整量bを、所定の範囲で平滑化する。
 例えば、視差調整部202は、シーンBの先頭の立体画像フレームから100フレーム程度後の立体画像フレームにかけて、視差調整量を、aからbに徐々に変化させる。あるいは、視差調整部202は、シーンAの最後尾から50フレーム程度遡った立体画像フレームからシーンBの先頭から50フレーム程度進んだ立体画像フレームにかけて、視差調整量を、aからbに徐々に変化させる。こうすれば、シーンの変化に伴う視差調整量の急激な変化を緩和できる。なお、シーン間での視差調整量の変化は、時間軸をパラメータとする所定の関数、例えば1次関数に従って行えばよい。
 49:視差検出部、202:視差調整部、204:表示許容視差幅取得部、206:シーン分離部、207:シーン分離情報入力部

Claims (18)

  1.  立体動画の全部または所定の一部の範囲を構成する複数の立体画像フレームごとの代表視差を取得する代表視差取得部と、
     前記代表視差取得部の取得した各立体画像フレームの代表視差の最大値および最小値で規定される視差幅が、予め定められた最大許容視差および最小許容視差で規定される許容視差幅に適合しない場合、前記立体動画を複数のシーンに分離するシーン分離部と、
     前記シーン分離部の分離したシーンごとに、前記シーンを構成する立体画像フレームの代表視差の最大値および最小値で規定されるシーン視差幅が前記許容視差幅に適合するか否かを判断し、前記判断結果に応じて前記シーンを構成する各立体画像フレームの代表視差を前記許容視差幅に適合するよう一律に調整する視差調整部と、
     前記視差調整部が代表視差を調整した立体画像フレームを出力する出力部と、
     を備え、
     前記立体画像フレームごとの代表視差は、前記立体画像フレームの視差のうち所定の条件を満たす視差に基づいて算出された統計的演算値を含む画像処理装置。
  2.  前記視差調整部は、あるシーンのシーン視差幅が前記許容視差幅に適合するが、前記シーンを構成する立体画像フレームの代表視差の最大値が予め定められた代表視差の上限を上回る場合、前記シーンを構成する各立体画像フレームの代表視差が前記代表視差の上限を下回るよう前記代表視差を調整する請求項1に記載の画像処理装置。
  3.  前記視差調整部は、連続する2以上のシーンに対応する各シーン視差幅が前記許容視差幅に適合するが、前記連続する2以上のシーンを構成する立体画像フレームの代表視差の最大値が前記代表視差の上限を上回る場合、前記連続する2以上のシーンを構成する各立体画像フレームの代表視差が前記代表視差の上限を下回るよう前記代表視差を一律に調整する請求項2に記載の画像処理装置。
  4.  前記視差調整部は、あるシーンのシーン視差幅が前記許容視差幅に適合するが、前記シーンを構成する立体画像フレームの代表視差の最小値が予め定められた代表視差の下限を下回る場合、前記シーンを構成する各立体画像フレームの代表視差が前記代表視差の下限を上回るよう前記代表視差を調整する請求項1~3のいずれかに記載の画像処理装置。
  5.  前記視差調整部は、連続する2以上のシーンに対応する各シーン視差幅が前記許容視差幅に適合するが、前記連続する2以上のシーンを構成する立体画像フレームの代表視差の最小値が前記代表視差の下限を下回る場合、前記連続する2以上のシーンを構成する各立体画像フレームの代表視差が前記代表視差の下限を上回るよう前記代表視差を一律に調整する請求項4に記載の画像処理装置。
  6.  前記シーン分離部は、所定の第1の基準に従って分離されたシーンのシーン視差幅が前記許容視差幅に適合しない場合、前記所定の第1の基準および前記所定の第1の基準と異なる第2の基準に従って前記立体動画を分離する請求項1~5のいずれかに記載の画像処理装置。
  7.  前記第2の基準は、前記第1の基準よりも前記シーンの変化の推定確度が低い請求項6に記載の画像処理装置。
  8.  前記視差調整部は、前記シーン分離部が前記第1の基準および前記第2の基準に従って分離したシーンごとに、前記シーンのシーン視差幅が前記許容視差幅に適合するか否かを判断し、前記シーンのシーン視差幅が前記許容視差幅に適合しないと判断した場合、前記シーンを構成する各立体画像フレームの代表視差を前記許容視差幅に適合するよう調整する請求項6または7に記載の画像処理装置。
  9.  前記視差調整部は、隣接する2つのシーン間での代表視差の調整量の差が所定の閾値を超える場合、前記隣接する2つのシーン間での代表視差の調整量を平滑化する請求項1~8のいずれかに記載の画像処理装置。
  10.  前記統計的演算値は、前記立体画像フレームの視差の平均値、最大値、最小値、最頻値および中央値のうち少なくとも1つを含む請求項1~9のいずれかに記載の画像処理装置。
  11.  前記立体画像フレームごとの代表視差は、前記立体画像フレームの視差のうちクロスポイントよりも撮像装置から遠ざかる方向である遠景側に存在する被写体の視差の平均値、最大値、最小値、最頻値もしくは中央値およびクロスポイントよりも撮像装置に近づく方向である近景側に存在する被写体の視差の平均値、最大値、最小値、最頻値もしくは中央値のうち少なくとも1つを含む請求項10に記載の画像処理装置。
  12.  前記所定の条件を満たす視差は、前記立体画像フレームに対する注視位置の視差を含む請求項1または10に記載の画像処理装置。
  13.  前記注視位置は、前記立体画像フレームの視聴者の注視点、前記立体画像フレームの撮影者の注視点または前記立体画像フレーム内で任意に指定された注視点を含む請求項12に記載の画像処理装置。
  14.  前記所定の条件を満たす視差は、顔領域の視差、合焦評価値算出領域の視差、画像中央領域の視差、前記立体画像フレームの視差のうちクロスポイントよりも撮像装置から遠ざかる方向である遠景側に存在する被写体の視差、または前記立体画像フレームの視差のうちクロスポイントよりも撮像装置に近づく方向である近景側に存在する被写体の視差を含む請求項1または10に記載の画像処理装置。
  15.  前記立体画像フレームごとの代表視差は、前記立体画像フレームの視差のうち所定の条件を満たす視差の最大値である第1の代表視差と、前記立体画像フレームの視差のうち所定の条件を満たす視差の最小値である第2の代表視差の双方を含み、
     前記シーン分離部は、前記第1の代表視差の最大値および前記第2の代表視差の最小値で規定される視差幅が、予め定められた最大許容視差および最小許容視差で規定される許容視差幅に適合しない場合、前記立体動画を複数のシーンに分離する請求項1~14のいずれかに記載の画像処理装置。
  16.  代表視差取得部と、シーン分離部と、視差調整部と、出力部と、を備える画像処理装置において、
     前記代表視差取得部が、立体動画の全部または所定の一部の範囲を構成する複数の立体画像フレームごとの代表視差を取得するステップと、
     前記シーン分離部が、前記代表視差取得部の取得した各立体画像フレームの代表視差の最大値および最小値で規定される視差幅が、予め定められた最大許容視差および最小許容視差で規定される許容視差幅に適合しない場合、前記立体動画を複数のシーンに分離するステップと、
     前記視差調整部が、前記シーン分離部の分離したシーンごとに、前記シーンを構成する立体画像フレームの代表視差の最大値および最小値で規定されるシーン視差幅が前記許容視差幅に適合するか否かを判断し、前記判断結果に応じて前記シーンを構成する各立体画像フレームの代表視差を前記許容視差幅に適合するよう一律に調整するステップと、
     前記出力部が、前記視差調整部が代表視差を調整した立体画像フレームを出力するステップと、
     を実行し、
     前記立体画像フレームごとの代表視差は、前記立体画像フレームの視差のうち所定の条件を満たす視差に基づいて算出された統計的演算値を含む画像処理方法。
  17.  代表視差取得部と、シーン分離部と、視差調整部と、出力部と、を備える画像処理装置において、
     前記代表視差取得部が、立体動画の全部または所定の一部の範囲を構成する複数の立体画像フレームごとの代表視差を取得するステップと、
     前記シーン分離部が、前記代表視差取得部の取得した各立体画像フレームの代表視差の最大値および最小値で規定される視差幅が、予め定められた最大許容視差および最小許容視差で規定される許容視差幅に適合しない場合、前記立体動画を複数のシーンに分離するステップと、
     前記視差調整部が、前記シーン分離部の分離したシーンごとに、前記シーンを構成する立体画像フレームの代表視差の最大値および最小値で規定されるシーン視差幅が前記許容視差幅に適合するか否かを判断し、前記判断結果に応じて前記シーンを構成する各立体画像フレームの代表視差を前記許容視差幅に適合するよう一律に調整するステップと、
     前記出力部が、前記視差調整部が代表視差を調整した立体画像フレームを出力するステップと、
     を実行し、
     前記立体画像フレームごとの代表視差は、前記立体画像フレームの視差のうち所定の条件を満たす視差に基づいて算出された統計的演算値を含む画像処理プログラム。
  18.  請求項17に記載の画像処理プログラムを記録したコンピュータ読み取り可能な非一時的記録媒体。
PCT/JP2012/078933 2011-12-19 2012-11-08 画像処理装置、方法およびプログラムならびにその記録媒体 WO2013094329A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2013550179A JP5571257B2 (ja) 2011-12-19 2012-11-08 画像処理装置、方法およびプログラム
CN201280062910.1A CN104054333A (zh) 2011-12-19 2012-11-08 图像处理装置、方法以及程序及其记录介质
US14/280,138 US9094671B2 (en) 2011-12-19 2014-05-16 Image processing device, method, and recording medium therefor

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2011-277352 2011-12-19
JP2011277352 2011-12-19

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US14/280,138 Continuation US9094671B2 (en) 2011-12-19 2014-05-16 Image processing device, method, and recording medium therefor

Publications (1)

Publication Number Publication Date
WO2013094329A1 true WO2013094329A1 (ja) 2013-06-27

Family

ID=48668228

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2012/078933 WO2013094329A1 (ja) 2011-12-19 2012-11-08 画像処理装置、方法およびプログラムならびにその記録媒体

Country Status (4)

Country Link
US (1) US9094671B2 (ja)
JP (1) JP5571257B2 (ja)
CN (1) CN104054333A (ja)
WO (1) WO2013094329A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103391447A (zh) * 2013-07-11 2013-11-13 上海交通大学 3d节目镜头切换中安全深度保证与调整方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107087112B (zh) * 2017-05-31 2020-01-10 Oppo广东移动通信有限公司 双摄像头的控制方法和控制装置
JP7022544B2 (ja) * 2017-09-13 2022-02-18 キヤノン株式会社 画像処理装置及び方法、及び撮像装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010111040A1 (en) * 2009-03-23 2010-09-30 Waterdance, Inc. Stereo camera with automatic control of interocular distance
JP2011109408A (ja) * 2009-11-17 2011-06-02 Funai Electric Co Ltd 三次元信号生成装置
WO2011121818A1 (ja) * 2010-03-30 2011-10-06 富士フイルム株式会社 複眼撮像装置、その視差調整方法及びプログラム
JP2011223482A (ja) * 2010-04-14 2011-11-04 Sony Corp 画像処理装置、画像処理方法、およびプログラム

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4086585A (en) * 1976-12-27 1978-04-25 Dimensional Development Corporation System and camera for controlling depth of field in three-dimensional photography
US6590573B1 (en) * 1983-05-09 2003-07-08 David Michael Geshwind Interactive computer system for creating three-dimensional image information and for converting two-dimensional image information for three-dimensional display systems
US4852972A (en) * 1987-06-08 1989-08-01 Wah Lo Allen K Method of controlling variation of density of images in 3-D pictures
JPH0628452A (ja) 1991-08-07 1994-02-04 Nec Home Electron Ltd 3次元画像処理装置
US5337096A (en) * 1993-08-23 1994-08-09 Pantech, Inc. Method for generating three-dimensional spatial images
JPH08327948A (ja) 1995-05-31 1996-12-13 Canon Inc 立体画像表示方法及び立体画像表示装置
JPH09238369A (ja) 1996-02-29 1997-09-09 Mitsubishi Electric Corp 3次元像表示装置
US7365875B2 (en) * 2002-05-14 2008-04-29 Canon Kabushiki Kaisha Image processing apparatus, image processing method, program, and recording medium
JP2004221699A (ja) 2003-01-09 2004-08-05 Sanyo Electric Co Ltd 立体画像処理方法および装置
US20100097444A1 (en) * 2008-10-16 2010-04-22 Peter Lablans Camera System for Creating an Image From a Plurality of Images
US9288470B2 (en) * 2008-12-02 2016-03-15 Lg Electronics Inc. 3D image signal transmission method, 3D image display apparatus and signal processing method therein
US8199186B2 (en) * 2009-03-05 2012-06-12 Microsoft Corporation Three-dimensional (3D) imaging based on motionparallax
US8780185B2 (en) * 2009-11-25 2014-07-15 Olympus Imaging Corp. Image pickup apparatus having a display controlled using interchangeable lens information and/or finder information
US20130002656A1 (en) * 2010-01-13 2013-01-03 Thomson Licensing System and method for combining 3d text with 3d content
KR101329065B1 (ko) * 2010-03-31 2013-11-14 한국전자통신연구원 영상 시스템에서 영상 데이터 제공 장치 및 방법
JP5336662B2 (ja) * 2010-07-26 2013-11-06 富士フイルム株式会社 画像処理装置、方法およびプログラム
JP5891424B2 (ja) * 2010-09-17 2016-03-23 パナソニックIpマネジメント株式会社 立体映像作成装置および立体映像作成方法
KR101763686B1 (ko) * 2010-11-15 2017-08-01 삼성전자 주식회사 입체 영상 처리 장치 및 그 처리 방법
US8878950B2 (en) * 2010-12-14 2014-11-04 Pelican Imaging Corporation Systems and methods for synthesizing high resolution images using super-resolution processes
JP5011431B2 (ja) * 2010-12-21 2012-08-29 株式会社東芝 映像信号処理装置および処理方法ならびに映像表示装置
US8937644B2 (en) * 2012-03-21 2015-01-20 Canon Kabushiki Kaisha Stereoscopic image capture

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010111040A1 (en) * 2009-03-23 2010-09-30 Waterdance, Inc. Stereo camera with automatic control of interocular distance
JP2011109408A (ja) * 2009-11-17 2011-06-02 Funai Electric Co Ltd 三次元信号生成装置
WO2011121818A1 (ja) * 2010-03-30 2011-10-06 富士フイルム株式会社 複眼撮像装置、その視差調整方法及びプログラム
JP2011223482A (ja) * 2010-04-14 2011-11-04 Sony Corp 画像処理装置、画像処理方法、およびプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103391447A (zh) * 2013-07-11 2013-11-13 上海交通大学 3d节目镜头切换中安全深度保证与调整方法

Also Published As

Publication number Publication date
CN104054333A (zh) 2014-09-17
US9094671B2 (en) 2015-07-28
JP5571257B2 (ja) 2014-08-13
US20140247327A1 (en) 2014-09-04
JPWO2013094329A1 (ja) 2015-04-27

Similar Documents

Publication Publication Date Title
US9560341B2 (en) Stereoscopic image reproduction device and method, stereoscopic image capturing device, and stereoscopic display device
US8736671B2 (en) Stereoscopic image reproduction device and method, stereoscopic image capturing device, and stereoscopic display device
WO2012023330A1 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体
JP5449550B2 (ja) 立体画像表示装置、立体画像表示方法、立体画像表示プログラムおよび記録媒体
JP5336662B2 (ja) 画像処理装置、方法およびプログラム
JP5449551B2 (ja) 画像出力装置、方法およびプログラム
US9310672B2 (en) Stereoscopic image capturing device and method of controlling thereof
JP5486697B2 (ja) 立体動画再生装置、立体動画再生プログラムならびにその記録媒体、立体ディスプレイ装置、立体撮像装置及び立体動画再生方法
JP5571257B2 (ja) 画像処理装置、方法およびプログラム
WO2012101916A1 (ja) 立体動画処理装置、立体動画処理プログラム及びその記録媒体、立体撮像装置並びに立体動画処理方法
JP5580486B2 (ja) 画像出力装置、方法およびプログラム
JP5466773B2 (ja) 立体動画再生装置、立体動画再生プログラムならびにその記録媒体、立体ディスプレイ装置、立体撮像装置及び立体動画再生方法
JP2012015620A (ja) 立体撮像装置
US20130120374A1 (en) Image processing device, image processing method, and image processing program
JP2012044319A (ja) 画像処理装置、画像処理方法及び立体撮像装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12860978

Country of ref document: EP

Kind code of ref document: A1

DPE1 Request for preliminary examination filed after expiration of 19th month from priority date (pct application filed from 20040101)
ENP Entry into the national phase

Ref document number: 2013550179

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 12860978

Country of ref document: EP

Kind code of ref document: A1