WO2019176930A1 - 合成映像作成装置および合成映像作成方法並びに合成映像作成プログラム - Google Patents
合成映像作成装置および合成映像作成方法並びに合成映像作成プログラム Download PDFInfo
- Publication number
- WO2019176930A1 WO2019176930A1 PCT/JP2019/009964 JP2019009964W WO2019176930A1 WO 2019176930 A1 WO2019176930 A1 WO 2019176930A1 JP 2019009964 W JP2019009964 W JP 2019009964W WO 2019176930 A1 WO2019176930 A1 WO 2019176930A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- image
- image conversion
- images
- composite video
- coordinate
- Prior art date
Links
- 239000002131 composite material Substances 0.000 title claims abstract description 93
- 238000000034 method Methods 0.000 title claims description 28
- 238000006243 chemical reaction Methods 0.000 claims abstract description 263
- 239000011159 matrix material Substances 0.000 claims abstract description 161
- 230000009466 transformation Effects 0.000 claims description 45
- 238000000605 extraction Methods 0.000 claims description 20
- 239000000284 extract Substances 0.000 claims description 5
- 230000010365 information processing Effects 0.000 claims description 5
- 230000000007 visual effect Effects 0.000 description 8
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 239000004973 liquid crystal related substance Substances 0.000 description 3
- 238000009966 trimming Methods 0.000 description 2
- 240000004050 Pentaglottis sempervirens Species 0.000 description 1
- 235000004522 Pentaglottis sempervirens Nutrition 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003702 image correction Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4038—Image mosaicing, e.g. composing plane images from plane sub-images
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/18—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
- H04N7/181—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a plurality of remote sources
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/187—Segmentation; Edge detection involving region growing; involving region merging; involving connected component labelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/30—Determination of transform parameters for the alignment of images, i.e. image registration
- G06T7/37—Determination of transform parameters for the alignment of images, i.e. image registration using transform domain methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/97—Determining parameters from multiple pictures
Definitions
- the present invention relates to a composite video creation device, a composite video creation method, and a composite video creation program for creating a composite video by connecting two or more videos each having an area where two adjacent videos overlap each other.
- a composite image creation technique for creating a composite image (such as a panorama image) by joining two or more images each having a region where two adjacent images overlap each other has been put into practical use.
- a composite image creation technique currently in practical use, for example, there is a technique that performs the following series of processes.
- a feature point is detected for each of two images having regions overlapping each other.
- the feature amount of the feature point is extracted.
- Corresponding points of the two images are detected based on the feature amount.
- an image conversion matrix for aligning the positions of the two images is calculated.
- One image is subjected to coordinate transformation using the image transformation matrix, and the coordinate systems of both images are matched.
- a composite image is created by superimposing the two images.
- This composite video creation technique can be used for, for example, a so-called electronic mirror for a vehicle.
- the electronic mirror is configured as follows. Cameras are arranged in the left, center, and right directions behind the vehicle. For each camera image, a series of panoramic images are created by connecting two adjacent images (ie, the left and center images and the center and right images). The created panoramic image is displayed on an image display device such as a liquid crystal display arranged in front of the driver's seat so that the driver can visually recognize it.
- the composite image creation technology When the composite image creation technology is applied to an electronic mirror, there may be frequent displacement between the images of each camera due to relative movement between the cameras due to vehicle vibration or the like.
- the image conversion matrix is updated (corrected) every time there is a positional shift between the images of each camera, the displayed panoramic video flickers (fluctuates), causing the driver to feel annoyance, As a result, the driving of the vehicle may be hindered.
- the present invention solves the above-described problems, and provides a composite video creation device, a composite video creation method, and a composite video creation program in which flickering of the composite video is suppressed.
- the present invention relates to a composite video creation device that creates a composite video by connecting two videos having regions that overlap each other in the regions that overlap each other, wherein the composite video creation device includes an image acquisition unit and a feature amount extraction unit An image conversion matrix generation unit, an image conversion unit, an image output unit, and a correction determination unit, and the image acquisition unit sequentially acquires two images, one each from the two videos.
- the feature amount extraction unit detects feature points for the two acquired images, respectively, and extracts feature amounts of the detected feature points, and the image transformation matrix generation unit extracts the extracted feature points.
- Corresponding points of the two images are detected based on the feature quantities of the feature points, and the coordinate systems of the two images are associated based on the coordinates of the detected corresponding points (for example, the coordinate systems are matched or coordinated) Or said
- the image conversion matrix is sequentially generated, and the image conversion unit performs coordinate conversion on at least one of the two images by using the generated image conversion matrix, and the 2
- the coordinate system of two images is associated, and the image output unit creates and outputs a composite image by superimposing two images associated with the coordinate system, and the correction determination unit is currently used
- the image conversion matrix and the newly generated image conversion matrix are compared, and the two image conversion matrices are similar to each other according to a predetermined criterion for determining the difference or similarity between the two image conversion matrices.
- the image conversion unit that is currently used is continued to use the image conversion unit to perform the coordinate conversion.
- the image conversion matrix used for the coordinate conversion is corrected with the newly generated image conversion matrix (for example, switched to the newly generated image conversion matrix), and the coordinate conversion is performed on the image conversion unit.
- the composite video creation device is configured to create the composite video by sequentially creating the composite image as time progresses. According to this, since frequent update of the image conversion matrix is suppressed, flickering of the composite video is suppressed, and as a result, it is possible to reduce troublesomeness for the viewer of the composite video.
- the image conversion matrix can be, for example, an image conversion matrix that associates the coordinate system of one of the two images with the coordinate system of the other image. According to this, it is possible to associate the coordinate systems of the two images by converting the coordinates of one of the two images.
- the correction determination unit as the determination criterion, for example, on the difference between element values (referred to as element values) between corresponding elements of the currently used image conversion matrix and the newly generated image conversion matrix
- the degree of difference or similarity between the two image conversion matrices can be determined.
- the image transformation matrix is corrected by determining the difference or similarity between the two image transformation matrices using the value based on the difference between the element values of the corresponding elements of the two image transformation matrices as an index value. Can do.
- the index value does not exceed a predetermined threshold (determination reference value) (that is, when the difference between the two image conversion matrices is low or the similarity is high), it is determined that the two image conversion matrices are similar.
- the currently used image conversion matrix can be continuously used.
- the index value exceeds a predetermined threshold (that is, when the degree of difference between the two image conversion matrices is high or the degree of similarity is low)
- a predetermined threshold that is, when the degree of difference between the two image conversion matrices is high or the degree of similarity is low
- the image conversion matrix used in the above can be corrected with the newly generated image conversion matrix. For example, the following can be used as an index value based on the difference between the element values of corresponding elements of the two image conversion matrices.
- the feature amount extraction unit may extract the feature amount with respect to images at appropriate time intervals, for example. According to this, it is possible to reduce the amount of calculation compared to the case where the feature amount is extracted for the images at all times (that is, all frames).
- the correction determination unit for example, when the image conversion matrix is determined to be dissimilar, the image conversion matrix used for the coordinate conversion on the condition that the state determined to be dissimilar continues for a predetermined time, Correction may be performed using the newly generated image conversion matrix. According to this, it is possible to suppress the occurrence of flickering in the video by correcting the image conversion matrix due to the temporary vibration of the video.
- the composite video creation apparatus performs processing in each of the two adjacent videos for each of the three or more videos each having an area where two adjacent videos overlap each other. It is possible to create a composite image by connecting the images in the overlapping areas. According to this, even when three or more videos are connected, the flicker of the synthesized video is suppressed, and the troublesomeness given to the viewer can be reduced.
- the direction in which the images of the three or more videos are connected can be variously set as follows, for example. -Using the coordinate system of the image at one end as a reference (that is, fixing the coordinate system), the image at the other end is sequentially connected in one direction. -Connects to both ends of the image sequentially in both directions with reference to the coordinate system of the center image.
- This invention can be applied to, for example, a vehicle visual recognition device.
- a vehicle visual recognition device for example, for the three images of the left direction behind the vehicle, the center direction behind the vehicle, and the right direction behind the vehicle having areas where two adjacent images overlap each other.
- the three videos can be connected to each other in the overlapping area to create a synthesized video. According to this, it is possible to obtain a panoramic image connecting three images of the left direction, the center direction, and the right direction behind the vehicle.
- the image conversion matrix generation unit for example, for the three images acquired from the three videos, the left direction and the coordinate system of the image in the central direction, An image conversion matrix that associates the coordinate systems of the two images in the right direction is generated, and the image conversion unit performs coordinate conversion of the images in the left direction and the right direction using the generated image conversion matrices, respectively. Then, the left and right image coordinate systems are associated with the central image coordinate system, and the image output unit superimposes the three images associated with the coordinate systems to A composite image can be created and output. According to this, since the coordinate system of the image in the center direction behind the vehicle, which is important when driving the vehicle, does not change, the center image does not flicker, and a panoramic image suitable for driving can be obtained.
- the correction determination unit for example, between the elements reflecting the difference between the element values reflecting the parallel movement amount in the both image conversion matrices and the rotation angle between the elements.
- the degree of difference or similarity between the two image transformation matrices can be determined using the determination criterion using a value based on the difference between element values as an index value. It is considered that fluctuations in the shift of the coordinate system between the left, center, and right images of the rear of the vehicle occur in the parallel movement direction and the rotation direction. Therefore, among the elements of the image conversion matrix, the value based on the difference between the element values reflecting the translation amount and the difference between the element values reflecting the rotation angle is used as the index value, thereby obtaining the image conversion matrix. Compared with the case where the value based on the difference between the element values of all corresponding elements is used as the index value, the amount of calculation can be reduced.
- the composite video creation program of the present invention is a program for causing an information processing device to function as the composite video creation device of the present invention. According to this, the information processing apparatus can be caused to function as the composite video creating apparatus according to the present invention.
- the composite video creation method of the present invention is a method of creating a composite video by connecting two video images having mutually overlapping areas in the mutually overlapping areas, and the method includes one each from the two video images. Sequentially acquiring two images, sequentially generating an image transformation matrix that associates the coordinate systems of the two images, and using the generated image transformation matrix to coordinate at least one of the two images.
- the composite video creation program of the present invention is a program for causing an information processing apparatus to execute the composite video creation method of the present invention.
- FIG. 3 is a functional block diagram showing an embodiment of the present invention in a case where the present invention is applied to a composite video creation device that synthesizes the images of the three cameras in FIG.
- a visual device for a vehicle that synthesizes and displays the images of three cameras arranged in the left direction behind the vehicle, the central direction behind the vehicle, and the right direction behind the vehicle, It is a model top view which shows an example of arrangement
- FIG. 2 is a schematic diagram illustrating an example of a display area of the composite image in an image display device that displays three images at a certain point of time synthesized by the composite video creation device of FIG. 1 and a composite image obtained by the synthesis.
- 3 is a flowchart showing an example of control content of a composite video creation operation by the composite video creation device of FIG. 1.
- FIG. 2 shows the arrangement of the cameras in the vehicle.
- a left camera 12L, a central camera 12C, and a right camera 12R are provided on the left side (for example, the left door mirror), the rear part (for example, in the vicinity of the number plate at the center in the width direction of the rear part of the vehicle), and the right side (for example, the right door mirror). Each is installed.
- These cameras 12L, 12C, and 12R are respectively constituted by electronic cameras such as a CCD camera and a CMOS camera.
- the photographing magnifications of the cameras 12L, 12C, and 12R are fixed and equal to each other.
- the cameras 12L, 12C, and 12R take images of respective fields of view (that is, continuous images) at a frame rate of a predetermined frame per second, and sequentially output video signals of the taken images.
- An example of the horizontal field of view of the cameras 12L, 12C, and 12R is shown in gray in FIG. In this example, the horizontal visual fields of the left camera 12L, the central camera 12C, and the right camera 12R are set as follows.
- the region ZL and the region ZC have a region ZLC that overlaps each other, and the region ZC and the region ZR have a region ZCR that overlaps each other.
- the vertical fields of view of the cameras 12L, 12C, and 12R are set in appropriate angle ranges from an appropriate downward angle to an appropriate upward angle around the horizontal direction.
- FIG. 1 is a functional block diagram of a composite video creation device 14 according to the present invention that synthesizes video captured by the three cameras 12L, 12C, and 12R of FIG.
- the composite video creation device 14 converts the coordinate system of each video of the left camera 12L and the right camera 12R so as to match the coordinate system of the video of the central camera 12C, and superimposes these three videos to create a panoramic video. Is configured to create.
- a left image acquisition unit 16L, a center image acquisition unit 16C, and a right image acquisition unit 16R are images (left image, center image, and right image) captured by the left camera 12L, the center camera 12C, and the right camera 12R, respectively. ) Are acquired sequentially for each frame synchronously or asynchronously.
- the feature quantity extraction units 18L, 18C, and 18R detect feature points of the acquired left image, center image, and right image at the same time point (at the same time or approximately the same time) and the feature values of the detected feature points. Perform extraction in sync with each other.
- the feature point detection and feature quantity extraction can be performed using a feature quantity extraction algorithm such as SIFT (Scale-invariant feature transform) or SURF (Speed-Upped Robust Feature).
- SIFT Scale-invariant feature transform
- SURF Speed-Upped Robust Feature
- the image conversion matrix generation unit 20 detects a plurality of corresponding points of the left image and the center image based on the feature amounts extracted for the left image and the center image, respectively. These corresponding points are corresponding points in the region ZLC (FIG. 2) where the left image and the center image overlap each other. Further, the image conversion matrix generation unit 20 detects a plurality of corresponding points of the center image and the right image based on the feature amounts extracted for the center image and the right image, respectively. These corresponding points are corresponding points in the region ZCR (FIG. 2) where the center image and the right image overlap each other. The corresponding points can be detected by, for example, the following algorithm.
- the degree of similarity is obtained by the least square method or the like for the feature amount detected for each feature point.
- Feature points having a high degree of similarity if the least square method is used, feature points whose difference sum of squares is close to 0 or less than a predetermined threshold.
- the determined feature points are detected as corresponding points.
- the image conversion matrix generation unit 20 further generates an image conversion matrix that associates the coordinate systems of the two images based on the coordinates of the detected corresponding points. That is, for the set of the left image and the center image, an image conversion matrix TL that matches the coordinate system of the left image with the coordinate system of the center image is generated with reference to the coordinate system of the center image. For the set of the center image and the right image, an image conversion matrix TR that matches the coordinate system of the right image with the coordinate system of the center image is generated with reference to the coordinate system of the center image.
- the image transformation matrices TL and TR can be generated as an affine transformation matrix, for example.
- the image conversion unit 22 performs coordinate conversion of the left image and the right image using the generated image conversion matrices TL and TR, respectively. That is, the image conversion unit 22 performs coordinate conversion of the left image using the image conversion matrix TL, and matches the coordinate system of the left image with the coordinate system of the central image. Further, the image conversion unit 22 performs coordinate conversion of the right image using the image conversion matrix TR, and matches the coordinate system of the right image with the coordinate system of the central image. As a result of these coordinate transformations, the coordinate system of the left image and the right image is matched with the coordinate system of the central image.
- the coordinate conversion process in the image conversion unit 22 for an image at a certain point in time can be performed without waiting for the end of the image conversion matrix generation process in the image conversion matrix generation unit 20 based on the image. That is, when the image conversion matrix generation unit 20 based on the image at a certain point in time waits for the end of the image conversion matrix generation processing to be performed, the image conversion unit 22 performs coordinate conversion processing on the image conversion matrix generation unit 20. When it takes time to generate the image conversion matrix, the coordinate conversion processing for the image is delayed, and the image is displayed with a delay. This display delay is not desirable for use in vehicle electronic mirrors.
- the coordinate conversion process in the image conversion unit 22 for the image at a certain time is performed without waiting for the end of the image conversion matrix generation process in the image conversion matrix generation unit 20 based on the image.
- the display delay associated with the image conversion matrix generation process can be eliminated.
- the image is subjected to coordinate conversion by an image conversion matrix generated based on an image acquired before the image.
- the time difference between the two images is not so large, the images are connected on the displayed panoramic image. It is considered that a large shift hardly occurs in the eyes (or even if it occurs, the large shift is eliminated within a short time).
- the image output unit 24 creates and outputs a composite image by superimposing the left image, the center image, and the right image with the coordinate systems matched. In this case, for the regions ZLC and ZCR that overlap each other, for example, the corresponding regions of the left image and the right image are masked, and the corresponding region of the center image is output. As a result, the image output unit 24 outputs a panoramic image in which the left image, the center image, and the right image are connected.
- the composite video creation device 14 creates a panoramic video by sequentially performing coordinate conversion processing in the image conversion unit 22 and image superimposition processing in the image output unit 24 for each frame.
- the panoramic video created by the composite video creation device 14 is appropriately trimmed and displayed on an image display device such as a liquid crystal display arranged in front of the driver's seat.
- the driver looks at the video and drives the vehicle while confirming the situation around the rear of the vehicle (that is, a wide-angle region in the horizontal direction extending from the left to the center to the right after the vehicle). be able to.
- FIG. 3 schematically shows an example of three images (left image IL, center image IC, and right image IR) at a certain point of time synthesized by the synthesized video creating device 14 and a display area D in the image display device.
- the left image IL, the center image IC, and the right image IR are connected to each other and constitute a panoramic image.
- the panoramic video is appropriately trimmed and displayed in the display area D of the image display device.
- the coordinate conversion is performed with reference to the coordinate system of the central image IC (that is, the coordinate system of the central image IC is not moved), and the trimming position is fixed with respect to the central image IC, whereby the central image is displayed with respect to the display area D.
- the position of the IC can be fixed. As a result, it is possible to prevent flickering (fluctuation) of an image in the vehicle rear center direction which is important for driving the vehicle by image processing (coordinate conversion and trimming), and a panoramic image suitable for driving can be obtained.
- the correction determination unit 26 determines whether or not the image conversion matrix needs to be corrected by comparing the currently used image conversion matrix with the newly generated image conversion matrix.
- the currently used image conversion matrix is an image conversion matrix that is generated based on images acquired in the past and is used for the current coordinate conversion processing.
- the newly generated image conversion matrix is an image conversion matrix that is generated based on a newly acquired image and is not used for the coordinate conversion processing.
- the correction determination unit 26 determines whether or not the two image conversion matrices are similar based on a predetermined determination criterion for determining the difference or similarity between the two image conversion matrices.
- the image conversion unit 22 When it is determined that both the image conversion matrices are “similar”, the image conversion unit 22 is caused to perform coordinate conversion by continuously using the image conversion matrix currently used. On the other hand, when it is determined that the two image conversion matrices are “dissimilar”, the image conversion matrix used for the coordinate conversion is switched to the newly generated image conversion matrix and the image conversion unit 22 performs the coordinate conversion. Let it be done.
- the correction determination unit 26 sets, for example, a determination criterion in which a value based on a difference between element values of corresponding elements of the currently used image conversion matrix and a newly generated image conversion matrix is used as an index value. Then, the correction determination unit 26 determines the difference or similarity between the two image conversion matrices using this determination criterion, and switches the image conversion matrix. In this case, the correction determination unit 26 determines that the two image conversion matrices are similar when the index value does not exceed a predetermined threshold (when the difference between the two image conversion matrices is low or the similarity is high). Then, the image conversion unit 22 is caused to perform coordinate conversion of the acquired image by continuously using the currently used image conversion matrix.
- the correction determination unit 26 determines that the two image conversion matrices are different when the index value exceeds a predetermined threshold (when the difference between the two image conversion matrices is high or the similarity is low). . Then, the correction determination unit 26 causes the image conversion unit 22 to switch to the newly generated image conversion matrix and perform coordinate conversion of the acquired image. By such correction of the image conversion matrix, it is possible to correct a shift in the coordinate system among the left image, the center image, and the right image. As a result, it is possible to suppress a panoramic image shift. In addition, by determining whether or not correction is necessary by setting a threshold value, when the shift in the coordinate system between the images is small and the shift in the panoramic image is not visually noticeable, the shift in the coordinate system is corrected.
- the correction determination unit 26 is not limited to immediately correcting the image conversion matrix when the index value exceeds the threshold, but on condition that the state exceeding the threshold has continued for a predetermined time. It is also possible to correct the image conversion matrix. In this way, it is possible to suppress the image conversion matrix from being switched by momentary vibration or the like of a part of the three videos and flickering due to the influence of the other videos.
- index value based on the difference between the element values of the corresponding elements of the currently used image conversion matrix and the newly generated image conversion matrix used as a determination criterion in the correction determination unit 26 is, for example, for example, the following index values (a) to (d) can be used. However, the index value is not limited to these. Index value (a): For all elements of both image conversion matrices, the absolute value of the difference between element values is taken for each element, and the value obtained as the sum of the absolute values.
- Index value (b) Both image conversions For all elements of the matrix, take the square value of the difference between the element values for each element, and the value / index value obtained as the sum of the square values (c): not for all elements of both image transformation matrices but for specific elements The absolute value of the difference between the element values is taken for each element, and the value / index value obtained as the sum of the absolute values (d): for every element of both image transformation matrices, for each element Take the square value of the difference between the values, the value obtained as the sum of the square values When using the index value (c) or (d) based on a specific element of the image transformation matrix, the calculation is performed compared to using the index value (a) or index value (b) based on all elements of the image transformation matrix. The amount can be reduced, and the determination of whether correction is necessary can be speeded up.
- any of the index values (a) to (d) is such that the currently used image conversion matrix approximates the newly generated image conversion matrix (that is, the lower the difference or the higher the similarity). Small value. Therefore, when the index values (a) to (d) are used, the correction determination unit 26 determines whether the calculated values of the index values (a) to (d) are the same as the predetermined threshold value set as the determination criterion. Is smaller, both image conversion matrices are determined to be “similar”. At this time, the correction determination unit 26 causes the image conversion unit 22 to continue using the currently used image conversion matrix to perform coordinate conversion of the acquired image.
- the correction determination unit 26 determines that both image conversion matrices are “dissimilar”. At this time, the correction determination unit 26 causes the image conversion unit 22 to switch to the newly generated image conversion matrix and perform coordinate conversion of the acquired image.
- affine transformation is used for coordinate transformation in this embodiment.
- the affine transformation is a transformation combining translation, scale (enlargement and reduction), skew (shear), and rotation.
- the imaging magnifications of the cameras 12L, 12C, and 12R are fixed and equal to each other, so that the image magnification does not change. Also, no image shear occurs. Therefore, if a change occurs in the coordinate system between the images of the cameras 12L, 12C, and 12R, it is considered that the movement is caused by translation or rotation.
- the elements of the affine transformation matrix used for determining whether or not the image transformation matrix needs to be corrected in the correction determination unit 26 can be limited to elements relating to the parallel movement amount and elements relating to the rotation angle.
- An affine transformation formula combining translation and rotation is expressed by Formula 1a or Formula 1b.
- x and y are coordinates before coordinate conversion
- X and Y are coordinates after coordinate conversion
- tx is a parallel movement amount in the x-axis direction
- ty is a parallel movement amount in the y-axis direction
- the correction determination unit 26 uses, for example, the elements tx and ⁇ sin (q) of the affine transformation matrix of Expression 1a or Expression 1b as “specific elements”. Two elements can be used. In this case, the index values (c) and (d) are expressed by Expression 2 and Expression 3, respectively.
- the correction determination unit 26 can use not only two elements but also three elements, for example, elements tx, ty, and ⁇ sin (q). Further, the element cos (q) can be used instead of the element -sin (q).
- the left image acquisition unit 16L, the center image acquisition unit 16C, and the right image acquisition unit 16R sequentially acquire the left image, the center image, and the right image of the image captured by the left camera 12L, the center camera 12C, and the right camera 12R for each frame.
- the feature amount extraction units 18L, 18C, and 18R perform image conversion (for example, graying) for extracting feature amounts of the acquired left image, center image, and right image at the same time point.
- the feature quantity extraction units 18L, 18C, and 18R perform feature quantity extraction (detection of feature points and calculation of feature quantities of the detected feature points) from the image-converted images (S2). Note that, as described above, the feature amount extraction can be performed every frame or every other frame.
- the image conversion matrix generation unit 20 detects a plurality of corresponding points between the left image and the center image and a plurality of corresponding points between the center image and the right image based on the feature amounts extracted for the left image, the center image, and the right image, respectively. To do.
- the image conversion matrix generation unit 20 further generates image conversion matrices TL and TR for matching the positions of the corresponding points based on the detected coordinates of the corresponding points (S3). That is, for the left image and the center image, the image conversion matrix generation unit 20 generates an image conversion matrix TL for performing coordinate conversion of the left image so that the corresponding point of the left image matches the corresponding point of the center image.
- the image conversion matrix generation unit 20 generates an image conversion matrix TR that performs coordinate conversion of the right image so that the corresponding point of the right image matches the corresponding point of the central image.
- the correction determination unit 26 determines whether or not the image conversion matrix needs to be corrected by comparing the currently used image conversion matrix with the newly generated image conversion matrix for each of the image conversion matrices TL and TR. . That is, the correction determination unit 26 determines whether the index value based on the difference between the element values of the corresponding elements in the currently used image conversion matrix and the newly generated image conversion matrix exceeds a predetermined threshold value. Then, it is determined whether or not the image conversion matrix needs to be corrected (S4). Then, when the index value does not exceed the threshold value, the correction determination unit 26 determines that correction is not necessary (“NO” in S4), and instructs the image conversion unit 22 to use the currently used image conversion matrix TL.
- TR are continuously used to perform coordinate conversion of the acquired image (S5). Further, the correction determination unit 26 determines that the correction is necessary when the index value exceeds the threshold value (“YES” in S4) and the state exceeding the threshold value continues for a predetermined time (“YES” in S6). Then, the image conversion unit 22 is switched to the newly generated image conversion matrix to perform coordinate conversion of the acquired image (S7). Further, the correction determination unit 26 does not need correction when the index value exceeds the threshold value (“YES” in S4) but does not continue for a predetermined time (“NO” in S6). The image conversion unit 22 is caused to perform coordinate conversion of the acquired image by using the image conversion matrices TL and TR that are currently used (S5). Image correction matrix correction processing (S4 to S7) is performed independently for each of the image conversion matrices TL and TR.
- the image conversion unit 22 sequentially acquires a left image, a center image, and a right image for each frame from each image captured by the left camera 12L, the center camera 12C, and the right camera 12R (S8). Then, the image conversion unit 22 performs coordinate conversion on the left image using the image conversion matrix TL specified by the correction determination unit 26, thereby matching the coordinate system of the left image with the coordinate system of the central image. The image conversion unit 22 performs coordinate conversion on the right image using the image conversion matrix TR designated by the correction determination unit 26, thereby matching the coordinate system of the right image with the coordinate system of the central image (S9). .
- the image output unit 24 creates and outputs a panoramic composite image by superimposing the left image, the center image, and the right image with the coordinate systems matched (S9, S10).
- the composite image creating apparatus 14 According to the composite image creating apparatus 14 according to the above-described embodiment, its usefulness is exhibited, for example, in the following scene.
- the image transformation matrix When multiple cameras are retrofitted to a vehicle to synthesize panoramic images, if the direction of each camera is roughly set, the image transformation matrix is automatically corrected and the image is connected. Eyes are met.
- the coordinate conversion processing in the image conversion unit for the image at a certain point in time is performed after completion of the generation processing of the image conversion matrix in the image conversion matrix generation unit based on the image (that is, generated based on the image at the certain point in time) It is also possible to perform coordinate transformation of the image using an image transformation matrix).
- the coordinate systems of the left image and the right image are coordinate-transformed in accordance with the coordinate system of the center image, but the present invention is not limited to this.
- the coordinate system of the center image is coordinate-transformed according to the coordinate system of the left image
- the coordinate system of the right image is coordinate-transformed according to the coordinate system of the coordinate-converted center image (or in the opposite direction)
- the coordinates can be converted sequentially.
- only one image is subjected to coordinate conversion so that the coordinate system of one of the two adjacent images matches the coordinate system of the other image, and the image is aligned. Not limited to this.
- the coordinate system of both the images can be coordinate-converted for alignment.
- the image captured by the camera is converted and synthesized as it is, but the present invention is not limited to this.
- an image obtained by performing appropriate image processing for example, viewpoint conversion processing, distortion correction processing, etc.
- appropriate image processing for example, viewpoint conversion processing, distortion correction processing, etc.
- the present invention can be applied to a system having two cameras or a system having four or more cameras.
- an affine transformation matrix is used as an image transformation matrix, but other image transformation matrices can also be used. For example, when only rotation and translation need to be considered, a rigid transformation matrix can be used.
- the present invention is not limited thereto. That is, for example, the present invention can also be applied to a system that converts viewpoints of a plurality of cameras mounted on a vehicle and connects and creates and displays a bird's-eye view around the vehicle.
- SYMBOLS 10 ... Vehicle, 12L ... Left camera, 12C ... Center camera, 12R ... Right camera, 14 ... Synthetic-video production apparatus, 16L ... Left image acquisition part, 16C ... Center image acquisition part, 16R ... Right image acquisition part, 18L ... Feature Amount extraction unit, 18C ... feature amount extraction unit, 18R ... feature amount extraction unit, 20 ... image conversion matrix generation unit, 22 ... image conversion unit, 24 ... image output unit, 26 ... correction determination unit, ZL ... field of view by left camera Horizontal region, ZC ... horizontal region of the field of view by the central camera, ZR ... horizontal region of the field of view by the right camera, ZLC ...
- region where the region ZL and region ZC overlap each other ZCR ... region ZC and region ZR TL ... image conversion matrix, TR ... image conversion matrix, IL ... left image, IC ... center image, IR ... right image, D ... display area of the image display device
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Image Processing (AREA)
- Closed-Circuit Television Systems (AREA)
- Image Analysis (AREA)
Abstract
【課題】隣接する映像を繋ぎ合わせて合成映像を作成する場合に、画像変換行列が頻繁に更新されることによる合成映像のちらつきを抑制する。 【解決手段】相互に重なる領域を有する2つの映像から取得される2つの画像について、座標系を対応づける画像変換行列を順次生成する。生成された画像変換行列を用いて少なくとも一方の画像を座標変換する。少なくとも一方が座標変換された2つの画像を重ね合わせて合成画像を作成する。現在使用している画像変換行列と新たに生成された画像変換行列とを対比する。該両画像変換行列が類似しているときは、現在使用している画像変換行列を引き続き使用して前記座標変換を行う。両画像変換行列が非類似のときは、座標変換に使用する画像変換行列を、新たに生成された画像変換行列で補正して、座標変換を行う。
Description
この発明は、隣接する2つの映像がそれぞれ相互に重なる領域を有する2つ以上の映像を繋ぎ合わせて合成映像を作成する合成映像作成装置および合成映像作成方法並びに合成映像作成プログラムに関する。
隣接する2つの画像がそれぞれ相互に重なる領域を有する2つ以上の画像を繋ぎ合わせて合成画像(パノラマ画像等)を作成する合成画像作成技術が実用化されている。現在実用化されている合成画像作成技術には、例えば次のような一連の処理を行うものがある。相互に重なる領域を有する2つの画像について、それぞれ特徴点を検出する。該特徴点の特徴量を抽出する。該特徴量に基づき該両画像の対応点を検出する。該対応点の座標に基づき、該両画像の位置を合わせるための画像変換行列を算出する。該画像変換行列を用いて一方の画像を座標変換して、両画像の座標系を一致させる。該両画像どうしを重ね合わせて合成画像を作成する。以上の一連の処理を、隣接する2つの画像の組み合わせごとに行うことにより、2つ以上の画像を繋ぎ合わせることができる。この合成画像作成技術は例えば非特許文献1に記載されている。
「特徴に基づくパノラマイメージ」、[平成30年3月6日検索]、インターネット〈URL:https://jp.mathworks.com/help/vision/examples/feature-based-panoramic-image-stitching.html〉
前記合成画像作成技術を映像(動画像)に適用することにより、相互に重なる領域を有する2つの映像を該領域で繋ぎ合わせた合成映像を作成することができる。この合成映像作成技術は、例えば車両用の所謂電子ミラーの用途に利用できる。この電子ミラーは例えば次のように構成される。車両後方の左、中央、右の各方向に向けてカメラを配置する。各カメラの映像について、隣接する2つの映像どうし(すなわち、左と中央の映像どうし、および中央と右の映像どうし)を繋ぎ合わせて一連のパノラマ映像を作成する。作成されたパノラマ映像を運転席の前方に配置された液晶ディスプレイ等の画像表示装置に表示して運転者に視認させる。
合成画像作成技術を電子ミラーに適用した場合、車両の振動等によるカメラ相互間の相対移動により、各カメラの画像相互間で位置ずれが頻繁に生じる可能性がある。そして、各カメラの画像相互間で位置ずれが生じる度に画像変換行列が更新(補正)されると、表示されるパノラマ映像にちらつき(揺らぎ)が生じて運転者に煩わしさを感じさせ、その結果、車両の運転に支障をきたす恐れがある。
この発明は上述の問題を解決して、合成映像のちらつきを抑制した合成映像作成装置および合成映像作成方法並びに合成映像作成プログラムを提供するものである。
この発明は、相互に重なる領域を有する2つの映像を該相互に重なる領域で繋ぎ合わせて合成映像を作成する合成映像作成装置において、前記合成映像作成装置は、画像取得部と、特徴量抽出部と、画像変換行列生成部と、画像変換部と、画像出力部と、補正判定部を有し、前記画像取得部は、前記2つの映像から各1つずつの、2つの画像を順次取得し、前記特徴量抽出部は、前記取得された2つの画像について特徴点をそれぞれ検出して、該検出された特徴点の特徴量をそれぞれ抽出し、前記画像変換行列生成部は、前記抽出された特徴点の特徴量に基づき前記2つの画像の対応点を検出し、該検出された対応点の座標に基づき該2つの画像の座標系を対応づける(例えば、座標系を一致させる、または座標合わせを行う、または前記相互に重なる領域の位置を合わせる等)画像変換行列を順次生成し、前記画像変換部は、前記生成された画像変換行列を用いて前記2つの画像の少なくとも一方の画像を座標変換して該2つの画像の座標系の対応付けを行い、前記画像出力部は、前記座標系が対応づけられた2つの画像どうしを重ね合わせて合成画像を作成して出力し、前記補正判定部は、現在使用している画像変換行列と新たに生成された画像変換行列とを対比して、該両画像変換行列の相違度または類似度を判定する所定の判定基準により、該両画像変換行列が類似しているか否かを判定し、類似していると判定されたときは前記現在使用している画像変換行列を引き続き使用して前記画像変換部に前記座標変換を行わせ、該両画像変換行列が非類似と判定されたときは、前記座標変換に使用する画像変換行列を、前記新たに生成された画像変換行列で補正して(例えば、該新たに生成された画像変換行列に切り換えて)、前記画像変換部に前記座標変換を行わせ、前記合成映像作成装置は、前記合成画像の作成を時間の進行に応じて順次行って前記合成映像を作成するものである。これによれば、画像変換行列の頻繁な更新が抑制されるので、合成映像のちらつきが抑制されて、その結果、合成映像の視認者に与える煩わしさを軽減することができる。
前記画像変換行列は、例えば、前記2つの画像の一方の画像の座標系を他方の画像の座標系に対応づける画像変換行列とすることができる。これによれば、2つの画像の一方の画像について座標変換することにより、2つの画像の座標系の対応付けを行うことができる。
前記補正判定部は、前記判定基準として、例えば、前記現在使用している画像変換行列と前記新たに生成された画像変換行列の対応する要素どうしの要素値(要素の値をいう)の差に基づく値を指標値とする判定基準を用いて、該両画像変換行列の相違度または類似度を判定することができる。これによれば、該両画像変換行列の対応する要素どうしの要素値の差に基づく値を指標値として該両画像変換行列の相違度または類似度を判定して画像変換行列の補正を行うことができる。例えば、該指標値が所定の閾値(判定基準値)を超えないとき(すなわち、両画像変換行列の相違度が低いときまたは類似度が高いとき)は、両画像変換行列が類似するものと判定して、現在使用している画像変換行列を引き続き使用することができる。また、該指標値が所定の閾値を超えたとき(すなわち、両画像変換行列の相違度が高いときまたは類似度が低いとき)は、両画像変換行列が相違するものと判定して、座標変換に使用する画像変換行列を、新たに生成された画像変換行列で補正することができる。該両画像変換行列の対応する要素どうしの要素値の差に基づく指標値としては、例えば次を用いることができる。
・全対応する要素どうしの要素値の差の各絶対値の総和値
・ある特定の対応する要素どうしの要素値の差の各絶対値の総和値
・全対応する要素どうしの要素値の差をそれぞれ二乗した値の総和値
・ある特定の要素どうしの要素値の差をそれぞれ二乗した値の総和値
・全対応する要素どうしの要素値の差の各絶対値の総和値
・ある特定の対応する要素どうしの要素値の差の各絶対値の総和値
・全対応する要素どうしの要素値の差をそれぞれ二乗した値の総和値
・ある特定の要素どうしの要素値の差をそれぞれ二乗した値の総和値
前記特徴量抽出部は、例えば、適宜の時間間隔置きの画像について前記特徴量を抽出するものとすることができる。これによれば、全時点(つまり全フレームの)の画像について特徴量の抽出を行う場合に比べて、演算量を削減することができる。
前記補正判定部は、例えば、前記画像変換行列が非類似と判定されたときに、該非類似と判定された状態が所定時間継続したことを条件に、前記座標変換に使用する画像変換行列を、前記新たに生成された画像変換行列で補正するものとすることができる。これによれば、映像の一時的な振動等により画像変換行列が補正されて、映像にちらつきが生じるのを抑制することができる。
この発明の合成映像作成装置は、隣接する2つの映像がそれぞれ相互に重なる領域を有する3つ以上の映像について、該隣接する2つの映像ごとに前記各部での処理を行って該3つ以上の映像を該相互に重なる領域でそれぞれ繋ぎ合わせて合成映像を作成するものとすることができる。これによれば、3つ以上の映像を繋ぎ合わせる場合にも、合成映像のちらつきが抑制されて、視認者に与える煩わしさを軽減することができる。該3つ以上の映像の各画像を繋ぎ合わせる方向は、例えば次のように様々に設定することができる。
・一端の画像の座標系を基準として(つまり該座標系を固定して)、他端の画像まで一方向に順次繋いでいく。
・中央の画像の座標系を基準として、両端の画像まで両方向に順次繋いでいく。
・一端の画像の座標系を基準として(つまり該座標系を固定して)、他端の画像まで一方向に順次繋いでいく。
・中央の画像の座標系を基準として、両端の画像まで両方向に順次繋いでいく。
この発明は、例えば、車両用視認装置に適用することができる。その場合、例えば、隣接する2つの映像がそれぞれ相互に重なる領域を有する車両後方の左方向、車両後方の中央方向、車両後方の右方向の3つの映像について、該隣接する2つの映像ごとに前記各処理を行って該3つの映像を該相互に重なる領域でそれぞれ繋ぎ合わせて合成映像を作成することができる。これによれば、車両後方の左方向、中央方向、右方向の3つの映像を繋いだパノラマ映像を得ることができる。
この発明を上記車両用視認装置に適用する場合は、前記画像変換行列生成部は、例えば、前記3つの映像から取得される3つの画像について、前記中央方向の画像の座標系に前記左方向および前記右方向の2つの画像の座標系を対応づける画像変換行列をそれぞれ生成し、前記画像変換部は、前記生成された画像変換行列をそれぞれ用いて、前記左方向および右方向の画像を座標変換して、該左方向および右方向の画像の座標系を前記中央方向の画像の座標系に対応付け、前記画像出力部は、前記座標系が対応づけられた3つの画像どうしを重ね合わせて前記合成画像を作成して出力することができる。これによれば、車両の運転をする際に重要な車両後方中央方向の映像の座標系は変化しないので、該中央方向の映像はちらつかず、運転に適したパノラマ映像を得ることができる。
この発明を上記車両用視認装置に適用する場合は、前記補正判定部は、例えば、前記両画像変換行列における平行移動量を反映した要素どうしの要素値の差および回転角度を反映した要素どうしの要素値の差に基づく値を指標値とする前記判定基準を用いて該両画像変換行列の相違度または類似度を判定することができる。車両後方の左方向、中央方向、右方向の映像相互の座標系のずれの変動は、概ね平行移動方向および回転方向について生じると考えられる。そこで、画像変換行列の要素のうち、平行移動量を反映した要素どうしの要素値の差および回転角度を反映した要素どうしの要素値の差に基づく値を指標値とすることにより、画像変換行列の全対応する要素どうしの要素値の差に基づく値を指標値とする場合に比べて、演算量を削減することができる。
この発明の合成映像作成プログラムは、情報処理装置をこの発明の合成映像作成装置として機能させるためのプログラムである。これによれば、情報処理装置を、この発明による合成映像作成装置として機能させることができる。
この発明の合成映像作成方法は、相互に重なる領域を有する2つの映像を該相互に重なる領域で繋ぎ合わせて合成映像を作成する方法であって、該方法は、前記2つの映像から各1つずつの、2つの画像を順次取得し、前記2つの画像の座標系を対応づける画像変換行列を順次生成し、前記生成された画像変換行列を用いて前記2つの画像の少なくとも一方の画像を座標変換して該2つの画像の座標系の対応付けを行い、前記座標系が対応づけられた2つの画像どうしを重ね合わせて合成画像を作成し、現在使用している画像変換行列と新たに生成された画像変換行列とを対比して、該両画像変換行列の相違度または類似度を判定する所定の判定基準により、該両画像変換行列が類似していると判定されたときは前記現在使用している画像変換行列を引き続き使用して前記座標変換を行い、該両画像変換行列が非類似と判定されたときは、前記座標変換に使用する画像変換行列を、前記新たに生成された画像変換行列で補正して、前記座標変換を行い、前記合成画像の作成を時間の進行に応じて順次行って前記合成映像を作成するものである。これによれば、画像変換行列の頻繁な更新が抑制されるので、合成映像のちらつきが抑制されて、その結果、合成映像の視認者に与える煩わしさを軽減することができる。
この発明の合成映像作成プログラムは、この発明の合成映像作成方法を情報処理装置に実行させるためのプログラムである。
この発明を車両用視認装置に適用する場合の実施の形態を説明する。この車両用視認装置は、車両後方の左、中央、右の各方向に向けて配置された3台のカメラの映像を合成して、該合成映像(パノラマ映像)を運転席の前方に配置された液晶ディスプレイ等の画像表示装置に表示するものである。図2は車両におけるカメラの配置を示す。車両10の車外の左側部(例えば左ドアミラー)、後部(例えば車両後部の幅方向中央のナンバープレート付近)、右側部(例えば右ドアミラー)には、左カメラ12L、中央カメラ12C、右カメラ12Rがそれぞれ設置されている。これらカメラ12L,12C,12RはCCDカメラ、CMOSカメラ等の電子式カメラでそれぞれ構成される。カメラ12L,12C,12Rの撮影倍率は固定で相互に等しい。カメラ12L,12C,12Rは毎秒所定フレームのフレームレートでそれぞれの視野の映像(すなわち連続画像)を撮像し、該撮像した映像の映像信号を順次出力する。カメラ12L,12C,12Rの水平方向の視野の一例を図2にグレー色でそれぞれ示す。この例では、左カメラ12L、中央カメラ12C、右カメラ12Rの水平方向の視野はそれぞれ次のように設定されている。
・左カメラ12Lの視野:車両10の後方の左方向の領域ZL
・中央カメラ12Cの視野:車両10の後方の中央方向の領域ZC
・右カメラ12Rの視野:車両10の後方の右方向の領域ZR
図2に示すように、領域ZLと領域ZCは相互に重なる領域ZLCを有し、領域ZCと領域ZRは相互に重なる領域ZCRを有する。カメラ12L,12C,12Rの上下方向の視野は、水平方向を中心に下向きの適宜の角度から上向きの適宜の角度までの適宜の角度範囲にそれぞれ設定されている。
・左カメラ12Lの視野:車両10の後方の左方向の領域ZL
・中央カメラ12Cの視野:車両10の後方の中央方向の領域ZC
・右カメラ12Rの視野:車両10の後方の右方向の領域ZR
図2に示すように、領域ZLと領域ZCは相互に重なる領域ZLCを有し、領域ZCと領域ZRは相互に重なる領域ZCRを有する。カメラ12L,12C,12Rの上下方向の視野は、水平方向を中心に下向きの適宜の角度から上向きの適宜の角度までの適宜の角度範囲にそれぞれ設定されている。
図1は、図2の3台のカメラ12L,12C,12Rで撮像した映像を合成するこの発明による合成映像作成装置14の機能ブロック図を示す。合成映像作成装置14は、中央カメラ12Cの映像の座標系に合わせるように、左カメラ12Lおよび右カメラ12Rの各映像の座標系をそれぞれ座標変換して、これら3つの映像を重ね合わせてパノラマ映像を作成するように構成されている。図1において、左画像取得部16L、中央画像取得部16C、右画像取得部16Rは、それぞれ左カメラ12L、中央カメラ12C、右カメラ12Rで撮像した映像の画像(左画像、中央画像、右画像)を、相互に同期してあるいは非同期でフレームごとに順次取得する。
特徴量抽出部18L,18C,18Rは、取得された同一時点(同一時刻または概ね同一時刻)の左画像、中央画像、右画像について、特徴点の検出および該検出された特徴点の特徴量の抽出を相互に同期して行う。特徴点の検出および特徴量の抽出は、例えばSIFT (Scale-invariant feature transform)、SURF (Speed-Upped Robust Feature) 等の特徴量抽出アルゴリズムを用いて行うことができる。なお、特徴量抽出部18L,18C,18Rによる特徴点の検出および特徴量の抽出は、フレームごとに行うほか、適宜のフレーム置きに行うこともできる。特徴点の検出および特徴量の抽出を適宜のフレーム置きに行うようにすれば、フレームごとに特徴点の検出および特徴量の抽出を行う場合に比べて、演算量を削減することができる。
画像変換行列生成部20は、左画像および中央画像についてそれぞれ抽出された特徴量に基づき、左画像および中央画像の複数の対応点を検出する。これら対応点は、左画像および中央画像が相互に重なる領域ZLC(図2)における対応点である。また、画像変換行列生成部20は、中央画像および右画像についてそれぞれ抽出された特徴量に基づき、中央画像および右画像の複数の対応点を検出する。これら対応点は、中央画像および右画像が相互に重なる領域ZCR(図2)における対応点である。対応点の検出は、例えば次のアルゴリズムにより行うことができる。2つの画像の複数の特徴点の相互間について、各特徴点について検出された特徴量について最小二乗法等により類似度を求める。類似度が高い特徴点(最小二乗法であれば、差の二乗和が0に近い所定の閾値以下となる特徴点)どうしを判定する。判定された特徴点どうしを対応点として検出する。
画像変換行列生成部20はさらに、検出された対応点の座標に基づき2つの画像の座標系を対応づける画像変換行列を生成する。すなわち、左画像と中央画像の組については、中央画像の座標系を基準として、左画像の座標系を中央画像の座標系に一致させる画像変換行列TLを生成する。また、中央画像と右画像の組については、中央画像の座標系を基準として、右画像の座標系を中央画像の座標系に一致させる画像変換行列TRを生成する。画像変換行列TL,TRは、例えばアフィン変換行列として生成することができる。
画像変換部22は、生成された画像変換行列TL,TRをそれぞれ用いて、左画像、右画像の座標変換を行う。すなわち、画像変換部22は画像変換行列TLを用いて左画像を座標変換して、左画像の座標系を中央画像の座標系に一致させる。また、画像変換部22は画像変換行列TRを用いて右画像を座標変換して、右画像の座標系を中央画像の座標系に一致させる。これら座標変換の結果、左画像、右画像の座標系が、中央画像の座標系に合わせられる。なお、ある時点の画像に対する画像変換部22における座標変換処理は、該画像に基づく画像変換行列生成部20における画像変換行列の生成処理の終了を待たずに行うことができる。すなわち、ある時点の画像に基づく画像変換行列生成部20における画像変換行列の生成処理の終了を待って該画像に対する画像変換部22における座標変換処理を行うようにすると、画像変換行列生成部20における画像変換行列の生成処理に時間を要する場合には、該画像に対する座標変換処理が遅れて、その分該画像が遅れて表示されることになる。この表示の遅れは、車両用電子ミラーの用途には望ましくない。そこで、ある時点の画像に対する画像変換部22における座標変換処理を、該画像に基づく画像変換行列生成部20における画像変換行列の生成処理の終了を待たずに行うようにする。これにより、画像変換行列の生成処理に伴う表示の遅れをなくすことができる。この場合、画像は、該画像よりも前に取得した画像に基づいて生成された画像変換行列により座標変換されることになる。しかし、両画像(画像変換行列の生成に用いられた画像と、該生成された画像変換行列で座標変換される画像)間の時間差がさほど大きくなければ、表示されるパノラマ画像上で画像の繋ぎ目に大きなずれは生じ難い(あるいは生じたとしても短時間内に大きなずれは解消される)ものと考えられる。
画像出力部24は、座標系が合わせられた左画像、中央画像、右画像を重ね合わせて合成画像を作成して出力する。この場合、相互に重なる領域ZLC、ZCRについては、例えば、左画像、右画像の該当領域をマスキングして、中央画像の該当領域を出力する。その結果、画像出力部24からは、左画像、中央画像、右画像が繋がったパノラマ画像が出力される。
合成映像作成装置14は、画像変換部22での座標変換処理および画像出力部24での画像の重ね合わせ処理をフレームごとに順次行うことにより、パノラマ映像を作成する。合成映像作成装置14で作成されたパノラマ映像は、適宜トリミングされて、運転席の前方に配置された液晶ディスプレイ等の画像表示装置に表示される。運転者は該映像を見て、車両後方の周囲(すなわち、車両後方の、左方向から中央方向を経て右方向にわたる水平方向の広角度の領域)の状況を確認しながら該車両を運転をすることができる。
図3は、合成映像作成装置14により合成される、ある時点の3つの画像(左画像IL、中央画像IC、右画像IR)と、画像表示装置における表示領域Dの一例を模式的に示す。左画像IL、中央画像IC、右画像IRは、相互に隣接する画像どうしが繋げられてパノラマ画像を構成している。該パノラマ映像は、適宜トリミングされて画像表示装置の表示領域Dに表示される。座標変換を中央画像ICの座標系を基準として行う(すなわち、中央画像ICの座標系は動かさない)とともに、トリミング位置を中央画像ICに対し固定とすることにより、表示領域Dに対して中央画像ICの位置を固定することができる。その結果、車両の運転に重要な車両後方中央方向の映像が画像処理(座標変換およびトリミング)によってちらつく(揺らぐ)のを防止でき、運転に適したパノラマ映像を得ることができる。
図1において、補正判定部26は、現在使用している画像変換行列と、新たに生成された画像変換行列とを対比して、画像変換行列の補正の要否を判定する。ここで、現在使用している画像変換行列とは、過去に取得された画像に基づき生成されて、現在座標変換処理に使用されている画像変換行列である。また、新たに生成された画像変換行列とは、新たに取得された画像に基づき生成されて、座標変換処理に未使用の画像変換行列である。補正判定部26は、これら両画像変換行列の相違度または類似度を判定する所定の判定基準により、該両画像変換行列が類似しているか否かを判定する。そして、該両画像変換行列が「類似」と判定されたときは、現在使用している画像変換行列を引き続き使用して画像変換部22に座標変換を行わせる。これに対し、該両画像変換行列が「非類似」と判定されたときは、座標変換に使用する画像変換行列を、新たに生成された画像変換行列に切り換えて画像変換部22に座標変換を行わせる。
補正判定部26は、例えば、現在使用している画像変換行列と新たに生成された画像変換行列の、対応する要素どうしの要素値の差に基づく値を指標値とする判定基準を設定する。そして、補正判定部26は、この判定基準を用いて、該両画像変換行列の相違度または類似度を判定して、画像変換行列の切り換えを行う。この場合、補正判定部26は、該指標値が所定の閾値を超えないとき(両画像変換行列の相違度が低いときまたは類似度が高いとき)は、両画像変換行列が類似するものと判定して、画像変換部22に対し、現在使用している画像変換行列を引き続き使用して取得画像の座標変換を行わせる。また、補正判定部26は、該指標値が所定の閾値を超えたとき(両画像変換行列の相違度が高いときまたは類似度が低いとき)は、両画像変換行列が相違するものと判定する。そして、補正判定部26は、画像変換部22に対し、新たに生成された画像変換行列に切り換えて取得画像の座標変換を行わせる。このような画像変換行列の補正により、左画像、中央画像、右画像の相互間の座標系のずれを補正することができる。その結果、パノラマ画像のずれを抑制することができる。また、閾値を設定して補正の要否を判定することにより、画像相互間の座標系のずれが小さくパノラマ画像中のずれが視覚上目立たないときは、該座標系のずれの補正が行われないようにしている。これにより、画像変換行列の頻繁な更新が抑制されて、合成映像のちらつきが抑制されるため、視認者に与える煩わしさを軽減することができる。なお、補正判定部26は、指標値が閾値を超えたときに、即座に画像変換行列の補正を行うようにするのに限らず、該閾値を超えた状態が所定時間継続したことを条件に画像変換行列の補正を行うようにすることもできる。このようにすれば、3つの映像のうちの一部の映像の一瞬の振動等により画像変換行列が切り換えられて、他の映像がその影響を受けてちらつきが生じるのを抑制することができる。
補正判定部26で判定基準として使用する「現在使用している画像変換行列と新たに生成された画像変換行列の対応する要素どうしの要素値の差に基づく指標値」は、具体例には、例えば次の指標値(a)~(d)を用いることができる。ただし、該指標値はこれらに限られるものではない。
・指標値(a):両画像変換行列の全要素について、要素ごとに要素値の差の絶対値を取り、該各絶対値の総和値として得られる値
・指標値(b):両画像変換行列の全要素について、要素ごとに要素値の差の二乗値を取り、該各二乗値の総和値として得られる値
・指標値(c):両画像変換行列の全要素でなく特定の要素について、要素ごとに要素値の差の絶対値を取り、該各絶対値の総和値として得られる値
・指標値(d):両画像変換行列の全要素でなく特定の要素について、要素ごとに要素値の差の二乗値を取り、該各二乗値の総和値として得られる値
画像変換行列の特定の要素に基づく指標値(c)または(d)を用いる場合は、画像変換行列の全要素に基づく指標値(a)または指標値(b)を用いる場合に比べて、演算量を削減することができ、補正要否の判定を高速化できる。
・指標値(a):両画像変換行列の全要素について、要素ごとに要素値の差の絶対値を取り、該各絶対値の総和値として得られる値
・指標値(b):両画像変換行列の全要素について、要素ごとに要素値の差の二乗値を取り、該各二乗値の総和値として得られる値
・指標値(c):両画像変換行列の全要素でなく特定の要素について、要素ごとに要素値の差の絶対値を取り、該各絶対値の総和値として得られる値
・指標値(d):両画像変換行列の全要素でなく特定の要素について、要素ごとに要素値の差の二乗値を取り、該各二乗値の総和値として得られる値
画像変換行列の特定の要素に基づく指標値(c)または(d)を用いる場合は、画像変換行列の全要素に基づく指標値(a)または指標値(b)を用いる場合に比べて、演算量を削減することができ、補正要否の判定を高速化できる。
指標値(a)~(d)はいずれも、現在使用している画像変換行列と新たに生成された画像変換行列が近似するほど(すなわち、相違度が低いほど、あるいは類似度が高いほど)小さな値となる。したがって、指標値(a)~(d)を用いる場合には、補正判定部26は、指標値(a)~(d)の算出値が、判定基準として設定した所定の閾値と同じかそれよりも小さい場合は、両画像変換行列が「類似」と判定する。このとき、補正判定部26は、画像変換部22に対し、現在使用している画像変換行列を引き続き使用して取得画像の座標変換を行わせる。また、補正判定部26は、指標値(a)~(d)の算出値が、判定基準として設定した所定の閾値よりも大きい場合は、両画像変換行列が「非類似」と判定する。このとき、補正判定部26は、画像変換部22に対し、新たに生成された画像変換行列に切り換えて取得画像の座標変換を行わせる。
ここで、この実施の形態において座標変換にアフィン変換を用いるものとして以下説明する。アフィン変換は、周知のように、平行移動、スケール(拡大、縮小)、スキュー(せん断)、回転を組み合わせた変換である。ただし、この実施の形態の車両用視認装置としての用途では、カメラ12L,12C,12Rの撮影倍率は固定で相互に等しいので画像の倍率変化は生じない。また画像のせん断も生じない。したがって、カメラ12L,12C,12Rの画像相互間で座標系に変化が生じるとすれば、平行移動または回転によるものと考えられる。そこで、補正判定部26において画像変換行列の補正の要否の判定に用いるアフィン変換行列の要素は、平行移動量に関する要素と回転角度に関する要素に限定できると考えられる。平行移動と回転を組み合わせたアフィン変換式は式1aまたは式1bで表される。
但し、式1aまたは式1bにおいて、x,yは座標変換前の座標、X,Yは座標変換後の座標、txはx軸方向の平行移動量、tyはy軸方向の平行移動量、qは回転角度である。
補正判定部26は、前述の指標値(c)または(d)を用いる場合には、「特定の要素」として、式1aまたは式1bのアフィン変換行列の例えば要素tx,-sin(q)の2要素を用いることができる。この場合、指標値(c)(d)は式2、式3でそれぞれ表される。
このほか、補正判定部26は、指標値(c)または(d)を用いる場合には、2要素に限らず、例えば要素tx,ty,-sin(q)の3要素を用いることもできる。また、要素-sin(q)に代えて要素cos(q)を用いることもできる。
図1の合成映像作成装置14による合成映像作成の一連の制御内容を図4を参照して説明する。左画像取得部16L、中央画像取得部16C、右画像取得部16Rは、左カメラ12L、中央カメラ12C、右カメラ12Rで撮像した映像の左画像、中央画像、右画像をフレームごとに順次取得する(S1)。特徴量抽出部18L,18C,18Rは、取得された同一時点の左画像、中央画像、右画像について、特徴量を抽出するための画像変換(例えばグレー化)を行う。次いで、特徴量抽出部18L,18C,18Rは、該画像変換された各画像から特徴量の抽出(特徴点の検出および検出された特徴点の特徴量の算出)を行う(S2)。なお、前述のとおり、特徴量の抽出は、フレームごとに行うほか、適宜のフレーム置きに行うこともできる。
画像変換行列生成部20は、左画像、中央画像、右画像についてそれぞれ抽出された特徴量に基づき、左画像と中央画像の複数の対応点、中央画像と右画像の複数の対応点をそれぞれ検出する。画像変換行列生成部20はさらに、検出された対応点の座標に基づき、対応点どうしの位置を一致させるための画像変換行列TL,TRを生成する(S3)。すなわち、画像変換行列生成部20は、左画像と中央画像については、左画像の対応点を中央画像の対応点に一致させるように左画像を座標変換する画像変換行列TLを生成する。また、画像変換行列生成部20は、中央画像と右画像については、右画像の対応点を中央画像の対応点に一致させるように右画像を座標変換する画像変換行列TRを生成する。
補正判定部26は、画像変換行列TL,TRごとに、現在使用している画像変換行列と、新たに生成された画像変換行列とを対比して、画像変換行列の補正の要否を判定する。すなわち、補正判定部26は、現在使用している画像変換行列と新たに生成された画像変換行列の対応する要素どうしの要素値の差に基づく指標値が所定の閾値を超えたか否かに応じて、画像変換行列の補正の要否を判定する(S4)。そして、補正判定部26は、指標値が該閾値を超えていない場合は補正は不要と判定して(S4で“NO”)、画像変換部22に対し、現在使用している画像変換行列TL,TRを引き続き使用して取得画像の座標変換を行わせる(S5)。また、補正判定部26は、指標値が該閾値を超え(S4で“YES”)、かつ該閾値を超えた状態が所定時間継続した場合は(S6で“YES”)補正が必要と判定して、画像変換部22に対し、新たに生成された画像変換行列に切り換えて取得画像の座標変換を行わせる(S7)。また、補正判定部26は、指標値が該閾値を超えたものの(S4で“YES”)、該閾値を超えた状態が所定時間継続しなかった場合は(S6で“NO”)補正は不要と判定して、画像変換部22に対し、現在使用している画像変換行列TL,TRを引き続き使用して取得画像の座標変換を行わせる(S5)。画像変換行列の補正処理(S4~S7)は、画像変換行列TL,TRごとに独立に行う。
画像変換部22は、左カメラ12L、中央カメラ12C、右カメラ12Rで撮像した各映像から、それぞれ左画像、中央画像、右画像をフレームごとに順次取得する(S8)。そして、画像変換部22は、左画像について、補正判定部26で指定された画像変換行列TLを用いて座標変換を行うことにより、左画像の座標系を中央画像の座標系に合わせる。また、画像変換部22は、右画像について、補正判定部26で指定された画像変換行列TRを用いて座標変換を行うことにより、右画像の座標系を中央画像の座標系に合わせる(S9)。画像出力部24は、座標系が合わせられた左画像、中央画像、右画像を重ね合わせてパノラマ合成画像を作成して出力する(S9、S10)。
前記実施の形態による合成映像作成装置14によれば、例えば次のような場面でその有用性が発揮される。
(a) 車両が大きく振動したりカメラが障害物に衝突するなどして、カメラ相互の相対位置にずれが生じても、画像変換行列が補正されて、画像の繋ぎ目のずれが自動修正される。
(b) カメラが電動格納式の場合に、展開位置でいずれかのカメラの停止位置が正規の位置から微妙にずれて停止された場合に、画像変換行列が補正されて、画像の繋ぎ目が自動的に合わせられる。
(c) 車両に後付けで複数台のカメラを搭載して、パノラマ映像を合成する場合に、各カメラの方向を大まかに設定すれば、あとは画像変換行列が自動で補正されて、画像の繋ぎ目が合わせられる。
(d) 運転者が各カメラの向きを遠隔操作により電動で調整できる機能を搭載した場合に、カメラの向きを調整したときに、画像変換行列が自動で補正されて、画像の繋ぎ目が合わせられる。
(a) 車両が大きく振動したりカメラが障害物に衝突するなどして、カメラ相互の相対位置にずれが生じても、画像変換行列が補正されて、画像の繋ぎ目のずれが自動修正される。
(b) カメラが電動格納式の場合に、展開位置でいずれかのカメラの停止位置が正規の位置から微妙にずれて停止された場合に、画像変換行列が補正されて、画像の繋ぎ目が自動的に合わせられる。
(c) 車両に後付けで複数台のカメラを搭載して、パノラマ映像を合成する場合に、各カメラの方向を大まかに設定すれば、あとは画像変換行列が自動で補正されて、画像の繋ぎ目が合わせられる。
(d) 運転者が各カメラの向きを遠隔操作により電動で調整できる機能を搭載した場合に、カメラの向きを調整したときに、画像変換行列が自動で補正されて、画像の繋ぎ目が合わせられる。
この発明は、次のような実施の形態も可能である。
(a) 前記実施の形態では、現在使用している画像変換行列と新たに生成された画像変換行列が非類似と判定されたときに、座標変換に使用する画像変換行列を、新たに生成された画像変換行列に一度に(すなわち、1フレームで)切り換えるようにしたが、これに限らない。すなわち、一度に切り換えるのに代えて、徐々に(すなわち、複数フレームをかけて段階的に)切り換えるようにすることもできる。このようにすれば、合成映像のちらつき(揺らぎ)を目立たなくすることができる。
(b) 前記実施の形態では、ある時点の画像に対する画像変換部における座標変換処理を、該画像に基づく画像変換行列生成部における画像変換行列の生成処理の終了を待たずに行うようにしたが、これに限らない。すなわち、ある時点の画像に対する画像変換部における座標変換処理を、該画像に基づく画像変換行列生成部における画像変換行列の生成処理の終了を待って行う(すなわち、ある時点の画像に基づき生成された画像変換行列を用いて該画像の座標変換を行う)こともできる。
(c) 前記実施の形態では、中央画像の座標系に合わせて左画像および右画像の各座標系をそれぞれ座標変換したが、これに限らない。すなわち、左画像の座標系に合わせて中央画像の座標系を座標変換し、該座標変換された中央画像の座標系に合わせて右画像の座標系を座標変換する(あるいは、これとは逆方向に順次座標変換する)こともできる。
(d) 前記実施の形態では、隣接する2つの画像の一方の画像の座標系を他方の画像の座標系に合わせるように一方の画像のみ座標変換を行って画像の位置合わせを行ったが、これに限らない。すなわち、両方の画像の座標系とも座標変換して位置合わせを行うこともできる。
(e) 前記実施の形態では、カメラで撮像された画像をそのまま座標変換して合成したが、これに限らない。すなわち、カメラで撮像された画像に適宜の画像処理(例えば、視点変換処理、歪補正処理等)を施した画像について座標変換して合成することもできる。
(f) 前記実施の形態では、3台のカメラを有するシステムにこの発明を適用した場合について示したが、これに限らない。すなわち、この発明は2台のカメラを有するシステムまたは4台以上のカメラを有するシステムにも適用できる。
(g) 前記実施の形態では画像変換行列としてアフィン変換行列を用いたが、ほかの画像変換行列を用いることもできる。例えば、回転と平行移動のみ考慮すればよい場合には、剛体変換行列を用いることができる。
(h) 前記実施の形態では、車両後方の映像を撮像して表示する電子ミラーにこの発明を適用した場合について示したが、これに限らない。すなわち、例えば、車両に搭載した複数台のカメラの映像を視点変換し、繋ぎ合わせて車両周囲の俯瞰映像を作成して表示するシステムにも適用できる。
(a) 前記実施の形態では、現在使用している画像変換行列と新たに生成された画像変換行列が非類似と判定されたときに、座標変換に使用する画像変換行列を、新たに生成された画像変換行列に一度に(すなわち、1フレームで)切り換えるようにしたが、これに限らない。すなわち、一度に切り換えるのに代えて、徐々に(すなわち、複数フレームをかけて段階的に)切り換えるようにすることもできる。このようにすれば、合成映像のちらつき(揺らぎ)を目立たなくすることができる。
(b) 前記実施の形態では、ある時点の画像に対する画像変換部における座標変換処理を、該画像に基づく画像変換行列生成部における画像変換行列の生成処理の終了を待たずに行うようにしたが、これに限らない。すなわち、ある時点の画像に対する画像変換部における座標変換処理を、該画像に基づく画像変換行列生成部における画像変換行列の生成処理の終了を待って行う(すなわち、ある時点の画像に基づき生成された画像変換行列を用いて該画像の座標変換を行う)こともできる。
(c) 前記実施の形態では、中央画像の座標系に合わせて左画像および右画像の各座標系をそれぞれ座標変換したが、これに限らない。すなわち、左画像の座標系に合わせて中央画像の座標系を座標変換し、該座標変換された中央画像の座標系に合わせて右画像の座標系を座標変換する(あるいは、これとは逆方向に順次座標変換する)こともできる。
(d) 前記実施の形態では、隣接する2つの画像の一方の画像の座標系を他方の画像の座標系に合わせるように一方の画像のみ座標変換を行って画像の位置合わせを行ったが、これに限らない。すなわち、両方の画像の座標系とも座標変換して位置合わせを行うこともできる。
(e) 前記実施の形態では、カメラで撮像された画像をそのまま座標変換して合成したが、これに限らない。すなわち、カメラで撮像された画像に適宜の画像処理(例えば、視点変換処理、歪補正処理等)を施した画像について座標変換して合成することもできる。
(f) 前記実施の形態では、3台のカメラを有するシステムにこの発明を適用した場合について示したが、これに限らない。すなわち、この発明は2台のカメラを有するシステムまたは4台以上のカメラを有するシステムにも適用できる。
(g) 前記実施の形態では画像変換行列としてアフィン変換行列を用いたが、ほかの画像変換行列を用いることもできる。例えば、回転と平行移動のみ考慮すればよい場合には、剛体変換行列を用いることができる。
(h) 前記実施の形態では、車両後方の映像を撮像して表示する電子ミラーにこの発明を適用した場合について示したが、これに限らない。すなわち、例えば、車両に搭載した複数台のカメラの映像を視点変換し、繋ぎ合わせて車両周囲の俯瞰映像を作成して表示するシステムにも適用できる。
10…車両、12L…左カメラ、12C…中央カメラ、12R…右カメラ、14…合成映像作成装置、16L…左画像取得部、16C…中央画像取得部、16R…右画像取得部、18L…特徴量抽出部、18C…特徴量抽出部、18R…特徴量抽出部、20…画像変換行列生成部、22…画像変換部、24…画像出力部、26…補正判定部、ZL…左カメラによる視野の水平方向の領域、ZC…中央カメラによる視野の水平方向の領域、ZR…右カメラによる視野の水平方向の領域、ZLC…領域ZLと領域ZCが相互に重なる領域、ZCR…領域ZCと領域ZRが相互に重なる領域、TL…画像変換行列、TR…画像変換行列、IL…左画像、IC…中央画像、IR…右画像、D…画像表示装置の表示領域
Claims (11)
- 相互に重なる領域を有する2つの映像を該相互に重なる領域で繋ぎ合わせて合成映像を作成する合成映像作成装置において、
前記合成映像作成装置は、画像取得部と、特徴量抽出部と、画像変換行列生成部と、画像変換部と、画像出力部と、補正判定部を有し、
前記画像取得部は、前記2つの映像から各1つずつの、2つの画像を順次取得し、
前記特徴量抽出部は、前記取得された2つの画像について特徴点をそれぞれ検出して、該検出された特徴点の特徴量をそれぞれ抽出し、
前記画像変換行列生成部は、前記抽出された特徴点の特徴量に基づき前記2つの画像の対応点を検出し、該検出された対応点の座標に基づき該2つの画像の座標系を対応づける画像変換行列を順次生成し、
前記画像変換部は、前記生成された画像変換行列を用いて前記2つの画像の少なくとも一方の画像を座標変換して該2つの画像の座標系の対応付けを行い、
前記画像出力部は、前記座標系が対応づけられた2つの画像どうしを重ね合わせて合成画像を作成して出力し、
前記補正判定部は、現在使用している画像変換行列と新たに生成された画像変換行列とを対比して、該両画像変換行列の相違度または類似度を判定する所定の判定基準により、該両画像変換行列が類似しているか否かを判定し、類似していると判定されたときは前記現在使用している画像変換行列を引き続き使用して前記画像変換部に前記座標変換を行わせ、該両画像変換行列が非類似と判定されたときは、前記座標変換に使用する画像変換行列を、前記新たに生成された画像変換行列で補正して、前記画像変換部に前記座標変換を行わせ、
前記合成映像作成装置は、前記合成画像の作成を時間の進行に応じて順次行って前記合成映像を作成する、
そのように構成された合成映像作成装置。 - 前記補正判定部は、前記判定基準として、前記現在使用している画像変換行列と前記新たに生成された画像変換行列の対応する要素どうしの要素値の差に基づく値を指標値とする判定基準を用いて、該両画像変換行列の相違度または類似度を判定する請求項1に記載の合成映像作成装置。
- 前記特徴量抽出部は、適宜の時間間隔置きの画像について前記特徴量を抽出する請求項1または2に記載の合成映像作成装置。
- 前記補正判定部は、前記画像変換行列が非類似と判定されたときに、該非類似と判定された状態が所定時間継続したことを条件に、前記座標変換に使用する画像変換行列を、前記新たに生成された画像変換行列で補正する請求項1から3のいずれか1つに記載の合成映像作成装置。
- 隣接する2つの映像がそれぞれ相互に重なる領域を有する3つ以上の映像について、該隣接する2つの映像ごとに前記各部での処理を行って該3つ以上の映像を該相互に重なる領域でそれぞれ繋ぎ合わせて合成映像を作成する請求項1から4のいずれか1つに記載の合成映像作成装置。
- 隣接する2つの映像がそれぞれ相互に重なる領域を有する車両後方の左方向、車両後方の中央方向、車両後方の右方向の3つの映像について、該隣接する2つの映像ごとに前記各処理を行って該3つの映像を該相互に重なる領域でそれぞれ繋ぎ合わせて合成映像を作成する請求項1から5のいずれか1つに記載の合成映像作成装置。
- 前記画像変換行列生成部は、前記3つの映像から取得される3つの画像について、前記中央方向の画像の座標系に前記左方向および前記右方向の2つの画像の座標系を対応づける画像変換行列をそれぞれ生成し、
前記画像変換部は、前記生成された画像変換行列をそれぞれ用いて、前記左方向および右方向の画像を座標変換して、該左方向および右方向の画像の座標系を前記中央方向の画像の座標系に対応付け、
前記画像出力部は、前記座標系が対応づけられた3つの画像どうしを重ね合わせて前記合成画像を作成して出力する、
請求項6に記載の合成映像作成装置。 - 前記補正判定部は、前記両画像変換行列における平行移動量を反映した要素どうしの要素値の差および回転角度を反映した要素どうしの要素値の差に基づく値を指標値とする前記判定基準を用いて該両画像変換行列の相違度または類似度を判定する請求項6または7に記載の合成映像作成装置。
- 情報処理装置を、請求項1から8のいずれか1つに記載の合成映像作成装置として機能させるための合成映像作成プログラム。
- 相互に重なる領域を有する2つの映像を該相互に重なる領域で繋ぎ合わせて合成映像を作成する合成映像作成方法において、
前記合成映像作成方法は、
前記2つの映像から各1つずつの、2つの画像を順次取得し、
前記2つの画像の座標系を対応づける画像変換行列を順次生成し、
前記生成された画像変換行列を用いて前記2つの画像の少なくとも一方の画像を座標変換して該2つの画像の座標系の対応付けを行い、
前記座標系が対応づけられた2つの画像どうしを重ね合わせて合成画像を作成し、
現在使用している画像変換行列と新たに生成された画像変換行列とを対比して、該両画像変換行列の相違度または類似度を判定する所定の判定基準により、該両画像変換行列が類似していると判定されたときは前記現在使用している画像変換行列を引き続き使用して前記座標変換を行い、該両画像変換行列が非類似と判定されたときは、前記座標変換に使用する画像変換行列を、前記新たに生成された画像変換行列で補正して、前記座標変換を行い、
前記合成画像の作成を時間の進行に応じて順次行って前記合成映像を作成する、
そのような合成映像作成方法。 - 請求項10に記載の合成映像作成方法を情報処理装置に実行させるための合成映像作成プログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE112019001358.0T DE112019001358T5 (de) | 2018-03-15 | 2019-03-12 | Vorrichtung zur erstellung zusammengesetzter videobilder, verfahren zur erstellung zusammengesetzter videobilder und programm zur erstellung zusammengesetzter videobilder |
JP2020506552A JP7244488B2 (ja) | 2018-03-15 | 2019-03-12 | 合成映像作成装置および合成映像作成方法並びに合成映像作成プログラム |
CN201980019557.0A CN111869198B (zh) | 2018-03-15 | 2019-03-12 | 合成影像制作装置、合成影像制作方法以及记录介质 |
US17/018,414 US11232540B2 (en) | 2018-03-15 | 2020-09-11 | Composite video image creation apparatus, composite video image creation method, and composite video image creation program |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018-047600 | 2018-03-15 | ||
JP2018047600 | 2018-03-15 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
US17/018,414 Continuation US11232540B2 (en) | 2018-03-15 | 2020-09-11 | Composite video image creation apparatus, composite video image creation method, and composite video image creation program |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2019176930A1 true WO2019176930A1 (ja) | 2019-09-19 |
Family
ID=67908493
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2019/009964 WO2019176930A1 (ja) | 2018-03-15 | 2019-03-12 | 合成映像作成装置および合成映像作成方法並びに合成映像作成プログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US11232540B2 (ja) |
JP (1) | JP7244488B2 (ja) |
CN (1) | CN111869198B (ja) |
DE (1) | DE112019001358T5 (ja) |
WO (1) | WO2019176930A1 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112508773A (zh) * | 2020-11-20 | 2021-03-16 | 小米科技(武汉)有限公司 | 图像处理方法及装置、电子设备、存储介质 |
US11198393B2 (en) * | 2019-07-01 | 2021-12-14 | Vadas Co., Ltd. | Method and apparatus for calibrating a plurality of cameras |
CN114897966A (zh) * | 2022-04-13 | 2022-08-12 | 深圳市路远智能装备有限公司 | 一种大元件的视觉识别方法 |
CN115063661A (zh) * | 2022-08-15 | 2022-09-16 | 广州思涵信息科技有限公司 | 一种智慧教学空间下的多源图像融合方法 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018220681A1 (ja) * | 2017-05-29 | 2018-12-06 | オリンパス株式会社 | 画像処理装置、画像処理方法および画像処理プログラム |
CN111327840A (zh) * | 2020-02-27 | 2020-06-23 | 努比亚技术有限公司 | 一种多帧特效视频获取方法、终端及计算机可读存储介质 |
US11295521B2 (en) * | 2020-03-25 | 2022-04-05 | Woven Planet North America, Inc. | Ground map generation |
CN114511443A (zh) * | 2020-10-29 | 2022-05-17 | 北京中祥英科技有限公司 | 图像处理、图像识别网络训练和图像识别的方法及装置 |
CN113784059B (zh) * | 2021-08-03 | 2023-08-18 | 阿里巴巴(中国)有限公司 | 用于服装生产的视频生成与拼接方法、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007049276A (ja) * | 2005-08-08 | 2007-02-22 | Sanyo Electric Co Ltd | 車載パノラマカメラシステム |
WO2015029934A1 (ja) * | 2013-08-30 | 2015-03-05 | クラリオン株式会社 | カメラ校正装置、カメラ校正システム、及びカメラ校正方法 |
WO2015129280A1 (ja) * | 2014-02-26 | 2015-09-03 | 京セラ株式会社 | 画像処理装置および画像処理方法 |
JP2016070814A (ja) * | 2014-09-30 | 2016-05-09 | クラリオン株式会社 | カメラキャリブレーション装置及びカメラキャリブレーションシステム |
JP2016078484A (ja) * | 2014-10-09 | 2016-05-16 | 株式会社デンソー | 画像生成装置および画像生成方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000227963A (ja) * | 1999-02-08 | 2000-08-15 | Nippon Telegr & Teleph Corp <Ntt> | 距離情報付き画像作成装置及び方法、並びにこの方法のプログラムを記録した記録媒体 |
JP2004342067A (ja) * | 2003-04-22 | 2004-12-02 | 3D Media Co Ltd | 画像処理方法、画像処理装置、及びコンピュータプログラム |
JP4677364B2 (ja) * | 2006-05-23 | 2011-04-27 | 株式会社村上開明堂 | 車両監視装置 |
JP5444139B2 (ja) * | 2010-06-29 | 2014-03-19 | クラリオン株式会社 | 画像のキャリブレーション方法および装置 |
KR101524548B1 (ko) * | 2012-07-26 | 2015-06-02 | 삼성테크윈 주식회사 | 영상 정합 장치 및 방법 |
CN102855649B (zh) * | 2012-08-23 | 2015-07-15 | 山东电力集团公司电力科学研究院 | 基于orb特征点的高压杆塔高清图像全景拼接方法 |
CN104408701B (zh) * | 2014-12-03 | 2018-10-09 | 中国矿业大学 | 一种大场景视频图像拼接方法 |
CN106709894B (zh) * | 2015-08-17 | 2020-10-27 | 北京亿羽舜海科技有限公司 | 一种图像实时拼接方法及系统 |
CN105957007B (zh) * | 2016-05-05 | 2018-12-18 | 电子科技大学 | 基于特征点平面相似度的图像拼接方法 |
CN106548451A (zh) * | 2016-10-14 | 2017-03-29 | 青岛海信网络科技股份有限公司 | 一种客车客流拥挤度计算方法和装置 |
CN106960179B (zh) * | 2017-02-24 | 2018-10-23 | 北京交通大学 | 轨道交通线路环境安全智能监测方法和装置 |
-
2019
- 2019-03-12 CN CN201980019557.0A patent/CN111869198B/zh active Active
- 2019-03-12 JP JP2020506552A patent/JP7244488B2/ja active Active
- 2019-03-12 DE DE112019001358.0T patent/DE112019001358T5/de active Pending
- 2019-03-12 WO PCT/JP2019/009964 patent/WO2019176930A1/ja active Application Filing
-
2020
- 2020-09-11 US US17/018,414 patent/US11232540B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007049276A (ja) * | 2005-08-08 | 2007-02-22 | Sanyo Electric Co Ltd | 車載パノラマカメラシステム |
WO2015029934A1 (ja) * | 2013-08-30 | 2015-03-05 | クラリオン株式会社 | カメラ校正装置、カメラ校正システム、及びカメラ校正方法 |
WO2015129280A1 (ja) * | 2014-02-26 | 2015-09-03 | 京セラ株式会社 | 画像処理装置および画像処理方法 |
JP2016070814A (ja) * | 2014-09-30 | 2016-05-09 | クラリオン株式会社 | カメラキャリブレーション装置及びカメラキャリブレーションシステム |
JP2016078484A (ja) * | 2014-10-09 | 2016-05-16 | 株式会社デンソー | 画像生成装置および画像生成方法 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11198393B2 (en) * | 2019-07-01 | 2021-12-14 | Vadas Co., Ltd. | Method and apparatus for calibrating a plurality of cameras |
CN112508773A (zh) * | 2020-11-20 | 2021-03-16 | 小米科技(武汉)有限公司 | 图像处理方法及装置、电子设备、存储介质 |
CN112508773B (zh) * | 2020-11-20 | 2024-02-09 | 小米科技(武汉)有限公司 | 图像处理方法及装置、电子设备、存储介质 |
CN114897966A (zh) * | 2022-04-13 | 2022-08-12 | 深圳市路远智能装备有限公司 | 一种大元件的视觉识别方法 |
CN114897966B (zh) * | 2022-04-13 | 2024-04-09 | 深圳市路远智能装备有限公司 | 一种大元件的视觉识别方法 |
CN115063661A (zh) * | 2022-08-15 | 2022-09-16 | 广州思涵信息科技有限公司 | 一种智慧教学空间下的多源图像融合方法 |
CN115063661B (zh) * | 2022-08-15 | 2022-11-29 | 广州思涵信息科技有限公司 | 一种智慧教学空间下的多源图像融合方法 |
Also Published As
Publication number | Publication date |
---|---|
US11232540B2 (en) | 2022-01-25 |
JPWO2019176930A1 (ja) | 2021-04-08 |
CN111869198B (zh) | 2021-12-14 |
JP7244488B2 (ja) | 2023-03-22 |
US20200410641A1 (en) | 2020-12-31 |
DE112019001358T5 (de) | 2020-12-31 |
CN111869198A (zh) | 2020-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2019176930A1 (ja) | 合成映像作成装置および合成映像作成方法並びに合成映像作成プログラム | |
US9533618B2 (en) | Method, apparatus and system for processing a display from a surround view camera solution | |
JP5194679B2 (ja) | 車両用周辺監視装置および映像表示方法 | |
US9892493B2 (en) | Method, apparatus and system for performing geometric calibration for surround view camera solution | |
JP6091586B1 (ja) | 車両用画像処理装置および車両用画像処理システム | |
JP5321711B2 (ja) | 車両用周辺監視装置および映像表示方法 | |
JP2888713B2 (ja) | 複眼撮像装置 | |
JP4975592B2 (ja) | 撮像装置 | |
US20090051778A1 (en) | Advanced dynamic stitching method for multi-lens camera system | |
WO2020218024A1 (ja) | パノラマ映像合成装置、パノラマ映像合成方法、及びパノラマ映像合成プログラム | |
JP2003255925A (ja) | 画像表示制御装置 | |
EP2551817B1 (en) | Vehicle rear view camera system and method | |
CN110651295B (zh) | 图像处理设备、图像处理方法和程序 | |
JP2008102620A (ja) | 画像処理装置 | |
WO1995004329A1 (fr) | Dispositif et procede de detection de l'appariement d'images | |
JP4830380B2 (ja) | 車両周辺監視装置及び車両周辺監視方法 | |
KR101977635B1 (ko) | 다중 카메라 기반 시설물 주변 항공뷰 형태의 전방위 비디오 합성 및 이동체 검출 방법 및 장치 | |
KR20130056605A (ko) | 파노라마 영상 생성 장치 및 방법 | |
KR101614247B1 (ko) | 파노라마 영상의 접합면 표시장치 | |
Yebes et al. | Surrounding view for enhancing safety on vehicles | |
JP6293089B2 (ja) | 後方モニタ | |
US20190166309A1 (en) | Panoramic camera and image processing method | |
US11863900B2 (en) | Image generation apparatus and image display system for superimposition of three-dimensional objects into bird's view images | |
US9355323B2 (en) | Image correction method and apparatus for visually impaired person | |
KR101750156B1 (ko) | 차량의 파노라마 영상 표시장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 19766851 Country of ref document: EP Kind code of ref document: A1 |
|
ENP | Entry into the national phase |
Ref document number: 2020506552 Country of ref document: JP Kind code of ref document: A |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 19766851 Country of ref document: EP Kind code of ref document: A1 |