WO2004053796A1 - 類似画像抽出装置、類似画像抽出方法および類似画像抽出プログラム - Google Patents

類似画像抽出装置、類似画像抽出方法および類似画像抽出プログラム Download PDF

Info

Publication number
WO2004053796A1
WO2004053796A1 PCT/JP2003/015852 JP0315852W WO2004053796A1 WO 2004053796 A1 WO2004053796 A1 WO 2004053796A1 JP 0315852 W JP0315852 W JP 0315852W WO 2004053796 A1 WO2004053796 A1 WO 2004053796A1
Authority
WO
WIPO (PCT)
Prior art keywords
image
pixel
value
original image
collation
Prior art date
Application number
PCT/JP2003/015852
Other languages
English (en)
French (fr)
Inventor
Makoto Ouchi
Original Assignee
Seiko Epson Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corporation filed Critical Seiko Epson Corporation
Priority to EP03780724A priority Critical patent/EP1574991A4/en
Priority to US10/540,787 priority patent/US20060115148A1/en
Publication of WO2004053796A1 publication Critical patent/WO2004053796A1/ja

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/97Determining parameters from multiple pictures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • G06V10/7515Shifting the patterns to accommodate for positional errors

Definitions

  • the present invention relates to a similar image extracting device, a similar image extracting method, and a similar image extracting program.
  • the present invention has been made in view of the above problems, and has an image search accuracy of It is an object of the present invention to provide a similar image extraction device, a similar image extraction method, and a similar image extraction program that can perform processing at high cost and at high speed.
  • the present invention uses some pixels in the original image to search for similar site candidates in the search target image, and compares these candidates with the original image for each pixel. A part similar to the original image is extracted from the search target image.
  • the present invention includes an image data acquisition unit, a reference pixel gradation value acquisition unit, a comparison pixel gradation value acquisition unit, a comparison value calculation unit, and a scanning unit. With these means, the original image data and the search target image data are acquired, and while the search target image is scanned in an area of the same size as the original image, the gradation value of the collation pixel and the gradation value of the comparison pixel are obtained. A collation value indicating the similarity is calculated.
  • the collation pixels are arranged at a plurality of positions in the original image, but have a smaller number of pixels than the number of pixels in the original image. Therefore, by scanning the search target image for each area of the same size as the original image, only a part of the pixels in the search target image and some pixels of the original image are compared, and the search target image is scanned. With, similar parts in the original image can be found as candidates. Therefore, the processing can be performed at a very high speed as compared with the processing for examining whether or not all the pixels of the search target image are similar to the original image.
  • a region similar to the original image is extracted by the similar region extracting unit from the candidates found as described above. That is, since these candidates indicate that the similarity to the original image is high by the matching value indicating the similarity, any of these candidates is considered to be a search target. Therefore, after limiting the candidates as described above, the similarity between all the pixels in the candidate and all the pixels in the original image is calculated. As a result, it is highly probable that the most similar area is most similar to the original image, and this area is extracted. As a result, an image similar to the original image can be searched for in the search target image.
  • the similarity is calculated for all the pixels of the original image and all the pixels in a plurality of regions which have been candidates by the above-described processing. Since only the pixels of the part are used, the candidate can be determined at high speed.Since this candidate is a part of the search target image, the target to calculate the similarity by comparing with all the pixels of the original image can be determined. Part of the search target image. Therefore, the processing can be performed at a very high speed as compared with the processing for examining whether or not all the pixels of the search target image are similar to the original image.
  • the above-mentioned candidates are extracted based on a collation value indicating the similarity between the collation pixel and the comparison pixel. According to the determination based on the collation value, it is possible to determine whether the collation pixel is similar to the comparison pixel, but whether all pixels in the original image and all pixels in the candidate are very similar. It cannot be determined. However, if a configuration is adopted in which a plurality of the above candidates are detected based on the collation value, an area having a high degree of similarity to the original image is not ultimately extracted based on the collation value alone, but the most similar region is extracted from the plurality of candidates. Regions can be extracted.
  • the search target site is included in these candidates with a very high probability. Therefore, even with a configuration in which candidates are listed with a small number of collation pixels and all pixels in the original image are compared, search can be performed with extremely high accuracy.
  • the collation pixel is a part of the original image, and by comparing the collation pixel with a comparison pixel in the search target image, it is determined whether or not the compared portion is similar to the original image.
  • a configuration in which the collation pixels are arranged every 5 to 10 pixels vertically and horizontally in the original image, and each pixel corresponding to 1 /, 8 to 1/16 of the number of vertical or horizontal pixels in the original image A configuration in which the collation pixels are arranged at the same time can be adopted. According to such a configuration, it is possible to set the reference pixel without causing positional deviation from the original image.
  • various pitches other than the above-mentioned specific example can be adopted as the pitch of the matching pixels, and the pitch can be adjusted according to the size of the original image or the search target image, the required search accuracy, and the search speed. .
  • the collation value only needs to indicate the similarity between the gradation value of the collation pixel and the gradation value of the comparison pixel according to the value.
  • the collation pixel corresponding to the same position and the comparison pixel are compared.
  • the similar region extracting means When extracting a region having a high degree of similarity from the collation value as a candidate, the similar region extracting means considers some of the higher-ranked regions having a small difference as candidates and considers a region whose difference is equal to or less than a predetermined threshold as a candidate.
  • the candidate can be extracted only by the addition / subtraction operation of the gradation value between the collation pixel and the comparison pixel, and the candidate can be extracted at high speed.
  • Various configurations can be employed for extracting a region having a high degree of similarity as a candidate from the collation value by the similar region extracting means.
  • calculate the collation value It is possible to adopt a configuration in which the searched area and its matching value itself are stored in a storage medium, and after the scanning of the search target image is completed, an area having a high degree of similarity is extracted by referring to the storage medium.
  • data indicating an area that gives a high similarity collation value to the storage medium may be sequentially stored up to a predetermined number of areas. .
  • the collation value calculating means when the collation value is calculated by the collation value calculating means, the collation value in the already stored area is referred to, and when the calculated collation value indicates a higher similarity, the storage medium is stored. Update the stored contents.
  • the data indicating the area stored in the storage medium at the time when the scanning is completed is data relating to some higher-order areas having a high degree of similarity. Therefore, the similar area extracting means can process the upper area having a high degree of similarity only by referring to the data in the storage medium, and at the same time as the end of scanning, the gradation values of almost all the pixels in the above area. The process can be shifted to a process of calculating the similarity between and the tone values of substantially all the pixels of the original image.
  • the similarity may be information indicating the degree of similarity between all the pixels of the original image and all the pixels of each of the above-mentioned candidates, and may be the same as the above-mentioned collation value. It can be configured by a value obtained by adding the difference of the gradation value to all the pixels of each candidate.
  • a part similar to the original image can be searched from the search target image by the processing by the similar region extraction means.
  • the scanning means are sequentially changed to calculate the matching value. If each area is selected so that it does not overlap during the scanning process, fine adjustment of each area may result in higher similarity . Therefore, after extracting the area having a high degree of similarity by the similar area extracting means, an area having the same size as the original image is set in the vicinity of the area.
  • the degree of similarity between the set area and the original image may be calculated. In such a configuration, a region having the highest ⁇ similarity among the similarities is set as a similar image of the original image, and a portion of the search target image that best matches the original image is regarded as a similar image. Can be extracted.
  • the above-described similar image extracting apparatus may be implemented independently, or may be implemented together with another method while being incorporated in a certain device. Includes various embodiments, and can be appropriately changed.
  • the method of searching for a similar image by calculating the similarity for all pixels of the original pixel after limiting the detection of the search region from some pixels of the original image described above is performed according to a predetermined procedure. It goes without saying that there is an invention in the procedure at the root of proceeding. Therefore, the present invention can be applied also as a method, and the invention according to claim 6 has basically the same operation.
  • a predetermined program may be executed by the similar image extracting device. The present invention is also applicable as this program, and the invention according to claim 7 has basically the same operation.
  • any storage medium can be used to provide the program.
  • a magnetic recording medium or a magneto-optical recording medium may be used, and the same applies to any recording medium to be developed in the future.
  • the concept of the present invention is not completely different, and it is necessary to record a part on a recording medium.
  • a form in which the data is appropriately read in accordance with the information is also included.
  • Figure 1 is a block diagram of the computer system.
  • FIG. 2 is a functional block diagram of the similar image extraction program.
  • FIG. 3 is a flowchart of a process performed by the similar image extraction program.
  • FIG. 4 is an explanatory diagram illustrating a processing example according to the present embodiment.
  • FIG. 5 is an explanatory diagram illustrating a processing example according to the present embodiment.
  • FIG. 1 is a block diagram showing a computer system that executes a similar image extraction program according to an embodiment of the present invention.
  • a computer system 10 has a scanner as an image input device.
  • Each input device is capable of generating image data that represents an image by dot matrix pixels and outputting the image data to the computer main unit 12, where the image data is RGB. By displaying 256 gradations for each of the three primary colors, approximately 1.67 million colors can be expressed.
  • a flexible disk drive 13a as an external auxiliary storage device, a hard disk 13b, and a CD-ROM drive 13c are connected to the computer body 12.
  • the hard disk 13b stores the main programs related to the system, and stores necessary programs and image data from the flexible disk 13a1 and CD-ROM13c1 as needed. It is readable.
  • a modem 14a is connected as a communication device for connecting the computer body 12 to an external network or the like, and is connected to the external network via the same public communication line or the like. It can be connected and downloaded software and image data can be introduced.
  • the modem 14a accesses the outside through a telephone line.
  • a keyboard 15a and a mouse 15b are connected to operate the computer body 12.
  • the original image data and the search target image data in the present invention are respectively input to the computer main body 12 from the input device, the external auxiliary storage device, the communication device, and the like.
  • a display 17a and a color printer 17b are provided as image output devices.
  • the display 17a has a display area of 1024 pixels in the horizontal direction and 768 pixels in the vertical direction, and each pixel can display the above mentioned 1670,000 colors. I have. Of course, this resolution is merely an example, and can be changed as appropriate, such as 640 ⁇ 480 pixels or 800 ⁇ 600 pixels.
  • the operating system (OS) 12a is operating as the basic program, and the operating system 12a has a display for displaying on the display 17a.
  • a printer driver (PRTDRV) 12c that prints to the driver (DSPDRV) 12b and the color printer 17b is incorporated.
  • These drivers 12b and 12c depend on the model of the display 17a and color printer 17b, and can be added to and changed from the operating system 12a according to each model. is there. Also, depending on the model, additional functions beyond the standard processing can be realized. In other words, it is possible to realize various additional processes within the allowable range while maintaining a common processing system on the standard system of the operating system 12a.
  • the computer 12 includes a CPU 12 e, a ROM 12 f, a RAM I 2 g, and an I / O l 2 h.
  • the CPU 12e that executes the arithmetic processing uses the ROM 12f as a temporary work area setting storage area or writes it to the RAM I 2g while using it as a program area. It executes the basic program as appropriate to control external devices and internal devices connected via I / O 12h.
  • the application (APL) 12 d is executed on the operating system 12 a as the basic program.
  • the processing contents of the application 12d are various, and the operation of the keyboard 15a or the mouse 15b as an operation device is monitored, and when operated, various external devices are appropriately applied.
  • the processing result of the application 12 d is output as print data to the above-described color printer 17 b via the printer driver 12 c, and the color printer 17 b is a color printer.
  • the color printer 17 b is a color printer.
  • the similar image extraction program according to the present invention can be provided as the above application 12d, or as a program that realizes a part of the functions of the application 12d. Can also be. It is particularly preferable to incorporate the similar image extraction program according to the present invention into a panorama photograph synthesis program image search program.
  • FIG. 2 shows the functional block diagram of the similar image extraction program and the data used in the processing.
  • Figure 3 shows the processing flow of the similar image extraction program.
  • the similar image extraction program 20 includes an image data acquisition module 21, a reference pixel gradation value acquisition module 22, a scanning unit 23, and a similar area extraction module 24.
  • the scanning unit 23 further includes a comparison pixel gradation value acquisition module 23a and a collation value calculation module 23b.
  • the original image data and the search target image data are stored on the hard disk 13 b.
  • the data may be data obtained from a device such as 1b, or may be data obtained through a modem 14a or the like.
  • the image data acquisition module 21 proceeds to step S100 to The original image data is read from the disk 13b and temporarily stored in RAM I 2g (original image data 12g 1).
  • the following processing may be performed by acquiring all the color components of the image data, a specific color component may be acquired, or a component other than RGB (for example, a luminance component) may be acquired. Good.
  • step S 105 the reference pixel gradation value acquisition module 22 sets a reference pixel for the original image data 12 g 1, and sets the reference pixel gradation value (reference pixel gradation value 12 g 3) Get.
  • FIG. 4 shows an example of processing in the present embodiment, which will be described in detail later.
  • the collation pixels are set at a fixed pixel pitch, and the collation pixels can be set for each lZm (m is a natural number) of the number of vertical and horizontal pixels of the original image, or can be set for each pixel (1 is a natural number).
  • the position can be determined by various methods such as setting.
  • step S110 the image data acquisition module 21 reads out the search target image data from the hard disk 13b and temporarily stores it in the RAM I 2g (search target image data 12g2).
  • steps S115 to S140 a loop process is performed under the control of the scanning unit 23. That is, in step S115, the comparison pixel tone value acquisition module 23a sets an area having the same size as the original image on the search target image (hereinafter, referred to as a comparison area). Further, in step S120, the comparison pixel gradation value acquisition module 23a sets a comparison pixel corresponding to the same position as the above-mentioned comparison pixel in the comparison area, and sets the gradation value (comparison pixel gradation). Obtain the adjustment value 1 2 g 4).
  • the collation value calculation module 23b calculates the collation value with reference to the collation pixel gradation value 12g3 and the comparison pixel gradation value 12g4.
  • the collation value is the gradation value of the collation pixel and the comparison pixel corresponding to the same position. This value is the sum of the differences. The smaller the value, the higher the similarity. Further, the collation value calculation module 23b performs processing of storing the top three similarities indicated by the collation values in steps S130 and S135 in RAM I2g.
  • RAM I 2 g has a storage capacity for storing a collation value and a collation value 1 2 g 5 indicating a position of an area to which the collation value is given, and a memory capable of storing three locations. Capacity is secured.
  • step S130 it is determined whether or not the calculated collation value is smaller than the collation value already stored in the RAM 12g (high similarity) (step S130), and is smaller than the existing collation value. If it is determined that the collation value has been calculated, the collation value 12 g5 in the RAM I 2 g is updated with the collation value calculated above (step S135). That is, the largest matching value is deleted from the existing matching values 1 2 g 5 and the calculated matching value is stored in RAM 12 g. If it is not determined in step S130 that the collation value is smaller than the existing collation value, the update of RAM12g is skipped.
  • step S140 it is determined whether or not the process of calculating the collation value for the comparison region has been completed for all the regions in the search target image, and the processes in step SI15 and thereafter are determined until it is determined that the process has been completed. repeat.
  • step S115 a new comparison area is set so as not to overlap within the search target image. Of course, the comparison area is changed while partially overlapping, and the processing proceeds. You may.
  • the matching value is calculated for the entire area in the search target image in step S 140. After it is determined that the processing to be performed is completed, the top three places of the similarity in the comparison value 12 g5 of the RAM 12 g are stored in each comparison area. For the first three iterations Since only three or less existing collation values are stored in the RAM 12g, the process of storing the first three locations without discrimination may be performed. Of course, the three maximum matching values may be stored as the initial values.
  • step S145 the comparison area indicated by the comparison value 12g5 is set as a candidate, and the similar area extraction module 24 calculates the similarity between each of the candidates and the original image.
  • a peripheral area having the same size as the original image is set at a position obtained by moving the position of each candidate up, down, left, and right, and the similarity between the image of the peripheral area and the original image is calculated.
  • the similarity is a value obtained by adding the difference between the tone values of the pixels corresponding to the same t position for all the pixels belonging to the original image and the comparison region (or the peripheral region).
  • the similarity in the present embodiment is the same as the above collation value, although the number of target pixels is different from the matching value, but the concept is the same, and the smaller the similarity, the smaller the original image and the comparison area (or the surrounding area). ) Are similar.
  • the comparison area or the peripheral area having the minimum value (most similar) among the similarities calculated in step S145 is determined as a similar image, and the similar image is determined. Is stored in RAM 12 g (similar image data 12 g 6).
  • FIGS. 4 and 5 are explanatory diagrams illustrating a state in which a part similar to the image indicated by the original image data 12 g1 is searched from the search target image data 12 g2 of a photograph in which a mountain is a subject.
  • the reference pixel gradation value acquisition module 22 includes a plurality of reference pixels X in the original image data 12 g 1 as shown on the left side of FIG. Set X for each collation pixel. To obtain the gradation value of.
  • a comparison area C is set for the search target image data 12g2, and the search target image is set. A process of sequentially changing the comparison area C in the image data 1 2 g 2 is performed.
  • the comparison area C is moved from the left to the right, and when the comparison area C reaches the right end, the comparison area C is moved down and again from the left to the right, and the search target image data 1 2 g Scan for the whole of 2. Further, in this scanning process, the comparison pixel gradation value acquisition module 23a sets the comparison pixel X in the comparison area. Comparison pixel X corresponding to the position of. Set, acquires the gradation value of each ratio ⁇ element X e. The matching value calculation module 23b calculates the matching value by adding the difference between the matching pixel and the comparison pixel.
  • i is a number for specifying a pixel position in the horizontal direction
  • j is This is a number that specifies the pixel position in the vertical direction, and both are natural numbers.
  • the origin in each parenthesis is the coordinates of the left end of the original image and the comparison area. Therefore, the comparison pixel in the original image and the comparison pixel in the comparison area are specified by the combination of i and j.
  • T indicates the pitch of the matching pixel and the comparison pixel, and indicates that pixels are acquired at a predetermined pitch in the original image and the matching value is calculated. That is, reference pixel X.
  • the collation value calculation module 23b stores the collation values of the top three in the order of the degree of similarity in RAM 12g.
  • Similar region extraction module 2 4 matching value stored in the RAM 1 2 g, 1 2 g 5 refers to the identifies three the position of the comparison area indicated by the matching value 1 2 g 5.
  • An area (peripheral area) of the same size as the comparison area is set on the upper, lower, left, and right sides of the comparison area to determine the similarity between all pixels of the original image and all pixels of the comparison area (or peripheral pixels). calculate. That is, in Figure 5 As shown in the figure, in the situation where the comparison areas C 1, C n, etc. are extracted as candidates based on the comparison value 12 g 5, the similarity is calculated by changing the position of the comparison area as shown by the broken line. I do. .
  • the similarity is calculated according to the formula ⁇ (X. (i, j)- ⁇ ⁇ ⁇ (i, j)) shown in FIG.
  • i and j are natural numbers and indicate the coordinates of the original image, the comparison area, and the surrounding area. Again, the origin is the coordinates of the left edge of the image.
  • i and j have a larger value range than that shown in Fig. 4 above
  • i is the value range of the number of horizontal pixels in the original image, the comparison region, and the peripheral region
  • j is the value of the original image, the comparison region, and the peripheral region.
  • the number of vertical pixels is the value range.
  • n is a natural number, which is a number that specifies the comparison area and its surrounding area.
  • a region most similar to the original image can be extracted from the comparison region and the peripheral region.
  • the comparison region is a region extracted as a similar image candidate from the search target image data 12g2 based on the collation value shown in FIG. 4, and is therefore the most significant region based on the similarity shown in FIG.
  • the region extracted as a similar part has a very high probability of being the part most similar to the original image in all of the search target image data 12 g 2. Therefore, a similar image can be determined by the above processing.
  • the force S that determines the candidate for the comparison area based on only a part of the pixels, and the similar area extraction module 24 finally compares all the pixels.
  • the comparison target is expanded to the surrounding area, a similar image can be searched very accurately.
  • similar area extraction module 24 The process of calculating the similarity only for the comparison region as the candidate and extracting the region having the highest similarity may be performed without expanding the target of calculating the similarity between the surrounding regions. .
  • the extracted region is not necessarily the most similar to the original image in the search target image, but a portion close to the most similar image can be searched very quickly.
  • the scanning unit 23 does not necessarily have such a configuration that all the search target images are to be scanned while avoiding duplication when setting the comparison area. For example, when the collation value calculated by the collation value calculation module 23b is very large (when the similarity is very small), the scanning pitch is increased when the next comparison area is set. It is possible to adopt a configuration in which the comparison area is set farther and the scanning pitch is reduced as the collation value increases. Further, a configuration may be adopted in which the number of collation pixels is reduced when the collation value is extremely large. According to these configurations, redundant processing can be effectively reduced, and candidate comparison regions can be extracted more quickly.
  • the present invention can be applied to various situations. For example, as described above, when it is desired to specify an area that matches between connected pictures when synthesizing a panoramic picture, the original image is cut out from one image, and the similar image extraction program according to the present invention is applied to the other image. By doing so, it is possible to easily identify a site that matches in both images. Therefore, it is possible to easily specify the position connecting the two. In this case, even if a plurality of candidates for the comparison area are extracted, a condition that a part regarded as a similar image must exist on the left side of one image and exist on the right side of the other image. For example, the processing can be completed faster. Industrial applicability
  • a connection position search for connecting panorama photograph images, and the like a search target It is possible to provide a computer or the like that realizes a function of searching for a part similar to the original image in the image.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

従来の画像検索においては検索精度が充分ではなかった。また、高速に画像を検索可能な手法が望まれていた。元画像データと検索対象画像データとを取得し、元画像の複数の位置に照合画素を設定するとともに当該照合画素の階調値を取得し、検索対象画像上に元画像と同じ大きさの領域を設定し、当該領域を逐次変更しながら、当該領域において上記照合画素と同じ位置に相当する比較画素の階調値を取得し、上記照合画素の階調値と比較画素の階調値との類似度を示す照合値を算出する工程を行い、上記照合値が示す類似度が高い領域について当該領域内の略全画素の階調値と上記元画像の略全画素の階調値との類似度を算出して、類似度の高い領域を抽出する。

Description

明 細 書 類似画像抽出装置、 類似画像抽出方法および類似画像抽出 プログラム 技術分野
本発明は、 類似画像抽出装置、 類似画像抽出方法および類似画像抽出 プログラムに関する。 背景技術
近年、 デジタルカメ ラ等による撮像画像あるいはその一部など'を検索 する画像検索ゃパノラマ写真画像を連結する際の接続位置検索等を実施 する当たり、 検索対象の画像内で元画像に類似する部位を検索する種々 の手法が提案されている (例えば、 特開平 4一 3 2 9 4 9 0号公報, 特 開昭 6 3 — 1 4 2 9 9 1号公報を参照) 。 発明の開示
上述した従来の検索においては検索精度が充分ではなかった。 また、 高速に画像を検索可能な手法が望まれていた。 例えば、 上記特許文献 1 における手法では、 ヒ ス ト グラムの類似度を計算して対象枠内の画像と 類似度枠内の画像とを照合しており、 正確に画像検索をすることができ なかった。 また、 上記特許文献 2における手法では相互相関係数 f ( τ ) を縦横画素について求めることによって画像と画像をつなぎ合わせてお り、 計算対象が全画素になるため処理速度が遅かった。
本発明は、 上記課題にかんがみてなされたもので、 画像検索の精度が 高く、 また、 高速に処理を実行可能な類似画像抽出装置、 類似画像抽出 方法および類似画像抽出プログラムの提供を目的とする。
上記目的を達成するため、 本発明では元画像内の一部の画素を利用し て検索対象画像の中から類似部位の候補を探し、 これらの候補と元画像 とを画素毎に比較することによって元画像と類似する部位を検索対象画 像から抽出する。 このために、 本発明は画像データ取得手段と照合画素 階調値取得手段と比較画素階調値取得手段と照合値算出手段と走査手段 とを備えている。 これらの手段によって、 元画像データと検索対象画像 データとを取得し、 元画像と同じ大きさの領域で検索対象画像を走査し ながら、 照合画素の階調値と比較画素の階調値との類似度を示す照合値 を算出する。
ここで、 照合画素は元画像内の複数の位置に配置されるが、 元画像の 画素数よ り少ない画素数である。 従って、 元画像と同じ大きさの領域毎 に検索対象画像を走査することによ り、 検索対象画像内の一部の画素と 元画像の一部の画素とを照合するのみで検索対象画像内で元画像内に類 似する部位を候補と して探し出すこ とができる。 このため、 検索対象画 像の全画素について元画像と類似するか否かを検討する処理と比較して、 非常に高速に処理を行う ことができる。
さ らに本発明では、 上述のよ うにして探し出した候補の中から、 類似 領域抽出手段によって元画像に類似する領域を抽出する。 すなわち、 こ れらの候補は上記類似度を示す照合値によって元画像との類似度が高い ことが示されているので、 これらのいずれかが検索対象であると考えら れる。 そこで、 上述のよ うにして候補を限定した上で候補内の全画素と 元画像の全画素との類似度を算出する。 この結果、 最も類似する と され た領域が元画像に最も類似している可能性が高く、 この領域を抽出する ことにより、 検索対象画像内で元画像と類似する画像を検索することが できる。
本発明においては、 元画像の全画素と上述の処理によって候補となつ た複数の領域内の全画素とで類似度を計算しているが、 この候補を決定 するためには上述のよ うに一部の画素のみが使用されているため高速に 候補を決定することができる し、 この候補は検索対象画像の一部である ため、 元画像の全画素と比較して類似度を算出する対象も検索対象画像 の一部である。 従って、 検索対象画像の全画素について元画像と類似す るか否かを検討する処理と比較して、 非常に高速に処理を行う ことがで さる。
また、 上述の候補は上記照合画素と比較画素との類似度を示す照合値 に基づいて抽出される。 この照合値に基づく判別によれば、 上記照合画 素と比較画素とが類似するか否かを判別することができるが、 元画像の 全画素と候補内の全画素とが非常に似通っているか否かを決定すること はできない。 しかし、 照合値によって上述の候補を複数個検出するよ う に構成すれば、 照合値のみによって最終的に元画像と類似度の高い領域 を抽出するのではなく、 複数個の候補から最も類似する領域を抽出する ことができる。
検索対象画像内に元画像と一致する部位あるいは非常に類似している 部位が存在するのであれば、 これらの候補の中に非常に高い確率で検索 対象の部位が含まれる。 従って、 少ない照合画素数で候補を挙げた上で 元画像内の全画素と比較する構成であっても非常に高精度に検索を実行 することができる。 尚、 本発明によれば、 検索対象画像から元画像に類 似する領域を抽出することができるので、 むろん、 検索対象画像から元 画像と同一の領域を抽出することも可能である。 ここで、 上記照合画素は上記元画像の一部であって、 当該照合画素と 検索対象画像内の比較画素とを照合することによって、 比較された部位 が元画像に類似しているか否かを判定することができればよく、 種々の 位置, 数の照合画素を設定するこ とができる。 その構成例と して、 元画 像の縦およびまたは横の一定画素数毎に照合画素を設定する構成等を採 用可能である。
よ り具体的には、 元画像中の縦横 5〜 1 0画素毎に照合画素を配置す る構成や元画像の縦または横画素数の 1 /, 8〜 1 / 1 6 に相当する画素 毎に照合画素を配置する構成等を採用可能である。 このよ う な構成によ れば、 元画像の中から位置的な偏り を生じさせることなく 照合画素を設 定することができる。 むろん、 照合画素のピッチと しては上述の具体例 以外にも種々のピッチを採用可能であり、 元画像や検索対象画像の大き さ, 必要な検索精度, 検索速度に応じて調整可能である。
さ らに、 照合値はその値によつて照合画素の階調値と比較画素の階調 値との類似度を示していればよく、 例えば、 同じ位置に相当する照合画 素と比較画素との階調値の差分を加え合わせた値等を採用可能である。 この差分は照合画素の階調値と比較画素の階調値との差異が大きいほど 大きく なる。 従って、 この差分が小さければ類似度が高いと言える。 類 似領域抽出手段において照合値から類似度が高い領域を候補と して抽出 する際には、 差分が小さいものの上位いくつかを候補と したり、 差分が 所定の閾値以下となるものを候補とするなど、 種々の構成を採用可能で ある。 いずれにしても、 照合画素と比較画素との階調値の加減演算のみ で候補を抽出することができ、 高速に候補を抽出する'ことができる。 類似領域抽出手段において照合値から類似度が高い領域を候補と して 抽出するためには種々の構成を採用可能である。 例えば、 照合値を算出 した領域とその照合値自体を記憶媒体に保存しておき、 検索対象画像の 走査を終了した後に記憶媒体を参照して類似度が高い領域を抽出する構 成を採用可能である。 走査を実施する上で好適な他の構成と して、 予め 決められた領域数を限度と して記憶媒体に類似度の高い照合値を与える 領域を示すデータを逐次記憶していってもよい。
この場合さ らに、 照合値算出手段において照合値を算出したときに、 既に記憶した領域の照合値を参照し、 算出された照合値がよ り高い類似 度を示している ときに記憶媒体の記憶内容を更新する。 この構成によれ ば、 上記走査を終了した時点で記憶媒体に記憶されている上記領域を示 すデータは類似度が高い上位いくつかの領域に関するデータとなる。 従 つて、 類似領域抽出手段では、 この記憶媒体のデータを参照するのみで 類似度が高い上位の領域について処理を行う ことができ、 走査終了と同 時に上記領域内の略全画素の階調値と上記元画像の略全画素の階調値と の類似度を算出する処理に移行することができる。 尚、 この類似度は、 元画像の全画素と上述の各候補の全画素とが類似している度合を示す情 報であればよく 、 上述の照合値と同様に元画像の全画素と上述の各候補 の全画素とについて階調値の差分を加え合わせた値等によって構成する ことができる。
以上のよ うに、 類似領域抽出手段での処理によって検索対象画像の中 から元画像に類似した部位を検索することができるが、 上述のよ うに走 査手段においては、 検索対象画像上で上記領域を逐次変更して照合値の 算出を行わせており、 走査の過程において重複しないよ うに各領域を選 択した場合には、 各領域を微調整した方がより高い類似度になる場合も ある。 そこで、 類似領域抽出手段において、 上記類似度の高い領域を抽 出した後に当該領域の近隣にて上記元画像と同じ大きさの領域を設定す る と ともに当該設定した領域と上記元画像との類似度を算出してもよい。 かかる構成においては、 この類似度の中から最も高い ^類似度を有する領 域を元画像の類似画像とすることによ り、 検索対象画像の中から元画像 と最も合致する部位を類似画像と して抽出することができる。
と ころで、 上述した類似画像抽出装置は、 単独で実施される場合もあ る し、 ある機器に組み込まれた状態で他の方法と ともに実施されること もあるなど、発明の思想と しては各種の態様を含むものであ'つて、適宜、 変更可能である。 また、 上述した元画像の一部の画素から検索部位の候 捕を限定した後に、 元画素の全画素について類似度を算出することによ つて類似画像を検索する手法は、 所定の手順に従って処理を進めていく うえで、 その根底にはその手順に発明が存在するという ことは当然であ る。 したがって、 本発明は方法と しても適用可能であり、 請求項 6にか かる発明においても、 基本的には同様の作用となる。 本発明を実施しよ う とする際に、 類似画像抽出装置にて所定のプログラムを実行させる場 合もある。 本発明はこのプログラムと しても適用可能であり、 請求項 7 にかかる発明においても、 基本的には同様の作用となる。
むろん、 請求項 2〜 求項 5に記載された構成を上記方法やプロダラ ムに対応させることも可能であることは言うまでもない。 また、 いかな る記憶媒体もプログラムを提供するために使用可能である。 例えば、 磁 気記録媒体や光磁気記録媒体であってもよいし、 今後開発されるいかな る記録媒体においても全く 同様に考えることができる。 また、 一部がソ フ トウエアであって、 一部がハードウェアで実現される場合においても 本発明の思想において全く異なるものではなく、 一部を記録媒体上に記 録しておいて必要に応じて適宜読み込む形態のものも含まれる。さ らに、 一次複製品、 二次複製品などの複製段階については全く 問う余地なく 同 等である。 図面の簡単な説明
第 1 図は、 コンピュータシステムのブロ ック図である。
第 2図は、 類似画像抽出プログラムの機能プロ ック図である。
第 3図は、 類似画像抽出プログラムでの処理フローチヤ一トである。 第 4図は、 本実施形態での処理例を説明する説明図である。
第 5図は、 本実施形態での処理例を説明する説明図である。 発明を実施するための最良の形態
ここでは、下記の順序に従って本発明の実施の形態について説明する。
( 1 ) システムハードウェア構成 :
( 2 ) 類似画像抽出プログラムの構成および処理 :
( 3 ) 類似画像抽出処理の例 :
( 4 ) 他の実施形態 :
( 1 ) システムハードウェア構成 :
図 1 は、 本発明の一実施形態にかかる類似画像抽出プログラムを実行 するコンピュータシステムをブロック図によ り示している。 同図におい て、 コンピュータシステム 1 0は、 画像入力デバイス と して、 スキャナ
1 1 a とデジタルスチルカメ ラ 1 1 b と ビデオカメ ラ 1 1 c とを備えて おり、 コンピュータ本体 1 2に接続されている。 それぞれの入力デバィ スは、 画像を ドッ トマ ト リ クス状の画素で:表現した画像データを生成し てコンピュータ本体 1 2に出力可能となっており、 ここで、 同画像デー タは、 R G Bの三原色においてそれぞれ 2 5 6階調表示することによ り、 約 1 6 7 0万色を表現可能となっている。 コンピュータ本体 1 2 には、 外部補助記憶装置と してのフ レキシブル ディスク ドライブ 1 3 a と、 ハー ドディスク 1 3 b と、 C D— R OMド ライブ 1 3 c とが接続されている。 また、 ハー ドディスク 1 3 b には、 システム関連の主要プログラムが記録されており 、 フレキシブルデイス ク 1 3 a 1や C D— R OM 1 3 c 1 などから適宜必要なプログラムや画 像データなどを読み込み可能となっている。
さ らに、 コ ンピュータ本体 1 2 を外部のネッ ト ワークなどに接続する ための通信デバィス と してモデム 1 4 a が接続されており 、 外部のネッ ト ワークに同公衆通信回線等を介して接続し、 ソフ ト ウェアや画像デー タなどをダウンロー ドして導入可能となっている。 この例ではモデム 1 4 a にて電話回線を介して外部にァクセスするよ う にしているが、 L A Nアダプタを介してネッ ト ワークに対してアクセスする構成とするこ と も可能である し、 ルーターを介して外部回線にアクセス してもよい。 こ の他、 コ ンピュータ本体 1 2の操作用にキーボー ド 1 5 aやマウス 1 5 b も接続されている。 本発明における元画像データ と検索対象画像デー タ とはそれぞれ、 上記入力デバイスや外部補助記憶装置、 通信デバイス 等からコ ンピュータ本体 1 2 に入力される。
また、 画像出力デバイス と して、 ディスプレイ 1 7 a とカラープリ ン タ 1 7 b とを備えている。 ディスプレイ 1 7 a については水平方向に 1 0 2 4画素と垂直方向に 7 6 8画素の表示エリ アを備えており 、 各画素 毎に上述した 1 6 7 0万色の表示が可能となっている。 むろん、 この解 像度は一例に過ぎず、 6 4 0 X 4 8 0画素であったり 、 8 0 0 X 6 0 0 画素であるなど、 適宜変更可能である。
一方、 このよ う な画像入力デバイスを使用 して画像を入力しつつ、 画 像出力デバイスに表示あるいは出力するため、 コ ンピュータ本体 1 2內 では所定のプログラムが実行されるこ とになる。 その う ち、 基本プログ ラムと して稼働しているのはオペレーティ ングシステム (O S ) 1 2 a であ り 、 このオペレーティ ングシステム 1 2 a にはディ スプレイ 1 7 a での表示を行わせるディスプレイ ドライバ (D S P D R V) 1 2 b と力 ラープリ ンタ 1 7 b に印刷出力を行わせるプリ ンタ ドライバ ( P R T D R V ) 1 2 c が組み込まれている。 これらの ドライバ 1 2 b , 1 2 c の 類はディスプレイ 1 7 aやカラープリ ンタ 1 7 b の機種に依存しており それぞれの機種に応じてオペレーティ ングシステム 1 2 a に対して追加 変更可能である。 また、 機種に依存して標準処理以上の付加機能を実現 するこ と もできる よ う になつている。 すなわち、 オペレーティ ングシス テム 1 2 a という標準システム上で共通化した処理体系を維持しつつ、 許容される範囲内での各種の追加的処理を実現できる。
むろん、 このよ う なプログラムを実行する前提と して、 コンピュータ 本体 1 2内には C P U 1 2 e と R OM 1 2 f と R AM I 2 g と I /O l 2 hなどが備えられており 、 演算処理を実行する C P U 1 2 e が R OM 1 2 f を一時的なワークエリ ァゃ設定記憶領域と して使用 したり プログ ラム領域と して使用 しながら、 R AM I 2 g に書き込まれた基本プログ ラムを適宜実行し、 I /O 1 2 hを介して接続されている外部機器及び 内部機器などを制御している。
この基本プログラムと してのオペレーティ ングシステム 1 2 a 上でァ プリ ケーシヨ ン (A P L ) 1 2 dが実行される。 アプリ ケーショ ン 1 2 dの処理内容は様々であり 、 操作デバイ ス と してのキーボー ド 1 5 aや マウス 1 5 b の操作を監視し、 操作された場合には各種の外部機器を適 切に制御して対応する演算処理などを実行し、 さ らには、 処理結果をデ イスプレイ 1 7 a に表示したり 、 カラープリ ンタ 1 7 b に出力したりす るこ とになる。
ここで上述したカラープリ ンタ 1 7 b には、 プリ ンタ ドライバ 1 2 c を介してアプリ ケーショ ン 1 2 dの処理結果が印刷データと して出力さ れ、 同カラープリ ンタ 1 7 bは色イ ンクを用いて印刷用紙上に ドッ トを 付すこ とによ り 、 対応する文字や画像を印刷する。 本発明にかかる類似 画像抽出プログラムは、 上記アプリ ケーシヨ ン 1 2 d と して提供するこ と もできる し、 アプリ ケーショ ン 1 2 dの機能の一部を実現するプログ ラムと して提供するこ ともできる。 パノ ラマ写真の合成プロダラムゃ画 像検索プログラムに本発明にかかる類似画像抽出プロダラムを組み込む と特に好ま しい。
( 2 ) 類似画像抽出プログラムの構成および処理 :
図 2は類似画像抽出プロダラムの機能プロ ック図および処理において 使用するデータを示しており、 図 3 は類似画像抽出プログラムでの処理 フローを示している。 以下、 これらの図にしたがってプログラムの機能 および処理を説明する。 類似画像抽出プログラム 2 0 は、 図 2 に示すよ う に画像データ取得モジュール 2 1 と照合画素階調値取得モジュール 2 2 と走査部 2 3 と類似領域抽出モジュール 2 4 とを備えている。 走査部 2 3 はさ らに、 比較画素階調値取得モジュール 2 3 a と照合値算出モジ ユール 2 3 b とを備えている。
図では元画像データ と検索対象画像データ とがハー ドディスク 1 3 b に保存されている例について説明しているが、 むろん、 他の媒体に保存 されていてもよいし、 デジタルスチルカメ ラ 1 1 b等の機器から取得さ れるデータであってもよいし、 モデム 1 4 a等を介して取得されるデー タであってもよい。類似画像抽出プログラム 2 0の処理が開始される と、 画像データ取得モジュール 2 1 はステップ S 1 0 0においてハー ドディ スク 1 3 bから元画像データを読み出して R AM I 2 gに一時記憶させ る (元画像データ 1 2 g 1 ) 。 ここでは、 画像データの全色成分につい て取得して以下の処理を行つてもよいし、 特定の色成分のみであっても よいし、 R G B以外の成分 (例えば輝度成分) を取得してもよい。
ステップ S 1 0 5では、 照合画素階調値取得モジュール 2 2が元画像 データ 1 2 g 1 に対して照合画素を設定し、 当該照合画素の階調値 (照 合画素階調値 1 2 g 3 ) を取得する。 図 4は後に詳述する本実施形態で の処理例であり、 このステップ S 1 0 5では同図左側の元画像データ 1 2 g 1 に黒丸で示すよ うに、 元画像内のごく一部の画素を照合画素と し ている。 照合画素は一定の画素ピッチ毎に設定されており、 元画像の縦 横画素数の l Zm (mは自然数) 毎に照合画素を設定したり、 1 画素毎 ( 1 は自然数) に照合画素を設定するなど種々の手法で位置を決定する こ とができる。
ステップ S 1 1 0では画像データ取得モジュール 2 1 がハー ドデイス ク 1 3 bから検索対象画像データを読み出して R AM I 2 gに一時記憶 させる (検索対象画像データ 1 2 g 2 ) 。 ステップ S 1 1 5〜 S 1 4 0 では、 走査部 2 3 の制御によるループ処理が行われる。 すなわち、 ステ ップ S 1 1 5では比較画素階調値取得モジュール 2 3 aが検索対象画像 上に上記元画像と同じ大きさの領域 (以下、 比較領域という) を設定す る。 さ らに、 ステップ S 1 2 0では比較画素階調値取得モジュール 2 3 a が当該比較領域内で上記照合画素と同じ位置に相当する比較画素を設 定し、 その階調値 (比較画素階調値 1 2 g 4 ) を取得する。
ステップ S 1 2 5では、 照合値算出モジュール 2 3 bが照合画素階調 値 1 2 g 3 と比較画素階調値 1 2 g 4 とを参照して照合値を算出する。 ここで照合値は、 同じ位置に相当する照合画素と比較画素との階調値の 差分を加え合わせた値であり、 値が小さいほど高い類似度を示す。 さ ら に、 照合値算出モジュール 2 3 b はステップ S 1 3 0 , S 1 3 5で照合 値が示す類似度の上位 3位までを R AM I 2 gに保存する処理を行う。 具体的には、 R AM I 2 gには照合値およびその照合値を与える領域の 位置を示す照合値 1 2 g 5を保存する記憶容量であって、 3箇所分の記 憶が可能な記憶容量が確保されている。
そして、 上記算出した照合値が R A M 1 2 g内に既に記憶されている 照合値よ り小さい (高い類似度) か否かを判別 (ステップ S 1 3 0 ) し、 既存の照合値よ り小さいと判 されたときには、 上記算出した照合値で R AM I 2 g内の照合値 1 2 g 5を更新 (ステップ S 1 3 5 ) する。 す なわち、 既存の照合値 1 2 g 5の中から最大の照合値を削除し、 算出し た照合値を R A M 1 2 gに記憶させる。 ステップ S 1 3 0にて既存の照 合値より小さいと'判別されないときには R A M 1 2 gの更新をスキップ する。
ステップ S 1 4 0では、 上記比較領域について照合値を算出する処理 が検索対象画像内の全領域について終了したか否かを判別し、 終了した と判別されるまで上記ステップ S I 1 5以降の処理を繰り返す。 本実施 形態の繰り返し段階においてステップ S 1 1 5では、 検索対象画像内で 重複をしないよ うに新たな比較領域を設定するが、 むろん、 一部重複さ せながら比較領域を変更して処理を進めてもよい。
R AM 1 2 gには上述のよ うに、 3箇所分の照合値を記憶可能な記憶 容量が確保されているので、 ステップ S 1 4 0にて検索対象画像内の全 領域について照合値を算出する処理が終了したと判別された後には、 R AM 1 2 gの照合値 1 2 g 5は各比較領域の中で類似度の上位 3位まで が保存されていることになる。 尚、 繰り返し処理の最初の 3回について は、 R A M 1 2 g内に既存の照合値が 3個以下しか保存されていないの で、 最初の 3箇所は判別せずに記憶する処理を行えばよい。 むろん、 初 期値と して照合値の最大値を 3個記憶させておいてもよい。
ステップ S 1 4 5では、 上記照合値 1 2 g 5が示す比較領域を候補と し、 類似領域抽出モジュール 2 4がこれら各候補と元画像の類似度を算 出する。 また、 これら各候補の位置を上下左右に移動させた位置に上記 元画像と同じ大きさの周辺領域を設定し、 この周辺領域の画像と元画像 の類似度を算出する。 ここで、 類似度は、 元画像と比較領域 (あるいは 周辺領域) とのそれぞれに属する総ての画素について同 t位置に相当す る画素の階調値の差分を加え合わせた値である。 従って、 本実施形態に おける類似度は上述の照合値とでは、 対象とする画素数が異なるものの 考え方と しては同じであり、 類似度が小さいほど元画像と比較領域 (あ るいは周辺領域) の画像が類似していることになる。 ステップ S 1 5 0 では、 当該ステップ S 1 4 5にて算出した類似度の中で最小の値 (最も 類似している) となった比較領域あるいは周辺領域を類似画像と し、 当 該類似画像の位置を示すデータを R A M 1 2 gに保存する (類似画像デ ータ 1 2 g 6 ) 。
( 3 ) 類似画像抽出処理の例 :
次に、 以上の構成および処理による動作例を説明する。 図 4, 図 5は 山を被写体と した写真の検索対象画像データ 1 2 g 2から元画像データ 1 2 g 1が示す画像に類似した部位を検索する様子を説明する説明図で ある。 照合画素階調値取得モジュール 2 2は、 図 4の左側に示すよ うに 元画像データ 1 2 g 1 内に複数の照合画素 X。を設定し、 各照合画素 X。 の階調値を取得する。 走査部 2 3においては 図 4の右側に示すよ うに 検索対象画像データ 1 2 g 2に対して比較領域 Cを設定し、 検索対象画 像データ 1 2 g 2内で比較領域 Cを逐次変更する処理を行う。
このとき、 この比較領域 Cを左から右に移動させ、 比較領域 Cが右端 に達したときには比較領域 Cを下に移 ¾させると ともに再び左から右に 移動させて検索対象画像データ 1 2 g 2の全体について走査を行う。 さ らに、 この走査の過程において比較画素階調値取得モジュール 2 3 aは 比較領域内で照合画素 X。の位置に対応した比較画素 X。を設定し、 各比 較画素 X eの階調値を取得する。照合値算出モジュール 2 3 bは照合画素 と ,比較画素との差分を加え合わせて照合値を算出する。
尚、 図 4に示す照合値の式∑ ( X。 ( i T, j T ) — X。 ( i T, j T ) ) において、 i は横方向の画素位置を特定する番号であり、 j は縦方向の 画素位置を特定する番号であり、 双方とも自然数である。 また、 各 () 内の原点は元画像や比較領域の左端の座標である。 従って、 これら i, j の組み合わせによって元画像内の照合画素や比較領域内の比較画素が 指定される。 Tは照合画素や比較画素のピッチを示しており、 元画像内 の所定ピッチで画素が取得され、照合値が計算されることを示している。 すなわち、 照合画素 X。や比較画素 X。は元画像や比較領域のごく一部 · の画素であり、 これらごく一部の画素から照合値を算出することによつ て、 元画像の全画素分の照合値を算出する場合と比較して非常に高速に 処理を行う ことができる。 照合値算出モジュール 2 3 bは、 類似度が高 い順に上位 3位までの照合値を R A M 1 2 gに保存する。
類似領域抽出モジュール 2 4は R A M 1 2 gに保存されている照合値, 1 2 g 5を参照し、 当該照合値 1 2 g 5が示す比較領域の位置を 3箇所 特定する。 そして、 これら比較領域の上下左右に当該比較領域と同じ大 きさの領域 (周辺領域) を設定して元画像の全画素と比較領域 (あるい は周辺画素) の全画素についての類似度を算出する。 すなわち、 図 5に 示すよ うに、 照合値 1 2 g 5に基づいて候補と して比較領域 C 1, C n 等が抽出されている状況において、 破線に示すよ うに比較領域の位置を 変動させて類似度を算出する。 .
類似領域抽出モジュール 2 4·においては、類似度を図 5に示す式∑ ( X 。 ( i, j ) - Χ ο η ( i , j ) ) に従って算出している。 ここで、 i , j は自然数であって元画像, 比較領域, 周辺領域の座標を示している。 こ こでも原点は画像の左端の座標である。 尚、 この i , j は上記図 4に示 すものよ り値域が大きく、 i は元画像, 比較領域, 周辺領域の横画素数 を値域と し、 j は元画像, 比較領域, 周辺領域の縦画素数を値域と して いる。 また、 nは自然数であって、 比較領域およびその周辺領域を指定 する番号である。
以上の式で算出した類似度によれば、 比較領域と周辺領域との中から 元画像に最も類似する領域を抽出することができる。 比較領域は、 検索 対象画像データ 1 2 g 2の中から図 4に示す照合値によつて類似画像の 候補と して抽出された領域であるので、 図 5に示す類似度に基づいて最 も類似する部位と して抽出された領域は検索対象画像データ 1 2 g 2の 総ての中で元画像に最も類似する部位である確率が非常に高い。従って、 以上の処理によつて類似画像を決定することができる。 上述のよ う に、 本'発明ではごく一部の画素に基づいて比較領域の候補を決定している力 S、 類似領域抽出モジュール 2 4において最終的には全画素に対する比較を 行っているし、 さ らに、 比較対象を周辺領域にまで拡大しているので、 非常に正確に類似画像を検索することができる。
( 4 ) 他の実施形態 :
上記類似画像抽出処理の構成およぴ処理は一例であって、 他にも種々 の構成を採用可能である。 例えば、 類似領域抽出モジュール 2 4におい て類似度を算出する対象を周辺領域間で広げることなく、 上記候補と し ての比較領域のみに対して類似度を算出し、 最も類似度の高い領域を抽 出する処理を行ってもよい。 この場合、 抽出された領域が検索対象画像 内で元画像に最も類似しているとは必ずしも言えないが、 最も類似した 画像に近い部位を非常に高速に検索することができる。
また、 上記実施形態において走査部 2 3は、 比較領域の設定に際して 重複を避けつつ検索対象画像の総てが走査対象になるよ うにしていた力 むろん、 かかる構成が必須というわけではない。 例えば、 照合値算出モ ジュール 2 3 bによって算出された照合値が非常に大きかった場合 (類 似度が非常に小さかった場合) は、 次の比較領域を設定するに際して走 查ピッチを大きく (次の比較領域をよ り遠く に設定) し、 照合値が大き く なつたら走査ピッチを小さくする構成を採用可能である。 また、 照合 値が非常に大きかった場合に照合画素数を少なくする構成と してもよい。 これらの構成によれば、 冗長な処理を効果的に削減し、 よ り高速に候補 となる比較領域を抽出することができる。
さ らに、 本発明は種々の場面に適用することができる。 例えば、 上述 のよ うにパノラマ写真の合成に際して連結する写真同士で一致する領域 を特定したい場合、 一方の画像から元画像を切り 出し、 他方の画像に対 して本発明にかかる類似画像抽出プログラムを実施すると、 両画像で一 致する部位を容易に特定することができる。 従って、 両者を連結する位 置を容易に特定することが可能になる。 この場合、 比較領域の候補が複 数抽出されたと しても、 類似画像と された部位は一方の画像の左側に存 在し、 他方の画像の右側に存在すべきであるという条件を課するなどし て、 よ り高速に処理を完了することができる。 産業上の利用可能性
以上説明したよ うに本発明によれば、 デジタルカメ ラ等による撮像画 像あるいはその一部などを検索する画像検索やパノ ラマ写真画像を連結 する際の接続位置検索等を実施する当たり、 検索対象の画像内で元画像 に類似する部位を検索する機能を実現するコンピュータ等を提供するこ とができる。

Claims

請 求 の 範 囲
1 . 元'画像を ドッ トマ ト リ クス状の画素で表現した元画像データ と当 該元画像に類似した画像の検索対象となる検索対象画像を ドッ トマ ト リ タ ス状の画素で表現した検索対象画像データ とを取得する画像データ取 · 得手段と、 ·
上記元画像の複数の位置に照合画素を設定すると ともに当該照合画素 の階調値を取得する照合画素階調値取得手段と、
上記検索対象画像上に上記元画像と同じ大きさの領域を設定する と と もに当該領域において上記照合画素と同じ位置に相当する比較画素の階 調値を取得する比較画素階調値取得手段と、
上記照合画素の階調値と比較画素の階調値と の類似度を示す照合値を 算出する照合値算出手段と、
上記検索対象画像上で上記領域を逐次変更して上記比較画素階調値の 取得と照合値の算出とを行う走査手段と、
上記照合値が示す類似度が高い領域について当該領域内の略全画素の 階調値と上記元画像の略全画素の階調値との類似度を算出して、 類似度 の高い領域を抽出する類似領域抽出手段とを具備することを特徴とする 類似画像抽出装置。
2 . 上記照合画素階調値取得手段では、 上記元画像の縦およびまたは 横の一定画素数毎に照合画素を設定することを特徴とする上記請求項 1 に記載の類似画像抽出装置。
3 . 上記照合値は、 上記照合画素の階調値と同じ位置に相当する比較 画素の階調値との差分を加え合わせた値であることを特徴とする上記請 求項 1または請求項 2のいずれかに記載の類似画像抽出装置。
4 . 予め決められた領域数を限度と して高い類似度の照合値を与える 領域を示すデータを記憶する記憶媒体を備え、 上記照合値算出手段は上 記走査の過程で算出した照合値が既に記憶した領域の照合値よ り高い類 似度を示しているときに当該記憶媒体の記憶内容を更新することを特徴 とする上記請求項 1〜請求項 3のいずれかに記載の類似画像抽出装置。
5 . 上記類似領域抽出手段は、 上記類似度の高い領域を抽出した後に 当該領域の近隣にて上記元画像と同じ大きさの領域を設定すると ともに 当該設定した領域と上記元画像との類似度を算出し、. 最も高い類似度を 有する領域を元画像の類似画像とすることを特徴とする上記請求項 1〜 請求項 4のいずれかに記載の類似画像抽出装置。
6 . 元画像を ドッ トマ ト リ クス状の画素で表現した元画像データ と当 該元画像に類似した画像の検索対象となる検索対象画像を ドッ トマ ト リ タ ス状の画素で表現した検索対象画像データ とを取得する画像データ取 得工程と、
上記元画像の複数の位置に照合画素を設定すると ともに当該照合画素 の階調値を取得する照合画素階調値取得工程と、
上記検索対象画像上に上記元画像と同じ大きさの領域を設定し、 当該 領域を逐次変更しながら、 当該領域において上記照合画素と同じ位置に 相当する比較画素の階調値を取得し、 上記照合画素の階調値と比較画素 の階調値との類似度を示す照合値を算出する工程を行い、
上記照合値が示す類似度が高い領域について当該領域内の略全画素の 階調値と上記元画像の略全画素の階調値との類似度を算出して、 類似度 の高い領域を抽出することを特徴とする類似画像抽出方法。
7 . 所定の記憶媒体に元画像を ドッ トマ ト リ クス状の画素で表現した 元画像データと当該元画像に類似した画像の検索対象となる検索対象 ¾ 像'を ドッ トマ ト リ クス状の画素で表現した検索対象画像データ とを一時 記憶するとと もに検索対象画像から元画像に類似した画像を検索する類 似画像抽出プログラムであって、
上記元画像の複数の位置に照合画素を設定すると ともに当該照合画素 の階調値を取得する照合画素階調値取得機能と、
上記検索対象画像上に上記元画像と同じ大きざの領域を設定する と と もに当該領域において上記照合画素と同じ位置に相当する比較画素の階 調値を取得する比較画素階調値取得機能と、
上記照合画素の階調値と比較画素の階調値との類似度を示す照合値を 算出する照合値算出機能と、 ,
上記検索対象画像上で上記領域を逐次変更して上記比較画素階調値の 取得と照合値の算出とを行う走査機能と、
上記照合値が示す類似度が高い領域について当該領域内の略全画素の 階調値と上記元画像の略全画素の階調値との類似度を算出して、 類似度 の高い領域を抽出する類似領域抽出機能とをコ ンピュータに実現させる ことを特徴とする類似画像抽出プログラム。
PCT/JP2003/015852 2002-12-11 2003-12-11 類似画像抽出装置、類似画像抽出方法および類似画像抽出プログラム WO2004053796A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
EP03780724A EP1574991A4 (en) 2002-12-11 2003-12-11 EXTRACTION DEVICE FOR SIMILAR PICTURES, EXTRACTION PROCESSES FOR SIMILAR PICTURES AND EXTRACTION PROGRAM FOR SIMILAR IMAGES
US10/540,787 US20060115148A1 (en) 2002-12-11 2003-12-11 Similar image extraction device, similar image extraction method, and similar image extraction program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2002-358985 2002-12-11
JP2002358985A JP2004192307A (ja) 2002-12-11 2002-12-11 類似画像抽出装置、類似画像抽出方法および類似画像抽出プログラム

Publications (1)

Publication Number Publication Date
WO2004053796A1 true WO2004053796A1 (ja) 2004-06-24

Family

ID=32500917

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2003/015852 WO2004053796A1 (ja) 2002-12-11 2003-12-11 類似画像抽出装置、類似画像抽出方法および類似画像抽出プログラム

Country Status (5)

Country Link
US (1) US20060115148A1 (ja)
EP (1) EP1574991A4 (ja)
JP (1) JP2004192307A (ja)
CN (1) CN1711558A (ja)
WO (1) WO2004053796A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7817861B2 (en) 2006-11-03 2010-10-19 Symantec Corporation Detection of image spam

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003058554A1 (fr) * 2001-12-28 2003-07-17 Nikon Corporation Dispositif de traitement d'image permettant d'effectuer un jugement de similitude entre des pixels et programme de traitement d'image
JP4213112B2 (ja) * 2004-11-09 2009-01-21 シャープ株式会社 画像検索装置、画像形成装置、画像検索装置の制御方法、画像検索プログラムおよびコンピュータ読取り可能な記録媒体
JP4038777B2 (ja) * 2006-02-28 2008-01-30 ソニー株式会社 登録装置及び認証装置
AT504213B1 (de) * 2006-09-22 2008-04-15 Ipac Improve Process Analytics Verfahren zum ähnlichkeitsvergleich von gegenständen
CN101488129B (zh) * 2008-01-14 2011-04-13 夏普株式会社 图像检索装置及图像检索方法
TWI395051B (zh) * 2008-12-31 2013-05-01 Altek Corp Panorama Image Automatic Shooting Method for Digital Camera
CN101859326B (zh) * 2010-06-09 2012-04-18 南京大学 一种图像检索方法
EP2407928A1 (en) * 2010-07-16 2012-01-18 STMicroelectronics (Grenoble 2) SAS Fidelity measurement of digital images
JP2012203458A (ja) * 2011-03-23 2012-10-22 Fuji Xerox Co Ltd 画像処理装置及びプログラム
JP5919979B2 (ja) * 2012-04-06 2016-05-18 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
CN105100639B (zh) * 2015-07-20 2017-11-24 京东方科技集团股份有限公司 一种显示方法及显示装置
CN105868788A (zh) * 2016-04-01 2016-08-17 乐视控股(北京)有限公司 图像文件比对方法和装置
US10901674B2 (en) * 2017-12-07 2021-01-26 Honeywell International Inc. Protocol for high integrity personal electronic device applications
CN111046893B (zh) * 2018-10-12 2024-02-02 富士通株式会社 图像相似性确定方法和装置、图像处理方法和装置
CN115100199B (zh) * 2022-08-24 2022-11-22 宁波鑫芯微电子科技有限公司 一种晶圆低纹理缺陷的检测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59211167A (ja) * 1984-05-04 1984-11-29 Hitachi Ltd パタ−ンの位置検出装置
JPH05159064A (ja) * 1991-12-09 1993-06-25 Nippon Telegr & Teleph Corp <Ntt> 画像探索装置
JPH0830784A (ja) * 1994-07-14 1996-02-02 Sumitomo Metal Ind Ltd 2値または濃淡値画像パターンマッチング装置
JPH08235357A (ja) * 1995-02-24 1996-09-13 Mitsubishi Electric Corp 画像処理装置
JPH1021389A (ja) * 1996-07-03 1998-01-23 Mitsubishi Electric Corp テンプレートマッチング方法およびその装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59226981A (ja) * 1983-06-08 1984-12-20 Fujitsu Ltd パタ−ンマツチング方法および装置
US5530483A (en) * 1994-10-11 1996-06-25 Pixel Instruments Corp. Delay detector apparatus and method for plural image sequences
JPH09293082A (ja) * 1996-04-26 1997-11-11 Toshiba Corp 画像検索装置及び画像検索方法
JPH11214485A (ja) * 1998-01-26 1999-08-06 Dainippon Screen Mfg Co Ltd ウェハの回転方向決定方法
US7046842B2 (en) * 1999-08-17 2006-05-16 National Instruments Corporation System and method for color characterization using fuzzy pixel classification with application in color matching and color match location

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59211167A (ja) * 1984-05-04 1984-11-29 Hitachi Ltd パタ−ンの位置検出装置
JPH05159064A (ja) * 1991-12-09 1993-06-25 Nippon Telegr & Teleph Corp <Ntt> 画像探索装置
JPH0830784A (ja) * 1994-07-14 1996-02-02 Sumitomo Metal Ind Ltd 2値または濃淡値画像パターンマッチング装置
JPH08235357A (ja) * 1995-02-24 1996-09-13 Mitsubishi Electric Corp 画像処理装置
JPH1021389A (ja) * 1996-07-03 1998-01-23 Mitsubishi Electric Corp テンプレートマッチング方法およびその装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP1574991A4 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7817861B2 (en) 2006-11-03 2010-10-19 Symantec Corporation Detection of image spam

Also Published As

Publication number Publication date
EP1574991A4 (en) 2006-09-27
US20060115148A1 (en) 2006-06-01
JP2004192307A (ja) 2004-07-08
CN1711558A (zh) 2005-12-21
EP1574991A1 (en) 2005-09-14

Similar Documents

Publication Publication Date Title
WO2004053796A1 (ja) 類似画像抽出装置、類似画像抽出方法および類似画像抽出プログラム
JP4338155B2 (ja) 画像処理装置及びその方法、コンピュータ可読メモリ
WO2004051575A1 (ja) 特徴領域抽出装置、特徴領域抽出方法および特徴領域抽出プログラム
US8446494B2 (en) Automatic redeye detection based on redeye and facial metric values
JP4189506B2 (ja) 画像処理のための装置、方法及び記録媒体
JP2002152492A (ja) 画像処理装置、方法及び記録媒体
US20090231628A1 (en) Image Processing Apparatus, Image Processing Method, Computer Program for Image Processing
JP2007004677A (ja) コメントレイアウト装置、アルバム作成装置
JP2011081803A (ja) 赤目オブジェクト候補を分類する方法、コンピューター読み取り可能な媒体および画像処理装置
JP2009237661A (ja) 画像処理装置、画像処理方法、画像処理のためのコンピュータプログラム
JP2005151130A (ja) 画像出力装置、画像出力方法ならびに記憶媒体、プログラム
JP2004054898A (ja) 印刷データ生成装置、印刷データ生成方法およびそのプログラム
JP2006279460A (ja) 画像処理装置、印刷装置、画像処理方法、および、画像処理プログラム
JP2007200091A (ja) 画像処理装置
JP4742642B2 (ja) 画像処理装置、印刷装置、画像処理方法、および、画像処理プログラム
JP2008042291A (ja) 印刷装置、および、印刷方法
JP2003187257A (ja) 画像作成システム
WO2022107635A1 (ja) 撮影装置、画像の生産方法、および記録媒体
JP4271428B2 (ja) 文字認識方法および文字認識装置
JP2008117345A (ja) 印刷装置、画像検索方法、および、画像検索プログラム
JP4046509B2 (ja) 画像生成方法および装置、画像処理方法および装置並びにプログラム
JP2003179737A (ja) 画像処理装置、画像形成装置、および画像処理方法
JP2006023949A (ja) 画像処理装置及び画像処理方法
JP2007253355A (ja) 画像形成装置、画像形成システム及び情報処理装置
JP4310943B2 (ja) 文字認識装置、文字認識プログラム、文字認識方法

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): CN US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LU MC NL PT RO SE SI SK TR

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 20038A30146

Country of ref document: CN

ENP Entry into the national phase

Ref document number: 2006115148

Country of ref document: US

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 10540787

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 2003780724

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 2003780724

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 10540787

Country of ref document: US

WWW Wipo information: withdrawn in national office

Ref document number: 2003780724

Country of ref document: EP