WO2007063705A1 - パターン認識装置、パターン認識方法、およびパターン認識プログラム - Google Patents

パターン認識装置、パターン認識方法、およびパターン認識プログラム Download PDF

Info

Publication number
WO2007063705A1
WO2007063705A1 PCT/JP2006/322731 JP2006322731W WO2007063705A1 WO 2007063705 A1 WO2007063705 A1 WO 2007063705A1 JP 2006322731 W JP2006322731 W JP 2006322731W WO 2007063705 A1 WO2007063705 A1 WO 2007063705A1
Authority
WO
WIPO (PCT)
Prior art keywords
image
cumulative histogram
reference image
pixels
cumulative
Prior art date
Application number
PCT/JP2006/322731
Other languages
English (en)
French (fr)
Inventor
Katsuhiko Takahashi
Original Assignee
Nec Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nec Corporation filed Critical Nec Corporation
Priority to JP2007547892A priority Critical patent/JP4968075B2/ja
Priority to US12/093,407 priority patent/US8014601B2/en
Priority to DE602006019481T priority patent/DE602006019481D1/de
Priority to EP06832662A priority patent/EP1956551B1/en
Publication of WO2007063705A1 publication Critical patent/WO2007063705A1/ja

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/18086Extraction of features or characteristics of the image by performing operations within image blocks or by using histograms
    • G06V30/18095Summing image-intensity values; Projection and histogram analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Definitions

  • Pattern recognition apparatus pattern recognition method, and pattern recognition program
  • the present invention relates to a pattern recognition apparatus, a pattern recognition method, and a pattern recognition program that perform pattern recognition of a grayscale image by collating with a reference image.
  • the grayscale image is binary-coded only once by some binary key algorithm, and template matching is performed between the binary patterns.
  • template matching is performed between the binary patterns.
  • algorithms for binarizing the fixed threshold method, p-tile method, and Otsu's binarizing method (discriminant analysis method) are well known. These methods have the advantage of being relatively fast because the binarization operation is performed only once.
  • unique preconditions are assumed for each input grayscale image, so good results can be obtained only when they are limited.
  • the fixed threshold method it is a precondition that the density value of the recognition target area and the density value of the other area can always be separated by a stable value (called binary threshold). Is assumed. Therefore, the fixed threshold method is not suitable for images in which the pixel value of the input grayscale image increases or decreases as a whole due to changes in illumination intensity, because the optimal binary threshold value increases or decreases.
  • a plurality of threshold value setting methods including a P tile method are used.
  • a value image is generated and the result with the highest evaluation value is selected based on the character recognition evaluation value for each.
  • the binarization threshold value is maintained until the certainty of character recognition exceeds a predetermined threshold value. A small amount is automatically increased or decreased from the initial value, and results are obtained by repeating trial and error.
  • the following method can be considered.
  • various binary thresholds that can be set are assumed, and a binary image based on each binary threshold is generated.
  • the distance between these binary images and the reference image is calculated, and the recognition result that minimizes the distance value is adopted.
  • the input grayscale image can be optimally adapted to the reference image regardless of the nature of the input grayscale image, so the highest recognition compared to the above-mentioned conventional technology. Accuracy can be achieved.
  • Japanese Patent Application Laid-Open No. 2004-180000 describes a method for binarizing an image for the purpose of automatically binarizing a grayscale image with high accuracy.
  • Japanese Patent Laid-Open No. 2000-40153 takes advantage of the fact that the characters are different in density from the background color in the vicinity, and whatever color is used for the characters, background, An image processing method for the purpose of providing a binary image that clearly expresses characters and lines is described. Disclosure of the invention
  • the binary image generation round-robin method allows an input gray image to be optimally adapted to a reference image regardless of the nature of the input gray image.
  • a very large amount of processing time is required because the binarization process and the distance calculation process must be repeated as many times as the number of binarization threshold values set.
  • the present invention is an invention for solving the above-described problems, and is a pattern recognition device, a pattern recognition method, and a pattern recognition device capable of obtaining a result equivalent to the binary image generation round-robin method at higher speed.
  • An object is to provide a pattern recognition program.
  • a pattern recognition device includes a storage unit that stores a reference image that is a binarized image having a high density region and a low density region, and an input grayscale image that is collated with the reference image;
  • a first cumulative histogram extraction unit that extracts a cumulative histogram that accumulates the number of pixels having a density value less than a predetermined value for pixels of an input grayscale image that are associated with pixels in a high density region of the reference image; and a reference image
  • a second cumulative histogram extraction unit that extracts a cumulative histogram that accumulates the number of pixels having a density value equal to or greater than a predetermined value for pixels of an input grayscale image associated with pixels in the low density region;
  • the cumulative histogram obtained by adding the cumulative histogram extracted by the cumulative histogram extractor and the cumulative histogram extracted by the second cumulative histogram extractor in association with each other.
  • An addition unit and a pattern matching unit that recognizes the input grayscale image using the minimum value of the cumulative cumulative histogram obtained by
  • FIG. 12 is an explanatory diagram showing a density histogram (a graph in which the horizontal axis indicates the density and the vertical axis indicates the number of pixels) used in the pattern recognition execution process.
  • FIG. 12 (a) shows the density histogram 1201 for the pixels in the input grayscale image associated with the pixels in the high density area of the reference image
  • FIG. 12 (b) shows the low density area in the reference image.
  • a density histogram 1202 is shown for the pixels in the input grayscale image associated with this pixel.
  • binary threshold value 1203 is set for binarization, low density region 1204 with a density value lower than binarization threshold 1203 in density histogram 1201 and binarization threshold value in density histogram 1202 And a high density region 1205 having a density value higher than 1203.
  • ai and bi indicate the value of each pixel of the binary image and the value of each pixel of the reference image obtained by binarizing the grayscale image with the temporary binary threshold 1203, respectively.
  • d indicates the number of pixels. Also, if a pixel value 1 is assigned to a pixel that has a binary threshold value of 1203 or higher and a pixel value of 0 is assigned to a pixel that is less than the binary threshold value 1203 in a grayscale image, the values of ai and bi are 0 respectively. Or since it is 1, the value of I ai-bi I is
  • the urban area distance is a pixel having a high density region on the reference image and a pixel value of 0 on the binary image.
  • the number of pairs + (low density area on the reference image and pixel value 1 on the binary image) equals the number of pixel pairs.
  • the first term is equal to the area value of the low concentration region 1204, and the second term is equal to the area value of the high concentration region 1205.
  • the first cumulative histogram and the second cumulative histogram in the present invention are the low density region 1204 and the high density region 1205 when the binary key threshold 1203 is assumed to be various values, respectively. Is equivalent to the area.
  • the minimum value of the cumulative cumulative histogram obtained by adding these is equal to the minimum value of the urban area distance between the binary image obtained by virtually binarizing the grayscale image and the reference image from equation (A1). Therefore, by selecting the minimum value of the cumulative cumulative histogram, regardless of the nature of the input image, the city distance when the grayscale image is optimally matched to the reference image can be obtained. / You can make a judgment in a hurry.
  • the pattern recognition apparatus includes a reference image that is a binarized reference image having a high density region and a low density region, an input grayscale image that is collated with the reference image, and each pixel.
  • a storage unit that stores a weighted image having a weight value of 5 and a pixel of an input grayscale image that is associated with a pixel in a high-density area of the reference image, and is associated with a pixel having a density value less than a predetermined value.
  • the first cumulative histogram extraction unit that extracts the cumulative histogram by accumulating the weight values of the pixels of the weighted image, and the density value for the pixels of the input grayscale image that are associated with the low density region pixels of the reference image.
  • a weight associated with a pixel having a predetermined value or more a cumulative histogram extracted by a second cumulative histogram extraction unit that extracts the cumulative histogram by accumulating the weight values of the pixels of the image and the first cumulative histogram extraction unit
  • the cumulative histogram extracted by the cumulative histogram extraction unit is added in association with the cumulative histogram, and the cumulative histogram addition unit that obtains the cumulative cumulative histogram is added to the reference image.
  • a pattern matching unit for recognizing the input grayscale image as a distance value from the input grayscale image. According to such a configuration, the contribution in pattern recognition can be changed for each pixel.
  • the reference image includes a third density region that is a non-calculation region, and the first cumulative histogram extraction unit and the second cumulative histogram extraction unit include the third density region. Pixels included in the region may be excluded from the cumulative histogram extraction process. According to such a configuration, it is possible to eliminate the influence on the distance value due to the coincidence or non-coincidence of the pixel positions, which is effective in performing the turn recognition.
  • the pattern recognition device expands the area setting unit for setting the partial area image from the input grayscale image and the partial area image set by the area setting unit to the same size as the reference image.
  • a grayscale image enlargement / reduction unit that reduces (i.e., zooms in or out by scaling), and the grayscale image enlargement / reduction unit uses the enlarged / reduced partial area image as an input grayscale image for comparison with the reference image. Is preferred. According to such a configuration, even when the region corresponding to the reference image is a part of the input grayscale image, the region corresponding to the reference image can be detected.
  • the pattern recognition method includes a step of storing a reference image that is a binarized image having a high density region and a low density region, and an input grayscale image that is collated with the reference image.
  • a first cumulative histogram extraction step for extracting a cumulative histogram that accumulates the number of pixels having a density value less than a predetermined value for pixels of the input grayscale image that are associated with pixels in the high density region of the reference image;
  • a second cumulative histogram extraction step for extracting a cumulative histogram in which the number of pixels having a density value equal to or greater than a predetermined value is extracted for pixels of an input grayscale image associated with pixels in a low density region of the reference image;
  • the cumulative histogram extracted in the first cumulative histogram extraction step and the cumulative histogram extracted in the second cumulative histogram extraction step are added in association with each other.
  • the pattern recognition method includes a reference image, which is a binarized image having a high density region and a low density region, an input grayscale image to be compared with the reference image, and a weight value for each pixel.
  • the first cumulative histogram extraction step that extracts the cumulative histogram by accumulating the weight values, and the density value is equal to or greater than a predetermined value for the pixels of the input grayscale image that are associated with the pixels in the low density area of the reference image
  • a cumulative histogram extracted in the second cumulative histogram extraction step which extracts the cumulative histogram by accumulating the pixel weight values of the weighted images associated with the pixels, and the first cumulative histogram extraction step.
  • the cumulative histogram extracted in the cumulative histogram addition step, and the cumulative histogram addition step obtained in the cumulative histogram addition step.
  • a pattern matching step for recognizing the input grayscale image using the minimum value of the distance as a distance value between the reference image and the input grayscale image.
  • the reference image includes a third density region that is a non-calculation region, and includes a first cumulative histogram extraction step and a second cumulative histogram extraction step. Then, the pixels included in the third density region may be excluded from the cumulative histogram extraction process.
  • the area setting step for setting the partial area image from the input grayscale image, and the partial area image set in the area setting step are enlarged to the same size as the reference image. It is preferable that a partial area image that has been reduced and includes a grayscale image enlargement / reduction step and that has been enlarged / reduced in the grayscale image enlargement / reduction step is used as an input grayscale image for collation with a reference image.
  • a pattern recognition program stores a reference image, which is a binarized image having a high density region and a low density region, and an input grayscale image to be collated with the reference image;
  • a first cumulative histogram extraction process for extracting a cumulative histogram that accumulates the number of pixels having a density value less than a predetermined value for pixels of an input grayscale image that are associated with pixels in a high density area of the reference image; and a reference image
  • a second cumulative histogram extraction process for extracting a cumulative histogram that accumulates the number of pixels having a density value equal to or greater than a predetermined value for pixels of the input grayscale image associated with pixels in the low density area;
  • the cumulative histogram extracted by the cumulative histogram extraction process in step 2 and the cumulative histogram extracted by the second cumulative histogram extraction process are added in association with each other to obtain an added cumulative histogram.
  • Cumulative histogram addition processing, and pattern matching that uses the minimum value of the cumulative cumulative histogram obtained by cumulative histogram addition processing as the distance value between the reference image and the input grayscale image, and compares the pattern with a predetermined threshold. Causes the computer to execute the process.
  • the pattern recognition program includes a reference image that is a binarized image having a high density region and a low density region, an input grayscale image that is collated with the reference image, pixels
  • a step of storing a weighted image having a weight value for each, and an input grayscale image pixel associated with a pixel in a high-density area of the reference image is associated with a pixel having a density value less than a predetermined value.
  • a first cumulative histogram extraction process for extracting the cumulative histogram by accumulating the weight values of the pixels of the weighted image, and the density value for the pixels of the input grayscale image associated with the low density region pixels of the reference image.
  • the cumulative value extracted by the second cumulative histogram extraction process that extracts the cumulative histogram by accumulating the weight values of the pixels of the weighted image that correspond to pixels that are greater than or equal to the predetermined value, and the first cumulative histogram extraction process Hiss And grams, of the second
  • the cumulative histogram addition process that adds the cumulative histograms extracted by the cumulative histogram extraction process to obtain the cumulative cumulative histogram, and the minimum value of the calorie cumulative histogram obtained by the cumulative histogram addition process, the reference image and the input grayscale image And a pattern matching process for pattern matching by comparing with a predetermined threshold value.
  • the reference image includes a third density region that is a non-calculation region, and the pattern recognition program sends the third cumulative histogram extraction process to the computer in the first cumulative histogram extraction process and the second cumulative histogram extraction process. Pixels included in the density region may be excluded from the cumulative histogram extraction process.
  • the pattern recognition program enlarges / reduces the area setting process for setting the partial area image from the input grayscale image and the partial area image set by the area setting process to the same size as the reference image.
  • the grayscale image enlargement / reduction process may be executed, and the partial area image enlarged / reduced by the pattern matching process may be matched with the reference image.
  • FIG. 1 is a block diagram showing a configuration of a first embodiment of a pattern recognition apparatus according to the present invention.
  • FIG. 2 is a flowchart showing an example of processing steps performed by the pattern recognition apparatus.
  • FIG. 3 is an explanatory diagram showing an example of an input gray image.
  • FIG. 4 is an explanatory diagram showing an example of an image used for non-turn recognition.
  • FIG. 5A is an explanatory diagram showing an example of Hf (i).
  • FIG. 5B is an explanatory diagram showing an example of Hb (i).
  • FIG. 6A is an explanatory diagram showing an example of Af (i).
  • FIG. 6B is an explanatory diagram showing an example of Ab (i).
  • FIG. 7 is an explanatory diagram showing an example of At (i).
  • FIG. 8A is an explanatory diagram showing an example of the output result of each part when the density of the input grayscale image is almost uniform.
  • FIG. 8B is an explanatory diagram showing an example of the output result of each part when the density of the input grayscale image is almost uniform.
  • FIG. 8C is an explanatory diagram showing an example of the output result of each part when the density of the input grayscale image is almost uniform.
  • FIG. 8D is an explanatory diagram showing an example of an output result of each unit when the density of the input grayscale image is almost uniform.
  • FIG. 8E is an explanatory diagram showing an example of the output result of each part when the density of the input grayscale image is almost uniform.
  • FIG. 9 is an explanatory diagram showing an example of a reference image that is a ternary image.
  • FIG. 10 is an explanatory diagram showing another example of a reference image that is a ternary image.
  • FIG. 11 is a block diagram showing a configuration of a second embodiment of a pattern recognition apparatus according to the present invention.
  • FIG. 12 is an explanatory diagram showing a density histogram used for pattern recognition execution processing.
  • FIG. 13 is a block diagram showing a configuration of a third embodiment of a pattern recognition apparatus according to the present invention.
  • FIG. 14 is a flowchart showing an example of processing steps performed by the pattern recognition apparatus.
  • FIG. 1 is a block diagram showing a configuration of a first embodiment of a pattern recognition apparatus according to the present invention.
  • the pattern recognition apparatus includes a first cumulative histogram extraction unit 103, a second cumulative histogram extraction unit 104, a cumulative histogram addition unit 105, and a pattern matching unit 106.
  • the pattern recognition device is realized by an information processing device exemplified by a workstation or a personal computer.
  • the input grayscale image 101 is input from the image input unit and stored in the image storage unit.
  • Binary representation For example, the reference image 102 is input from the image input unit and stored in the reference image storage unit.
  • the first cumulative histogram extraction unit 103, the second cumulative histogram extraction unit 104, the cumulative histogram addition unit 105, and the pattern matching unit 106 are realized by the control unit of the pattern recognition apparatus.
  • the control unit is realized by a CPU of an information control device that operates according to a program.
  • the input grayscale image 101 is a recognition target image expressed in grayscale.
  • the vertical and horizontal sizes of the input gray image 101 are the same as the vertical and horizontal sizes of the reference image 102.
  • FIG. 3 is an explanatory diagram showing an example of the input grayscale image.
  • a gray circle 302 is drawn on a white background 301, and the letter “a” 303 is drawn in the circle 302.
  • the range that the gray value can take is set to 0-255, for example.
  • the reference image 102 is a binary image. Pixels in the high brightness area of the reference image 102 have the attribute value “1”, and pixels in the low brightness area of the reference image 102 have the attribute value “2”.
  • FIG. 4 is an explanatory diagram showing an example of an image used for pattern recognition.
  • the letter “a” is shown as a reference image.
  • the attribute value “1” is assigned to the high density area 401 and the attribute value “2” is assigned to the low density area 402.
  • the first cumulative histogram extraction unit 103 compares the input grayscale image 101 and the reference image 102 with respect to the pixels in the grayscale image associated with the pixel having the attribute value 1 on the reference image.
  • a first cumulative histogram Af (i) indicating the number of pixels whose density value is less than i is generated. That is, Af (i) is the number of pixels with a density value i among the pixels in the grayscale image associated with the pixel having the attribute value 1 on the reference image as Hf (i)
  • Af (i) is a monotonically increasing function.
  • the second cumulative histogram extraction unit 104 reversely indicates the number of pixels having a density value of i or more among the pixels in the grayscale image corresponding to the pixel having the attribute value 2 on the reference image 102.
  • Cumulative histogram adding section 105 adds first cumulative histogram Af (i) and second cumulative histogram Ab (i) according to equation (3), and extracts added cumulative histogram At (i). .
  • FIG. 2 is a flowchart showing an example of processing steps performed by the pattern recognition apparatus.
  • the first cumulative histogram extraction unit 103 extracts a first cumulative histogram from the input grayscale image 101 and the reference image 102.
  • the second cumulative histogram extraction unit 104 extracts a second cumulative histogram from the input gray image 101 and the reference image 102 (step S201). An example of this process will be described in detail with reference to FIGS.
  • FIGS. 5A and 5B are explanatory diagrams showing examples of Hf (i) and Hb (i), respectively.
  • 5A and 5B show examples of Hf (i) 501 and Hb (i) 502 when the input grayscale image 101 shown in FIG. 3 and the reference image 102 shown in FIG. 4 are collated.
  • a high frequency a large number of pixels
  • Hb (i) 502 has two peaks in the region from the low concentration to the medium concentration region.
  • FIGS. 6A and 6B are explanatory diagrams showing examples of Af (i) and Ab (i), respectively.
  • FIG. 6A shows a first cumulative histogram 601 that is extracted based on Hf (i) 501 and is Af (i) in equation (1)
  • FIG. 6B shows Hb (i) 502
  • a second cumulative histogram 602 that is extracted based on Ab (i) in equation (2) is shown. Since the first cumulative histogram 601 indicates the number of pixels less than the density value i, it has a monotonically increasing histogram shape. On the other hand, the second cumulative histogram 602 has a histogram shape that monotonously decreases because it indicates the number of pixels greater than the density value i.
  • Cumulative histogram adding section 105 adds first cumulative histogram 601 and second cumulative histogram 602 to generate added cumulative histogram 701 (step S202).
  • FIG. 7 is an explanatory diagram showing an example of At (i).
  • FIG. 7 shows an addition cumulative histogram which is At (i) of the equation (3) calculated by adding the first cumulative histogram 601 and the second cumulative histogram 602.
  • the pattern matching unit 106 performs pattern matching using the addition cumulative histogram 701 (step S203). That is, the pattern matching unit 106 extracts the minimum value in the cumulative cumulative histogram 701 and compares it with a predetermined threshold value Dthr. If the minimum value in the cumulative cumulative histogram 701 is less than or equal to the threshold value Dthr, the input image is recognized. The object is determined. Conversely, if the minimum value of the cumulative cumulative histogram 701 is larger than the threshold value Dthr, it is determined that the input image is not a recognition object. In the example shown in FIG. 7, the minimum value in the cumulative cumulative histogram 701 is the cumulative cumulative histogram minimum value 702, which is equal to or less than the threshold value 703. Therefore, the pattern matching unit 106 determines that the input grayscale image 101 is the recognition target. to decide.
  • FIGS. 8A to 8E are explanatory diagrams illustrating examples of output results of the respective units when the density of the input grayscale image is substantially uniform.
  • FIG. 8A shows an input gray image 801
  • FIG. 8B shows a reference image 802.
  • the input grayscale image 801 shows an image in which the pixel values are substantially uniform throughout the image.
  • FIG. 8C the first cumulative histogram 8003 is shown
  • FIG. 8D the second cumulative histogram 804 is shown.
  • FIG. 8E an accumulated cumulative histogram 805 is shown.
  • a first cumulative histogram 803, a second cumulative histogram 804, and an added cumulative histogram 805 are obtained for the input grayscale image 801 and the reference image 802, respectively. Since the minimum value 806 in the cumulative cumulative histogram 805, which is the minimum value in the cumulative cumulative histogram 805, is larger than the threshold value 807, it is determined that the input image is not a recognition object.
  • the reference image is in the image format.
  • the image may not be in the image format as long as equivalent information can be expressed. For example, a list of pixel locations with attribute value “1” Data may be used.
  • the reference image is a binary image composed of a pixel having the attribute value “1” and a pixel having the attribute value “2”.
  • the third attribute value indicating the non-calculation area is used. It may be a ternary image including. Examples of ternary images are shown in Figs.
  • FIG. 9 is an explanatory diagram showing an example of a reference image that is a ternary image.
  • the reference image includes a third region 903 having a third attribute value near the boundary between a high density region 901 having an attribute value “1” and a low density region 902 having an attribute value “2”.
  • Have The first cumulative histogram extraction unit 103 and the second cumulative histogram extraction unit 104 do not include the pixels included in the third region 903 in the histogram generation target. That is, the first cumulative histogram extraction unit 103 and the second cumulative histogram extraction unit 104 exclude pixels included in the third region 903 from the cumulative histogram extraction process.
  • the area having the third attribute value is not considered in the histogram calculation, so even if the position of the input grayscale image and the reference image is slightly shifted up, down, left, or right, addition accumulation due to the shift is performed.
  • the influence on the histogram value can be reduced, and a pattern recognition device that is more robust against misregistration than when using a binary reference image can be configured.
  • FIG. 10 is an explanatory diagram showing another example of a reference image that is a ternary image.
  • FIG. 10 shows a ternary reference image having a third region 1001 having a third attribute value only in the hook that is a short bar extending to the right of the upper end force of the vertical bar of the number “1”.
  • a reference image corresponding to both “1” having a hook portion and “1” having no hook portion can be obtained.
  • the ternary reference image is a basic representation form of a reference image having one of the three values as a pixel value as in the example of FIGS. Since the same effect can be obtained even if it is expressed using two images with another binary image showing only the calculation area, it is called a ternary reference image including such an implementation.
  • FIG. 11 is a block diagram showing the configuration of the second embodiment of the pattern recognition apparatus according to the present invention.
  • the pattern recognition apparatus includes an input grayscale image 1101, a binary reference image 1102, a first cumulative histogram extraction unit 1103, and a second cumulative histogram extraction unit 110. 4, a cumulative histogram addition unit 1105, and a pattern matching unit 1106.
  • the first cumulative histogram extraction unit 1103, the second cumulative histogram extraction unit 1104, the cumulative histogram addition unit 1 105, and the pattern matching unit 1106 are realized, for example, by the control unit of the pattern recognition apparatus similar to that in the first embodiment. Is done.
  • the weight image 1107 indicating the importance for each pixel is referred to, which is different from the pattern recognition apparatus shown in FIG.
  • the weight image 1107 is input from the image input unit and stored in the weight image storage unit.
  • the weight image 1107 indicating the importance for each pixel is an image that numerically represents how important each pixel is in recognizing the pattern, and has the same vertical and horizontal sizes as the input gray image 1101 and the reference image 1102. It is an image that has. For example, if each pixel contributes equally to recognition, all pixel values may be set to 1. In addition, if you want to configure a pattern recognition device that distinguishes the difference between the letter “e” and the similar letter “e” with an umlaut, the upper pixel value with the umlaut symbol is set to another part. It may be set larger than.
  • the first cumulative histogram extraction unit 1103 associates the pixels of the input grayscale image 1101, the reference image 1102, and the weight image 1107, and the grayscale image associated with the pixels in the high density area on the reference image.
  • the sum of the pixel values of the weighted image associated with the pixels with density values less than i among the pixels in the middle is extracted as the first cumulative histogram Af (i). That is, Af (i) is given by the following equation.
  • D (X, y) is the pixel value of the reference image at coordinates (X, y)
  • I (x, y) is the pixel of the input grayscale image at coordinates (X, y).
  • W (x, y) is the pixel value of the weighted image at coordinates (X, y)
  • S f (D (x, y) is the pixel value of the reference image D (x, y) is high concentration
  • the second cumulative histogram extraction unit 1104 associates each pixel of the input grayscale image 1101, the reference image 1102, and the weighted image 1107, and associates the pixels with the low density region on the reference image.
  • the sum of the pixel values of the weighted image associated with the pixels having a density value of i or more among the pixels in the grayscale image is extracted as a second cumulative histogram Ab (i). That is, Ab (i) is given by the following equation.
  • ⁇ b (D (x, y), I ( ⁇ , y), i) is a pixel in which the pixel value D (x, y) of the reference image indicates a low density region.
  • This function takes a value and returns a value 1 only if the pixel value I (x, y) of the input grayscale image is greater than or equal to the value i, and returns a value 0 otherwise.
  • Cumulative histogram addition unit 1105 adds first cumulative histogram Af (i) and second cumulative histogram Ab (i) by equations (4) and (5), and adds by equation (3). Extract cumulative histogram At (i).
  • the operation of the pattern recognition apparatus of the present embodiment is the same as that of the pattern recognition apparatus of the first embodiment, and the operation of the pattern recognition apparatus of the present embodiment is described with reference to FIG. Explain.
  • the first cumulative histogram extraction unit 1103 and the second cumulative histogram extraction unit 1 104 are configured to input the first cumulative histogram and the second cumulative histogram from the input grayscale image 1101, the reference image 1102, and the weighted image 1107.
  • the cumulative histogram is extracted (step S2 01).
  • the cumulative histogram adding unit 1105 adds the first cumulative histogram and the second cumulative histogram to generate an added cumulative histogram (step S202).
  • the pattern matching unit 1106 performs pattern matching using the addition cumulative histogram (step S203).
  • the pixel value of the weighted image 1107 is taken into account when extracting the first cumulative histogram and the second cumulative histogram. It can be considered that pattern recognition is judged by the so-called weighted minimum city distance.
  • the threshold value is such that the pixels of the input image that are relatively important in recognizing the pattern are more consistent with the pixels of the reference image.
  • pattern recognition having a tendency to appear the minimum value of the cumulative cumulative histogram is realized.
  • FIG. 13 is a block diagram showing the configuration of the third embodiment of the pattern recognition apparatus according to the present invention.
  • the first cumulative histogram extraction unit 1303 is not a grayscale input image.
  • the image output from the image enlargement / reduction unit 1309 is input.
  • the pattern recognition apparatus expands the partial area image set by the area setting unit 1308 to set a plurality of partial areas from the original image 1307 expressed in grayscale to the same size as the reference image.
  • a grayscale image enlargement / reduction unit 1309 for reduction is further provided.
  • the area setting unit 1308, the grayscale image enlargement / reduction unit 1309, the first cumulative histogram extraction unit 1303, the second cumulative histogram extraction unit 1304, the cumulative histogram addition unit 1305, and the pattern matching unit 1306 are, for example, 1 is realized by the control unit of the pattern recognition apparatus similar to 1.
  • the original image 1307 is a recognition target image expressed in shades.
  • the size of the original image 1307 may be different from that of the reference image 1302.
  • the original image 1307 may be a grayscale image obtained by capturing the entire surface of a form on which characters are described.
  • the reference image 1302 indicates one road sign
  • the original image 1307 may be an image that captures the road scenery.
  • the area setting unit 1308 sets various area ranges that satisfy the predetermined condition for the intermediate force of the original image 1307.
  • the predetermined condition is, for example, a rule that narrows down candidate areas using rules that limit the vertical and horizontal sizes of the areas, or advanced discriminant functions.
  • the grayscale image enlargement / reduction unit 1309 displays each partial region image set by the region setting unit 1308, Enlarge / reduce to the same size as reference image 1302.
  • the pixels are complemented by methods such as the two-way rest neighbor method, the bilinear interpolation method, and the no-cubic method.
  • FIG. 14 is a flowchart showing an example of a process performed by the non-turn recognition apparatus.
  • the area setting unit 1308 sets one area to be processed from the original image (step S1401).
  • the grayscale image enlargement / reduction unit 1309 enlarges / reduces the set region image so as to be the same size as the reference image (step S 1402).
  • the first cumulative histogram extraction unit 1303, the second cumulative histogram extraction unit 1304, the cumulative histogram addition unit 1305, and the pattern matching unit 1306 This is the same as the processing from step S201 to step S203 shown in FIG. 2 by the unit 103, the second cumulative histogram extraction unit 104, the cumulative histogram addition unit 105, and the pattern matching unit 106.
  • step S1405 When the pattern matching process in step S1405 is completed for one area, the control unit of the pattern recognition apparatus determines whether or not the other area to be processed still remains. The process is repeated from step S1401.
  • a recognition target object is partially included in the original image.
  • the object in the case where it exists can be detected.
  • the grayscale image enlargement / reduction unit 1309 performs enlargement / reduction processing, the original image 1
  • the size force of the recognition object in 307 can be verified.
  • the power obtained by applying the region setting unit 1308 and the grayscale image scaling unit 1309 to the pattern recognition device shown in FIG. 1 is compared with the pattern recognition device shown in FIG. Apply the area setting unit 1308 and the grayscale image enlargement / reduction unit 1309.
  • the present invention can be applied to a pattern recognition apparatus, a pattern recognition method, and a pattern recognition program.

Abstract

 2値または3値で表現された参照画像と入力された濃淡画像との照合において、設定可能な種々の2値化閾値を仮定して2値の参照画像を複数生成し、これらの参照画像と濃淡画像との距離を比較するパターン認識方法と同等の結果を、より高速に求めることを可能にするパターン認識方法である。2値の参照画像における高濃度領域の画素に対応づけさられた濃淡画像の画素に対する第1の累積ヒストグラムと、参照画像における低濃度領域の画素に対応づけされた濃淡画像の画素に対する逆向きの第2の累積ヒストグラムとが生成され、加算される。加算後の累積ヒストグラムの最小値が閾値と比較されることによってパターンの有無が判定される。

Description

明 細 書
パターン認識装置、パターン認識方法、およびパターン認識プログラム 技術分野
[0001] 本発明は、参照画像と照合することにより濃淡画像のパターン認識を行うパターン 認識装置、パターン認識方法、およびパターン認識プログラムに関する。
背景技術
[0002] 濃淡画像と 2値の階調の参照画像とを照合する方法として、濃淡画像を何らかの 2 値ィ匕アルゴリズムによって 1度だけ 2値ィ匕し、 2値パターン同士でテンプレートマツチン グを行う方法がある。 2値ィ匕するためのアルゴリズムの例として、固定閾値法、 pタイル 法、大津の 2値ィ匕法 (判別分析法)がよく知られている。これら方法は、 2値化操作を 1 度しか行わないので比較的高速であるという利点がある。ただし、 2値化アルゴリズム においては、入力濃淡画像に対してそれぞれ固有の前提条件が仮定されるため、限 定された場合にのみ良好な結果が得られる。
[0003] 例えば、固定閾値法においては、認識対象物の領域がもつ濃度値とそれ以外の領 域がもつ濃度値が常に安定した値 (2値ィ匕閾値と呼ばれる)で分離できることが前提 条件として仮定される。よって、照明強度の変化により入力濃淡画像の画素値が全 体的に上下するような画像では、最適な 2値ィ匕閾値が上下するので、固定閾値法は 適さない。
[0004] pタイル法においては、画像全体に対する画素値分布のうち上位もしくは下位 pパ 一セントの画素によって形成される領域が認識対象に対応することが前提とされる。 例えば入力濃淡画像中において認識対象の大きさが変化する場合には、前提条件 が満たされなくなるため、 pタイル法は適さな 、。
[0005] 大津の 2値ィ匕法においては、画像全体における画素値のヒストグラムが双峰形であ ることが仮定される。しかし、入力画像中に 3種類以上の物体が含まれる場合には、ヒ ストグラムが双峰形でない場合が非常に多ぐ大津の 2値ィ匕法は適さない。
[0006] 上記諸方法よりも前提条件がよりゆるい方法が提案されている。この方法では、入 力濃淡画像が複数の異なる閾値でそれぞれ 2値化され、それぞれの入力 2値画像と 参照画像との比較結果力 最終的な出力が選択される。
[0007] 例えば、特開平 8— 287246号公報(段落 [0013]— [0028]及び図 1参照)に記 載の方法においては、 Pタイル法をはじめとする複数の閾値設定法によって複数の 2 値画像が生成され、それぞれに対する文字認識評価値に基づ!、て最も評価値が高 力つた結果が選択される。
[0008] 特開平 8— 077300号公報 (段落 [0007]— [0022]及び図 1参照)に記載の文字 認識装置においては、文字認識の確信度が所定の閾値を超えるまで 2値化閾値が 微小量だけ初期値から自動的に増減され、試行錯誤が繰り返されることにより結果が 得られる。
[0009] また、次のような方法(2値ィ匕画像総あたり法と 、う)が考えられる。この方法にお!、 ては、設定可能な種々の 2値化閾値が仮定され、それぞれの 2値ィ匕閾値に基づく 2 値画像が生成される。これらの 2値画像と参照画像との距離が計算され、距離値が最 小となる認識結果が採用される。この 2値画像生成総あたり法によれば、入力濃淡画 像の性質にかかわらず、入力濃淡画像が参照画像に最適に適合されることが可能な ので、上記の従来技術と比べてもっとも高い認識精度を実現することができる。
[0010] 特開 2004— 180000には、濃淡画像を高精度に自動 2値ィ匕することを目的とした 画像の 2値化方法が記載されて 、る。
[0011] 特開 2000— 40153には、鄞線ゃ文字が近傍の背景色とは異なった濃度であるこ とを利用し、鄞線、文字や背景にどのような色が使われていても、文字や鄞線を鮮明 に表現した二値画像を提供できることを目的とした画像処理方法が記載されている。 発明の開示
[0012] 2値画像生成総あたり法は、入力濃淡画像の性質にかかわらず入力濃淡画像が参 照画像に最適に適合されることができる。しかし、設定した 2値化閾値の数と同じ回数 、 2値ィ匕処理および距離計算処理を繰り返し実行しなければならないため、非常に多 くの処理時間を要するという問題がある。
[0013] 本発明は、上記の課題を解決するための発明であって、 2値画像生成総あたり法と 同等の結果を、より高速に求めることが可能なパターン認識装置、パターン認識方法 、およびパターン認識プログラムを提供することを目的とする。 [0014] 本発明によるパターン認識装置は、高濃度領域と低濃度領域とを有する 2値化され た画像である参照画像と前記参照画像と照合される入力濃淡画像とを記憶する記憶 部と、参照画像の高濃度領域の画素に対応づけられた入力濃淡画像の画素に対し 、濃度値が所定の値未満の画素数を累積する累積ヒストグラムを抽出する第 1の累積 ヒストグラム抽出部と、参照画像の低濃度領域の画素に対応づけられた入力濃淡画 像の画素に対し、濃度値が所定の値以上の画素数を累積する累積ヒストグラムを抽 出する第 2の累積ヒストグラム抽出部と、第 1の累積ヒストグラム抽出部が抽出した累 積ヒストグラムと、第 2の累積ヒストグラム抽出部が抽出した累積ヒストグラムとを対応付 けて加算して加算累積ヒストグラムを求める累積ヒストグラム加算部と、累積ヒストグラ ム加算部により求められた加算累積ヒストグラムの最小値を参照画像と入力濃淡画像 との距離値として入力濃淡画像の認識を行うパターン照合部とを有することを特徴と する。
[0015] そのような構成によって、入力濃淡画像と参照画像を最適に適合させた場合の距 離値に基づいてパターン認識処理が実行できる原理を、図 12を参照して説明する。 図 12は、パターン認識の実行処理に用いる濃度ヒストグラム (横軸が濃度を示し、縦 軸が画素数を示すグラフ)を示す説明図である。図 12 (a)には、参照画像の高濃度 領域の画素に対応づけられた入力濃淡画像中の画素に対する濃度ヒストグラム 120 1が示され、図 12 (b)には、参照画像の低濃度領域の画素に対応づけられた入力濃 淡画像中の画素に対する濃度ヒストグラム 1202が示されている。 2値ィ匕するため、 2 値ィ匕閾値 1203を設定した場合、濃度ヒストグラム 1201において、 2値化閾値 1203 よりも濃度値の低い低濃度領域 1204と、濃度ヒストグラム 1202において、 2値化閾 値 1203よりも濃度値の高い高濃度領域 1205とを有している。
[0016] 今、入力濃淡画像を 2値化閾値 1203で 2値化した 2値画像と参照画像との市街地 距離を求めることを考える。市街地距離は、(A1)式で表されるミンコフスキー計量( Minkowski metric)の式にお 、て k= 1とした場合の距離である。
[0017] [数 1] 4(", )= μι)
Figure imgf000006_0001
[0018] ここで、 ai、 biは、それぞれ、濃淡画像を仮の 2値ィ匕閾値 1203で 2値ィ匕した 2値画 像の各画素の値および参照画像の各画素の値を示し、 dは画素数を示す。また、濃 淡画像中で 2値ィ匕閾値 1203以上だった画素に画素値 1を、 2値ィ匕閾値 1203未満だ つた画素に画素値 0を割り当てたとすると、 ai、 biの値はそれぞれ 0もしくは 1なので、 I ai-bi Iの値は、
ケース 1 ai=0、bi=O の場合 ai-bi I =0
ケース 2 ai=0、bi= l の場合 ai— bi I =丄
ケース 3 ai=l、bi=0 の場合 ai— bi I = 1
ケース 4 ai=l、bi= l の場合 ai-bi I =0
の 4通りのいずれかになる。ここで I ai— bi I = 1であるケース 2, 3に着目する。
[0019] 市街地距離は、参照画像と 2値入力画像の対応づけられた画素対の値に基づ 、て 、(参照画像上で高濃度領域 かつ 2値画像上で画素値 0)である画素対の数 + ( 参照画像上で低濃度領域 かつ 2値画像上で画素値 1)である画素対の数の値と 等しくなる。第 1項は低濃度領域 1204の面積の値に等しぐ第 2項は高濃度領域 12 05の面積の値に等しい。
[0020] そして、本発明における第 1の累積ヒストグラムおよび第 2の累積ヒストグラムは、そ れぞれ 2値ィ匕閾値 1203を種々の値に仮定した場合の低濃度領域 1204および高濃 度領域 1205の面積に相当する。また、これらを加算して得られる加算累積ヒストグラ ムの最小値は、(A1)式から、濃淡画像を仮想的に 2値化した 2値画像と参照画像と の市街地距離の最小値に等しい。よって、加算累積ヒストグラムの最小値を選択する こと〖こよって、入力画像の性質にかかわらず、濃淡画像を参照画像に最適に対応さ せた場合の市街地距離が得られるので、これに基づ!/ヽて判定を行うことができる。
[0021] また、入力濃淡画像を実際に 2値化して 2値画像を作成することなぐ仮想的 2値画 像と参照画像との市街地距離を算出することができるので、 2値化処理および画像べ ースでの距離計算処理は不要であり、 2値画像生成総あたり法よりも高速に認識処 理を行うことができる。
[0022] また、本発明によるパターン認識装置は、高濃度領域と低濃度領域とを有する 2値 化された参照画像である参照画像と、前記参照画像と照合される入力濃淡画像と、 画素毎の重み値を有する重み画像とを記憶する記憶部と、参照画像の高濃度領域 の画素に対応づけられた入力濃淡画像の画素に対し、濃度値が所定の値未満の画 素に対応づけられた重み画像の画素の重み値を累積して累積ヒストグラムを抽出す る第 1の累積ヒストグラム抽出部と、参照画像の低濃度領域の画素に対応づけられた 入力濃淡画像の画素に対し、濃度値が所定の値以上の画素に対応づけられた重み 画像の画素の重み値を累積して累積ヒストグラムを抽出する第 2の累積ヒストグラム抽 出部と、第 1の累積ヒストグラム抽出部が抽出した累積ヒストグラムと、第 2の累積ヒスト グラム抽出部が抽出した累積ヒストグラムとを対応付けて加算して加算累積ヒストグラ ムを求める累積ヒストグラム加算部と、累積ヒストグラム加算部により求められた加算 累積ヒストグラムの最小値を参照画像と入力濃淡画像との距離値として入力濃淡画 像の認識を行うパターン照合部とを有することを特徴とする。そのような構成によれば 、画素毎にパターン認識における寄与度を変更することができる。
[0023] また、パターン認識装置において、参照画像は、非計算領域である第 3の濃度領 域を含み、第 1の累積ヒストグラム抽出部と第 2の累積ヒストグラム抽出部とは、第 3の 濃度領域に含まれる画素を累積ヒストグラムの抽出処理から除外してもよい。そのよう な構成によれば、ノターン認識を行う上で有効でな 、画素位置の一致又は不一致 による距離値への影響を排除することができる。
[0024] また、パターン認識装置にお!ヽて、入力濃淡画像から部分領域画像を設定する領 域設定部と、領域設定部が設定した部分領域画像を、参照画像と同じ大きさに拡大 '縮小 (すなわちスケーリングによるズームインまたはズームアウト)する濃淡画像拡大 縮小部とを備え、濃淡画像拡大縮小部は、拡大 ·縮小された部分領域画像を、参照 画像と照合するための入力濃淡画像とすることが好ましい。このような構成によれば、 参照画像に対応する領域が、入力された濃淡画像の一部である場合においても、当 該参照画像に対応する領域を検出することができる。 [0025] 本発明によるパターン認識方法は、高濃度領域と低濃度領域とを有する 2値化され た画像である参照画像と前記参照画像と照合される入力濃淡画像とを記憶するステ ップと、参照画像の高濃度領域の画素に対応づけられた入力濃淡画像の画素に対 し、濃度値が所定の値未満の画素数を累積する累積ヒストグラムを抽出する第 1の累 積ヒストグラム抽出ステップと、参照画像の低濃度領域の画素に対応づけられた入力 濃淡画像の画素に対し、濃度値が所定の値以上の画素数を累積する累積ヒストグラ ムを抽出する第 2の累積ヒストグラム抽出ステップと、第 1の累積ヒストグラム抽出ステ ップで抽出された累積ヒストグラムと、第 2の累積ヒストグラム抽出ステップで抽出され た累積ヒストグラムとを対応付けて加算して加算累積ヒストグラムを求める累積ヒストグ ラム加算ステップと、累積ヒストグラム加算ステップで求められた加算累積ヒストグラム の最小値を参照画像と入力濃淡画像との距離値として入力濃淡画像の認識を行うパ ターン照合ステップとを含むことを特徴とする。
[0026] また、本発明によるパターン認識方法は、高濃度領域と低濃度領域とを有する 2値 化された画像である参照画像と参照画像と照合される入力濃淡画像と画素毎の重み 値を有する重み画像とを記憶するステップと、参照画像の高濃度領域の画素に対応 づけられた入力濃淡画像の画素に対し、濃度値が所定の値未満の画素に対応づけ られた重み画像の画素の重み値を累積して累積ヒストグラムを抽出する第 1の累積ヒ ストグラム抽出ステップと、参照画像の低濃度領域の画素に対応づけられた入力濃 淡画像の画素に対し、濃度値が所定の値以上の画素に対応づけられた重み画像の 画素の重み値を累積して累積ヒストグラムを抽出する第 2の累積ヒストグラム抽出ステ ップと、第 1の累積ヒストグラム抽出ステップで抽出された累積ヒストグラムと、第 2の累 積ヒストグラム抽出ステップで抽出された累積ヒストグラムとを対応付けて加算してカロ 算累積ヒストグラムを求める累積ヒストグラム加算ステップと、累積ヒストグラム加算ステ ップで求められた加算累積ヒストグラムの最小値を参照画像と入力濃淡画像との距 離値として入力濃淡画像の認識を行うパターン照合ステップとを含むことを特徴とす る。
[0027] また、パターン認識方法にぉ 、て、参照画像は、非計算領域である第 3の濃度領 域を含み、第 1の累積ヒストグラム抽出ステップと第 2の累積ヒストグラム抽出ステップ では、第 3の濃度領域に含まれる画素を累積ヒストグラムの抽出処理から除外しても よい。
[0028] また、パターン認識方法にぉ ヽて、入力濃淡画像から部分領域画像を設定する領 域設定ステップと、領域設定ステップで設定された部分領域画像を、参照画像と同じ 大きさに拡大,縮小し、濃淡画像拡大縮小ステップとを含み、濃淡画像拡大縮小ステ ップで、拡大'縮小された部分領域画像を、参照画像と照合するための入力濃淡画 像とすることが好ましい。
[0029] 本発明によるパターン認識プログラムは、高濃度領域と低濃度領域とを有する 2値 化された画像である参照画像と前記参照画像と照合される入力濃淡画像とを記憶す るステップと、参照画像の高濃度領域の画素に対応づけられた入力濃淡画像の画素 に対し、濃度値が所定の値未満の画素数を累積する累積ヒストグラムを抽出する第 1 の累積ヒストグラム抽出処理と、参照画像の低濃度領域の画素に対応づけられた入 力濃淡画像の画素に対し、濃度値が所定の値以上の画素数を累積する累積ヒストグ ラムを抽出する第 2の累積ヒストグラム抽出処理と、第 1の累積ヒストグラム抽出処理で 抽出された累積ヒストグラムと、第 2の累積ヒストグラム抽出処理で抽出された累積ヒス トグラムとを対応付けて加算して加算累積ヒストグラムを求める累積ヒストグラム加算処 理と、累積ヒストグラム加算処理で求められた加算累積ヒストグラムの最小値を、参照 画像と入力濃淡画像との距離値とし、所定の閾値と比較することによりパターン照合 するパターン照合処理とをコンピュータに実行させる。
[0030] また、本発明によるパターン認識プログラムは、高濃度領域と低濃度領域とを有す る 2値化された画像である参照画像と、前記参照画像と照合される入力濃淡画像と、 画素毎の重み値を有する重み画像とを記憶するステップと、参照画像の高濃度領域 の画素に対応づけられた入力濃淡画像の画素に対し、濃度値が所定の値未満の画 素に対応づけられた重み画像の画素の重み値を累積して累積ヒストグラムを抽出す る第 1の累積ヒストグラム抽出処理と、参照画像の低濃度領域の画素に対応づけられ た入力濃淡画像の画素に対し、濃度値が所定の値以上の画素に対応づけられた重 み画像の画素の重み値を累積して累積ヒストグラムを抽出する第 2の累積ヒストグラム 抽出処理と、第 1の累積ヒストグラム抽出処理で抽出された累積ヒストグラムと、第 2の 累積ヒストグラム抽出処理で抽出された累積ヒストグラムとを加算して加算累積ヒストグ ラムを求める累積ヒストグラム加算処理と、累積ヒストグラム加算処理で求められたカロ 算累積ヒストグラムの最小値を、参照画像と入力濃淡画像との距離値とし、所定の閾 値と比較することによりパターン照合するパターン照合処理とをコンピュータに実行さ せる。
[0031] また、参照画像は、非計算領域である第 3の濃度領域を含み、パターン認識プログ ラムは、コンピュータに、第 1の累積ヒストグラム抽出処理と第 2の累積ヒストグラム抽出 処理では、第 3の濃度領域に含まれる画素を累積ヒストグラムの抽出処理から除外さ せるものであってもよい。
[0032] また、パターン認識プログラムは、コンピュータに、入力濃淡画像から部分領域画像 を設定する領域設定処理と、領域設定処理が設定した部分領域画像を、参照画像と 同じ大きさに拡大 ·縮小する濃淡画像拡大縮小処理とを実行させ、パターン照合処 理で、拡大'縮小された部分領域画像を前記参照画像と照合させるように構成されて いてもよい。
[0033] 本発明によれば、 2値画像生成総あたり法と等しい照合精度を保ったまま、より高速 に入力濃淡画像を 2値の参照画像に最適に適合させてパターン認識を行うことがで きる。すなわち、異なる閾値で繰り返し 2値化処理および距離計算処理を行う必要が ないので、 2値画像生成総あたり法と同等の結果を、より高速に求めることができる。 図面の簡単な説明
[0034] [図 1]本発明によるパターン認識装置の第 1の実施の形態の構成を示すブロック図で ある。
[図 2]パターン認識装置が行う処理過程の一例を示すフローチャートである。
[図 3]入力濃淡画像の一例を示す説明図である。
[図 4]ノターン認識に用いる画像の一例を示す説明図である。
[図 5A]Hf (i)の一例を示す説明図である。
[図 5B]Hb (i)の一例を示す説明図である。
[図 6A]Af (i)の一例を示す説明図である。
[図 6B]Ab (i)の一例を示す説明図である。 [図 7]At (i)の一例を示す説明図である。
[図 8A]入力濃淡画像の濃度がほぼ一様な場合における各部の出力結果の一例を 示す説明図である。
[図 8B]入力濃淡画像の濃度がほぼ一様な場合における各部の出力結果の一例を示 す説明図である。
[図 8C]入力濃淡画像の濃度がほぼ一様な場合における各部の出力結果の一例を 示す説明図である。
[図 8D]入力濃淡画像の濃度がほぼ一様な場合における各部の出力結果の一例を 示す説明図である。
[図 8E]入力濃淡画像の濃度がほぼ一様な場合における各部の出力結果の一例を示 す説明図である。
[図 9]3値画像である参照画像の一例を示す説明図である。
[図 10]3値画像である参照画像の他の例を示す説明図である。
[図 11]本発明によるパターン認識装置の第 2の実施の形態の構成を示すブロック図 である。
[図 12]パターン認識の実行処理に用いる濃度ヒストグラムを示す説明図である。
[図 13]本発明によるパターン認識装置の第 3の実施の形態の構成成を示すブロック 図である。
[図 14]パターン認識装置が行う処理過程の一例を示すフローチャートである。
発明を実施するための最良の形態
[0035] 実施の形態 1.
以下、本発明の第 1の実施の形態を図面を参照して説明する。図 1は、本発明によ るパターン認識装置の第 1の実施の形態の構成を示すブロック図である。図 1に示す ように、パターン認識装置は、第 1の累積ヒストグラム抽出部 103と、第 2の累積ヒスト グラム抽出部 104と、累積ヒストグラム加算部 105と、パターン照合部 106とを含む。
[0036] パターン認識装置は、具体的には、ワークステーションやパーソナルコンピュータに 例示される情報処理装置によって実現される。本実施の形態において、入力濃淡画 像 101は、画像入力部から入力され、画像記憶部に記憶される。 2値で表現された参 照画像 102は、例えば、画像入力部から入力され、参照画像記憶部に記憶されてい る。第 1の累積ヒストグラム抽出部 103、第 2の累積ヒストグラム抽出部 104、累積ヒスト グラム加算部 105、およびパターン照合部 106は、パターン認識装置の制御部によ つて実現される。制御部は、具体的には、プログラムに従って動作する情報制御装置 の CPUによって実現される。
[0037] 入力濃淡画像 101は、濃淡表現された認識対象の画像である。入力濃淡画像 101 の縦横サイズは、参照画像 102の縦横サイズと同一である。図 3は、入力濃淡画像の 一例を示す説明図である。図 3に示す入力濃淡画像においては、白地の背景 301に 灰色の円 302が描かれ、その円 302の中に文字「a」 303が描かれている。図 3にお いて、より色の濃い部分ほど濃度値が大きい。つまり各領域の濃度値は、背景 301く 円 302く文字「a」 303である。濃淡値の取りうる範囲は、例えば 0〜255に設定され る。参照画像 102は、 2値画像である。参照画像 102の高輝度領域の画素は、属性 値" 1"を、参照画像 102の低輝度領域の画素は、属性値" 2"を、画素値として持つ。
[0038] 図 4は、パターン認識に用いる画像の一例を示す説明図である。文字「a」が、参照 画像として示されている。図 3に示すような入力濃淡画像をパターン認識する場合に は、高濃度領域 401に属性値" 1"が、低濃度領域 402に属性値" 2"が割り当てられ る。
[0039] 第 1の累積ヒストグラム抽出部 103は、入力濃淡画像 101と参照画像 102を照合し たときに、参照画像上で属性値 1を持つ画素に対応づけられた濃淡画像中の画素に 対し、濃度値が i未満である画素の数を示す第 1の累積ヒストグラム Af (i)を生成する 。すなわち、 Af (i)は、参照画像上で属性値 1を持つ画素に対応づけされた濃淡画 像中の画素のうち濃度値が iである画素数を Hf (i)で表すと、
Af (i) =Hf (0) +Hf (l) + +Hf (i— 1) … (1)
で表される。 Af (i)は単調増加する関数である。
[0040] 第 2の累積ヒストグラム抽出部 104は、参照画像 102上で属性値 2を持つ画素に対 応する濃淡画像中の画素のうち、濃度値が i以上である画素の数を示す逆向きの第 2 の累積ヒストグラム Ab (i)を生成する。すなわち、 Ab (i)は、参照画像上で属性値 2を 持つ画素に対応する濃淡画像中の画素のうち、濃度値が iである画素数を Hb (i)で 表すと、
Ab (i) =Hb (255) +Hb (254) + +Hb (i) … (2)
で表される。 Ab (i)は単調減少する関数である。
[0041] 累積ヒストグラム加算部 105は、第 1の累積ヒストグラム Af (i)と第 2の累積ヒストグラ ム Ab (i)を、(3)式により加算し、加算累積ヒストグラム At (i)を抽出する。
[0042] At (i) =Af (i) +Ab (i) … (3)
パターン照合部 106は、 At (i) {i=0, 1, 2, · · , 255}の中力も最小値を抽出し、そ の値が予め定めてある閾値 Dthrよりも小さい場合に入力画像が参照画像の示す認 識対象物であると判断する。
[0043] 次に、パターン認識装置の動作について図面を参照しながら詳細に説明する。図 2 はパターン認識装置が行う処理過程の一例を示すフローチャートである。第 1の累積 ヒストグラム抽出部 103は、入力濃淡画像 101および参照画像 102から第 1の累積ヒ ストグラムを抽出する。第 2の累積ヒストグラム抽出部 104は、入力濃淡画像 101およ び参照画像 102から第 2の累積ヒストグラムを抽出する (ステップ S201)。その処理の 一例を図 3から図 6を参照して詳細に説明する。
[0044] 図 5A、 5Bは、それぞれ Hf (i)および Hb (i)の一例を示す説明図である。図 5Aと図 5B〖こは、図 3に示す入力濃淡画像 101と図 4に示す参照画像 102とを照合した場合 の Hf (i) 501と Hb (i) 502の例がそれぞれ示されている。高濃度領域 401には、文字 「a」 303の大部分が対応するので、 Hf (i) 501において、高い濃度値の領域に高い 度数 (多い画素数)が集中する。一方、低濃度領域 402には、背景 301と円 302の大 部分が対応するので、 Hb (i) 502の分布は、低濃度から中濃度域にかけての領域に 2つのピークをもつ。
[0045] 図 6A、 6Bは、それぞれ Af (i)および Ab (i)の一例を示す説明図である。図 6Aには 、 Hf (i) 501に基づいて抽出され、(1)式の Af (i)である第 1の累積ヒストグラム 601が 示され、図 6B〖こは、 Hb (i) 502〖こ基づいて抽出され、(2)式の Ab (i)である第 2の累 積ヒストグラム 602が示されている。第 1の累積ヒストグラム 601は、濃度値 i未満の画 素数を示すので単調に増加するヒストグラム形状となる。一方、第 2の累積ヒストグラム 602は、濃度値 i以上の画素数を示すので単調に減少するヒストグラム形状となる。 [0046] 累積ヒストグラム加算部 105は、第 1の累積ヒストグラム 601と第 2の累積ヒストグラム 602を加算し、加算累積ヒストグラム 701を生成する(ステップ S202)。
[0047] 図 7は、 At (i)の一例を示す説明図である。図 7には、第 1の累積ヒストグラム 601お よび第 2の累積ヒストグラム 602を加算することによって算出される (3)式の At (i)であ る加算累積ヒストグラムが示されて 、る。
[0048] パターン照合部 106は、加算累積ヒストグラム 701を用いてパターン照合を行う(ス テツプ S203)。すなわち、パターン照合部 106は、加算累積ヒストグラム 701における 最小値を抽出して予め定めてある閾値 Dthrと比較し、加算累積ヒストグラム 701にお ける最小値が、閾値 Dthr以下であれば入力画像が認識対象物であると判定する。 逆に、加算累積ヒストグラム 701の最小値が閾値 Dthrより大きければ入力画像は認 識対象物でないと判定する。図 7に示される例では、加算累積ヒストグラム 701におけ る最小値は、加算累積ヒストグラム最小値 702であり、閾値 703以下なので、パターン 照合部 106は、入力濃淡画像 101を認識対象物であると判断する。
[0049] 認識対象を含まない入力画像が入力された場合の例を、図 8A〜Eを用いて詳細 に説明する。図 8A〜Eは、入力濃淡画像の濃度がほぼ一様な場合における各部の 出力結果の一例を示す説明図である。図 8Aには、入力濃淡画像 801が示され、図 8 Bには、参照画像 802が示されている。入力濃淡画像 801には、画像全体において 画素値がおおむね均一な画像が示されている。図 8Cには、第 1の累積ヒストグラム 8 03力示され、図 8Dには、第 2の累積ヒストグラム 804が示されている。また、図 8Eに は、加算累積ヒストグラム 805が示されている。入力濃淡画像 801と参照画像 802に 対して、第 1の累積ヒストグラム 803、第 2の累積ヒストグラム 804、加算累積ヒストグラ ム 805がそれぞれ得られる。そして、加算累積ヒストグラム 805における最小値である 加算累積ヒストグラム最小値 806は閾値 807よりも大きいので、入力画像は、認識対 象物でないと判定される。
[0050] 以上のように、累積加算ヒストグラムにおける最小値を閾値 Dthrと比較することによ り、入力画像が認識対象物であるカゝ否かを判定することができる。
[0051] また、上記実施例では、参照画像を画像形式としたが、等価な情報を表現できさえ すれば画像形式でなくともよい。例えば、属性値" 1"を有する画素位置を列挙したデ ータなどでもよい。
[0052] また、上記実施例では、参照画像は属性値" 1"の画素および属性値" 2"の画素か らなる 2値画像であるとしたが、非計算領域を示す第 3の属性値を含む 3値画像であ つても構わない。 3値画像の一例を図 9、図 10に示す。
[0053] 図 9は、 3値画像である参照画像の一例を示す説明図である。図 9に示すように、参 照画像は、属性値" 1"を持つ高濃度領域 901と属性値" 2"を持つ低濃度領域 902 の境界付近に第 3の属性値を持つ第 3領域 903を有する。第 1の累積ヒストグラム抽 出部 103および第 2の累積ヒストグラム抽出部 104は、第 3領域 903に含まれる画素 をヒストグラム生成の対象に含めない。すなわち、第 1の累積ヒストグラム抽出部 103と 第 2の累積ヒストグラム抽出部 104とは、第 3領域 903に含まれる画素を累積ヒストグラ ムの抽出処理から除外する。このような参照画像を用いると、第 3の属性値を持つ領 域はヒストグラム計算に考慮されないため、入力濃淡画像と参照画像の位置が上下 左右に僅かにずれている場合でも、ずれによる加算累積ヒストグラム値への影響を低 減することができ、 2値参照画像を用いる場合に比べ位置ずれに対して頑健なバタ ーン認識装置を構成することができる。
[0054] 図 10は、 3値画像である参照画像の他の例を示す説明図である。図 10には、数字 「 1」の縦棒の上端力 右側に伸びる短い棒であるかぎ部にのみ第 3の属性値を持つ 第 3領域 1001を有する 3値参照画像が示されている。力ぎ部を有する「1」と、かぎ部 を有さない「1」との両方に対応した参照画像とすることができる。
[0055] また、 3値参照画像は、図 9,図 10の例のように 3値のいずれかを画素値として持つ 参照画像が基本的な表現形態であるが、 2値参照画像と、非計算領域のみを示す別 の 2値画像との 2つの画像を用いて表現した場合も同じ効果を得ることができるので、 ここでは、そのような実現形態も含めて 3値参照画像とよぶ。
[0056] 実施の形態 2.
次に、本発明の第 2の実施の形態を図面を参照して説明する。図 11は、本発明に よるパターン認識装置の第 2の実施の形態の構成を示すブロック図である。図 11に 示すように、パターン認識装置は、入力濃淡画像 1101と、 2値で表現された参照画 像 1102と、第 1の累積ヒストグラム抽出部 1103と、第 2の累積ヒストグラム抽出部 110 4と、累積ヒストグラム加算部 1105と、パターン照合部 1106とを含む。第 1の累積ヒス トグラム抽出部 1103、第 2の累積ヒストグラム抽出部 1104、累積ヒストグラム加算部 1 105、およびパターン照合部 1106は、例えば、実施の形態 1と同様のパターン認識 装置の制御部によって実現される。本実施の形態では画素毎の重要度を示す重み 画像 1107が参照される点が、図 1に示されたパターン認識装置の場合と相異して!/ヽ る。重み画像 1107は、例えば、画像入力部から入力され、重み画像記憶部に記憶さ れている。
[0057] 以下、重み画像 1107、第 1の累積ヒストグラム抽出部 1103、および第 2の累積ヒス トグラム抽出部 1104の機能について、第 1の実施の形態と異なる機能を中心に説明 する。
[0058] 画素毎の重要度を示す重み画像 1107は、各画素がパターンを認識する上でどの 程度重要かを数値的に表す画像であり、入力濃淡画像 1101および参照画像 1102 と等しい縦横サイズを持つ画像である。例えば、各画素を等しく認識に寄与させる場 合にはすべての画素値を 1とすればよい。また、文字" e"と、それと類似した文字であ るウムラウト付き" e"との相異を際立たせたパターン認識装置を構成したい場合には、 ウムラウト記号のある上部の画素値を他の部分よりも大きく設定すればよい。
[0059] 第 1の累積ヒストグラム抽出部 1103は、入力濃淡画像 1101と参照画像 1102と重 み画像 1107との各画素を対応づけ、参照画像上の高濃度領域の画素に対応づけ られた濃淡画像中の画素のうち、濃度値が i未満である画素に対応づけられた重み 画像の画素値の総和を第 1の累積ヒストグラム Af (i)として抽出する。すなわち、 Af (i )は以下の式によって与えられる。
[0060] [数 2]
Figure imgf000016_0001
ή· w(x7 y)} … (4)
y x
[0061] この式にぉ 、て、 D (X, y)は座標 (X, y)における参照画像の画素値、 I (x, y)は、 座標 (X, y)における入力濃淡画像の画素値、 W(x, y)は、座標 (X, y)における重み 画像の画素値、 S f (D (x, y) , I (x, y) , i)は、参照画像の画素値 D (x, y)が高濃度 領域を示す画素値であり、且つ入力濃淡画像の画素値 I (x, y)が i未満である場合の み値 1を返し、それ以外の場合は値 0を返す関数である。
[0062] 同様に、第 2の累積ヒストグラム抽出部 1104は、入力濃淡画像 1101と参照画像 1 102と重み画像 1107との各画素を対応づけ、参照画像上の低濃度領域の画素に 対応づけられた濃淡画像中の画素のうち、濃度値が i以上である画素に対づけられ た重み画像の画素値の総和を第 2の累積ヒストグラム Ab (i)として抽出する。すなわ ち、 Ab (i)は以下の式によって与えられる。
[0063] [数 3]
Figure imgf000017_0001
…(
y χ
[0064] この式にぉ 、て、 δ b (D (x, y) , I (χ, y) , i)は、参照画像の画素値 D (x, y)が低濃 度領域を示す画素値をとり、且つ入力濃淡画像の画素値 I (x, y)が値 i以上である場 合のみ値 1を返し、それ以外の場合は値 0を返す関数である。
[0065] 累積ヒストグラム加算部 1105は、第 1の累積ヒストグラム Af (i)と第 2の累積ヒストグ ラム Ab (i)を (4) , (5)式により加算し、(3)式により、加算累積ヒストグラム At (i)を抽 出する。
[0066] パターン照合部 1106は、 At (i) {i=0, 1, 2, · · , 255}の中力も最小値を抽出し、 その値が予め定めてある閾値 Dthrよりも小さい場合に入力画像が参照画像の示す 認識対象物であると判断する。
[0067] 本実施の形態のパターン認識装置の動作は、第 1の実施の形態のパターン認識装 置の動作と同様であり、本実施の形態のパターン認識装置の動作を、図 2を参照して 説明する。第 1の累積ヒストグラム抽出部 1103および第 2の累積ヒストグラム抽出部 1 104は、図 2に示すように、入力濃淡画像 1101、参照画像 1102、および重み画像 1 107から第 1の累積ヒストグラムおよび第 2の累積ヒストグラムを抽出する (ステップ S2 01)。累積ヒストグラム加算部 1105は、第 1の累積ヒストグラムと第 2の累積ヒストグラ ムを加算し、加算累積ヒストグラムを生成する (ステップ S202)。パターン照合部 110 6は、加算累積ヒストグラムを用いてパターン照合を行う (ステップ S203)。 [0068] 本実施の形態においては、第 1の累積ヒストグラムと第 2の累積ヒストグラムを抽出す る際に、重み画像 1107の画素値が考慮されいる。いわゆる重み付きの市街地距離 の最小値によって、パターン認識を判断していると捉えることができる。
[0069] 本実施の形態においては、第 1の実施の形態に比べると、パターンを認識する上で 比較的重要度の高い入力画像の画素が、より参照画像の画素に整合するような閾値 において、加算累積ヒストグラムの最小値が出現する傾向性を有するパターン認識が 実現される。
[0070] 実施の形態 3.
次に、本発明の第 3の実施の形態を図面を参照して説明する。図 13は、本発明に よるパターン認識装置の第 3の実施の形態の構成を示すブロック図である。図 13に 示すように、本実施の形態のパターン認識装置では、図 1に示されたパターン認識装 置の場合とは異なり、第 1の累積ヒストグラム抽出部 1303が、入力濃淡画像ではなく 、濃淡画像拡大縮小部 1309が出力する画像を入力する。また、パターン認識装置 は、濃淡表現された元画像 1307中から複数の部分領域を設定する領域設定部 130 8と、領域設定部が設定した各部分領域画像を参照画像と同じ大きさに拡大 '縮小す る濃淡画像拡大縮小部 1309とを更に備える。領域設定部 1308、濃淡画像拡大縮 小部 1309、第 1の累積ヒストグラム抽出部 1303、第 2の累積ヒストグラム抽出部 130 4、累積ヒストグラム加算部 1305、およびパターン照合部 1306は、例えば、実施の 形態 1と同様のパターン認識装置の制御部によって実現される。
[0071] 元画像 1307は、濃淡表現された認識対象の画像である。元画像 1307の大きさは 、参照画像 1302と異なってもよい。例えば、参照画像 1302が、図 4に示すような 1文 字を表現するような場合、元画像 1307は、文字が記載されている帳票の全面を撮像 した濃淡画像でもよい。また、参照画像 1302が、 1つの道路標識を示す場合、元画 像 1307は道路風景をとらえた画像などでもよい。
[0072] 領域設定部 1308は、元画像 1307中力も予め定めた条件を満たす種々の領域の 範囲を設定する。予め定めた条件とは、例えば、領域の縦横サイズを限定するルー ル、または高度な識別関数などを用いて候補領域を絞り込むと!、うルールである。
[0073] 濃淡画像拡大縮小部 1309は、領域設定部 1308が設定した各部分領域画像を、 参照画像 1302と同じ大きさに拡大 ·縮小する。なお、拡大する場合は、画素を、二了 レストネイバ一法や双 1次補間法、ノ ィキュービック法などの手法によって補完する。
[0074] 次に、パターン認識装置の動作について図面を参照して詳細に説明する。図 14は 、 ノターン認識装置が行う処理過程の一例を示すフローチャートである。まず、領域 設定部 1308は、元画像から処理対象の領域を 1つ設定する (ステップ S1401)。次 に、濃淡画像拡大縮小部 1309は、設定された領域画像を参照画像と同じサイズに なるように拡大 ·縮小を行う (ステップ S 1402)。第 1の累積ヒストグラム抽出部 1303、 第 2の累積ヒストグラム抽出部 1304、累積ヒストグラム加算部 1305およびパターン照 合部 1306〖こよるステップ S 1403からステップ S 1405の処理は、第 1の累積ヒストグラ ム抽出部 103、第 2の累積ヒストグラム抽出部 104、累積ヒストグラム加算部 105およ びパターン照合部 106による図 2に示されたステップ S201からステップ S203の処理 と同様である。
[0075] 1つの領域に対してステップ S1405のパターン照合処理が終了したら、パターン認 識装置の制御部は、処理すべき他の領域がまだ残っている力否かを判断し、残って いる場合にはステップ S1401から処理を繰り返す。
[0076] 本実施の形態によれば、元画像から一部の領域を設定して参照画像と同じサイズ に変換してからパターン照合を行うことによって、元画像中の一部に認識対象物が存 在する場合での該対象物を検出することができる。
[0077] また、濃淡画像拡大縮小部 1309により、拡大 ·縮小処理をおこなうので、元画像 1
307中における認識対象物の大きさ力 参照画像 1302と異なる場合でも照合するこ とがでさる。
[0078] なお、本実施の形態では、図 1に示されたパターン認識装置に対して領域設定部 1 308および濃淡画像拡大縮小部 1309を適用した力 図 11に示されたパターン認識 装置に対して領域設定部 1308および濃淡画像拡大縮小部 1309を適用してもょ ヽ
[0079] 以上の実施の形態に例示されるように、本発明は、パターン認識装置、パターン認 識方法、およびパターン認識プログラムに適用可能である。

Claims

請求の範囲
[1] 高濃度領域と低濃度領域とを有する 2値化された画像である参照画像と、前記参 照画像と照合される入力濃淡画像とを記憶する記憶部と、
前記参照画像の前記高濃度領域の画素に対応づけられた前記入力濃淡画像の 画素に対し、濃度値が所定の値未満の画素数を累積する第 1の累積ヒストグラムを抽 出する第 1の累積ヒストグラム抽出部と、
前記参照画像の前記低濃度領域の画素に対応づけられた前記入力濃淡画像の 画素に対し、濃度値が所定の値以上の画素数を累積する第 2の累積ヒストグラムを抽 出する第 2の累積ヒストグラム抽出部と、
前記第 1の累積ヒストグラムと前記第 2の累積ヒストグラムとを対応付けて加算してカロ 算累積ヒストグラムを求める累積ヒストグラム加算部と、
前記累積ヒストグラム加算部により求められた加算累積ヒストグラムの最小値を前記 参照画像と前記入力濃淡画像との距離値として入力濃淡画像の認識を行うパターン 照合部とを有する
パターン認識装置。
[2] 前記参照画像は、非計算領域である第 3の濃度領域を含み、
前記第 1の累積ヒストグラム抽出部は前記第 3の濃度領域に含まれる画素を前記第 1の累積ヒストグラムの抽出処理から除外し、
前記第 2の累積ヒストグラム抽出部は前記第 3の濃度領域に含まれる画素を前記第 2の累積ヒストグラムの抽出処理から除外する
請求の範囲 1に記載のパターン認識装置。
[3] 元画像から部分領域画像を設定する領域設定部と、
前記部分領域画像を、前記参照画像と同じ大きさに拡大,縮小する濃淡画像拡大 縮小部とを備え、
前記濃淡画像拡大縮小部は、拡大,縮小された前記部分領域画像を、前記参照画 像と照合するための入力濃淡画像として設定する
請求の範囲 1に記載のパターン認識装置。
[4] 高濃度領域と低濃度領域とを有する 2値化された参照画像である参照画像と、前 記参照画像と照合される入力濃淡画像と、画素毎の重み値を有する重み画像とを記 憶する記憶部と、
前記参照画像の前記高濃度領域の画素に対応づけられた前記入力濃淡画像の 画素に対し、濃度値が所定の値未満の画素に対応づけられた前記重み画像の画素 の重み値を累積して第 1の累積ヒストグラムを抽出する第 1の累積ヒストグラム抽出部 と、
前記参照画像の前記低濃度領域の画素に対応づけられた前記入力濃淡画像の 画素に対し、濃度値が所定の値以上の画素に対応づけられた前記重み画像の画素 の重み値を累積して第 2の累積ヒストグラムを抽出する第 2の累積ヒストグラム抽出部 と、
前記第 1の累積ヒストグラムと前記第 2の累積ヒストグラムとを対応付けて加算してカロ 算累積ヒストグラムを求める累積ヒストグラム加算部と、
前記累積ヒストグラム加算部により求められた加算累積ヒストグラムの最小値を前記 参照画像と前記入力濃淡画像との距離値として入力濃淡画像の認識を行うパターン 照合部とを有する
パターン認識装置。
[5] 前記参照画像は、非計算領域である第 3の濃度領域を含み、
前記第 1の累積ヒストグラム抽出部は前記第 3の濃度領域に含まれる画素を前記第 1の累積ヒストグラムの抽出処理から除外し、
前記第 2の累積ヒストグラム抽出部は前記第 3の濃度領域に含まれる画素を前記第 2の累積ヒストグラムの抽出処理から除外する
請求の範囲 4に記載のパターン認識装置。
[6] 元画像から部分領域画像を設定する領域設定部と、
前記部分領域画像を、前記参照画像と同じ大きさに拡大,縮小する濃淡画像拡大 縮小部とを備え、
前記濃淡画像拡大縮小部は、拡大,縮小された前記部分領域画像を、前記参照画 像と照合するための入力濃淡画像として設定する
請求の範囲 4に記載のパターン認識装置。
[7] 高濃度領域と低濃度領域とを有する 2値化された画像である参照画像と、前記参 照画像と照合される入力濃淡画像とを記憶するステップと、
前記参照画像の前記高濃度領域の画素に対応づけられた前記入力濃淡画像の 画素に対し、濃度値が所定の値未満の画素数を累積する第 1の累積ヒストグラムを抽 出する第 1の累積ヒストグラム抽出ステップと、
前記参照画像の前記低濃度領域の画素に対応づけられた前記入力濃淡画像の 画素に対し、濃度値が所定の値以上の画素数を累積する第 2の累積ヒストグラムを抽 出する第 2の累積ヒストグラム抽出ステップと、
前記第 1の累積ヒストグラムと前記第 2の累積ヒストグラムとを対応付けて加算してカロ 算累積ヒストグラムを求める累積ヒストグラム加算ステップと、
前記累積ヒストグラム加算ステップで求められた加算累積ヒストグラムの最小値を前 記参照画像と前記入力濃淡画像との距離値として入力濃淡画像の認識を行うパター ン照合ステップとを含む
パターン認識方法。
[8] 前記参照画像は、非計算領域である第 3の濃度領域を含み、
前記第 1の累積ヒストグラム抽出ステップでは前記第 3の濃度領域に含まれる画素 は前記第 1の累積ヒストグラムの抽出処理力 除外され、
前記第 2の累積ヒストグラム抽出ステップでは前記第 3の濃度領域に含まれる画素 は前記第 2の累積ヒストグラムの抽出処理から除外される
請求の範囲 7に記載のパターン認識方法。
[9] 元画像から部分領域画像を設定する領域設定ステップと、
前記部分領域画像を、参照画像と同じ大きさに拡大,縮小する濃淡画像拡大縮小 ステップとを含み、
前記濃淡画像拡大縮小ステップで拡大 ·縮小された前記部分領域画像を、前記参 照画像と照合するための入力濃淡画像として設定する
請求の範囲 7に記載のパターン認識方法。
[10] 高濃度領域と低濃度領域とを有する 2値化された画像である参照画像と、前記参 照画像と照合される入力濃淡画像と、画素毎の重み値を有する重み画像とを記憶す るステップと、
前記参照画像の高濃度領域の画素に対応づけられた前記入力濃淡画像の画素 に対し、濃度値が所定の値未満の画素に対応づけられた前記重み画像の画素の重 み値を累積して第 1の累積ヒストグラムを抽出する第 1の累積ヒストグラム抽出ステップ と、
前記参照画像の低濃度領域の画素に対応づけられた前記入力濃淡画像の画素 に対し、濃度値が所定の値以上の画素に対応づけられた前記重み画像の画素の重 み値を累積して第 2の累積ヒストグラムを抽出する第 2の累積ヒストグラム抽出ステップ と、
前記第 1の累積ヒストグラムと前記第 2の累積ヒストグラムとを対応付けて加算してカロ 算累積ヒストグラムを求める累積ヒストグラム加算ステップと、
前記累積ヒストグラム加算ステップで求められた加算累積ヒストグラムの最小値を前 記参照画像と前記入力濃淡画像との距離値として入力濃淡画像の認識を行うパター ン照合ステップとを含む
パターン認識方法。
[11] 前記参照画像は、非計算領域である第 3の濃度領域を含み、
前記第 1の累積ヒストグラム抽出ステップでは前記第 3の濃度領域に含まれる画素 は前記第 1の累積ヒストグラムの抽出処理力 除外され、
前記第 2の累積ヒストグラム抽出ステップでは前記第 3の濃度領域に含まれる画素 は前記第 2の累積ヒストグラムの抽出処理から除外される
請求の範囲 10に記載のパターン認識方法。
[12] 元画像から部分領域画像を設定する領域設定ステップと、
前記部分領域画像を、参照画像と同じ大きさに拡大,縮小する濃淡画像拡大縮小 ステップとを含み、
前記濃淡画像拡大縮小ステップで拡大 ·縮小された前記部分領域画像を、前記参 照画像と照合するための入力濃淡画像として設定する
請求の範囲 10に記載のパターン認識方法。
[13] 高濃度領域と低濃度領域とを有する 2値化された画像である参照画像と、前記参 照画像と照合される入力濃淡画像とを記憶するステップと、
前記参照画像の高濃度領域の画素に対応づけられた前記入力濃淡画像の画素 に対し、濃度値が所定の値未満の画素数を累積する第 1の累積ヒストグラムを抽出す る第 1の累積ヒストグラム抽出ステップと、
前記参照画像の低濃度領域の画素に対応づけられた前記入力濃淡画像の画素 に対し、濃度値が所定の値以上の画素数を累積する第 2の累積ヒストグラムを抽出す る第 2の累積ヒストグラム抽出ステップと、
前記第 1の累積ヒストグラムと前記第 2の累積ヒストグラムとを対応付けて加算してカロ 算累積ヒストグラムを求める累積ヒストグラム加算ステップと、
前記累積ヒストグラム加算ステップで求められた加算累積ヒストグラムの最小値を前 記参照画像と前記入力濃淡画像との距離値として入力濃淡画像の認識を行うパター ン照合ステップ
とを具備する方法をコンピュータに実行させるためのパターン認識プログラム。
[14] 前記参照画像は、非計算領域である第 3の濃度領域を含み、
前記第 1の累積ヒストグラム抽出ステップでは、前記第 3の濃度領域に含まれる画素 は前記第 1の累積ヒストグラムの抽出処理力 除外され、
前記第 2の累積ヒストグラム抽出ステップでは、前記第 3の濃度領域に含まれる画素 は前記第 2の累積ヒストグラムの抽出処理から除外される
請求の範囲 13に記載のパターン認識プログラム。
[15] 更に、元画像から部分領域画像を設定する領域設定ステップと、
前記部分領域画像を、参照画像と同じ大きさに拡大,縮小する濃淡画像拡大縮小 ステップと、
前記濃淡画像拡大縮小ステップで拡大 ·縮小された前記部分領域画像を、前記参 照画像と照合される入力濃淡画像に設定するステップ
とを具備する方法をコンピュータに実行させる請求の範囲 13に記載のパターン認 識プログラム。
[16] 高濃度領域と低濃度領域とを有する 2値化された画像である参照画像と、前記参 照画像と照合される入力濃淡画像と、画素毎の重み値を有する重み画像とを記憶す るステップと、
前記参照画像の高濃度領域の画素に対応づけられた前記入力濃淡画像の画素 に対し、濃度値が所定の値未満の画素に対応づけられた前記重み画像の画素の重 み値を累積して第 1の累積ヒストグラムを抽出する第 1の累積ヒストグラム抽出ステップ と、
前記参照画像の低濃度領域の画素に対応づけられた前記入力濃淡画像の画素 に対し、濃度値が所定の値以上の画素に対応づけられた前記重み画像の画素の重 み値を累積して第 2の累積ヒストグラムを抽出する第 2の累積ヒストグラム抽出ステップ と、
前記第 1の累積ヒストグラムと前記第 2の累積ヒストグラムとを対応付けて加算してカロ 算累積ヒストグラムを求める累積ヒストグラム加算ステップと、
前記累積ヒストグラム加算ステップで求められた加算累積ヒストグラムの最小値を前 記参照画像と前記入力濃淡画像との距離値として入力濃淡画像の認識を行うパター ン照合処理
とを具備する方法をコンピュータに実行させるためのパターン認識プログラム。
[17] 前記参照画像は、非計算領域である第 3の濃度領域を含み、
前記第 1の累積ヒストグラム抽出ステップでは、前記第 3の濃度領域に含まれる画素 は前記第 1の累積ヒストグラムの抽出処理力 除外され、
前記第 2の累積ヒストグラム抽出ステップでは、前記第 3の濃度領域に含まれる画素 は前記第 2の累積ヒストグラムの抽出処理から除外される
請求の範囲 16に記載のパターン認識プログラム。
[18] 更に、元画像から部分領域画像を設定する領域設定ステップと、
前記部分領域画像を、参照画像と同じ大きさに拡大,縮小する濃淡画像拡大縮小 ステップと、
前記濃淡画像拡大縮小ステップで拡大 ·縮小された前記部分領域画像を、前記参 照画像と照合される入力濃淡画像に設定するステップ
とを具備する方法をコンピュータに実行させる請求の範囲 16に記載のパターン認 識プログラム。
PCT/JP2006/322731 2005-11-29 2006-11-15 パターン認識装置、パターン認識方法、およびパターン認識プログラム WO2007063705A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2007547892A JP4968075B2 (ja) 2005-11-29 2006-11-15 パターン認識装置、パターン認識方法、およびパターン認識プログラム
US12/093,407 US8014601B2 (en) 2005-11-29 2006-11-15 Pattern recognizing apparatus, pattern recognizing method and pattern recognizing program
DE602006019481T DE602006019481D1 (de) 2005-11-29 2006-11-15 Mustererkennungsvorrichtung, mustererkennungsverfahren und mustererkennungsprogramm
EP06832662A EP1956551B1 (en) 2005-11-29 2006-11-15 Pattern recognition apparatus, pattern recognition method, and pattern recognition program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2005344233 2005-11-29
JP2005-344233 2005-11-29

Publications (1)

Publication Number Publication Date
WO2007063705A1 true WO2007063705A1 (ja) 2007-06-07

Family

ID=38092040

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2006/322731 WO2007063705A1 (ja) 2005-11-29 2006-11-15 パターン認識装置、パターン認識方法、およびパターン認識プログラム

Country Status (5)

Country Link
US (1) US8014601B2 (ja)
EP (1) EP1956551B1 (ja)
JP (1) JP4968075B2 (ja)
DE (1) DE602006019481D1 (ja)
WO (1) WO2007063705A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010191593A (ja) * 2009-02-17 2010-09-02 Honda Motor Co Ltd 対象物の位置検出装置及び位置検出方法
JP2010191590A (ja) * 2009-02-17 2010-09-02 Honda Motor Co Ltd 対象物の位置検出装置及び位置検出方法
US9779062B2 (en) 2014-11-12 2017-10-03 Kabushiki Kaisha Toshiba Apparatus, method, and computer program product for computing occurrence probability of vector

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8675998B2 (en) * 2007-12-06 2014-03-18 Mitsubishi Electric Corporation Method and apparatus for high frequency component smoothing, and image display apparatus
US8155442B2 (en) * 2008-02-04 2012-04-10 The Neat Company, Inc. Method and apparatus for modifying the histogram of an image
US8144986B2 (en) * 2008-09-05 2012-03-27 The Neat Company, Inc. Method and apparatus for binarization threshold calculation
US9053562B1 (en) 2010-06-24 2015-06-09 Gregory S. Rabin Two dimensional to three dimensional moving image converter
CN102375987B (zh) * 2010-08-17 2014-04-02 国基电子(上海)有限公司 图像处理设备及图像特征向量提取与图像匹配方法
WO2013105381A1 (ja) * 2012-01-10 2013-07-18 コニカミノルタ株式会社 画像処理方法、画像処理装置および画像処理プログラム
US9804839B2 (en) 2012-12-28 2017-10-31 Intel Corporation Instruction for determining histograms
US9992021B1 (en) 2013-03-14 2018-06-05 GoTenna, Inc. System and method for private and point-to-point communication between computing devices
JP6108220B2 (ja) * 2013-03-26 2017-04-05 ブラザー工業株式会社 画像処理装置、画像処理プログラム
US10328855B2 (en) 2015-03-18 2019-06-25 Uber Technologies, Inc. Methods and systems for providing alerts to a connected vehicle driver and/or a passenger via condition detection and wireless communications
US9610893B2 (en) 2015-03-18 2017-04-04 Car1St Technologies, Llc Methods and systems for providing alerts to a driver of a vehicle via condition detection and wireless communications

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08287246A (ja) * 1995-04-12 1996-11-01 Kobe Steel Ltd 画像2値化処理装置
JP2000040153A (ja) * 1998-07-22 2000-02-08 Ricoh Co Ltd 画像処理方法、画像処理プログラムを記録した媒体及び画像処理装置
JP2001266143A (ja) * 2000-03-17 2001-09-28 Nippon Telegr & Teleph Corp <Ntt> 図形抽出方法
JP2002279422A (ja) * 2001-03-19 2002-09-27 Seiko Epson Corp テンプレートマッチ判定装置、テンプレートマッチ判定プログラムおよびテンプレートマッチ判定方法
JP2004180000A (ja) * 2002-11-27 2004-06-24 Kansai Tlo Kk 画像の2値化装置および方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2940317B2 (ja) * 1992-06-24 1999-08-25 三菱電機株式会社 画像処理装置
EP0811946A3 (en) * 1994-04-15 1998-01-14 Canon Kabushiki Kaisha Image pre-processor for character recognition system
JPH0877300A (ja) 1994-08-31 1996-03-22 Canon Inc 画像処理装置
US5835628A (en) * 1996-11-21 1998-11-10 Xerox Corporation Method and system for generating histograms from a scanned image
JP2001061065A (ja) * 1999-08-24 2001-03-06 Konica Corp 画像処理装置及び画像処理方法
JP4631199B2 (ja) * 2001-04-13 2011-02-16 ソニー株式会社 画像処理装置および画像処理方法、記録媒体、並びにプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08287246A (ja) * 1995-04-12 1996-11-01 Kobe Steel Ltd 画像2値化処理装置
JP2000040153A (ja) * 1998-07-22 2000-02-08 Ricoh Co Ltd 画像処理方法、画像処理プログラムを記録した媒体及び画像処理装置
JP2001266143A (ja) * 2000-03-17 2001-09-28 Nippon Telegr & Teleph Corp <Ntt> 図形抽出方法
JP2002279422A (ja) * 2001-03-19 2002-09-27 Seiko Epson Corp テンプレートマッチ判定装置、テンプレートマッチ判定プログラムおよびテンプレートマッチ判定方法
JP2004180000A (ja) * 2002-11-27 2004-06-24 Kansai Tlo Kk 画像の2値化装置および方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP1956551A4 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010191593A (ja) * 2009-02-17 2010-09-02 Honda Motor Co Ltd 対象物の位置検出装置及び位置検出方法
JP2010191590A (ja) * 2009-02-17 2010-09-02 Honda Motor Co Ltd 対象物の位置検出装置及び位置検出方法
US9779062B2 (en) 2014-11-12 2017-10-03 Kabushiki Kaisha Toshiba Apparatus, method, and computer program product for computing occurrence probability of vector

Also Published As

Publication number Publication date
EP1956551A4 (en) 2009-10-21
JPWO2007063705A1 (ja) 2009-05-07
US20090268964A1 (en) 2009-10-29
EP1956551A1 (en) 2008-08-13
DE602006019481D1 (de) 2011-02-17
US8014601B2 (en) 2011-09-06
JP4968075B2 (ja) 2012-07-04
EP1956551B1 (en) 2011-01-05

Similar Documents

Publication Publication Date Title
JP4968075B2 (ja) パターン認識装置、パターン認識方法、およびパターン認識プログラム
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
JP4744918B2 (ja) 顔検出方法および装置並びにプログラム
US8325998B2 (en) Multidirectional face detection method
JP6282045B2 (ja) 情報処理装置および方法、プログラム、記憶媒体
JP6268023B2 (ja) 文字認識装置およびその文字切り出し方法
JP4100885B2 (ja) 帳票認識装置、方法、プログラムおよび記憶媒体
JP2005327242A (ja) 特定被写体検出装置
JP2007102401A (ja) 顔向き特定方法、顔判別方法および装置並びにプログラム
CN113971644A (zh) 基于数据增强策略选择的图像识别方法及装置
JP2003216953A (ja) 画像から対象物を抽出する方法およびその装置
JP2006309402A (ja) 文字列認識方法、ナンバープレート認識方法、及び装置
CN110175257B (zh) 一种线稿图像匹配方法、电子设备、存储介质
JP2009259190A (ja) 文字認識プログラムおよび文字認識装置
JP3830350B2 (ja) カラー画像処理方法、カラー画像処理装置、プログラム、及び記録媒体
JP3150762B2 (ja) グラディエントベクトルの抽出方式及び文字認識用特徴抽出方式
KR101991461B1 (ko) 특징점의 벡터화를 이용한 문자인식 시스템 및 방법
JP4692151B2 (ja) 画像認識方法及び画像認識装置
JPH11175662A (ja) パターン認識方法および装置とパターン認識方法をコンピュータに実行させるためのプログラムを記録した記録媒体
JP2015225469A (ja) 画像処理装置、画像処理方法、及びプログラム
JP5145862B2 (ja) 画像処理プログラムおよび画像処理装置
CN112215783B (zh) 一种图像噪点识别方法、装置、存储介质及设备
Das et al. 4 A study of recent trends in content based image classification
JP2006235817A (ja) 文字認識装置、文字認識方法、及び文字認識プログラムの記録媒体
WO2014129016A1 (ja) 文字認識装置、文字認識方法及び記録媒体

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 12093407

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 2007547892

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 2006832662

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE