WO2015045394A1 - シンボル認識装置および車両用標識認識装置 - Google Patents

シンボル認識装置および車両用標識認識装置 Download PDF

Info

Publication number
WO2015045394A1
WO2015045394A1 PCT/JP2014/004918 JP2014004918W WO2015045394A1 WO 2015045394 A1 WO2015045394 A1 WO 2015045394A1 JP 2014004918 W JP2014004918 W JP 2014004918W WO 2015045394 A1 WO2015045394 A1 WO 2015045394A1
Authority
WO
WIPO (PCT)
Prior art keywords
run length
recognition target
image
determination unit
recognition
Prior art date
Application number
PCT/JP2014/004918
Other languages
English (en)
French (fr)
Inventor
小出 哲士
ホアン アイン トゥワン
真晴 山本
翼 三島
Original Assignee
国立大学法人広島大学
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 国立大学法人広島大学 filed Critical 国立大学法人広島大学
Publication of WO2015045394A1 publication Critical patent/WO2015045394A1/ja
Priority to US15/084,457 priority Critical patent/US9959473B2/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
    • G06V20/582Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads of traffic signs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/18086Extraction of features or characteristics of the image by performing operations within image blocks or by using histograms
    • G06V30/18095Summing image-intensity values; Projection and histogram analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/186Extraction of features or characteristics of the image by deriving mathematical or geometrical properties from the whole image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Definitions

  • the present invention relates to a device for recognizing symbols in an image, and more particularly to a symbol recognition device suitable for recognizing numbers contained in road speed signs.
  • the present invention also relates to a vehicular sign recognition device provided with such a symbol recognition device.
  • Non-Patent Document 1 Talking about road sign recognition, detection of road speed signs and number recognition. Conventionally, symbols such as letters, numbers, and symbols are recognized by performing pattern matching after thinning the image (see, for example, Non-Patent Document 1).
  • Image thinning is a software-oriented method, and it is necessary to repeatedly read images from the image memory. Therefore, it is difficult to implement this method in hardware such as an in-vehicle embedded system and perform real-time processing while the vehicle is running.
  • an object of the present invention is to provide a symbol recognition technique suitable for hardware processing. Another object of the present invention is to provide a vehicular sign recognition apparatus to which such a symbol recognition technique is applied.
  • a symbol recognition apparatus receives an image memory that stores a binarized image to be recognized, and an image of each partial area of the recognition target area in the binarized image.
  • a plurality of histogram calculation units for calculating the frequency distribution of pixels of a predetermined color in each line or each column and an image of each partial area of the recognition target area are input, and a predetermined length consisting of pixels of the predetermined color in the partial area
  • a plurality of run length determination units for determining whether or not the above-described lines or columns exist, and the plurality of pieces of pixel information of the partial areas read by scanning the binary image stored in the image memory
  • the histogram calculation unit and the control unit that inputs to the plurality of run length determination units, the calculation results of the plurality of histogram calculation units, and the determination of the plurality of run length determination units Based on the result, and a determination unit for determining symbols included in the binarized image.
  • the binarized image stored in the image memory is read out by the control unit, and an image of an arbitrary partial region of the binarized image is input to each histogram calculation unit and each run length determination unit, and each histogram
  • the calculation unit and each run length determination unit perform predetermined processing on each partial area independently and simultaneously in parallel.
  • the determination unit Symbols included in the binarized image are determined.
  • the symbols included in the binarized image can be recognized by the control unit only scanning the binarized image once.
  • the plurality of histogram calculation units divide the recognition target region into two parts in the left-right direction, first and second histogram calculation units to which an image of each partial region is input, and the recognition target region is divided into three in the vertical direction.
  • Third, fourth, and fifth histogram calculators to which images of each partial area are input;
  • a sixth histogram calculator to which an image of a partial area at the center in the horizontal direction of the recognition target area;
  • a seventh histogram calculation unit to which an image of a partial region at the center in the vertical direction of the recognition target region may be included.
  • the run length determination unit may be included.
  • the determination unit includes a maximum value of the histogram calculated by the first to fifth histogram calculation units, a minimum value of the histogram calculated by the sixth and seventh histogram calculation units, and the first to You may make it determine the symbol contained in the said binarized image based on the determination result of a 4th run length determination part.
  • the plurality of run length determination units include a fifth run length determination unit, and the fifth run length determination unit receives an image of a partial region in the center in the vertical direction of the recognition target region, and the partial region It is determined whether or not there are a predetermined number or more of black and white columns having a predetermined length or longer, and the determination unit takes into account the determination result of the fifth run length determination unit, and the recognition target It may be determined whether or not the symbol included in the region is the number “0”.
  • the plurality of run length determination units may include sixth and seventh run length determination units to which an image of each partial region obtained by dividing the recognition target region into two in the left-right direction, and the recognition target region in the vertical direction. And the eighth and ninth run length determination units to which the images of the upper and lower partial regions divided into three are input, and the determination unit determines the determination results of the sixth to ninth run length determination units In consideration of this, it may be determined whether or not the symbol included in the recognition target area is the number “0”.
  • the plurality of run-length determination units include sixth, seventh, and eighth run-length determination units to which images of partial regions obtained by dividing the recognition target region into three in the vertical direction are input.
  • the unit may determine whether or not the symbol included in the recognition target area is the number “8” in consideration of the determination results of the sixth to eighth run length determination units.
  • the symbol recognition apparatus may include a color ratio calculation unit that receives an image of the recognition target area and calculates a ratio of pixels of a predetermined color in the entire recognition target area, and the control unit includes the image
  • the pixel information of the partial area read by scanning the binarized image stored in the memory may be input to the color ratio calculation unit, and the determination unit may include the color ratio calculation unit.
  • a symbol included in the recognition target area may be determined in consideration of a calculation result.
  • the accuracy of symbol recognition is improved by taking into account the proportion of the predetermined color in the entire recognition target area.
  • the symbol recognition apparatus may simultaneously perform the recognition process on the recognition target area and each recognition target area in which the recognition target area is slightly shifted vertically and horizontally.
  • a vehicle sign recognition device detects a frame of a vehicle sign in the symbol recognition device and the binarized image stored in the image memory of the symbol recognition device.
  • a frame detection unit, and the determination unit of the symbol recognition device determines whether the binarized image is a vehicle sign image based on a detection result of the frame detection unit. .
  • the vehicle sign recognition apparatus may include a diagonal line determination unit that determines whether or not there is a diagonal line having a predetermined length or more composed of pixels of a predetermined color in an oblique partial region in the binarized image.
  • the determination unit may determine whether the binarized image is an image of any of the signs indicating prohibition in consideration of the determination result of the oblique line determination unit. Good.
  • the symbols included in the binarized image can be recognized at high speed and with high accuracy using hardware.
  • FIG. 1 is a configuration diagram of a main part of a symbol recognition apparatus according to a first embodiment of the present invention.
  • the figure which shows the example of the binarized image of recognition object The figure which shows the example of the partial area
  • the figure which shows the characteristic of the histogram of the image of each number from "0" to "8” The figure which shows the correspondence of the histogram of the image of the number "5", and each partial area
  • the block diagram of the principal part of the symbol recognition apparatus which concerns on the 2nd Embodiment of this invention.
  • region with the number "0" The figure which shows the characteristic of the run length in another several partial area
  • the figure which shows the feature of run length in some partial areas of number "8" The block diagram of the principal part of the symbol recognition apparatus which concerns on the 3rd Embodiment of this invention.
  • the figure which shows the example of the reference recognition object area, and the example of the recognition object area shifted up and down, right and left The block diagram of the principal part of the marker recognition apparatus for vehicles which concerns on the 4th Embodiment of this invention.
  • FIG. 1 shows the configuration of the main part of a symbol recognition apparatus according to the first embodiment of the present invention.
  • the symbol recognition apparatus 10 recognizes symbols included in a binary image having a predetermined size, and is particularly suitable for recognizing numbers included in road speed signs. .
  • the symbol recognition device 10 includes an image memory 12, a control unit 14, eleven feature quantity extraction units 16_1 to 16_11, and a determination unit 18.
  • Each of the feature quantity extraction units 16_1 to 16_11 includes a histogram calculation unit 161 and a run length determination unit 162.
  • the feature quantity extraction units 16_3 to 16_10 are not shown in FIG. 1, but the feature quantity extraction units 16_3 to 16_10 (not shown) may be referred to in the following description.
  • the image memory 12 is a memory that stores a binarized image to be recognized by the symbol recognition device 10.
  • the image memory 12 can be composed of a volatile memory such as SRAM (Static Random Access Memory) or DRAM (Dynamic Random Access Memory).
  • FIG. 2 shows an example of a binarized image to be recognized.
  • the image is obtained by binarizing a 640 ⁇ 480 pixel 8-bit grayscale original image taken in front of a camera attached to a car to obtain a road speed sign candidate region (hereinafter referred to as a “scan window”). Extracted.
  • the size of the scan window SW is about 20 ⁇ 20 pixels to 50 ⁇ 50 pixels.
  • the road speed sign is represented by a design in which a 2-digit number is enclosed in a circle.
  • the symbol recognition device 10 recognizes the first digit and the tenth digit included in the binarized image. That is, the symbol recognizing device 10 recognizes numbers included in each of two rectangular areas (two rectangular areas surrounded by a broken line in FIG. 2, hereinafter referred to as “recognition target areas”) at a substantially central portion of the scan window SW.
  • recognition target areas numbers included in each of two rectangular areas (two rectangular areas surrounded by a broken line in FIG. 2, hereinafter referred to as “recognition target areas”) at a substantially central portion of the scan window SW.
  • the pixel information can be read out in units of several pixels or in units of one pixel. More specifically, a coordinate range in the scan window is set in each partial area.
  • the control unit 18 detects that the coordinate data (x, y) has entered the coordinate range of each partial area during scanning of the binarized image stored in the image memory 12, and corresponds to the partial area.
  • the control signal ACT is output to the histogram calculation unit 161 and the run length determination unit 162 in each of the feature amount extraction units 16_1 to 16_11.
  • each histogram calculation unit 161 and each run length determination unit 162 fetches the pixel value Ixy and coordinate data (x, y) when the control signal ACT input to the histogram calculation unit 161 and the run length determination unit 162 are at the H level, and the control signal ACT is at the L level. In this case, the pixel value Ixy and the coordinate data (x, y) are not captured.
  • each histogram calculation unit 161 and each run length determination unit 162 perform a predetermined process on the input image simultaneously and independently from each other.
  • control unit 14 does not directly read the pixel value Ixy from the image memory, but the control unit 14 outputs a control signal for reading the pixel value to the image memory 12, and is read from the image memory 12 according to the control signal.
  • the pixel value Ixy may be directly supplied to the feature amount extraction units 16_1 to 16_11.
  • FIG. 3 shows an example of a partial area of the recognition target area processed by each of the feature quantity extraction units 16_1 to 16_11.
  • the images of the partial areas BL1 and BL2 obtained by dividing the recognition target area into two in the left-right direction, for example, equally divided into two, are input to the feature amount extraction units 16_1 and 16_2 and processed.
  • the images of the partial areas BL3, BL4, and BL5 obtained by dividing the recognition target area into three in the vertical direction, for example, equally divided into three, are input to the feature amount extraction units 16_3, 16_4, and 16_5 and processed.
  • the image of the partial region BL6 at the center in the left-right direction of the recognition target region is input to the feature amount extraction unit 16_6 and processed.
  • the image of the partial area BL7 in the center in the vertical direction of the recognition target area is input to the feature amount extraction unit 16_7 and processed.
  • the images of the partial areas BL8, BL9, BL10, and BL11 obtained by dividing the partial area at the center in the vertical direction of the recognition target area into four parts in the vertical and horizontal directions, for example, equally divided into four are input to the feature amount extraction units 16_8, 16_9, 16_10, and 16_11 To be processed.
  • the histogram calculation unit 161 receives an image of a partial area of the recognition target area, and calculates a frequency distribution of pixels of a predetermined color in each line or each column in the partial area.
  • the number is displayed in black on a white background, so the histogram calculation unit 161 calculates the frequency distribution of black pixels.
  • the number may be represented in white on a black background. In this case, the histogram calculation unit 161 calculates the frequency distribution of white pixels.
  • the histogram calculation unit 161 can basically be configured using an addition circuit and a comparator.
  • FIG. 4 shows the characteristics of the histogram of each numerical image from “0” to “8”.
  • the frequency distribution of black pixels in each line in the recognition target area is next to each number (the right side for the number “0” and the left side for other numbers), and the frequency of black pixels in each column in the recognition target area. The distribution is shown below each number.
  • the histogram has different characteristics for each number.
  • FIG. 5 shows the correspondence between the histogram of the number “5” image and the partial areas BL1 to BL7.
  • the histogram calculation unit 161 in the feature amount extraction units 16_1 and 16_2 calculates the maximum value of the histogram corresponding to the partial regions BL1 and BL2 in the histograms in the column direction of the numerical images, respectively. Output.
  • the histogram calculation units 161 in the feature amount extraction units 16_3 to 16_5 respectively output the maximum values of the histograms corresponding to the partial regions BL3 to BL5 among the histograms in the line direction of the numerical images.
  • FIG. 5 shows the correspondence between the histogram of the number “5” image and the partial areas BL1 to BL7.
  • the histogram calculation unit 161 in the feature amount extraction unit 16_6 outputs the minimum value of the histogram corresponding to the partial region BL6 in the histogram in the column direction of the numerical image.
  • the histogram calculation unit 161 in the feature amount extraction unit 16_7 outputs the minimum value of the histogram corresponding to the partial region BL7 in the histogram in the line direction of the number image.
  • the maximum value and the minimum value of the histogram can be defined as a ratio of the frequency of pixels of a predetermined color included in each line or each column to the width or height of the recognition target area. For example, in the case of a normal road speed sign, the predetermined color is black, and in the electric speed display road speed sign, the predetermined color is white.
  • the predetermined color may be white or black as appropriate. From the characteristics of the binarized image, the maximum value of the black pixel histogram corresponds to the minimum value of the white pixel histogram, and the maximum value of the white pixel histogram corresponds to the minimum value of the black pixel histogram. To do.
  • the maximum values of the histograms of the partial areas BL1 to BL5 and the minimum values of the histograms of the partial areas BL6 to BL7 have different characteristics for each number, and the slope of the number, positional deviation, and noise superposition It is hard to be influenced by such. For this reason, the maximum value and the minimum value of the histogram of each partial region can be effective feature amounts for recognizing symbols in the recognition target region.
  • the run length determination unit 162 receives an image of each partial area of the recognition target area, and determines whether or not there is a line or a column having a predetermined length or more composed of pixels of a predetermined color in the partial area. To do. As will be described later, since the number image has a feature in the continuity of pixels of a predetermined color in the line direction in a portion other than the line segment representing the number, the run length determination unit 162 has a continuity of pixels of the predetermined color in the line direction. Determine gender. In addition, due to the characteristics of the font design of numbers used for road speed signs, it is appropriate that the areas for which the continuity of pixels of a predetermined color is to be determined are the partial areas BL8 to BL11.
  • the run length determination unit 162 in the feature quantity extraction units 16_8 to 16_11 determines whether or not a white or black line having a predetermined length or more exists in each of the partial regions BL8 to BL11.
  • the predetermined length is, for example, an arbitrary length such as 90% or 95% with respect to the width of each of the partial regions BL8 to BL11.
  • the width of each of the partial areas BL8 to BL11 can be specified as a predetermined length.
  • the run length determination unit 162 determines whether or not all white lines or all black lines exist in the partial areas BL8 to BL11. It will be.
  • the run length calculation unit 162 determines the continuity of white pixels.
  • the number may be represented in white on a black background. In this case, the run length determination unit 162 determines the continuity of black pixels.
  • the run length determination unit 162 can be configured as a combinational circuit having an AND circuit, an OR circuit, and an adder.
  • FIG. 6 shows the characteristics of the run length of each numerical image from 0 to 8.
  • white lines having a predetermined length or longer exist in the partial areas BL9 and BL11
  • white lines having a predetermined length or longer exist in the partial areas BL8 and BL11
  • the number “3” the partial area BL8.
  • BL10 have a white line of a predetermined length or more
  • the number “4” has a white line of a predetermined length or more in the partial area BL8
  • the number “5” has a white line of a predetermined length or more in the partial areas BL9 and BL10.
  • a white line having a predetermined length or longer exists in the partial region BL9
  • a white line having a predetermined length or longer exists in the partial region BL8, and in the numbers “0” and “8”.
  • the pattern of the presence or absence of a white line having a predetermined length or more in the partial areas BL8 to BL11 is different for each number.
  • the numbers “0” and “8” have the same pattern for the presence or absence of a white line of a predetermined length or more, the number “0” is not used at the tens place in the road speed sign, No digits other than the number “0” are used. Therefore, the numbers “0” and “8” can be distinguished according to the position of the recognition target region in the scan window.
  • the determination unit 18 comprehensively determines numbers together with the histogram feature amounts of the partial regions BL1 to BL7.
  • the determination unit 18 recognizes the recognition target region based on the calculation result of the histogram calculation unit 161 in the feature amount extraction units 16_1 to 16_7 and the determination result of the run length determination unit 162 in the feature amount extraction units 16_8 to 16_11.
  • the number contained in is determined.
  • the determination unit 18 determines a number according to the following determination condition. Note that, under the following determination conditions, Hmax1 to Hmax5 are the maximum values of the histogram output from the histogram calculation unit 161 in the feature quantity extraction units 16_1 to 16_5, and Hmin6 and Hmin7 are histograms in the feature quantity extraction units 16_6 and 16_7.
  • RL1 to RL4 are determination results output from the run length determination unit 162 in the feature quantity extraction units 16_8 to 16_11. RL1 to RL4 are “1” when a white line longer than a predetermined length is detected, “0” when no white line is detected, and “*” represents don't care.
  • the determination unit 18 may determine that the binarized image to be recognized is not a road speed sign image when all the above conditions are not satisfied. Furthermore, in the road speed sign, only the number “0” appears in the recognition target area on the right side in the scan window (see FIG. 2). Therefore, the control unit 14 first scans the right recognition target area in the scan window, and the determination unit 18 determines whether the recognition target binary is a symbol “0” based on whether or not the symbol included in the recognition target area is the number “0”. It may be determined whether the converted image is an image of a road speed sign. When the symbol included in the right recognition target area in the scan window is the number “0”, the control unit 14 next scans the left recognition target area in the scan window. You may make it recognize the tens digit.
  • symbol recognition included in the binarized image stored in the image memory 12 can be performed at high speed and with high accuracy using hardware.
  • the speed may be represented by a three-digit number.
  • three recognition target areas may be set in the scan window so as to match each three-digit number.
  • the hundreds digit in the road speed sign cannot be other than “1”. Therefore, the control unit 14 first scans the leftmost recognition target area in the scan window, and the determination unit 18 determines whether the recognition target binary is a symbol “1” depending on whether or not the symbol included in the recognition target area is the number “1”. It may be determined whether the converted image is an image of a road speed sign. When the symbol included in the leftmost target area in the scan window is the number “1”, the control unit 14 next scans the middle or right end recognition target in the scan window, and the determination unit 18 You may make it recognize the number of the tenth place or the first place.
  • the partial areas for determining the histogram and the run length are not limited to the above-described partial areas BL1 to BL11, and include partial areas that reflect the characteristics of each symbol. It is desirable to adopt.
  • the run length determination unit 162 in the feature quantity extraction units 16_1 to 16_7 and the histogram calculation unit 161 in the feature quantity extraction units 16_8 to 16_11 are not actually used, the components that are not used are omitted if recognition is limited to numbers. May be. Thereby, the circuit scale can be reduced. Further, the feature quantity extraction units 16_1 to 16_11 can share data and resources by optimizing, and the circuit scale can be reduced.
  • an appropriate number of feature quantity extraction units 16 including a histogram calculation unit 161 and a run length determination unit 162 are arranged, and the control unit 14 controls the histogram calculation unit 161 in each feature quantity extraction unit 16. Further, by controlling the input of pixel information to the run length determination unit 162, the circuit scale increases, but versatility that can cope with recognition of various symbols other than numbers can be provided.
  • the entire circuit is obtained by sharing the feature amount extraction unit 16 so that one feature amount extraction unit 16 processes the plurality of partial regions.
  • the scale can be reduced.
  • the circuit scale per feature quantity extraction unit 16 is very small, the influence of the increase in circuit scale is considered to be limited even if a large number of feature quantity extraction units 16 are arranged. Therefore, the feature amount extraction unit 16 may be shared when the circuit scale becomes a problem.
  • FIG. 7 shows the configuration of the main part of a symbol recognition apparatus according to the second embodiment of the present invention.
  • the symbol recognition apparatus 10 according to the present embodiment adds a color ratio calculation unit 17 to the symbol recognition apparatus 10 according to the first embodiment, and further includes a run length determination unit 162 in the feature amount extraction units 16_1 to 16_5 and 16_7. Used to improve the recognition accuracy of numbers.
  • description of the same matters as in the first embodiment will be omitted, and points different from those in the first embodiment will be mainly described.
  • the color ratio calculation unit 17 receives the image of the recognition target area directly from the image memory 12 or indirectly through the control unit 14 and calculates the ratio of pixels of a predetermined color in the recognition target area.
  • the predetermined color is black in the case of a normal road speed sign, and is white in the case of an electric display road speed sign.
  • the ratio of pixels of a predetermined color is, for example, 66% or less for the number “0”, 40% or less for the number “1”, 46% or less for the number “2”, 43% or less for the number “3”, and the number “4”. Is 50% or less, the number “5” is 54% or less, the number “6” is 48% or less, the number “7” is 44% or less, and the number “8” is 61% or less.
  • the control unit 14 outputs a control signal ACT and controls input of pixel information to the color ratio calculation unit 17.
  • the color ratio calculation unit 17 takes in the pixel value Ixy and coordinate data (x, y) when the control signal ACT input to the H level is H level, and captures the pixel value Ixy and the coordinate data (x, y) when the control signal ACT is L level. The coordinate data (x, y) is not captured.
  • the control unit 14 scans the binarized image stored in the image memory 12 once, and images of arbitrary partial areas of the binarized image are extracted from the feature amount extracting units 16_1 to 16_11 and the color ratio calculating unit 17. Can be entered. Then, each of the feature amount extraction units 16_1 to 16_11 and the color ratio calculation unit 17 performs predetermined processing on the input image independently and simultaneously in parallel.
  • the determining unit 18 determines the number included in the recognition target region by adding the calculation result of the color ratio calculating unit 17 to the determination condition of each number. In this way, the numerical recognition accuracy is improved by taking into account the calculation result of the color ratio calculation unit 17.
  • the determination unit 18 can determine that the symbol included in the recognition target area is not a number when the determination condition for each number and the calculation result of the color ratio calculation unit 17 contradict each other. It is also possible to determine that the target binarized image is not a road traffic sign image.
  • FIG. 8 shows the characteristics of the run length in the partial area with the number “0”.
  • the black and white columns of a predetermined length or more are identified from the characteristics of the font design of the number “0”.
  • the run length determination unit 162 in the feature amount extraction unit 16_7 to which the image of the partial area BL7 is input determines whether or not a predetermined number or more of black and white columns having a predetermined length or more exist in the partial area BL7.
  • the predetermined length is an arbitrary length such as 90% or 95% with respect to the height of the partial region BL7, for example.
  • the height of the partial area BL7 can also be specified as a predetermined length.
  • the run length determination unit 162 determines whether or not there are a predetermined number or more of all-black columns and all-white columns in the partial region BL7. judge.
  • the predetermined number may be an integer of 1 or more, and can be changed according to the size of the scan window.
  • the determination unit 18 determines that the number included in the recognition target region is “0” by adding the determination result of the run length determination unit 162 in the feature amount extraction unit 16_7 to the determination condition of the number “0”. can do. Thereby, the recognition accuracy of the number “0” is improved.
  • FIG. 9 shows the characteristics of run lengths in several other partial areas with the number “0”.
  • the partial areas BL1 to BL3 and BL5 have a characteristic of the font design of the number “0”.
  • the run length determination unit 162 in the feature amount extraction units 16_1 and 16_2 to which the images of the partial areas BL1 and BL2 are input has columns of a predetermined length or more composed of pixels of a predetermined color in the partial areas BL1 and BL2, respectively.
  • the run length determination unit 162 in the feature amount extraction units 16_3 and 16_5 to which the images of the partial areas BL3 and BL5 are input is equal to or longer than a predetermined length composed of pixels of a predetermined color in the partial areas BL3 and BL5, respectively. It is determined whether or not a line exists.
  • the predetermined length is, for example, half the height of the partial region for the partial regions BL1 and BL2, and half the width of the partial region for the partial regions BL3 and BL5.
  • the determination unit 18 can determine that the number included in the recognition target region is “0” by considering the determination results of the run length determination unit 162 in the feature amount extraction units 16_1 to 16_3 and 16_5. Thereby, the recognition accuracy of the number “0” is further improved.
  • FIG. 10 shows the characteristics of run length in some partial areas of the number “8”.
  • the run length determination unit 162 in the feature amount extraction units 16_3 to 16_5 to which the images of the partial areas BL3 to BL5 are input has lines of a predetermined length or more composed of pixels of a predetermined color in the partial areas BL3 to BL5, respectively. It is determined whether or not.
  • the predetermined length is, for example, half of each width of the partial regions BL3 to BL5.
  • the determination unit 18 adds the determination result of the run length determination unit 162 in the feature amount extraction units 16_3 to 16_5 to the determination condition of the number “8”, and the number included in the recognition target region is “8”. Can be determined. Thereby, the recognition accuracy of the number “8” is improved. Note that the determination result of the run length determination unit 162 in the feature amount extraction units 16_3 and 16_5 can be used in common for the determination processing of the numbers “0” and “8” in the determination unit 18.
  • FIG. 11 shows the configuration of the main part of a symbol recognition apparatus according to the third embodiment of the present invention.
  • the symbol recognition device 10 according to the present embodiment is obtained by adding feature quantity extraction units 16_1U to 16_11U, 16_1D to 16_11D, 16_1L to 16_11L, and 16_1R to 16_11R to the symbol recognition device 10 according to the first embodiment.
  • feature quantity extraction units 16_1U to 16_11U, 16_1D to 16_11D, 16_1L to 16_11L, and 16_1R to 16_11R to the symbol recognition device 10 according to the first embodiment.
  • the symbol recognition apparatus 10 simultaneously performs a recognition process on a reference recognition target region located substantially in the center of the scan window and each recognition target region slightly shifted vertically and horizontally around the reference recognition target region. I do.
  • FIG. 12 shows an example of a reference recognition target area and an example of a recognition target area shifted up and down and left and right.
  • the images of the partial areas of the reference recognition target area NW are input to the feature amount extraction units 16_1 to 16_11.
  • the images of the partial areas of the recognition target area NW shifted upward are input to the feature amount extraction units 16_1U to 16_11U.
  • the images of the partial areas of the recognition target area NW shifted downward are input to the feature amount extraction units 16_1D to 16_11D.
  • the images of the partial areas of the recognition target area NW shifted to the left are input to the feature amount extraction units 16_1L to 16_11L.
  • the images of the partial areas of the recognition target area NW shifted to the right are input to the feature amount extraction units 16_1R to 16_11R.
  • the feature quantity extraction units 16_1U to 16_11U, 16_1D to 16_11D, 16_1L to 16_11L, and 16_1R to 16_11R are elements having the same configuration as the feature quantity extraction units 16_1 to 16_11, and input images are input to the feature quantity extraction units 16_1 to 16_11. It is only different from the input image.
  • the shift amount of the recognition target area is, for example, 1 pixel when one side of the scan window is 20 to 29 pixels, 2 pixels when one side of the scan window is 30 to 39 pixels, and 1 side of the scan window. In the case of 40 to 50 pixels, it can be appropriately changed according to the size of the scan window, such as 3 pixels.
  • the control unit 14 outputs the control signal ACT, and the histogram calculation unit 161 and the run length determination unit 162 in each of the feature amount extraction units 16_1 to 16_11, 16_1U to 16_11U, 16_1D to 16_11D, 16_1L to 16_11L, and 16_1R to 16_11R. Controls the input of pixel information to each. For example, each histogram calculation unit 161 and each run length determination unit 162 fetches the pixel value Ixy and coordinate data (x, y) when the control signal ACT input to the histogram calculation unit 161 and the run length determination unit 162 are at the H level, and the control signal ACT is at the L level.
  • the control unit 14 scans the binarized image stored in the image memory 12 once, and the image of an arbitrary partial area of the binarized image is transferred to each histogram calculation unit 161 and each run length determination unit 162. Can be entered.
  • Each histogram calculation unit 161 and each run length determination unit 162 perform a predetermined process on the input image simultaneously and independently from each other.
  • the determination unit 18 determines the numbers included in each recognition target area based on the outputs of the feature amount extraction units 16_1 to 16_11, 16_1U to 16_11U, 16_1D to 16_11D, 16_1L to 16_11L, and 16_1R to 16_11R.
  • the determination unit 18 can determine the symbol recognition result by majority decision of the recognition result of each recognition target region.
  • symbols included in the binarized image can be correctly recognized even when the recognition target is not properly captured in the scan window.
  • the recognition target object is correctly captured in the scan window by adding the color ratio calculation unit 17 to which the images of the recognition target regions shifted in the vertical and horizontal directions are input. Even if it is not, it is possible to correctly recognize the symbols included in the binarized image.
  • a road speed sign represented by a design in which a two-digit number is surrounded by a circle frame is captured in the scan window SW together with the circle frame.
  • the symbol recognition apparatus 10 according to the first to third embodiments performs image analysis by dividing the recognition target region into several partial regions, with the substantially central portion of such a scan window SW as a recognition target region, The scan window SW, that is, the symbol included in the binarized image is recognized.
  • the area around the recognition target area includes a circle frame of road speed signs.
  • the circle frame can be detected by the above-mentioned method, and it can be determined from the detection result whether the scan window SW, that is, the binarized image is an image of a road speed sign. That is, the above-described symbol recognition device 10 can be expanded to constitute a vehicle sign recognition device.
  • FIG. 13 shows the configuration of the main part of the vehicle sign recognition apparatus according to the fourth embodiment of the present invention.
  • the vehicle sign recognition apparatus 100 according to the present embodiment is obtained by adding a frame detection unit 20 and an oblique line determination unit 30 to the symbol recognition apparatus 10 according to the first embodiment.
  • description of the same matters as in the first embodiment will be omitted, and points different from those in the first embodiment will be mainly described.
  • the frame detection unit 20 detects the frame of the vehicle sign in the binarized image stored in the image memory 12.
  • Image information is input to the frame detection unit 20 directly from the image memory 12 or indirectly through the control unit 14.
  • the frame detection unit 20 has a predetermined number of lines, columns, or diagonal lines having pixels of a predetermined color or longer, which are composed of pixels of a predetermined color in some partial areas of the binarized image. It can be determined whether or not it exists, and the frame of the vehicle sign can be detected from the determination result.
  • the predetermined color is black in the case of a normal vehicle sign, and white in the case of an electric display sign.
  • FIG. 14 shows an example of a partial area of the binarized image processed by the frame detection unit 20.
  • the frame detection unit 20 has a predetermined number or more of lines, columns, or diagonal lines of pixels of a predetermined color in each of the vertical, horizontal, and diagonal partial areas BL21 to BL28 in the scan window SW. It is determined whether or not to do. Specifically, the frame detection unit 20 determines whether or not there are a predetermined number or more columns of pixels having a predetermined color in the partial areas BL21 and BL23, and the predetermined colors of the partial areas BL22 and BL24.
  • the predetermined length is an arbitrary length such as 90% or 95% with respect to the length in the longitudinal direction of each partial region.
  • the predetermined number is an arbitrary number such as one.
  • the frame detection unit 20 determines that a predetermined number or more of lines, columns, or diagonal lines having a predetermined length or more of pixels of a predetermined color exist in all of the partial areas BL21 to BL28. It is determined that there is a circle frame used for a sign.
  • the frame of the vehicle sign detected by the frame detection unit 20 is not limited to a circular frame.
  • the partial area to be processed by the frame detection unit 20 it is possible to correspond to detection of a diamond frame used as a warning sign, an inverted triangle frame used as a slow sign, a stop sign, or the like. it can.
  • the oblique line determination unit 30 determines whether or not such an oblique line exists in the binarized image stored in the image memory 12. Specifically, the oblique line determination unit 30 determines whether or not there is an oblique line having a predetermined length or more, which is composed of pixels of a predetermined color, in an oblique partial area in the binarized image stored in the image memory 12. Image information is input to the oblique line determination unit 30 directly from the image memory 12 or indirectly through the control unit 14.
  • the predetermined color is black in the case of a normal vehicle sign, and white in the case of an electric display sign.
  • FIG. 15 shows examples of partial regions of the binarized image processed by the oblique line determination unit 30 and some examples of signs indicating prohibition.
  • the oblique line determination unit 30 determines whether or not there is an oblique line having a predetermined length or more made of pixels of a predetermined color in the oblique rectangular partial region BL29 in the scan window SW.
  • the control unit 14 outputs a control signal ACT to control input of pixel information to the frame detection unit 20 and the oblique line determination unit 30.
  • the frame detection unit 20 and the oblique line determination unit 30 take in the pixel value Ixy and coordinate data (x, y) when the control signal ACT input to the frame detection unit 20 and the oblique line determination unit 30 are at the H level, and when the control signal ACT is at the L level. Pixel value Ixy and coordinate data (x, y) are not captured.
  • control unit 14 scans the binarized image stored in the image memory 12 once, and the image of an arbitrary partial area of the binarized image is extracted from the feature amount extracting units 16_1 to 16_11, the frame detecting unit 20, And can be input to the oblique line determination unit 30. Then, each of the feature amount extraction units 16_1 to 16_11, the frame detection unit 20, and the oblique line determination unit 30 performs predetermined processing on the input image independently and simultaneously in parallel.
  • the determination unit 18 receives the outputs of the feature amount extraction units 16_1 to 16_11, the frame detection unit 20, and the oblique line determination unit 30, and determines whether or not the binarized image stored in the image memory 12 is a vehicle sign. If it is a vehicle sign, it is a prohibited sign, if it is a prohibited sign, what kind of prohibited sign it is, and if it is a speed sign instead of a prohibited sign, its speed limit Recognize First, based on the detection result of the frame detection unit 20, the determination unit 18 determines that the binarized image to be recognized is an image of the vehicle sign when the binarized image does not include the frame of the vehicle sign. Judge that there is no.
  • the determination unit 18 determines that the binarized image includes a diagonal line indicating prohibition based on the determination result of the diagonal line determination unit 30. It is determined that the binarized image to be recognized is a prohibition sign image. Further, when the frame detection unit 20 detects the circle frame of the road speed sign and the diagonal line determination unit 30 determines that there is no diagonal line representing prohibition in the binarized image, the determination unit 18 performs binary processing. The symbols included in the digitized image are recognized as numbers representing the speed limit.
  • the determination unit 18 determines that the binarized image to be recognized is a prohibition sign image
  • the determination unit 18 further outputs the output of the feature amount extraction units 16_1 to 16_11, that is, the histogram and the run length of each partial region of the recognition target region.
  • the type of prohibition sign can also be determined based on the above.
  • a feature amount extraction unit to which pixel information of a partial area for determining the type of the prohibited sign is input is provided separately, and the determination unit 18 is based on the output of the feature amount extraction unit.
  • the type of prohibition sign may be determined.
  • the vehicle sign recognition apparatus 100 is suitable for mounting on hardware such as an FPGA (Field Programmable Gate Array).
  • FPGA Field Programmable Gate Array
  • a vehicle sign recognition device similar to the above can be configured by adding the frame detection unit 20 and the oblique line determination unit 30.

Landscapes

  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Optimization (AREA)
  • Algebra (AREA)
  • Image Analysis (AREA)
  • Traffic Control Systems (AREA)
  • Character Discrimination (AREA)

Abstract

 シンボル認識装置(10)は、認識対象の2値化画像を格納する画像メモリ(12)と、2値化画像における認識対象領域の各部分領域の画像が入力され、該部分領域において各ラインまたは各列の所定色の画素の頻度分布を算出する複数のヒストグラム算出部(161)と、認識対象領域の各部分領域の画像が入力され、該部分領域において所定色の画素からなる所定長以上のラインまたは列が存在するか否かを判定する複数のランレングス判定部(162)と、画像メモリに格納されている2値化画像を走査して読み出した部分領域の画素情報を複数のヒストグラム算出部および複数のランレングス判定部へ入力する制御部(14)と、複数のヒストグラム算出部の算出結果および複数のランレングス判定部の判定結果に基づいて、2値化画像に含まれるシンボルを判定する判定部(18)とを備える。

Description

シンボル認識装置および車両用標識認識装置
 本発明は、画像中のシンボルを認識する装置に関し、特に、道路速度標識に含まれる数字の認識に好適なシンボル認識装置に関する。また、本発明は、そのようなシンボル認識装置を備えた車両用標識認識装置に関する。
 近年、自動車普及台数の増加により交通事故件数の増加が深刻化している。交通事故の主な原因として、発見の遅れ、判断ミス、操作ミスなどの運転者によるものがある。交通事故を未然に防ぐためには、自動車で判断を行い、運転者の操作をアシストすることで、運転者の操作ミスや判断ミスを防ぐことができる。そのような自動車での判断を可能にするには、自動車走行中に処理できる程度のリアルタイム性で白線認識、歩行者認識、車両認識、道路標識認識などを一度に行う必要がある。
 道路標識認識について言えば、道路速度標識の検出および数字認識が挙げられる。従来、画像に細線化処理を施してからパターンマッチングを行うことで文字、数字、記号などのシンボルを認識している(例えば、非特許文献1を参照)。
FRANK Y. SHIH, "IMAGE PROCESSING AND PATTERN RECOGNITION - Fundamentals and Techniques -", John Wiley & Sons, Inc., 2010, pp.233-253
 画像の細線化処理はソフトウェア向けの手法であり、画像メモリから画像を繰り返し読み出す必要がある。したがって、この手法を車載組込システムなどのハードウェアに実装して自動車走行中にリアルタイム処理を行うことは困難である。
 上記問題に鑑み、本発明は、ハードウェア処理に適したシンボル認識手法を提供することを目的とする。また、本発明は、そのようなシンボル認識手法を応用した車両用標識認識装置を提供することを目的とする。
 本発明の一局面に従ったシンボル認識装置は、認識対象の2値化画像を格納する画像メモリと、前記2値化画像における認識対象領域の各部分領域の画像が入力され、該部分領域において各ラインまたは各列の所定色の画素の頻度分布を算出する複数のヒストグラム算出部と、前記認識対象領域の各部分領域の画像が入力され、該部分領域において前記所定色の画素からなる所定長以上のラインまたは列が存在するか否かを判定する複数のランレングス判定部と、前記画像メモリに格納されている前記2値化画像を走査して読み出した前記部分領域の画素情報を前記複数のヒストグラム算出部および前記複数のランレングス判定部へ入力する制御部と、前記複数のヒストグラム算出部の算出結果および前記複数のランレングス判定部の判定結果に基づいて、前記2値化画像に含まれるシンボルを判定する判定部とを備えている。
 これによると、画像メモリに格納された2値化画像が制御部によって読み出され、2値化画像の任意の部分領域の画像が各ヒストグラム算出部および各ランレングス判定部へ入力され、各ヒストグラム算出部および各ランレングス判定部によって、各部分領域に対して所定の処理が互いに独立に同時並行的に行われ、各ヒストグラム算出部および各ランレングス判定部の出力結果に基づいて、判定部によって、2値化画像に含まれるシンボルが判定される。これにより、制御部が2値化画像を一度走査するだけで2値化画像に含まれるシンボルを認識することができる。
 前記複数のヒストグラム算出部が、前記認識対象領域を左右方向に2分割した各部分領域の画像が入力される第1および第2のヒストグラム算出部と、前記認識対象領域を上下方向に3分割した各部分領域の画像が入力される第3、第4、および第5のヒストグラム算出部と、前記認識対象領域の左右方向中央の部分領域の画像が入力される第6のヒストグラム算出部と、前記認識対象領域の上下方向中央の部分領域の画像が入力される第7のヒストグラム算出部とを含んでいてもよい。また、前記複数のランレングス判定部が、前記認識対象領域の上下方向中央の部分領域を上下左右に4分割した各部分領域の画像が入力される第1、第2、第3、および第4のランレングス判定部を含んでいてもよい。そして、前記判定部が、前記第1から第5のヒストグラム算出部によって算出されたヒストグラムの最大値、前記第6および第7のヒストグラム算出部によって算出されたヒストグラムの最小値、および前記第1から第4のランレングス判定部の判定結果に基づいて、前記2値化画像に含まれるシンボルを判定するようにしてもよい。
 これによると、数字、特に道路速度標識に含まれる数字を高速かつ高精度に認識することができる。
 前記複数のランレングス判定部が、第5のランレングス判定部を含み、前記第5のランレングス判定部が、前記認識対象領域の上下方向中央の部分領域の画像が入力され、該部分領域において所定長以上の黒および白の各列が所定数以上存在するか否かを判定するものであり、前記判定部が、前記第5のランレングス判定部の判定結果を加味して、前記認識対象領域に含まれるシンボルが数字「0」であるか否かを判定するものであってもよい。
 これによると、数字「0」の認識精度が向上する。
 さらに、前記複数のランレングス判定部が、前記認識対象領域を左右方向に2分割した各部分領域の画像が入力される第6および第7のランレングス判定部と、前記認識対象領域を上下方向に3分割した上および下の各部分領域の画像が入力される第8および第9のランレングス判定部とを含み、前記判定部が、前記第6から第9のランレングス判定部の判定結果を加味して、前記認識対象領域に含まれるシンボルが数字「0」であるか否かを判定するものであってもよい。
 これによると、数字「0」の認識精度がさらに向上する。
 あるいは、前記複数のランレングス判定部が、前記認識対象領域を上下方向に3分割した各部分領域の画像が入力される第6、第7、および第8のランレングス判定部を含み、前記判定部が、前記第6から第8のランレングス判定部の判定結果を加味して、前記認識対象領域に含まれるシンボルが数字「8」であるか否かを判定するものであってもよい。
 これによると、数字「8」の認識精度が向上する。
 前記シンボル認識装置は、前記認識対象領域の画像が入力され、前記認識対象領域の全体における所定色の画素の割合を算出する色割合算出部を備えていてもよく、前記制御部が、前記画像メモリに格納されている前記2値化画像を走査して読み出した前記部分領域の画素情報を前記色割合算出部へ入力するものであってもよく、前記判定部が、前記色割合算出部の算出結果を加味して、前記認識対象領域に含まれるシンボルを判定するものであってもよい。
 これによると、認識対象領域の全体における所定色の割合を加味することでシンボルの認識精度が向上する。
 前記シンボル認識装置は、前記認識対象領域および前記認識対象領域を上下左右に僅かずつずらした各認識対象領域について同時並行的に認識処理を行ってもよい。
 これによると、2値化画像においてシンボルが所定位置からずれていても2値化画像に含まれるシンボルを正しく認識することができる。
 また、本発明の別の局面に従った車両用標識認識装置は、前記シンボル認識装置と、前記シンボル認識装置の前記画像メモリに格納された前記2値化画像において車両用標識の枠を検出する枠検出部とを備え、前記シンボル認識装置の前記判定部が、前記枠検出部の検出結果に基づいて、前記2値化画像が車両用標識の画像であるか否かを判定するものである。
 これによると、画像メモリに格納された2値化画像について車両用標識の判定および制限速度の認識を行うことができる。
 さらに、前記車両用標識認識装置は、前記2値化画像における斜めの部分領域において所定色の画素からなる所定長以上の斜め線が存在するか否かを判定する斜線判定部を備えていてもよく、前記判定部が、前記斜線判定部の判定結果を加味して、前記2値化画像が禁止を表す標識のうちのいずれの種類の標識の画像であるかを判定するものであってもよい。
 これによると、画像メモリに格納された2値化画像が禁止を表す標識であるか否かを判定し、さらには禁止を表す標識の種類を認識することができる。
 本発明によると、2値化画像に含まれるシンボル認識をハードウェアを用いて高速かつ高精度に行うことができる。また、自動車走行中にリアルタイムで車両用標識の認識処理を行うことができる低価格の車載組込システムを実現することができる。
本発明の第1の実施形態に係るシンボル認識装置の主要部の構成図 認識対象の2値化画像の例を示す図 各特徴量抽出部で処理される認識対象領域の部分領域の例を示す図 「0」から「8」までの各数字の画像のヒストグラムの特徴を示す図 数字「5」の画像のヒストグラムと各部分領域との対応関係を示す図 「0」から「8」までの各数字の画像のランレングスの特徴を示す図 本発明の第2の実施形態に係るシンボル認識装置の主要部の構成図 数字「0」のある部分領域におけるランレングスの特徴を示す図 数字「0」の別のいくつかの部分領域におけるランレングスの特徴を示す図 数字「8」のいくつかの部分領域におけるランレングスの特徴を示す図 本発明の第3の実施形態に係るシンボル認識装置の主要部の構成図 基準の認識対象領域の例および上下左右にずらした認識対象領域の例を示す図 本発明の第4の実施形態に係る車両用標識認識装置の主要部の構成図 枠検出部で処理される2値画像の部分領域の例を示す図 斜線判定部で処理される2値化画像の部分領域の例および禁止を表す標識のいくつかの例を示す図
 以下、図面を参照しながら本発明を実施するための形態について説明する。なお、本発明は、以下の実施形態に限定されるものではない。
 ≪第1の実施形態≫
 図1は、本発明の第1の実施形態に係るシンボル認識装置の主要部の構成を示す。本実施形態に係るシンボル認識装置10は、所定の大きさの2値化画像に含まれるシンボルを認識するものであり、特に、道路速度標識に含まれる数字を認識するのに好適なものである。
 シンボル認識装置10は、画像メモリ12と、制御部14と、11個の特徴量抽出部16_1~16_11と、判定部18とを備えている。また、各特徴量抽出部16_1~16_11は、ヒストグラム算出部161と、ランレングス判定部162とを備えている。なお、便宜上、図1において特徴量抽出部16_3~16_10の図示を省略しているが、以下の説明において、これら図示しない特徴量抽出部16_3~16_10を参照することがある。
 画像メモリ12は、シンボル認識装置10の認識対象となる2値化画像を格納するメモリである。画像メモリ12は、SRAM(Static Random Access Memory)やDRAM(Dynamic Random Access Memory)などの揮発性メモリで構成することができる。
 図2は、認識対象の2値化画像の例を示す。当該画像は、自動車に取り付けたカメラで前方を撮影した640×480ピクセルの8ビットグレースケールの原画像を2値化処理し、道路速度標識の候補領域(以下、「スキャンウィンドウ」と称する)を抽出したものである。スキャンウィンドウSWのサイズは、20×20ピクセルから50×50ピクセル程度である。
 図2に示したように、道路速度標識は、2桁の数字を円枠で囲んだデザインで表される。シンボル認識装置10は、当該2値化画像に含まれる一の位の数字および十の位の数字をそれぞれ認識する。すなわち、シンボル認識装置10は、スキャンウィンドウSWの略中央部分の2つの矩形領域(図2において破線で囲んだ2つの矩形領域、以下「認識対象領域」と称する)のそれぞれに含まれる数字を認識する。なお、グレースケールの原画像を2値化処理してスキャンウィンドウを抽出する技術については、本願発明者らによる特願2012-285669の明細書に詳しく記載されている。
 図1へ戻り、制御部14は、画像メモリ12に格納されている2値化画像を走査して読み出した部分領域の画素情報、すなわち、画素値Ixy={0,1}およびその画素の座標を表す座標データ(x,y)を各特徴量抽出部16_1~16_11におけるヒストグラム算出部161およびランレングス判定部162へ入力する。画素情報の読み出しは、数ピクセルまとまったワード単位や1ピクセル単位で行うことができる。より詳細には、各部分領域にはスキャンウィンドウにおける座標範囲が設定されている。制御部18は、画像メモリ12に格納されている2値化画像の走査中に座標データ(x,y)が各部分領域の座標範囲に入ったことを検出して、その部分領域に対応する各特徴量抽出部16_1~16_11におけるヒストグラム算出部161およびランレングス判定部162のそれぞれへ制御信号ACTを出力する。例えば、各ヒストグラム算出部161および各ランレングス判定部162は、自身に入力された制御信号ACTがHレベルのときは画素値Ixyおよび座標データ(x,y)を取り込み、制御信号ACTがLレベルのときは画素値Ixyおよび座標データ(x,y)を取り込まない。これにより、画像メモリ12に格納された2値化画像を一度走査するだけで、2値化画像の任意の部分領域の画像を各ヒストグラム算出部161および各ランレングス判定部162へ入力することができる。そして、各ヒストグラム算出部161および各ランレングス判定部162は、入力された画像に対して所定の処理を、互いに独立に同時並行的に行う。
 なお、制御部14が画像メモリから画素値Ixyを直接読み込まずに、制御部14は画像メモリ12に対して画素値読み出しの制御信号を出力し、当該制御信号に従って画像メモリ12から読み出された画素値Ixyを各特徴量抽出部16_1~16_11へ直接供給するようにしてもよい。
 図3は、各特徴量抽出部16_1~16_11で処理される認識対象領域の部分領域の例を示す。認識対象領域を左右方向に2分割、例えば2等分した部分領域BL1およびBL2の画像は、特徴量抽出部16_1および16_2に入力されて処理される。認識対象領域を上下方向に3分割、例えば3等分した部分領域BL3、BL4、およびBL5の画像は、特徴量抽出部16_3、16_4、および16_5に入力されて処理される。認識対象領域の左右方向中央の部分領域BL6の画像は、特徴量抽出部16_6に入力されて処理される。認識対象領域の上下方向中央の部分領域BL7の画像は、特徴量抽出部16_7に入力されて処理される。認識対象領域の上下方向中央の部分領域を上下左右に4分割、例えば4等分した部分領域BL8、BL9、BL10、およびBL11の画像は、特徴量抽出部16_8、16_9、16_10、および16_11に入力されて処理される。
 図1へ戻り、ヒストグラム算出部161は、認識対象領域の部分領域の画像が入力され、該部分領域において各ラインまたは各列の所定色の画素の頻度分布を算出する。通常の道路速度標識の2値化画像の場合、数字は白地に黒色で表示されるため、ヒストグラム算出部161は、黒の画素の頻度分布を算出する。一方、電光表示の道路速度標識の2値化画像の場合、数字は黒地に白色で表されることがある。この場合には、ヒストグラム算出部161は、白の画素の頻度分布を算出する。
 なお、ヒストグラムの算出は加算演算および比較演算で行うことができるため、ヒストグラム算出部161は、基本的に加算回路および比較器を用いて構成することができる。
 図4は、「0」から「8」までの各数字の画像のヒストグラムの特徴を示す。図4において、認識対象領域における各ラインの黒の画素の頻度分布は各数字の横(数字「0」では右側、その他の数字では左側)に、認識対象領域における各列の黒の画素の頻度分布は各数字の下に、それぞれ示されている。図4に示したように、ヒストグラムは数字ごとに異なった特徴を有している。
 図5は、数字「5」の画像のヒストグラムと部分領域BL1~BL7との対応関係を示す。図5(a)に示したように、特徴量抽出部16_1および16_2におけるヒストグラム算出部161は、それぞれ、数字の画像の列方向のヒストグラムのうち部分領域BL1およびBL2に対応するヒストグラムの最大値を出力する。特徴量抽出部16_3~16_5におけるヒストグラム算出部161は、それぞれ、数字の画像のライン方向のヒストグラムのうち部分領域BL3~BL5に対応するヒストグラムの最大値を出力する。一方、図5(b)に示したように、特徴量抽出部16_6におけるヒストグラム算出部161は、数字の画像の列方向のヒストグラムのうち部分領域BL6に対応するヒストグラムの最小値を出力する。特徴量抽出部16_7におけるヒストグラム算出部161は、数字の画像のライン方向のヒストグラムのうち部分領域BL7に対応するヒストグラムの最小値を出力する。なお、ヒストグラムの最大値および最小値は、認識対象領域の幅または高さに対する各ラインまたは各列に含まれる所定色の画素の度数の割合として定義することができる。例えば、通常の道路速度標識の場合には所定色は黒であり、電光表示の道路速度標識では所定色は白である。認識すべきシンボルが道路速度標識に含まれる数字以外である場合には、所定色は、適宜、白または黒であり得る。なお、2値化画像の特徴から、黒の画素のヒストグラムの最大値は白の画素のヒストグラムの最小値に相当し、白の画素のヒストグラムの最大値は黒の画素のヒストグラムの最小値に相当する。
 以上のように、部分領域BL1~BL5のヒストグラムの最大値、および部分領域BL6~BL7のヒストグラムの最小値は、数字ごとに特徴が異なっており、また、数字の傾き、位置ずれ、ノイズの重畳などに対して影響を受けにくい。このため、各部分領域のヒストグラムの最大値および最小値は、認識対象領域内にあるシンボルの認識のための有効な特徴量となり得る。
 図1へ戻り、ランレングス判定部162は、認識対象領域の各部分領域の画像が入力され、該部分領域において所定色の画素からなる所定長以上のラインまたは列が存在するか否かを判定する。後述するように、数字の画像では数字を表す線分以外の部分においてライン方向の所定色の画素の連続性に特徴があるため、ランレングス判定部162は、ライン方向の所定色の画素の連続性を判定する。また、道路速度標識に使用される数字のフォントデザインの特徴から、所定色の画素の連続性の判定対象となる領域は、部分領域BL8~BL11の各領域とするのが適当である。したがって、特徴量抽出部16_8~16_11におけるランレングス判定部162は、それぞれ、部分領域BL8~BL11において所定長以上の白または黒のラインが存在するか否かを判定する。所定長は、例えば、各部分領域BL8~BL11の幅に対して90%、95%などの任意の長さである。所定長として各部分領域BL8~BL11の幅を指定することもでき、その場合、ランレングス判定部162は、部分領域BL8~BL11において全白ラインまたは全黒ラインが存在するか否かを判定することとなる。通常の道路速度標識の2値化画像の場合、数字は白地に黒色で表示されるため、ランレングス算出部162は、白の画素の連続性を判定する。一方、電光表示の道路速度標識の2値化画像の場合、数字は黒地に白色で表されることがある。この場合には、ランレングス判定部162は、黒の画素の連続性を判定する。
 なお、ランレングスはAND演算、OR演算、および加算で処理を行うことができるため、ランレングス判定部162は、AND回路、OR回路、加算器を有する組み合わせ回路として構成することができる。
 図6は、0から8までの各数字の画像のランレングスの特徴を示す。数字「1」では部分領域BL9およびBL11に所定長以上の白ラインが存在し、数字「2」では部分領域BL8およびBL11に所定長以上の白ラインが存在し、数字「3」では部分領域BL8およびBL10に所定長以上の白ラインが存在し、数字「4」では部分領域BL8に所定長以上の白ラインが存在し、数字「5」では部分領域BL9およびBL10に所定長以上の白ラインが存在し、数字「6」では部分領域BL9に所定長以上の白ラインが存在し、数字「7」では部分領域BL8に所定長以上の白ラインが存在し、数字「0」および「8」ではいずれの部分領域にも所定長以上の白ラインが存在しない。このように、部分領域BL8~BL11における所定長以上の白ラインの有無のパターンは数字ごとに異なっている。ただし、数字「0」と「8」では所定長以上の白ラインの有無のパターンが同じであるが、道路速度標識において十の位に数字「0」が用いられることはなく、逆に一の位に数字「0」以外が用いられることはない。したがって、スキャンウィンドウにおける認識対象領域の位置によって、数字「0」と「8」を区別することができる。
 なお、道路速度標識の傾きによる数字の傾き、スキャンウィンドウのずれによる位置ずれ、ノイズの重畳などの程度が大きい場合には、部分領域BL8~BL11における所定長以上の白ラインの有無のパターンが上記パターンと違ってくる。したがって、部分領域BL8~BL11における所定色の画素の連続性のみで数字を認識することは困難である。そこで、判定部18は、部分領域BL1~BL7のヒストグラムの特徴量と合わせて総合的に数字を判定する。
 図1へ戻り、判定部18は、特徴量抽出部16_1~16_7におけるヒストグラム算出部161の算出結果、および特徴量抽出部16_8~16_11におけるランレングス判定部162の判定結果に基づいて、認識対象領域に含まれる数字を判定する。例えば、判定部18は、下記の判定条件に従って数字を判定する。なお、下記の判定条件において、Hmax1~Hmax5は、特徴量抽出部16_1~16_5におけるヒストグラム算出部161から出力されるヒストグラムの最大値であり、Hmin6およびHmin7は、特徴量抽出部16_6および16_7におけるヒストグラム算出部161から出力されるヒストグラムの最小値であり、RL1~RL4は、特徴量抽出部16_8~16_11におけるランレングス判定部162から出力される判定結果である。RL1~RL4は、所定長以上の白ラインが検出された場合には“1”、検出されなかった場合には“0”であり、“*”はドントケアを表す。
 <数字「0」の判定>
 ・(RL1,RL2,RL3,RL4)=(0,0,0,0)
 ・Hmax1,Hmax2,Hmax3,Hmax5が50%以上
 ・Hmax1-Hmin6,Hmax2-Hmin6が30%以上
 ・|Hmax1-Hmax2|が50%未満
 ・|Hmax3-Hmax5|が30%未満
 ・Hmin6,Hmin7が10%以上
 以上の条件を満たすとき、判定部18は、認識対象領域に含まれる数字が「0」であると判定する。
 <数字「1」の判定>
 ・(RL1,RL2,RL3,RL4)=(0,*,0,*)
 ・Hmax1が70%以上
 ・Hmax3が70%未満
 ・Hmax4,Hmax5が50%未満
 または
 ・(RL1,RL2,RL3,RL4)=(0,*,0,*)
 ・Hmax1が70%以上
 ・Hmax3,Hmax4,Hmax5が70%未満
 ・Hmax1-Hmin6が50%以上
 ・Hmin6が20%以下 
 以上の条件を満たすとき、判定部18は、認識対象領域に含まれる数字が「1」であると判定する。
 <数字「2」の判定>
 ・(RL1,RL2,RL3,RL4)=(1,0,*,*)
 ・Hmax1,Hmax2,Hmax4が70%未満
 ・Hmax3が50%以上
 ・Hmax5が70%以上
 ・Hmax2-Hmin6が30%未満
 以上の条件を満たすとき、判定部18は、認識対象領域に含まれる数字が「2」であると判定する。 
 <数字「3」の判定>
 ・(RL1,RL2,RL3,RL4)=(1,0,1,0)
 ・Hmax1が70%未満
 ・Hmax2,Hmax3,Hmax5が50%以上
 以上の条件を満たすとき、判定部18は、認識対象領域に含まれる数字が「3」であると判定する。
 <数字「4」の判定>
 ・(RL1,RL2,RL3,RL4)=(*,0,0,0)
 ・Hmax1が50%未満
 ・Hmax2,Hmax5が70%以上
 ・Hmax3,Hmax4が70%未満
 または
 ・(RL1,RL2,RL3,RL4)=(*,0,0,0)
 ・Hmax1,Hmax3,Hmax4が70%未満
 ・Hmax2,Hmax5が70%以上
 ・Hmax2-Hmin6が50%以上
 ・Hmax2-Hmax1が30%以上
 または
 ・(RL1,RL2,RL3,RL4)=(*,0,0,0)
 ・Hmax2,Hmax5が70%以上
 ・Hmax3が70%未満
 ・Hmax2-Hmin6が50%以上
 ・Hmax5-Hmin7が40%以上
 以上の条件を満たすとき、判定部18は、認識対象領域に含まれる数字が「4」であると判定する。
 <数字「5」の判定>
 ・(RL1,RL2,RL3,RL4)=(0,1,1,0)
 ・Hmax1,Hmax2,Hmax3,Hmax4,Hmax5が50%以上
 以上の条件を満たすとき、判定部18は、認識対象領域に含まれる数字が「5」であると判定する。
 <数字「6」の判定>
 ・(RL1,RL2,RL3,RL4)=(0,1,0,0)
 ・Hmax1,Hmax4,Hmax5が50%以上
 ・Hmax3が70%未満
 以上の条件を満たすとき、判定部18は、認識対象領域に含まれる数字が「6」であると判定する。
 <数字「7」の判定>
 ・(RL1,RL2,RL3,RL4)=(1,0,*,*)
 ・Hmax1,Hmax2,Hmax4,Hmax5が70%未満
 ・Hmax3が70%以上
 または
 ・(RL1,RL2,RL3,RL4)=(1,0,*,*)
 ・Hmax3が70%以上
 ・Hmax3-Hmin7が50%以上
 以上の条件を満たすとき、判定部18は、認識対象領域に含まれる数字が「7」であると判定する。
 <数字「8」の判定>
 ・(RL1,RL2,RL3,RL4)=(0,0,0,0)
 ・Hmax1,Hmax2,Hmax3,Hmax4,Hmax5が70%以上
 または
 ・(RL1,RL2,RL3,RL4)=(0,0,0,0)
 ・Hmax1,Hmax2,Hmax3,Hmax4,Hmax5が50%以上
 ・Hmax1-Hmin6が20%以上
 ・Hmax2-Hmin6が20%以上
 ・|Hmax1-Hmax2|が30%未満
 ・|Hmax3-Hmax5|が30%未満
 以上の条件を満たすとき、判定部18は、認識対象領域に含まれる数字が「8」であると判定する。
 判定部18は、上記の全条件が満たされない場合、認識対象の2値化画像は道路速度標識の画像ではないと判定してもよい。さらに言えば、道路速度標識ではスキャンウィンドウ(図2を参照)における右側の認識対象領域には数字「0」以外は現れない。したがって、制御部14は、まず、スキャンウィンドウにおける右側の認識対象領域を走査し、判定部18は、該認識対象領域に含まれるシンボルが数字「0」であるか否かによって認識対象の2値化画像が道路速度標識の画像であるか否かを判定してもよい。そして、スキャンウィンドウにおける右側の認識対象領域に含まれるシンボルが数字「0」である場合、制御部14は、次に、スキャンウィンドウにおける左側の認識対象領域を走査し、判定部18は、速度の十の位の数字を認識するようにしてもよい。
 以上のように本実施形態によると、画像メモリ12に格納された2値化画像に含まれるシンボル認識をハードウェアを用いて高速かつ高精度に行うことができる。
 数字「9」の判定条件の説明を省略したが、これは、日本国内において道路速度標識に数字「9」が使用されないためであり、数字「9」が認識不可能というわけではない。数字「9」の画像のヒストグラムおよびランレングスの特徴に基づいて、他の数字と同様に数字「9」を認識することは容易である。
 道路速度標識において速度が3桁の数字で表される場合もあるが、そのような場合には、スキャンウィンドウ内に3桁の各数字に合うように3つの認識対象領域を設定すればよい。また、道路速度標識において百の位の数字が「1」以外になることはあり得ないと考えられる。したがって、制御部14は、まず、スキャンウィンドウにおける左端の認識対象領域を走査し、判定部18は、該認識対象領域に含まれるシンボルが数字「1」であるか否かによって認識対象の2値化画像が道路速度標識の画像であるか否かを判定してもよい。そして、スキャンウィンドウにおける左端の対象領域に含まれるシンボルが数字「1」である場合、制御部14は、次に、スキャンウィンドウにおける真ん中または右端の認識対象を走査し、判定部18は、速度の十の位または一の位の数字を認識するようにしてもよい。
 アルファベット、ひらがな、カタカナなどの数字以外のシンボルについても上記と同様の手法で認識可能である。ただし、数字以外のシンボルを認識する場合、ヒストグラムやランレングスを判定する部分領域は、上記の部分領域BL1~BL11が最適であるとは限られず、各シンボルの特徴を反映するような部分領域を採用することが望ましい。
 特徴量抽出部16_1~16_7におけるランレングス判定部162、および特徴量抽出部16_8~16_11におけるヒストグラム算出部161は実際には使用されないため、数字に限定した認識であればこれら使用されない構成要素を省略してもよい。これにより、回路規模を縮小することができる。また、特徴量抽出部16_1~16_11は、最適化することによってデータおよびリソースの共有が可能となり、回路規模を縮小することができる。
 逆に、本実施形態のように、ヒストグラム算出部161およびランレングス判定部162を備えた特徴量抽出部16を適当な個数配置し、制御部14によって各特徴量抽出部16におけるヒストグラム算出部161およびランレングス判定部162への画素情報の入力を制御することで、回路規模は大きくなるが、数字以外のさまざまなシンボルの認識に対応可能な汎用性を持たせることができる。
 認識対象領域において複数の部分領域がオーバーラップするような場合には、1個の特徴量抽出部16で複数の部分領域の処理を行うように特徴量抽出部16を共有させることで全体の回路規模を縮小することができる。しかし、特徴量抽出部16の1個当たりの回路規模は非常に小さいため、特徴量抽出部16を多数配置したとしても回路規模増大の影響は限定的であると考えられる。したがって、回路規模が問題になるような場合に特徴量抽出部16を共有させればよい。
 ≪第2の実施形態≫
 図7は、本発明の第2の実施形態に係るシンボル認識装置の主要部の構成を示す。本実施形態に係るシンボル認識装置10は、第1の実施形態に係るシンボル認識装置10に色割合算出部17を追加し、さらに、特徴量抽出部16_1~16_5および16_7におけるランレングス判定部162を使用して、数字の認識精度を向上させたものである。以下、第1の実施形態と同様の事項については説明を省略し、第1の実施形態と異なる点について重点的に説明する。
 色割合算出部17は、認識対象領域の画像が画像メモリ12から直接的にまたは制御部14を介して間接的に入力され、認識対象領域における所定色の画素の割合を算出する。所定色は、通常の道路速度標識の場合は黒であり、電光表示の道路速度標識の場合は白である。所定色の画素の割合は、例えば、数字「0」では66%以下、数字「1」では40%以下、数字「2」では46%以下、数字「3」では43%以下、数字「4」では50%以下、数字「5」では54%以下、数字「6」では48%以下、数字「7」では44%以下、数字「8」では61%以下である。
 制御部14は、制御信号ACTを出力して、色割合算出部17への画素情報の入力を制御する。例えば、色割合算出部17は、自身に入力された制御信号ACTがHレベルのときは画素値Ixyおよび座標データ(x,y)を取り込み、制御信号ACTがLレベルのときは画素値Ixyおよび座標データ(x,y)を取り込まない。これにより、制御部14が画像メモリ12に格納された2値化画像を一度走査するだけで、2値化画像の任意の部分領域の画像を特徴量抽出部16_1~16_11および色割合算出部17へ入力することができる。そして、各特徴量抽出部16_1~16_11および色割合算出部17は、入力された画像に対して所定の処理を、互いに独立に同時並行的に行う。
 判定部18は、上記の各数字の判定条件に色割合算出部17の算出結果を加味して、認識対象領域に含まれる数字を判定する。このように、色割合算出部17の算出結果を加味することにより、数字の認識精度が向上する。また、判定部18は、上記の各数字の判定条件と色割合算出部17の算出結果とが矛盾する場合、認識対象領域に含まれるシンボルは数字ではないと判定することができ、さらに、認識対象の2値化画像が道路交通標識の画像ではないと判定することもできる。
 数字のうち「0」および「8」の2つは字形に際立った特徴がないため、まったく異なる画像が数字「0」や数字「8」として誤認識されやすい傾向にある。そこで、本実施形態では以下のような特別な対策を講じることで、数字「0」および「8」の認識精度を向上させることができる。
 図8は、数字「0」のある部分領域におけるランレングスの特徴を示す。認識対象領域に数字「0」が含まれている場合において部分領域BL7(図3を参照)に着目すると、数字「0」のフォントデザインの特徴から、所定長以上の黒および白の各列が多数存在する。そこで、部分領域BL7の画像が入力される特徴量抽出部16_7におけるランレングス判定部162は、部分領域BL7において所定長以上の黒および白の各列が所定数以上存在するか否かを判定する。所定長は、例えば、部分領域BL7の高さに対して90%、95%などの任意の長さである。所定長として部分領域BL7の高さを指定することもでき、その場合、ランレングス判定部162は、部分領域BL7において全黒の列および全白の列がそれぞれ所定数以上存在するか否かを判定する。所定数は、1以上の整数であればよく、スキャンウィンドウの大きさに応じて変更することもできる。
 判定部18は、上記の数字「0」の判定条件に、特徴量抽出部16_7におけるランレングス判定部162の判定結果を加味して、認識対象領域に含まれる数字が「0」であると判定することができる。これにより、数字「0」の認識精度が向上する。
 図9は、数字「0」の別のいくつかの部分領域におけるランレングスの特徴を示す。認識対象領域に数字「0」が含まれている場合において部分領域BL1~BL3およびBL5(図3を参照)に着目すると、数字「0」のフォントデザインの特徴から、部分領域BL1およびBL2には所定色の画素からなる所定長以上の列が存在し、部分領域BL3およびBL5には所定色の画素からなる所定長以上のラインが存在する。そこで、部分領域BL1およびBL2の画像が入力される特徴量抽出部16_1および16_2におけるランレングス判定部162は、それぞれ、部分領域BL1およびBL2において所定色の画素からなる所定長以上の列が存在するか否かを判定し、部分領域BL3およびBL5の画像が入力される特徴量抽出部16_3および16_5におけるランレングス判定部162は、それぞれ、部分領域BL3およびBL5において所定色の画素からなる所定長以上のラインが存在するか否かを判定する。所定長は、例えば、部分領域BL1およびBL2については当該部分領域の高さの半分であり、部分領域BL3およびBL5については当該部分領域の幅の半分である。
 判定部18は、さらに、特徴量抽出部16_1~16_3および16_5におけるランレングス判定部162の判定結果を加味して、認識対象領域に含まれる数字が「0」であると判定することができる。これにより、数字「0」の認識精度がより一層向上する。
 図10は、数字「8」のいくつかの部分領域におけるランレングスの特徴を示す。認識対象領域に数字「8」が含まれている場合において部分領域BL3~BL5(図3を参照)に着目すると、数字「8」のフォントデザインの特徴から、部分領域BL3~BL5には所定色の画素からなる所定長以上のラインが存在する。そこで、部分領域BL3~BL5の画像が入力される特徴量抽出部16_3~16_5におけるランレングス判定部162は、それぞれ、部分領域BL3~BL5において所定色の画素からなる所定長以上のラインが存在するか否かを判定する。所定長は、例えば、部分領域BL3~BL5の各幅の半分である。
 判定部18は、上記の数字「8」の判定条件に、特徴量抽出部16_3~16_5におけるランレングス判定部162の判定結果を加味して、認識対象領域に含まれる数字が「8」であると判定することができる。これにより、数字「8」の認識精度が向上する。なお、特徴量抽出部16_3および16_5におけるランレングス判定部162の判定結果は、判定部18における数字「0」および「8」の判定処理に共通に使用することができる。
 以上のように本実施形態によると、道路速度標識における数字の認識精度を向上させることができる。
 ≪第3の実施形態≫
 図11は、本発明の第3の実施形態に係るシンボル認識装置の主要部の構成を示す。本実施形態に係るシンボル認識装置10は、第1の実施形態に係るシンボル認識装置10に特徴量抽出部16_1U~16_11U、16_1D~16_11D、16_1L~16_11L、および16_1R~16_11Rを追加したものである。以下、第1の実施形態と同様の事項については説明を省略し、第1の実施形態と異なる点について重点的に説明する。
 車両用標識などの認識対象物がスキャンウィンドウ内に正しく捕らえられていない場合、認識すべきシンボルが認識対象領域からはみ出てしまってシンボルを正しく認識できないおそれがある。そこで、本実施形態に係るシンボル認識装置10は、スキャンウィンドウの略中央部分に位置する基準の認識対象領域およびそれを中心に上下左右に僅かずつずらした各認識対象領域について同時並行的に認識処理を行う。
 図12は、基準の認識対象領域の例および上下左右にずらした認識対象領域の例を示す。基準の認識対象領域NWの各部分領域の画像は特徴量抽出部16_1~16_11に入力される。上へずらした認識対象領域NWの各部分領域の画像は特徴量抽出部16_1U~16_11Uに入力される。下へずらした認識対象領域NWの各部分領域の画像は特徴量抽出部16_1D~16_11Dに入力される。左へずらした認識対象領域NWの各部分領域の画像は特徴量抽出部16_1L~16_11Lに入力される。右へずらした認識対象領域NWの各部分領域の画像は特徴量抽出部16_1R~16_11Rに入力される。特徴量抽出部16_1U~16_11U、16_1D~16_11D、16_1L~16_11L、および16_1R~16_11Rは、特徴量抽出部16_1~16_11と同じ構成の要素であり、入力される画像が特徴量抽出部16_1~16_11に入力される画像と異なるのみである。
 認識対象領域のずらし量は、例えば、スキャンウィンドウの1辺が20~29ピクセルの場合には1ピクセル、スキャンウィンドウの1辺が30~39ピクセルの場合には2ピクセル、スキャンウィンドウの1辺が40~50ピクセルの場合には3ピクセルなどのように、スキャンウィンドウのサイズに応じて適宜変えることができる。
 制御部14は、制御信号ACTを出力して、各特徴量抽出部16_1~16_11、16_1U~16_11U、16_1D~16_11D、16_1L~16_11L、および16_1R~16_11Rにおけるヒストグラム算出部161およびランレングス判定部162のそれぞれへの画素情報の入力を制御する。例えば、各ヒストグラム算出部161および各ランレングス判定部162は、自身に入力された制御信号ACTがHレベルのときは画素値Ixyおよび座標データ(x,y)を取り込み、制御信号ACTがLレベルのときは画素値Ixyおよび座標データ(x,y)を取り込まない。これにより、制御部14が画像メモリ12に格納された2値化画像を一度走査するだけで、2値化画像の任意の部分領域の画像を各ヒストグラム算出部161および各ランレングス判定部162へ入力することができる。そして、各ヒストグラム算出部161および各ランレングス判定部162は、入力された画像に対して所定の処理を、互いに独立に同時並行的に行う。
 判定部18は、特徴量抽出部16_1~16_11、16_1U~16_11U、16_1D~16_11D、16_1L~16_11L、および16_1R~16_11Rの出力に基づいて、各認識対象領域に含まれる数字を判定する。なお、判定部18は、各認識対象領域の認識結果の多数決により、シンボルの認識結果を決定することができる。
 以上のように本実施形態によると、認識対象物がスキャンウィンドウ内に正しく捕らえられていない場合であっても2値化画像に含まれるシンボルを正しく認識することができる。
 第2の実施形態に係るシンボル認識装置10についても、上下左右へずらした各認識対象領域の画像が入力される色割合算出部17を追加することで、認識対象物がスキャンウィンドウ内に正しく捕らえられていない場合であっても2値化画像に含まれるシンボルを正しく認識できるようにすることができる。
 ≪第4の実施形態≫
 例えば、図2に示したように、2桁の数を円枠で囲んだデザインで表される道路速度標識は、円枠ごとスキャンウィンドウSW内に捕らえられている。第1から第3の実施形態に係るシンボル認識装置10は、そのようなスキャンウィンドウSWの略中央部分を認識対象領域として、認識対象領域をいくつかの部分領域に区分して画像解析を行い、スキャンウィンドウSW、すなわち、2値化画像に含まれるシンボルを認識する。一方、図2に示したように、スキャンウィンドウSWにおいて、認識対象領域の周りの領域には道路速度標識の円枠が含まれているから、そのような周りの領域についても画像解析を行うことで円枠を検出することができ、その検出結果から、スキャンウィンドウSW、すなわち、2値化画像が道路速度標識の画像であるか否かを判定することができる。すなわち、上記のシンボル認識装置10を拡張して車両用標識認識装置を構成することができる。
 図13は、本発明の第4の実施形態に係る車両用標識認識装置の主要部の構成を示す。本実施形態に係る車両用標識認識装置100は、第1の実施形態に係るシンボル認識装置10に枠検出部20および斜線判定部30を追加したものである。以下、第1の実施形態と同様の事項については説明を省略し、第1の実施形態と異なる点について重点的に説明する。
 枠検出部20は、画像メモリ12に格納された2値化画像において車両用標識の枠を検出する。枠検出部20には、画像メモリ12から直接的にまたは制御部14を介して間接的に画像情報が入力される。例えば、道路速度標識は、図2に示したように2桁の数字の周りに円枠を有している。そこで、そのような円枠を検出するために、枠検出部20は、2値化画像のいくつかの部分領域において所定色の画素からなる所定長以上のライン、列、または斜め線が所定本数以上存在するか否かを判定し、その判定結果から車両用標識の枠を検出することができる。所定色は、通常の車両用標識の場合は黒であり、電光表示の標識の場合は白である。
 図14は、枠検出部20で処理される2値化画像の部分領域の例を示す。枠検出部20は、スキャンウィンドウSWにおける縦長、横長、および斜めの8つの矩形の各部分領域BL21~BL28において所定色の画素からなる所定長以上のライン、列、または斜め線が所定本数以上存在するか否かを判定する。具体的には、枠検出部20は、部分領域BL21およびBL23において所定色の画素からなる所定長以上の列が所定本数以上存在するか否かを判定し、部分領域BL22およびBL24において所定色の画素からなる所定長以上のラインが所定本数以上存在するか否かを判定し、部分領域BL25およびBL27において所定色の画素からなる所定長以上の左上から右下の斜め45度の線が所定本数以上存在するか否かを判定し、部分領域BL26およびBL28において所定色の画素からなる所定長以上の左下から右上の斜め45度の線が所定本数以上存在するか否かを判定する。所定長は、各部分領域の長手方向の長さに対して90%、95%などの任意の長さである。所定本数は、1本などの任意の数である。そして、枠検出部20は、部分領域BL21~BL28のすべてにおいて所定色の画素からなる所定長以上のライン、列、または斜め線が所定本数以上存在すると判断したとき、2値化画像において道路速度標識などで使用される円枠が存在すると判定する。
 なお、枠検出部20によって検出される車両用標識の枠は円枠に限られない。枠検出部20で処理すべき部分領域を適宜変更することで、警戒標識で使用される菱形の枠、徐行標識や一時停止標識などで使用される逆三角形の枠などの検出に対応させることができる。
 ところで、車両用標識には道路速度標識以外にUターン禁止や追い越し禁止などの禁止を表す標識(以下、「禁止標識」と称する)があり、それら禁止標識には共通して禁止を表す斜め線が含まれている。図13へ戻り、斜線判定部30は、画像メモリ12に格納された2値化画像においてそのような斜め線が存在するか否かを判定する。具体的には、斜線判定部30は、画像メモリ12に格納された2値化画像における斜めの部分領域において所定色の画素からなる所定長以上の斜め線が存在するか否かを判定する。斜線判定部30には、画像メモリ12から直接的にまたは制御部14を介して間接的に画像情報が入力される。所定色は、通常の車両用標識の場合は黒であり、電光表示の標識の場合は白である。
 図15は、斜線判定部30で処理される2値化画像の部分領域の例および禁止を表す標識のいくつかの例を示す。斜線判定部30は、スキャンウィンドウSWにおける斜めの矩形の部分領域BL29において所定色の画素からなる所定長以上の斜め線が存在するか否かを判定する。
 図13へ戻り、制御部14は、制御信号ACTを出力して、枠検出部20および斜線判定部30への画素情報の入力を制御する。例えば、枠検出部20および斜線判定部30は、自身に入力された制御信号ACTがHレベルのときは画素値Ixyおよび座標データ(x,y)を取り込み、制御信号ACTがLレベルのときは画素値Ixyおよび座標データ(x,y)を取り込まない。これにより、制御部14が画像メモリ12に格納された2値化画像を一度走査するだけで、2値化画像の任意の部分領域の画像を特徴量抽出部16_1~16_11、枠検出部20、および斜線判定部30へ入力することができる。そして、各特徴量抽出部16_1~16_11、枠検出部20、および斜線判定部30は、入力された画像に対して所定の処理を、互いに独立に同時並行的に行う。
 判定部18は、特徴量抽出部16_1~16_11、枠検出部20、および斜線判定部30の各出力を受け、画像メモリ12に格納された2値化画像が車両用標識であるか否か、車両用標識である場合には禁止標識であるか否か、禁止標識である場合にはさらにどのような種類の禁止標識であるか、および禁止標識ではなく速度標識である場合にはその制限速度を認識する。まず、判定部18は、枠検出部20の検出結果に基づいて、2値化画像に車両用標識の枠が含まれていない場合には認識対象の2値化画像が車両用標識の画像ではないと判定する。枠検出部20によって車両用標識の枠が検出された場合、判定部18は、斜線判定部30の判定結果に基づいて、2値化画像に禁止を表す斜め線が含まれている場合には認識対象の2値化画像が禁止標識の画像であると判定する。さらに、枠検出部20によって道路速度標識の円枠が検出され、かつ、斜線判定部30によって2値化画像に禁止を表す斜め線が存在しないと判定された場合、判定部18は、2値化画像に含まれるシンボルを制限速度を表す数字として認識する。
 判定部18は、認識対象の2値化画像が禁止標識の画像であると判定した場合、さらに、特徴量抽出部16_1~16_11の出力、すなわち、認識対象領域の各部分領域のヒストグラムおよびランレングスに基づいて、禁止標識の種類を判定することもできる。
 なお、禁止標識の種類の判定にはそれに適した認識対象領域および部分領域の画像のヒストグラムおよびランレングスを使用した方がよい場合がある。したがって、そのような場合には、禁止標識の種類の判定のための部分領域の画素情報が入力される特徴量抽出部を別途設けて、判定部18は、その特徴量抽出部の出力に基づいて禁止標識の種類を判定するようにしてもよい。
 以上のように本実施形態によると、画像メモリ12から2値化画像を繰り返し読み出すことなく画像メモリ12に格納された2値化画像を一度走査するだけで車両用標識の判定、禁止標識の判定、禁止標識の種類の認識、および制限速度の認識を行うことができる。したがって、本実施形態に係る車両用標識認識装置100は、FPGA(Field Programmable Gate Array)などのハードウェアへの実装に適している。また、本実施形態に係る車両用標識認識装置100をFPGAに実装することで、自動車走行中にリアルタイムで車両用標識の認識処理を行うことができる低価格の車載組込システムを実現することができる。
 第2および第3の実施形態に係るシンボル認識装置10についても、枠検出部20および斜線判定部30を追加することで上記と同様の車両用標識認識装置を構成することができる。

Claims (13)

  1.  認識対象の2値化画像を格納する画像メモリと、
     前記2値化画像における認識対象領域の各部分領域の画像が入力され、該部分領域において各ラインまたは各列の所定色の画素の頻度分布を算出する複数のヒストグラム算出部と、
     前記認識対象領域の各部分領域の画像が入力され、該部分領域において前記所定色の画素からなる所定長以上のラインまたは列が存在するか否かを判定する複数のランレングス判定部と、
     前記画像メモリに格納されている前記2値化画像を走査して読み出した前記部分領域の画素情報を前記複数のヒストグラム算出部および前記複数のランレングス判定部へ入力する制御部と、
     前記複数のヒストグラム算出部の算出結果および前記複数のランレングス判定部の判定結果に基づいて、前記2値化画像に含まれるシンボルを判定する判定部とを備えている
    ことを特徴とするシンボル認識装置。
  2.  前記複数のヒストグラム算出部が、前記認識対象領域を左右方向に2分割した各部分領域の画像が入力される第1および第2のヒストグラム算出部と、前記認識対象領域を上下方向に3分割した各部分領域の画像が入力される第3、第4、および第5のヒストグラム算出部と、前記認識対象領域の左右方向中央の部分領域の画像が入力される第6のヒストグラム算出部と、前記認識対象領域の上下方向中央の部分領域の画像が入力される第7のヒストグラム算出部とを含み、
     前記複数のランレングス判定部が、前記認識対象領域の上下方向中央の部分領域を上下左右に4分割した各部分領域の画像が入力される第1、第2、第3、および第4のランレングス判定部を含み、
     前記判定部が、前記第1から第5のヒストグラム算出部によって算出されたヒストグラムの最大値、前記第6および第7のヒストグラム算出部によって算出されたヒストグラムの最小値、および前記第1から第4のランレングス判定部の判定結果に基づいて、前記認識対象領域に含まれるシンボルを判定する
    ことを特徴とする請求項1に記載のシンボル認識装置。
  3.  前記複数のランレングス判定部が、第5のランレングス判定部を含み、
     前記第5のランレングス判定部が、前記認識対象領域の上下方向中央の部分領域の画像が入力され、該部分領域において所定長以上の黒および白の各列が所定数以上存在するか否かを判定するものであり、
     前記判定部が、前記第5のランレングス判定部の判定結果を加味して、前記認識対象領域に含まれるシンボルが数字「0」であるか否かを判定する
    ことを特徴とする請求項2に記載のシンボル認識装置。
  4.  前記複数のランレングス判定部が、前記認識対象領域を左右方向に2分割した各部分領域の画像が入力される第6および第7のランレングス判定部と、前記認識対象領域を上下方向に3分割した上および下の各部分領域の画像が入力される第8および第9のランレングス判定部とを含み、
     前記判定部が、前記第6から第9のランレングス判定部の判定結果を加味して、前記認識対象領域に含まれるシンボルが数字「0」であるか否かを判定する
    ことを特徴とする請求項2に記載のシンボル認識装置。
  5.  前記複数のランレングス判定部が、前記認識対象領域を左右方向に2分割した各部分領域の画像が入力される第6および第7のランレングス判定部と、前記認識対象領域を上下方向に3分割した上および下の各部分領域の画像が入力される第8および第9のランレングス判定部とを含み、
     前記判定部が、前記第6から第9のランレングス判定部の判定結果を加味して、前記認識対象領域に含まれるシンボルが数字「0」であるか否かを判定する
    ことを特徴とする請求項3に記載のシンボル認識装置。
  6.  前記複数のランレングス判定部が、前記認識対象領域を上下方向に3分割した各部分領域の画像が入力される第6、第7、および第8のランレングス判定部を含み、
     前記判定部が、前記第6から第8のランレングス判定部の判定結果を加味して、前記認識対象領域に含まれるシンボルが数字「8」であるか否かを判定する
    ことを特徴とする請求項2に記載のシンボル認識装置。
  7.  前記複数のランレングス判定部が、前記認識対象領域を上下方向に3分割した各部分領域の画像が入力される第6、第7、および第8のランレングス判定部を含み、
     前記判定部が、前記第6から第8のランレングス判定部の判定結果を加味して、前記認識対象領域に含まれるシンボルが数字「8」であるか否かを判定する
    ことを特徴とする請求項3に記載のシンボル認識装置。
  8.  前記複数のランレングス判定部が、前記認識対象領域を上下方向に3分割した真ん中の部分領域の画像が入力される第10のランレングス判定部を含み、
     前記判定部が、前記第8から第10のランレングス判定部の判定結果を加味して、前記認識対象領域に含まれるシンボルが数字「8」であるか否かを判定する
    ことを特徴とする請求項4に記載のシンボル認識装置。
  9.  前記複数のランレングス判定部が、前記認識対象領域を上下方向に3分割した真ん中の部分領域の画像が入力される第10のランレングス判定部を含み、
     前記判定部が、前記第8から第10のランレングス判定部の判定結果を加味して、前記認識対象領域に含まれるシンボルが数字「8」であるか否かを判定する
    ことを特徴とする請求項5に記載のシンボル認識装置。
  10.  前記認識対象領域の画像が入力され、前記認識対象領域の全体における所定色の画素の割合を算出する色割合算出部を備え、
     前記制御部が、前記画像メモリに格納されている前記2値化画像を走査して読み出した前記部分領域の画素情報を前記色割合算出部へ入力するものであり、
     前記判定部が、前記色割合算出部の算出結果を加味して、前記認識対象領域に含まれるシンボルを判定する
    ことを特徴とする請求項1に記載のシンボル認識装置。
  11.  前記認識対象領域および前記認識対象領域を上下左右に僅かずつずらした各認識対象領域について同時並行的に認識処理を行う
    ことを特徴とする請求項1に記載のシンボル認識装置。
  12.  請求項1に記載のシンボル認識装置と、
     前記シンボル認識装置の前記画像メモリに格納された前記2値化画像において車両用標識の枠を検出する枠検出部とを備え、
     前記シンボル認識装置の前記判定部が、前記枠検出部の検出結果に基づいて、前記2値化画像が車両用標識の画像であるか否かを判定する
    ことを特徴とする車両用標識認識装置。
  13.  前記2値化画像における斜めの部分領域において所定色の画素からなる所定長以上の斜め線が存在するか否かを判定する斜線判定部を備え、
     前記判定部が、前記斜線判定部の判定結果を加味して、前記2値化画像が禁止を表す標識のうちのいずれの種類の標識の画像であるかを判定する
    ことを特徴とする請求項12に記載の車両用標識認識装置。
PCT/JP2014/004918 2013-09-30 2014-09-25 シンボル認識装置および車両用標識認識装置 WO2015045394A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US15/084,457 US9959473B2 (en) 2013-09-30 2016-03-29 Symbol recognition device and traffic sign recognition device

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2013-203715 2013-09-30
JP2013203715 2013-09-30
JP2013-216403 2013-10-17
JP2013216403A JP6355908B2 (ja) 2013-09-30 2013-10-17 シンボル認識装置および車両用標識認識装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US15/084,457 Continuation US9959473B2 (en) 2013-09-30 2016-03-29 Symbol recognition device and traffic sign recognition device

Publications (1)

Publication Number Publication Date
WO2015045394A1 true WO2015045394A1 (ja) 2015-04-02

Family

ID=52742563

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2014/004918 WO2015045394A1 (ja) 2013-09-30 2014-09-25 シンボル認識装置および車両用標識認識装置

Country Status (3)

Country Link
US (1) US9959473B2 (ja)
JP (1) JP6355908B2 (ja)
WO (1) WO2015045394A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102014214711B4 (de) * 2014-07-25 2023-01-05 Continental Autonomous Mobility Germany GmbH Verfahren zum Betrieb eines Assistenzsystems eines Kraftfahrzeugs sowie Assistenzsystem
US11293762B2 (en) * 2019-06-18 2022-04-05 Here Global B.V. System and methods for generating updated map data
GB2609483A (en) * 2021-08-05 2023-02-08 Continental Automotive Gmbh Method and system for recognizing and classifying restricted road signs for a vehicle automation system

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04350783A (ja) * 1991-05-29 1992-12-04 Fuji Electric Co Ltd 文字読取方法
JPH0652358A (ja) * 1992-08-04 1994-02-25 Fujitsu Ltd 文字認識方法
JPH07287758A (ja) * 1994-04-18 1995-10-31 Hitachi Ltd 相関演算装置
JP2006235752A (ja) * 2005-02-22 2006-09-07 Asahi Engineering Kk オブジェクト認識装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP2008286566A (ja) * 2007-05-16 2008-11-27 Omron Corp 車載装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5847064B2 (ja) * 1978-07-08 1983-10-20 工業技術院長 文字読取方式
US5056154A (en) * 1988-11-07 1991-10-08 Sharp Kabushiki Kaisha Text image data compression system
US5179599A (en) * 1991-06-17 1993-01-12 Hewlett-Packard Company Dynamic thresholding system for documents using structural information of the documents
US5872864A (en) * 1992-09-25 1999-02-16 Olympus Optical Co., Ltd. Image processing apparatus for performing adaptive data processing in accordance with kind of image
JP3615333B2 (ja) * 1996-12-05 2005-02-02 株式会社リコー 罫線消去装置
US6088478A (en) * 1998-02-13 2000-07-11 Xerox Corporation Method and apparatus for distinguishing bold face characters
JP2000341501A (ja) * 1999-03-23 2000-12-08 Minolta Co Ltd 画像処理装置および画像処理方法、ならびに画像処理プログラムを記録した記録媒体
US6922487B2 (en) * 2001-11-02 2005-07-26 Xerox Corporation Method and apparatus for capturing text images
US20060140487A1 (en) * 2004-12-23 2006-06-29 Kabushiki Kaisha Toshiba Image compressing apparatus and image decoding apparatus and image converting apparatus and image processing method
RU2596600C2 (ru) * 2014-09-02 2016-09-10 Общество с ограниченной ответственностью "Аби Девелопмент" Способы и системы обработки изображений математических выражений

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04350783A (ja) * 1991-05-29 1992-12-04 Fuji Electric Co Ltd 文字読取方法
JPH0652358A (ja) * 1992-08-04 1994-02-25 Fujitsu Ltd 文字認識方法
JPH07287758A (ja) * 1994-04-18 1995-10-31 Hitachi Ltd 相関演算装置
JP2006235752A (ja) * 2005-02-22 2006-09-07 Asahi Engineering Kk オブジェクト認識装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP2008286566A (ja) * 2007-05-16 2008-11-27 Omron Corp 車載装置

Also Published As

Publication number Publication date
US20160210520A1 (en) 2016-07-21
JP6355908B2 (ja) 2018-07-11
US9959473B2 (en) 2018-05-01
JP2015092305A (ja) 2015-05-14

Similar Documents

Publication Publication Date Title
US10429193B2 (en) Method and apparatus for generating high precision map
US9082038B2 (en) Dram c adjustment of automatic license plate recognition processing based on vehicle class information
CN111382704A (zh) 基于深度学习的车辆压线违章判断方法、装置及存储介质
CN104700072B (zh) 基于车道线历史帧的识别方法
US20090110286A1 (en) Detection method
CN108596168B (zh) 用于识别图像中字符的方法、装置及介质
Arenado et al. Monovision‐based vehicle detection, distance and relative speed measurement in urban traffic
JP2010205160A (ja) 速度規制標識認識結果の通知方法
US20180189590A1 (en) Identification medium recognition device and identification medium recognition method
CN108734161B (zh) 冠字号区域的识别方法、装置、设备及存储介质
CN111382625A (zh) 道路标识识别方法、装置及电子设备
WO2015045394A1 (ja) シンボル認識装置および車両用標識認識装置
JP2017130155A (ja) 物体認識装置および物体認識方法
CN103489254A (zh) 彩票的识别方法及系统
CN112926564A (zh) 图片分析方法、系统、计算机设备和计算机可读存储介质
CN111243003A (zh) 车载双目摄像机及其检测道路限高杆的方法、装置
US9600894B2 (en) Image processing apparatus and computer-readable storage medium
KR100969603B1 (ko) 숫자의 기하학적 관계를 이용한 차량 번호판 인식 방법
CN113297939B (zh) 障碍物检测方法、系统、终端设备及存储介质
CN113311507A (zh) 一种台风路径的识别方法及装置
US20140285662A1 (en) Image processing apparatus, and method
JP4224328B2 (ja) 車番認識装置
CN115346206B (zh) 基于改进超分辨的深度卷积特征识别的车牌检测方法
CN111881897B (zh) 一种停车场地面中文标志识别方法及其系统、存储介质
JP4842301B2 (ja) 歩行者検出装置及びプログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 14848762

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 14848762

Country of ref document: EP

Kind code of ref document: A1