WO2015098810A1 - 画像処理装置および特定図形検出方法 - Google Patents

画像処理装置および特定図形検出方法 Download PDF

Info

Publication number
WO2015098810A1
WO2015098810A1 PCT/JP2014/083857 JP2014083857W WO2015098810A1 WO 2015098810 A1 WO2015098810 A1 WO 2015098810A1 JP 2014083857 W JP2014083857 W JP 2014083857W WO 2015098810 A1 WO2015098810 A1 WO 2015098810A1
Authority
WO
WIPO (PCT)
Prior art keywords
image
candidate image
template matching
correlation
candidate
Prior art date
Application number
PCT/JP2014/083857
Other languages
English (en)
French (fr)
Inventor
原田 博之
宏憲 林
Original Assignee
京セラドキュメントソリューションズ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 京セラドキュメントソリューションズ株式会社 filed Critical 京セラドキュメントソリューションズ株式会社
Priority to US15/104,967 priority Critical patent/US9665938B2/en
Priority to JP2015554865A priority patent/JP5993100B2/ja
Priority to CN201480068336.XA priority patent/CN105814608B/zh
Publication of WO2015098810A1 publication Critical patent/WO2015098810A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • G06T7/74Determining position or orientation of objects or cameras using feature-based methods involving reference images or patches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/28Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching

Definitions

  • the present invention relates to an image processing apparatus and a specific figure detection method.
  • the logo mark present in the original image is in various states with respect to size, rotation angle, etc., and it is difficult to detect such a logo mark (especially a full color log mark) at high speed by template matching. is there.
  • the present invention has been made in view of the above problems, and an object of the present invention is to obtain an image processing apparatus and a specific figure detection method for detecting a logo mark in a document image at high speed by template matching.
  • An image processing apparatus includes: a binarization processing unit that performs binarization processing based on whether or not a template matching candidate image has at least one of luminance and saturation; A labeling processing unit that performs a labeling process on the candidate image and extracts a pixel block in the candidate image after binarization, and samples the position coordinates of the outermost periphery of the pixel block, An outer shape specifying unit that performs an outer shape specifying process for specifying a distance and an angle from a predetermined direction with reference to the barycentric position of the pixel block, the binarization process, the labeling process, and the outer shape specifying process for a template matching reference image A storage device for storing the reference outline data obtained by performing the processing, and the candidate image based on the reference outline data A correlation between the distance and the angle of the position coordinate and the distance and the angle of the position coordinate with respect to the reference image is specified, and the candidate image is selected from template matching candidates based on the specified degree of correlation.
  • the specific figure detection method includes a step of performing binarization processing based on whether or not a template matching candidate image has at least one of luminance and saturation, and the candidate after binarization Performing a labeling process on the image, extracting a pixel block in the binarized candidate image, sampling a position coordinate of the outermost periphery of the pixel block, and using the position coordinates as the position of the center of gravity of the pixel block
  • a step of performing an outer shape specifying process for specifying a distance and an angle from a predetermined direction with reference to a reference, and a reference obtained by performing the binarization process, the labeling process, and the outer shape specifying process for a template matching reference image Based on the outer shape data, the distance and the angle of the position coordinates of the candidate image, and the reference image Identifying a correlation between the distance and the angle of the position coordinates with respect to the, and excluding the candidate image from a template matching candidate based on the identified degree of correlation; and the reference image not excluded Performing template
  • a logo mark in a document image can be detected at high speed by template matching.
  • FIG. 1 is a block diagram showing a configuration of an image processing apparatus according to an embodiment of the present invention.
  • FIG. 2A is a diagram for explaining an outline specifying process in the image processing apparatus shown in FIG. 1 (1/2).
  • FIG. 2B is a diagram for explaining an outline specifying process in the image processing apparatus shown in FIG. 1 (2/2).
  • FIG. 1 is a block diagram showing a configuration of an image processing apparatus according to an embodiment of the present invention.
  • the image processing apparatus shown in FIG. 1 includes an arithmetic processing device 1 and a storage device 2.
  • the arithmetic processing device 1 incorporates, for example, a computer and functions as various processing units.
  • the storage device 2 is a nonvolatile storage device and stores various data.
  • the storage device 2 stores reference image data 21 and reference outline data 22.
  • the binarization processing unit 11 performs binarization processing based on whether or not the template matching reference image and candidate image have at least one of luminance and saturation. Specifically, when the binarization processing unit 11 has at least one of luminance and saturation for each pixel, the binarized value is set to 1, and neither luminance nor saturation is included. In this case, the value after binarization is set to 0.
  • template matching is performed between the reference image and the candidate image, and a candidate image that matches the reference image is detected.
  • the reference image is a logo mark (such as a company symbol mark) including a figure
  • the candidate image is extracted by removing characters, ruled lines, etc. from the original image, or the reference image constituent color or its configuration Image portions including similar colors within a predetermined range from the colors are extracted as candidate images.
  • the labeling processing unit 12 performs a labeling process on the reference image and the candidate image after binarization by the binarization processing unit 11, and one or a plurality of pixel blocks (identical to the binarized reference image and candidate image). A set of labeled pixels).
  • the labeling processing unit 12 performs a sharpening process, extracts an edge in the image, and specifies a pixel block. Note that the labeling processing unit 12 may perform a sharpening process after performing a smoothing process on the binarized reference image and the candidate image to remove noise and a screen.
  • the labeling process unit 12 After performing the dilation process on the candidate image after the binarization, the labeling process is performed. That is, when two adjacent pixel blocks are combined by the expansion process, the two pixel blocks are recognized as one pixel block.
  • FIG. 2A and FIG. 2B are diagrams for explaining an outline specifying process in the image processing apparatus shown in FIG.
  • the contour specifying unit 14 samples the position coordinates of the outermost periphery of the pixel block in the reference image and the candidate image at predetermined angles (for example, 1 degree), and uses the position coordinates (r, ⁇ ) as the position of the center of gravity of the pixel block.
  • An outer shape specifying process for specifying the reference distance r and the angle ⁇ from the predetermined direction is performed.
  • the reference image data 21 is image data of a reference image
  • the reference outer shape data 22 is data obtained by performing binarization processing, labeling processing, and outer shape specifying processing on a template matching reference image.
  • the correlation specifying unit 15 calculates the correlation between the position coordinate distance and angle (r, ⁇ ) for the candidate image and the position coordinate distance and angle (r, ⁇ ) for the reference image.
  • the candidate images are identified and excluded from the template matching candidates based on the identified degree of correlation.
  • the degree of correlation between the two is specified by shifting the characteristics in the range of 0 to 359 degrees.
  • the (r, ⁇ ) characteristic of the candidate image and the (r, ⁇ ) characteristic of the reference image are similar. Not.
  • the correlation specifying unit 15 determines the distance of the position coordinates of the candidate image. And the angle characteristic (that is, the characteristic of the distance r with respect to the angle ⁇ when the position coordinate is moved along the outermost periphery), and the relative position with respect to one of the distance and angle characteristics of the position coordinate with respect to the reference image Is shifted in the direction of the angle by a range corresponding to n described above to specify the correlation.
  • the degree of correlation between the two is specified by shifting the characteristics in the range of 0 to 359 degrees.
  • the degree of correlation between the two is specified by shifting the characteristics in the range of 0 to (360 / n-1) degrees.
  • the correlation specifying unit 15 may compare the aspect ratio of the reference image and the aspect ratio of the candidate image, and exclude the candidate image from the template matching candidates. For example, when the difference between the aspect ratios of the two becomes a predetermined threshold or more, the candidate image is excluded from the template matching candidates.
  • the template matching unit 16 performs template matching between the reference image and the candidate images that are not excluded by the correlation specifying unit 15 based on the reference image data 21 and the image data of the candidate images, and candidates that are excluded by the correlation specifying unit 15 Do not perform template matching on images.
  • template matching the pixel value of the reference image based on the reference image data 21 and the pixel value of the candidate image are compared for each pixel, and whether or not the reference image matches the candidate image based on the comparison result. Is determined.
  • the correlation specifying unit 15 determines the size of the candidate image from the (r, ⁇ ) characteristic of the candidate image and the (r, ⁇ ) characteristic of the reference image.
  • a ratio (magnification ratio) with the size of the reference image is calculated.
  • the template matching unit 16 performs template matching by scaling the candidate image or the reference image so that the size of the candidate image becomes the same as the size of the reference image based on the calculated scaling factor.
  • reference image data 21 of a desired reference image is prepared by a user and stored in a storage device.
  • the reference image data 21 may be generated by, for example, CAD (Computer Aided Design), or may be generated by causing a scanner to read a document on which a reference image is printed.
  • the binarization processing unit 11, the labeling processing unit 12, the structure analysis unit 13, and the outer shape specifying unit 14 generate reference outer shape data 22 from the reference image data 21 and store it in the storage device 2.
  • the binarization processing unit 11 After that, for example, when a template matching candidate image is obtained from a document image read by a scanner, the binarization processing unit 11 performs binarization processing on the candidate image.
  • the labeling processing unit 12 performs a labeling process on the candidate image after binarization by the binarization processing unit 11 and extracts one or a plurality of pixel blocks.
  • the structural analysis unit 13 performs dilation processing (processing for expanding the outer periphery of each pixel block) or contraction processing (processing for reducing the outer periphery of each pixel block) on the binarized reference image, and performs labeling.
  • dilation processing processing for expanding the outer periphery of each pixel block
  • contraction processing processing for reducing the outer periphery of each pixel block
  • the labeling processing unit 12 dilates the binarized candidate image. After performing the processing, the labeling processing is performed.
  • the outer shape specifying unit 14 performs the outer shape specifying process in order to obtain the outer shape data of the candidate image (sampling data of the above-described outermost position coordinates (r, ⁇ )).
  • specification part 15 specifies the correlation coefficient of both position coordinates (r, (theta)) based on the reference
  • the candidate image is excluded from the template matching candidates.
  • the template matching unit 16 performs template matching between the reference image and the candidate images that are not excluded by the correlation specifying unit 15 based on the reference image data 21 and the image data of the candidate images, and candidates that are excluded by the correlation specifying unit 15 Do not perform template matching on images.
  • the binarization processing unit 11 performs binarization processing on the template matching candidate image
  • the labeling processing unit 12 applies the binarization candidate image to the candidate image after binarization.
  • a labeling process is performed on the extracted candidate image, and the pixel block in the binarized candidate image is extracted.
  • An outer shape specifying process is performed for specifying a reference distance and an angle from a predetermined direction.
  • the correlation specifying unit 15 specifies the distance and angle correlation of the position coordinates for the reference image and the candidate image based on the reference outline data, and excludes the candidate image from the template matching candidates based on the specified degree of correlation. .
  • the template matching unit 16 performs template matching only for candidate images that are not excluded by the correlation specifying unit 15.
  • the structure analysis unit 13 is used, but the outer shape specifying process may be performed immediately after the labeling process without using the structure analysis unit 13.
  • the present invention can be applied to, for example, detection of a logo mark including a figure in a document image.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

 2値化処理部(11)は、テンプレートマッチングの候補画像に対して、輝度および彩度の少なくとも一方を有するか否かに基づき2値化処理を行い、ラベリング処理部(12)は、2値化後の候補画像に対してラベリング処理を行って画素ブロックを抽出し、外形特定部(14)は、画素ブロックの最外周の位置座標をサンプリングし、その位置座標として、画素ブロックの重心位置を基準とした距離および所定方向からの角度を特定する外形特定処理を行う。相関特定部(15)は、基準外形データに基づいて、基準画像および候補画像についての位置座標の距離および角度の相関を特定し、特定した相関の度合いに基づいて候補画像をテンプレートマッチングの候補から除外する。

Description

画像処理装置および特定図形検出方法
 本発明は、画像処理装置および特定図形検出方法に関するものである。
 近年、原稿画像内に存在するフルカラーのロゴマークを検出したいという要求が強くなっている。図形を含むロゴマークの場合、OCR(Optical Character Recognition)技術では検出できないため、パターンマッチング技術を利用して検出される。パターンマッチング技術では、基準画像と、対象画像とのマッチングの度合いが算出される(例えば特許文献1参照)。
特開2007-79982号公報
 しかしながら、原稿画像内に存在するロゴマークは、サイズ、回転角などについて様々な状態となっており、そのようなロゴマーク(特にフルカラーのログマーク)をテンプレートマッチングで高速に検出することは困難である。
 本発明は、上記の問題に鑑みてなされたものであり、原稿画像内のロゴマークをテンプレートマッチングで高速に検出する画像処理装置および特定図形検出方法を得ることを目的とする。
 本発明に係る画像処理装置は、テンプレートマッチングの候補画像に対して、輝度および彩度の少なくとも一方を有するか否かに基づき、2値化処理を行う2値化処理部と、2値化後の前記候補画像に対してラベリング処理を行い、2値化後の前記候補画像における画素ブロックを抽出するラベリング処理部と、前記画素ブロックの最外周の位置座標をサンプリングし、前記位置座標として、前記画素ブロックの重心位置を基準とした距離および所定方向からの角度を特定する外形特定処理を行う外形特定部と、テンプレートマッチングの基準画像について前記2値化処理、前記ラベリング処理、および前記外形特定処理を行うことで得られる基準外形データを記憶する記憶装置と、前記基準外形データに基づいて、前記候補画像についての前記位置座標の前記距離および前記角度と、前記基準画像についての前記位置座標の前記距離および前記角度との相関を特定し、特定した前記相関の度合いに基づいて前記候補画像をテンプレートマッチングの候補から除外する相関特定部と、前記基準画像と前記相関特定部により除外されなかった前記候補画像とのテンプレートマッチングを行い、前記相関特定部により除外された前記候補画像についてテンプレートマッチングを行わないテンプレートマッチング部とを備える。
 本発明に係る特定図形検出方法は、テンプレートマッチングの候補画像に対して、輝度および彩度の少なくとも一方を有するか否かに基づき、2値化処理を行うステップと、2値化後の前記候補画像に対してラベリング処理を行い、2値化後の前記候補画像における画素ブロックを抽出するステップと、前記画素ブロックの最外周の位置座標をサンプリングし、前記位置座標として、前記画素ブロックの重心位置を基準とした距離および所定方向からの角度を特定する外形特定処理を行うステップと、テンプレートマッチングの基準画像について前記2値化処理、前記ラベリング処理、および前記外形特定処理を行うことで得られる基準外形データに基づき、前記候補画像についての前記位置座標の前記距離および前記角度と、前記基準画像についての前記位置座標の前記距離および前記角度との相関を特定し、特定した前記相関の度合いに基づいて前記候補画像をテンプレートマッチングの候補から除外するステップと、前記基準画像と除外されなかった前記候補画像とのテンプレートマッチングを行い、除外された前記候補画像についてテンプレートマッチングを行わないステップとを備える。
 本発明によれば、原稿画像内のロゴマークをテンプレートマッチングで高速に検出することができる。
図1は、本発明の実施の形態に係る画像処理装置の構成を示すブロック図である。 図2Aは、図1に示す画像処理装置における外形特定処理について説明する図である(1/2)。 図2Bは、図1に示す画像処理装置における外形特定処理について説明する図である(2/2)。
 以下、図に基づいて本発明の実施の形態を説明する。
 図1は、本発明の実施の形態に係る画像処理装置の構成を示すブロック図である。
図1に示す画像処理装置は、演算処理装置1および記憶装置2を備える。演算処理装置1は、例えばコンピューターなどを内蔵し、各種処理部として機能する。記憶装置2は、不揮発性の記憶装置であって、各種データを記憶している。
 図1における演算処理装置1は、2値化処理部11、ラベリング処理部12、構造解析部13、外形特定部14、相関特定部15、およびテンプレートマッチング部16として機能する。また、記憶装置2には、基準画像データ21および基準外形データ22が記憶されている。
 2値化処理部11は、テンプレートマッチングの基準画像および候補画像に対して、輝度および彩度の少なくとも一方を有するか否かに基づき、2値化処理を行う。具体的には、2値化処理部11は、各画素について、輝度および彩度の少なくとも一方を有する場合には、2値化後の値を1とし、輝度および彩度のいずれも有さない場合には、2値化後の値を0とする。
 なお、テンプレートマッチングは、基準画像と候補画像との間で行われ、基準画像に合致する候補画像が検出される。ここでは、基準画像は、図形を含むロゴマーク(企業のシンボルマークなど)であり、候補画像は、原稿画像内から文字、罫線などを除去して抽出されたり、基準画像の構成色またはその構成色から所定範囲内の類似色を含む画像部分が候補画像としてそれぞれ抽出される。
 ラベリング処理部12は、2値化処理部11による2値化後の基準画像および候補画像に対してラベリング処理を行い、2値化後の基準画像および候補画像における1または複数の画素ブロック(同一ラベルを付された画素の集合)を抽出する。
 このとき、ラベリング処理部12は、鮮鋭化処理を行い画像内のエッジを抽出し、画素ブロックを特定する。なお、ラベリング処理部12は、2値化後の基準画像および候補画像に対して平滑化処理を行った後に鮮鋭化処理を行い、ノイズやスクリーンを除去するようにしてもよい。
 構造解析部13は、ラベリング処理部12を使用して、2値化後の基準画像に対して膨張処理または収縮処理を行うと膨張処理または収縮処理の前後で画素ブロックの数が変動するか否かを判定する。
 2値化後の基準画像に対して膨張処理または収縮処理を行うと膨張処理または収縮処理の前後における画素ブロックの数が変動すると構造解析部13により判定された場合、ラベリング処理部12は、2値化後の候補画像に対して膨張処理を行った後に、ラベリング処理を行う。つまり、近接する2つの画素ブロックが膨張処理によって結合する場合、その2つの画素ブロックは1つの画素ブロックとして認識される。
 図2Aおよび図2Bは、図1に示す画像処理装置における外形特定処理について説明する図である。外形特定部14は、基準画像および候補画像における画素ブロックの最外周の位置座標を所定の角度(例えば1度)ごとにサンプリングし、その位置座標(r,θ)として、画素ブロックの重心位置を基準とした距離rおよび所定方向からの角度θを特定する外形特定処理を行う。
 また、基準画像データ21は、基準画像のイメージデータであり、基準外形データ22は、テンプレートマッチングの基準画像について2値化処理、ラベリング処理、および外形特定処理を行うことで得られるデータである。
 相関特定部15は、基準外形データ22に基づいて、候補画像についての位置座標の距離および角度(r,θ)と、基準画像についての位置座標の距離および角度(r,θ)との相関を特定し、特定した相関の度合いに基づいて候補画像をテンプレートマッチングの候補から除外する。
 このとき、0~359度の範囲で特性をシフトさせて両者の相関の度合いが特定される。このようにすることで、候補画像が、基準画像を回転させたものである場合、そのような候補画像は除外されない。
 また、候補画像が、基準画像をサイズ変更したものである場合、候補画像の(r,θ)特性と基準画像の(r,θ)特性とは相似となるため、そのような候補画像は除外されない。
 ここでは、基準画像は、図形を含むロゴマークであり、そのロゴマークがn回(n>1)対称の回転対称の図形である場合、相関特定部15は、候補画像についての位置座標の距離および角度の特性(つまり、最外周に沿って位置座標を動かした際の角度θに対する距離rの特性)、並びに基準画像についての位置座標の距離および角度の特性のうちの一方の他方に対する相対位置を、上述のnに応じた範囲だけ角度の方向にシフトさせて相関を特定する。
 つまり、ロゴマークが回転対称の図形ではない場合には、0~359度の範囲で特性をシフトさせて両者の相関の度合いが特定されるが、ロゴマークがn回対称の図形である場合には、0~(360/n-1)度の範囲で特性をシフトさせることで両者の相関の度合いが特定される。
 また、相関特定部15は、基準画像のアスペクト比および候補画像のアスペクト比を比較して、候補画像をテンプレートマッチングの候補から除外するようにしてもよい。例えば、両者のアスペクト比の差が所定の閾値以上となった場合に、候補画像をテンプレートマッチングの候補から除外する。
 テンプレートマッチング部16は、基準画像データ21および候補画像の画像データに基づいて、基準画像と相関特定部15により除外されなかった候補画像とのテンプレートマッチングを行い、相関特定部15により除外された候補画像についてテンプレートマッチングを行わない。なお、テンプレートマッチングでは、基準画像データ21に基づく基準画像の画素値と候補画像の画素値とが1画素ごとに比較され、その比較結果に基づいて基準画像と候補画像とが一致するか否かが判定される。
 なお、候補画像が、基準画像をサイズ変更したものである場合、相関特定部15は、候補画像の(r,θ)特性と基準画像の(r,θ)特性とから、候補画像のサイズと基準画像のサイズとの比率(変倍率)を算出する。テンプレートマッチング部16は、算出された変倍率に基づき、候補画像のサイズと基準画像のサイズとが同じになるように候補画像または基準画像を変倍して、テンプレートマッチングを行う。
 次に、上記画像処理装置の動作について説明する。
 まず、ユーザーによって所望の基準画像の基準画像データ21を用意され記憶装置に記憶される。基準画像データ21は、例えばCAD(Computer Aided Design)で生成してもよいし、基準画像が印刷された原稿をスキャナーに読み取らせて生成するようにしてもよい。次に、2値化処理部11、ラベリング処理部12、構造解析部13、および外形特定部14は、その基準画像データ21から基準外形データ22を生成し、記憶装置2に記憶する。
 その後、例えばスキャナーで読み取られた原稿画像からテンプレートマッチングの候補画像が得られると、2値化処理部11は、その候補画像に対して2値化処理を行う。
 次に、ラベリング処理部12は、2値化処理部11による2値化後の候補画像に対してラベリング処理を行い、1または複数の画素ブロックを抽出する。
 さらに、このとき、構造解析部13は、2値化後の基準画像に対して膨張処理(各画素ブロックの外周を拡げる処理)または収縮処理(各画素ブロックの外周を縮める処理)を行い、ラベリング処理部12を使用して、2値化後の基準画像に対して膨張処理または収縮処理を行うと膨張処理または収縮処理の前後における画素ブロックの数が変動するか否かを判定する。例えば、図2Aに示すような連結箇所が、膨張処理で繋がったり、収縮処理で離れたりする。
 2値化後の基準画像に対する膨張処理または収縮処理の前後で画素ブロックの数が変動すると構造解析部13により判定された場合、ラベリング処理部12は、2値化後の候補画像に対して膨張処理を行った後に、ラベリング処理を行う。
 これにより、仮に図2Aにおける連結箇所が離れた状態で複数の画素ブロックが検出されていても図2Bに示すような1つの画素ブロックに対してラベリング処理が行われる。
 そして、外形特定部14は、候補画像の外形データ(上述の最外周の位置座標(r,θ)のサンプリングデータ)を得るために、外形特定処理を行う。
 そして、相関特定部15は、基準外形データ22および候補画像の外形データに基づいて、両者の位置座標(r,θ)の相関係数を特定し、特定した相関係数が所定の閾値未満の候補画像をテンプレートマッチングの候補から除外する。
 テンプレートマッチング部16は、基準画像データ21および候補画像の画像データに基づいて、基準画像と相関特定部15により除外されなかった候補画像とのテンプレートマッチングを行い、相関特定部15により除外された候補画像についてテンプレートマッチングを行わない。
 以上のように、上記実施の形態によれば、2値化処理部11は、テンプレートマッチングの候補画像に対して2値化処理を行い、ラベリング処理部12は、2値化後の候補画像に対してラベリング処理を行い、2値化後の候補画像における画素ブロックを抽出し、外形特定部14は、画素ブロックの最外周の位置座標をサンプリングし、その位置座標として、画素ブロックの重心位置を基準とした距離および所定方向からの角度を特定する外形特定処理を行う。相関特定部15は、基準外形データに基づいて、基準画像および候補画像についての位置座標の距離および角度の相関を特定し、特定した相関の度合いに基づいて候補画像をテンプレートマッチングの候補から除外する。そして、テンプレートマッチング部16は、相関特定部15により除外されなかった候補画像についてのみテンプレートマッチングを行う。
 これにより、テンプレートマッチングの前処理で、外形の全く異なる候補画像が除外されるため、テンプレートマッチングすべき候補画像が減り、結果として、原稿画像内のロゴマークをテンプレートマッチングで高速に検出することができる。
 なお、上述の実施の形態は、例示および説明を目的として示したものであり、これがすべてではなく、発明をこの形態に限定するものではない。
 例えば、上記実施の形態では、構造解析部13を使用しているが、構造解析部13を使用せずにラベリング処理後にただちに外形特定処理を行うようにしてもよい。
 また、上述の実施の形態に対する様々な変更および修正については、当業者には明らかである。そのような変更および修正は、その主題の趣旨および範囲から離れることなく、かつ、意図された利点を弱めることなく行われてもよい。つまり、そのような変更および修正が追加請求項に含まれることを意図している。
 本発明は、例えば、原稿画像内の、図形を含むロゴマークの検出に適用可能である。

Claims (6)

  1.  テンプレートマッチングの候補画像に対して、輝度および彩度の少なくとも一方を有するか否かに基づき、2値化処理を行う2値化処理部と、
     2値化後の前記候補画像に対してラベリング処理を行い、2値化後の前記候補画像における画素ブロックを抽出するラベリング処理部と、
     前記画素ブロックの最外周の位置座標をサンプリングし、前記位置座標として、前記画素ブロックの重心位置を基準とした距離および所定方向からの角度を特定する外形特定処理を行う外形特定部と、
     テンプレートマッチングの基準画像について前記2値化処理、前記ラベリング処理、および前記外形特定処理を行うことで得られる基準外形データを記憶する記憶装置と、
     前記基準外形データに基づいて、前記候補画像についての前記位置座標の前記距離および前記角度と、前記基準画像についての前記位置座標の前記距離および前記角度との相関を特定し、特定した前記相関の度合いに基づいて前記候補画像をテンプレートマッチングの候補から除外する相関特定部と、
     前記基準画像と前記相関特定部により除外されなかった前記候補画像とのテンプレートマッチングを行い、前記相関特定部により除外された前記候補画像についてテンプレートマッチングを行わないテンプレートマッチング部と、
     を備えることを特徴とする画像処理装置。
  2.  2値化後の前記基準画像に対して膨張処理または収縮処理を行うと前記膨張処理または前記収縮処理の前後で前記画素ブロックの数が変動する場合、前記ラベリング処理部は、2値化後の前記候補画像に対して前記膨張処理を行った後に、前記ラベリング処理を行うことを特徴とする請求項1記載の画像処理装置。
  3.  前記基準画像は、図形を含むロゴマークであって、
     前記相関特定部は、前記ロゴマークがn回対称の回転対称の図形である場合、前記候補画像についての前記位置座標の前記距離および前記角度の特性、並びに前記基準画像についての前記位置座標の前記距離および前記角度の特性のうちの一方の他方に対する相対位置を、前記nに応じた範囲だけ前記角度の方向にシフトさせて前記相関を特定すること、
     を特徴とする請求項1記載の画像処理装置。
  4.  前記相関特定部は、前記基準画像のアスペクト比および前記候補画像のアスペクト比を比較して、前記候補画像をテンプレートマッチングの候補から除外することを特徴とする請求項1記載の画像処理装置。
  5.  前記候補画像が、前記基準画像をサイズ変更したものである場合、前記相関特定部は、前記候補画像の(r,θ)特性と前記基準画像の(r,θ)特性とから、前記候補画像のサイズと前記基準画像のサイズとの比率を変倍率として算出し、前記テンプレートマッチング部は、算出された前記変倍率に基づき、前記候補画像のサイズと前記基準画像のサイズとが同じになるように前記候補画像または前記基準画像を変倍して、前記テンプレートマッチングを行うことを特徴とする請求項1記載の画像処理装置。
  6.  テンプレートマッチングの候補画像に対して、輝度および彩度の少なくとも一方を有するか否かに基づき、2値化処理を行うステップと、
     2値化後の前記候補画像に対してラベリング処理を行い、2値化後の前記候補画像における画素ブロックを抽出するステップと、
     前記画素ブロックの最外周の位置座標をサンプリングし、前記位置座標として、前記画素ブロックの重心位置を基準とした距離および所定方向からの角度を特定する外形特定処理を行うステップと、
     テンプレートマッチングの基準画像について前記2値化処理、前記ラベリング処理、および前記外形特定処理を行うことで得られる基準外形データに基づき、前記候補画像についての前記位置座標の前記距離および前記角度と、前記基準画像についての前記位置座標の前記距離および前記角度との相関を特定し、特定した前記相関の度合いに基づいて前記候補画像をテンプレートマッチングの候補から除外するステップと、
     前記基準画像と除外されなかった前記候補画像とのテンプレートマッチングを行い、除外された前記候補画像についてテンプレートマッチングを行わないステップと、
     を備えることを特徴とする特定図形検出方法。
PCT/JP2014/083857 2013-12-27 2014-12-22 画像処理装置および特定図形検出方法 WO2015098810A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US15/104,967 US9665938B2 (en) 2013-12-27 2014-12-22 Image processing apparatus and specific figure detecting method
JP2015554865A JP5993100B2 (ja) 2013-12-27 2014-12-22 画像処理装置および特定図形検出方法
CN201480068336.XA CN105814608B (zh) 2013-12-27 2014-12-22 图像处理装置和特定图形检测方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2013271374 2013-12-27
JP2013-271374 2013-12-27

Publications (1)

Publication Number Publication Date
WO2015098810A1 true WO2015098810A1 (ja) 2015-07-02

Family

ID=53478664

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2014/083857 WO2015098810A1 (ja) 2013-12-27 2014-12-22 画像処理装置および特定図形検出方法

Country Status (4)

Country Link
US (1) US9665938B2 (ja)
JP (1) JP5993100B2 (ja)
CN (1) CN105814608B (ja)
WO (1) WO2015098810A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117746056A (zh) * 2023-12-26 2024-03-22 江苏福拉特自动化设备有限公司 一种查找屏体标记的方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6968342B2 (ja) * 2017-12-25 2021-11-17 オムロン株式会社 物体認識処理装置、物体認識処理方法及びプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002158999A (ja) * 2000-08-31 2002-05-31 Hitachi Kokusai Electric Inc 物体検出方法及び物体検出装置並びに侵入物体監視装置
JP2003123080A (ja) * 2001-10-11 2003-04-25 Seiko Epson Corp 画像認識方法及び画像認識装置
JP2013161241A (ja) * 2012-02-03 2013-08-19 Toyota Motor Corp 物体認識装置、物体認識方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11265282A (ja) 1998-03-17 1999-09-28 Toshiba Corp 自動販売機の制御装置
US7082209B2 (en) 2000-08-31 2006-07-25 Hitachi Kokusai Electric, Inc. Object detecting method and object detecting apparatus and intruding object monitoring apparatus employing the object detecting method
US7231063B2 (en) * 2002-08-09 2007-06-12 Intersense, Inc. Fiducial detection system
JP4658756B2 (ja) * 2005-09-14 2011-03-23 株式会社日立ハイテクノロジーズ 画像処理装置、画像処理方法および走査型電子顕微鏡
JP4173901B2 (ja) * 2006-05-19 2008-10-29 本田技研工業株式会社 車両周辺監視装置
JP4173902B2 (ja) * 2006-05-19 2008-10-29 本田技研工業株式会社 車両周辺監視装置
US8160366B2 (en) * 2008-06-20 2012-04-17 Sony Corporation Object recognition device, object recognition method, program for object recognition method, and recording medium having recorded thereon program for object recognition method
DE102008052928A1 (de) * 2008-10-23 2010-05-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung, Verfahren und Computerprogramm zur Erkennung einer Geste in einem Bild, sowie Vorrichtung, Verfahren und Computerprogramm zur Steuerung eines Geräts
US8317325B2 (en) * 2008-10-31 2012-11-27 Cross Match Technologies, Inc. Apparatus and method for two eye imaging for iris identification
JP4762327B2 (ja) * 2009-03-24 2011-08-31 シャープ株式会社 画像処理装置及び画像形成装置
JP5733570B2 (ja) * 2011-05-23 2015-06-10 ソニー株式会社 画像処理装置、画像処理方法、プログラム、および、記録媒体

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002158999A (ja) * 2000-08-31 2002-05-31 Hitachi Kokusai Electric Inc 物体検出方法及び物体検出装置並びに侵入物体監視装置
JP2003123080A (ja) * 2001-10-11 2003-04-25 Seiko Epson Corp 画像認識方法及び画像認識装置
JP2013161241A (ja) * 2012-02-03 2013-08-19 Toyota Motor Corp 物体認識装置、物体認識方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
KAZUHISA SHIIYA: "A Study of Circular Road Sign Recognition from a Color Image", IEICE TECHNICAL REPORT, vol. 109, no. 325, 1 December 2009 (2009-12-01), pages 13 - 16 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117746056A (zh) * 2023-12-26 2024-03-22 江苏福拉特自动化设备有限公司 一种查找屏体标记的方法
CN117746056B (zh) * 2023-12-26 2024-06-04 江苏福拉特自动化设备有限公司 一种查找屏体标记的方法

Also Published As

Publication number Publication date
CN105814608B (zh) 2017-03-15
JPWO2015098810A1 (ja) 2017-03-23
JP5993100B2 (ja) 2016-09-14
US9665938B2 (en) 2017-05-30
CN105814608A (zh) 2016-07-27
US20160321813A1 (en) 2016-11-03

Similar Documents

Publication Publication Date Title
WO2018068415A1 (zh) 元件错件检测方法和系统
CN105303156B (zh) 字符检测装置、方法及程序
JP2008217347A (ja) ナンバープレート認識装置、その制御方法、コンピュータプログラム
JP6343648B2 (ja) 円検出方法、円検出装置、プログラム及び記憶媒体
CN107545223B (zh) 图像识别方法及电子设备
JP2018142189A (ja) プログラム、測距方法、及び測距装置
CN110462634A (zh) 标志检测视频分析法
Yadav et al. Text extraction in document images: highlight on using corner points
JP2018096908A (ja) 検査装置及び検査方法
JP5111055B2 (ja) 画像処理装置及び画像処理方法、コンピュータプログラム
CN112419207A (zh) 一种图像矫正方法及装置、系统
JP5993100B2 (ja) 画像処理装置および特定図形検出方法
JP6496159B2 (ja) パターン検査装置およびパターン検査方法
CN107748897B (zh) 基于模式识别的大尺寸弯曲零件轮廓度质量检测方法
JP2011107878A (ja) 位置検出装置、位置検出方法
US9792675B1 (en) Object recognition using morphologically-processed images
JP2013254242A (ja) 画像認識装置、画像認識方法および画像認識プログラム
JP2007140729A (ja) 物品の位置及び姿勢を検出する方法および装置
TWI384418B (zh) 採用區域架構之影像處理方法及系統
JP2010191767A (ja) 文字認識装置及び文字認識方法
JP4936250B2 (ja) 書込み抽出方法、書込み抽出装置および書込み抽出プログラム
JP6468880B2 (ja) 文字領域抽出装置及びプログラム
WO2017088478A1 (zh) 数字分离方法及装置
JP7405528B2 (ja) 媒体判別装置、媒体判別システム及び媒体判別方法
JP2009080630A (ja) 画像処理装置及びプログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 14875334

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2015554865

Country of ref document: JP

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 15104967

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 14875334

Country of ref document: EP

Kind code of ref document: A1