JP2018500706A - 領域認識方法及び装置 - Google Patents
領域認識方法及び装置 Download PDFInfo
- Publication number
- JP2018500706A JP2018500706A JP2017547048A JP2017547048A JP2018500706A JP 2018500706 A JP2018500706 A JP 2018500706A JP 2017547048 A JP2017547048 A JP 2017547048A JP 2017547048 A JP2017547048 A JP 2017547048A JP 2018500706 A JP2018500706 A JP 2018500706A
- Authority
- JP
- Japan
- Prior art keywords
- region
- area
- face
- certificate image
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/245—Aligning, centring, orientation detection or correction of the image by locating a pattern; Special marks for positioning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/10—Image acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/1444—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
- G06V30/1448—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on markings or identifiers characterising the document or the area
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/1801—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
- G06V30/18067—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections by mapping characteristic values of the pattern into a parameter space, e.g. Hough transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/18086—Extraction of features or characteristics of the image by performing operations within image blocks or by using histograms
- G06V30/18095—Summing image-intensity values; Projection and histogram analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R33/00—Arrangements or instruments for measuring magnetic variables
- G01R33/20—Arrangements or instruments for measuring magnetic variables involving magnetic resonance
- G01R33/44—Arrangements or instruments for measuring magnetic variables involving magnetic resonance using nuclear magnetic resonance [NMR]
- G01R33/48—NMR imaging systems
- G01R33/54—Signal processing systems, e.g. using pulse sequences ; Generation or control of pulse sequences; Operator console
- G01R33/56—Image enhancement or correction, e.g. subtraction or averaging techniques, e.g. improvement of signal-to-noise ratio and resolution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
- G06T2207/30201—Face
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Bioinformatics & Computational Biology (AREA)
- Radiology & Medical Imaging (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Signal Processing (AREA)
- High Energy & Nuclear Physics (AREA)
- Condensed Matter Physics & Semiconductors (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
- Image Processing (AREA)
- Collating Specific Patterns (AREA)
Abstract
Description
証明書類画像における顔領域の領域位置を取得することと、
前記顔領域の領域位置に基づき少なくとも1つの情報領域を決定することと、
前記情報領域に対して領域切断を行い、少なくとも1つのキャラクター領域を得ることと、を含む領域認識方法を提供している。
前記顔領域の領域位置は前記顔領域の所定縁で示され、
前記証明書類画像における顔領域の領域位置を取得することは、
前記証明書類画像を顔認識し、前記顔領域を得ることと、
前記顔領域に基づき前記顔領域の前記所定縁を認識することと、を含む。
前記証明書類画像を顔認識し、前記顔領域を得ることは、
所定の顔サイズに対する顔モデルによって、前記証明書類画像における所定領域を顔認識し、前記顔領域を得ることを含む。
前記顔領域に基づき前記顔領域の前記所定縁を認識することは、
前記顔領域の下部に基づき前記顔領域の下縁を含む関心領域を決定することと、
前記関心領域を直線検出し、前記顔領域の下縁を認識することと、を含む。
前記関心領域を直線検出し、前記顔領域の下縁を認識することは、
前記関心領域に対してソーベル水平フィルタリング及び2値化を行い、処理後の前記関心領域を得ることと、
前記処理後の前記関心領域に対してハフ(Hough)変換を行い、長さが所定の長さよりも大きい線分を得て、前記線分を前記顔領域の下縁として認識することと、を含む。
前記所定縁の傾きに基づいて、前記証明書類画像に対して勾配補正を行うことを更に含む。
前記所定縁の傾きに基づいて、前記証明書類画像に対して勾配補正を行うことは、
前記所定縁の傾きに基づいて、前記所定縁と水平方向とのなす角度を決定することと、
前記証明書類画像を前記角度に応じて回転させ、回転後の前記証明書類画像における前記所定縁が前記水平方向と平行になることと、を含む。
前記情報領域に対して領域切断を行い、少なくとも1つのキャラクター領域を得ることは、
前記情報領域を2値化し、2値化後の情報領域を得ることと、
前記2値化後の情報領域に対して水平方向に応じて第1ヒストグラムを算出し、前記第1ヒストグラムが、各行ピクセルの縦座標及び前記各行ピクセルにおける前景色ピクセルの累積値を含むことと、
前記第1ヒストグラムにおける前景色ピクセルの累積値が第1閾値よりも大きい行からなる連続行セットに基づき、n行の文字領域を認識して、nが正整数であることと、
第i行の文字領域に対して、垂直方向に応じて第2ヒストグラムを算出し、前記第2ヒストグラムが、各列のピクセルの横座標と前記各列のピクセルにおける前景色ピクセルの累積値を含み、n≧i≧1、iが正整数であることと、
前記第2ヒストグラムにおける前景色ピクセルの累積値が第2閾値よりも大きい列からなる連続列セットに基づいて、ni個のキャラクター領域を認識する。
証明書類画像における顔領域の領域位置を取得するように配置される取得モジュールと、
前記顔領域の領域位置に基づき少なくとも1つの情報領域を決定するように配置される決定モジュールと、
前記情報領域に対して領域切断を行い、少なくとも1つのキャラクター領域を得るように配置される切断モジュールと、を備える領域認識装置を提供している。
前記顔領域の領域位置は前記顔領域の所定縁で示され、
前記取得モジュールは、
前記証明書類画像を顔認識し、前記顔領域を得るように配置される第1認識サブモジュールと、
前記顔領域に基づき前記顔領域の前記所定縁を認識するように配置される第2認識サブモジュールと、を備える。
前記第1認識サブモジュールは、所定の顔サイズに対する顔モデルによって、前記証明書類画像における所定領域を顔認識し、前記顔領域を得るように配置される。
前記第2認識サブモジュールは、
前記顔領域の下部に基づき前記顔領域の下縁を含む関心領域を決定するように配置される関心決定サブモジュールと、
前記関心領域を直線検出し、前記顔領域の下縁を認識するように配置される検出サブモジュールと、を備える。
前記検出サブモジュールは、
前記関心領域に対してソーベル水平フィルタリング及び2値化を行い、処理後の前記関心領域を得るように配置されるフィルタリングサブモジュールと、
前記処理後の前記関心領域に対して直線フィッティング又はハフ(Hough)変換を行い、長さが所定の長さよりも大きい線分を得て、前記線分を前記顔領域の下縁として認識するように配置される変換サブモジュールと、を備える。
前記所定縁の傾きに基づいて、前記証明書類画像に対して勾配補正を行うように配置される修正モジュールを更に備える。
前記修正モジュールは、
前記所定縁の傾きに基づいて、前記所定縁と水平方向とのなす角度を決定するように配置される角度決定サブモジュールと、
前記証明書類画像を前記角度に応じて回転させ、回転後の前記証明書類画像における前記所定縁が前記水平方向と平行になるように配置される回転サブモジュールと、を備える。
前記切断モジュールは、
前記情報領域を2値化し、2値化後の情報領域を得るように配置される2値化サブモジュールと、
前記2値化後の情報領域に対して水平方向に応じて第1ヒストグラムを算出し、前記第1ヒストグラムが、各行ピクセルの縦座標及び前記各行ピクセルにおける前景色ピクセルの累積値を含むように配置される第1算出サブモジュールと、
前記第1ヒストグラムにおける前景色ピクセルの累積値が第1閾値よりも大きい行からなる連続行セットに基づいて、n行の文字領域を認識し、nが正整数であるように配置される行認識サブモジュールと、
i行目の文字領域に対して、垂直方向に応じて第2ヒストグラムを算出し、前記第2ヒストグラムが各列のピクセルの横座標及び前記各列のピクセルにおける前景色ピクセルの累積値を含み、n≧i≧1、iが正整数であるように配置される第2算出サブモジュールと、
前記第2ヒストグラムにおける前景色ピクセルの累積値が第2閾値よりも大きい列からなる連続列セットに基づいて、ni個のキャラクター領域を認識するように配置されるキャラクター認識サブモジュールと、を備える。
証明書類画像における顔領域の領域位置を取得し、
前記顔領域の領域位置に基づき少なくとも1つの情報領域を決定し、
前記情報領域に対して領域切断を行い、少なくとも1つのキャラクター領域を得るように配置されるプロセッサと、
前記プロセッサにより実行可能なコマンドを記憶するためのメモリと、を備える領域認識装置を提供している。
証明書類画像は証明書類を直接的に撮影して得た画像であり、例えば、身分証明書画像、社会保障カード画像等が挙げられる。
ステップ202aにおいて、所定の顔サイズの顔モデルに対して、証明書類画像における所定領域を顔認識し、顔領域を得る。
ステップ205aにおいて、所定縁の傾きに基づいて、所定縁と水平方向とのなす角度を決定し、
端末は顔領域の下縁と水平方向とのなす角度を算出する。該角度も証明書類と水平方向とのなす角度である。
ステップ208aにおいて、情報領域を2値化し、2値化後の情報領域を得る。
第1ヒストグラムに基づいて、各行のピクセルにおける前景色ピクセルの累積値を取得し、各行のピクセルにおける前景色ピクセルの累積値と第1閾値を比較し、第1ヒストグラムにおける前景色ピクセルの累積値が第1閾値よりも大きい行からなる連続行セットを、文字領域が所在する行として決定することができる。
証明書類画像は証明書類を直接的に撮影した画像であり、例えば、身分証明書画像、社会保障カード画像等が挙げられる。
情報領域は、証明書類画像において文字情報がある領域、例えば、名前情報領域、生年月日情報領域、性別領域、アドレス情報領域、公民身分証明書番号情報領域、番号情報領域、証明書発行機関情報領域および有効期限情報領域などの情報領域のうちの少なくとも1種を意味する。
本実施例において、取得モジュール610は下記のサブモジュールを備えてもよい。
証明書類には通常ユーザーの証明写真があるため、証明書類画像には顔領域が存在する。顔認識技術により、証明書類画像から顔領域を認識することができる。
証明書類画像のタイプが既知した際に、顔領域の所定縁と証明書類におけるその他の情報領域の間に固定の相対的な位置関係が存在し、決定モジュール620は顔領域の所定縁と該相対的な位置関係に基づき少なくとも1つの情報領域を決定する。
関心決定サブモジュール810は、顔領域の下部に基づき顔領域の下縁を含む関心領域を決定するように配置され、
関心決定サブモジュール810は、顔領域の下部に所定のウィンドウに応じて関心領域を決定し、該関心領域は顔領域の下縁を覆うことを基準とする。
フィルタリングサブモジュール821は、関心領域をソーベル水平フィルタリング及び2値化し、処理後の関心領域を得るように配置され、
まず、フィルタリングサブモジュール821は関心決定サブモジュール810における関心領域をソーベル(sobel)水平フィルタリングし、即ちソーベル(sobel)演算子を使用して水平方向に沿ってフィルタリングする。次に、フィルタリング後の関心領域を2値化する。
修正モジュール910は、所定縁の傾きに基づいて、証明書類画像に対して勾配補正を行うように配置される。
角度決定サブモジュール911は、所定縁の傾きに基づいて、所定縁と水平方向とのなす角度を決定するように配置され、
端末における角度決定サブモジュール911は顔領域の下縁と水平方向とのなす角度を算出する。該角度も証明書類と水平方向とのなす角度である。
2値化サブモジュール631は、情報領域を2値化し、2値化後の情報領域を得るように配置され、
情報領域が公民身分証明書番号領域であることを例とし、2値化サブモジュール631はまず情報領域をプリ処理し、プリ処理後の情報領域を2値化することが好ましい。そのうち、プリ処理は、ノイズ除去、フィルタリング、縁抽出等の操作を含んでもよい。
第1算出サブモジュール632は2値化後の情報領域に対して水平方向に応じて第1ヒストグラムを算出し、該第1ヒストグラムが、垂直方向で各行のピクセルの縦座標を示し、水平方向で各行のピクセルにおける前景色ピクセルの個数累積値を表す。
第1ヒストグラムに基づいて、各行ピクセルにおける前景色ピクセルの累積値を取得し、行認識サブモジュール633は、各行ピクセルにおける前景色ピクセルの累積値と第1閾値を比較し、第1ヒストグラムにおける前景色ピクセルの累積値が第1閾値よりも大きい行からなる連続行セットを、文字領域が所在する行として決定することができる。
行認識サブモジュール633により認識された公民身分証明書番号行に対して、第2算出サブモジュール634は垂直方向に応じて第2ヒストグラムを算出し、該第2ヒストグラムは水平方向で各列のピクセルの横座標を表し、垂直方向で各列のピクセルにおける前景色ピクセルの個数累積値を表す。
プロセッサにより実行可能なコマンドを記憶するためのメモリと、を備え、
そのうち、プロセッサは、
証明書類画像における顔領域の領域位置を取得し、
顔領域の領域位置に基づき少なくとも1つの情報領域を決定し、
情報領域に対して領域切断を行い、少なくとも1つのキャラクター領域を取得するように配置される。
Claims (17)
- 証明書類画像における顔領域の領域位置を取得することと、
前記顔領域の領域位置に基づき少なくとも1つの情報領域を決定することと、
前記情報領域に対して領域切断を行い、少なくとも1つのキャラクター領域を得ることと、を含むことを特徴とする領域認識方法。 - 前記顔領域の領域位置は前記顔領域の所定縁で示され、
前記証明書類画像における顔領域の領域位置を取得することは、
前記証明書類画像を顔認識し、前記顔領域を得ることと、
前記顔領域に基づき前記顔領域の前記所定縁を認識することと、を含むことを特徴とする請求項1に記載の方法。 - 前記証明書類画像を顔認識し、前記顔領域を得ることは、
所定の顔サイズに対する顔モデルによって、前記証明書類画像における所定領域を顔認識し、前記顔領域を得ることを含むことを特徴とする請求項2に記載の方法。 - 前記顔領域に基づき前記顔領域の前記所定縁を認識することは、
前記顔領域の下部に基づき前記顔領域の下縁を含む関心領域を決定することと、
前記関心領域を直線検出し、前記顔領域の下縁を認識することと、を含むことを特徴とする請求項2に記載の方法。 - 前記関心領域を直線検出し、前記顔領域の下縁を認識することは、
前記関心領域に対してソーベル水平フィルタリング及び2値化を行い、処理後の関心領域を得ることと、
前記処理後の関心領域に対して直線フィッティング又はハフ変換を行い、長さが所定の長さよりも大きい線分を得て、前記線分を前記顔領域の下縁として認識することと、を含むことを特徴とする請求項4に記載の方法。 - 前記所定縁の傾きに基づいて、前記証明書類画像に対して勾配補正を行うことを更に含むことを特徴とする請求項2〜5のいずれかに記載の方法。
- 前記所定縁の傾きに基づいて、前記証明書類画像に対して勾配補正を行うことは、
前記所定縁の傾きに基づいて、前記所定縁と水平方向とのなす角度を決定することと、
前記証明書類画像を前記角度に応じて回転させ、回転後の前記証明書類画像における前記所定縁が前記水平方向と平行になることと、を含むことを特徴とする請求項6に記載の方法。 - 前記情報領域に対して領域切断を行い、少なくとも1つのキャラクター領域を得ることは、
前記情報領域を2値化し、2値化後の情報領域を得ることと、
前記2値化後の情報領域に対して水平方向に応じて第1ヒストグラムを算出し、前記第1ヒストグラムが、各行ピクセルの縦座標及び前記各行ピクセルにおける前景色ピクセルの累積値を含むことと、
前記第1ヒストグラムにおける前景色ピクセルの累積値が第1閾値よりも大きい行からなる連続行セットに基づき、n行の文字領域を認識して、nが正整数であり、n≧i≧1、iが正整数であることと、
第i行の文字領域に対して、垂直方向に応じて第2ヒストグラムを算出し、前記第2ヒストグラムが、各列のピクセルの横座標と前記各列のピクセルにおける前景色ピクセルの累積値を含むことと、
前記第2ヒストグラムにおける前景色ピクセルの累積値が第2閾値よりも大きい列からなる連続列セットに基づいて、ni個のキャラクター領域を認識することを特徴とする請求項1〜5のいずれかに記載の方法。 - 証明書類画像における顔領域の領域位置を取得するように配置される取得モジュールと、
前記顔領域の領域位置に基づき少なくとも1つの情報領域を決定するように配置される決定モジュールと、
前記情報領域に対して領域切断を行い、少なくとも1つのキャラクター領域を得るように配置される切断モジュールと、を備えることを特徴とする領域認識装置。 - 前記顔領域の領域位置は前記顔領域の所定縁で示され、
前記取得モジュールは、
前記証明書類画像を顔認識し、前記顔領域を得るように配置される第1認識サブモジュールと、
前記顔領域に基づき前記顔領域の前記所定縁を認識するように配置される第2認識サブモジュールと、を備えることを特徴とする請求項9に記載の装置。 - 前記第1認識サブモジュールは、所定の顔サイズに対する顔モデルによって、前記証明書類画像における所定領域を顔認識し、前記顔領域を得るように配置されることを特徴とする請求項10に記載の装置。
- 前記第2認識サブモジュールは、
前記顔領域の下部に基づき前記顔領域の下縁を含む関心領域を決定するように配置される関心決定サブモジュールと、
前記関心領域を直線検出し、前記顔領域の下縁を認識するように配置される検出サブモジュールと、を備えることを特徴とする請求項10に記載の装置。 - 前記検出サブモジュールは、
前記関心領域に対してソーベル水平フィルタリング及び2値化を行い、処理後の関心領域を得るように配置されるフィルタリングサブモジュールと、
前記処理後の関心領域に対して直線フィッティング又はハフ変換を行い、長さが所定の長さよりも大きい線分を得て、前記線分を前記顔領域の下縁として認識するように配置される変換サブモジュールと、を備えることを特徴とする請求項12に記載の装置。 - 前記所定縁の傾きに基づいて、前記証明書類画像に対して勾配補正を行うように配置される修正モジュールを更に備えることを特徴とする請求項10〜13のいずれかに記載の装置。
- 前記修正モジュールは、
前記所定縁の傾きに基づいて、前記所定縁と水平方向とのなす角度を決定するように配置される角度決定サブモジュールと、
前記証明書類画像を前記角度に応じて回転させ、回転後の前記証明書類画像における前記所定縁が前記水平方向と平行になるように配置される回転サブモジュールと、を備えることを特徴とする請求項14に記載の装置。 - 前記切断モジュールは、
前記情報領域を2値化し、2値化後の情報領域を得るように配置される2値化サブモジュールと、
前記2値化後の情報領域に対して水平方向に応じて第1ヒストグラムを算出し、前記第1ヒストグラムが、各行ピクセルの縦座標及び前記各行ピクセルにおける前景色ピクセルの累積値を含むように配置される第1算出サブモジュールと、
前記第1ヒストグラムにおける前景色ピクセルの累積値が第1閾値よりも大きい行からなる連続行セットに基づいて、n行の文字領域を認識し、nが正整数であるように配置される行認識サブモジュールと、
i行目の文字領域に対して、垂直方向に応じて第2ヒストグラムを算出し、前記第2ヒストグラムが各列のピクセルの横座標及び前記各列のピクセルにおける前景色ピクセルの累積値を含み、n≧i≧1、iが正整数であるように配置される第2算出サブモジュールと、
前記第2ヒストグラムにおける前景色ピクセルの累積値が第2閾値よりも大きい列からなる連続列セットに基づいて、ni個のキャラクター領域を認識するように配置されるキャラクター認識サブモジュールと、を備えることを特徴とする請求項9〜13のいずれかに記載の装置。 - 証明書類画像における顔領域の領域位置を取得し、
前記顔領域の領域位置に基づき少なくとも1つの情報領域を決定し、
前記情報領域に対して領域切断を行い、少なくとも1つのキャラクター領域を得るように配置されるプロセッサと、
前記プロセッサにより実行可能なコマンドを記憶するためのメモリと、を備えることを特徴とする領域認識装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510728282.1A CN105528602A (zh) | 2015-10-30 | 2015-10-30 | 区域识别方法及装置 |
CN201510728282.1 | 2015-10-30 | ||
PCT/CN2015/099301 WO2017071065A1 (zh) | 2015-10-30 | 2015-12-29 | 区域识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018500706A true JP2018500706A (ja) | 2018-01-11 |
JP6401873B2 JP6401873B2 (ja) | 2018-10-10 |
Family
ID=55770816
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017547048A Active JP6401873B2 (ja) | 2015-10-30 | 2015-12-29 | 領域認識方法及び装置 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20170124386A1 (ja) |
EP (1) | EP3163500A1 (ja) |
JP (1) | JP6401873B2 (ja) |
KR (1) | KR101864759B1 (ja) |
CN (1) | CN105528602A (ja) |
MX (1) | MX360693B (ja) |
RU (1) | RU2629537C1 (ja) |
WO (1) | WO2017071065A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020086847A (ja) * | 2018-11-22 | 2020-06-04 | 株式会社Pfu | 画像処理装置、制御方法及び制御プログラム |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140052636A1 (en) | 2012-08-15 | 2014-02-20 | Jumio Inc. | Image Processing For Credit Card Validation |
CN106250894B (zh) * | 2016-07-26 | 2021-10-26 | 北京小米移动软件有限公司 | 卡片信息识别方法及装置 |
CN106446898A (zh) * | 2016-09-14 | 2017-02-22 | 宇龙计算机通信科技(深圳)有限公司 | 一种图像中文字信息的提取方法及装置 |
CN106778755A (zh) * | 2016-11-30 | 2017-05-31 | 北京小米移动软件有限公司 | 卡片信息识别方法及装置 |
CN106778744A (zh) * | 2016-12-17 | 2017-05-31 | 北京小米移动软件有限公司 | 一种识别信息卡的信息的方法和装置 |
CN107194397A (zh) * | 2017-05-09 | 2017-09-22 | 珠海赛纳打印科技股份有限公司 | 卡片放置方向的识别方法、装置以及图像处理装置 |
US10606993B2 (en) * | 2017-08-09 | 2020-03-31 | Jumio Corporation | Authentication using facial image comparison |
CN108154132A (zh) * | 2018-01-10 | 2018-06-12 | 马上消费金融股份有限公司 | 一种身份证文字提取方法、系统及设备和存储介质 |
CN108446699A (zh) * | 2018-02-08 | 2018-08-24 | 东华大学 | 一种复杂场景下身份证图片信息识别系统 |
CN108509885A (zh) * | 2018-03-26 | 2018-09-07 | 东南大学 | 一种高效的身份证照片筛选方法 |
CN109145891B (zh) * | 2018-06-27 | 2022-08-02 | 上海携程商务有限公司 | 客户端及其识别身份证的方法、识别身份证的系统 |
CN110889470B (zh) * | 2018-09-07 | 2023-11-07 | 京东科技控股股份有限公司 | 用于处理图像的方法和装置 |
CN109919164B (zh) * | 2019-02-22 | 2021-01-05 | 腾讯科技(深圳)有限公司 | 用户界面对象的识别方法及装置 |
CN110248037B (zh) * | 2019-05-30 | 2022-01-07 | 苏宁金融服务(上海)有限公司 | 一种身份证件扫描方法及装置 |
CN110245616B (zh) * | 2019-06-17 | 2023-04-18 | 深圳市安络科技有限公司 | 一种虚假通缉令预警方法及装置 |
CN110928457B (zh) * | 2019-11-13 | 2020-06-26 | 南京甄视智能科技有限公司 | 基于红外相机的平面触摸方法 |
CN111191657B (zh) * | 2019-11-19 | 2023-08-18 | 泰康保险集团股份有限公司 | 一种文字识别方法、装置及计算机可读存储介质 |
CN111222541B (zh) * | 2019-12-02 | 2022-08-12 | 国网浙江省电力有限公司 | 一种基于深度卷积神经网络的外表箱类型识别方法 |
CN110929725B (zh) * | 2019-12-06 | 2023-08-29 | 深圳市碧海扬帆科技有限公司 | 证件分类方法、装置及计算机可读存储介质 |
CN111259891B (zh) * | 2020-01-19 | 2023-04-18 | 福建升腾资讯有限公司 | 一种自然场景下身份证识别方法、装置、设备和介质 |
CN111626274B (zh) * | 2020-07-30 | 2020-10-27 | 四川骏逸富顿科技有限公司 | 一种社保卡识别方法 |
CN114299509A (zh) * | 2021-12-29 | 2022-04-08 | 支付宝(杭州)信息技术有限公司 | 一种获取信息的方法、装置、设备及介质 |
CN117705754A (zh) * | 2023-11-30 | 2024-03-15 | 浙江大学 | 一种基于高光谱成像的纺织品聚酯纤维含量在线检测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008071076A (ja) * | 2006-09-13 | 2008-03-27 | Oki Electric Ind Co Ltd | 画像抽出装置 |
JP2011009986A (ja) * | 2009-06-25 | 2011-01-13 | Ricoh Co Ltd | 身分証明書撮影システム、身分証明書撮影方法およびプログラム |
JP2011227636A (ja) * | 2010-04-19 | 2011-11-10 | Nidec Sankyo Corp | 文字列認識装置および文字列認識方法 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4078045B2 (ja) * | 2001-07-02 | 2008-04-23 | キヤノン株式会社 | 画像処理装置、方法、プログラム、及び記憶媒体 |
CA2476895A1 (en) * | 2002-02-19 | 2003-08-28 | Digimarc Corporation | Security methods employing drivers licenses and other documents |
KR100473600B1 (ko) * | 2002-12-04 | 2005-03-10 | 삼성전자주식회사 | 얼굴 인식 시스템에서의 사진 판별 장치 및 방법 |
JP4354225B2 (ja) * | 2003-07-24 | 2009-10-28 | コニカミノルタエムジー株式会社 | 複写型idカード作製装置及び複写型idカード作製方法 |
US8194933B2 (en) * | 2007-12-12 | 2012-06-05 | 3M Innovative Properties Company | Identification and verification of an unknown document according to an eigen image process |
CN101751568B (zh) * | 2008-12-12 | 2012-07-18 | 汉王科技股份有限公司 | 证件号码定位和识别方法 |
CN101662581B (zh) * | 2009-09-09 | 2011-06-01 | 谭洪舟 | 多功能证件信息采集系统 |
EP2474931A1 (en) * | 2010-12-31 | 2012-07-11 | Gemalto SA | System providing an improved skimming resistance for an electronic identity document. |
US9087204B2 (en) * | 2012-04-10 | 2015-07-21 | Sita Information Networking Computing Ireland Limited | Airport security check system and method therefor |
US9373031B2 (en) * | 2013-03-14 | 2016-06-21 | Digitech Systems Private Reserve, LLC | System and method for document alignment, correction, and classification |
US8995774B1 (en) * | 2013-09-19 | 2015-03-31 | IDChecker, Inc. | Automated document recognition, identification, and data extraction |
CN104573616A (zh) * | 2013-10-29 | 2015-04-29 | 腾讯科技(深圳)有限公司 | 一种信息识别方法、相关装置及系统 |
CN104680161A (zh) * | 2015-01-09 | 2015-06-03 | 安徽清新互联信息科技有限公司 | 一种身份证数字识别方法 |
CN104680130A (zh) * | 2015-01-09 | 2015-06-03 | 安徽清新互联信息科技有限公司 | 一种身份证汉字识别方法 |
-
2015
- 2015-10-30 CN CN201510728282.1A patent/CN105528602A/zh active Pending
- 2015-12-29 RU RU2016109956A patent/RU2629537C1/ru active
- 2015-12-29 KR KR1020167005384A patent/KR101864759B1/ko active IP Right Grant
- 2015-12-29 MX MX2016003577A patent/MX360693B/es active IP Right Grant
- 2015-12-29 WO PCT/CN2015/099301 patent/WO2017071065A1/zh active Application Filing
- 2015-12-29 JP JP2017547048A patent/JP6401873B2/ja active Active
-
2016
- 2016-10-13 EP EP16193747.9A patent/EP3163500A1/en not_active Withdrawn
- 2016-10-21 US US15/299,613 patent/US20170124386A1/en not_active Abandoned
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008071076A (ja) * | 2006-09-13 | 2008-03-27 | Oki Electric Ind Co Ltd | 画像抽出装置 |
JP2011009986A (ja) * | 2009-06-25 | 2011-01-13 | Ricoh Co Ltd | 身分証明書撮影システム、身分証明書撮影方法およびプログラム |
JP2011227636A (ja) * | 2010-04-19 | 2011-11-10 | Nidec Sankyo Corp | 文字列認識装置および文字列認識方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020086847A (ja) * | 2018-11-22 | 2020-06-04 | 株式会社Pfu | 画像処理装置、制御方法及び制御プログラム |
Also Published As
Publication number | Publication date |
---|---|
MX360693B (es) | 2018-11-14 |
RU2629537C1 (ru) | 2017-08-29 |
MX2016003577A (es) | 2017-07-14 |
EP3163500A1 (en) | 2017-05-03 |
CN105528602A (zh) | 2016-04-27 |
WO2017071065A1 (zh) | 2017-05-04 |
KR20170061629A (ko) | 2017-06-05 |
KR101864759B1 (ko) | 2018-06-05 |
JP6401873B2 (ja) | 2018-10-10 |
US20170124386A1 (en) | 2017-05-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6401873B2 (ja) | 領域認識方法及び装置 | |
JP6400226B2 (ja) | 領域認識方法及び装置 | |
US10127471B2 (en) | Method, device, and computer-readable storage medium for area extraction | |
JP6392468B2 (ja) | 領域認識方法及び装置 | |
JP6392467B2 (ja) | 領域識別方法及び装置 | |
US20170124719A1 (en) | Method, device and computer-readable medium for region recognition | |
CN105894042B (zh) | 检测证件图像遮挡的方法和装置 | |
CN105678242B (zh) | 手持证件模式下的对焦方法和装置 | |
CN106296665B (zh) | 卡片图像模糊检测方法和装置 | |
CN106056117A (zh) | 矩形物体的图像处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171219 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180314 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180828 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180907 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6401873 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |