JP6392467B2 - 領域識別方法及び装置 - Google Patents

領域識別方法及び装置 Download PDF

Info

Publication number
JP6392467B2
JP6392467B2 JP2017547044A JP2017547044A JP6392467B2 JP 6392467 B2 JP6392467 B2 JP 6392467B2 JP 2017547044 A JP2017547044 A JP 2017547044A JP 2017547044 A JP2017547044 A JP 2017547044A JP 6392467 B2 JP6392467 B2 JP 6392467B2
Authority
JP
Japan
Prior art keywords
predetermined
edge
region
target
predetermined edge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017547044A
Other languages
English (en)
Other versions
JP2018500703A (ja
Inventor
ロン,フェイ
チャン,タオ
チェン,チジュン
Original Assignee
シャオミ・インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by シャオミ・インコーポレイテッド filed Critical シャオミ・インコーポレイテッド
Publication of JP2018500703A publication Critical patent/JP2018500703A/ja
Application granted granted Critical
Publication of JP6392467B2 publication Critical patent/JP6392467B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/758Involving statistics of pixels or of feature values, e.g. histogram matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20016Hierarchical, coarse-to-fine, multiscale or multiresolution image processing; Pyramid transform
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20024Filtering details
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • G06V40/173Classification, e.g. identification face re-identification, e.g. recognising unknown faces across different face tracks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Image Analysis (AREA)
  • Character Input (AREA)
  • Image Processing (AREA)

Description

本発明は画像処理分野に関し、特に領域識別方法及び装置に関する。本発明は出願番号201510726012.7であり、出願日2015年10月30日である中国特許出願に基づいて提出され、該中国特許出願の優先権を主張し、該中国特許出願の全ての内容はここで参考として本発明に引用される。
身分証明書の自動識別技術は画像処理によって身分証明書における文字情報を識別する技術である。かかる技術は身分証明書の自動識別方法を提供し、身分証明書スキャン装置が固定した相対的位置に従って身分証明書をスキャンすることにより、身分証明書のスキャン画像が取得され、スキャン画像におけるn箇所の所定領域に対して文字識別を行い、氏名情報、性別情報、民族情報、生年月日情報、住所情報と公民身分番号情報のうちの少なくとも一つが取得される。ただし、撮影により直接取得された身分証明書画像に対し、かなり識別しにくい。
かかる技術問題を解決するために、本発明は領域識別方法及び装置を提供する。前記技術的解決手段は以下のとおりである。
本発明の実施例の第1態様によれば、証明書画像における証明書の所定方向に位置するエッジである所定エッジを識別することと、n本(n≧2)候補の所定エッジが識別された場合、n本候補の所定エッジのうちの1本候補の所定エッジをターゲット所定エッジに確定することと、ターゲット所定エッジに基づいて証明書画像において少なくとも一つの情報領域を識別することと、を含む領域識別方法を提供する。
好ましい実施例において、n本候補の所定エッジが識別された場合、n本候補の所定エッジにおける1本候補の所定エッジをターゲット所定エッジに確定することは、n本候補の所定エッジを並べ替えることと、第i本(1≦i≦n)候補の所定エッジと、ターゲット所定エッジおよびターゲット情報領域の間の相対的位置関係である第1相対的位置関係とを用い、証明書画像においてターゲット情報領域の識別を試すことと、ターゲット情報領域が識別された場合、第i本候補の所定エッジをターゲット所定エッジに確定することと、ターゲット情報領域が識別されなかった場合、i=i+1に設置し、第i本候補の所定エッジと第1相対的位置関係を用い、証明書画像においてターゲット情報領域の識別を試すステップを再実行することとを含む。
好ましい実施例において、n本候補の所定エッジを並べ替えることは、それぞれの候補の所定エッジに対し、所定エッジと、ソーベル水平方向フィルターと二値化された画像である処理された証明書画像における同じ位置の前景色画素点と交わり、所定エッジに対応する交点数を取得することと、交点数の多から少への順に従い、n本候補の所定エッジを並べ替えることとを含む。
好ましい実施例において、第i本候補の所定エッジと第1相対的位置関係を用い、証明書画像においてターゲット情報領域の識別を試すことは、第i本候補の所定エッジと第1相対的位置関係を用い、証明書画像において関心領域を切り取ることと、関心領域において、ターゲット情報領域におけるキャラクター領域が備える特徴である所定特徴に合致するキャラクター領域が存在するか否かを識別することとを含む。
好ましい実施例において、関心領域に所定特徴に合致するキャラクター領域が存在するか否かを識別することは、関心領域に対して二値化し、二値化された関心領域を取得することと、二値化された関心領域に対して水平方向に従い、それぞれの行の画素点における縦座標とそれぞれの行の画素点における前景色画素点の累積値を含む第1ヒストグラムを計算することと、二値化された関心領域に対して垂直方向に従い、それぞれの列の画素点における横座標とそれぞれの列の画素点における前景色画素点の累積値を含む第2ヒストグラムを計算することと、第1ヒストグラムにおける前景色画素点の累積値が第1閾値より大きい行により構成された連続行集合の高さが所定高さ区間に合致し、第2ヒストグラムにおける前景色画素点の累積値が第2閾値より大きい列により構成された連続列集合の個数が所定個数に合致した場合、関心領域において所定特徴に合致するキャラクター領域が識別されることと、第1ヒストグラムにおける前景色画素点の累積値が第1閾値より大きい行により構成された連続行集合の高さが所定高さ区間に合致せず、又は第2ヒストグラムにおける前景色画素点の累積値が第2閾値より大きい列により構成された連続列集合の個数が所定個数に合致しない場合、関心領域において所定特徴に合致するキャラクター領域が識別されないこととを含む。
好ましい実施例において、証明書画像における所定エッジを識別することは、証明書画像に対してソーベル水平方向フィルターと二値化を行い、処理された証明書画像を取得することと、処理された証明書画像における所定領域に対して直線検出を行い、少なくとも1本の直線を取得することと、直線がn本(n≧2)である場合、n本直線をn本候補の所定エッジに識別することとを含む。
好ましい実施例において、ターゲット所定エッジに基づいて証明書画像において少なくとも一つの情報領域を確定することは、ターゲット所定エッジと、ターゲット所定エッジと情報領域との間の相対的位置関係である第2相対的位置関係に基づき、少なくとも一つの情報領域を確定することを含む。
本発明の実施例の第2態様によれば、証明書画像における証明書の所定方向に位置するエッジである所定エッジを識別するように配置された識別モジュールと、n本(n≧2)候補の所定エッジが識別された場合、n本候補の所定エッジのうちの1本候補の所定エッジをターゲット所定エッジに確定するように配置された確定モジュールと、ターゲット所定エッジに基づいて証明書画像において少なくとも一つの情報領域を識別するように配置された領域識別モジュールとを含む領域識別装置を提供する。
好ましい実施例において、確定モジュールは、n本候補の所定エッジを並べ替えるように配置された第1並べ替えサブモジュールと、第i本(1≦i≦n)候補の所定エッジと、ターゲット所定エッジおよびターゲット情報領域の間の相対的位置関係である第1相対的位置関係とを用い、証明書画像においてターゲット情報領域の識別を試すように配置された第1識別サブモジュールと、ターゲット情報領域が識別された場合、第i本候補の所定エッジをターゲット所定エッジに確定するように配置された第2識別サブモジュールと、ターゲット情報領域が識別されなかった場合、i=i+1に設置し、第1識別サブモジュールに戻るように配置された第3識別サブモジュールとを含む。
好ましい実施例において、第1並べ替えサブモジュールは、それぞれの候補の所定エッジに対し、所定エッジが、ソーベル水平方向フィルターと二値化された画像である処理された証明書画像における同じ位置の前景色画素点と交わり、所定エッジに対応する交点数を取得するように配置された交わりサブモジュールと、交点数の多から少への順に従い、n本候補の所定エッジを並べ替えるように配置された第2並べ替えサブモジュールとを含む。
好ましい実施例において、第1識別サブモジュールは、第i本候補の所定エッジと第1相対的位置関係を用い、証明書画像において関心領域を切り取るように配置された切取サブモジュールと、関心領域において、ターゲット情報領域におけるキャラクター領域が備える特徴である所定特徴に合致するキャラクター領域が存在するか否かを識別するように配置された第4識別サブモジュールとを含む。
好ましい実施例において、第4識別サブモジュールは、関心領域に対して二値化し、二値化された関心領域を取得するように配置された二値化サブモジュールと、二値化された関心領域に対して水平方向に従い、それぞれの行の画素点における縦座標とそれぞれの行の画素点における前景色画素点の累積値を含む第1ヒストグラムを計算するように配置された第1計算サブモジュールと、二値化された関心領域に対して垂直方向に従い、それぞれの列の画素点における横座標とそれぞれの列の画素点における前景色画素点の累積値を含む第2ヒストグラムを計算するように配置された第2計算サブモジュールと、第1ヒストグラムにおける前景色画素点の累積値が第1閾値より大きい行により構成された連続行集合の高さが所定高さ区間に合致し、第2ヒストグラムにおける前景色画素点の累積値が第2閾値より大きい列により構成された連続列集合の個数が所定個数に合致した場合、関心領域において所定特徴に合致するキャラクター領域が識別されるように配置されたキャラクター識別サブモジュールと、第1ヒストグラムにおける前景色画素点の累積値が第1閾値より大きい行により構成された連続行集合の高さが所定高さ区間に合致せず、又は第2ヒストグラムにおける前景色画素点の累積値が第2閾値より大きい列により構成された連続列集合の個数が所定個数に合致しない場合、関心領域において所定特徴に合致するキャラクター領域が識別されないように配置された第5識別サブモジュールとを含む。
好ましい実施例において、識別モジュールは、証明書画像に対してソーベル水平方向フィルターと二値化を行い、処理された証明書画像を取得するように配置されたフィルターサブモジュールと、処理された証明書画像における所定領域に対して直線検出を行い、少なくとも1本の直線を取得するように配置された検出サブモジュールと、直線がn本(n≧2)である場合、n本直線をn本候補の所定エッジに識別するように配置されたエッジ識別サブモジュールとを含む。
好ましい実施例において、領域識別モジュールは、ターゲット所定エッジと、ターゲット所定エッジおよび情報領域の間の相対的位置関係である第2相対的位置関係に基づき、少なくとも一つの情報領域を確定するように配置される。
本発明の実施例の第3態様によれば、証明書画像における証明書の所定方向に位置するエッジである所定エッジを識別し、n本(n≧2)候補の所定エッジが識別された場合、n本候補の所定エッジのうちの1本候補の所定エッジをターゲット所定エッジに確定し、ターゲット所定エッジに基づいて証明書画像において少なくとも一つの情報領域を識別するプロセッサと、プロセッサの実行可能なコマンドを記憶するメモリと、を含む領域識別装置を提供する。
本発明の実施例により提供される技術的解決手段は、下記好適な効果を含むことができる。
証明書画像における証明書の所定方向に位置するエッジである所定エッジを識別することにより、n本(n≧2)候補の所定エッジが識別された場合、n本候補の所定エッジのうちの1本の候補の所定エッジをターゲット所定エッジに確定し、ターゲット所定エッジに基づいて証明書画像において少なくとも一つの情報領域を識別し、かかる技術における直接撮影して取得した証明書画像における一部情報領域が識別しにくいおよび一部情報領域に対する位置決めが正確ではない問題を解決し、証明書画像におけるn本候補の所定エッジによりターゲット所定エッジを確定し、ターゲット所定エッジに基づいて少なくとも一つの情報領域を確定し、これによって情報領域に対する正確な位置決め効果を達する。
理解すべきことは、以上の一般的な説明と後述の詳細な説明は例示的なものに過ぎず、本発明を限定するものではない。
この図面は明細書に合わせ本明細書の一部を構成し、本発明に適合する実施例を示し、明細書と共に本発明の原理を解釈するのに用いられる。
一例示的な実施例により示された領域識別方法のフローチャートである。 他の一例示的な実施例により示された領域識別方法のフローチャートである。 他の一例示的な実施例により示された領域識別方法のフローチャートである。 一例示的な実施例により示された証明書画像の二値化の概略図である。 一例示的な実施例により示された証明書画像における直線検出の概略図である。 一例示的な実施例により示された証明書画像におけるn本候補の所定エッジの概略図である。 他の一例示的な実施例により示された領域識別方法のフローチャートである。 他の一例示的な実施例により示された領域識別方法のフローチャートである。 一例示的な実施例により示されたターゲット情報領域を確定する概略図である。 他の一例示的な実施例により示された領域識別方法のフローチャートである。 一例示的な実施例により示された水平方向に従って第1ヒストグラムを計算する概略図である。 一例示的な実施例により示された垂直方向に従って第2ヒストグラムを計算する概略図である。 一例示的な実施例により示された連続行集合の概略図である。 一例示的な実施例により示された連続列集合の概略図である。 他の一例示的な実施例により示された領域識別方法のフローチャートである。 一例示的な実施例により示された領域識別装置のブロック図である。 他の一例示的な実施例により示された領域識別装置のブロック図である。 他の一例示的な実施例により示された領域識別装置のブロック図である。 一例示的な実施例により示された領域識別装置における第1並べ替えサブモジュールのブロック図である。 一例示的な実施例により示された領域識別装置における第1識別サブモジュールのブロック図である。 一例示的な実施例により示された領域識別装置における第4識別サブモジュールのブロック図である。 一例示的な実施例により示された領域識別装置のブロック図である。
ここで例示的な実施例について詳しく説明し、その実例は図面に示す通りである。下記の説明が図面に関わる時、別途に表示されない限り、異なる図面における同じ数字は同じ又は類似する要素を表示する。以下の例示的な実施例に説明される実施形態は本発明と一致する全ての実施形態を代表するわけではない。逆に、それらは添付の特許請求の範囲に詳細に記載された本発明の一部の態様と一致する装置と方法の例に過ぎない。
図1は一例示的な実施例により示された領域識別方法のフローチャートである。図1に示すように、該領域識別方法は以下のステップを含む。
ステップ102において、証明書画像における証明書の所定方向に位置するエッジである所定エッジを識別し、証明書画像は証明書に対して直接撮影して取得した画像であり、例えば、身分証明書画像、社会保障カード画像などである。
所定エッジは証明書の上エッジ、下エッジ、左エッジと右エッジのうちのいずれかである。本発明の実施例においていずれも下エッジを例として説明する。所定エッジが上エッジ、左エッジ又は右エッジである場合に対し、ここでその説明を省略する。
ステップ104において、n本(n≧2)候補の所定エッジが識別された場合、n本候補の所定エッジのうちの1本候補の所定エッジをターゲット所定エッジに確定し、証明書画像の撮影効果が撮影角度、背景、光照射条件と撮影パラメータなどの要素の様々な影響を受けたため、所定エッジを識別する時、1本以上の所定エッジ、即ちn本候補の所定エッジが識別されることが可能である。
n≧2の場合、n本候補の所定エッジのうちのある1本の所定エッジを証明書が証明書画像におけるターゲット所定エッジに確定する。ターゲット所定エッジは真実の所定エッジ、正確な所定エッジ又は正確度が高い所定エッジと認識することができる。
ステップ106において、ターゲット所定エッジに基づいて証明書画像において少なくとも一つの情報領域を識別する。証明書画像におけるターゲット所定エッジの位置は相対的に固定され、ターゲット所定エッジに基づいて証明書画像において証明書のそれぞれの情報領域を確定することができる。
情報領域は証明書画像における文字情報付きの領域を指し、例えば、氏名情報領域、生年月日情報領域、性別領域、住所情報領域、公民身分番号情報領域、整理番号情報領域、証明書発行機関情報領域、有効期限情報領域などの情報領域のうちの少なくとも一つである。
以上まとめると、本発明の実施例により提供される領域識別方法は、証明書画像における証明書の所定方向に位置するエッジである所定エッジを識別することにより、n本(n≧2)候補の所定エッジが識別された場合、n本候補の所定エッジのうちの1本所定エッジをターゲット所定エッジに確定し、ターゲット所定エッジに基づいて証明書画像において少なくとも一つの情報領域を識別し、かかる技術における直接撮影して取得した証明書画像における一部情報領域が識別しにくく、一部情報領域に対する位置決めが正確ではない問題を解決し、証明書画像におけるn本候補の所定エッジによりターゲット所定エッジを確定し、ターゲット所定エッジに基づいて少なくとも一つの情報領域を確定し、これによって情報領域に対する正確な位置決め効果を達する。
図2は他の一例示的な実施例により示された領域識別方法のフローチャートである。図2に示すように、該領域識別方法は以下のステップを含む。
ステップ202において、証明書画像における証明書の所定方向に位置するエッジである所定エッジを識別し、好ましくは、証明書画像を撮影する時、撮影画面において撮影を誘導するための矩形領域が設置され、ユーザーが矩形領域を証明書に合わせた時、撮影して証明書画像が取得される。
好ましくは、撮影して取得された証明書画像に基づき、直線検出技術によって証明書画像における証明書の所定エッジを識別する。直線検出技術によって識別された証明書画像における証明書の所定エッジが1本のみである場合、識別された該本の所定エッジを証明書が証明書画像におけるターゲット所定エッジを確定し、ステップ212を直接実行し、撮影角度、背景、光照射条件と撮影パラメータなどの要素のため、直線検出技術により識別された証明書画像における証明書の所定エッジがn本(n≧2)である場合、ステップ204〜ステップ210を実行してn本候補の所定エッジを処理する。
ステップ204において、n本候補の所定エッジを並べ替え、n本候補の所定エッジが取得された後、n本候補の所定エッジがターゲット所定エッジである可能性に基づいて大から小の順に並べ替える。
ステップ206において、第i本(1≦i≦n)候補の所定エッジと第1相対的位置関係を用い、証明書画像においてターゲット情報領域の識別を試し、ターゲット情報領域の識別難度が一般に低い。本ステップにおいて、仮に第i本候補の所定エッジがターゲット情報領域であれば、第i本候補の所定エッジを用いてターゲット情報領域を識別し、ターゲット情報領域が識別された場合、第i本候補の所定エッジがターゲット所定エッジであることを確定し、ターゲット情報領域が識別されなかった場合、第i本候補の所定エッジがターゲット所定エッジではないことを確定する。
仮に第i本候補の所定エッジがターゲット所定エッジであれば、第i本候補の所定エッジを用いてターゲット情報領域を識別するステップにおいて、ステップ204の並べ替えた所定エッジによって順に試す。第1相対的位置関係はターゲット所定エッジとターゲット情報領域との間の相対的位置関係である。
ステップ208において、ターゲット情報領域が識別された場合、第i本候補の所定エッジをターゲット所定エッジに確定し、第i本候補の所定エッジと第1相対的位置関係に基づいて証明書画像におけるターゲット情報領域が識別された場合、第i本候補の所定エッジをターゲット所定エッジに確定する。
ステップ210において、ターゲット情報領域が識別されなかった場合、i=i+1に設置し、ステップ206を再実行し、第i本候補の所定エッジと第1相対的位置関係に基づいて証明書画像におけるターゲット情報領域が識別されなかった場合、i=i+1に設置し、第i+1本候補の所定エッジをターゲット所定エッジに確定し、第i+1本候補の所定エッジと第1相対的位置関係を用い、証明書画像においてターゲット情報領域の識別を試す。
ステップ212において、ターゲット所定エッジに基づいて証明書画像において少なくとも一つの情報領域を識別する。ステップ208に確定されたターゲット所定エッジに基づき、ターゲット所定エッジと第2相対的位置関係によって、少なくとも一つの情報領域を確定する。
例えば、氏名情報領域、生年月日情報領域、性別領域、住所情報領域、公民身分番号情報領域、整理番号情報領域、証明書発行機関情報領域、有効期限情報領域などの情報領域を確定する。第2相対的位置関係はターゲット所定エッジと情報領域との間の相対的位置関係である。第1相対的位置関係は第2相対的位置関係の部分集合である。
例えば、第2相対的位置関係は、ターゲット所定エッジと氏名情報領域との間の相対的位置関係、ターゲット所定エッジと生年月日情報領域との間の相対的位置関係、又は、ターゲット所定エッジと性別領域との間の相対的位置関係などを含むことができる。
以上まとめると、本発明の実施例により提供される領域識別方法は、証明書画像における証明書の所定方向に位置するエッジである所定エッジを識別することにより、n本候補の所定エッジを並べ替え、第i本(1≦i≦n)候補の所定エッジと、ターゲット所定エッジおよびターゲット情報領域の間の相対的位置関係である第1相対的位置関係とを用い、証明書画像においてターゲット情報領域の識別を試し、ターゲット所定エッジに基づいて証明書画像において少なくとも一つの情報領域を識別し、かかる技術における直接撮影して取得された証明書画像における一部情報領域が識別しにくく、一部情報領域に対する位置決めが正確ではない問題を解決し、証明書画像におけるn本候補の所定エッジによりターゲット所定エッジを確定し、ターゲット所定エッジに基づいて少なくとも一つの情報領域を確定し、これによって情報領域に対する正確な位置決め効果を達する。
同時に、n本候補の所定エッジを並べ替えることにより、ターゲット所定エッジを確定するスピードを向上させ、ターゲット所定エッジに対する正確な位置決め効果を達する。
図2の実施例により提供された好ましい実施例に基づき、ステップ202において証明書画像における所定エッジを識別する。以下のステップ202a〜ステップ202cにより代替し実現することができ、図3Aに示すように、ステップ202aにおいて、証明書画像に対してソーベル水平方向フィルターと二値化を行い、処理された証明書画像が取得され、まず証明書画像に対してソーベル水平方向フィルターを行い、即ちソーベル演算子を採用して水平方向に沿ってフィルターを行う。その後、フィルターが行われた証明書画像に対して二値化する。二値化は証明書画像における画素点の濃淡値と所定濃淡値との比較を指し、証明書画像における画素点を、所定濃淡値より大きい画素グループと所定濃淡値より小さい画素グループの二部分に分け、二部分の画素グループが証明書画像においてそれぞれ黒と白の二色を表し、二値化された証明書画像が取得され、図3Bに示すようになる。前景に位置する一色の画素点は前景色画素点と称し、即ち図3Bにおける白色画素点であり、背景に位置する一色の画素点は背景色画素点と称し、即ち図3Bにおける黒色画素点である。
ステップ202bにおいて、処理された証明書画像における所定領域に対して直線検出を行い、少なくとも1本の直線が取得され、該所定領域は証明書における所定方向に位置する領域である。例えば、該所定領域は証明書の下エッジが証明書画像における領域であり、又は、該所定領域は証明書の上エッジが証明書画像における領域などである。
ソーベル水平方向フィルターと二値化の証明書画像が取得された後、処理された証明書画像に対して直線フィッティング又はハフ変換を含む直線検出を行い、これによって少なくとも1本の直線が取得され、図3Cに示すようになる。
ステップ202cにおいて、直線がn本(n≧2)である場合、n本直線をn本候補の所定エッジに識別する。取得された直線がn本(n≧2)である場合、n本直線をn本候補の所定エッジに識別し、例えば、ソーベル水平方向フィルターと二値化の証明書画像に対し、証明書の下エッジが証明書画像における領域に対して直線検出を行い、直線フィッティング又はハフ変換により、n本候補の所定エッジが取得され、n本候補の証明書の下エッジが証明書画像における領域は、図3Dに示すようになる。
取得された直線が1本のみである場合、該直線は証明書画像におけるターゲット所定エッジに直接識別され、ステップ212を直接実行する。
以上まとめると、本実施例により提供される領域識別方法は、証明書画像に対してソーベル水平方向フィルターと二値化を行うことにより、処理された証明書画像が取得され、処理された証明書画像における所定領域に対して直線検出を行い、少なくとも1本の直線が取得され、n本直線をn本候補の所定エッジに識別し、証明書画像のターゲット所定エッジに対する検出がさらに正確になり、後続情報領域識別時の正確度を向上させる。
図2の実施例により提供された好ましい実施例に基づき、ステップ204がn本候補の所定エッジに対する並べ替えは以下のステップ204aとステップ204bにより実現することでき、図4に示すようになる。
ステップ204aにおいて、それぞれの候補の所定エッジに対し、所定エッジが、ソーベル水平方向フィルターと二値化により処理された画像である処理された証明書画像における同じ位置の前景色画素点と交わり、所定エッジに対応する交点数が取得され、n本候補の所定エッジが取得された後、まず証明書画像に対してソーベル水平方向フィルターを行い、即ちソーベル演算子を採用して水平方向に沿ってフィルターを行う。その後、フィルターがかけられた証明書画像に対して二値化する。
それぞれの候補の所定エッジが処理された証明書画像における同じ位置の前景色画素点と交わる。即ち、それぞれの候補の所定エッジが二値化された証明書画像における同じ位置に属する前景色画素点の個数を求める。
ステップ204bにおいて、交点数の多から少への順に従い、n本候補の所定エッジを並べ替える。それぞれの候補の所定エッジに対応する交点数が取得された後、交点数の数に従って多から少への順に並べ替え、並べ替えられたn本候補の所定エッジを取得する。
以上まとめると、本実施例により提供される領域識別方法は、n本候補の所定エッジを並べ替えることにより、ターゲット所定エッジを確定するスピードを向上させ、ターゲット所定エッジに対する正確な位置決めに有利であり、後続情報領域識別時の正確性を向上させる。
図2の実施例により提供された好ましい実施例に基づき、ステップ206は第i本候補の所定エッジと第1相対的位置関係を用い、証明書画像においてターゲット情報領域の識別を試す。
以下のステップ206aとステップ206bにより代替し実現することができ、図5Aに示すように、ステップ206aにおいて、第i本候補の所定エッジと第1相対的位置関係を用い、証明書画像において関心領域を切り取り、第i本候補の所定エッジと第1相対的位置関係に基づき、第i本候補の所定エッジと第1相対的位置関係に基づいて確定した領域を指す関心領域における上エッジ、下エッジ、左エッジと右エッジの大体の位置を確定することができ、そのため、確定された関心領域における上エッジ、下エッジ、左エッジと右エッジに基づき、証明書画像において関心領域を切り取る。
例えば、ターゲット所定エッジが身分証明書の下エッジであることを例とし、図3Cにおける第i本候補の所定エッジを身分証明書の下エッジ51に確定し、身分証明書の下エッジ51と公民身分番号との間の相対的位置関係に基づき、公民身分番号の上エッジ52、下エッジ53、左エッジ54と右エッジ55の大体の位置を確定し、図5Bに示すようになる。
ステップ206bにおいて、関心領域においてターゲット情報領域におけるキャラクター領域が備える特徴である所定特徴に合致するキャラクター領域が存在するか否かを識別する。関心領域が切り取られた後、ターゲット情報領域におけるキャラクター領域が備える特徴である所定特徴に基づいて関心領域において所定特徴に合致するキャラクター領域が存在するか否かを識別する。
例えば、ターゲット情報領域が公民身分番号領域である場合、該特徴は、連続する18のキャラクター領域(又は18の数字領域)が含まれ、隣接する2つのキャラクター領域の間の距離が小さく、それぞれのキャラクター領域の高さを事前設定区間に合致することができる。
関心領域において所定特徴に合致するキャラクター領域が存在することが識別された場合、ターゲット情報領域が識別され、関心領域において所定特徴に合致するキャラクター領域が存在しないことが識別された場合、ターゲット情報領域が識別されない。
好ましくは、関心領域に所定特徴に合致するキャラクター領域が存在するか否かを識別する。ステップ206bの代わりにステップ301〜ステップ305により実現することができ、図6Aに示すようになる。
ステップ301において、関心領域に対して二値化し、二値化された関心領域が取得され、関心領域が公民身分番号領域であることを例とし、好ましくは、まず関心領域に対し、ノイズ除去、フィルターかけ、エッジ抽出などの操作を含む前処理を行い、前処理された関心領域を二値化する。
ステップ302において、二値化された関心領域に対して水平方向に従い、それぞれの行の画素点における縦座標とそれぞれの行の画素点における前景色画素点の累積値を含む第1ヒストグラムを計算し、二値化された関心領域は水平方向に従い、垂直方向においてそれぞれの行の画素点における縦座標を表示し、水平方向においてそれぞれの行の画素点における前景色画素点の個数累積値を表示する第1ヒストグラムを計算する。前景色画素点は二値化された画像における白色画素点を指し、図6Bに示すようになる。
ステップ303において、二値化された関心領域に対して垂直方向に従い、それぞれの列の画素点における横座標とそれぞれの列の画素点における前景色画素点の累積値を含む第2ヒストグラムを計算し、二値化された関心領域は垂直方向に従い、水平方向においてそれぞれの列の画素点における横座標を表示し、垂直方向においてそれぞれの列の画素点における前景色画素点の個数累積値を表示する第2ヒストグラムを計算し、図6Cに示すようになる。
ステップ304において、第1ヒストグラムにおける前景色画素点の累積値が第1閾値より大きい行により構成された連続行集合の高さが所定高さ区間に合致し、第2ヒストグラムにおける前景色画素点の累積値が第2閾値より大きい列により構成された連続列集合の個数が所定個数に合致した場合、関心領域において所定特徴に合致するキャラクター領域が識別され、第1ヒストグラムに基づいてそれぞれの行の画素点における前景色画素点の累積値を取得することができ、それぞれの行の画素点における前景色画素点の累積値と第1閾値を比較し、第1ヒストグラムにおける前景色画素点の累積値が第1閾値より大きい行により構成された連続行集合の高さを取得する。
連続行集合は、前景色画素点の累積値が第1閾値より大きい行である連続するm行の画素点により構成された集合を指し、図6Dに示すように、図におけるm行画素点に対し、左側ヒストグラムに位置する前景色画素点の累積値はいずれも第1閾値より大きい。該m行画素点が証明書画像において公民身分番号行「0421199」に対応し、m行画素点の高さは連続行集合の高さである。
第2ヒストグラムに基づいてそれぞれの列の画素点における前景色画素点の累積値を取得することができ、それぞれの列の画素点における前景色画素点の累積値と第2閾値を比較し、第2ヒストグラムにおける前景色画素点の累積値が第2閾値より大きい列により構成された連続列集合の個数を取得する。
連続列集合は、前景色画素点の累積値が第2閾値より大きい列である連続するp列の画素点により構成された集合を指し、図6Eに示すように、連続列集合はpであり、即ち第2ヒストグラムに形成した連続する白色領域である。図におけるp列画素点に対し、下側ヒストグラムに位置する前景色画素点の累積値はいずれも第2閾値より大きい。該p列画素点は証明書画像においてキャラクター領域「3」に対応する。
連続行集合の高さが所定高さ区間に合致し、連続行集合の個数が所定個数に合致した場合、関心領域に所定特徴に合致するキャラクター領域が識別されることを認識する。ステップ305において、第1ヒストグラムにおける前景色画素点の累積値が第1閾値より大きい行により構成された連続行集合の高さが所定高さ区間に合致せず、又は第2ヒストグラムにおける前景色画素点の累積値が第2閾値より大きい列により構成された連続列集合の個数が所定個数に合致しない場合、関心領域において所定特徴に合致するキャラクター領域が識別されない。
連続行集合の高さが所定高さ区間に合致せず、又は連続列集合の個数が所定個数に合致しない場合、関心領域において所定特徴に合致するキャラクター領域が識別されないことを認識する。
以上まとめると、本実施例により提供される領域識別方法は、関心領域に対して二値化し、二値化された関心領域をそれぞれ水平方向と垂直方向に従って第1ヒストグラムと第2ヒストグラムを計算することにより、第1ヒストグラムにおける連続行集合の高さと第2ヒストグラムにおける連続列集合の個数に基づいて所定特徴に合致するキャラクター領域が識別されるか否かを確定し、キャラクター領域に対する位置決めをさらに正確にさせる。
図2の実施例により提供された好ましい実施例に基づき、ターゲット所定エッジに基づいて証明書画像において少なくとも一つの情報領域が識別された後、以下のステップに基づいて情報領域におけるキャラクターを識別することができる。
図7に示すように、ステップ701において、情報領域に対して二値化し、二値化された領域が取得され、情報領域が公民身分番号領域であることを例とし、好ましくは、まず情報領域に対し、ノイズ除去、フィルターをかけ、エッジ抽出などの操作を含む前処理を行う。前処理された情報領域を二値化する。
ステップ702において、二値化された情報領域に対して水平方向に従い、それぞれの行の画素点における縦座標とそれぞれの行の画素点における前景色画素点の累積値を含む第1ヒストグラムを計算し、ステップ703において、第1ヒストグラムにおける前景色画素点の累積値が第1閾値より大きい行により構成された連続行集合に基づき、識別し、正整数であるa行の文字領域が取得され、第1ヒストグラムに基づいてそれぞれの行の画素点における前景色画素点の累積値を取得することができ、それぞれの行の画素点における前景色画素点の累積値と第1閾値を比較し、第1ヒストグラムにおける前景色画素点の累積値が第1閾値より大きい行により構成された連続行集合は、文字領域が所在する行に確定する。
当然ながら、該情報領域が住所情報領域又は他の情報領域であれば、文字領域は2行又は2行以上になることができる。この時、各連続行集合は1行の文字領域に識別され、a個連続行集合はa行の文字領域に識別される。
ステップ704において、第i行(a≧i≧1、iが正整数である)の文字領域に対し、垂直方向に従い、それぞれの列の画素点における横座標とそれぞれの列の画素点における前景色画素点の累積値を含む第2ヒストグラムを計算し、識別された公民身分番号行に対し、垂直方向に従い、水平方向においてそれぞれの列の画素点における横座標を表示し、垂直方向においてそれぞれの列の画素点における前景色画素点の個数累積値を表示する第2ヒストグラムを計算する。
ステップ705において、第2ヒストグラムにおける前景色画素点の累積値が第2閾値より大きい列により構成された連続列集合に基づき、a個キャラクター領域が識別される。
第2ヒストグラムに基づいてそれぞれの列の画素点における前景色画素点の累積値を取得することができ、それぞれの列の画素点における前景色画素点の累積値と第2閾値を比較し、第2ヒストグラムにおける前景色画素点の累積値が第2閾値より大きい列により構成された連続列集合をキャラクター領域が所在する列に確定する。
それぞれの連続列集合は一つのキャラクター領域に識別され、b個連続列集合はb個のキャラクター領域に識別される。図6Eに示すように、18個のキャラクター領域が識別される。文字領域がa行あれば、ステップ701とステップ705はそれぞれ行の文字領域に対して1回実行し、全部でa回実行する。
識別されたそれぞれのキャラクター領域に対し、さらにキャラクター識別技術により、該キャラクター領域に含まれる文字を識別することができる。文字は漢字、英文字、数字又は他の言語の単一キャラクターであることができる。
以上まとめると、本実施例は情報領域の二値化により、二値化された情報領域を水平方向に従って第1ヒストグラムを計算し、情報領域におけるa行文字領域を確定し、a行文字領域にそれぞれに対して垂直方向に従って第2ヒストグラムを計算し、それぞれの文字に対応するキャラクター領域を識別し、情報領域におけるキャラクター領域を識別する正確度を向上させる。
以下は本発明に係わる装置の実施例であり、本発明方法の実施例を実行するのに用いることができる。本発明に係わる装置の実施例に開示されていない詳細については、本発明方法の実施例を参照すること。
図8は一例示的な実施例により示された領域識別装置のブロック図であり、図8に示すように、該領域識別装置は、証明書に対して直接撮影して取得した画像であり、例えば、身分証明書画像、社会保障カード画像などである証明書画像における証明書の所定方向に位置するエッジである所定エッジを識別するように配置された識別モジュール810と、n本(n≧2)候補の所定エッジが識別された場合、n本候補の所定エッジのうちの1本候補の所定エッジを、真実の所定エッジ、正確な所定エッジ又は正確度が高い所定エッジと認識することができるターゲット所定エッジに確定するように配置された確定モジュール820と、ターゲット所定エッジに基づいて証明書画像において少なくとも一つの情報領域を識別するように配置された領域識別モジュール830とを含むがそれに限定されない。
所定エッジは証明書における上エッジと、下エッジと、左エッジと、右エッジとのうちのいずれかである。
n≧2の場合、確定モジュール820はn本候補の所定エッジのうちのある1本の所定エッジを証明書が証明書画像におけるターゲット所定エッジに確定する。
情報領域は証明書画像において文字情報付きの領域を指し、例えば、氏名情報領域、生年月日情報領域、性別領域、住所情報領域、公民身分番号情報領域、整理番号情報領域、証明書発行機関情報領域、有効期限情報領域などの情報領域のうちの少なくとも一つである。
以上まとめると、本発明の実施例により提供される領域識別装置は、証明書画像における証明書の所定方向に位置するエッジである所定エッジを識別することにより、n本(n≧2)候補の所定エッジが識別された場合、n本候補の所定エッジのうちの1本所定エッジをターゲット所定エッジに確定し、ターゲット所定エッジに基づいて証明書画像において少なくとも一つの情報領域を識別し、かかる技術における直接撮影して取得した証明書画像における一部情報領域が識別しにくく、一部情報領域に対する位置決めが正確ではない問題を解決し、証明書画像におけるn本候補の所定エッジによりターゲット所定エッジを確定し、ターゲット所定エッジに基づいて少なくとも一つの情報領域を確定し、これによって情報領域に対する正確な位置決め効果を達する。
図8の実施例により提供された好ましい実施例に基づき、図9に示すように、確定モジュール820は、n本候補の所定エッジを並べ替えるように配置され、n本候補の所定エッジが取得された後、第1並べ替えサブモジュールn本候補の所定エッジがターゲット所定エッジである可能性に基づいて大から小へ並べ替える第1並べ替えサブモジュール821と、第i本(1≦i≦n)候補の所定エッジと第1相対的位置関係を用い、証明書画像においてターゲット情報領域の識別を試すように配置され、第i本候補の所定エッジがターゲット情報領域である場合、第i本候補の所定エッジを用いてターゲット情報領域の識別を試し、ターゲット情報領域が識別された場合、第i本候補の所定エッジはターゲット所定エッジであることを確定し、ターゲット情報領域が識別されなかった場合、第i本候補の所定エッジはターゲット所定エッジではないことを確定する第1識別サブモジュール822と、ターゲット情報領域が識別された場合、第i本候補の所定エッジをターゲット所定エッジに確定するように配置され、第i本候補の所定エッジと第1相対的位置関係に基づき、第1識別サブモジュール822は証明書画像におけるターゲット情報領域が識別された場合、第i本候補の所定エッジをターゲット所定エッジに確定する第2識別サブモジュール823と、ターゲット情報領域が識別されなかった場合、i=i+1に設置し、第1識別サブモジュール822に戻し、第1識別サブモジュール822の機能を実行するように配置された第3識別サブモジュール824と、を含むことができる。
第1識別サブモジュール822は、仮に第i本候補の所定エッジがターゲット情報領域であれば、第i本候補の所定エッジを用いてターゲット情報領域の識別を試し、第1並べ替えサブモジュール821の並べ替えた所定エッジの順によって試す。
第1相対的位置関係はターゲット所定エッジとターゲット情報領域との間の相対的位置関係である。好ましくは、領域識別モジュール830は、ターゲット所定エッジと、ターゲット所定エッジ及び情報領域の間の相対的位置関係である第2相対的位置関係とに基づき、少なくとも一つの情報領域を確定するようにさらに配置される。
以上まとめると、本発明の実施例により提供される領域識別装置は、証明書画像における証明書の所定方向に位置するエッジである所定エッジを識別することにより、n本候補の所定エッジを並べ替え、第i本(1≦i≦n)候補の所定エッジと、ターゲット所定エッジおよびターゲット情報領域の間の相対的位置関係である第1相対的位置関係とを用い、証明書画像においてターゲット情報領域の識別を試し、ターゲット所定エッジに基づいて証明書画像において少なくとも一つの情報領域が識別され、かかる技術における直接撮影して取得した証明書画像における一部情報領域が識別しにくいおよび一部情報領域に対する位置決めが正確ではない問題を解決し、証明書画像におけるn本候補の所定エッジによりターゲット所定エッジを確定し、ターゲット所定エッジに基づいて少なくとも一つの情報領域を確定し、これによって情報領域に対する正確な位置決め効果を達する。
同時に、n本候補の所定エッジを並べ替えることにより、ターゲット所定エッジを確定するスピードを向上させ、ターゲット所定エッジに対する正確な位置決め効果を達する。
図9の実施例により提供された好ましい実施例に基づき、図10に示すように、識別モジュール810は、証明書画像に対してソーベル水平方向フィルターと二値化を行い、処理された証明書画像を取得するように配置され、証明書画像に対してソーベル水平方向フィルターを行い、即ちソーベル演算子を採用して水平方向に沿ってフィルターをかける。その後、フィルターがかけられた証明書画像に対して二値化するフィルターサブモジュール811と、処理された証明書画像における証明書の所定方向に位置する領域である所定領域に対して直線検出を行い、少なくとも1本の直線を取得するように配置され、フィルターサブモジュール811により処理された証明書画像が取得され、処理された証明書画像に対して直線フィッティング又はハフ変換を含む直線検出を行い、これによって少なくとも1本の直線を取得する検出サブモジュール812と、直線がn本(n≧2)である場合、n本直線をn本候補の所定エッジに識別するように配置され、取得された直線がn本(n≧2)である場合、n本直線をn本候補の所定エッジに識別し、取得された直線が1本のみである場合、該直線は証明書画像におけるターゲット所定エッジに直接識別され、領域識別モジュール830の機能を直接実行するエッジ識別サブモジュール813と、を含むことができる。
二値化は証明書画像における画素点の濃淡値と所定濃淡値との比較を指し、証明書画像における画素点を、所定濃淡値より大きい画素グループと所定濃淡値より小さい画素グループの二部分に分け、二部分の画素グループが証明書画像においてそれぞれ黒と白の二色を現し、二値化された証明書画像を取得する。
以上まとめると、本実施例により提供される領域識別装置は、証明書画像に対してソーベル水平方向フィルターと二値化を行うことにより、処理された証明書画像が取得され、処理された証明書画像における所定領域に対して直線検出を行い、少なくとも1本直線が取得され、n本直線をn本候補の所定エッジに識別し、証明書画像のターゲット所定エッジに対する検出がさらに正確になり、後続情報領域識別時の正確度を向上させる。
図9の実施例により提供された好ましい実施例に基づき、図11Aに示すように、第1並べ替えサブモジュール821は、それぞれの候補の所定エッジに対し、所定エッジが処理された証明書画像における同じ位置の前景色画素点と交わり、所定エッジに対応する交点数を取得する交わりサブモジュール1110と、交点数の多から少への順に従い、n本候補の所定エッジを並べ替えるように配置され、交わりサブモジュール1110はそれぞれの候補の所定エッジに対応する交点数が取得された後、交点数の数に従って多から少への順序に並べ替え、並べ替えたn本候補の所定エッジを取得する第2並べ替えサブモジュール1120と、を含むサブモジュールをふくむことができる。
処理された証明書画像はフィルターサブモジュール811により処理された画像であり、エッジ識別サブモジュール813はn本候補の所定エッジが取得された後、証明書画像に対してソーベル水平方向フィルターを行い、即ちソーベル演算子を採用して水平方向に沿ってフィルターをかける。その後、フィルターをかけた証明書画像に対して二値化する。
交わりサブモジュール1110はそれぞれの候補の所定エッジが処理された証明書画像における同じ位置の前景色画素点と交わる。即ち、それぞれの候補の所定エッジが二値化された証明書画像における同じ位置に属する前景色画素点の個数を求める。
以上まとめると、本実施例により提供される領域識別装置は、n本候補の所定エッジを並べ替えることにより、ターゲット所定エッジを確定するスピードを向上させ、ターゲット所定エッジに対する正確な位置決めに有利であり、後続情報領域識別時の正確性を向上させる。
図9の実施例により提供された好ましい実施例に基づき、図11Bに示すように、第1識別サブモジュール822は、第i本候補の所定エッジと第1相対的位置関係を用い、証明書画像において、第i本候補の所定エッジと第1相対的位置関係に基づいて確定した領域を指す関心領域を切り取るように配置され、第i本候補の所定エッジと第1相対的位置関係に基づき、関心領域における上エッジ、下エッジ、左エッジと右エッジの大体の位置を確定することができ、そのため、確定された関心領域の上エッジと、下エッジと、左エッジと、右エッジとに基づき、証明書画像において関心領域を切り取る切取サブモジュール1130と、関心領域においてターゲット情報領域のキャラクター領域が備える特徴である所定特徴に合致するキャラクター領域が存在するか否かを識別するように配置され、切取サブモジュール1130により関心領域が切り取られた後、所定特徴に基づいて関心領域において所定特徴に合致するキャラクター領域が存在するか否かを識別する第4識別サブモジュール1140と、を含むことができる。
以上まとめると、本実施例により提供される領域識別装置は、第i本候補の所定エッジと第1相対的位置関係を用いることにより、証明書画像において関心領域が切り取られ、ターゲット情報領域を確定するスピードを向上させ、ターゲット情報領域に対する正確な位置決めに有利であり、後続情報領域識別時の正確性を向上させる。
図11Bの実施例により提供された好ましい実施例に基づき、図12に示すように、第4識別サブモジュール1140は、関心領域に対して二値化し、二値化された関心領域を取得するように配置される二値化サブモジュール1141と、関心領域が公民身分番号領域であることを例とし、好ましくは、二値化サブモジュール1141は関心領域に対し、ノイズ除去、フィルターかけ、エッジ抽出などの操作を含む前処理を行い、前処理された関心領域を二値化する。
二値化された関心領域に対して水平方向に従い、それぞれの行の画素点における縦座標とそれぞれの行の画素点における前景色画素点の累積値を含む第1ヒストグラムを計算するように配置され、二値化サブモジュール1141により処理された関心領域を水平方向に従い、垂直方向においてそれぞれの行の画素点における縦座標を表示し、水平方向においてそれぞれの行の画素点における前景色画素点の個数累積値を表示する第1ヒストグラムを計算する第1計算サブモジュール1142と、二値化された関心領域に対して垂直方向に従い、それぞれの列の画素点における横座標とそれぞれの列の画素点における前景色画素点の累積値を含む第2ヒストグラムを計算するように配置され、二値化サブモジュール1141により処理された関心領域を垂直方向に従い、水平方向においてそれぞれの列の画素点の横座標を表示し、垂直方向においてそれぞれの列の画素点における前景色画素点の個数累積値を表示する第2ヒストグラムを計算する第2計算サブモジュール1143と、第1ヒストグラムにおける前景色画素点の累積値が第1閾値より大きい行により構成された連続行集合の高さが所定高さ区間に合致し、第2ヒストグラムにおける前景色画素点の累積値が第2閾値より大きい列により構成された連続列集合の個数が所定個数に合致した場合、関心領域において所定特徴に合致するキャラクター領域が識別されるように配置され、第1ヒストグラムに基づいてそれぞれの行の画素点における前景色画素点の累積値を取得することができ、それぞれの行の画素点における前景色画素点の累積値と第1閾値を比較し、第1ヒストグラムにおける前景色画素点の累積値が第1閾値より大きい行により構成され、前景色画素点の累積値が第1閾値より大きい行は連続するm行であり、該連続するm行の画素点により構成された集合を指す連続行集合の高さを取得し、第2ヒストグラムに基づいてそれぞれの列の画素点における前景色画素点の累積値を取得することができ、それぞれの列の画素点における前景色画素点の累積値と第2閾値を比較し、第2ヒストグラムにおける前景色画素点の累積値が第2閾値より大きい列により構成され、前景色画素点の累積値が第2閾値より大きい行は連続するp列であり、該連続するp列の画素点により構成された集合を指す連続列集合の個数を取得するキャラクター識別サブモジュール1144と、第1ヒストグラムにおける前景色画素点の累積値が第1閾値より大きい行により構成された連続行集合の高さが所定高さ区間に合致せず、又は第2ヒストグラムにおける前景色画素点の累積値が第2閾値より大きい列により構成された連続列集合の個数が所定個数に合致しない場合、関心領域において所定特徴に合致するキャラクター領域が識別されないように配置された第5識別サブモジュール1145と、を含むことができる。
連続行集合の高さを所定高さ区間に合致せず、又は連続行集合の個数が所定個数に合致しない場合、第5識別サブモジュール1145は関心領域に所定特徴に合致するキャラクター領域が識別されないことを認識する。
以上まとめると、本実施例により提供される領域識別装置は、関心領域に対して二値化し、二値化された関心領域をそれぞれ水平方向と垂直方向に従って第1ヒストグラムと第2ヒストグラムを計算することにより、第1ヒストグラムにおける連続行集合の高さと第2ヒストグラムにおける連続列集合の個数に基づいて所定特徴に合致するキャラクター領域が識別されるか否かを確定し、キャラクター領域に対する位置決めをさらに正確にさせる。
本発明の一例示的実施例は、本発明により提供される領域識別方法を実現可能な領域識別装置を提供し、該領域識別装置は、プロセッサと、プロセッサの実行可能なコマンドを記憶するメモリとを含む。
プロセッサは、証明書画像における証明書の所定方向に位置するエッジである所定エッジを識別し、n本(n≧2)候補の所定エッジが識別された場合、n本候補の所定エッジのうちの1本候補の所定エッジをターゲット所定エッジに確定し、ターゲット所定エッジに基づいて証明書画像において少なくとも一つの情報領域が識別されるように配置された。
上記実施例における装置について、各モジュールの操作を実行する具体的な形態は、すでに該方法に関する実施例において詳しく説明されたので、ここで詳細な説明を省略する。
図13は一例示的な実施例により示された領域識別方法に用いられるブロック図である。例えば、設備1300は、携帯電話、コンピュータ、デジタル放送端末、メッセージ送受信装置、ゲームコンソール、タブレット型装置、医療機器、フィットネス装置、パーソナルデジタルアシスタントなどであってもよい。
図13に示すように、装置1300は、処理部1302、メモリ1304、電源部1306、マルチメディア部1308、音声部1310、入力/出力(I/O)のインタフェース1312、センサー部1314、及び通信部1316のうちの一つ又は複数の部材を含むことができる。
処理部1302は、一般的に装置1300の全体的操作、例えば、表示、電話呼び出し、データ通信、カメラ操作及び記録操作に関する操作を制御する。処理部1302は、上記方法の全部又は一部のステップを完成するために、一つ又は複数のプロセッサ1320を含んでコマンドを実行してもよい。さらに、処理部1302は、その他のモジュールとのインタラクションを便利にするように、一つ又は複数のモジュールを含んでもよい。例えば、処理部1302は、マルチメディア部1308と処理部1302とのインタラクションを便利にするように、マルチメディアモジュールを含んでもよい。
メモリ1304は、装置1300の操作をサポートするために、様々な種類のデータを記憶するように配置される。これらのデータの実例は、装置1300において操作される如何なるアプリケーション又は方法のコマンド、連絡先データ、電話帳データ、メッセージ、画像、ビデオなどを含む。メモリ1304は、如何なる種類の揮発性又は不揮発性メモリ又はそれらの組合せ、例えば、スタティックランダムアクセスメモリ(SRAM)、電気的消去可能なプログラマブル読み取り専用メモリ(EEPROM)、消去可能なプログラマブル読み取り専用メモリ(EPROM)、プログラマブル読み取り専用メモリ(PROM)、読み取り専用メモリ(ROM)、磁気メモリ、フラッシュメモリ、磁気ディスク又は光ディスクにより実現することができる。
電源部1306は、装置1300の様々な部材のために電力を供給する。電源部1306は、電源管理システム、一つ又は複数の電源、及びその他の装置1300のための電力の生成、管理及び供給に関連する部材を含むことができる。
マルチメディア部1308は、前記装置1300とユーザーの間の一つの出力インタフェースを提供するスクリーンを含む。一部の実施例において、スクリーンは液晶ディスプレイ(LCD)とタッチパネル(TP)を含んでもよい。スクリーンにタッチパネルが含まれる場合、スクリーンはユーザーからの入力信号を受信するために、タッチスクリーンに実現されることができる。タッチパネルは、タッチ、スワイプ及びタッチパネルにおけるジェスチャーを感知するために、一つ又は複数のタッチセンサを含む。前記タッチセンサは、タッチ又はスワイプ動作の境界を感知するとともに、前記タッチ又はスワイプ動作に関わる持続時間及び圧力を検出することができる。
一部の実施例において、マルチメディア部1308は、フロントカメラ及び/又はバックカメラを含む。装置1300が操作モードである場合、例えば、撮影モード又はビデオモードである場合、フロントカメラ及び/又はバックカメラは外部のマルチメディアデータを受信することができる。各フロントカメラ及びバックカメラは、固定された光学レンズシステムであってもよく、又は焦点距離と光学ズーム能力を有する。
音声部1310は、音声信号を出力及び/又は入力するように配置される。例えば、音声部1310は、マイクロホン(MIC)を含み、装置1300が操作モードである場合、例えば、呼び出しモード、記録モード及び音声認識モードである場合、マイクロホンは外部の音声信号を受信するように配置される。受信された音声信号は、さらにメモリ1304に記憶され、又は通信部1316を介して送信される。一部の実施例において、音声部1310は、さらに音声信号を出力するスピーカーを含む。
I/Oインタフェース1312は、処理部1302と周辺インターフェース部との間にインタフェースを提供し、上記周辺インターフェース部は、キーボード、クリックホイール、ボタンなどであってもよい。これらのボタンは、ホームボタン、ボリュームボタン、スタートボタン及びホールドボタンを含むことができるが、それに限定されない。
センサー部1314は、一つ又は複数のセンサを含み、装置1300に各方面の状態評価を提供するためである。例えば、センサー部1314は、装置1300のオン/オフ状態、部材の相対的位置決めを検出することができ、例えば、前記部材が装置1300のディスプレイ及びキーパッドであり、センサー部1314は、さらに装置1300又は装置1300の一つの部材の位置変化、ユーザーと装置1300との接触の有無、装置1300の方角又は加速/減速及び装置1300の温度変化を検出することができる。センサー部1314は、近接センサを含むことができ、如何なる物理的接触がない時、近傍物体の存在を検出するように配置される。センサー部1314は、さらに光学センサ、例えば、CMOS又はCCDイメージセンサを含むことができ、イメージングアプリケーションに用いられる。一部の実施例において、該センサー部1314は、さらに加速度センサ、ジャイロセンサ、磁気センサ、圧力センサ又は温度センサを含むことができる。
通信部1316は、装置1300とその他の装置との有線又は無線方式による通信を便利にするように配置される。装置1300は、通信標準に基づく無線ネットワーク、例えば、Wi−Fi、2G又は3G、又はそれらの組み合わせにアクセスすることができる。一例示的な実施例において、通信部1316は、放送チャネルを介して外部放送管理システムからの放送信号又は放送関連情報を受信する。一例示的な実施例において、通信部1316は、狭域通信を促進するために、さらに近距離無線通信(NFC)モジュールを含む。例えば、NFCモジュールにおいて、無線周波数認識(RFID)技術、赤外線データ協会(IrDA)技術、超広帯域(UWB)技術、ブルートゥース(BT)及びその他の技術に基づいて実現することができる。
例示的な実施例において、装置1300は、一つ又は複数の特定用途向け集積回路(ASIC)、デジタル信号プロセッサ(DSP)、デジタル信号処理装置(DSPD)、プログラマブルロジックデバイス(PLD)、フィールドプログラマブルゲートアレイ(FPGA)、コントローラ、マイクロコントローラ、マイクロプロセッサ又はその他の電子部品により実現することができ、上記デバイスの制御方法を実行するのに用いられる。
例示的な実施例において、さらに、コマンドを含む非一時的コンピュータ可読記憶媒体、例えば、コマンドを含むメモリ1304を提供し、上記方法を完成するために、上記コマンドは装置1300のプロセッサ1320により実行することができる。例えば、前記非一時的なコンピュータ可読記憶媒体は、ROM、ランダムアクセスメモリ(RAM)、CD−ROM、磁気テープ、フロッピー(登録商標)ディスク及び光データ記憶装置などであってもよい。
当業者であれば、明細書を考慮しここに開示された発明を実践した後、本発明のその他の実施様態を容易に想到できる。本発明は、本発明の如何なる変形、用途又は適応的変化を含むためのものであり、これらの変形、用途又は適応的変化は本発明の一般的な原理に準じ、本発明の開示されていない当該技術分野における一般的知識又は慣用の技術手段を含む。明細書と実施例は例示的なものに過ぎず、本発明の実際の範囲と精神は下記特許請求の範囲により与えられる。
理解すべきことは、本発明は既に上記のように説明され、図面に示された正確な構造に限定されず、その範囲を逸脱しない限りにおいて様々な修正や変更を行うことができる。本発明の範囲は特許請求の範囲のみにより限定される。

Claims (13)

  1. 領域識別方法であって、
    証明書画像における前記証明書の所定方向に位置するエッジである所定エッジを識別することと、
    n本(n≧2)候補の前記所定エッジが識別された場合、n本候補の前記所定エッジのうちの1本候補の前記所定エッジをターゲット所定エッジとして確定することと、
    前記ターゲット所定エッジに基づいて前記証明書画像において少なくとも一つの情報領域を識別することとを含み、
    n本(n≧2)候補の前記所定エッジが識別された場合、n本候補の前記所定エッジのうちの1本候補の前記所定エッジをターゲット所定エッジとして確定することは、
    n本候補の前記所定エッジを並べ替えることと、
    第i本(1≦i≦n)候補の前記所定エッジと、前記ターゲット所定エッジおよびターゲット情報領域の間の相対的位置関係である第1相対的位置関係とを用い、前記証明書画像においてターゲット情報領域の識別を試すことと、
    前記ターゲット情報領域が識別された場合、第i本候補の前記所定エッジを前記ターゲット所定エッジとして確定することと、
    前記ターゲット情報領域が識別されなかった場合、i=i+1に設置し、第i本候補の前記所定エッジと第1相対的位置関係を用い、前記証明書画像においてターゲット情報領域の識別を試すステップを再実行することと、を含むことを特徴とする方法。
  2. n本候補の前記所定エッジを並べ替えることは、
    それぞれの候補の前記所定エッジに対し、前記所定エッジがソーベル水平方向フィルターと二値化された画像である処理された前記証明書画像における同じ位置の前景色画素点と交わり、前記所定エッジに対応する交点数を取得することと、
    前記交点数の多から少への順に従い、n本候補の前記所定エッジを並べ替えることと、を含むことを特徴とする請求項に記載の方法。
  3. 第i本候補の前記所定エッジと第1相対的位置関係を用い、前記証明書画像においてターゲット情報領域の識別を試すことは、
    第i本候補の前記所定エッジと第1相対的位置関係を用い、前記証明書画像において関心領域を切り取ることと、
    前記関心領域において、前記ターゲット情報領域におけるキャラクター領域が備える特徴である所定特徴に合致するキャラクター領域が存在するか否かを識別することと、を含むことを特徴とする請求項に記載の方法。
  4. 前記関心領域において所定特徴に合致するキャラクター領域が存在するか否かを識別することは、
    前記関心領域に対して二値化を行い、二値化された関心領域を取得することと、
    前記二値化された関心領域に対して水平方向に従い、それぞれの行の画素点における縦座標と前記それぞれの行の画素点における前景色画素点の累積値を含む第1ヒストグラムを計算することと、
    前記二値化された関心領域に対して垂直方向に従い、それぞれの列の画素点における横座標と前記それぞれの列の画素点における前景色画素点の累積値を含む第2ヒストグラムを計算することと、
    前記第1ヒストグラムにおける前景色画素点の累積値が第1閾値より大きい行により構成された連続行集合の高さが所定高さ区間に合致し、前記第2ヒストグラムにおける前景色画素点の累積値が第2閾値より大きい列により構成された連続列集合の個数が所定個数に合致した場合、前記関心領域において前記所定特徴に合致するキャラクター領域が識別されることと、
    前記第1ヒストグラムにおける前景色画素点の累積値が第1閾値より大きい行により構成された連続行集合の高さが所定高さ区間に合致せず、又は前記第2ヒストグラムにおける前景色画素点の累積値が第2閾値より大きい列により構成された連続列集合の個数が所定個数に合致しない場合、前記関心領域において前記所定特徴に合致するキャラクター領域が識別されないこととを含むことを特徴とする請求項に記載の方法。
  5. 証明書画像における所定エッジを識別することは、
    前記証明書画像に対してソーベル水平方向フィルターと二値化を行い、処理された前記証明書画像を取得することと、
    前記処理された前記証明書画像における所定領域に対して直線検出を行い、少なくとも1本の直線を取得することと、
    前記直線がn本(n≧2)である場合、前記n本直線をn本候補の所定エッジに識別することとを含むことを特徴とする請求項1、3、4のいずれかに記載の方法。
  6. 前記ターゲット所定エッジに基づいて前記証明書画像において少なくとも一つの情報領域が識別されることは、
    前記ターゲット所定エッジと、前記ターゲット所定エッジ及び前記情報領域の間の相対的位置関係である第2相対的位置関係とに基づき、少なくとも一つの情報領域を確定することを含むことを特徴とする請求項1、3、4のいずれかに記載の方法。
  7. 領域識別装置であって、
    証明書画像における前記証明書の所定方向に位置するエッジである所定エッジを識別するように配置された識別モジュールと、
    n本(n≧2)候補の前記所定エッジが識別された場合、n本候補の前記所定エッジのうちの1本候補の前記所定エッジをターゲット所定エッジとして確定するように配置された確定モジュールと、
    前記ターゲット所定エッジに基づいて前記証明書画像において少なくとも一つの情報領域を識別するように配置された領域識別モジュールと、
    を含み、
    前記確定モジュールは、
    n本候補の前記所定エッジを並べ替えるように配置された第1並べ替えサブモジュールと、
    第i本(1≦i≦n)候補の前記所定エッジと、前記ターゲット所定エッジおよびターゲット情報領域の間の相対的位置関係である第1相対的位置関係とを用い、前記証明書画像においてターゲット情報領域の識別を試すように配置された第1識別サブモジュールと、を含み、
    前記ターゲット情報領域が識別された場合、前記第i本候補の前記所定エッジを前記ターゲット所定エッジとして確定し、
    前記ターゲット情報領域が識別されなかった場合、i=i+1に設置し、第1識別サブモジュールに戻ることを特徴とする装置。
  8. 前記第1並べ替えサブモジュールは、
    それぞれの候補の前記所定エッジに対し、前記所定エッジがソーベル水平方向フィルターと二値化された画像である処理された前記証明書画像における同じ位置の前景色画素点と交わり、前記所定エッジに対応する交点数を取得するように配置された交わりサブモジュールと、
    前記交点数の多から少への順に従い、n本候補の前記所定エッジを並べ替えるように配置された第2並べ替えサブモジュールとを含むことを特徴とする請求項に記載の装置。
  9. 前記第1識別サブモジュールは、
    第i本候補の前記所定エッジと前記第1相対的位置関係を用い、前記証明書画像において関心領域を切り取るように配置された切取サブモジュールと、
    前記関心領域において前記ターゲット情報領域におけるキャラクター領域が備える特徴である所定特徴に合致するキャラクター領域が存在するか否かを識別するように配置された第4識別サブモジュールとを含むことを特徴とする請求項に記載の装置。
  10. 前記第4識別サブモジュールは、
    前記関心領域に対して二値化し、二値化された関心領域を取得するように配置された二値化サブモジュールと、
    前記二値化された関心領域に対して水平方向に従い、それぞれの行の画素点における縦座標と前記それぞれの行の画素点における前景色画素点の累積値を含む第1ヒストグラムを計算するように配置された第1計算サブモジュールと、
    前記二値化された関心領域に対して垂直方向に従い、それぞれの列の画素点における横座標と前記それぞれの列の画素点における前景色画素点の累積値を含む第2ヒストグラムを計算するように配置された第2計算サブモジュールと、
    前記第1ヒストグラムにおける前景色画素点の累積値が第1閾値より大きい行により構成された連続行集合の高さが所定高さ区間に合致し、前記第2ヒストグラムにおける前景色画素点の累積値が第2閾値より大きい列により構成された連続列集合の個数が所定個数に合致した場合、前記関心領域において前記所定特徴に合致するキャラクター領域が識別されるように配置されたキャラクター識別サブモジュールと、
    前記第1ヒストグラムにおける前景色画素点の累積値が第1閾値より大きい行により構成された連続行集合の高さが所定高さ区間に合致せず、又は前記第2ヒストグラムにおける前景色画素点の累積値が第2閾値より大きい列により構成された連続列集合の個数が所定個数に合致しない場合、前記関心領域において前記所定特徴に合致するキャラクター領域が識別されないように配置された第5識別サブモジュールとを含むことを特徴とする請求項に記載の装置。
  11. 前記識別モジュールは、
    前記証明書画像に対してソーベル水平方向フィルターと二値化を行い、処理された前記証明書画像を取得するように配置されたフィルターサブモジュールと、
    処理された前記証明書画像における所定領域に対して直線検出を行い、少なくとも1本の直線を取得するように配置された検出サブモジュールと、
    前記直線がn本(n≧2)である場合、前記n本直線をn本候補の前記所定エッジに識別されるように配置されたエッジ識別サブモジュールとを含むことを特徴とする請求項7〜10のいずれかに記載の装置。
  12. 前記ターゲット所定エッジと、前記ターゲット所定エッジ及び前記情報領域の間の相対的位置関係である第2相対的位置関係とに基づき、少なくとも一つの情報領域を確定するように配置されたことを特徴とする請求項7〜10のいずれかに記載の装置。
  13. 領域識別装置であって、
    プロセッサと、
    プロセッサの実行可能なコマンドを記憶するメモリと、
    を含み、
    前記プロセッサは、
    証明書画像における前記証明書の所定方向に位置するエッジである所定エッジを識別し、
    n本(n≧2)候補の前記所定エッジが識別された場合、n本候補の前記所定エッジのうちの1本候補の前記所定エッジをターゲット所定エッジとして確定し、
    前記ターゲット所定エッジに基づいて前記証明書画像において少なくとも一つの情報領域を識別し、
    n本(n≧2)候補の前記所定エッジが識別された場合、n本候補の前記所定エッジのうちの1本候補の前記所定エッジをターゲット所定エッジとして確定する場合、
    n本候補の前記所定エッジを並べ替えて、
    第i本(1≦i≦n)候補の前記所定エッジと、前記ターゲット所定エッジおよびターゲット情報領域の間の相対的位置関係である第1相対的位置関係とを用い、前記証明書画像においてターゲット情報領域の識別を試し、
    前記ターゲット情報領域が識別された場合、第i本候補の前記所定エッジを前記ターゲット所定エッジとして確定し、
    前記ターゲット情報領域が識別されなかった場合、i=i+1に設置し、第i本候補の前記所定エッジと第1相対的位置関係を用い、前記証明書画像においてターゲット情報領域の識別を試すステップを再実行するように配置されることを特徴とする装置。
JP2017547044A 2015-10-30 2015-12-28 領域識別方法及び装置 Active JP6392467B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201510726012.7 2015-10-30
CN201510726012.7A CN105550633B (zh) 2015-10-30 2015-10-30 区域识别方法及装置
PCT/CN2015/099286 WO2017071061A1 (zh) 2015-10-30 2015-12-28 区域识别方法及装置

Publications (2)

Publication Number Publication Date
JP2018500703A JP2018500703A (ja) 2018-01-11
JP6392467B2 true JP6392467B2 (ja) 2018-09-19

Family

ID=55829816

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017547044A Active JP6392467B2 (ja) 2015-10-30 2015-12-28 領域識別方法及び装置

Country Status (8)

Country Link
US (1) US10095949B2 (ja)
EP (1) EP3163503A1 (ja)
JP (1) JP6392467B2 (ja)
KR (1) KR101758580B1 (ja)
CN (1) CN105550633B (ja)
MX (1) MX2016003318A (ja)
RU (1) RU2633184C2 (ja)
WO (1) WO2017071061A1 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106710372A (zh) * 2017-01-11 2017-05-24 成都市极米科技有限公司 拼音卡片识别方法、装置以及终端设备
CN107358150B (zh) * 2017-06-01 2020-08-18 深圳赛飞百步印社科技有限公司 物体边框识别方法、装置和高拍仪
CN109559344B (zh) * 2017-09-26 2023-10-13 腾讯科技(上海)有限公司 边框检测方法、装置及存储介质
US10740644B2 (en) * 2018-02-27 2020-08-11 Intuit Inc. Method and system for background removal from documents
KR102063036B1 (ko) * 2018-04-19 2020-01-07 한밭대학교 산학협력단 딥러닝과 문자인식으로 구현한 시각주의 모델 기반의 문서 종류 자동 분류 장치 및 방법
JP6574921B1 (ja) * 2018-07-06 2019-09-11 楽天株式会社 画像処理システム、画像処理方法、及びプログラム
JP7018372B2 (ja) * 2018-08-30 2022-02-10 株式会社Pfu 画像処理装置及び画像処理方法
US10331966B1 (en) * 2018-10-19 2019-06-25 Capital One Services, Llc Image processing to detect a rectangular object
CN111325197B (zh) * 2018-11-29 2023-10-31 北京搜狗科技发展有限公司 数据处理方法和装置、用于数据处理的装置
WO2020229517A1 (de) * 2019-05-13 2020-11-19 Prismade Labs Gmbh Vorrichtung und verfahren zur kontrolle von elektrisch leitfähigen sicherheitsmerkmalen und kontrollvorrichtung für elektrisch leitfähige sicherheitsmerkmale
CN110399872B (zh) * 2019-06-20 2023-04-28 创新先进技术有限公司 图像处理方法以及装置
CN110738204B (zh) * 2019-09-18 2023-07-25 平安科技(深圳)有限公司 一种证件区域定位的方法及装置
CN111260631B (zh) * 2020-01-16 2023-05-05 成都地铁运营有限公司 一种高效刚性接触线结构光光条提取方法
CN111724346A (zh) * 2020-05-21 2020-09-29 北京配天技术有限公司 直线边缘检测方法、机器人及存储装置
CN113835582B (zh) * 2021-09-27 2024-03-15 青岛海信移动通信技术有限公司 一种终端设备、信息显示方法和存储介质

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08161423A (ja) * 1994-12-06 1996-06-21 Dainippon Printing Co Ltd 照明装置および文字読取装置
DE19958553A1 (de) * 1999-12-04 2001-06-07 Luratech Ges Fuer Luft Und Rau Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten
JP3823782B2 (ja) * 2001-08-31 2006-09-20 日産自動車株式会社 先行車両認識装置
KR100608443B1 (ko) 2004-06-30 2006-08-02 노틸러스효성 주식회사 형태복원을 통한 지로인식방법
RU2309456C2 (ru) * 2005-12-08 2007-10-27 "Аби Софтвер Лтд." Способ распознавания текстовой информации из векторно-растрового изображения
US8265393B2 (en) * 2007-05-01 2012-09-11 Compulink Management Center, Inc. Photo-document segmentation method and system
KR101291195B1 (ko) 2007-11-22 2013-07-31 삼성전자주식회사 문자인식장치 및 방법
CN101751568B (zh) * 2008-12-12 2012-07-18 汉王科技股份有限公司 证件号码定位和识别方法
US8345106B2 (en) * 2009-09-23 2013-01-01 Microsoft Corporation Camera-based scanning
US9639949B2 (en) * 2010-03-15 2017-05-02 Analog Devices, Inc. Edge orientation for second derivative edge detection methods
JP5742399B2 (ja) * 2011-04-06 2015-07-01 富士ゼロックス株式会社 画像処理装置及びプログラム
CN102693421B (zh) * 2012-05-31 2013-12-04 东南大学 基于sift 特征包的牛眼虹膜图像识别方法
CN103577817B (zh) 2012-07-24 2017-03-01 阿里巴巴集团控股有限公司 表单识别方法与装置
CN102982160B (zh) 2012-12-05 2016-04-20 上海合合信息科技发展有限公司 方便电子化的专业笔记本及其电子化文档的自动分类方法
CN104217444B (zh) * 2013-06-03 2018-06-05 支付宝(中国)网络技术有限公司 定位卡片区域的方法和设备
JP6161484B2 (ja) 2013-09-19 2017-07-12 株式会社Pfu 画像処理装置、画像処理方法及びコンピュータプログラム
CN103488984B (zh) * 2013-10-11 2017-04-12 瑞典爱立信有限公司 基于智能移动设备的二代身份证识别方法及装置
CN104573616A (zh) * 2013-10-29 2015-04-29 腾讯科技(深圳)有限公司 一种信息识别方法、相关装置及系统
KR101663790B1 (ko) 2014-04-11 2016-10-10 (주) 엠티콤 얼굴인식장치 및 그 동작 방법
CN104268864B (zh) * 2014-09-18 2017-04-12 小米科技有限责任公司 卡片边缘提取方法和装置
CN104408450A (zh) * 2014-11-21 2015-03-11 深圳天源迪科信息技术股份有限公司 身份证识别方法、装置及系统
CN105528600A (zh) 2015-10-30 2016-04-27 小米科技有限责任公司 区域识别方法及装置

Also Published As

Publication number Publication date
KR20170061633A (ko) 2017-06-05
US20170124419A1 (en) 2017-05-04
RU2633184C2 (ru) 2017-10-11
CN105550633A (zh) 2016-05-04
US10095949B2 (en) 2018-10-09
MX2016003318A (es) 2018-06-22
JP2018500703A (ja) 2018-01-11
EP3163503A1 (en) 2017-05-03
KR101758580B1 (ko) 2017-07-14
RU2016109047A (ru) 2017-09-19
CN105550633B (zh) 2018-12-11
WO2017071061A1 (zh) 2017-05-04

Similar Documents

Publication Publication Date Title
JP6392467B2 (ja) 領域識別方法及び装置
JP6392468B2 (ja) 領域認識方法及び装置
US10127471B2 (en) Method, device, and computer-readable storage medium for area extraction
JP6400226B2 (ja) 領域認識方法及び装置
JP6401873B2 (ja) 領域認識方法及び装置
US20170124719A1 (en) Method, device and computer-readable medium for region recognition

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171219

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180316

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180816

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180822

R150 Certificate of patent or registration of utility model

Ref document number: 6392467

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250