JP2021531571A - 証明書画像抽出方法及び端末機器 - Google Patents

証明書画像抽出方法及び端末機器 Download PDF

Info

Publication number
JP2021531571A
JP2021531571A JP2021500946A JP2021500946A JP2021531571A JP 2021531571 A JP2021531571 A JP 2021531571A JP 2021500946 A JP2021500946 A JP 2021500946A JP 2021500946 A JP2021500946 A JP 2021500946A JP 2021531571 A JP2021531571 A JP 2021531571A
Authority
JP
Japan
Prior art keywords
certificate
image
feature model
pixel point
difference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021500946A
Other languages
English (en)
Inventor
▲錦▼▲倫▼ 黄
冬根 熊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Publication of JP2021531571A publication Critical patent/JP2021531571A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/90Dynamic range modification of images or parts thereof
    • G06T5/92Dynamic range modification of images or parts thereof based on global image properties
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/60Image enhancement or restoration using machine learning, e.g. neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/80Geometric correction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19147Obtaining sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19173Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Geometry (AREA)

Abstract

本出願は、コンピュータ技術分野に適用し、証明書画像抽出方法、端末機器及びコンピュータの不揮発性可読記憶媒体を提供する。前記方法は、証明書画像を含む、撮像装置によって撮影された元の画像を取得することと、赤、緑、青の3色成分における元の画像の各画素点の成分値に応じて、前記元の画像に対してホワイトバランス処理を行い、バランス画像を取得することと、予め訓練された証明書特徴モデルに応じて、バランス画像から前記証明書画像の位置を確定し、ここで、前記証明書特徴モデルが履歴証明書画像、証明書画像モデル及び予め設定された初期重みに基づいて訓練されて得られることと、証明書画像の位置に応じて、前記バランス画像から前記証明書の画像を抽出することと、を含む。証明書特徴モデルに応じて元の画像中の証明書位置を確定し、画像中の証明書画像を抽出することにより、元の画像から証明書画像を抽出する精度が向上する。

Description

本出願は、2019年1月10日に中国特許庁に提出された、出願番号が201910023382.2号で、発明の名称が「証明書画像抽出方法及び端末機器」である中国特許出願の優先権を主張し、その内容全体が参照により本出願に組み込まれる。
本出願は、コンピュータ応用技術分野に属し、特に、証明書画像抽出方法、端末機器及びコンピュータの不揮発性可読記憶媒体に関する。
マシンビジョンは、「モノ」に「見る」機能を持たせ、情報収集機能だけでなく、処理や認識などの高度な機能も持たせることができる。また、マシンビジョンの機器コストが低く、最も一般的に使用されている機器はカメラである。統計によると、近年、各大都市での公共カメラと家庭用・企業用カメラの取り付け比率が大幅に増加しており、家庭用・企業用カメラの取り付け比率も高く、カメラの普及に伴い、今後、各都市の隅又は家庭や企業ではカメラが大量に使用される。カメラの急速な普及に伴い、マシンビジョン技術の関連アプリケーションはさらに急速に発展していく。マシンビジョン分野の発展に伴い、証明書写真による身元検証技術もこの波に乗って広く応用されている。
従来技術では、都市の様々な場所に配置されたカメラを呼び出して身元検証を行うことができ、これにより、数万人から特定の人の情報を見つけることが簡単になる。しかし、多くの外部環境の影響により、得られた証明書画像の品質が悪く、証明書画像を正確に取得することができない。
本出願の実施例は、従来技術における多くの外部環境の影響により、得られた証明書画像の品質が悪く、正確ではないという問題を解決するように、証明書画像抽出方法、端末機器及びコンピュータの不揮発性可読記憶媒体を提供する。
本出願の実施例の第1の態様に係る証明書画像抽出方法は、
証明書画像を含む、撮像装置によって撮影された元の画像を取得することと、
赤、緑、青の3色成分における前記元の画像の各画素点の成分値に応じて、前記元の画像に対してホワイトバランス処理を行い、バランス画像を取得することと、
予め訓練された証明書特徴モデルに応じて、前記バランス画像から前記証明書画像の位置を確定し、ここで、前記証明書特徴モデルが履歴証明書画像、証明書画像モデル及び予め設定された初期重みに基づいて訓練されて得られることと、
前記証明書画像の位置に応じて、前記バランス画像から前記証明書の画像を抽出することと、を含む。
本出願の実施例の第2の態様に係る端末機器は、メモリと、プロセッサと、前記メモリに記憶されかつ前記プロセッサ上で実行可能なコンピュータ可読命令とを含み、前記プロセッサが前記コンピュータ可読命令を実行すると、以下のステップを実現する:
証明書画像を含む、撮像装置によって撮影された元の画像を取得する。
赤、緑、青の3色成分における前記元の画像の各画素点の成分値に応じて、前記元の画像に対してホワイトバランス処理を行い、バランス画像を取得する。
予め訓練された証明書特徴モデルに応じて、前記バランス画像から前記証明書画像の位置を確定し、ここで、前記証明書特徴モデルが履歴証明書画像、証明書画像モデル及び予め設定された初期重みに基づいて訓練されて得られる。
前記証明書画像の位置に応じて、前記バランス画像から前記証明書の画像を抽出する。
本出願の実施例の第3の態様に係る端末機器は、
証明書画像を含む、撮像装置によって撮影された元の画像を取得するための取得ユニットと、
赤、緑、青の3色成分における前記元の画像の各画素点の成分値に応じて、前記元の画像に対してホワイトバランス処理を行い、バランス画像を取得するための処理ユニットと、
予め訓練された証明書特徴モデルに応じて、前記バランス画像から前記証明書画像の位置を確定するために使用され、ここで、前記証明書特徴モデルが履歴証明書画像、証明書画像モデル及び予め設定された初期重みに基づいて訓練されて得られる確定ユニットと、
前記証明書画像の位置に応じて、前記バランス画像から前記証明書の画像を抽出する抽出ユニットと、を含む。
本出願の実施例の第4の態様に係るコンピュータの不揮発性可読記憶媒体は、コンピュータ可読命令を記憶しており、前記コンピュータ可読命令がプロセッサによって実行されると、前記プロセッサに上記の第1の態様の方法を実行させる。
本出願の実施例では、証明書画像を含む、撮像装置によって撮影された元の画像を取得し、赤、緑、青の3色成分における元の画像の各画素点の成分値に応じて、前記元の画像に対してホワイトバランス処理を行い、バランス画像を取得し、予め訓練された証明書特徴モデルに応じて、バランス画像から前記証明書画像の位置を確定し、ここで、前記証明書特徴モデルが履歴証明書画像、証明書画像モデル及び予め設定された初期重みに基づいて訓練されて得られ、証明書画像の位置に応じて、前記バランス画像から前記証明書の画像を抽出する。証明書特徴モデルに応じて元の画像中の証明書位置を確定し、画像中の証明書画像を抽出することにより、元の画像から証明書画像を抽出する精度が向上する。
本出願の実施例1に係る証明書画像抽出方法のフローチャートである。 本出願の実施例2に係る証明書画像抽出方法のフローチャートである。 本出願の実施例3に係る端末機器の概略図である。 本出願の実施例4に係る端末機器の概略図である。
以下の説明では、限定ではなく説明の目的で、特定のシステム構造、技術などの詳細が本出願の実施例を完全に理解するために提供される。しかし、これらの詳細のない他の実施例においても本出願が実現され得ることは当業者が理解すべきである。他の実施例では、不要な詳細が本出願の説明を妨げないように、周知のシステム、装置、回路及び方法に対する詳細な説明を省略する。
本出願に記載の技術的解決手段を説明するために、以下に具体的な実施例を用いて説明する。
図1を参照すると、図1は、本出願の実施例1に係る証明書画像抽出方法のフローチャートである。本実施例における証明書画像抽出方法の実行主体は、端末である。端末は、スマートフォン、タブレットコンピュータ、ウェアラブル機器などのモバイル端末を含むがこれらに限定されず、デスクトップコンピュータなどであってもよい。図に示す証明書画像抽出方法は、以下のステップを含むことができる。
S101、証明書画像を含む、撮像装置によって撮影された元の画像を取得する。
社会実名制の発展に伴い、証明書情報を高速かつ正確に収集することは、ますます重要な話題となり、ハードウェア性能の向上及びデジタル画像処理技術の高速発展により、証明書情報収集システムの性能が大幅に向上する。証明書情報収集システム全体の機能に影響を与える証明書画像処理部として、それはシステムの効果に大きな影響を与え、且つ、対応する処理もシステムによって異なる。国の法規制が徐々に改善されるにつれ、社会は公共の安全に対する要求がますます高くなっているため、関係部門は、社会や人々の生活の多くの分野でインターネットアクセスの実名制、口座開設の実名制、携帯電話の実名制などの実名制を実施している。個人情報の抽出が単純に手作業による入力及び検証に依存すると、作業効率が低くなり、誤り率が高くなり、業務の両方に重大な不便をもたらす。証明書情報収集システムは、無線周波数識別技術と画像識別技術により、証明書情報の自動抽出、身元証明書、パスポートなどの証明書資料の入力を実現することができる。情報取得手段の豊富さと画像処理技術の発展により、証明書トリーダーの体積がより小さくなり、情報抽出の速度が速くなり、情報の誤り率が低くなる。公共の安全と管理効率を向上させるとともに、業務の両方に大きな利便性をもたらす。さらに、証明書情報収集システムは、実名制アプリケーションの拡張にも有利である。証明書情報収集システムの発展により、汽車、自動車、地下鉄などの交通量が大きい場合にも実名制の実施が可能となり、これは鉄道、道路、都市鉄道輸送の安全性が大幅に確保される。
モバイルインテリジェント端末とは、コンピュータのように様々なオペレーティングシステムが取り付けられるが、体積がコンピュータに比べて小さく、携帯しやすく、且つ無線インターネットアクセス機能を有し、ユーザは、自分のニーズに応じてオペレーティングシステムに対応する様々なアプリケーションをダウンロードすることができる。生活の中でより一般的なモバイルインテリジェント端末として、スマートフォン、タブレットコンピュータ、車載コンピュータ、ウェアラブルモバイル機器などがある。スマートフォンは、現在のより一般的に使用されるモバイルインテリジェント端末であり、ユーザは、自分の好み又はニーズに応じてサードパーティサービスプロバイダーから提供されるアプリケーション、ゲーム又は機能プログラムなどをインストールすることができ、インテリジェント端末の機能に対するニーズを満足することができる。近年、科学技術の継続的な発展に伴い、様々な証明書はもはや1本の証明書ではなく、身元証明書に類似するカードである。証明書の利用に伴い、証明書情報の入力も重要な問題となっている。従来の情報入力方法として、まず関連するテーブルに情報を手動で書き込み、次に内部作業者は、テーブルの内容に応じて重要な情報をコンピュータに記憶するか、又は指定された場所に証明書をスキャンしてアップロードする。前者の方式では情報入力の場所が制限されないが、情報入力のたびに多大な人的及び物的資源が必要であり、誤入力も発生しやすい。後者の場合、情報入力の効率や確率が向上するが、利用場所が比較的固定されている。モバイルインテリジェント端末の登場により、いつでもどこでも証明書情報の入力が可能になる。モバイルインテリジェント端末上の情報識別システムは、サービス業界、交通システム、公安システムなどの証明書情報をチェックする必要がある部分に広く適用することができ、多数の人員を必要とせずに証明書情報の収集及びチェックを完了することができ、収集及びチェック作業における証明書情報識別の効率と正確率を向上させ、幅広い応用の見通しを持っている。
実際の応用では、ユーザは、モバイル端末で撮影された元の画像をサーバ又は画像処理端末にアップロードすることができ、画像処理端末は、元の画像を受信した後、その元の画像を処理して識別する。本解決手段の応用場面は、ユーザの証明書画像が取得されて検証されるウェブサイトで画像収集命令をユーザに送信し、ユーザが自分の端末機器で身元証明書、パスポートなどの写真を撮影し、撮影された画像をモバイル端末内のアプリケーションソフト又はウェブページを介して実行主体に送信し、実行主体がターゲット画像を取得した後に当該元の画像を処理して識別することであってもよい。
S102、赤、緑、青の3色成分における前記元の画像の各画素点の成分値に応じて、前記元の画像に対してホワイトバランス処理を行い、バランス画像を取得する。
実際の応用では、画像を表現するために最も一般的に使用される色空間は、赤緑青(RGB:Red Green Blue)である。トゥルーカラー画像の3つの色成分はそれぞれ1つのバイトビットで表されるので、1つのドットの空間は3つのバイトで表される必要があり、1つの1024×768のトゥルーカラー画像は1024×768×3=2.25MBが必要となる。このような大きな空間は、初期のコンピュータでは大きなオーバーヘッドであり、携帯電話のようにメモリスペースが比較的小さいいくつかの環境でも、それも巨大である。したがって、1つのテーブルで画像内の全ての色が格納されるが、実際の画像データはもはやRGBデータではなく、そのテーブル内のRGBデータのインデックスであり、インデックスのサイズを制御するために、このテーブルのサイズは、一般的に256個未満の要素、すなわち1バイトで表される範囲に要求され、このバイトはこの画像内の1ドットの色を表すことができる。テーブルがより小さくなると、1つのドットのためのインデックスビット数がさらに少なくなるので、1024×768のトゥルーカラー画像の256色パレットに1024×768×3=768.8KBだけが必要となる。色量子化プロセスでは、トゥルーカラー又はフォールストゥルーカラー画像がパレット画像に量子化されるためのカラーパレットとパレット画像に継続的に量子化されるためのカラーパレットという2つのカラーパレットがよく使用される。コンピュータの記憶容量の継続的な増大に伴い、パレット画像は、パーソナルコンピュータから徐々に消えてきているが、携帯電話などのいくつかの特殊な機器、特にモバイルゲームアプリケーションなどでは、依然として広く応用されている。
コンピュータ技術の継続的な発展に伴い、グラフィック画像の処理は、工業、農業、軍事、医学、管理などの様々な分野で広く利用されている。カラースキャナー、カメラなどの機器で、自然界のカラフルな元の画像を収集することができる。しかし、コンピュータで表示する場合、表示装置によって提供される機能と経済性の理由で、表示できる色の数は常に制限されている。一方で、異なるコンピュータ機器の条件で表示できる色の数は常に異なるが、同じ画像でもグレードの低いマシン機器の状態ではより良く再現されることが望まれる。色再現、階調処理の一連の問題を解決することができるテレビ撮影の分野において非常に重要な概念である。
実際の応用では、バランスは、ディスプレイにおける赤、緑、青の三原色を混合して生成された白色の精度を記述するための指標である。ホワイトバランスは、カメラの分野で色再現と色相処理の一連の問題を解決するための非常に重要な概念である。ホワイトバランスは、電子画像のトゥルーカラーの再現に伴って発生し、専門の撮影分野でより早く応用され、現在の家庭用の電子製品でも広く使用されているが、技術の発展によりホワイトバランスの調整がより簡単になり、しかし、多くのユーザがホワイトバランスの動作原理を理解していなく、理解には多くの誤解がある。ホワイトバランスにより、カメラの画像に被写体の色の状態を正確に反映させることができる。本実施例では、手動ホワイトバランスと自動ホワイトバランスなどで元の画像に対してホワイトバランス処理を行うことにより、バランス画像を得ることができる。
S103、予め訓練された証明書特徴モデルに応じて、前記バランス画像から前記証明書画像の位置を確定し、ここで、前記証明書特徴モデルが履歴証明書画像、証明書画像モデル及び予め設定された初期重みに基づいて訓練されて得られる。
証明書文字の識別に用いられる主な方法は、隠れマルコフモデル、ニューラルネットワーク、サポートベクターマシン、テンプレートマッチングである。隠れマルコフモデルを用いたすべての方法では、前処理と既存の知識に基づくパラメータ設定とが行わる必要がある。この方法では、複雑な前処理とパラメータ化により高い識別率を取得することができ、証明書特徴モデルを多層知覚ニューラルネットワークによって訓練することができるが、ニューラルネットワークが後方フィードバック法を用いて訓練するため、より良い結果を得るために何度も訓練しなければならず、このプロセスに時間がかかり、隠れ層の層数と隠れ層のニューロンの数を実験的な方法で求めなければならない。選択可能に、ニューラルネットワークは、バランス画像内の証明書を識別するために、24個の入力層ニューロン、15個の隠れ層ニューロン、及び36個の出力層ニューロンを含む。
人間の中脳には無数のニューロンが存在し、これらのニューロンには無尽蔵のつながりがあり、組織化された後に緊密な神経ネットワーク構造が形成され、この神経ネットワーク構造が人間の脳の複雑な計算と機能を実現することが可能である。ここでのニューラルネットワークは、主にこれらのニューロンの接続方式、組織構造を研究するためのものである。ニューラルネットワークの場合、それは層状と網状の2種類に分けられてもよい。第1の種類のニューロン構造の場合、ニューロンは階層的に配列され、層ごとに並びに配置されて1つの緊密な機構を形成し、層の間にニューロンで接続されているが、各層内のニューロンの場合、接続ができなく、第2の種類のニューロン構造の場合、各ニューロンは相互に接続することができる。
ニューラルネットワークの場合、一定の訓練を行った後に、ニューラルネットワークの処理のルールや方法を学習し、かつこれらの方法で問題の処理及び解決を行う必要があることを説明すべきである。順方向多層ネットワークの構造については、具体的には次のいくつかのステップで実現される。まず、入力パターンと出力パターンを含む順方向多層ネットワークの訓練例を提供する必要がある。上記の設計の訓練セルフケアについては、入力と出力に一定の誤差が許容され、順方向多層ネットワークの出力を変更する必要があり、最終的な出力が誤差の範囲を満たすより良い出力を得るために、出力を変更する必要がある。
S104、前記証明書画像の位置に応じて、前記バランス画像から前記証明書の画像を抽出する。
バランス画像中の証明書画像の位置が確定された後、証明書画像の位置に応じて、バランス画像から当該証明書画像を抽出する。具体的には、その抽出方法は、証明書画像を抽出するためにバランス画像から直接トリミングする方式であってもよく、証明書画像以外の画像領域を除去して証明書画像を保持する方法であってもよいが、ここでは限定されない。
また、エッジと勾配とに基づいて、証明画像の画像エッジを検出し、その画像エッジに基づいて、証明画像を抽出するようにしてもよい。
また、エッジ及びグラデーションに基づく方法により、証明書画像の画像エッジを検出し、当該画像エッジに基づき、証明書画像を抽出することができる。エッジに基づく証明書画像方法では、自然場面における証明書画像と背景エッジに大きな違いがあると考えられ、当該方法では文字に対してエッジ検出を行うので、エッジ情報から証明書画像を確定する。選択可能に、Sobel演算子、Robert演算子、Laplace演算子によって証明書画像の画像エッジを確定することができる。ここで、Sobel演算子は、証明書画像中のある画素点のグラデーションが閾値よりも大きいかどうかを判断することにより、その点がエッジ点であるかどうかを確定し、Robert演算子は、文字と背景の違いが大きい画像に適し、かつ検出して得られたエッジが粗いが、Laplace演算子は、ノイズに非常に敏感であり、ダブルエッジ効果を発生しやすく、エッジの検出に直接使用されていない。また、接続領域に基づく証明書画像特定方法を用いうことができ、元の画像を2値画像に変換し、ノイズの影響を低減させ、形態学的腐食膨張アルゴリズムを用いて証明書画像領域を接続し、証明書画像と白背景との区別の度合いによって画像を分割し、証明書画像の様々な特徴によって非証明書画像接続領域を除外し、それによって証明書画像を取得するという接続領域に基づく証明書画像確定方法は、証明書画像の確定速度が速くなり、証明書画像及びその証明書画像に含まれる文字の識別効率を向上させることができる。
上記の解決手段では、証明書画像を含む、撮像装置によって撮影された元の画像を取得し、赤、緑、青の3色成分における前記元の画像の各画素点の成分値に応じて、前記元の画像に対してホワイトバランス処理を行い、バランス画像を取得し、予め訓練された証明書特徴モデルに応じて、前記バランス画像から前記証明書画像の位置を確定し、ここで、前記証明書特徴モデルが履歴証明書画像、証明書画像モデル及び予め設定された初期重みに基づいて訓練されて得られ、前記証明書画像の位置に応じて、前記バランス画像から前記証明書の画像を抽出する。証明書特徴モデルに応じて元の画像中の証明書位置を確定し、画像中の証明書画像を抽出することにより、元の画像から証明書画像を抽出する精度が向上する。
図2を参照すると、図2は、本出願の実施例2に係る証明書画像抽出方法のフローチャートである。本実施例における証明書画像抽出方法の実行主体は、端末である。端末は、スマートフォン、タブレットコンピュータ、ウェアラブル機器などのモバイル端末を含むがこれらに限定されず、デスクトップコンピュータなどであってもよい。図に示す証明書画像抽出方法は、以下のステップを含むことができる。
S201、履歴証明書画像を収集し、前記履歴証明書画像を予め設定されたターゲット画像要件に従ってフィルタリングしてターゲット画像を取得する。
元の画像を識別して処理する前に、証明書画像を識別するための証明書特徴モデルを訓練する必要がある。したがって、本解決手段では、まず、元の画像から証明書画像を抽出するために、履歴証明書画像に基づいて証明書特徴モデルを訓練することができる。本解決手段では、証明書特徴モデルを訓練するためのデータは、履歴証明書画像であってもよく、履歴証明書画像は、証明書画像を正式に抽出する前に取得された履歴画像を含む。
実際の応用では、取得された履歴証明書画像には要件を満たしていない画像がある可能性があり、このような状況を考慮して、本解決手段では、取得された履歴証明書画像を予め設定されたターゲット画像要件に従ってフィルタリングしてターゲット画像を取得する。ここで、予め設定されたターゲット画像要件は、画像の画素、サイズ、又は撮影時間の要件であってもよく、さらに、検出された画像の完全性、証明書画像のタイプの要件などであってもよい。これらの要件は、実行者によって確定されてもよく、ここでは限定されず、ターゲット画像要件が確定された後、取得された履歴証明書画像をターゲット画像要件と一致させ、一致度が一致度閾値より大きい履歴証明書画像をターゲット画像として確定する。
様々な撮像装置で得られた証明書画像を取得してニューラルネットワーク訓練を行うための初期サンプルとして使用する。ニューラルネットワークの学習及び訓練プロセスでは、訓練セットの選択は、ネットワークの学習及び訓練時間、重み行列、学習及び訓練効果などに影響を直接与える。本解決手段では、画像のエッジが明らかであり、かつ画像の大部分の領域にエッジが分布している画像が訓練セットの初期サンプルとして選択され、画像のエッジがより明確になり、粒状のエッジが画像全体に分布し、かつそのテクスチャ特徴が豊富であり、ニューラルネットワークが十分に訓練され、ネットワークの重みなどのネットワーク情報はより多くのエッジ情報を記憶し、画像をより良く検出することができる。
S202、予め設定された証明書画像テンプレートに従って前記ターゲット画像の画素を識別し、前記ターゲット画像から少なくとも1つの中心画素点を確定する。
画像サンプルの中心画素点を確定する際には、画像識別により、画像サンプルの顕著かつ代表的な画素点を中心画素点として確定することができる。例示的には、処理される元の画像がユーザによって撮影された身元画像である場合、既知の身元証明書画像のアバターのサイズと文字の位置に基づいてアバターの四隅を中心画素点として確定してもよいし、身元証明書中の1番目のワード又は各行の1番目のワードなどのいくつかの文字を中心画素点として確定してもよい。さらに、身元証明書の写真、不動産証明書の写真などの取得された画像のタイプを予め設定し、各タイプの画像テンプレート及び当該テンプレート内の各画像要素の位置、又は証明書の境界からの距離などの情報を確定し、これらの情報によって識別し、画像サンプル内の中心画素点を正確に確定し、中心画素点及びそれを中心する周辺の画素点を用いて学習及び訓練を行い、元の画像から証明書の位置を確定することができる。
説明すべきものとして、中心画素点の周辺の画素点の数は、少なくとも2個であってもよく、好ましくは、画像の各画素をより明確に確定するために、中心画素点の周辺の8個の画素点を確定して学習して訓練してもよい。
S203、訓練モデルの初期パラメータを設定し、前記初期パラメータ、各前記中心画素点の画素値と前記中心画素点の周辺の画素点の画素値に基づいて学習して訓練し、ニューラルネットワークに基づく証明書特徴モデルを取得する。
いずれかのニューラルネットワークモデルについては、その応用プロセスにおける学習及び訓練はいずれも重要なリンクであり、ネットワークは、関連付け、記憶、予測機能を持つことができるように、学習及び訓練される必要がある。通常、いくつかのパラメータの確定は、学習及び訓練プロセスにとって非常に重要である。ネットワークの初期パラメータは、ネットワークの初期構造、接続の重み、閾値及び学習率などを含む。異なる設定は、ネットワークの収束速度に影響をある程度与える。初期パラメータの選択は、非常に重要であるが、非常に難しい。ネットワーク構築は、必要な技術処理に加えて、主に観察と経験に依存している。
証明書特徴モデルを訓練するとき、まず、モデルの初期値を確定し、ネットワークの初期重みと閾値は、一般的に[−1,1]又は[0,1]からランダムに選択され、いくつかの改良されたアルゴリズムは、間隔に適切な変更を加える。次に、ベクトルを正規化し、学習及び訓練プロセスにおいてノード入力が大きすぎてはならず、重み調整が小さすぎるとネットワーク学習及び訓練に不利である。訓練画像は階調に基づいているため、画像行列はすべて[0、255]の間の整数値であり、かつ特徴ベクトルの次元が比較的高いので、ネットワークの訓練速度を向上させるために、特徴ベクトルに対して一様に正規化する。特徴ベクトルを行ベクトルと見なすと、それは、以下のように表される。

Figure 2021531571
ここで、

Figure 2021531571
は、それぞれ中心画素点とその周辺の画素点の画素値を表すために使用される。
本実施例における中心画素点の周辺の画素点の数は、少なくとも2個であってもよく、中心画素点の周辺の画素点をより正確に説明するために、好ましくは8個であってもよく、8ビットの階調画像の階調値範囲は[0、255]であり、従って、実際の処理における正規化式は以下のとおりであり、

Figure 2021531571
ここで、xは、中心画素点の画素値を表すために使用される。
処理対象が画像であり、画像サンプルセットが比較的大きいため、画像をブロックに分割するという考え方を採用する。ニューラルネットワークに1つの画像サンプルが入力されるたびに、1つ又は少なくとも2つの中心画素点を確定することにより、この中心画素点の周辺のテンプレート画素、即ちそれを中心とする周辺の8つの画素を学習及び訓練し、これらの画素の階調値を上から下へ、左から右へと順に入力層に供給する。出力層から供給される所望の出力画素の階調値と実際の出力層の出力画素の階調値との間には一定の誤差があり、この誤差は逆伝播し、これにより各ニューロンの閾値とニューロン間の接続重みが変化するため、ネットワークはより多くのエッジ情報を効果的に記憶することができる。上記のプロセスを、誤差が所定の範囲内に小さくなるまで、又は訓練回数が目標回数に達するまで繰り返して行い、訓練タスクを完了する。訓練要件では、ネットワークの訓練をいつでも停止できると同時に、今後のニューラルネットワークによる検出を容易にするために、訓練された重みと閾値の両方をバックエンドのデータベースに記憶し、最後に訓練されたネットワークを保存することが規定されている。
S204、証明書画像を含む、撮像装置によって撮影された元の画像を取得する。
本実施例におけるS204は、図1に対応する実施例におけるS101の実現方法と完全に同様であり、具体的には図1に対応する実施例におけるS101の関連説明を参照することができ、ここでは説明を省略する。
S205、赤、緑、青の3色成分における前記元の画像の各画素点の成分値に応じて、前記元の画像に対してホワイトバランス処理を行い、バランス画像を取得する。
元の画像を取得した後、赤、緑、青の3色成分における元の画像の各画素点の成分値に応じて、前記元の画像に対してホワイトバランス処理を行い、バランス画像を取得する。
さらに、ステップS205は、具体的には、ステップS2051−S2052を含んでもよい。
S2051、赤、緑、青の3色成分における前記元の画像の各前記画素点の成分値に応じて、前記元の画像における各前記画素点の平均色差を推定する。
画像に対して形態学的処理又はマッチング、識別などの処理を行う前に、干渉情報をフィルタリングしたり、有効情報を強化したりするなどの画像前処理と呼ばれる処理を行う。画像の前処理の主な目的は、画像内の干渉情報又は無関係な情報を排除し、有用な実の情報を復元し、関連情報の検出可能性を高め、データを最大限に関素化することで、特徴抽出、画像分割、マッチングと識別の信頼性を向上させることである。デジタルカラー画像に対する前処理は、一般的に輝度と色の復元と強化である。様々な前処理の比較と試験に鑑み、ホワイトバランス処理はシステムの最終的な分割結果に比較的大きな影響を与えるが、他の前処理は、ほとんど影響を与えないことがわかる。したがって、本解決手段における前処理は主にホワイトバランス処理である。
光源が異なるとスペクトルの成分及び分布も異なり、これを比色分析では色温度と呼ばれる。1つの白い物体は、色温度の低い光が照射されと赤くなり、色温度の高い光が照射されると青くなる。撮影時には、周囲光源の色温度が画像に影響を与え、必然的に色のずれが生じる。ターゲット色への外光の影響を最小限に抑え、異なる色温度条件下で被写体の元の色を復元するためには、正しいカラーバランスを達成するための色補正を行う必要がある。
画像のR、G、Bの3色が等しい場合、その色差が0であり、白色になる。画像処理では、一般的に、YBRカラーモデルを用いて色差を計算する。YBR色系とRGB色系の対応関係は、以下のとおりである:

Figure 2021531571
Yが十分に大きく、BとRが十分に小さい空間で1つの領域が定義され、その領域内の全ての画素が白色として見なされ、色差の計算に参加することができる。次に、白色画素の平均色差を用いて画像全体の色差を表し、よい精度を達成する。システムの特徴に応じて、以下の約束条件、

Figure 2021531571
が与えられる。当該約束を満たす画素は白色として見なされ、白色画素点の平均輝度及びR、G、B成分の平均値Ravg、Gavg、Bavgとが得られる。
S2052、各前記画素点の前記平均色差に応じて、赤、緑、青の3色成分における各前記画素点の利得量を計算する。
実際の応用では、色利得が画像の鮮やかさを示すために使用され、利得量は色のコントラストを増加し、色をより鮮やかで飽和させ、より大きな視覚的影響を引き起こし、一方では、一定のシャープニング効果があるため、エッジラインがより鮮明になる。色利得により、画像のコントラスト、彩度などを自動的に調整する機能は同様である。デジタルカメラのこのような技術は、写真をより鮮明に見せることができ、より目立つようにすることができる。
前ステップで算出された平均色差に基づき、ホワイトバランスの各成分の利得量は、以下のとおりである:

Figure 2021531571
S2053、前記利得量に基づき、前記元の画像における各前記画素点の色温度を補正し、前記バランス画像を取得する。
前ステップで得られた利得量に基づき、本解決手段では、画像全体の各画素の色温度補正を行い、具体的な算式は以下のとおりである:

Figure 2021531571
選択可能に、画像の強化を行って画像のノイズを除去又は低減したりし、画像のコントラストを増加したりするなどにより、テキスト領域の位置を強化することができる。画像の水平補正により、元の画像をテキストの水平分布に変換し、テキスト領域の位置決め精度を向上させる。画像強化方法として、ガウスぼかしとシャープニング処理であってもよく、画像のガウスぼかし処理は、細部をぼかしてノイズを低減するための一般的な方法であり、ガウスぼかし処理には、点の8つの接続領域を一定の重みで加算し、その中の値を点の画素値として使用する。ガウスぼかしスムージング処理により、画像内の多くのノイズを平滑化し、画像内のターゲット画像の輪郭を強化することができる。ガウスぼかしスムージング処理は、背景が複雑であるが画像の目標輪郭が明らかな画像のみに適用できるが、スムージング処理により、画像の細部を平滑化することができ、ノイズを平滑化するとともに、不明確な輪郭の細部も平滑化する。
また、元の画像に対して画像の平滑化やフィルタリングを行うことができ、画像生成プロセスで発生する画像の品質の低下に対して何らかの対策を講じることができる。これにより、画像の品質を向上させることができる。具体的には、画像の失われた一部の情報を対象として補償する。また、他の方法として、画像のある部分の画像情報を強化するように画像処理を行う。重要度の低いいくつかの画像情報をさらに低減する。証明書の画像処理では、証明書の画像情報を取得するために、通常は証明書収集ツールを使用する必要がある。このプロセスでは、ノイズが発生することが多いので、ノイズの低減に努める必要がある。このような方法により、画像の品質を高めることができ、発生したノイズを干渉し、良い画像情報を取得し、重要な画像の情報を強化する。この画像の前処理の技術は、画像の平滑処理である。画像平滑技術の場合、画像強化効果は、主に次の2つの方法と性能要件によって達成され、まず、画像の線やエッジの輪郭などの重要な情報を保持するが必要があり、任意に破壊できなく、次に、画像に対して、画像を鮮明にし、画像効果を高める必要がある。
S206、予め訓練された証明書特徴モデルに応じて、前記バランス画像から前記証明書画像の位置を確定し、ここで、前記証明書特徴モデルが履歴証明書画像、証明書画像モデル及び予め設定された初期重みに基づいて訓練されて得られる。
証明書特徴モデルが多層知覚ニューラルネットワークによって訓練され、ニューラルネットワークが後方フィードバック法によって訓練され、より良い結果を得るために、このようなネットワークを何度も訓練しなければならない。このプロセスに時間がかかり、かつ隠れ層の層数と隠れ層のニューロンの数を実験的な方法で求めなければならない。選択可能に、ニューラルネットワークは、バランス画像内の証明書を識別するために、24個の入力層ニューロン、15個の隠れ層ニューロン、及び36個の出力層ニューロンを含む。
さらに、ステップS206は、具体的には、ステップS2061を含んでもよい。
S2061、前記証明書特徴モデルに基づいて得られた前記証明書の位置と前記証明書の実際の位置との間の距離の差が予め設定された差閾値以上である場合、前記証明書特徴モデルの初期パラメータを修正する。
証明書特徴モデルに基づいて元の画像内の証明書画像の位置を検出する場合、検出結果が実際の検出結果と異なる可能性が高いが、この場合、その後の検出結果がより正確になるように、証明書特徴モデルのパラメータを調整してもよい。具体的な実施形態は以下のとおりである。
前記証明書特徴モデルに基づいて得られた前記証明書の位置と前記証明書の実際の位置との間の距離の差を確定する。
前記距離の差が前記差の閾値以上である場合、前記証明書特徴モデルの初期パラメータを、次の式に応じて補正される:

Figure 2021531571
ここで、wij(k)は、k回目の訓練時の重みを表し、wij(k+1)は、k+1回目の訓練時の重みを表し、ηは、学習レートを表しかつη>0であり、E(k)は、最初のk回の訓練によって得られた証明書画像の位置の期待値を表す。
ニューラルネットワークの実際の出力値が所望の出力値と一致しない場合、誤差信号を求め、かつ当該信号を出力端子から逆伝播し、同時に伝播プロセスで重み係数を常に修正して誤差関数を最小化し、通常、ネットワーク誤差の場合、平均二乗偏差を用いて重み係数を修正する。調整のための式は次のとおりである:

Figure 2021531571
式では、wij(k)は、k回目の訓練時の重みを表し、wij(k+1)は、k+1回目の訓練時の重みを表し、は、η学習レートを表しかつη>0であり、E(k)は、最初のk回の訓練によって得られた証明書画像の位置の期待値を表し、

Figure 2021531571
は、k回目の負のグラデーションを表す。
S207、前記証明書画像の位置に応じて、前記バランス画像から前記証明書の画像を抽出する。
本実施例におけるS207は、図1に対応する実施例におけるS105の実現方法と完全に同様であり、具体的には図1に対応する実施例におけるS105の関連説明を参照することができ、ここでは説明を省略する。
上記解決手段では、履歴証明書画像を収集し、前記履歴証明書画像を予め設定されたターゲット画像要件に従ってフィルタリングしてターゲット画像を取得し、予め設定された証明書画像テンプレートに従って前記ターゲット画像の画素を識別し、前記ターゲット画像から少なくとも1つの中心画素点を確定し、訓練モデルの初期パラメータを設定し、前記初期パラメータ、各前記中心画素点の画素値と前記中心画素点の周辺の画素点の画素値に基づいて学習及び訓練してニューラルネットワークに基づく証明書特徴モデルを取得する。証明書画像を含む、撮像装置によって撮影された元の画像を取得し、赤、緑、青の3色成分における前記元の画像の各画素点の成分値に応じて、前記元の画像に対してホワイトバランス処理を行い、バランス画像を取得し、予め訓練された証明書特徴モデルに応じて、前記バランス画像から前記証明書画像の位置を確定し、ここで、前記証明書特徴モデルが履歴証明書画像、証明書画像モデル及び予め設定された初期重みに基づいて訓練されて得られ、前記証明書画像の位置に応じて、前記バランス画像から前記証明書の画像を抽出する。取得された抽出待ち画像の元の画像を前処理し、証明書特徴モデルに基づいて前処理後の画像に対して証明書位置を確定し、その画像から証明書画像を抽出することにより、元の画像からの証明書画像の抽出精度が向上する。
図3を参照すると、図3は、本出願の実施例3に係る端末機器の概略図である。端末機器に含まれる各ユニットは、図1〜図2に対応する実施例における各ステップを実行するために使用される。具体的には、図1〜図2のそれぞれに対応する実施例における関連説明を参照してください。説明の便宜上、本実施例に関連する部分のみが示されている。本実施例の端末機器300は、
証明書画像を含む、撮像装置によって撮影された元の画像を取得するための取得ユニット301と、
赤、緑、青の3色成分における前記元の画像の各画素点の成分値に応じて、前記元の画像に対してホワイトバランス処理を行い、バランス画像を取得するための処理ユニット302と、
予め訓練された証明書特徴モデルに応じて、前記バランス画像から前記証明書画像の位置を確定するために使用され、ここで、前記証明書特徴モデルが履歴証明書画像、証明書画像モデル及び予め設定された初期重みに基づいて訓練されて得られる確定ユニット303と、
前記証明書画像の位置に応じて、前記バランス画像から前記証明書の画像を抽出するための抽出ユニット304と、を含む。
さらに、前記端末機器は、
履歴証明書画像を収集し、前記履歴証明書画像を予め設定されたターゲット画像要件に従ってフィルタリングしてターゲット画像を取得するためのスクリーニングユニットと、
予め設定された証明書画像テンプレートに従って前記ターゲット画像の画素を識別し、前記ターゲット画像から少なくとも1つの中心画素点を確定するための識別ユニットと、
訓練モデルの初期パラメータを設定し、前記初期パラメータ、各前記中心画素点の画素値と前記中心画素点の周辺の画素点の画素値に基づいて学習及び訓練してニューラルネットワークに基づく証明書特徴モデルを取得するための訓練ユニットと、をさらに含んでもよい。
さらに、前記確定ユニット303は、
前記証明書特徴モデルに基づいて得られた前記証明書の位置と前記証明書の実際の位置との間の距離の差が予め設定された差閾値以上である場合、前記証明書特徴モデルの初期パラメータを修正するための修正ユニット、を含んでもよい。
さらに、前記修正ユニットは、
前記証明書特徴モデルに基づいて得られた前記証明書の位置と前記証明書の実際の位置との間の距離の差を確定するための距離計算ユニットと、
前記距離の差が前記差の閾値以上である場合、前記証明書特徴モデルの初期パラメータを、下式に応じて補正するために使用され、

Figure 2021531571
ここで、wij(k)がk回目の訓練時の重みを表し、wij(k+1)がk+1回目の訓練時の重みを表し、ηが学習レートを表しかつη>0であり、E(k)が最初のk回の訓練によって得られた証明書画像の位置の期待値を表すパラメータ補正ユニットを含んでもよい。
さらに、前記処理ユニット302は、
赤、緑、青の3色成分における前記元の画像の各前記画素点の成分値に応じて、前記元の画像における各前記画素点の平均色差を推定するための色差推定ユニットと、
各前記画素点の前記平均色差に応じて、各前記画素点の赤、緑、青の3色成分の利得量を計算するための利得計算ユニットと、
前記利得量に基づいて、前記元の画像における各前記画素点の色温度を補正し、前記バランス画像を取得するためのバランス処理ユニットと、含んでもよい。
上記解決手段では、証明書画像を含む、撮像装置によって撮影された元の画像を取得し、赤、緑、青の3色成分における元の画像の各画素点の成分値に応じて、前記元の画像に対してホワイトバランス処理を行い、バランス画像を取得し、予め訓練された証明書特徴モデルに応じて、バランス画像から前記証明書画像の位置を確定し、ここで、前記証明書特徴モデルが履歴証明書画像、証明書画像モデル及び予め設定された初期重みに基づいて訓練されて得られ、証明書画像の位置に応じて、前記バランス画像から前記証明書の画像を抽出する。証明書特徴モデルに応じて元の画像中の証明書位置を特定し、画像中の証明書画像を抽出することにより、元の画像から証明書画像を抽出する精度が向上する。
図4は、本出願の実施例4に係る端末機器の概略図である。図4に示すように、当該実施例の端末機器4は、プロセッサ40と、メモリ41と、前記メモリ41に記憶され且つ前記プロセッサ40上で実行可能なコンピュータ可読命令42とを含む。前記プロセッサ40は、前記コンピュータ可読命令42を実行すると上述した各証明書画像抽出方法の実施例におけるステップ、例えば図1に示すステップ101乃至104を実現する。又は、前記プロセッサ40は、前記コンピュータ可読命令42を実行すると上述した各装置実施例における各モジュール/ユニットの機能、例えば、図3に示すユニット301乃至304の機能を実現する。
例示的には、前記コンピュータ可読命令42は、1つ以上のモジュール/ユニットに分割されてもよく、前記1つ以上のモジュール/ユニットは、前記メモリ41に記憶され、前記プロセッサ40によって実行され、本出願を完了する。前記1つ以上のモジュール/ユニットは特定の機能を完了できる一連のコンピュータ可読命令の命令セグメントであってもよく、当該命令セグメントが前記端末機器4における前記コンピュータ可読命令42の実行プロセスを記述するために使用される。
前記端末機器4は、デスクトップコンピュータ、ラップトップ、ハンドヘルドコンピュータ、クラウドサーバなどのコンピューティング機器であってもよい。前記端末機器は、プロセッサ40、メモリ41を含んでもよいがこれらに限定されない。図4が、端末機器4の一例に過ぎず、端末機器4に対する限定を構成するものではなく、それが図に示されているものよりも多く又は少ない構成要素、又はいくつかの構成要素の組み合わせ、又は異なる構成要素を含んでもよく、例えば、前記端末機器がさらに、入出力装置、ネットワークアクセス装置、バスなどを含んでもよいことは、当業者が理解され得る。
前記プロセッサ40は、中央処理ユニット(CPU:Central Processing Unit)であってもよく、また、他の汎用プロセッサ、デジタルシグナルプロセッサ(DSP:Digital Signal Processor)、特定用途向け集積回路(ASICApplication Specific Integrated Circuit)、フィールドプログラマブルゲートアレイ(FPGA:Field−Programmable Gate Array)又は他のプログラマブルロジックデバイス、ディスクリートゲート又はトランジスタロジックデバイス、ディスクリートハードウェアコンポーネントなどであってもよい。汎用プロセッサは、マイクロプロセッサ、又は任意の従来のプロセッサなどであってもよい。
前記メモリ41は、前記端末機器4の内部記憶ユニット、例えば端末機器4のハードディスク又は内部メモリであってもよい。前記メモリ41は、前記端末機器4の外部記憶機器、例えば、前記端末機器4に装備されているプラグインハードディスク、スマートメディアカード(SMC:Smart Media(登録商標) Card)、セキュアデジタル(SD:Secure Digital)カード、フラッシュカード(FC:Flash Card)などであってもよい。さらに、前記メモリ41は、前記端末機器4の内部記憶ユニットだけでなく、外部記憶機器を含んでもよい。前記メモリ41は、前記コンピュータ可読命令、前記端末機器に必要な他のプログラム及びデータを記憶するために使用される。前記メモリ41はさらに、出力されたか、又は出力されるデータを一時的に記憶するために使用されてもよい。
当業者にとって、上記実施例の方法における流れの全部又は一部がコンピュータ可読命令によって関連するハードウェアに指示して完了されてもよいことを理解することができ、前記コンピュータ可読命令は、不揮発性のコンピュータ可読記憶媒体に記憶されてもよく、このコンピュータ可読命令が実行されると、上記各方法の実施例の流れを含んでもよい。ここで、本出願によって提供される各実施例で使用されるメモリ、記憶、データベース、又は他の媒体への参照はいずれも不揮発性及び/又は揮発性メモリを含んでもよい。不揮発性メモリは、読み出し専用メモリ(ROM:Read−Only Memory)、プログラマブルROM(PROM)、電気的プログラマブルROM(EPROM)、電気的消去可能プログラマブルROM(EEPROM)又はフラッシュメモリを含んでもよい。揮発性メモリは、ランダムアクセスメモリ(RAM:Random Access Memory、)又は外部キャッシュメモリを含んでもよい。限定ではなく説明として、RAMは、スタティックRAM(SRAM)、ダイナミックRAM(DRAM)、同期DRAM(SDRAM)、ダブルデータレートSDRAM(DDRSDRAM)、強化型SDRAM(ESDRAM)、同期リンク(Synchlink)DRAM(SLDRAM)、メモリバス(Rambus)ダイレクトRAM(RDRAM)、ダイレクトメモリバスダイナミックRAM(DRDRAM)、及びメモリバスダイナミックRAM(RDRAM)などの様々な形態で得られる。
上述した実施例は、本出願の技術的解決手段を説明するためのものであり、これらを限定するためのものではない。前記実施例を参照しながら本出願を詳細に説明したが、当業者であれば、各前記実施例に記載された技術的解決手段を変更し、又はそれらの技術特徴の一部を等価的に置き換えることができることを理解すべきである。これらの変更や置き換えは、対応する技術的解決手段の本質を本出願の各実施例の技術的解決手段の要旨及び範囲から逸脱させることなく、いずれも本出願の保護の範囲に含まれるべきである。
4 端末機器
40 プロセッサ
41 メモリ
42 コンピュータ可読命令
301 取得ユニット
302 処理ユニット
303 確定ユニット
304 抽出ユニット

Claims (20)

  1. 証明書画像を含む、撮像装置によって撮影された元の画像を取得することと、
    赤、緑、青の3色成分における前記元の画像の各画素点の成分値に応じて、前記元の画像に対してホワイトバランス処理を行い、バランス画像を取得することと、
    予め訓練された証明書特徴モデルに応じて、前記バランス画像から前記証明書画像の位置を確定し、ここで、前記証明書特徴モデルが履歴証明書画像、証明書画像モデル及び予め設定された初期重みに基づいて訓練されて得られることと、
    前記証明書画像の位置に応じて、前記バランス画像から前記証明書の画像を抽出することと、を含むことを特徴とする証明書画像抽出方法。
  2. 予め訓練された証明書特徴モデルに応じて、前記バランス画像から前記証明書画像の位置を確定する前に、前記方法は、さらに、
    履歴証明書画像を収集し、前記履歴証明書画像を予め設定されたターゲット画像要件に従ってフィルタリングしてターゲット画像を取得することと、
    予め設定された証明書画像テンプレートに従って前記ターゲット画像の画素を識別し、前記ターゲット画像から少なくとも1つの画素を中心画素点として確定することと、
    訓練モデルの初期重み値を設定し、前記初期重み値、各前記中心画素点と前記中心画素点の周辺の画素点の画素値に基づいて証明書画像の出力位置を計算し、前記出力位置と予め設定された期待位置との間の差に基づいて前記初期重みを調整して目標重みを取得し、前記目標重みに基づいてニューラルネットワークに基づく証明書特徴モデルを確定することと、を含むことを特徴とする請求項1に記載の証明書画像抽出方法。
  3. 前記予め訓練された証明書特徴モデルに応じて、前記バランス画像から前記証明書画像の位置を確定することは、
    前記証明書特徴モデルに基づいて得られた前記証明書の位置と前記証明書の実際の位置との間の距離の差が予め設定された差閾値以上である場合、前記証明書特徴モデルの初期パラメータを修正すること、を含むことを特徴とする請求項2に記載の証明書画像抽出方法。
  4. 前記証明書特徴モデルに基づいて得られた前記証明書の位置と前記証明書の実際の位置との間の距離の差が予め設定された差閾値以上である場合、前記証明書特徴モデルの初期パラメータを修正することは、
    前記証明書特徴モデルに基づいて得られた前記証明書の位置と前記証明書の実際の位置との間の距離の差を確定することと、
    前記距離の差が前記差の閾値以上である場合、前記証明書特徴モデルの初期パラメータを、下式に応じて補正し、

    Figure 2021531571
    ここで、wij(k)がk回目の訓練時の重みを表し、wij(k+1)がk+1回目の訓練時の重みを表し、ηが学習レートを表しかつη>0であり、E(k)が最初のk回の訓練によって得られた証明書画像の位置の期待値を表すこととを含むことを特徴とする請求項3に記載の証明書画像抽出方法。
  5. 赤、緑、青の3色成分における前記元の画像の各画素点の成分値に応じて、前記元の画像に対してホワイトバランス処理を行い、バランス画像を取得することは、
    赤、緑、青の3色成分における前記元の画像の各前記画素点の成分値に応じて、前記元の画像における各前記画素点の平均色差を推定することと、
    各前記画素点の前記平均色差に応じて、各前記画素点の赤、緑、青の3色成分の利得量を計算することと、
    前記利得量に基づいて、前記元の画像における各前記画素点の色温度を補正し、前記バランス画像を取得することと、を含むことを特徴とする請求項1−4のいずれか一項に記載の証明書画像抽出方法。
  6. 証明書画像を含む、撮像装置によって撮影された元の画像を取得するための取得ユニットと、
    赤、緑、青の3色成分における前記元の画像の各画素点の成分値に応じて、前記元の画像に対してホワイトバランス処理を行い、バランス画像を取得するための処理ユニットと、
    予め訓練された証明書特徴モデルに応じて、前記バランス画像から前記証明書画像の位置を確定するために使用され、前記証明書特徴モデルが履歴証明書画像、証明書画像モデル及び予め設定された初期重みに基づいて訓練されて得られる確定ユニットと、
    前記証明書画像の位置に応じて、前記バランス画像から前記証明書の画像を抽出する抽出ユニットと、を含むことを特徴とする端末機器。
  7. 前記端末機器は、
    履歴証明書画像を収集し、前記履歴証明書画像を予め設定されたターゲット画像要件に従ってフィルタリングしてターゲット画像を取得するためのスクリーニングユニットと、
    予め設定された証明書画像テンプレートに従って前記ターゲット画像の画素を識別し、前記ターゲット画像から少なくとも1つの中心画素点を確定するための識別ユニットと、
    訓練モデルの初期パラメータを設定し、前記初期パラメータ、各前記中心画素点の画素値と前記中心画素点の周辺の画素点の画素値に基づいて学習及び訓練して、ニューラルネットワークに基づく証明書特徴モデルを取得するための訓練ユニットと、をさらに含むことを特徴とする請求項6に記載の端末機器。
  8. 前記確定ユニットは、
    前記証明書特徴モデルに基づいて得られた前記証明書の位置と前記証明書の実際の位置との間の距離の差が予め設定された差閾値以上である場合、前記証明書特徴モデルの初期パラメータを修正するための修正ユニット、を含むことを特徴とする請求項7に記載の端末機器。
  9. 前記修正ユニットは、
    前記証明書特徴モデルに基づいて得られた前記証明書の位置と前記証明書の実際の位置との間の距離の差を確定するための距離計算ユニットと、
    前記距離の差が前記差の閾値以上である場合、前記証明書特徴モデルの初期パラメータを、下式に応じて補正するために使用され、

    Figure 2021531571
    ここで、wij(k)は、k回目の訓練時の重みを表し、wij(k+1)がk+1回目の訓練時の重みを表し、ηが学習レートを表しかつη>0であり、E(k)が最初のk回の訓練によって得られた証明書画像の位置の期待値を表すパラメータ補正ユニットとを含んでもよいことを特徴とする請求項8に記載の端末機器。
  10. 前記処理ユニットは、
    赤、緑、青の3色成分における前記元の画像の各前記画素点の成分値に応じて、前記元の画像における各前記画素点の平均色差を推定するための色差推定ユニットと、
    各前記画素点の前記平均色差に応じて、各前記画素点の赤、緑、青の3色成分の利得量を計算するための利得計算ユニットと、
    前記利得量に基づいて、前記元の画像における各前記画素点の色温度を補正し、前記バランス画像を取得するためのバランス処理ユニットと、含むことを特徴とする請求項6−9のいずれか一項に記載の端末機器。
  11. メモリと、プロセッサと、前記メモリに記憶され、前記プロセッサ上で実行可能なコンピュータ可読命令とを含み、前記プロセッサは、前記コンピュータ可読命令を実行すると、
    証明書画像を含む、撮像装置によって撮影された元の画像を取得するステップと、
    赤、緑、青の3色成分における前記元の画像における各画素点の成分値に応じて、前記元の画像に対してホワイトバランス処理を行い、バランス画像を取得するステップと、
    予め訓練された証明書特徴モデルに応じて、前記バランス画像から前記証明書画像の位置を確定し、ここで、前記証明書特徴モデルが履歴証明書画像、証明書画像モデル及び予め設定された初期重みに基づいて訓練されて得られるステップと、
    前記証明書画像の位置に応じて、前記バランス画像から前記証明書の画像を抽出するステップと、を実現することを特徴とする端末機器。
  12. 予め訓練された証明書特徴モデルに応じて、前記バランス画像から前記証明書画像の位置を確定する前に、さらに、
    履歴証明書画像を収集し、前記履歴証明書画像を予め設定されたターゲット画像要件に応じてフィルタリングしてターゲット画像を取得することと、
    予め設定された証明書画像テンプレートに従って前記ターゲット画像の画素を識別し、前記ターゲット画像から少なくとも1つの画素を中心画素点として確定することと、
    訓練モデルの初期重み値を設定し、前記初期重み値、各前記中心画素点と前記中心画素点の周辺の画素点の画素値に基づいて証明書画像の出力位置を計算し、前記出力位置と予め設定された期待位置との間の差に基づいて前記初期重みを調整して目標重みを取得し、前記目標重みに基づいてニューラルネットワークに基づく証明書特徴モデルを確定することと、を含むことを特徴とする請求項11記載の端末機器。
  13. 予め訓練された証明書特徴モデルに応じて、前記バランス画像から前記証明書画像の位置を確定することは、
    前記証明書特徴モデルに基づいて得られた前記証明書の位置と前記証明書の実際の位置との間の距離の差が予め設定された差閾値以上である場合、前記証明書特徴モデルの初期パラメータを修正すること、を含むことを特徴とする請求項12に記載の端末機器。
  14. 前記証明書特徴モデルに基づいて得られた前記証明書の位置と前記証明書の実際の位置との間の距離の差が予め設定された差閾値以上である場合、前記証明書特徴モデルの初期パラメータを修正することは、
    前記証明書特徴モデルに基づいて得られた前記証明書の位置と、前記証明書の実際の位置との間の距離の差を確定することと、
    前記距離の差が前記差の閾値以上である場合、前記証明書特徴モデルの初期パラメータを、下式に応じて補正し、

    Figure 2021531571
    ここで、wij(k)がk回目の訓練時の重みを表し、wij(k+1)がk+1回目の訓練時の重みを表し、ηが学習レートを表しかつη>0であり、E(k)が最初のk回の訓練によって得られた証明書画像の位置の期待値を表すことと、を含むことを特徴とする請求項13に記載の端末機器。
  15. 赤、緑、青の3色成分における前記元の画像における各画素点の成分値に応じて、前記元の画像に対してホワイトバランス処理を行い、バランス画像を取得することは、
    赤、緑、青の3色成分における前記元の画像の各前記画素点の成分値に応じて、前記元の画像における各前記画素点の平均色差を推定することと、
    各前記画素点の前記平均色差に応じて、各前記画素点の赤、緑、青の3色成分の利得量を計算することと、
    前記利得量に基づいて、前記元の画像における各前記画素点の色温度を補正し、前記バランス画像を取得することと、を含むことを特徴とする請求項11−14のいずれか一項に記載の端末機器。
  16. コンピュータ可読命令を記憶しているコンピュータの不揮発性可読記憶媒体であって、前記コンピュータ可読命令がプロセッサによって実行されると、
    証明書画像を含む、撮像装置によって撮影された元の画像を取得するステップと、
    赤、緑、青の3色成分における前記元の画像の各画素点の成分値に応じて、前記元の画像に対してホワイトバランス処理を行い、バランス画像を取得するステップと、
    予め訓練された証明書特徴モデルに応じて、前記バランス画像から前記証明書画像の位置を確定し、ここで、前記証明書特徴モデルが履歴証明書画像、証明書画像モデル及び予め設定された初期重みに基づいて訓練されて得られるステップと、
    前記証明書画像の位置に応じて、前記バランス画像から前記証明書の画像を抽出するステップと、を実現することを特徴とするコンピュータの不揮発性可読記憶媒体。
  17. 予め訓練された証明書特徴モデルに応じて、前記バランス画像から前記証明書画像の位置を確定する前に、さらに、
    履歴証明書画像を収集し、前記履歴証明書画像を予め設定されたターゲット画像要件に従ってフィルタリングしてターゲット画像を取得することと、
    予め設定された証明書画像テンプレートに従って前記ターゲット画像の画素を識別し、前記ターゲット画像から少なくとも1つの画素を中心画素点として確定することと、
    訓練モデルの初期重み値を設定し、前記初期重み値、各前記中心画素点と前記中心画素点の周辺の画素点の画素値に基づいて証明書画像の出力位置を計算し、前記出力位置と予め設定された期待位置との間の差に基づいて前記初期重みを調整して目標重みを取得し、前記目標重みに基づいてニューラルネットワークに基づく証明書特徴モデルを確定することと、を含むことを特徴とする請求項16に記載のコンピュータの不揮発性可読記憶媒体。
  18. 予め訓練された証明書特徴モデルに応じて、前記バランス画像から前記証明書画像の位置を確定することは、
    前記証明書特徴モデルに基づいて得られた前記証明書の位置と前記証明書の実際の位置との間の距離の差が予め設定された差閾値以上である場合、前記証明書特徴モデルの初期パラメータを修正すること、を含むことを特徴とする請求項17に記載のコンピュータの不揮発性可読記憶媒体。
  19. 前記証明書特徴モデルに基づいて得られた前記証明書の位置と前記証明書の実際の位置との間の距離の差が予め設定された差閾値以上である場合、前記証明書特徴モデルの初期パラメータを修正することは、
    前記証明書特徴モデルに基づいて得られた前記証明書の位置と前記証明書の実際の位置との間の距離の差を確定することと、
    前記距離の差が前記差の閾値以上である場合、前記証明書特徴モデルの初期パラメータを、下式に応じて補正し、

    Figure 2021531571
    ここで、wij(k)がk回目の訓練時の重みを表し、wij(k+1)がk+1回目の訓練時の重みを表し、ηが学習レートを表しかつη>0であり、E(k)が最初のk回の訓練によって得られた証明書画像の位置の期待値を表すことと、を含むことを特徴とする請求項18に記載のコンピュータの不揮発性可読記憶媒体。
  20. 赤、緑、青の3色成分における前記元の画像の各画素点の成分値に応じて、前記元の画像に対してホワイトバランス処理を行い、バランス画像を取得することは、
    赤、緑、青の3色成分における前記元の画像の各前記画素点の成分値に応じて、前記元の画像における各前記画素点の平均色差を推定することと、
    各前記画素点の前記平均色差に応じて、各前記画素点の赤、緑、青の3色成分の利得量を計算することと、
    前記利得量に基づき、前記元の画像における各前記画素点の色温度を補正し、前記バランス画像を取得することと、を含むことを特徴とする請求項16−19のいずれか一項に記載のコンピュータの不揮発性可読記憶媒体。
JP2021500946A 2019-01-10 2019-11-13 証明書画像抽出方法及び端末機器 Pending JP2021531571A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201910023382.2 2019-01-10
CN201910023382.2A CN109871845B (zh) 2019-01-10 2019-01-10 证件图像提取方法及终端设备
PCT/CN2019/118133 WO2020143316A1 (zh) 2019-01-10 2019-11-13 证件图像提取方法及终端设备

Publications (1)

Publication Number Publication Date
JP2021531571A true JP2021531571A (ja) 2021-11-18

Family

ID=66917644

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021500946A Pending JP2021531571A (ja) 2019-01-10 2019-11-13 証明書画像抽出方法及び端末機器

Country Status (5)

Country Link
US (1) US11790499B2 (ja)
JP (1) JP2021531571A (ja)
CN (1) CN109871845B (ja)
SG (1) SG11202100270VA (ja)
WO (1) WO2020143316A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109871845B (zh) * 2019-01-10 2023-10-31 平安科技(深圳)有限公司 证件图像提取方法及终端设备
CN110929725B (zh) * 2019-12-06 2023-08-29 深圳市碧海扬帆科技有限公司 证件分类方法、装置及计算机可读存储介质
CN111310746B (zh) * 2020-01-15 2024-03-01 支付宝实验室(新加坡)有限公司 文本行检测方法、模型训练方法、装置、服务器及介质
SG10202001559WA (en) * 2020-02-21 2021-03-30 Alipay Labs Singapore Pte Ltd Method and system for determining authenticity of an official document
CN113570508A (zh) * 2020-04-29 2021-10-29 上海耕岩智能科技有限公司 图像修复方法及装置、存储介质、终端
CN112132812B (zh) * 2020-09-24 2023-06-30 平安科技(深圳)有限公司 证件校验方法、装置、电子设备及介质
CN112333356B (zh) * 2020-10-09 2022-09-20 支付宝实验室(新加坡)有限公司 一种证件图像采集方法、装置和设备
CN114399454A (zh) * 2022-01-18 2022-04-26 平安科技(深圳)有限公司 图像处理方法、装置、电子设备及存储介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09231311A (ja) * 1996-02-23 1997-09-05 Pfu Ltd 画像データ読取装置
JPH1042180A (ja) * 1996-07-26 1998-02-13 Sharp Corp 画像入力装置
JP2006129442A (ja) * 2004-09-30 2006-05-18 Fuji Photo Film Co Ltd 画像補正装置および方法,ならびに画像補正プログラム
JP2006174281A (ja) * 2004-12-17 2006-06-29 Canon Inc 画像処理装置、方法、及びコンピュータプログラム
JP2007150593A (ja) * 2005-11-25 2007-06-14 Toshiba Corp 光学的文字読取装置及びカラーバランス調整方法
JP2009239323A (ja) * 2006-07-27 2009-10-15 Panasonic Corp 映像信号処理装置
CN102147860A (zh) * 2011-05-16 2011-08-10 杭州华三通信技术有限公司 一种基于白平衡的车牌识别方法和装置
JP2013197848A (ja) * 2012-03-19 2013-09-30 ▲うぇい▼強科技股▲ふん▼有限公司 スキャナのためのオートホワイトバランス調整方法
JP2017059207A (ja) * 2015-09-18 2017-03-23 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 画像認識方法
WO2018173108A1 (ja) * 2017-03-21 2018-09-27 富士通株式会社 関節位置推定装置、関節位置推定方法及び関節位置推定プログラム
JP2018533808A (ja) * 2016-03-02 2018-11-15 平安科技(深▲せん▼)有限公司 運転免許証有効期限自動抽出方法、装置、システム及び記憶媒体

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101038686B (zh) * 2007-01-10 2010-05-19 北京航空航天大学 一种基于信息融合的机读旅行证件识别方法
US8452089B2 (en) * 2011-03-31 2013-05-28 Sony Corporation System and method for effectively performing an image identification procedure
JP4998637B1 (ja) * 2011-06-07 2012-08-15 オムロン株式会社 画像処理装置、情報生成装置、画像処理方法、情報生成方法、制御プログラムおよび記録媒体
KR101901591B1 (ko) * 2011-11-01 2018-09-28 삼성전자주식회사 얼굴 인식 장치 및 그 제어방법
US8693731B2 (en) * 2012-01-17 2014-04-08 Leap Motion, Inc. Enhanced contrast for object detection and characterization by optical imaging
US10540564B2 (en) * 2014-06-27 2020-01-21 Blinker, Inc. Method and apparatus for identifying vehicle information from an image
CN105825243A (zh) * 2015-01-07 2016-08-03 阿里巴巴集团控股有限公司 证件图像检测方法及设备
WO2016207875A1 (en) * 2015-06-22 2016-12-29 Photomyne Ltd. System and method for detecting objects in an image
CN105120167B (zh) * 2015-08-31 2018-11-06 广州市幸福网络技术有限公司 一种证照相机及证照拍摄方法
CN107844748B (zh) * 2017-10-17 2019-02-05 平安科技(深圳)有限公司 身份验证方法、装置、存储介质和计算机设备
US10831821B2 (en) * 2018-09-21 2020-11-10 International Business Machines Corporation Cognitive adaptive real-time pictorial summary scenes
KR20200076461A (ko) * 2018-12-19 2020-06-29 삼성전자주식회사 중첩된 비트 표현 기반의 뉴럴 네트워크 처리 방법 및 장치
CN109871845B (zh) * 2019-01-10 2023-10-31 平安科技(深圳)有限公司 证件图像提取方法及终端设备

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09231311A (ja) * 1996-02-23 1997-09-05 Pfu Ltd 画像データ読取装置
JPH1042180A (ja) * 1996-07-26 1998-02-13 Sharp Corp 画像入力装置
JP2006129442A (ja) * 2004-09-30 2006-05-18 Fuji Photo Film Co Ltd 画像補正装置および方法,ならびに画像補正プログラム
JP2006174281A (ja) * 2004-12-17 2006-06-29 Canon Inc 画像処理装置、方法、及びコンピュータプログラム
JP2007150593A (ja) * 2005-11-25 2007-06-14 Toshiba Corp 光学的文字読取装置及びカラーバランス調整方法
JP2009239323A (ja) * 2006-07-27 2009-10-15 Panasonic Corp 映像信号処理装置
CN102147860A (zh) * 2011-05-16 2011-08-10 杭州华三通信技术有限公司 一种基于白平衡的车牌识别方法和装置
JP2013197848A (ja) * 2012-03-19 2013-09-30 ▲うぇい▼強科技股▲ふん▼有限公司 スキャナのためのオートホワイトバランス調整方法
JP2017059207A (ja) * 2015-09-18 2017-03-23 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 画像認識方法
JP2018533808A (ja) * 2016-03-02 2018-11-15 平安科技(深▲せん▼)有限公司 運転免許証有効期限自動抽出方法、装置、システム及び記憶媒体
WO2018173108A1 (ja) * 2017-03-21 2018-09-27 富士通株式会社 関節位置推定装置、関節位置推定方法及び関節位置推定プログラム

Also Published As

Publication number Publication date
US20210166015A1 (en) 2021-06-03
CN109871845B (zh) 2023-10-31
WO2020143316A1 (zh) 2020-07-16
CN109871845A (zh) 2019-06-11
US11790499B2 (en) 2023-10-17
SG11202100270VA (en) 2021-02-25

Similar Documents

Publication Publication Date Title
JP2021531571A (ja) 証明書画像抽出方法及び端末機器
WO2020258667A1 (zh) 图像识别方法及装置、非易失性可读存储介质、计算机设备
CN110334585A (zh) 表格识别方法、装置、计算机设备和存储介质
CN111079764B (zh) 一种基于深度学习的低照度车牌图像识别方法及装置
CN110675334A (zh) 一种图像增强方法及装置
CN111259891B (zh) 一种自然场景下身份证识别方法、装置、设备和介质
CN113160023A (zh) 一种土地利用核查系统
CN106709916A (zh) 图像质量评估方法及装置
CN114022383A (zh) 一种文字图像的摩尔纹祛除方法、装置及电子设备
CN110599554A (zh) 人脸肤色的识别方法和装置、存储介质及电子装置
CN113590906A (zh) 一种土地利用变更举证的核查系统
CN110929562A (zh) 一种基于改进Hough变换的答题卡识别方法
CN117496019B (zh) 一种驱动静态图像的图像动画处理方法及系统
CN111862040A (zh) 人像图片质量评价方法、装置、设备及存储介质
CN107909542A (zh) 图像处理方法、装置、计算机可读存储介质和电子设备
Yang et al. EHNQ: Subjective and objective quality evaluation of enhanced night-time images
CN110135274B (zh) 一种基于人脸识别的人流量统计方法
CN104408736A (zh) 基于特征相似性的合成人脸画像质量评价方法
Tao et al. An effective and robust underwater image enhancement method based on color correction and artificial multi-exposure fusion
CN112686851B (zh) 一种图像检测方法、装置及存储介质
CN116977190A (zh) 图像处理方法、装置、设备、存储介质及程序产品
CN115456888A (zh) 电子化美术考试作品的校正方法、装置、电子设备及介质
CN110766153A (zh) 神经网络模型训练方法、装置及终端设备
Chen et al. Candidate region acquisition optimization algorithm based on multi-granularity data enhancement
Zhou et al. Saliency preserving decolorization

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220111

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220311

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220418