JP6774137B2 - Id写真の真正性を検証するためのシステムおよび方法 - Google Patents

Id写真の真正性を検証するためのシステムおよび方法 Download PDF

Info

Publication number
JP6774137B2
JP6774137B2 JP2018568402A JP2018568402A JP6774137B2 JP 6774137 B2 JP6774137 B2 JP 6774137B2 JP 2018568402 A JP2018568402 A JP 2018568402A JP 2018568402 A JP2018568402 A JP 2018568402A JP 6774137 B2 JP6774137 B2 JP 6774137B2
Authority
JP
Japan
Prior art keywords
photo
target
feature vector
computer
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018568402A
Other languages
English (en)
Other versions
JP2019536120A (ja
Inventor
ティアンミン チャン
ティアンミン チャン
Original Assignee
ベイジン ディディ インフィニティ テクノロジー アンド ディベロップメント カンパニー リミティッド
ベイジン ディディ インフィニティ テクノロジー アンド ディベロップメント カンパニー リミティッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ベイジン ディディ インフィニティ テクノロジー アンド ディベロップメント カンパニー リミティッド, ベイジン ディディ インフィニティ テクノロジー アンド ディベロップメント カンパニー リミティッド filed Critical ベイジン ディディ インフィニティ テクノロジー アンド ディベロップメント カンパニー リミティッド
Publication of JP2019536120A publication Critical patent/JP2019536120A/ja
Application granted granted Critical
Publication of JP6774137B2 publication Critical patent/JP6774137B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/449Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
    • G06V10/451Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
    • G06V10/454Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/40Spoof detection, e.g. liveness detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • G06V10/507Summing image-intensity values; Histogram projection analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Human Computer Interaction (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)
  • Collating Specific Patterns (AREA)
  • Storage Device Security (AREA)

Description

本開示は、一般に、写真真正性(photo authenticity)検証の技術分野に関し、詳細には、ターゲットID写真(target ID photo)と基準ID写真(reference ID photo)との間の類似度に基づいて偽ID写真(fake ID photo)を識別するためのシステムおよび方法に関する。
ユーザが、ウェブサイトによって与えられるサービスに登録する(register)とき、識別情報検証が求められることがある。識別情報検証を実施するための従来のやり方は、ユーザが識別(ID)写真をアップロードすることを求めることがある。しかしながら、ユーザが、不正をはたらくために偽ID写真を作ることがあり、偽ID写真は、識別するのが難しいことがある。したがって、ユーザによってアップロードされたID写真(Id photo)の真正性を検証するためのシステムおよび方法を提供することが望ましい。
本開示の一態様によれば、システムが、ターゲットID写真の真正性を検証するための命令のセットを含む少なくとも1つのコンピュータ可読ストレージ媒体と、コンピュータ可読ストレージ媒体と通信している少なくとも1つプロセッサとを含み得、命令のセットを実行するとき、少なくとも1つのプロセッサは、ターゲット識別(ID)写真を受信することと、1つまたは複数の基準ID写真のデータベースにアクセスすることと、ターゲットID写真上の所定のエリアとデータベース中の1つまたは複数のターゲット基準ID写真(target reference ID photo)の所定のエリアとの間の差分値を決定することと、差分値がしきい値よりも小さいと決定すると、ターゲットID写真が偽ID写真であることを示すための警告コードを生成することとを行うように指示され得る。
いくつかの実施形態では、1つまたは複数の基準ID写真のデータベースは、1つまたは複数の構造化データを含み、1つまたは複数の構造化データの各々が、基準ID写真の所定のエリアに関連付けられた基準特徴ベクトル(reference feature vector)を符号化する。いくつかの実施形態では、差分値を決定するために、少なくとも1つのプロセッサは、ターゲットID写真上の所定のエリアの1つまたは複数の特徴に基づいて、ターゲット特徴ベクトル(target feature vector)を決定することと、ターゲット特徴ベクトルを基準特徴ベクトルと比較することによって、差分値を決定することとを行うようにさらに指示され得る。いくつかの実施形態では、差分値はユークリッド距離であり得る。
いくつかの実施形態では、少なくとも1つのプロセッサは、ID写真を少なくとも1つのブロックに分割することであって、ID写真が基準ID写真またはターゲットID写真である、分割することと、第2の信号フラグメントに基づいて、各ブロック中の1つまたは複数のピクセルのグレー・スケールを決定することと、1つまたは複数のピクセルのグレー・スケールに基づいて、各ブロックのピクセル勾配(pixel gradient)を決定することと、各ブロックのピクセル勾配に基づいて、ID写真のテクスチャ特徴(texture feature)を決定することと、少なくとも1つのブロックのテクスチャ特徴をストレージ媒体中の特徴ベクトルに記憶することであって、特徴ベクトルが基準特徴ベクトルまたはターゲット特徴ベクトルである、記憶することとを行うようにさらに指示され得る。
いくつかの実施形態では、少なくとも1つのプロセッサは、ID写真中のピクセルの所定のエリアのグレー・スケールを取得することと、ピクセルとピクセルの1つまたは複数の近接するピクセルとに基づいて、1つまたは複数の2進値を決定することと、1つまたは複数の2進値に基づいて、ピクセルのテクスチャ情報を決定することと、ターゲットID写真のすべてのピクセルのテクスチャ情報に基づいて、ターゲットID写真のテクスチャ特徴を決定することと、少なくとも1つのブロックのテクスチャ特徴をストレージ媒体中の特徴ベクトルに記憶することであって、特徴ベクトルが基準特徴ベクトルまたはターゲット特徴ベクトルである、記憶することとを行うようにさらに指示され得る。
いくつかの実施形態では、少なくとも1つのプロセッサは、トレーニングされた畳み込みニューラル・ネットワーク(trained convolutional neural network)によって顔特徴(face feature)を決定するようにさらに指示され得、ターゲットID写真の所定のエリアはポートレート・エリアを含む。
いくつかの実施形態では、少なくとも1つのプロセッサは、トレーニングされた畳み込みニューラル・ネットワークによって偽ID特徴を決定するようにさらに指示され得、トレーニングされた畳み込みニューラル・ネットワークは、少なくとも1つのコンピュータによって、複数の基準偽ID写真(reference fake ID photo)を用いてトレーニングされ得る。
いくつかの実施形態では、少なくとも1つのプロセッサは、複数の基準ID写真のデータを読み取るために、オンライン・プラットフォームのデータ・バスを介してメモリ中にアクセスすることと、複数の基準ID写真の各々の基準特徴に基づいて、複数の基準ID写真の各々についての基準特徴ベクトルを生成することと、基準特徴ベクトルに基づいてクラスタ数を生成することと、複数のID写真の各々について、読取り/書込み機器に、対応するID写真を符号化するクラスタ数を追加するように指示することとを含む、基準ID写真のデータベースを確立することを行うようにさらに指示され得る。
本開示の別の態様によれば、要求を承認するための方法が、少なくとも1つのコンピュータによって、ターゲット識別(ID)写真を受信するステップと、少なくとも1つのコンピュータによって、1つまたは複数の基準ID写真のデータベースにアクセスするステップと、少なくとも1つのコンピュータによって、ターゲットID写真上の所定のエリアとデータベース中の1つまたは複数のターゲット基準ID写真の所定のエリアとの間の差分値を決定するステップと、差分値がしきい値よりも小さいと決定すると、少なくとも1つのコンピュータによって、ターゲットID写真が偽ID写真であることを示すための警告コードを生成するステップとを含み得る。
いくつかの実施形態では、1つまたは複数の基準ID写真のデータベースは、1つまたは複数の構造化データを含み得、1つまたは複数の構造化データの各々が、基準ID写真の所定のエリアに関連付けられた基準特徴ベクトルを符号化する。いくつかの実施形態では、差分値を決定するステップは、ターゲットID写真上の所定のエリアの1つまたは複数の特徴に基づいて、ターゲット特徴ベクトルを決定するステップと、ターゲット特徴ベクトルを基準特徴ベクトルと比較することによって、差分値を決定するステップとを含み得る。いくつかの実施形態では、差分値はユークリッド距離であり得る。
いくつかの実施形態では、本方法は、少なくとも1つのコンピュータによって、ID写真を少なくとも1つのブロックに分割するステップであって、ID写真が基準ID写真またはターゲットID写真である、分割するステップと、少なくとも1つのコンピュータによって、第2の信号フラグメントに基づいて、各ブロック中の1つまたは複数のピクセルのグレー・スケールを決定するステップと、少なくとも1つのコンピュータによって、1つまたは複数のピクセルのグレー・スケールに基づいて、各ブロックのピクセル勾配を決定するステップと、少なくとも1つのコンピュータによって、各ブロックのピクセル勾配に基づいて、ID写真のテクスチャ特徴を決定するステップと、少なくとも1つのコンピュータによって、少なくとも1つのブロックのテクスチャ特徴をストレージ媒体中の特徴ベクトルに記憶するステップであって、特徴ベクトルが基準特徴ベクトルまたはターゲット特徴ベクトルである、記憶するステップとをさらに含み得る。
いくつかの実施形態では、本方法は、少なくとも1つのコンピュータによって、ID写真中のピクセルの所定のエリアのグレー・スケールを取得するステップと、少なくとも1つのコンピュータによって、ピクセルとピクセルの1つまたは複数の近接するピクセルとの間の1つまたは複数の2進値を決定するステップと、少なくとも1つのコンピュータによって、1つまたは複数の2進値に基づいて、ピクセルのテクスチャ情報を決定するステップと、少なくとも1つのコンピュータによって、ターゲットID写真のすべてのピクセルのテクスチャ情報に基づいて、ターゲットID写真のテクスチャ特徴を決定するステップと、少なくとも1つのコンピュータによって、少なくとも1つのブロックのテクスチャ特徴をストレージ媒体中の特徴ベクトルに記憶するステップであって、特徴ベクトルが基準特徴ベクトルまたはターゲット特徴ベクトルである、記憶するステップとをさらに含み得る。
いくつかの実施形態では、本方法は、少なくとも1つのコンピュータによって、トレーニングされた畳み込みニューラル・ネットワークによって顔特徴を決定するステップをさらに含み得、ターゲットID写真の所定のエリアはポートレート・エリアを含み得る。
いくつかの実施形態では、本方法は、少なくとも1つのコンピュータによって、トレーニングされた畳み込みニューラル・ネットワークによって偽ID特徴を決定するステップをさらに含み得、トレーニングされた畳み込みニューラル・ネットワークは、少なくとも1つのコンピュータによって、複数の基準偽ID写真を用いてトレーニングされ得る。
いくつかの実施形態では、本方法は、少なくとも1つのコンピュータによって、複数の基準ID写真のデータを読み取るために、オンライン・プラットフォームのデータ・バスを介してメモリ中にアクセスするステップと、少なくとも1つのコンピュータによって、複数のID写真の各々についてのカテゴリーを決定するステップと、少なくとも1つのコンピュータによって、複数の基準ID写真の各々の基準特徴に基づいて、複数の基準ID写真の各々についての基準特徴ベクトルを生成するステップと、少なくとも1つのコンピュータによって、基準特徴ベクトルに基づいてクラスタ数を生成するステップと、複数のID写真の各々について、少なくとも1つのコンピュータによって、読取り/書込み機器に、ID写真の対応するカテゴリーを符号化するクラスタ数を追加するように指示するステップとを含む、基準ID写真のデータベースを確立するステップをさらに含み得る。
本開示のさらに別の態様によれば、ターゲットID写真の真正性を検証するための命令の少なくとも1つのセットを備える、非一時的コンピュータ可読媒体、コンピュータ・サーバの少なくとも1つのプロセッサによって実行されたとき、命令の少なくとも1つのセットは、少なくとも1つのプロセッサに、ターゲット識別(ID)写真を受信することと、1つまたは複数の基準ID写真のデータベースにアクセスすることと、ターゲットID写真上の所定のエリアとデータベース中の1つまたは複数のターゲット基準ID写真の所定のエリアとの間の差分値を決定することと、差分値がしきい値よりも小さいと決定すると、ターゲットID写真が偽ID写真であることを示すための警告コードを生成することとの行為を実施するように指示し得る。
例示的な実施形態に関して本開示がさらに説明される。本開示の実施形態の上記および他の態様は、以下の詳細な説明において、添付の図面とともに読めば、より明らかになる。
いくつかの実施形態による、偽ID識別のための例示的なシステムのブロック図である。 いくつかの実施形態による、コンピューティング・デバイスの例示的なハードウェアおよびソフトウェア構成要素を示す概略図である。 いくつかの実施形態による、例示的な処理エンジンを示すブロック図である。 本開示のいくつかの実施形態による、ターゲットID写真の真正性を検証するための例示的なプロセスおよび/または方法のフローチャートである。 本開示のいくつかの実施形態による、配向勾配ヒストグラム(histogram of oriented gradients)を介してID写真のテクスチャ特徴を抽出するための例示的なプロセスおよび/または方法のフローチャートである。 本開示のいくつかの実施形態による、ローカル・バイナリ・パターン(local binary pattern)を介してID写真のテクスチャ特徴を抽出するための例示的なプロセスおよび/または方法のフローチャートである。 本開示のいくつかの実施形態による、ターゲットID写真の顔特徴を取得するための例示的なプロセスのフローチャートである。 本開示のいくつかの実施形態による、ID写真の偽ID特徴を抽出するための例示的なプロセスおよび/または方法のフローチャートである。 本開示のいくつかの実施形態による、CNNをトレーニングするための例示的なプロセスおよび/または方法のフローチャートである。 本開示のいくつかの実施形態による、基準ID写真のデータベースを確立するための例示的なプロセスおよび/または方法のフローチャートである。
以下の説明は、いかなる当業者でも本開示を製作および使用することを可能にするために提示され、特定の適用例およびそれの要件の文脈において与えられる。開示される実施形態への様々な変更は当業者には容易に明らかになり、本明細書で定義された一般原理は、本開示の趣旨および範囲から逸脱することなく他の実施形態および適用例に適用され得る。したがって、本開示は、示される実施形態に限定されず、特許請求の範囲に一致する最も広い範囲を与られるべきである。
本明細書で使用される用語は、特定の例示的な実施形態について説明するためのものにすぎず、限定するものではない。本明細書で使用される単数形「a」、「an」、および「the」は、文脈が別段に明確に示すのでなければ、複数形をも含むものとし得る。さらに、本明細書で使用される「備える(comprises)」、「備える(comprising)」、「含む(includes)」、および/または「含む(including)」という用語は、述べられた特徴、整数、ステップ、動作、要素、および/または構成要素の存在を明示するが、1つまたは複数の他の特徴、整数、ステップ、動作、要素、構成要素、および/またはそれらのグループの存在または追加を排除しないことを理解されよう。
それらのすべてが本明細書の一部を形成する(1つまたは複数の)添付の図面を参照しながら以下の説明を考慮すれば、本開示のこれらおよび他の特徴および特性、ならびに動作の方法および構造の関係する要素の機能および部分の組合せおよび製造の経済性がより明らかになり得る。ただし、(1つまたは複数の)図面は、例示および説明のためのものにすぎず、本開示の範囲を限定するものではないことを明確に理解されたい。図面が一定の縮尺でないことを理解されたい。
本開示において使用されるフローチャートは、システムが、本開示のいくつかの実施形態に従って実装する動作を示す。フローチャートの動作は、順序が正しく実装されないことがあることを明確に理解されたい。逆に、動作は、逆の順序でまたは同時に実装され得る。その上、1つまたは複数の他の動作が、フローチャートに追加され得る。1つまたは複数の動作が、フローチャートから削除され得る。
その上、本開示におけるシステムおよび方法は、主に、ターゲットID写真の真正性を検証することに関して説明されるが、これは例示的な一実施形態にすぎないことも理解されたい。本開示のシステムまたは方法は、コンテンツベースの画像検索に適用され得る。たとえば、本開示のシステムまたは方法は、ターゲット画像のコンテンツに基づいてターゲット画像の同様の画像を探索するために適用され得る。本開示のシステムまたは方法はまた、ユーザがオンデマンド・サービス・プラットフォームのドライバとして登録することを希望するとき、任意の種類のオンデマンド・サービス・プラットフォームのユーザに適用され得る。本開示のシステムまたは方法の適用シナリオは、ウェブページ、ブラウザのプラグイン、クライアント端末、カスタム・システム、内部分析システム、人工知能ロボットなど、またはそれらの任意の組合せを含み得る。
本開示における「ID写真」という用語は、個人の識別情報の態様を検証するために使用され得る、識別(ID)の写真を指し得る。ID写真は、ポートレート・エリアと文字記述エリア(literal statement area)とを含み得る。ポートレート・エリアは、ID所有者の外観の画像リマインダ(image reminder)を与え得る。文字記述エリアは、ID所有者の識別情報の言語的説明を与える。ID写真は、ID写真中に、IDの背景を反映する背景エリアをさらに含み得る。たとえば、ユーザがIDの写真を撮るとき、IDは、机または1枚の紙の上に置かれ得るので、背景エリアは、写真ID中の机または紙であり得る。本開示における「ターゲットID写真」という用語は、その真正性が本開示のシステムまたは方法によって検証されていないID写真を指し得、ユーザは所定の目的、たとえば、オンデマンド・サービス・プラットフォームのドライバとして登録するために、サーバまたはデータベースに「ターゲットID写真」をアップロードする。本開示における「基準ID写真」という用語は、本開示のシステムにアップロードしたID写真を指し得る。基準ID写真の真正性は、検証されていることもあれば、検証されていないこともある。本開示における「偽ID写真」という用語は、1つまたは複数の基準ID写真に類似するID写真を指し得る。
本開示における「特徴ベクトル」という用語は、ID写真の特徴に関係する、数値特徴のn次元ベクトルを指し得る。本開示における「ターゲット特徴ベクトル」という用語は、ターゲットID写真の特徴ベクトルを指し得る。本開示における「基準特徴ベクトル」という用語は、基準ID写真の特徴ベクトルを指し得る。
本開示の一態様は、本開示においてシステムにユーザがアップロードするターゲットID写真の真正性を検証するためのオンライン・システムおよび方法に関する。本開示によれば、本システムおよび本方法は、数ミリ秒、さらには数ナノ秒で、オンライン・システムを用いてターゲットID写真と数百万個もの基準ID写真との間の類似度を決定することによって、ターゲットID写真の真正性を検証し得る。ターゲットID写真が基準ID写真に類似する場合、ターゲットID写真は偽ID写真として識別され得る。ターゲットID写真と基準ID写真との間の類似度は、ターゲット特徴ベクトルと基準特徴ベクトルとを比較することによって決定され得る。したがって、本解決策は、ポストインターネット時代にのみ生じる問題に深く根ざしており、その問題を解決することを目的とする。
図1は、いくつかの実施形態による、ターゲットID写真の真正性を検証するためのオンライン・プラットフォームとしての例示的なシステム100のブロック図である。システム100は、サーバ110と、ネットワーク120と、端末130と、データベース140とを含み得る。サーバ110は処理エンジン112を含み得る。
サーバ110は、サービス要求、たとえば、識別(ID)写真をサーバ110またはデータベース140にアップロードするための要求に関係する情報および/またはデータを処理するように構成され得る。いくつかの実施形態では、サーバ110は、単一のサーバ、またはサーバ・グループであり得る。サーバ・グループは、集中型、または分散型であり得る(たとえば、サーバ110は、分散型システムであり得る)。いくつかの実施形態では、サーバ110は、ローカルまたはリモートであり得る。たとえば、サーバ110は、ネットワーク120を介して、端末130および/またはデータベース140に記憶された情報および/またはデータにアクセスし得る。別の例として、サーバ110は、記憶された情報および/またはデータにアクセスするために端末130および/またはデータベース140に直接接続され得る。いくつかの実施形態では、サーバ110は、クラウド・プラットフォーム上に実装され得る。単に例として、クラウド・プラットフォームは、プライベート・クラウド、パブリック・クラウド、ハイブリッド・クラウド、コミュニティ・クラウド、分散型クラウド、インタークラウド、マルチクラウドなど、またはそれらの任意の組合せを含み得る。いくつかの実施形態では、サーバ110は、本開示において図2に示されている1つまたは複数の構成要素を有するコンピューティング・デバイス上に実装され得る。
いくつかの実施形態では、サーバ110は処理エンジン112を含み得る。処理エンジン112は、本開示で説明される1つまたは複数の機能を実施するための要求に関係する情報および/またはデータを処理し得る。たとえば、処理エンジン112は、ターゲットID写真をサーバ110またはデータベース140にアップロードするようにとの端末130からの要求を取得し得る。いくつかの実施形態では、処理エンジン112は、1つまたは複数の処理エンジン(たとえば、(1つまたは複数の)シングルコア処理エンジンまたは(1つまたは複数の)マルチコア・プロセッサ)を含み得る。単に例として、処理エンジン112は、中央処理ユニット(CPU)、特定用途向け集積回路(ASIC)、特定用途向け命令セット・プロセッサ(ASIP)、グラフィックス処理ユニット(GPU)、物理処理ユニット(PPU)、デジタル信号プロセッサ(DSP)、フィールド・プログラマブル・ゲート・アレイ(FPGA)、プログラマブル論理デバイス(PLD)、コントローラ、マイクロコントローラ・ユニット、縮小命令セット・コンピュータ(RISC)、マイクロプロセッサなど、またはそれらの任意の組合せを含み得る。
いくつかの実施形態では、端末130は、モバイル・デバイス130−1、タブレット・コンピュータ130−2、ラップトップ・コンピュータ130−3、および自動車両中の組込みデバイス130−4など、またはそれらの任意の組合せを含み得る。いくつかの実施形態では、モバイル・デバイス130−1は、スマート・ホーム・デバイス、ウェアラブル・デバイス、スマート・モバイル・デバイス、仮想現実デバイス、拡張現実デバイスなど、またはそれらの任意の組合せを含み得る。いくつかの実施形態では、スマート・ホーム・デバイスは、スマート照明デバイス、インテリジェント電気装置の制御デバイス、スマート監視デバイス、スマート・テレビジョン、スマート・ビデオ・カメラ、インターホンなど、またはそれらの任意の組合せを含み得る。いくつかの実施形態では、ウェアラブル・デバイスは、スマート・ブレスレット、スマート・フットギア、スマート・グラス、スマート・ヘルメット、スマート・ウォッチ、スマート衣類、スマート・バックパック、スマート・アクセサリなど、またはそれらの任意の組合せを含み得る。いくつかの実施形態では、スマート・モバイル・デバイスは、スマートフォン、携帯情報端末(PDA)、ゲーム・デバイス、ナビゲーション・デバイス、ポイント・オブ・セール(POS)デバイスなど、またはそれらの任意の組合せを含み得る。いくつかの実施形態では、仮想現実デバイスおよび/または拡張現実デバイスは、仮想現実ヘルメット、仮想現実グラス、仮想現実パッチ、拡張現実ヘルメット、拡張現実グラス、拡張現実パッチなど、またはそれらの任意の組合せを含み得る。たとえば、仮想現実デバイスおよび/または拡張現実デバイスは、Google Glass、Oculus Rift、HoloLens、Gear VRなどを含み得る。いくつかの実施形態では、自動車両中の組込みデバイス130−4は、オンボード・コンピュータ、オンボード・テレビジョンなどを含み得る。単に例として、端末130は、コントローラ(たとえば、リモートコントローラ)を含み得る。
ネットワーク120は、情報および/またはデータの交換を容易にし得る。いくつかの実施形態では、システム100中の1つまたは複数の構成要素(たとえば、サーバ110、端末130、およびデータベース140)は、ネットワーク120を介して、システム100中の(1つまたは複数の)他の構成要素に/から情報および/またはデータを送信および/または受信し得る。たとえば、サーバ110は、ネットワーク120を介して端末130からのサービス要求を取得/収集し得る。いくつかの実施形態では、ネットワーク120は、任意のタイプのワイヤードまたはワイヤレス・ネットワーク、あるいはそれらの組合せであり得る。単に例として、ネットワーク120は、ケーブル・ネットワーク、ワイヤライン・ネットワーク、光ファイバー・ネットワーク、電気通信ネットワーク、イントラネット、インターネット、ローカル・エリア・ネットワーク(LAN)、ワイド・エリア・ネットワーク(WAN)、ワイヤレス・ローカル・エリア・ネットワーク(WLAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、公衆電話交換網(PSTN)、Bluetooth(登録商標)ネットワーク、ZigBee(商標)ネットワーク、ニア・フィールド通信(NFC)ネットワーク、モバイル通信用グローバル・システム(GSM、登録商標)ネットワーク、符号分割多元接続(CDMA)ネットワーク、時分割多元接続(TDMA)ネットワーク、汎用パケット無線サービス(GPRS)ネットワーク、GSM進化型高速データ・レート(EDGE)ネットワーク、広帯域符号分割多元接続(WCDMA、登録商標)ネットワーク、高速ダウンリンク・パケット・アクセス(HSDPA)ネットワーク、ロング・ターム・エボリューション(LTE)ネットワーク、ユーザ・データグラム・プロトコル(UDP)ネットワーク、伝送制御プロトコル/インターネット・プロトコル(TCP/IP)ネットワーク、ショート・メッセージ・サービス(SMS)ネットワーク、ワイヤレス・アプリケーション・プロトコル(WAP)ネットワーク、超広帯域(UWB)ネットワーク、赤外線など、またはそれらの任意の組合せを含み得る。いくつかの実施形態では、サーバ110は、1つまたは複数のネットワーク・アクセス・ポイントを含み得る。たとえば、サーバ110は、基地局および/またはインターネット交換ポイント120−1、120−2、...などのワイヤードまたはワイヤレス・ネットワーク・アクセス・ポイントを含み得、それらを通して、システム100の1つまたは複数の構成要素がネットワーク120に接続されて、データおよび/または情報を交換し得る。
データベース140はデータおよび/または命令を記憶し得る。いくつかの実施形態では、データベース140は、端末130から取得/収集されたデータを記憶し得る。いくつかの実施形態では、データベース140は、本開示で説明される例示的な方法を実施するためにサーバ110が実行または使用し得る、データおよび/または命令を記憶し得る。いくつかの実施形態では、データベース140は、基準ID写真と、基準ID写真に対応する特徴ベクトルと、特徴ベクトルに対応するクラスタ数とを記憶し得る。いくつかの実施形態では、データベース140は、大容量ストレージ、リムーバブル・ストレージ、揮発性読取りおよび書込みメモリ、読取り専用メモリ(ROM)など、またはそれらの任意の組合せを含み得る。例示的な大容量ストレージは、磁気ディスク、光ディスク、ソリッドステート・ドライブなどを含み得る。例示的なリムーバブル・ストレージは、フラッシュ・ドライブ、フロッピー・ディスク、光ディスク、メモリ・カード、ジップ・ディスク、磁気テープなどを含み得る。例示的な揮発性読取りおよび書込みメモリは、ランダム・アクセス・メモリ(RAM)を含み得る。例示的なRAMは、ダイナミックRAM(DRAM)、ダブル・データ・レート同期ダイナミックRAM(DDR SDRAM:double date rate synchronous dynamic RAM)、スタティックRAM(SRAM)、サイリスタRAM(TRAM)、およびゼロ・キャパシタRAM(Z−RAM)などを含み得る。例示的なROMは、マスクROM(MROM)、プログラマブルROM(PROM)、消去可能プログラマブルROM(PEROM)、電気的消去可能プログラマブルROM(EEPROM)、コンパクト・ディスクROM(CD−ROM)、およびデジタル多用途ディスクROMなどを含み得る。いくつかの実施形態では、データベース140は、クラウド・プラットフォーム上に実装され得る。単に例として、クラウド・プラットフォームは、プライベート・クラウド、パブリック・クラウド、ハイブリッド・クラウド、コミュニティ・クラウド、分散型クラウド、インタークラウド、マルチクラウドなど、またはそれらの任意の組合せを含み得る。
いくつかの実施形態では、データベース140は、システム100中の1つまたは複数の構成要素(たとえば、サーバ110、端末130)と通信するためにネットワーク120に接続され得る。システム100中の1つまたは複数の構成要素は、ネットワーク120を介して、データベース140に記憶されたデータまたは命令にアクセスし得る。いくつかの実施形態では、データベース140は、システム100中の1つまたは複数の構成要素(たとえば、サーバ110、端末130など)に直接接続されるか、またはそれらと通信し得る。いくつかの実施形態では、データベース140は、サーバ110の一部であり得る。
図2は、サーバ110、端末130、および/またはデータベース140が、本開示のいくつかの実施形態に従ってその上に実装され得る、コンピューティング・デバイス200の例示的なハードウェアおよびソフトウェア構成要素を示す概略図である。たとえば、処理エンジン112は、コンピューティング・デバイス200上に実装され、本開示で開示される処理エンジン112の機能を実施するように構成され得る。
コンピューティング・デバイス200は、本開示のためのID写真真正性検証システムを実装するために使用され得る。コンピューティング・デバイス200は、本明細書で説明されるように偽ID写真識別サービスの任意の構成要素を実装し得る。図1〜図2では、純粋に便宜目的で、1つのそのようなコンピュータ・デバイスのみが示される。当業者は、本明細書で説明されるオンデマンド・サービスに関係するコンピュータ機能が、処理負荷を分散させるためにいくつかの同様のプラットフォーム上で分散様式で実装され得ることを、本出願の出願時に理解されよう。
コンピューティング・デバイス200は、たとえば、データ通信を容易にするためにそれに接続されたネットワークにおよびネットワークから接続されたCOMポート250を含み得る。コンピューティング・デバイス200は、プログラム命令を実行するために、1つまたは複数のプロセッサの形態の、中央プロセッサ220をも含み得る。例示的なコンピュータ・プラットフォームは、様々なデータ・ファイルがコンピュータによって処理および/または送信されるために、内部通信バス210、異なる形態のプログラム・ストレージおよびデータ・ストレージ、たとえば、ディスク270、および読取り専用メモリ(ROM)230、またはランダム・アクセス・メモリ(RAM)240を含み得る。例示的なコンピュータ・プラットフォームは、プロセッサ220によって実行されるべき、ROM230、RAM240、および/または他のタイプの非一時的ストレージ媒体に記憶されたプログラム命令をも含み得る。本開示の方法および/またはプロセスは、プログラム命令として実装され得る。コンピューティング・デバイス200は、コンピュータと、ユーザ・インターフェース要素280など、コンピュータ中の他の構成要素との間の入出力をサポートする、I/Oポート260をも含み得る。コンピューティング・デバイス200はまた、ネットワーク通信を介してプログラミングおよびデータを受信し得る。
単に例示のために、コンピューティング・デバイス200において1つのプロセッサ220のみが説明される。ただし、本開示におけるコンピューティング・デバイス200は複数のプロセッサをも含み、したがって、本開示で説明される1つのプロセッサ220によって実施される動作および/または方法ステップは、複数のプロセッサによって一緒にまたは別個に実施されることもあることに留意されたい。たとえば、本開示では、コンピューティング・デバイス200のプロセッサ220がステップAとステップBの両方を実行する場合、ステップAおよびステップBはまた、コンピューティング・デバイス200において、2つの異なるプロセッサによって一緒にまたは別個に実施され得る(たとえば、第1のプロセッサがステップAを実行し、第2のプロセッサがステップBを実行するか、または、第1のプロセッサと第2のプロセッサとがステップAおよびBを一緒に実行する)ことを理解されたい。
システム100の要素が機能するとき、その要素は電気信号および/または電磁信号を通して機能し得ることを、当業者は理解されよう。たとえば、端末130が、サービス要求(たとえば、ID写真をサーバ110またはデータベース140にアップロードするようにとの要求)をサーバ110に送出するとき、端末130のプロセッサが、その要求を符号化する電気信号を生成し得る。端末130のプロセッサは、次いで、電気信号を出力ポートに送り得る。端末130がワイヤード・ネットワークを介してサーバ110と通信する場合、出力ポートはケーブルに物理的に接続され得、ケーブルは、さらに、電気信号をサーバ110の入力ポートに送信する。端末130がワイヤレス・ネットワークを介してサーバ110と通信する場合、サービス要求者端末130の出力ポートは1つまたは複数のアンテナであり得、1つまたは複数のアンテナは電気信号を電磁信号に変換する。同様に、端末130は、電気信号または電磁石信号を介してサーバ110から命令および/またはサービス要求を受信し得る。端末130および/またはサーバ110など、電子デバイス内で、それのプロセッサが命令を処理し、命令を送出し、および/またはアクションを実施するとき、命令および/またはアクションは電気信号を介して伝えられる。たとえば、プロセッサがストレージ媒体からデータを検索または保存するとき、プロセッサは、電気信号をストレージ媒体の読取り/書込みデバイスに送出し得、読取り/書込みデバイスは、ストレージ媒体中の構造化データを読み取るかまたは書き込み得る。構造化データは、電子デバイスのバスを介して電気信号の形態でプロセッサに送信され得る。ここで、電気信号は、1つの電気信号、一連の電気信号、および/または複数の個別の電気信号を指し得る。
図3は、いくつかの実施形態による、例示的な処理エンジン112を示すブロック図である。処理エンジン112は、取得モジュール310と、特徴抽出モジュール320と、決定モジュール330とを含み得る。モジュールは、処理エンジン112の全部または一部のハードウェア回路であり得る。モジュールはまた、処理エンジンによって読み取られ、実行される、アプリケーションまたは命令のセットとして実装され得る。さらに、モジュールは、ハードウェア回路とアプリケーション/命令の任意の組合せであり得る。たとえば、モジュールは、処理エンジン112がアプリケーション/命令のセットを実行しているとき、処理エンジン112の一部であり得る。
取得モジュール310は、I/Oポートを介して要求電気信号(request electrical signal)を取得し得る。いくつかの実施形態では、要求電気信号は、ターゲットID写真をサーバ110またはデータベース140にアップロードするための要求を表し、および/または符号化し得る。いくつかの実施形態では、要求電気信号は、ターゲットID写真をターゲット・ロケーションにアップロードするための要求を符号化する(encoded)要求信号フラグメントを含み得る。要求電気信号は、ターゲットID写真に関連付けられたターゲット画像データを符号化する(encoded)要求信号フラグメントをも含み得る。
特徴抽出モジュール320は、ID写真の1つまたは複数の特徴に基づいて特徴ベクトルを生成するように構成され得る。ID写真の特徴は、色分布特徴、テクスチャ特徴、顔特徴、または他の偽ID特徴、あるいはそれらの任意の組合せを含み得る。
いくつかの実施形態では、特徴抽出モジュール320は、ID写真の色ヒストグラムを介して色分布特徴を抽出するように構成され得る。色ヒストグラムは、ID写真の色空間にわたる色範囲の固定リストの各々中の色を有するピクセルの数を表し得る。色空間は、ID写真中のすべての可能な色のセットを表し得る。
いくつかの実施形態では、特徴抽出モジュール320は、ID写真の配向勾配ヒストグラム(HOG)を介して、および/またはID写真のローカル・バイナリ・パターン(LBP)を介して、テクスチャ特徴を抽出するように構成され得る。配向勾配ヒストグラムは、ID写真の局所的部分における勾配配向(gradient orientation)の発生をカウントし得る。ローカル・バイナリ・パターン(LBP)は、各ピクセルの近傍をしきい値処理することによってID写真のピクセルをラベリングし、結果を2進数として提示し得る。
いくつかの実施形態では、特徴抽出モジュール320は、トレーニングされた畳み込みニューラル・ネットワーク(CNN:convolutional neural network)を介して顔特徴を抽出するように構成され得る。複数の人間の顔によってトレーニングされた後に、畳み込みニューラル・ネットワークは、ID写真から顔特徴を抽出し得る。
いくつかの実施形態では、特徴抽出モジュール320は、トレーニングされた畳み込みニューラル・ネットワーク(CNN)を介して偽ID特徴を抽出するように構成され得る。複数の偽ID写真によってトレーニングされた後に、畳み込みニューラル・ネットワークは、ID写真から偽ID特徴を抽出し得る。
決定モジュール330は、ターゲットID写真と基準ID写真との間の差分値を生成するように構成され得る。いくつかの実施形態では、差分値は、ターゲット特徴ベクトルと基準特徴ベクトルとの間のユークリッド距離であり得る。
処理エンジン112中のモジュールは、ワイヤード接続またはワイヤレス接続を介して互いに接続されるか、または互いと通信し得る。ワイヤード接続は、メタル・ケーブル、光ケーブル、ハイブリッド・ケーブルなど、またはそれらの任意の組合せを含み得る。ワイヤレス接続は、ローカル・エリア・ネットワーク(LAN)、ワイド・エリア・ネットワーク(WAN)、Bluetooth(商標)、ZigBee(商標)、ニア・フィールド通信(NFC)など、またはそれらの任意の組合せを含み得る。モジュールのうちの2つまたはそれ以上が、単一のモジュールとして組み合わせられ得、モジュールのうちのいずれか1つが、2つまたはそれ以上のユニットに分割され得る。たとえば、特徴抽出モジュール320は、ID写真の1つまたは複数の特徴に基づいて特徴ベクトルを生成することと、ターゲットID写真と基準ID写真との間の差分値を生成することとの両方を行い得る単一のモジュールとして、決定モジュール330に組み込まれ得る。さらに別の例として、特徴抽出モジュール320は、それぞれ特徴抽出モジュール320の機能を実装するための、色分布特徴抽出ユニットと、テクスチャ特徴抽出ユニットと、顔特徴抽出ユニットと、偽ID特徴抽出ユニットとの4つのユニットに分割され得る。
図4は、本開示のいくつかの実施形態による、ターゲットID写真の真正性を検証するための例示的なプロセスおよび/または方法400のフローチャートである。いくつかの実施形態では、プロセス400は、図1に示されているシステム100において実装され得る。たとえば、プロセス400は、命令の形態としてデータベース140および/またはストレージ(たとえば、ROM230、RAM240など)に記憶され、サーバ110(たとえば、サーバ110中の処理エンジン112、またはサーバ110中の処理エンジン112のプロセッサ220)によって呼び出され、および/または実行され得る。
ステップ410において、プロセッサ220は、I/Oポート260を介して要求電気信号を取得し得る。
いくつかの実施形態では、要求電気信号は、ターゲットID写真をサーバ110またはデータベース140にアップロードするための要求を表し、および/または符号化し得る。いくつかの実施形態では、要求電気信号は、ターゲットID写真をターゲット・ロケーション(たとえば、サーバ110、またはデータベース140)にアップロードするための要求を符号化する要求信号フラグメントを含み得る。要求電気信号は、ターゲットID写真に関連付けられたターゲット画像データを符号化する要求信号フラグメントをも含み得る。
ステップ420において、プロセッサ220は、ターゲットID写真の所定のエリアに基づく特徴ベクトルをターゲット特徴ベクトルとして決定し得る。
いくつかの実施形態では、プロセッサ220は、ターゲットID写真の所定のエリアの1つまたは複数の特徴に従って、ターゲット特徴ベクトルを決定し得る。いくつかの実施形態では、ターゲットID写真の所定のエリアは、ID写真の全エリアを表し得る。いくつかの実施形態では、ID写真の所定のエリアは、ポートレート・エリアを除くID写真のエリア、またはポートレート・エリアを含むID写真のエリアを表し得る。いくつかの実施形態では、ID写真の所定のエリアは、文字記述エリアを除くID写真のエリア、または文字記述エリアを含むID写真のエリアを表し得る。ID写真の特徴は、色分布特徴、テクスチャ特徴、顔特徴、および偽ID特徴を含み得る。いくつかの実施形態では、プロセッサ220は、基準ID写真の所定のエリアの特徴ベクトルを基準特徴ベクトルとして決定し得る。いくつかの実施形態では、基準特徴ベクトルは、事前に、抽出され、データベース140に記憶され得る。特徴抽出方法のより多くの説明が、図5〜図11およびそれらの説明において見つけられ得る。
ステップ430において、プロセッサ220は、データ・バス210を介してデータベース140にアクセスし得る。ステップ520では、プロセッサ220は、データベース140から1つまたは複数の基準ID写真を検索し得る。
ターゲットID写真の真正性を検証するために、数百万個または数十億個もの基準ID写真がデータベース140に記憶され得るので、ターゲットID写真をデータベース140中のすべての基準ID写真と比較するのに極めて長い時間がかかるであろう。いくつかの実施形態では、プロセッサ220は、基準特徴ベクトルについてのクラスタ数を生成するために、局所性鋭敏型ハッシュ(LSH:locality sensitive hashing)アルゴリズムを実施し得る。異なる基準ID写真の基準特徴ベクトルが互いに類似する場合、これらの特徴ベクトルについてのクラスタ数は同じであり得る。プロセッサ220は、クラスタ数に基づいて、データベース140中の基準ID写真を複数のクラスタにクラスタ化し得る。プロセッサ220は、ターゲット特徴ベクトルに基づいてクラスタ数を生成し、同じクラスタ数をもつ基準写真を取得するためにデータベース140中の対応するクラスタを検索し得る。
ステップ440において、プロセッサ220は、ターゲットID写真とステップ430において取得された基準ID写真との間の差分値を生成し得る。
いくつかの実施形態では、ターゲットID写真と基準ID写真との間の差分値は、ターゲット特徴ベクトルと基準特徴ベクトルとの間のユークリッド距離であり得る。たとえば、n次元特徴ベクトルAが(x11,x12,...,x1n)として示され、n次元特徴ベクトルBが(x21,x22,...,x2n)として示される場合、特徴ベクトルAと特徴ベクトルBとの間のユークリッド距離d12は、以下の式によって決定され得る。
ユークリッド距離d12が小さいほど、ターゲットID写真と基準ID写真との間の類似度は高くなる。
ステップ450において、第1の差分値がしきい値(たとえば、0.1)よりも小さいと決定すると、プロセッサ220は、ターゲットID写真および/または基準ID写真が偽ID写真であり得ることを示すための警告コードを符号化する電子信号を生成し得る。
ターゲットID写真が十分に基準ID写真のようであるとプロセッサ220が決定したとき、ターゲットID写真が、システム100のデータベース中にすでにあった基準ID写真と同じ人を表すはずであると結論付けることは妥当であろう。しかしながら、誰かがターゲットID写真を使用して異なる人としてシステム100に登録することを試みているので、基準ID写真およびターゲットID写真のうちの少なくとも1つが偽である。どちらのID写真が偽ID写真であるかについての十分な証拠なしに(または、どちらのID写真が偽ID写真であるかを決定することなしに)、プロセッサ220は、ターゲットID写真および/または基準ID写真が偽ID写真であり得ることを示すための警告コードを生成し得る。
上記の説明は、例示の目的で与えられたものにすぎず、本開示の範囲を限定するものではないことに留意されたい。当業者の場合、本開示の教示の下で、複数の変形および変更が行われ得る。しかしながら、それらの変形および変更は、本開示の範囲から逸脱しない。たとえば、1つまたは複数の他の随意のステップ(たとえば、記憶ステップ、前処理ステップ)が、例示的なプロセス/方法400中の他の場所に追加され得る。別の例として、例示的なプロセス/方法400中のすべてのステップが、命令のセットを含むコンピュータ可読媒体において実装され得る。命令は、電子的流れ(electronic current)の形態で送信され得る。
図5は、本開示のいくつかの実施形態による、配向勾配ヒストグラムを介してID写真のテクスチャ特徴を抽出するための例示的なプロセスおよび/または方法500のフローチャートである。いくつかの実施形態では、プロセス500は、図1に示されているシステム100において実装され得る。たとえば、プロセス500は、命令の形態としてデータベース140および/またはストレージ(たとえば、ROM230、RAM240など)に記憶され、サーバ110(たとえば、サーバ110中の処理エンジン112、またはサーバ110中の処理エンジン112のプロセッサ220)によって呼び出され、および/または実行され得る。
ステップ510において、プロセッサ220は、I/Oポート260を介して要求電気信号を取得し得る。いくつかの実施形態では、要求電気信号は、配向勾配ヒストグラムを介してID写真からテクスチャ特徴を抽出するための要求を表し、および/または符号化し得る。いくつかの実施形態では、要求電気信号は、配向勾配ヒストグラムを介してテクスチャ特徴を抽出するための要求を符号化する(encoded)要求信号フラグメントを含み得る。要求電気信号は、ID写真に関連付けられた画像データを符号化する(encoded)要求信号フラグメントをも含み得る。
ステップ520において、プロセッサ220は、ID写真中のピクセルの所定のエリアのグレー・スケールを取得し得る。いくつかの実施形態では、ターゲットID写真の所定のエリアは、ID写真の全エリアを表し得る。いくつかの実施形態では、ID写真の所定のエリアは、ポートレート・エリアを除くID写真のエリア、またはポートレート・エリアを含むID写真のエリアを表し得る。いくつかの実施形態では、ID写真の所定のエリアは、文字記述エリアを除くID写真のエリア、または文字記述エリアを含むID写真のエリアを表し得る。
いくつかの実施形態では、プロセッサ220は、ID写真の少なくとも1つのポートレートを除くエリアをもつピクセルのグレー・スケールを取得し得る。いくつかの実施形態では、プロセッサ220は、浮動小数点演算、整数アルゴリズム、転送アルゴリズム、平均値アルゴリズムなど、またはそれらの任意の組合せを含む、グレー・スケールを生成するための所定のアルゴリズムを実施し得る。
ステップ530において、プロセッサ220は、ステップ520において生成されたグレー・スケールに基づいて、各ピクセルの勾配を生成し得る。
ID写真の各ピクセルにおける勾配は、水平方向および垂直方向における成分をもつ2次元空間におけるベクトル(「2Dベクトル」)であり得る。ID写真の各ピクセルにおいて、2Dベクトルの方向であり得る勾配方向(gradient direction)は、ピクセルにおける最も大きい可能なグレー・スケール増加の方向を表し得、2Dベクトルの長さであり得る勾配値(gradient value)は、ピクセルにおける最も大きい可能なグレー・スケール増加のその方向の変化率を表し得る。
いくつかの実施形態では、プロセッサ220は、フィルタ・カーネル[−1、0、1]、およびフィルタ・カーネル[−1、0、1]を用いて各ピクセルのグレー・スケール・データをフィルタ処理してよく、ここで、
(x,y)=f(x+1,y)−f(x−1,y)、 (2)
(x,y)=f(x,y+1)−f(x,y−1) (3)
である。
式(2)および(3)において、f(x,y)は、ID写真中の(x,y)の座標をもつピクセルのグレー・スケールを示し得る。G(x,y)は、ID写真中の(x,y)の座標をもつピクセルの水平勾配値を示し得、G(x,y)は、ID写真中の(x,y)の座標をもつピクセルの垂直勾配値を示し得る。プロセッサ220は、水平勾配値および垂直勾配値に基づいて、ピクセルの勾配値および勾配方向を生成し得、ここで、
である。
式(4)および(5)において、G(x,y)は、ID写真中の(x,y)の座標をもつピクセルの勾配値を示し得、α(x,y)は、ID写真中の(x,y)の座標をもつピクセルの勾配方向を示し得る。いくつかの実施形態では、勾配方向は、0〜180度または0〜360度であり得る。
ステップ540において、プロセッサ220は、ID写真の所定のエリアを1つまたは複数のブロックに分割し得る。
プロセッサ220は、ブロックを1つまたは複数のセルにさらに分割し得る。たとえば、プロセッサ220は、ID写真を4つのブロックに分割し得、各ブロックは3×3セルを含み得、各セルは6×6ピクセルを含み得る。
いくつかの実施形態では、プロセッサ220は、ID写真の所定のエリアの勾配方向分布を表すために、配向勾配ヒストグラム(HOG)を生成し得る。いくつかの実施形態では、HOGは9つのビンを有し得る。HOGの各ビンが、所定の方向範囲を表し得る。いくつかの実施形態では、ビンの方向範囲は、0〜20度、20〜40度、40〜60度、60〜80度、80〜100度、100〜120度、120〜140度、140〜160度、および160〜180度であり得る。
プロセッサ220は、セル中のすべてのピクセルについて、勾配方向とビンの方向範囲とに基づいて投票(voting)を行い得る。ビンの値は、ビン中のピクセルの数と、ビン中のこれらのピクセルの勾配値とに関係し得る。たとえば、セル中のピクセルAの勾配方向が17.1度である場合、プロセッサ220は、ピクセルAの勾配値を0〜20度ビンの値に追加し得る。したがって、プロセッサ220はセルのHOGを生成し得る。いくつかの実施形態では、プロセッサ220は、ブロックのピクセル勾配を生成するために、セルのHOGをグループ化し得る。
ステップ550において、プロセッサ220は、各ブロックのピクセル勾配に基づいて、ID写真のテクスチャ特徴を決定し得る。いくつかの実施形態では、プロセッサ220は、テクスチャ特徴ベクトルを取得するために、各ブロックをそれぞれ正規化し得る。
ステップ560において、プロセッサ220は、テクスチャ特徴をターゲット特徴ベクトルまたは基準特徴ベクトル中に保存するためのおよび/または組み込むための電気信号を生成し得る。テクスチャ特徴は、ストレージ媒体、または記憶機能をもつ任意の他のデバイスに記憶され得る。たとえば、テクスチャ特徴は、ターゲット特徴ベクトルまたは基準特徴ベクトルの構造化データを指す1つまたは複数のポインタをもつ構造化データとして保存され得る。代替的に、テクスチャ特徴は、ターゲット特徴の構造化データに組み込まれ得る。
上記の説明は、例示の目的で与えられたものにすぎず、本開示の範囲を限定するものではないことに留意されたい。当業者の場合、本開示の教示の下で、複数の変形および変更が行われ得る。しかしながら、それらの変形および変更は、本開示の範囲から逸脱しない。たとえば、1つまたは複数の他の随意のステップ(たとえば、記憶ステップ、前処理ステップ)が、例示的なプロセス/方法500中の他の場所に追加され得る。別の例として、例示的なプロセス/方法500中のすべてのステップが、命令のセットを含むコンピュータ可読媒体において実装され得る。命令は、電子的流れの形態で送信され得る。
図6は、本開示のいくつかの実施形態による、ローカル・バイナリ・パターンを介してID写真のテクスチャ特徴を抽出するための例示的なプロセスおよび/または方法600のフローチャートである。いくつかの実施形態では、プロセス600は、図1に示されているシステム100において実装され得る。たとえば、プロセス600は、命令の形態としてデータベース140および/またはストレージ(たとえば、ROM230、RAM240など)に記憶され、サーバ110(たとえば、サーバ110中の処理エンジン112、またはサーバ110中の処理エンジン112のプロセッサ220)によって呼び出され、および/または実行され得る。
ステップ610において、プロセッサ220は、I/Oポート260を介して要求電気信号を取得し得る。いくつかの実施形態では、要求電気信号は、ローカル・バイナリ・パターンを介してID写真からテクスチャ特徴を抽出するための要求を表し、および/または符号化し得る。いくつかの実施形態では、要求電気信号は、ローカル・バイナリ・パターンを介してテクスチャ特徴を抽出するための要求を符号化する(encoded)要求信号フラグメントを含み得る。要求電気信号は、ID写真に関連付けられた画像データを符号化する(encoded)要求信号フラグメントをも含み得る。
ステップ620において、プロセッサ220は、ID写真中のピクセルの所定のエリアのグレー・スケールを取得し得る。いくつかの実施形態では、プロセッサ220は、ID写真のポートレート・エリアを除くエリアをもつピクセルのグレー・スケールを取得し得る。いくつかの実施形態では、プロセッサ220は、浮動小数点演算、整数アルゴリズム、転送アルゴリズム、平均値アルゴリズムなど、またはそれらの任意の組合せを含む、グレー・スケールを生成するための所定のアルゴリズムを実施し得る。
ステップ630において、ID写真中の各ピクセルについて、プロセッサ220は、所定のシーケンスによって(たとえば、時計回りにまたは反時計回りに)、(中心ピクセルと見なされ得る)ピクセルをそのピクセルの8つの近接するピクセル(中心ピクセルの左上部、左中央、左下部、右上部、右中央、右下部、上部、および下部)の各々と比較し得る。いくつかの実施形態では、プロセッサ220は、中心ピクセルのグレー・スケールをしきい値として決定し得る。プロセッサ220は、グレー・スケールの比較に基づいて、中心ピクセルの近接するピクセルのうちの1つのために2進値をマークし得る。たとえば、中心ピクセルの近接するピクセルのうちの1つのグレー・スケールがしきい値(たとえば、中心ピクセルのグレー・スケール)よりも大きいかまたはそれに等しい場合、近接するピクセルは「1」とマークされ得、近接するピクセルのうちの1つのグレー・スケールがしきい値よりも小さい場合、近接するピクセルは「0」とマークされ得る。したがって、プロセッサ220は、中心ピクセルの近接するピクセルの2進値を配列することによって、2進列(たとえば、「00101010」)を取得し得る。
ステップ640において、プロセッサ220は、各ピクセルの2進列に基づいて、テクスチャ情報を生成し得る。いくつかの実施形態では、プロセッサ220は、2進列をローカル・バイナリ・パターン(LBP)値(たとえば、10進値)に変換し得、中心ピクセルのグレー・スケールをLBP値と置き換え得る。
ステップ650において、プロセッサ220は、テクスチャ情報に基づいて、ID写真のテクスチャ特徴を決定し得る。いくつかの実施形態では、ステップ620〜ステップ640の後に、ID写真の各ピクセルがLBP値を有し得る。いくつかの実施形態では、プロセッサ220は、ID写真を1つまたは複数の領域に分割し得る。各領域は、1つまたは複数のピクセルを有する。プロセッサ220は、領域の特徴を表すために、各領域のLBP値に基づいてLBPヒストグラムを生成し得る。プロセッサ220は、LBPヒストグラムに基づいてテクスチャ特徴を生成し得る。いくつかの実施形態では、プロセッサ220は、テクスチャ特徴に基づいて特徴ベクトルを生成し得る。
ステップ660において、プロセッサ220は、テクスチャ特徴をターゲット特徴ベクトルまたは基準特徴ベクトル中に保存するための電気信号を生成し得る。テクスチャ特徴は、ストレージ媒体、または記憶機能をもつ任意の他のデバイスに記憶され得る。
上記の説明は、例示の目的で与えられたものにすぎず、本開示の範囲を限定するものではないことに留意されたい。当業者の場合、本開示の教示の下で、複数の変形および変更が行われ得る。しかしながら、それらの変形および変更は、本開示の範囲から逸脱しない。たとえば、1つまたは複数の他の随意のステップ(たとえば、記憶ステップ、前処理ステップ)が、例示的なプロセス/方法600中の他の場所に追加され得る。別の例として、例示的なプロセス/方法600中のすべてのステップが、命令のセットを含むコンピュータ可読媒体において実装され得る。命令は、電子的流れの形態で送信され得る。
図7は、本開示のいくつかの実施形態による、ターゲットID写真の顔特徴を取得するための例示的なプロセスのフローチャートである。いくつかの実施形態では、プロセス600は、図1に示されているシステム100において実装され得る。たとえば、プロセス700は、命令の形態としてデータベース150および/またはストレージ(たとえば、ROM230、RAM240など)に記憶され、サーバ110(たとえば、サーバ110中の処理エンジン112、またはサーバ110中の処理エンジン112のプロセッサ220)によって呼び出され、および/または実行され得る。
ステップ710において、プロセッサ220は、I/Oポート260を介して要求電気信号を取得し得る。いくつかの実施形態では、要求電気信号は、トレーニングされた畳み込みニューラル・ネットワーク(CNN)を介してID写真から顔特徴を抽出するための要求を表し、および/または符号化し得る。いくつかの実施形態では、要求電気信号は、CNNを介して顔特徴を抽出するための要求を符号化する(encoded)要求信号フラグメントを含み得る。要求電気信号は、ID写真に関連付けられた画像データを符号化する(encoded)要求信号フラグメントをも含み得る。
ステップ720において、プロセッサ220は、ID写真中の所定のエリアのピクセルのピクセル値を取得し得る。いくつかの実施形態では、プロセッサ220は、ID写真のポートレート・エリア内のピクセルのピクセル値を取得し得る。たとえば、ピクセル値は、ピクセルのルミナンス値、ピクセルのグレー値、ピクセルの色またはRGB値、ピクセルの飽和値など、あるいはそれらの任意の組合せを指し得る。
ステップ730において、プロセッサ220は、顔特徴を抽出するために、トレーニングされた畳み込みニューラル・ネットワーク(CNN)を実施し得る。いくつかの実施形態では、プロセッサ220は、その顔特徴があらかじめ決定され得る複数の基準ID写真を用いて、CNNをトレーニングし得る。
いくつかの実施形態では、CNNは、1つまたは複数の入力層、1つまたは複数の畳み込み層(convolution layer)、1つまたは複数のプーリング層(pooling layer)、1つまたは複数の全結合層(fully−connected layer)、および1つまたは複数の出力層を含み得る。
いくつかの実施形態では、入力層は、入力画像についての固定サイズを指定し得、したがって、ポートレート・エリアのみをもつID写真は、入力層に与えられる前に相応にサイズ変更され得る。次いで、畳み込み層は、トレーニング可能な重みを使用して複数のカーネルを用いてID写真を畳み込み得る。いくつかの実施形態では、カーネルは、顔特徴がID写真中のある空間的位置にあるとき、顔特徴をアクティブにし得る。カーネルは、異なるトレーニング可能重みを用いて異なる顔特徴をアクティブにし得る。プーリング層は、カーネルによってアクティブにされた顔特徴を抽出することを試みながら、畳み込み層によって畳み込まれた後のID写真のサイズを低減し得る。いくつかの実施形態では、畳み込み層およびプーリング層は、CNNの特徴抽出部分を構成し得る。次いで、全結合層は、顔特徴を生成するために、抽出された顔特徴を重み付けし、合成し得、次いで、出力層は顔特徴を出力し得る。
いくつかの実施形態では、CNNをトレーニングするために、プロセッサ220は、その実際の顔特徴があらかじめ決定され得る複数の基準ID写真を、CNNに供給し得る。次いで、プロセッサ220は、出力層によって生成された顔特徴と、データベース140中の基準ID写真のあらかじめ決定された実際の特徴との間の差分に基づいて、誤差関数を生成し得る。プロセッサ220は、誤差関数が最小値に達するまで、誤差関数を畳み込み層に返し、カーネルのトレーニング可能重みを変化させ得る。したがって、プロセッサ220は、ID写真から顔特徴を抽出するために、CNNをトレーニングし得る。
トレーニングされたCNNによって顔特徴を決定した後に、プロセッサ220は、顔特徴をターゲット特徴ベクトルまたは基準特徴ベクトル中に保存するための電気信号を生成し得る。顔特徴は、ストレージ媒体、または記憶機能をもつ任意の他のデバイスに記憶され得る。
上記の説明は、例示の目的で与えられたものにすぎず、本開示の範囲を限定するものではないことに留意されたい。当業者の場合、本開示の教示の下で、複数の変形および変更が行われ得る。しかしながら、それらの変形および変更は、本開示の範囲から逸脱しない。たとえば、1つまたは複数の他の随意のステップ(たとえば、記憶ステップ)が、例示的なプロセス/方法700中の他の場所に追加され得る。別の例として、すべてのステップが、命令のセットを含むコンピュータ可読媒体において実装され得る。命令は、電子的流れの形態で送信され得る。
図8は、本開示のいくつかの実施形態による、ID写真の偽ID特徴を抽出するための例示的なプロセスおよび/または方法800のフローチャートである。いくつかの実施形態では、プロセス800は、図1に示されているシステム100において実装され得る。たとえば、プロセス600は、命令の形態としてデータベース150および/またはストレージ(たとえば、ROM230、RAM240など)に記憶され、サーバ110(たとえば、サーバ110中の処理エンジン112、またはサーバ110中の処理エンジン112のプロセッサ220)によって呼び出され、および/または実行され得る。
ステップ810において、プロセッサ220は、I/Oポート260を介して要求電気信号を取得し得る。いくつかの実施形態では、要求電気信号は、トレーニングされた畳み込みニューラル・ネットワーク(CNN)を介してID写真から偽ID特徴を抽出するための要求を表し、および/または符号化し得る。いくつかの実施形態では、要求電気信号は、CNNを介して偽ID特徴を抽出するための要求を符号化する(encoded)要求信号フラグメントを含み得る。要求電気信号は、ID写真に関連付けられた画像データを符号化する(encoded)要求信号フラグメントをも含み得る。
ステップ820において、プロセッサ220は、トレーニングされた畳み込みニューラル・ネットワークによってID写真の偽ID特徴が決定され得ることを抽出し得る。プロセッサ220は、複数の基準ID写真を用いてCNNをトレーニングし得る。いくつかの実施形態では、CNNをトレーニングするために使用される基準ID写真は、偽ID写真であり得る。プロセッサが偽ID写真から抽出し得る偽ID特徴は、偽色特徴、偽テクスチャ特徴、偽顔特徴など、またはそれらの任意の組合せを含み得る。いくつかの実施形態では、ステップ820において使用されるCNNは、ステップ730において使用されるCNNと同様であり得る。複数の偽ID写真を用いてCNNをトレーニングすることのより詳細な説明は、本開示の他の場所(たとえば、図7)で与えられる。
上記の説明は、例示の目的で与えられたものにすぎず、本開示の範囲を限定するものではないことに留意されたい。当業者の場合、本開示の教示の下で、複数の変形および変更が行われ得る。しかしながら、それらの変形および変更は、本開示の範囲から逸脱しない。たとえば、1つまたは複数の他の随意のステップ(たとえば、記憶ステップ、前処理ステップ)が、例示的なプロセス/方法800中の他の場所に追加され得る。別の例として、すべてのステップが、命令のセットを含むコンピュータ可読媒体において実装され得る。命令は、電子的流れの形態で送信され得る。
図9は、本開示のいくつかの実施形態による、CNNをトレーニングするための例示的なプロセスおよび/または方法900のフローチャートである。CNNをトレーニングすることは、ID写真の偽特徴を決定するために使用され得る。いくつかの実施形態では、プロセス900は、図1に示されているシステム100において実装され得る。たとえば、プロセス900は、命令の形態としてデータベース140および/またはストレージ(たとえば、ROM230、RAM240など)に記憶され、サーバ110(たとえば、サーバ110中の処理エンジン112、またはサーバ110中の処理エンジン112のプロセッサ220)によって呼び出され、および/または実行され得る。
ステップ910において、1つまたは複数のコンピュータによって、メモリ、データベースまたはインターネットから複数の基準ID写真が取得され得る。いくつかの実施形態では、基準ID写真は、偽基準ID写真であり得る。ある基準偽ID写真は、実際のID写真に基づいて変更された写真であり得る。ある実際のID写真を変更することによって、1つまたは複数の基準偽ID写真が取得され得ることと、1つまたは複数の実際のID写真の異なる部分を抽出することによって、基準偽ID写真が組み合わせられ得ることとに留意されたい。
ステップ920において、プロセッサ220は、異なる改ざん方法に基づいて、基準偽ID写真を分類およびマークし得る。改ざん方法は、基準偽IDがどのように生成されるかを表し得る。改ざん方法は、実際のID写真のテキスト情報を変更すること、実際のID写真の色を変更すること、実際のID写真の境界線を変更すること、実際のID写真の背景を変更すること、実際のID写真の顔を変更することなど、またはそれらの任意の組合せを含み得る。
ステップ930において、異なる改ざん方法に基づいて、複数の偽ID写真が取得され得る。各カテゴリーについて、カテゴリーのテンプレートを変更することによって、1つまたは複数の偽ID写真が取得され得る。テンプレートを変更することが、上記で説明された1つまたは複数の改ざん方法を含み得ることに留意されたい。たとえば、テンプレートの、テクスチャ情報、または色、または境界線、または背景、または顔など、あるいはそれらの任意の組合せを変更することによって、偽ID写真が取得され得る。偽ID写真を取得した後に、写真は、写真の改ざん方法に基づいて、カテゴリー中のサブカテゴリーに分類され得る。
ステップ940において、異なるトレーニング・データセットを使用して、異なる畳み込みニューラル・ネットワーク・モデルがトレーニングされ得る。カテゴリー中のすべての基準偽ID写真および偽ID写真が、トレーニング・データセットを形成し得る。各トレーニング・データセットが、CNNモデルをトレーニングし得る。CNNモデルは、Lenet、Alexnet、GoogleNet、VGG、ResNetなど、またはそれらの任意の組合せであり得る。CNNモデルのトレーニング・プロセスは、図7に関連しており、ここで繰り返されない。
ステップ950において、コンピュータによって取得された電気信号中に符号化されたターゲットID写真の偽ID特徴を決定し、偽ID特徴をターゲット特徴ベクトルまたは基準特徴ベクトル中に保存するために、1つまたは複数のコンピュータによって、トレーニングされたCNNモデル(trained CNN model)が取得され得る。
上記の説明は、例示の目的で与えられたものにすぎず、本開示の範囲を限定するものではないことに留意されたい。当業者の場合、本開示の教示の下で、複数の変形および変更が行われ得る。しかしながら、それらの変形および変更は、本開示の範囲から逸脱しない。たとえば、1つまたは複数の他の随意のステップ(たとえば、記憶ステップ、前処理ステップ)が、例示的なプロセス/方法900中の他の場所に追加され得る。別の例として、すべてのステップが、命令のセットを含むコンピュータ可読媒体において実装され得る。命令は、電子的流れの形態で送信され得る。
図10は、本開示のいくつかの実施形態による、基準ID写真のデータベースを確立するための例示的なプロセスおよび/または方法1000のフローチャートである。いくつかの実施形態では、プロセス1000は、図1に示されているシステム100において実装され得る。たとえば、プロセス1000は、命令の形態としてデータベース140および/またはストレージ(たとえば、ROM230、RAM240など)に記憶され、サーバ110(たとえば、サーバ110中の処理エンジン112、またはサーバ110中の処理エンジン112のプロセッサ220)によって呼び出され、および/または実行され得る。
ステップ1010において、プロセッサ220は、複数の基準ID写真のデータにアクセスし得る。いくつかの実施形態では、データは、ストレージ媒体(メモリ)、または記憶機能をもつ任意の他のデバイスに記憶され得る。コンピュータは、データ・バスを介してデータにアクセスし得る。基準ID写真は、基準偽ID写真および偽ID写真を含み得る。
ステップ1020において、プロセッサ220は、各基準ID写真についての基準特徴ベクトルを生成し得る。特徴は、色分布特徴、テクスチャ特徴、顔特徴、および偽ID特徴を含み得る。各基準ID写真の特徴の決定は、図5〜図9に関連しており、ここで繰り返されない。プロセッサ220は、特徴ベクトルに基づいて局所性鋭敏型ハッシュ(LSH)ベクトルを生成するために、LSHアルゴリズムを実施し得る。ハッシュ関数{h:R→Z}の詳細は、以下の通りである。
ここで、xは、元のd次元ベクトルであり、wは、ハッシュ・バケット幅を表す正の整数であり、bは、[0,w]内で一様に分布されていることを満足させる乱数であり、aの各要素は、p安定分布(p−stable distribution)を満たし得る。しかしながら、ただ1つのハッシュ関数の識別能力は十分に強くなく、2次的なハッシュ関数が次のように構成され得る。
(x)={hj,1(x),...,hj,k(x)}(j=1,...,l) (7)
各LSH関数g(x)は、k個のハッシュ関数h(x)からなり得る。LSH関数g(x)によって処理された後、各特徴はLSHベクトルを生成し得る。LSHベクトルは、k次元ハッシュ・ベクトルであり得、ハッシュ値を有し得る。kは、LSHベクトルのハッシュ値として指定され得る。一方、l(l≧1)個のLSH関数g(x)によって処理された特徴の後に、l個のハッシュ・テーブルが生成され得る。各ハッシュ・テーブルに対応して、特徴はハッシュ値を取得し得る。各ハッシュ・テーブルは、m個のハッシュ・バケットを有し得る。特徴は、LSHアルゴリズムによって処理された特徴の後に取得されたハッシュ値に基づいて、各ハッシュ・テーブルのバケットのうちの1つに割り当てられ得る。同じハッシュ値を有する特徴は、各ハッシュ・テーブル中の同じバケットに割り当てられ得る。
ステップ1030において、プロセッサ220は、LSHベクトルに基づいて各基準ID写真についてのクラスタ数を生成し得る。上記で説明されたように、ハッシュ・テーブルは、m個のハッシュ・バケットを有し得る。すべてのバケットは、(1からm)連続番号によって識別され得る。あるバケットに割り当てられた特徴ベクトルについて、そのバケットの番号が、特徴ベクトルのクラスタ数として指定され得る。同じクラスタ数をもつ特徴ベクトルは、同じクラスタ中にあるものと見なされ得る。同じクラスタ数をもつ異なる基準ID写真の特徴ベクトルが、これらの異なる基準ID写真が互いに極めて類似していることを表し得る。クラスタは、クラスタ数に基づいて取得され得る。クラスタ数は、データベース140中の基準ID写真の識別マークおよびロケーションを表し得る。
ステップ1040において、プロセッサ220は、読取り/書込み機器に、基準ID写真のデータを符号化し、基準ID写真のデータにクラスタ数を追加するように指示するための電気信号を生成し得る。
上記の説明は、例示の目的で与えられたものにすぎず、本開示の範囲を限定するものではないことに留意されたい。当業者の場合、本開示の教示の下で、複数の変形および変更が行われ得る。しかしながら、それらの変形および変更は、本開示の範囲から逸脱しない。たとえば、1つまたは複数の他の随意のステップ(たとえば、記憶ステップ、前処理ステップ)が、例示的なプロセス/方法1000中の他の場所に追加され得る。別の例として、すべてのステップが、命令のセットを含むコンピュータ可読媒体において実装され得る。命令は、電子的流れの形態で送信され得る。
ここまで基本概念を説明してきたが、この詳細な開示を読めば、上記の詳細な開示は例として提示されたものにすぎず、限定するものではないことが、当業者には十分に明らかであり得る。本明細書では明確に述べられないが、様々な改変、改善、および変更が行われ得、当業者に意図される。これらの改変、改善、および変更は、本開示によって示唆されるものであり、本開示の例示的な実施形態の趣旨および範囲内にある。
その上、本開示の実施形態について説明するために、ある用語が使用された。たとえば、「一実施形態(one embodiment)」、「実施形態(an embodiment)」および/または「いくつかの実施形態(some embodiments)」という用語は、実施形態に関して説明された特定の特徴、構造または特性が、本開示の少なくとも1つの実施形態中に含まれることを意味する。したがって、本明細書の様々な部分における「実施形態」、「一実施形態」、または「代替実施形態(an alternative embodiment)」への2つまたはそれ以上の言及は、必ずしもすべてが、同じ実施形態に言及しているとは限らないことが強調され、そのことを諒解されたい。さらに、それらの特定の特徴、構造、または特性は、本開示の1つまたは複数の実施形態において好適なものとして組み合わせられ得る。
さらに、本開示の態様は、任意の新しく有用なプロセス、機械、製品、または組成物、あるいはそれらの任意の新しく有用な改善を含むいくつかの特許性があるクラスまたはコンテキストのいずれかにおいて、本明細書で図示および説明され得ることが、当業者によって諒解されよう。したがって、本開示の態様は、完全にハードウェア実装されるか、完全に(ファームウェア、常駐ソフトウェア、マイクロコードなどを含む)ソフトウェア実装されるか、またはソフトウェア実装とハードウェア実装とを組み合わせて実装され得、それらはすべて、本明細書では一般に「ブロック」、「モジュール」、「エンジン」、「ユニット」、「構成要素」、または「システム」と呼ばれることがある。さらに、本開示の態様は、コンピュータ可読プログラム・コードを具現した1つまたは複数のコンピュータ可読媒体中で具現されたコンピュータ・プログラム製品の形態をとり得る。
コンピュータ可読信号媒体は、コンピュータ可読プログラム・コードがその中で具現された伝搬データ信号を、たとえば、ベースバンド内にまたは搬送波の一部として含み得る。そのような伝搬信号は、電磁信号、光信号など、またはそれらの任意の適切な組合せを含む様々な形態のいずれかをとり得る。コンピュータ可読信号媒体は、コンピュータ可読ストレージ媒体ではなく、命令実行システム、装置、またはデバイスによってあるいはそれらに関連して使用するためのプログラムを通信するか、伝搬するか、または搬送し得る、任意のコンピュータ可読ストレージ媒体であり得る。コンピュータ可読信号媒体上で具現されたプログラム・コードは、ワイヤレス、ワイヤライン、光ファイバー・ケーブル、RFなど、または前述の任意の好適な組合せを含む、任意の適切な媒体を使用して送信され得る。
本開示の態様のための動作を行うためのコンピュータ・プログラム・コードは、Java(登録商標)、Scale、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Pythonなど、オブジェクト指向プログラミング言語、「C」プログラミング言語、Visual Basic、Fortran 1703、Perl、COBOL 1702、PHP、ABAPなど、従来の手続き型プログラミング言語、Python、RubyおよびGroovyなど、動的プログラミング言語、または他のプログラミング言語を含む、1つまたは複数のプログラミング言語の任意の組合せで書かれ得る。プログラム・コードは、完全にユーザのコンピュータ上で実行するか、部分的にユーザのコンピュータ上で実行するか、スタンドアロン・ソフトウェア・パッケージとして実行するか、部分的にユーザのコンピュータ上と部分的にリモート・コンピュータ上とで実行するか、あるいは完全にリモート・コンピュータまたはサーバ上で実行し得る。後者のシナリオでは、リモート・コンピュータは、ローカル・エリア・ネットワーク(LAN)またはワイド・エリア・ネットワーク(WAN)を含む、任意のタイプのネットワークを通してユーザのコンピュータに接続され得、あるいは接続は、(たとえば、インターネット・サービス・プロバイダを使用してインターネットを通して)外部コンピュータに対して、またはクラウド・コンピューティング環境内で行われるか、あるいはサービスとしてのソフトウェア(SaaS:software as a service)などのサービスとして提供され得る。
さらに、処理要素またはシーケンスの具陳された順序、あるいは数字、文字、または他の表示の使用は、したがって、特許請求の範囲において指定され得る場合を除いて、請求されるプロセスおよび方法をいかなる順序にも限定するものではない。上記の開示は、様々な例を通して、本開示の様々な有用な実施形態であると現在見なされているものを論じたが、そのような詳細は、単にその目的のためのものであることと、添付の特許請求の範囲は、開示された実施形態に限定されず、むしろ、開示された実施形態の趣旨および範囲内にある変更および等価な構成をカバーするものであることとを理解されたい。たとえば、上記の様々な構成要素の実装は、ハードウェア・デバイスで具現され得、それはまた、ソフトウェアのみの解決策、たとえば、既存のサーバまたはモバイル・デバイス上でのインストールとして実装され得る。
同様に、本開示の実施形態の上記の説明では、様々な特徴が、様々な実施形態のうちの1つまたは複数の理解を助ける本開示を合理化する目的で、単一の実施形態、図、またはそれらの説明において一緒にグループ化されることがあることを諒解されたい。しかしながら、本開示のこの方法は、請求される主題が、各請求項において明確に具陳されているよりも多くの特徴を必要とするという意図を反映するものとして解釈されるべきではない。むしろ、請求される主題は、単一の上記の開示された実施形態のすべての特徴よりも少ないことがある。

Claims (15)

  1. ターゲットID写真の真正性を検証するための命令のセットを含む少なくとも1つのコンピュータ可読ストレージ媒体と、
    前記コンピュータ可読ストレージ媒体と通信している少なくとも1つプロセッサと
    を備えるシステムであって、前記命令のセットを実行するとき、前記少なくとも1つのプロセッサは、
    ターゲット識別(ID)写真を受信することと、
    1つまたは複数の基準ID写真のデータベースにアクセスすることと、
    前記ターゲットID写真上の所定のエリアと前記データベース中の1つまたは複数のターゲット基準ID写真の所定のエリアとの間の差分値を決定することと、
    前記差分値がしきい値よりも小さいと決定すると、前記ターゲットID写真が偽ID写真であることを示すための警告コードを生成することと
    を行うように指示される、システム。
  2. 1つまたは複数の基準ID写真の前記データベースが、1つまたは複数の構造化データを含み、前記1つまたは複数の構造化データの各々が、基準ID写真の前記所定のエリアに関連付けられた基準特徴ベクトルを符号化し、
    前記差分値を決定するために、前記少なくとも1つのプロセッサが、
    前記ターゲットID写真上の前記所定のエリアの1つまたは複数の特徴に基づいて、ターゲット特徴ベクトルを決定することと、
    前記ターゲット特徴ベクトルを基準特徴ベクトルと比較することによって、前記差分値を決定することと
    を行うようにさらに指示される、請求項1に記載のシステム。
  3. 前記差分値がユークリッド距離である、請求項2に記載のシステム。
  4. 前記少なくとも1つのプロセッサは、
    ID写真を少なくとも1つのブロックに分割することであって、前記ID写真が基準ID写真または前記ターゲットID写真である、分割することと、
    各ブロック中の1つまたは複数のピクセルのグレー・スケールを決定することと、
    前記1つまたは複数のピクセルの前記グレー・スケールに基づいて、各ブロックのピクセル勾配を決定することと、
    各ブロックの前記ピクセル勾配に基づいて、前記ID写真のテクスチャ特徴を決定することと、
    前記少なくとも1つのブロックの前記テクスチャ特徴を前記ストレージ媒体中の特徴ベクトルに記憶することであって、前記特徴ベクトルが前記基準特徴ベクトルまたは前記ターゲット特徴ベクトルである、記憶することと
    を行うようにさらに指示される、請求項2または請求項3に記載のシステム。
  5. 前記少なくとも1つのプロセッサは、
    ID写真中のピクセルの所定のエリアのグレー・スケールを取得することであって、前記ID写真が基準ID写真または前記ターゲットID写真である、取得することと、
    前記ピクセルと前記ピクセルの1つまたは複数の近接するピクセルとに基づいて、1つまたは複数の2進値を決定することと、
    前記1つまたは複数の2進値に基づいて、前記ピクセルのテクスチャ情報を決定することと、
    前記ID写真のすべてのピクセルの前記テクスチャ情報に基づいて、前記ID写真のテクスチャ特徴を決定することと、
    前記少なくとも1つのブロックの前記テクスチャ特徴を前記ストレージ媒体中の特徴ベクトルに記憶することであって、前記特徴ベクトルが前記基準特徴ベクトルまたは前記ターゲット特徴ベクトルである、記憶することと
    を行うようにさらに指示される、請求項2〜4のいずれか一項に記載のシステム。
  6. 前記少なくとも1つのプロセッサが、
    トレーニングされた畳み込みニューラル・ネットワークによって顔特徴を決定する
    ようにさらに指示され、前記ターゲットID写真の前記所定のエリアがポートレート・エリアを含む、請求項2〜5のいずれか一項に記載のシステム。
  7. 前記少なくとも1つのプロセッサが、
    トレーニングされた畳み込みニューラル・ネットワークによって偽ID特徴を決定する
    ようにさらに指示され、
    トレーニングされた畳み込みニューラル・ネットワークが、少なくとも1つのコンピュータによって、複数の基準偽ID写真を用いてトレーニングされる、請求項2〜6のいずれか一項に記載のシステム。
  8. 前記少なくとも1つのプロセッサが、
    前記1つまたは複数の基準ID写真のデータを読み取るために、オンライン・プラットフォームのデータ・バスを介してメモリ中にアクセスすることと、
    前記1つまたは複数の基準ID写真の各々の基準特徴に基づいて、前記1つまたは複数の基準ID写真の各々についての前記基準特徴ベクトルを生成することと、
    前記基準特徴ベクトルに基づいてクラスタ数を生成することと、
    前記1つまたは複数の基準ID写真の各々について、読取り/書込み機器に、対応するID写真を符号化する前記クラスタ数を追加するように指示することと
    を含む、基準ID写真の前記データベースを確立することを行うようにさらに指示される、請求項2〜7のいずれか一項に記載のシステム。
  9. 要求を承認するための方法であって、
    少なくとも1つのコンピュータによって、ターゲット識別(ID)写真を受信するステップと、
    前記少なくとも1つのコンピュータによって、1つまたは複数の基準ID写真のデータベースにアクセスするステップと、
    前記少なくとも1つのコンピュータによって、前記ターゲットID写真上の所定のエリアと前記データベース中の1つまたは複数のターゲット基準ID写真の所定のエリアとの間の差分値を決定するステップと、
    前記差分値がしきい値よりも小さいと決定すると、前記少なくとも1つのコンピュータによって、前記ターゲットID写真が偽ID写真であることを示すための警告コードを生成するステップと
    を含む、方法。
  10. 1つまたは複数の基準ID写真の前記データベースが、1つまたは複数の構造化データを含み、前記1つまたは複数の構造化データの各々が、基準ID写真の前記所定のエリアに関連付けられた基準特徴ベクトルを符号化し、
    前記差分値を決定する前記ステップが、
    前記ターゲットID写真上の前記所定のエリアの1つまたは複数の特徴に基づいて、ターゲット特徴ベクトルを決定するステップと、
    前記ターゲット特徴ベクトルを基準特徴ベクトルと比較することによって、前記差分値を決定するステップと
    を含む、請求項9に記載の方法。
  11. 前記少なくとも1つのコンピュータによって、ID写真を少なくとも1つのブロックに分割するステップであって、前記ID写真が基準ID写真または前記ターゲットID写真である、分割するステップと、
    前記少なくとも1つのコンピュータによって、各ブロック中の1つまたは複数のピクセルのグレー・スケールを決定するステップと、
    前記少なくとも1つのコンピュータによって、前記1つまたは複数のピクセルの前記グレー・スケールに基づいて、各ブロックのピクセル勾配を決定するステップと、
    前記少なくとも1つのコンピュータによって、各ブロックの前記ピクセル勾配に基づいて、前記ID写真のテクスチャ特徴を決定するステップと、
    前記少なくとも1つのコンピュータによって、前記少なくとも1つのブロックの前記テクスチャ特徴をストレージ媒体中の特徴ベクトルに記憶するステップであって、前記特徴ベクトルが前記基準特徴ベクトルまたは前記ターゲット特徴ベクトルである、記憶するステップと
    をさらに含む、請求項10に記載の方法。
  12. 前記少なくとも1つのコンピュータによって、ID写真中のピクセルの所定のエリアのグレー・スケールを取得するステップであって、前記ID写真が基準ID写真または前記ターゲットID写真である、取得するステップと、
    前記少なくとも1つのコンピュータによって、前記ピクセルと前記ピクセルの1つまたは複数の近接するピクセルとの間の1つまたは複数の2進値を決定するステップと、
    前記少なくとも1つのコンピュータによって、前記1つまたは複数の2進値に基づいて、前記ピクセルのテクスチャ情報を決定するステップと、
    前記少なくとも1つのコンピュータによって、前記ID写真のすべてのピクセルの前記テクスチャ情報に基づいて、前記ID写真のテクスチャ特徴を決定するステップと、
    前記少なくとも1つのコンピュータによって、前記少なくとも1つのブロックの前記テクスチャ特徴をストレージ媒体中の特徴ベクトルに記憶するステップであって、前記特徴ベクトルが前記基準特徴ベクトルまたは前記ターゲット特徴ベクトルである、記憶するステップと
    をさらに含む、請求項10または請求項11に記載の方法。
  13. 前記少なくとも1つのコンピュータによって、トレーニングされた畳み込みニューラル・ネットワークによって顔特徴を決定するステップ
    をさらに含み、前記ターゲットID写真の前記所定のエリアがポートレート・エリアを含む、請求項10〜12のいずれか一項に記載の方法。
  14. 前記少なくとも1つのコンピュータによって、トレーニングされた畳み込みニューラル・ネットワークによって偽ID特徴を決定するステップ
    をさらに含み、
    トレーニングされた畳み込みニューラル・ネットワークが、前記少なくとも1つのコンピュータによって、複数の基準偽ID写真を用いてトレーニングされる、請求項10〜13のいずれか一項に記載の方法。
  15. ターゲットID写真の真正性を検証するための命令の少なくとも1つのセットを備える、非一時的コンピュータ可読媒体であって、コンピュータ・サーバの少なくとも1つのプロセッサによって実行されたとき、前記命令の少なくとも1つのセットは、前記少なくとも1つのプロセッサに、
    ターゲット識別(ID)写真を受信することと、
    1つまたは複数の基準ID写真のデータベースにアクセスすることと、
    前記ターゲットID写真上の所定のエリアと前記データベース中の1つまたは複数のターゲット基準ID写真の所定のエリアとの間の差分値を決定することと、
    前記差分値がしきい値よりも小さいと決定すると、前記ターゲットID写真が偽ID写真であることを示すための警告コードを生成することと
    の行為を実施するように指示する、非一時的コンピュータ可読媒体。
JP2018568402A 2017-06-30 2017-06-30 Id写真の真正性を検証するためのシステムおよび方法 Active JP6774137B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2017/091300 WO2019000445A1 (en) 2017-06-30 2017-06-30 SYSTEMS AND METHODS FOR VERIFYING THE AUTHENTICITY OF AN IDENTIFICATION PHOTO

Publications (2)

Publication Number Publication Date
JP2019536120A JP2019536120A (ja) 2019-12-12
JP6774137B2 true JP6774137B2 (ja) 2020-10-21

Family

ID=64742777

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018568402A Active JP6774137B2 (ja) 2017-06-30 2017-06-30 Id写真の真正性を検証するためのシステムおよび方法

Country Status (8)

Country Link
US (1) US11003895B2 (ja)
EP (1) EP3510524A4 (ja)
JP (1) JP6774137B2 (ja)
CN (1) CN109429519A (ja)
AU (1) AU2017421316B2 (ja)
CA (1) CA3034688C (ja)
SG (1) SG11201811691RA (ja)
WO (1) WO2019000445A1 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11074434B2 (en) * 2018-04-27 2021-07-27 Microsoft Technology Licensing, Llc Detection of near-duplicate images in profiles for detection of fake-profile accounts
CN110245616B (zh) * 2019-06-17 2023-04-18 深圳市安络科技有限公司 一种虚假通缉令预警方法及装置
CN110705350B (zh) * 2019-08-27 2020-08-25 阿里巴巴集团控股有限公司 证件识别方法及装置
US10974537B2 (en) 2019-08-27 2021-04-13 Advanced New Technologies Co., Ltd. Method and apparatus for certificate identification
WO2021038298A2 (en) 2019-08-29 2021-03-04 PXL Vision AG Id verification with a mobile device
CN110445937B (zh) * 2019-09-16 2021-09-21 Oppo(重庆)智能科技有限公司 事件提醒方法及相关产品
CN110689063B (zh) * 2019-09-18 2023-07-25 平安科技(深圳)有限公司 一种基于神经网络的证件识别的训练方法及装置
CN110738204B (zh) * 2019-09-18 2023-07-25 平安科技(深圳)有限公司 一种证件区域定位的方法及装置
CN111127398B (zh) * 2019-11-25 2023-09-26 深圳前海微众银行股份有限公司 证件照片复制的检测方法、装置、终端设备及存储介质
SG10202000965YA (en) * 2020-02-03 2020-03-30 Alipay Labs Singapore Pte Ltd Authentication System And Method
KR102125379B1 (ko) * 2020-02-14 2020-06-22 주식회사 카카오뱅크 딥러닝 기반의 신분증 진위판단장치 및 신분증 진위판단방법
CN113269187A (zh) 2020-07-14 2021-08-17 支付宝实验室(新加坡)有限公司 用于检测照片身份证件中照片替换的方法、系统和装置
KR102480503B1 (ko) * 2020-09-16 2022-12-22 중소기업은행 신분증 이미지의 검증을 위한 서비스 제공 장치 및 방법
CN112215225B (zh) * 2020-10-22 2024-03-15 北京通付盾人工智能技术有限公司 一种基于计算机视觉技术的kyc证件核验方法
CN112562153B (zh) * 2020-11-04 2023-05-02 重庆恢恢信息技术有限公司 一种基于智能云平台的工地行为人员优化方法
CN113052836A (zh) * 2021-04-21 2021-06-29 深圳壹账通智能科技有限公司 电子身份照片检测方法、装置、电子设备及存储介质
US11900519B2 (en) * 2021-11-17 2024-02-13 Adobe Inc. Disentangling latent representations for image reenactment
US20230222826A1 (en) * 2022-01-11 2023-07-13 Daon Enterprises Limited Methods and systems for determining authenticity of a document
CN117373100B (zh) * 2023-12-08 2024-02-23 成都乐超人科技有限公司 基于差分量化局部二值模式的人脸识别方法及系统

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT1074184B (it) 1976-11-03 1985-04-17 Mario Marco De Gasperi Sistema per la realizzazione e la verifica della autenticita' di documenti di identificazione
JP2000194806A (ja) 1998-12-25 2000-07-14 Nippon Telegr & Teleph Corp <Ntt> Icカ―ド照合システム、icカ―ド照合方法、icカ―ドおよびリ―ダライタ
JP4734980B2 (ja) * 2005-03-15 2011-07-27 オムロン株式会社 顔認証装置およびその制御方法、顔認証装置を備えた電子機器、顔認証装置制御プログラム、ならびに該プログラムを記録した記録媒体
US7783085B2 (en) * 2006-05-10 2010-08-24 Aol Inc. Using relevance feedback in face recognition
JP2008102907A (ja) 2006-09-19 2008-05-01 Sharp Corp 画像処理方法、画像処理装置、原稿読取装置、画像形成装置、コンピュータプログラム及び記録媒体
US9721148B2 (en) * 2007-12-31 2017-08-01 Applied Recognition Inc. Face detection and recognition
KR20100073191A (ko) * 2008-12-22 2010-07-01 한국전자통신연구원 거리 정보를 이용한 위조 얼굴 검출 방법 및 장치
US20120250984A1 (en) * 2010-12-01 2012-10-04 The Trustees Of The University Of Pennsylvania Image segmentation for distributed target tracking and scene analysis
US9183429B2 (en) * 2012-08-15 2015-11-10 Qualcomm Incorporated Method and apparatus for facial recognition
CN103914676B (zh) * 2012-12-30 2017-08-25 杭州朗和科技有限公司 一种在人脸识别中使用的方法和装置
DE102013100635A1 (de) * 2013-01-22 2014-07-24 IDnow GmbH Benutzer-Identifikation
CN103207898B (zh) 2013-03-19 2016-08-03 天格科技(杭州)有限公司 一种基于局部敏感哈希的相似人脸快速检索方法
JP2015047759A (ja) 2013-08-30 2015-03-16 株式会社東芝 情報記録媒体、及び情報記録媒体の真偽判定方法
US10320807B2 (en) * 2014-02-25 2019-06-11 Sal Khan Systems and methods relating to the authenticity and verification of photographic identity documents
CN103914686B (zh) * 2014-03-11 2018-01-19 深圳辰通智能股份有限公司 一种基于证件照与采集照的人脸比对认证方法及系统
JP6159489B2 (ja) * 2014-04-11 2017-07-05 ペキン センスタイム テクノロジー ディベロップメント カンパニー リミテッド 顔認証方法およびシステム
US9384385B2 (en) * 2014-11-06 2016-07-05 Intel Corporation Face recognition using gradient based feature analysis
CN104573647B (zh) * 2014-12-30 2018-08-03 恒鸿达科技有限公司 一种非法身份证件的识别方法及装置
US9552510B2 (en) * 2015-03-18 2017-01-24 Adobe Systems Incorporated Facial expression capture for character animation
CN106203242B (zh) * 2015-05-07 2019-12-24 阿里巴巴集团控股有限公司 一种相似图像识别方法及设备
CN104899280B (zh) 2015-05-29 2017-12-29 山西大学 基于彩色直方图和nsct的模糊相关异步图像检索方法
CN105528549A (zh) 2015-12-09 2016-04-27 上海斐讯数据通信技术有限公司 基于人物识别的相片加/解密方法及系统、移动终端
CN105678250B (zh) * 2015-12-31 2019-10-11 北京迈格威科技有限公司 视频中的人脸识别方法和装置
CN105912611B (zh) 2016-04-05 2019-04-26 中国科学技术大学 一种基于cnn的快速图像检索方法
CN105956572A (zh) * 2016-05-15 2016-09-21 北京工业大学 一种基于卷积神经网络的活体人脸检测方法
CN106056562B (zh) * 2016-05-19 2019-05-28 京东方科技集团股份有限公司 一种人脸图像处理方法、装置及电子设备
US10217179B2 (en) * 2016-10-17 2019-02-26 Facebook, Inc. System and method for classification and authentication of identification documents using a machine learning based convolutional neural network
CN106778636A (zh) * 2016-12-22 2017-05-31 东软集团股份有限公司 身份验证方法及装置
CN106650693B (zh) * 2016-12-30 2020-07-03 河北三川科技有限公司 一种用于人脸比对的多特征融合识别算法
US10311288B1 (en) * 2017-03-24 2019-06-04 Stripe, Inc. Determining identity of a person in a digital image

Also Published As

Publication number Publication date
CA3034688A1 (en) 2019-01-03
AU2017421316A1 (en) 2019-01-24
CA3034688C (en) 2021-11-30
US11003895B2 (en) 2021-05-11
AU2017421316B2 (en) 2020-12-17
CN109429519A (zh) 2019-03-05
US20190180086A1 (en) 2019-06-13
EP3510524A1 (en) 2019-07-17
JP2019536120A (ja) 2019-12-12
EP3510524A4 (en) 2019-08-21
SG11201811691RA (en) 2019-01-30
WO2019000445A1 (en) 2019-01-03

Similar Documents

Publication Publication Date Title
JP6774137B2 (ja) Id写真の真正性を検証するためのシステムおよび方法
JP6594329B2 (ja) 顔表現のためのシステムおよび方法
CN109492627B (zh) 一种基于全卷积网络的深度模型的场景文本擦除方法
CN112084917B (zh) 一种活体检测方法及装置
WO2022022154A1 (zh) 脸部图像处理方法、装置、设备及存储介质
CN109948397A (zh) 一种人脸图像校正方法、系统及终端设备
CN112419326B (zh) 图像分割数据处理方法、装置、设备及存储介质
CN112507934A (zh) 活体检测方法、装置、电子设备及存储介质
US20230326173A1 (en) Image processing method and apparatus, and computer-readable storage medium
CN107967461A (zh) Svm 差分模型训练及人脸验证方法、装置、终端及存储介质
CN113128588A (zh) 模型训练方法、装置、计算机设备及计算机存储介质
CN114723636A (zh) 基于多特征融合的模型生成方法、装置、设备及存储介质
CN112651333A (zh) 静默活体检测方法、装置、终端设备和存储介质
Taşyürek ODRP: a new approach for spatial street sign detection from EXIF using deep learning-based object detection, distance estimation, rotation and projection system
CN110633733A (zh) 图像智能匹配方法、装置及计算机可读存储介质
CN108734712B (zh) 背景分割的方法、装置及计算机存储介质
CN112348008A (zh) 证件信息的识别方法、装置、终端设备及存储介质
CN112464924A (zh) 一种构建训练集的方法及装置
CN115661472A (zh) 图像查重方法、装置、计算机设备及存储介质
CN112667864B (zh) 图对齐方法、装置、电子设备及存储介质
CN113011132B (zh) 竖排文字识别方法、装置、计算机设备和存储介质
Zhao et al. Large-scale Landsat image classification based on deep learning methods
CN114118412A (zh) 证件识别模型训练及证件识别的方法、系统、设备及介质
CN113792671A (zh) 人脸合成图像的检测方法、装置、电子设备及介质
CN115116085A (zh) 针对目标属性的图片识别方法、装置、设备及存储介质

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190426

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190426

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200521

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200714

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200812

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200901

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200928

R150 Certificate of patent or registration of utility model

Ref document number: 6774137

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250