JP6374986B2 - 顔認識方法、装置及び端末 - Google Patents

顔認識方法、装置及び端末 Download PDF

Info

Publication number
JP6374986B2
JP6374986B2 JP2016567408A JP2016567408A JP6374986B2 JP 6374986 B2 JP6374986 B2 JP 6374986B2 JP 2016567408 A JP2016567408 A JP 2016567408A JP 2016567408 A JP2016567408 A JP 2016567408A JP 6374986 B2 JP6374986 B2 JP 6374986B2
Authority
JP
Japan
Prior art keywords
image
sub
face
processed
human face
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016567408A
Other languages
English (en)
Other versions
JP2017534090A (ja
Inventor
志▲軍▼ ▲陳▼
志▲軍▼ ▲陳▼
平仄 汪
平仄 汪
秋平 秦
秋平 秦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiaomi Inc
Original Assignee
Xiaomi Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiaomi Inc filed Critical Xiaomi Inc
Publication of JP2017534090A publication Critical patent/JP2017534090A/ja
Application granted granted Critical
Publication of JP6374986B2 publication Critical patent/JP6374986B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/165Detection; Localisation; Normalisation using facial parts and geometric relationships
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/162Detection; Localisation; Normalisation using pixel segmentation or colour matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Geometry (AREA)
  • Image Analysis (AREA)
  • Collating Specific Patterns (AREA)
  • Studio Devices (AREA)
  • Image Processing (AREA)

Description

[関連出願に対する相互参照]
本願は、2015年8月21日に中華人民共和国国家知識産権局に出願された中国特許出願第CN 201510520457.X号に基づき、かつ該出願による優先権を主張するものであり、該出願の全容は参照により本明細書に組み込まれる。
本開示は一般に、画像処理技術の分野に関し、より詳細には、顔認識方法、顔認識装置及び端末に関する。
近年、顔認識技術は、セキュリティアクセス制御、視覚的検出、コンテンツに基づく画像検索、及び新世代の人間−機械インターフェースの分野で益々高い応用価値を有して開発されている。その結果、画像内で人間の顔をどのように認識するかは、研究者により益々注目されている。
関連技術において、人間の顔は、顔の特徴として顔器官(眼、鼻等)の比を得る等、顔の特徴に従って認識され得る。しかしながら、人間の顔が画像の縁領域内に位置する場合、該画像が人間の顔の全体を含んでいないため、顔の器官の間の比と同様の比を有するプロファイルをそのような画像内に見出すことができず、従って顔分類器は、人間の顔を認識することができない。
本開示は、実施形態において、顔認識方法及び顔認識装置を提供する。
本開示の第1の実施形態の第1の態様によれば、顔認識方法が提供され、該方法は:
元の画像を取得することと、
元の画像の縁領域に特定数値ピクセルを付加して、付加された全ピクセルは、同一のピクセル値を有し、処理されるべき画像を取得することと、
前記処理されるべき画像上で顔認識を行うことと、
前記顔認識の結果に従って、前記元の画像内の人間の顔を決定することと、を含み、
前記元の画像の前記縁領域に前記特定数値ピクセルを付加することは、
前記元の画像の前記縁領域内の各ピクセルのピクセル値を取得することと、
前記縁領域内の各ピクセルの前記ピクセル値と、顔色ピクセルに関する事前設定ピクセル値とに従って、前記顔色ピクセルを有する縁領域を決定することと、
前記顔色ピクセルを有する前記縁領域のみに前記特定数値ピクセルを付加することと、を含む。
第1の態様と組み合わせて、第1の態様の第の可能な実施において、処理されるべき画像上で顔認識を行うことは:
処理されるべき画像の複数のサブ画像を取得することと;
事前に訓練されたアダプティブブースト顔分類器を使用して、各サブ画像が人間の顔のサブ画像であるか否かを判断することと、を含む。
第1の態様の第の可能な実施と組み合わせて、第1の態様の第の可能な実施において、処理されるべき画像の複数のサブ画像を取得することは:
スライディングウィンドウを使用して、処理されるべき画像を複数回トラバースし、各トラバースの全位置におけるスライディングウィンドウによりカバーされる画像領域を、処理されるべき画像の1つのサブ画像として画定することであって、任意の2つのトラバースにおいて使用されるスライディングウィンドウは、異なるサイズのものであること;
又は
処理されるべき画像を複数回拡大又は縮小して、複数の処理されるべき画像を異なるサイズで取得し、1つのサイズの処理されるべき画像を、特定のサイズの複数の画像領域へとトリミングし、この特定のサイズの各画像領域をサブ画像として画定すること、を含む。
第1の態様の第の可能な実施と組み合わせて、第1の態様の第の可能な実施において、事前に訓練されたアダプティブブースト顔分類器は、分類器の多段のカスケードとして形成されており、事前に訓練されたアダプティブブースト顔分類器を使用して、各サブ画像が人間の顔のサブ画像であるか否かを判断することは:
事前に訓練されたアダプティブブースト顔分類器において、分類器の第1の段階から開始して分類器の最終段階まで、段階的方法によって、サブ画像が人間の顔のサブ画像であるか否かを段階において判断することと;
分類器の全段階から出力された結果の各々が、サブ画像が人間の顔のサブ画像であることを示す場合、サブ画像が人間の顔のサブ画像であることを決定することと、を含む。
第1の態様の第の可能な実施と組み合わせて、第1の態様の第の可能な実施において、顔認識の結果に従って、元の画像内の人間の顔を決定することは:
人間の顔のサブ画像であるサブ画像が、処理されるべき画像の複数のサブ画像内に存在する場合、人間の顔のサブ画像であるサブ画像の、元の画像内での位置を決定することと;
人間の顔のサブ画像であるサブ画像の、元の画像内での位置に従って、元の画像内の人間の顔を決定することと、を含む。
本開示の実施形態の第2の態様によれば、顔認識装置が提供され、該装置は:
元の画像を取得するように構成された取得モジュールと;
モジュールにより取得された元の画像の縁領域に特定数値ピクセルを付加して、付加された全ピクセルは、同一のピクセル値を有し、処理されるべき画像を取得するように構成された付加モジュールと;
付加モジュールにより取得された処理されるべき画像上で、顔認識を行うように構成された認識モジュールと;
認識モジュールからの顔認識の結果に従って、元の画像内の人間の顔を決定するように構成された決定モジュールと、を備え、
前記付加モジュールは、
前記元の画像の前記縁領域内の各ピクセルのピクセル値を取得するように構成された第1の取得ユニットと;
前記第1の取得ユニットによって取得された前記縁領域内の各ピクセルの前記ピクセル値と、顔色ピクセルに関する事前設定ピクセル値とに従って、前記顔色ピクセルを有する縁領域を決定するように構成された第1の決定ユニットと;
前記第1の決定ユニットによって決定された前記顔色ピクセルを有する前記縁領域のみに、前記特定数値ピクセルを付加するように構成された付加ユニットと、を備える。
第2の態様と組み合わせて、第2の態様の第の可能な実施において、認識モジュールは:
処理されるべき画像の複数のサブ画像を取得するように構成された第2の取得ユニットと;
事前に訓練されたアダプティブブースト顔分類器を使用して、第2の取得ユニットによって取得された各サブ画像が人間の顔のサブ画像であるか否かを判断するように構成された判断ユニットと、を備える。
第2の態様の第の可能な実施と組み合わせて、第2の態様の第の可能な実施において、第2の取得ユニットは:
スライディングウィンドウを使用して、処理されるべき画像を複数回トラバースし、各トラバースの全位置におけるスライディングウィンドウによりカバーされる画像領域を、処理されるべき画像の1つのサブ画像として画定し、ここで任意の2つのトラバースにおいて使用されるスライディングウィンドウは、異なるサイズのものである;又は
処理されるべき画像を複数回拡大又は縮小して、複数の処理されるべき画像を異なるサイズで取得し、1つのサイズの処理されるべき画像を、特定のサイズの複数の画像領域へとトリミングし、この特定のサイズの各画像領域をサブ画像として画定する、ように構成されている。
第2の態様の第の可能な実施と組み合わせて、第2の態様の第の可能な実施において、事前に訓練されたアダプティブブースト顔分類器は、多段分類器のカスケードとして形成されており、判断ユニットは:
事前に訓練されたアダプティブブースト顔分類器において、分類器の第1の段階から開始して分類器の最終段階まで、段階的方法によって、サブ画像が人間の顔のサブ画像であるか否かを段階において判断し;
分類器の全段階から出力された結果の各々が、サブ画像が人間の顔のサブ画像であることを示す場合、サブ画像が人間の顔のサブ画像であることを決定する、ように構成されている。
第2の態様の第の可能な実施と組み合わせて、第2の態様の第の可能な実施において、決定モジュールは:
人間の顔のサブ画像であるサブ画像が、処理されるべき画像の複数のサブ画像内に存在する場合、人間の顔のサブ画像であるサブ画像の、元の画像内での位置を決定するように構成された第2の決定ユニットと;
人間の顔のサブ画像であるサブ画像の、元の画像内での位置に従って、元の画像内の人間の顔を決定するように構成された第3の決定ユニットと、を備える。
本開示の実施形態の第3の態様によれば、端末が提供され、該端末は:
プロセッサと;
プロセッサにより実行可能な命令を記憶するためのメモリと;を備え、
プロセッサは:
元の画像を取得し;
元の画像の縁領域に特定数値ピクセルを付加して、処理されるべき画像を取得し;
前記処理されるべき画像上で顔認識を行い;
前記顔認識の結果に従って、元の画像内の人間の顔を決定する、ように構成されている。
本開示の実施形態で提供される解決法は、以下の有益な効果を有し得る。
元の画像の縁領域に特定数値ピクセルを付加することによって、処理されるべき画像を取得した後、処理されるべき画像上で顔認識を行って、元の画像内の人間の顔を決定する。顔認識中、元の画像の縁領域に、元の画像の拡張と等価な特定数値ピクセルが付加され、それによって、人間の顔が元の画像の縁領域内に位置する場合、人間の顔を含むサブ画像が拡張画像内に見出され得るため、元の画像の縁領域内に位置する人間の顔を確実に認識することができ、更に、顔認識の正確性が向上する。
前述の一般的な記載及び以下の詳細な記載の両方は、単なる例示及び説明であり、本発明を限定するものではないことを理解するべきである。
本明細書に組み込まれ、かつその一部を構成する、付随する図面は、本発明に一致した実施形態を図解し、また明細書の記載と共に本発明の原理を説明する役割を果たす。
説明的な実施形態による顔認識方法を示すフローチャート
説明的な実施形態による顔認識方法を示すフローチャート
説明的な実施形態による元の画像の概略図
説明的な実施形態による処理されるべき画像の概略図
説明的な実施形態による、異なるサイズのスライディングウィンドウを使用して、処理されるべき画像を横切る概略図
説明的な実施形態による、異なるサイズの処理されるべき画像の概略図
説明的な実施形態によるAdaboost顔分類器の概略図
説明的な実施形態による顔認識装置のブロック図
説明的な実施形態による付加モジュールのブロック図
説明的な実施形態による認識モジュールのブロック図
説明的な実施形態による決定モジュールのブロック図
説明的な実施形態による端末のブロック図
本開示の実施形態を詳細に参照する。特に特定又は限定されない限り、同一又は同様の機能を有する同一又は同様の要素は、明細書全体を通して同様の参照番号で示される。本開示の例示的な実施形態及びその説明は、本開示と一致した全実施を表すものと解釈されるべきではない。むしろ、それらは、添付の特許請求の範囲に記載されるように、本開示のいくつかの態様と一致した装置及び方法の例である。
図1は、説明的な実施形態による顔認識方法を示すフローチャートであり、顔認識方法は、端末において適用される。図1に示されるように、本開示の実施形態にて提供される顔認識方法は、以下のステップを含む。
ステップS101において、元の画像を取得する。
ステップS102において、元の画像の縁領域に特定数値ピクセルを付加して、処理されるべき画像を取得する。
ステップS103において、処理されるべき画像上で顔認識を行う。
ステップS104において、顔認識の結果に従って、元の画像内の人間の顔を決定する。
本開示の実施形態により提供される方法を用いて、元の画像の縁領域に特定数値ピクセルを付加することによって、処理されるべき画像を取得した後、処理されるべき画像上で顔認識を行って、元の画像内の人間の顔を決定する。顔認識中、元の画像の縁領域に、元の画像の拡張と等価な特定数値ピクセルが付加され、それによって、人間の顔が元の画像の縁領域内に位置する場合、人間の顔を含むサブ画像が拡張画像内に見出され得るため、元の画像の縁領域内に位置する人間の顔を確実に認識することができ、更に、顔認識の正確性が向上する。
別の実施形態では、元の画像の縁領域に特定数値ピクセルを付加することは:
元の画像の縁領域内の各ピクセルのピクセル値を取得することと;
縁領域内の各ピクセルのピクセル値と、顔色ピクセルに関する事前設定ピクセル値とに従って、顔色ピクセルを有する縁領域を決定することと;
顔色ピクセルを有する縁領域に特定数値ピクセルを付加することと、を含む。
別の実施形態では、処理されるべき画像上で顔認識を行うことは:
処理されるべき画像の複数のサブ画像を取得することと;
事前に訓練されたアダプティブブースト顔分類器を使用して、各サブ画像が人間の顔のサブ画像であるか否かを判断することと、を含む。
別の実施形態では、処理されるべき画像の複数のサブ画像を取得することは:
スライディングウィンドウを使用して、処理されるべき画像を複数回横断(トラバース)し、各横断の全位置おけるスライディングウィンドウによりカバーされる画像領域を、処理されるべき画像の1つのサブ画像として画定することであって、ここで、任意の2つの横断において使用されるスライディングウィンドウは、異なるサイズのものであること;又は
処理されるべき画像を複数回拡大又は縮小して、複数の処理されるべき画像を異なるサイズで取得し、1つのサイズの処理されるべき画像を、特定のサイズの複数の画像領域へとトリミングし、この特定のサイズの各画像領域をサブ画像として画定すること、を含む。
別の実施形態では、事前に訓練されたアダプティブブースト顔分類器は、カスケードにおける多段分類器のカスケードとして形成され;事前に訓練されたアダプティブブースト顔分類器を使用して、各サブ画像が人間の顔のサブ画像であるか否かを判断することは:
事前に訓練されたアダプティブブースト顔分類器において、分類器の第1の段階から開始して分類器の最終段階まで、段階的方法によって、サブ画像が人間の顔のサブ画像であるか否かを段階において判断することと;
分類器の全段階から出力された結果の各々が、サブ画像が人間の顔のサブ画像であることを示す場合、サブ画像が人間の顔のサブ画像であることを決定することと、を含む。
別の実施形態では、顔認識の結果に従って、元の画像内の人間の顔を決定することは:
人間の顔のサブ画像であるサブ画像が、処理されるべき画像の複数のサブ画像内に存在する場合、人間の顔のサブ画像であるサブ画像の、元の画像内での位置を決定することと;
人間の顔のサブ画像であるサブ画像の、元の画像内での位置に従って、元の画像内の人間の顔を決定することと、を含む。
本開示の代替的な実施形態は、上記の代替的な技術的解決法を任意のやり方で組み合わせることにより形成することができ、それらは本明細書では詳述されない。
図2は、説明的な実施形態による顔認識方法を示すフローチャートであり、顔認識方法は、端末において適用される。図2に示されるように、本開示の実施形態により提供される顔認識方法は、以下のステップを含む。
ステップ201において、元の画像を取得する。
元の画像は、その上で顔認識を行う必要がある画像である。本開示の実施形態では、元の画像が人間の顔を含んでいるか否かを認識し、元の画像が人間の顔を含んでいる場合、元の画像のどの領域が、該画像内に位置する人間の顔であるかを認識する必要がある。
元の画像を取得するには、多数の方法が存在する。例えば、任意の記憶デバイスから読み取った画像を、元の画像として使用することができる。又は、インターネットからダウンロードした画像を、元の画像として使用することができる。また、元の画像は、画像をスキャナで走査することによって取得することができる。更に、カメラで撮影した画像を、元の画像として使用することができる。
ステップS202において、元の画像の縁領域に特定数値ピクセルを付加して、処理されるべき画像を取得する。
例えば、元の画像の縁領域は、元の画像の各縁の4つの最も外側におけるピクセルを含む。図3に示されるように、元の画像の概略図が示されている。図3の人間の顔は、元の画像の縁領域内に位置している。人間の顔が元の画像の縁領域内に位置している場合、この人間の顔は、人間の顔を認識する際に、認識されない場合がある。この状況を回避するために、本開示の実施形態では、人間の顔を認識する前に、元の画像の縁領域に特定数値ピクセルを付加して、処理されるべき画像を取得する。図4に示されるように、処理されるべき画像が示されている。図4の処理されるべき画像は、図3に示した元の画像の4つの縁領域にピクセルを付加することにより取得される。図4の斜線を有する領域は、付加されたピクセルを表す。
特定数値は、本開示の実施形態において限定されず、特定の実施において必要に応じて設定されてもよい。例えば、2ピクセル、5ピクセル又は10ピクセルが、最も外側における各ピクセルの周辺に付加されてもよい。
更に、元の画像の縁領域に付加された全ピクセルは、同一のピクセル値を有してもよく、即ち全ピクセルは同一の色にある。この同一の色は、白色、黒色、又は他の色であってもよく、本開示の実施形態において限定されない。同一の色におけるピクセルが同一のピクセル値を有するため、付加されたピクセルが同一の色を有するという状況下では、処理されるべき画像に関する顔認識中、処理されるべき画像の所定の領域内のピクセルが同一のピクセル値を有する場合、これらのピクセルは、付加されたピクセルであると決定され得、従って過分な認識手順を実行する必要がないため、認識の速度が高い。
例えば、元の画像の縁領域に特定数値ピクセルを付加する際、特定数値ピクセルは、元の画像の4つの縁領域の全部に付加され得る。勿論、各縁領域に付加される特定数値ピクセルの量は、区別されてもよい。例えば、左領域に付加される特定数値ピクセルの量は、右領域に付加される特定数値ピクセルの量と異なっていてもよい。しかしながら、ピクセルを元の画像の縁領域に付加した後、画像の認識のための計算は増大し得る。画像の認識のための計算を最小限にするために、元の画像の縁領域にピクセルを付加する前に、その内部に人間の顔が提示され得る、ピクセルが付加される縁領域を検出する。
可能な実施において、顔色ピクセルに関するピクセル値は、一般に、特定の値又は所定の値の範囲内であるため、縁領域内の各ピクセルのピクセル値が、顔色ピクセルに関するピクセル値であるか否かを検出することによって、縁領域内に人間の顔が存在するか否かを決定することができる。この部分のコンテンツを組み合わせて、元の画像の縁領域に特定数値ピクセルを付加するステップは、以下のステップS2021〜S2023を含むが、これらに限定されるものではない。
ステップS2021において、元の画像の縁領域内の各ピクセルのピクセル値を取得する。
例えば、縁領域内の各ピクセルのピクセル値は、各ピクセルのRGB値を決定することにより取得することができる。各ピクセルのRGB値の決定は、カラーセンサによって実施され得るが、これに限定されるものではない。
ステップS2022において、縁領域内の各ピクセルのピクセル値と、顔色ピクセルに関する事前設定ピクセル値とに従って、顔色ピクセルを有する縁領域を決定する。
可能な実施において、縁領域内の各ピクセルのピクセル値を、顔色ピクセルに関する事前設定ピクセルと比較した後、該比較に従って顔色ピクセルを有する縁領域を決定し得る。
例えば、縁領域内の任意のピクセルのピクセル値を、顔色ピクセルに関する事前設定ピクセルと比較する際、このピクセルのピクセル値と、顔色ピクセルに関する事前設定ピクセル値との間の相違が第1の事前設定閾値を超えない場合、このピクセルは顔色ピクセルとして決定され得る。第1の事前設定閾値の特定数値は、本開示の実施形態において限定されるものではない。しかしながら、ピクセルが顔色ピクセルであるか否かを正確に認識するために、第1の事前設定閾値は、小さい値に設定され得る。
例えば、各縁領域に関して、比較に従って顔色ピクセルを有する縁領域を決定する際、顔色ピクセルが縁領域内に存在するか否かは、縁領域内の全ピクセルに対する顔色ピクセルの比に従って決定され得る。この比が第2の事前設定閾値よりも大きい場合、顔色ピクセルが縁領域内に存在することが決定され、そうでない場合、顔色ピクセルは縁領域内に存在しないと決定される。第2の事前設定閾値の特定数値は、必要に応じて設定され得る。
ステップS2023において、顔色ピクセルを有する縁領域に特定数値ピクセルを付加する。
換言すれば、元の画像の縁領域にピクセルを付加する際、特定数値ピクセルは、顔色ピクセルを有する縁領域のみに付加され得る。例えば、顔色ピクセルが元の画像の上縁領域内に存在する場合、特定数値ピクセルは上縁領域のみに付加されて、画像認識のための計算を低減してもよい。
ステップS203において、処理されるべき画像の複数のサブ画像を取得し、事前に訓練されたアダプティブブースト顔分類器を使用して、各サブ画像が人間の顔のサブ画像であるか否かを判断する。
このステップは、処理されるべき画像上で顔認識を行うための特有の実施である。本開示の実施形態では、顔認識は、まず処理されるべき画像の複数のサブ画像を取得し、次いで各サブ画像が人間の顔のサブ画像であるか否かを判断し得る。
処理されるべき画像の複数のサブ画像の取得は、以下の2つの方法を含むが、これらに限定されるものではない。
第1の方法:スライディングウィンドウを使用して、処理されるべき画像を複数回横断(トラバース)し、各横断の全位置おけるスライディングウィンドウによりカバーされる画像領域を、処理されるべき画像の1つのサブ画像として画定する。ここで、任意の2つの横断において使用されるスライディングウィンドウは、異なるサイズのものである。
換言すれば、本開示の実施形態では、処理されるべき画像は、各々、異なるサイズのスライディングウィンドウによって横断される。処理されるべき画像の横断の各回に使用されるスライディングウィンドウのサイズは、様々であってもよい。例えば、処理されるべき画像の横断の所定の回に関して、スライディングウィンドウのサイズは3*3であり;一方、処理されるべき画像の次回の横断に関して、スライディングウィンドウのサイズは5*5等である。図5に示されるように、異なるサイズのスライディングウィンドウを使用して横断される、処理されるべき画像の概略図が示されている。図5の太線内の各正方形は、1つのスライディングウィンドウを表している。
任意のサイズのスライディングウィンドウを使用して、処理されるべき画像を横断(トラバース)する際、スライディングウィンドウは、処理されるべき画像の水平方向(X方向)及び垂直方向(Y方向)にて特定のステップサイズで、処理されるべき画像を横断する。スライディングウィンドウがX方向又はY方向に1ステップサイズ移動するとき、該スライディングウィンドウは、処理されるべき画像の新たな位置へ移動する。各位置は画像範囲を画定し、該画像範囲は、処理されるべき画像のサブ画像である。特定のステップサイズは、1ピクセル、2ピクセル等であってもよい。
第2の方法:処理されるべき画像を多数回拡大又は縮小して、複数の処理されるべき画像を異なるサイズで取得し、任意のサイズの処理されるべき画像を、特定のサイズの複数の画像領域へとトリミングし、各画像領域をサブ画像として画定する。
処理されるべき画像拡大又は縮小するたびに、1つの所定のサイズの処理されるべき画像が取得され得る。1つのサイズの処理されるべき画像に関して、そのような1つのサイズの処理されるべき画像は、複数の画像領域へとトリミングされ得る。各画像領域は、3*3(ピクセル*ピクセル)、5*5等、特定のサイズのものである。
図6に示されるように、異なるサイズの、処理されるべき画像の概略図が示されている。図6の図(a)〜(c)は、各々、所定のサイズの処理されるべき画像を示す。図6の図(c)に示されるように、所定のサイズの処理されるべき画像のトリミングの概略図が示されている。図6の図(c)に示されるように、太線で取り囲まれている各矩形は、所定のサイズの処理されるべき画像のサブ画像である。
更に、各サブ画像が人間の顔のサブ画像であるか否かの判断は、事前に訓練された顔分類器によって実施されてもよい。事前に訓練された顔分類器のタイプは、様々であってもよい。例えば、事前に訓練された顔分類器は、サポートベクターマシン顔分類器、ニューラルネットワーク顔分類器又はアダプティブブースト(Adaboost)顔分類器等であってもよい。記載の便宜上、本開示の実施形態では、Adaboost顔分類器である、事前に訓練された顔分類器を例として取り上げて、人間の顔を認識する連続的ステップを説明する。
可能な実施において、顔認識の正確性を向上させるために、本開示の実施形態では、Adaboost顔分類器は、多段分類器のカスケードとして形成される。Adaboost顔分類器における分類器の各段階は、サブ画像が人間の顔のサブ画像であるか否かを判断するように構成されている。分類器の各段階からの結果出力は、「0」又は「1」である。出力結果が「1」であることは、分類器の段階が、サブ画像が人間の顔のサブ画像であることを決定している。出力結果「0」は、分類器の段階が、サブ画像が人間の顔のサブ画像ではないことを決定している。
Adaboost顔分類器における分類器の各段階は、強分類器である。各強分類器は、複数の弱分類器を含む。Adaboost顔分類器における分類器の各段階の訓練は、分類器の段階に含まれる複数の弱分類器を訓練することにより実施され得る。分類器の段階からの結果出力は、分類器の段階に含まれる全弱分類器のデータ処理に従って決定される。Adaboost顔分類器の訓練方法と、分類器の各段階から結果出力を決定する方法とに関しては、Adaboost顔分類器に関する現存する内容が参照され、該内容は本開示の実施形態では詳述されない。
Adaboost顔分類器に含まれる分類器の段階の数は、本開示の実施形態において限定されない。より正確な認識を可能にするために、Adaboost顔分類器は、例えば分類器の5段階、分類器の8段階等、遙かにより多くの分類器の段階を含んでもよい。図7に示されるように、Adaboost顔分類器の概略図が示されている。図7の各円領域は、分類器の1段階を表している。
これに基づいて、任意のサブ画像に関して、事前に訓練されたアダプティブブースト顔分類器を使用して、各サブ画像が人間の顔のサブ画像であるか否かを判断する際、事前に訓練されたAdaboost顔分類器において、分類器の第1の段階から開始して分類器の最終段階まで、段階的方法によって、段階において訓練されて、サブ画像が人間の顔のサブ画像であるか否かを判断する。分類器の全段階からの結果出力の各々が、サブ画像が人間の顔のサブ画像であることを示す場合、サブ画像は人間の顔のサブ画像として決定される。分類器の任意の段階からの結果が、サブ画像が人間の顔のサブ画像ではないことを示す場合、サブ画像は人間の顔ではないサブ画像として決定される。
詳細には、任意のサブ画像に関して、サブ画像は、分類器の第1の段階からAdaboost顔分類器内に入力され、分類器の第1の段階がサブ画像が人間の顔のサブ画像であると決定した場合、サブ画像は分類器の第2の段階内に入力され、それによって分類器の第2の段階は、サブ画像が人間の顔のサブ画像であるか否かを判断し、これを分類器の最終段階まで行う。分類器の第1の段階が、サブ画像が人間の顔のサブ画像ではないと決定した場合、分類器の第1の段階は、認識のために次のサブ画像を取得する。
事前に訓練された顔分類器の作業原理に基づけば、人間の顔が元の画像の縁領域内に位置する場合、縁領域内に位置する人間の顔は、一般に認識できないことに留意するべきである。しかしながら、人間の顔は、遮蔽された場合、正確に認識されることができる。本開示の実施形態では、特定数値ピクセルが元の画像の縁領域に付加されるため、縁領域内に位置する人間の顔は、付加されたピクセルにより遮蔽されているのと等価であり、従って縁領域内に位置する人間の顔は、事前に訓練された顔分類器によって認識され、かくして縁領域内に位置する顔認識の正確性が向上し得る。
ステップS204において、顔認識の結果に従って、元の画像内の人間の顔を決定する。
各サブ画像が人間の顔のサブ画像であるか否かを認識した後、顔認識の結果に従って、人間の顔に属するサブ画像が決定され得る。しかしながら、どの領域が元の画像内の人間の顔内に位置するかを決定するために、人間の顔に属するサブ画像に従って、元の画像内の人間の顔を決定する必要がある。
例えば、顔認識の結果に従って、元の画像内の人間の顔を決定するステップは:人間の顔のサブ画像であるサブ画像が、処理されるべき画像の複数のサブ画像内に存在する場合、人間の顔のサブ画像であるサブ画像の、元の画像内での位置を決定し、次いで、人間の顔のサブ画像であるサブ画像の、元の画像内での位置に従って、元の画像内の人間の顔を決定することを含むが、これらに限定されるものではない。
可能な実施では、認識によって人間の顔のサブ画像であると示された任意のサブ画像に関して、元の画像内での位置を取得する際、サブ画像内の各ピクセルのピクセル値が抽出され、元の画像内の各ピクセルのピクセル値が抽出された後、サブ画像内の各ピクセルのピクセル値が、元の画像内の各ピクセルのピクセル値と比較される。元の画像の所定の一領域における各ピクセルのピクセル値が、サブ画像内の各ピクセルのピクセル値と等しい場合、サブ画像の位置は、元の画像内に位置付けられ得る。サブ画像を元の画像内に位置付けた後、元の画像内の人間の顔が決定され得る。
更に、人間の顔のサブ画像であるサブ画像が、処理されるべき画像の複数のサブ画像内に存在しない場合、元の画像が人間の顔を含まないことが決定される。
本開示の実施形態により提供される方法を用いて、元の画像の縁領域に特定数値ピクセルを付加することによって、処理されるべき画像を取得した後、処理されるべき画像上で顔認識を行って、元の画像内の人間の顔を決定する。顔認識中、元の画像の縁領域に、元の画像の拡張と等価な特定数値ピクセルが付加され、それによって、人間の顔が元の画像の縁領域内に位置する場合、人間の顔を含むサブ画像が拡張画像内に見出され得るため、元の画像の縁領域内に位置する人間の顔を確実に認識することができ、更に、顔認識の正確性が向上する。
図8は、説明的な実施形態による顔認識装置のブロック図である。図8を参照すると、顔認識装置は、取得モジュール801、付加モジュール802、認識モジュール803及び決定モジュール804を含む。
取得モジュール801は、元の画像を取得するように構成されている。
付加モジュール802は、取得モジュール801により取得された元の画像の縁領域に特定数値ピクセルを付加して、処理されるべき画像を取得するように構成されている。
認識モジュール803は、付加モジュール802により取得された処理されるべき画像上で、顔認識を行うように構成されている。
決定モジュール804は、認識モジュール803からの顔認識の結果に従って、元の画像内の人間の顔を決定するように構成されている。
本開示の実施形態により提供される装置を用いて、元の画像の縁領域に特定数値ピクセルを付加することによって、処理されるべき画像を取得した後、処理されるべき画像上で顔認識を行って、元の画像内の人間の顔を決定する。顔認識中、元の画像の縁領域に、元の画像の拡張と等価な特定数値ピクセルが付加され、それによって、人間の顔が元の画像の縁領域内に位置する場合、人間の顔を含むサブ画像が拡張画像内に見出され得るため、元の画像の縁領域内に位置する人間の顔を確実に認識することができ、更に、顔認識の正確性が向上する。
別の実施形態では、図9を参照すると、付加モジュール802は、第1の取得ユニット8021、第1の決定ユニット8022及び付加ユニット8023を含む。
第1の取得ユニット8021は、元の画像の縁領域内の各ピクセルのピクセル値を取得するように構成されている。
第1の決定ユニット8022は、第1の取得ユニット8021によって取得された縁領域内の各ピクセルのピクセル値と、顔色ピクセルに関する事前設定ピクセル値とに従って、顔色ピクセルを有する縁領域を決定するように構成されている。
付加ユニット8023は、第1の決定ユニット8022によって決定された顔色ピクセルを有する縁領域に、特定数値ピクセルを付加するように構成されている。
別の実施形態では、図10を参照すると、認識モジュール803は、第2の取得ユニット8031及び判断ユニット8032を含む。
第2の取得ユニット8031は、処理されるべき画像の複数のサブ画像を取得するように構成されている。
判断ユニット8032は、事前に訓練されたアダプティブブースト顔分類器を使用して、第2の取得ユニットによって取得された各サブ画像が人間の顔のサブ画像であるか否かを判断するように構成されている。
別の実施形態では、第2の取得ユニット8031は、スライディングウィンドウを使用して、処理されるべき画像を複数回横断(トラバース)し、各横断の全位置おけるスライディングウィンドウによりカバーされる画像領域を、処理されるべき画像の1つのサブ画像として画定し、ここで任意の2つの横断において使用されるスライディングウィンドウは、異なるサイズのものであり;又は、処理されるべき画像を複数回拡大又は縮小して、複数の処理されるべき画像を異なるサイズで取得し、1つのサイズの処理されるべき画像を、特定のサイズの複数の画像領域へとトリミングし、この特定のサイズの各画像領域をサブ画像として画定する、ように構成されている。
別の実施形態では、事前に訓練されたアダプティブブースト顔分類器は、複数の多段分類器のカスケードとして形成され、判断ユニット8032は:事前に訓練されたアダプティブブースト顔分類器において、分類器の第1の段階から開始して分類器の最終段階まで、段階的方法によって、サブ画像が人間の顔のサブ画像であるか否かを段階において判断し;分類器の全段階から出力された結果の各々が、サブ画像が人間の顔のサブ画像であることを示す場合、サブ画像が人間の顔のサブ画像であることを決定する、ように構成されている。
別の実施形態では、図11を参照すると、決定モジュール804は:第2の決定ユニット8041及び第3の決定ユニット8042を含む。
第2の決定ユニット8041は、人間の顔のサブ画像であるサブ画像が、処理されるべき画像の複数のサブ画像内に存在する場合、人間の顔のサブ画像であるサブ画像の、元の画像内での位置を決定するように構成されている。
第3の決定ユニット8042は、人間の顔のサブ画像であるサブ画像の、元の画像内での位置に従って、元の画像内の人間の顔を決定するように構成されている。
上記の実施形態における装置に関連して、内部の個々のモジュールが行う操作に関する特定の方法を、顔認識方法に関する実施形態において詳細に記載してきた。顔認識方法は、本明細書で詳述されない。本開示の代替的な実施形態は、上記の代替的な技術的解決法を任意のやり方で組み合わせることにより形成することができ、それらは本明細書では詳述されない。
図12は、説明的な実施形態による端末1200のブロック図であり、この端末は、図1又は2に対応する実施形態にて提供された顔認識方法を実行するように構成されている。例えば、端末1200は、携帯電話、コンピュータ、デジタル放送端末、メッセージングデバイス、ゲーム機、タブレット、医療デバイス、運動器具、携帯情報端末等であってもよい。
図12を参照すると、端末1200は、以下の構成要素の1つ以上を含んでもよい:処理構成要素1202、メモリ1204、電力構成要素1206、マルチメディア構成要素1208、オーディオ構成要素1210、入力/出力(I/O)インターフェース1212、センサ構成要素1214及び通信構成要素1216。
処理構成要素1202は、一般に、ディスプレー、電話の呼び出し、データ通信に関連した動作、カメラ動作及び記録動作等、端末1200の全般的な動作を制御する。処理構成要素1202は、1つ以上のプロセッサ1220を含んで、上述した方法におけるステップの全部又は一部を行う命令を実行し得る。更に、処理構成要素1202は、処理構成要素1202と他の構成要素との間の相互作用を容易にする1つ以上のモジュールを含んでもよい。例えば、処理構成要素1202は、マルチメディアモジュールを含んで、マルチメディア構成要素1208と処理構成要素1202との間の相互作用を容易にしてもよい。
メモリ1204は、様々なタイプのデータを記憶して、端末1200の動作を支持するように構成されている。そのようなデータの例としては、端末1200上で動作される任意のアプリケーション又は方法に関する命令、連絡先データ、電話帳データ、メッセージ、写真、ビデオ映像等が挙げられる。メモリ1204は、スタティックランダムアクセスメモリ(SRAM)、電気的に消去可能なプログラマブル読み出し専用メモリ(EEPROM)、消去可能なプログラマブル読み出し専用メモリ(EPROM)、プログラマブル読み出し専用メモリ(PROM)、読み出し専用メモリ(ROM)、磁気メモリ、フラッシュメモリ、磁気又は光ディスク等の任意のタイプの揮発性又は不揮発性メモリデバイス、又はそれらの組み合わせを使用して実施され得る。
電力構成要素1206は、端末1200の様々な構成要素に電力を提供する。電力構成要素1206は、電力管理システム、1つ以上の電源、並びに端末1200内での電力の生成、管理及び分配に関連した任意の他の構成要素を含んでもよい。
マルチメディア構成要素1208は、端末1200とユーザとの間の出力インターフェースを提供するスクリーンを含む。いくつかの実施形態では、スクリーンは、液晶ディスプレー(LCD)及びタッチパネル(TP)を含んでもよい。スクリーンがタッチパネルを含む場合、スクリーンはタッチスクリーンとして実施されて、ユーザからの入力信号を受信し得る。タッチパネルは1つ以上のタッチセンサを含んで、タッチパネル上のタッチ、スワイプ及び身振りを感知する。タッチセンサは、タッチ又はスワイプ動作の境界を感知するだけでなく、タッチ又はスワイプ活動に関連した期間及び圧力も感知し得る。いくつかの実施形態では、マルチメディア構成要素1208は、フロントカメラ及び/又はリアカメラを含む。フロントカメラ及びリアカメラは、端末1200が撮影モード又はビデオモード等の動作モードにある間、外部マルチメディアデータを受信し得る。フロントカメラ及びリアカメラの各々は、固定光学レンズシステムであり、又は焦点調節及び光学ズーム能力を有してもよい。
オーディオ構成要素1210は、オーディオ信号を出力及び/又は入力するように構成されている。例えば、オーディオ構成要素1210は、端末1200が呼び出しモード、記録モード及び音声認識モード等の動作モードにある際、外部オーディオ信号を受信するように構成されたマイクロホン(「MIC」)を含む。受信されたオーディオ信号は、更に、メモリ1204内に記憶され、又は通信構成要素1216を介して伝送されてもよい。いくつかの実施形態では、オーディオ構成要素1210は、オーディオ信号を出力するスピーカを更に含む。
I/Oインターフェース1212は、処理構成要素1202と、キーボード、クリックホイール、ボタン等の周辺インターフェースモジュールとの間のインターフェースを提供する。ボタンは、ホームボタン、ボリュームボタン、スタートボタン及びロックボタンを含み得るが、これらに限定されるものではない。
センサ構成要素1214は、1つ以上のセンサを含んで、端末1200の様々な局面の状態評価を提供する。例えば、センサ構成要素1214は、端末1200の開/閉状態、構成要素、例えば端末1200のディスプレー及びキーパッドの相対的な位置付け、端末1200又は端末1200の構成要素の位置の変化、ユーザと端末1200との接触の有無、端末1200の配向又は加速/減速、並びに端末1200の温度の変化を検出してもよい。センサ構成要素1214は、いずれの物理的接触も有することなく近隣の物体の存在を検出するように構成された近接センサを含んでもよい。センサ構成要素1214は、画像化用途での使用のための、CMOS又はCCD画像センサ等の光学センサも含み得る。いくつかの実施形態では、センサ構成要素1214は、加速度計センサ、ジャイロスコープセンサ、磁気センサ、圧力センサ又は温度センサも含み得る。
通信構成要素1216は、端末1200と他のデバイスとの間の有線又は無線での通信を容易にするように構成されている。端末1200は、WiFi、2G、又は3G、又はこれらの組み合わせ等の通信標準に基づいた無線ネットワークにアクセスすることができる。例示的な一実施形態では、通信構成要素1216は、放送チャネルを介して、放送信号、又は放送に関連した情報を外部放送管理システムから受信する。例示的な一実施形態では、通信構成要素1216は、近距離無線通信(NFC)モジュールを更に含んで、狭域通信を容易にする。例えば、NFCモジュールは、無線自動識別(RFID)技術、赤外線データ協会(IrDA)技術、超広帯域(UWB)技術、Bluetooth(登録商標)(BT)技術、及び他の技術に基づいて実施されてもよい。
例示的な実施形態では、端末1200は、1つ以上の特定用途向け集積回路(ASICs)、デジタル信号プロセッサ(DSPs)、デジタル信号処理デバイス(DSPDs)、プログラマブルロジックデバイス(PLDs)、フィールドプログラマブルゲートアレイ(FPGAs)、コントローラ、マイクロコントローラ、マイクロプロセッサ、又は他の電子構成要素を用いて実施されて、図1及び図2に対応する実施形態によって提供される顔認識方法を行ってもよい。
説明的な実施形態では、命令を含むメモリ1204等の非一時的コンピュータ読み取り可能記憶媒体も提供され、該命令は、端末1200内のプロセッサ1220によって実行されて、上述した方法を行ってもよい。例えば、非一時的コンピュータ読み取り可能記憶媒体は、ROM、RAM、CD−ROM、磁気テープ、フロッピーディスク、光学データ記憶デバイス等であってもよい。
本明細書の熟考と、本明細書に開示した本発明の実践とから、本発明の他の実施形態が当業者に明らかとなるであろう。本願は、本発明の一般的原理に従った本発明の任意の改変、使用又は適用を包含し、当技術分野における既知の又は習慣的な実践に近い本開示からの逸脱を含むものとする。明細書及び実施例は、例示のみとして見なされ、本発明の正確な趣旨及び範囲は、以下の特許請求の範囲に示されるものとする。
本発明は、上述し、付随する図面に示した通りの構造に限定されるものではなく、本発明の範囲から逸脱することなく様々な修正及び変更を為し得ることが認められるであろう。本発明の範囲は、添付の特許請求の範囲のみによって限定されるものとする。
801・・・・・取得モジュール
802・・・・・付加モジュール
803・・・・・認識モジュール
804・・・・・決定モジュール
8021・・・・第1の取得ユニット
8022・・・・第1の決定ユニット
8023・・・・付加ユニット
8031・・・・第2の取得ユニット
8032・・・・判断ユニット
8041・・・・第2の決定ユニット
8042・・・・第3の決定ユニット
1200・・・・端末
1202・・・・処理構成要素
1204・・・・メモリ
1220・・・・プロセッサ

Claims (12)

  1. 元の画像を取得することと、
    前記元の画像の縁領域に特定数値ピクセルを付加して、付加された全ピクセルは、同一のピクセル値を有し、処理されるべき画像を取得することと、
    前記処理されるべき画像上で顔認識を行うことと、
    前記顔認識の結果に従って、前記元の画像内の人間の顔を決定することと、
    を含み、
    前記元の画像の前記縁領域に前記特定数値ピクセルを付加することは、
    前記元の画像の前記縁領域内の各ピクセルのピクセル値を取得することと、
    前記縁領域内の各ピクセルの前記ピクセル値と、顔色ピクセルに関する事前設定ピクセル値とに従って、前記顔色ピクセルを有する縁領域を決定することと、
    前記顔色ピクセルを有する前記縁領域のみに前記特定数値ピクセルを付加することと、
    を含む、顔認識方法。
  2. 前記処理されるべき画像上で前記顔認識を行うことは、
    前記処理されるべき画像の複数のサブ画像を取得することと、
    事前に訓練されたアダプティブブースト顔分類器を使用して、各サブ画像が人間の顔のサブ画像であるか否かを判断することと、
    を含む、請求項1に記載の顔認識方法。
  3. 前記処理されるべき画像の前記複数のサブ画像を取得することは、
    スライディングウィンドウを使用して、前記処理されるべき画像を複数回トラバースし、各トラバースの、全位置におけるスライディングウィンドウによりカバーされる画像領域を、前記処理されるべき画像の1つのサブ画像として画定することであって、任意の2つのトラバースにおいて使用される前記スライディングウィンドウは、異なるサイズのものであること、又は
    前記処理されるべき画像を複数回拡大又は縮小して、複数の処理されるべき画像を異なるサイズで取得し、1つのサイズの処理されるべき画像を、特定のサイズの複数の画像領域へとトリミングし、前記特定のサイズの各画像領域をサブ画像として画定すること、
    を含む、請求項に記載の顔認識方法。
  4. 前記事前に訓練されたアダプティブブースト顔分類器が、多段分類器のカスケードとして形成されており、
    前記事前に訓練されたアダプティブブースト顔分類器を使用して、各サブ画像が前記人間の顔のサブ画像であるか否かを判断することは、
    前記事前に訓練されたアダプティブブースト顔分類器において、分類器の第1の段階から開始して分類器の最終段階まで、段階的方法によって、前記サブ画像が前記人間の顔のサブ画像であるか否かを段階において判断することと、
    分類器の全段階から出力された結果の各々が、前記サブ画像が前記人間の顔のサブ画像であることを示す場合、前記サブ画像が前記人間の顔のサブ画像であることを決定することと、
    を含む、請求項又は請求項に記載の顔認識方法。
  5. 前記顔認識の結果に従って、前記元の画像内の前記人間の顔を決定することは、
    前記人間の顔のサブ画像であるサブ画像が、前記処理されるべき画像の前記複数のサブ画像内に存在する場合、前記人間の顔のサブ画像である前記サブ画像の、前記元の画像内での位置を決定することと、
    前記人間の顔のサブ画像である前記サブ画像の、前記元の画像内での前記位置に従って、前記元の画像内の前記人間の顔を決定することと、
    を含む、請求項1〜のいずれか一項に記載の顔認識方法。
  6. 元の画像を取得するように構成された取得モジュールと、
    前記取得モジュールにより取得された前記元の画像の縁領域に特定数値ピクセルを付加して、付加された全ピクセルは、同一のピクセル値を有し、処理されるべき画像を取得するように構成された付加モジュールと、
    前記付加モジュールにより取得された前記処理されるべき画像上で、顔認識を行うように構成された認識モジュールと、
    前記認識モジュールからの前記顔認識の結果に従って、前記元の画像内の人間の顔を決定するように構成された決定モジュールと、
    を備え、
    前記付加モジュールは、
    前記元の画像の前記縁領域内の各ピクセルのピクセル値を取得するように構成された第1の取得ユニットと、
    前記第1の取得ユニットによって取得された前記縁領域内の各ピクセルの前記ピクセル値と、顔色ピクセルに関する事前設定ピクセル値とに従って、前記顔色ピクセルを有する縁領域を決定するように構成された第1の決定ユニットと、
    前記第1の決定ユニットによって決定された前記顔色ピクセルを有する前記縁領域のみに、前記特定数値ピクセルを付加するように構成された付加ユニットと、を備える、
    顔認識装置。
  7. 前記認識モジュールは、
    前記処理されるべき画像の複数のサブ画像を取得するように構成された第2の取得ユニットと、
    事前に訓練されたアダプティブブースト顔分類器を使用して、前記第2の取得ユニットによって取得された各サブ画像が人間の顔のサブ画像であるか否かを判断するように構成された判断ユニットと、を備える、
    請求項に記載の顔認識装置。
  8. 前記第2の取得ユニットは、
    スライディングウィンドウを使用して、前記処理されるべき画像を複数回トラバースし、各トラバースの、全位置における前記スライディングウィンドウによりカバーされる画像領域を、前記処理されるべき画像の1つのサブ画像として画定し、ここで任意の2つのトラバースにおいて使用される前記スライディングウィンドウは、異なるサイズのものである、又は
    前記処理されるべき画像を複数回拡大又は縮小して、複数の処理されるべき画像を異なるサイズで取得し、1つのサイズの処理されるべき画像を、特定のサイズの複数の画像領域へとトリミングし、前記特定のサイズの各画像領域をサブ画像として画定する、ように構成されている、
    請求項に記載の顔認識装置。
  9. 前記事前に訓練されたアダプティブブースト顔分類器が、多段分類器のカスケードとして形成されており、
    前記判断ユニットは、
    前記事前に訓練されたアダプティブブースト顔分類器において、分類器の第1の段階から開始して分類器の最終段階まで、段階的方法によって、前記サブ画像が前記人間の顔のサブ画像であるか否かを段階において判断し、
    分類器の全段階から出力された結果の各々が、前記サブ画像が前記人間の顔のサブ画像であることを示す場合、前記サブ画像が前記人間の顔のサブ画像であることを決定する、
    ように構成されている、
    請求項又は請求項に記載の顔認識装置。
  10. 前記決定モジュールは、
    前記人間の顔のサブ画像であるサブ画像が、前記処理されるべき画像の前記複数のサブ画像内に存在する場合、前記人間の顔のサブ画像である前記サブ画像の、前記元の画像内での位置を決定するように構成された第2の決定ユニットと、
    前記人間の顔のサブ画像である前記サブ画像の、前記元の画像内での前記位置に従って、前記元の画像内の前記人間の顔を決定するように構成された第3の決定ユニットと、を備える、
    請求項6〜9のいずれか一項に記載の顔認識装置。
  11. コンピュータ上で動作された際に、デバイスを制御するための請求項1〜のいずれか一項に記載の方法を前記コンピュータに実行させるコンピュータプログラム。
  12. コンピュータ読み取り可能な記憶媒体であって、該記憶媒体上に記憶された請求項11に記載のコンピュータプログラムを含む、記憶媒体。
JP2016567408A 2015-08-21 2015-12-30 顔認識方法、装置及び端末 Active JP6374986B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201510520457.X 2015-08-21
CN201510520457.XA CN105095881B (zh) 2015-08-21 2015-08-21 人脸识别方法、装置及终端
PCT/CN2015/099696 WO2017031901A1 (zh) 2015-08-21 2015-12-30 人脸识别方法、装置及终端

Publications (2)

Publication Number Publication Date
JP2017534090A JP2017534090A (ja) 2017-11-16
JP6374986B2 true JP6374986B2 (ja) 2018-08-15

Family

ID=54576269

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016567408A Active JP6374986B2 (ja) 2015-08-21 2015-12-30 顔認識方法、装置及び端末

Country Status (8)

Country Link
US (1) US10007841B2 (ja)
EP (1) EP3133527A1 (ja)
JP (1) JP6374986B2 (ja)
KR (1) KR20170033805A (ja)
CN (1) CN105095881B (ja)
MX (1) MX2017008481A (ja)
RU (1) RU2664688C2 (ja)
WO (1) WO2017031901A1 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9286509B1 (en) * 2012-10-19 2016-03-15 Google Inc. Image optimization during facial recognition
CN105095881B (zh) * 2015-08-21 2023-04-07 小米科技有限责任公司 人脸识别方法、装置及终端
EP3136289A1 (en) * 2015-08-28 2017-03-01 Thomson Licensing Method and device for classifying an object of an image and corresponding computer program product and computer-readable medium
CN106485567B (zh) * 2016-09-14 2021-11-30 北京小米移动软件有限公司 物品推荐方法及装置
CN106372616B (zh) * 2016-09-18 2019-08-30 Oppo广东移动通信有限公司 人脸识别方法、装置及终端设备
CN106446884A (zh) * 2016-09-19 2017-02-22 广东小天才科技有限公司 一种图像的快速截取的方法和装置
US10474881B2 (en) * 2017-03-15 2019-11-12 Nec Corporation Video retrieval system based on larger pose face frontalization
CN108280420A (zh) * 2018-01-19 2018-07-13 百度在线网络技术(北京)有限公司 用于处理图像的系统、方法和装置
CN109492550B (zh) * 2018-10-25 2023-06-06 腾讯科技(深圳)有限公司 活体检测方法、装置及应用活体检测方法的相关系统
US10650564B1 (en) * 2019-04-21 2020-05-12 XRSpace CO., LTD. Method of generating 3D facial model for an avatar and related device
CN110401835B (zh) * 2019-06-05 2021-07-02 西安万像电子科技有限公司 图像处理方法及装置
CN110248107A (zh) * 2019-06-13 2019-09-17 Oppo广东移动通信有限公司 图像处理方法和装置
CN110533002B (zh) * 2019-09-06 2022-04-12 厦门久凌创新科技有限公司 基于人脸识别的大数据处理方法
JP2022522551A (ja) * 2020-02-03 2022-04-20 ベイジン センスタイム テクノロジー ディベロップメント カンパニー リミテッド 画像処理方法及び装置、電子機器並びに記憶媒体
CN112132030B (zh) * 2020-09-23 2024-05-28 湖南快乐阳光互动娱乐传媒有限公司 视频处理方法及装置、存储介质及电子设备
CN112966136B (zh) * 2021-05-18 2021-09-07 武汉中科通达高新技术股份有限公司 一种人脸分类方法及装置

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4551839B2 (ja) * 2004-08-16 2010-09-29 キヤノン株式会社 撮像装置及び撮像装置の制御方法
US7430369B2 (en) 2004-08-16 2008-09-30 Canon Kabushiki Kaisha Image capture apparatus and control method therefor
RU2295152C1 (ru) * 2005-09-15 2007-03-10 Роман Павлович Худеев Способ распознавания лица человека по видеоизображению
JP5354842B2 (ja) * 2006-05-26 2013-11-27 キヤノン株式会社 画像処理方法および画像処理装置
JP2008181439A (ja) * 2007-01-26 2008-08-07 Sanyo Electric Co Ltd 顔検出装置及び方法並びに撮像装置
CN101488181B (zh) * 2008-01-15 2011-07-20 华晶科技股份有限公司 多方向的人脸检测方法
KR100973588B1 (ko) 2008-02-04 2010-08-02 한국과학기술원 얼굴검출기의 부윈도우 설정방법
KR101105435B1 (ko) 2009-04-14 2012-01-17 경북대학교 산학협력단 얼굴 검출과 얼굴 인지 방법
CN102096802B (zh) * 2009-12-11 2012-11-21 华为技术有限公司 人脸检测方法及装置
US9042599B2 (en) * 2010-07-02 2015-05-26 Intel Corporation Techniques for face detection and tracking
CN102270308B (zh) * 2011-07-21 2013-09-11 武汉大学 一种基于五官相关aam模型的面部特征定位方法
AU2013205535B2 (en) * 2012-05-02 2018-03-15 Samsung Electronics Co., Ltd. Apparatus and method of controlling mobile terminal based on analysis of user's face
CN105095881B (zh) * 2015-08-21 2023-04-07 小米科技有限责任公司 人脸识别方法、装置及终端

Also Published As

Publication number Publication date
CN105095881A (zh) 2015-11-25
EP3133527A1 (en) 2017-02-22
RU2017102521A (ru) 2018-07-26
RU2664688C2 (ru) 2018-08-21
US10007841B2 (en) 2018-06-26
KR20170033805A (ko) 2017-03-27
RU2017102521A3 (ja) 2018-07-26
CN105095881B (zh) 2023-04-07
US20170053156A1 (en) 2017-02-23
WO2017031901A1 (zh) 2017-03-02
MX2017008481A (es) 2017-10-31
JP2017534090A (ja) 2017-11-16

Similar Documents

Publication Publication Date Title
JP6374986B2 (ja) 顔認識方法、装置及び端末
US10565763B2 (en) Method and camera device for processing image
JP6392468B2 (ja) 領域認識方法及び装置
US10284773B2 (en) Method and apparatus for preventing photograph from being shielded
RU2577188C1 (ru) Способ, аппарат и устройство для сегментации изображения
CN106454336B (zh) 检测终端摄像头被遮挡的方法及装置和终端
US9959484B2 (en) Method and apparatus for generating image filter
WO2017071064A1 (zh) 区域提取方法、模型训练方法及装置
EP2998960B1 (en) Method and device for video browsing
CN107368810A (zh) 人脸检测方法及装置
WO2014054249A1 (en) Information processing apparatus, information processing method, and program
US11403789B2 (en) Method and electronic device for processing images
CN105426079B (zh) 图片亮度的调整方法及装置
CN111047526A (zh) 一种图像处理方法、装置、电子设备及存储介质
WO2020114236A1 (zh) 关键点检测方法、装置、电子设备及存储介质
US20180144176A1 (en) Fingerprint template acquisition method and device
WO2022077970A1 (zh) 特效添加方法及装置
US11216075B2 (en) Method, apparatus and device for triggering shooting mode, and storage medium
EP3328062A1 (en) Photo synthesizing method and device
CN110619350A (zh) 图像检测方法、装置及存储介质
EP3975046A1 (en) Method and apparatus for detecting occluded image and medium
WO2022095860A1 (zh) 指甲特效的添加方法及装置
JP2017521742A (ja) 虹彩画像を取得する方法および装置、ならびに虹彩識別機器
WO2020233201A1 (zh) 图标位置确定方法和装置
EP3327718B1 (en) Method and device for processing a page

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171219

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180717

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180720

R150 Certificate of patent or registration of utility model

Ref document number: 6374986

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250