JP6536058B2 - ユーザの人口統計学特性を推定する方法、コンピュータ・システム、及びプログラム - Google Patents

ユーザの人口統計学特性を推定する方法、コンピュータ・システム、及びプログラム Download PDF

Info

Publication number
JP6536058B2
JP6536058B2 JP2015022653A JP2015022653A JP6536058B2 JP 6536058 B2 JP6536058 B2 JP 6536058B2 JP 2015022653 A JP2015022653 A JP 2015022653A JP 2015022653 A JP2015022653 A JP 2015022653A JP 6536058 B2 JP6536058 B2 JP 6536058B2
Authority
JP
Japan
Prior art keywords
user
social media
face images
profile
face
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015022653A
Other languages
English (en)
Other versions
JP2015219904A (ja
Inventor
ジョシ ディラジ
ジョシ ディラジ
チェン フランシーン
チェン フランシーン
リン ディー. ウィルコックス
ディー. ウィルコックス リン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Publication of JP2015219904A publication Critical patent/JP2015219904A/ja
Application granted granted Critical
Publication of JP6536058B2 publication Critical patent/JP6536058B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/30Scenes; Scene-specific elements in albums, collections or shared content, e.g. social network photos or video
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/178Human faces, e.g. facial parts, sketches or expressions estimating age from face image; using age information for improving recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Medical Informatics (AREA)
  • Human Computer Interaction (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Processing (AREA)

Description

開示の技術は、ユーザの人口統計学特性を推定する方法、コンピュータ・システム、及びプログラムに関する。
(Twitter(登録商標)などの)マイクロブログ・プラットフォームは、今日、ウェブ上の数百万のユーザの意見を具現化している。マイクロブログは、ユーザによるより短い長さの投稿であり、よりオープンなエコシステムである点で、従来のソーシャル・ネットワークとはいくらか異なっている。マイクロブログは、歴史的に、テキスト・ベース・メッセージにフォーカスしているが、現在は、画像及びビデオをサポートしているマイクロブログもある。一方、写真またはビデオ専用のソーシャル・ネットワークも存在する。スマートフォンによって写真を投稿することはより容易になった。そして、写真によって伝えられる情報は、テキストよりも多いことがある。
ソーシャル・マルチメディアのトレンドの1つは、自分自身の写真を撮影すること(「自撮り」と呼ばれることもある)である。スマートフォンにインカメラ(ディスプレイ側に搭載されたカメラ)が導入されたことによって、「自撮り」は一層容易になった。
ビジネスの観点から、マイクロブログは、適切な人々に向けられるべき製品の推奨/広告を可能にするマーケティング情報の良いソースとなり得る。マイクロブログ上でアクティブなユーザにフォーカスすることは、(1)マイクロブログは、一般的に、そのコンテンツがより動的であり、人々が、現在の話題をアクティブに議論する傾向があり、(2)特に、第三者にとって、マイクロブログのデータはアクセスし易い、などの利点を有する。
米国特許出願公開第2013/0304658 A1号 米国特許出願公開第2011/0135168 A1号
アロウィブディ(Alowibdi)、「ツイッターにおける言語非依存性別分類(Language Independent Gender Classification on Twitter)」、ソーシャル・ネットワーク分析及びマイニングにおける進歩に関するIEEE/ACM国際会議(IEEE/ACM International Conf. on Advances in Social Networks Analysis and Mining)、2013年8月25日〜28日、頁5
ビジネス・アプリケーションは、ソーシャルの人口統計学と現在のもしくは最新のトピックに関するソーシャル・センチメントとを関連付けることが可能である。例えば、企業が新製品の発売に関するセンチメントに注目している場合、もしくは、政治団体が発表を行う場合、企業は、人々が考えていることを、マイクロブログ上でより迅速に見つけることが可能である。他のユーザに向けた(ユーザによって明示的に生成された、もしくは、ユーザ・アクティビティから暗黙裡に生成された)ユーザ・プロファイルが存在する場合、企業は、異なる人口統計学グループが考えていることを推定することが可能である。しかしながら、ユーザに関する人口統計学情報が利用可能でない場合もある。
本発明は、ユーザに関する人口統計学特性(例えば、性別、年齢、居住地域、収入、及び学齢等の属性の特性)が利用可能でない場合であっても、ユーザの人口統計学特性を推定する方法、コンピュータ・システム、及びプログラムを提供する。
開示の技術の第1の態様は、ユーザの人口統計学特性を推定する方法であって、少なくとも1つのプロセッサ、及び、少なくとも1つの前記プロセッサによって実行される少なくとも1つのプログラムを記憶するメモリを含む計算処理デバイスが、ユーザによってソーシャル・メディア・サイトに投稿される複数の写真を取得し、取得した前記写真から複数の顔画像を識別し、前記顔画像の選択されたサブセットに基づいて、前記ユーザの少なくとも1つの複数の人口統計学特性を推定する。
開示の技術の第2の態様は、第1の態様の方法であって、前記計算処理デバイスは、顔画像の前記サブセットを選択するために、前記ソーシャル・メディア・サイトから前記ユーザのプロファイル写真を取得し、複数の前記顔画像を複数のクラスタにグループ化するクラスタリング・アルゴリズムを適用し、取得した前記プロファイル写真に最もマッチする複数の前記クラスタの内のクラスタを選択し、顔画像の選択された前記サブセットは、選択された前記クラスタの前記顔画像を含む。
開示の技術の第3の態様は、第1の態様の方法であって、前記計算処理デバイスは、顔画像の前記サブセットを選択するために、前記ソーシャル・メディア・サイトから前記ユーザのプロファイル写真を取得し、前記プロファイル写真をクラスタリング・シードとして用いて、複数の前記顔画像を複数のクラスタにグループ化するクラスタリング・アルゴリズムを適用し、顔画像の選択された前記サブセットは、前記プロファイル写真に対応する前記クラスタの前記顔画像を含む。
開示の技術の第4の態様は、第1の態様の方法であって、前記計算処理デバイスは、顔画像の前記サブセットを選択するために、前記ソーシャル・メディア・サイトから前記ユーザのプロファイル写真を取得し、取得した前記プロファイル写真に対する類似度が予め定められた類似度の閾値より大きい前記顔画像のサブセットを選択する。
開示の技術の第5の態様は、第4の態様の方法であって、前記類似度は、空間ピラミッド・マッチングを用いて求められる。
開示の技術の第6の態様は、第1の態様の方法であって、前記計算処理デバイスは、顔画像の前記サブセットを選択するために、複数の前記顔画像を複数のクラスタにグループ化するクラスタリング・アルゴリズムを適用し、最高クラスタ純度を有する複数の前記クラスタからクラスタを選択し、顔画像の選択された前記サブセットは、選択された前記クラスタの前記顔画像を含む。
開示の技術の第7の態様は、第1の態様の方法であって、前記計算処理デバイスは、顔画像の前記サブセットを選択するために、少なくとも1つの自撮り特徴を有する取得した前記写真内の顔画像の存在に基づいて、前記顔画像の少なくとも1つを選択する。
開示の技術の第8の態様は、第7の態様の方法であって、写真の前記自撮り特徴は、前記写真の占有領域割合閾値を越える顔画像を有することを含む。
開示の技術の第9の態様は、第7又は第8の態様の方法であって、写真の前記自撮り特徴は、前記写真の周囲に沿った前記写真の内の人物の腕の画像を検出することを含む、
請求項7又は請求項8に記載の方法。
開示の技術の第10の態様は、第1〜第9の何れかの態様の方法であって、前記ユーザの少なくとも1つの人口統計学特性を推定することは、さらに、取得した前記写真の内の識別されたオブジェクトの画像に基づき、識別された前記オブジェクトは、少なくとも1つの人口統計学特性に対するスキューを有する。
開示の技術の第11の態様は、第10の態様の方法であって、識別されたオブジェクトの前記画像は、自撮りとして識別された写真に現れる。
開示の技術の第12の態様は、第1〜第11の何れかの態様の方法であって、前記ユーザの少なくとも1つの人口統計学特性を推定することは、識別された前記顔画像の数について人口統計学特性を決定し、決定された前記人口統計学特性の分布を計算し、ユーザのソーシャル・メディア写真の人口統計学特性の履歴データ及びユーザの人口統計学データに関してトレーニングされた分類手段への特徴入力として前記分布を用いる。
開示の技術の第13の態様は、第1〜第11の何れかの態様の方法であって、前記ユーザの少なくとも1つの人口統計学特性を推定することは、前記顔画像にN個の別個の推定手法を適用し、前記推定手法の各々は前記ユーザの画像であると推定された顔画像のセットの各々を識別し、Nは2以上の整数であり、顔画像の候補セットを形成するために識別された前記顔画像のセットの各々を組み合わせ、前記候補セットの内の顔画像の各々について、N次元特徴ベクトルを形成し、特徴ベクトルの各々の次元の各々は前記推定手法の1つに固有に対応し、特徴ベクトルの各々の値は、前記ユーザの画像であると顔画像の各々をどの推定手法が推定したかを示し、顔画像の各々が前記ユーザの画像であるか否か推定するためにトレーニングされた分類手段への入力として特徴ベクトルの各々を用い、前記顔画像の選択されたサブセットは、前記ユーザの画像であるとトレーニングされた前記分類手段によって決定された顔画像を含む。
開示の技術の第14の態様は、第1〜第11の何れかの態様の方法であって、前記ユーザの少なくとも1つの人口統計学特性を推定することは、前記顔画像に複数の推定手法を適用し、前記推定手法の各々は前記ユーザの画像であると推定された顔画像のセットの各々を識別し、顔画像の候補セットを形成するために顔画像の識別されたセットの各々を組み合わせ、前記推定手法によって提供されたスコアの加重平均を用いて前記候補セットの顔画像の各々にスコアを付け、前記顔画像の選択されたサブセットは加重平均されたスコアが予め定められた閾値を越える顔画像を含む。
開示の技術の第15の態様は、第1〜第14の何れかの態様の方法であって、少なくとも1つの前記人口統計学特性は年齢及び性別を含む。
開示の技術の第16の態様は、ユーザの人口統計学特性を推定するコンピュータ・システムであって、少なくとも1つのプロセッサと、メモリと、前記メモリに記憶された少なくとも1つのプログラムと、を含み、少なくとも1つのプログラムは、ユーザによってソーシャル・メディア・サイトに投稿された複数の写真を取得し、取得した前記写真から複数の顔画像を識別し、顔画像の選択されたサブセットに基づいて、前記ユーザの少なくとも1つの人口統計学特性を推定する、ための命令を含む。
開示の技術の第17の態様は、第16の態様のコンピュータ・システムであって、顔画像のサブセットを選択するために、前記ソーシャル・メディア・サイトから前記ユーザのプロファイル写真を取得し、複数の前記顔画像を複数のクラスタにグループ化するクラスタリング・アルゴリズムを適用し、取得した前記プロファイル写真と最もマッチする複数の前記クラスタからクラスタを選択する、命令をさらに含み、顔画像の選択された前記サブセットは、選択された前記クラスタの内の前記顔画像を含む。
開示の技術の第18の態様は、第16の態様のコンピュータ・システムであって、前記命令は、顔画像のサブセットを選択するために、複数のクラスタに複数の前記顔画像をグループ化するためにクラスタリング・アルゴリズムを適用し、複数の前記クラスタからクラスタ純度が最高であるクラスタを選択する、命令をさらに含み、顔画像の選択された前記サブセットは選択された前記クラスタの前記顔画像を含む。
開示の技術の第19の態様は、第16の態様のコンピュータ・システムであって、前記ユーザの少なくとも1つの人口統計学特性を推定する命令は、さらに、識別された前記顔画像の複数について人口統計学特性を決定し、決定された前記人口統計学特性の分布を計算し、ユーザのソーシャル・メディア写真の人口統計学特性の履歴データ及びユーザの人口統計学データについてトレーニングされた分類手段への特徴入力として前記分布を用いる、命令をさらに含む。
開示の技術の第20の態様は、ユーザの人口統計学特性を推定する処理をコンピュータに実行させるためのプログラムであって、ユーザによってソーシャル・メディア・サイトに投稿された複数の写真を取得し、取得した前記写真から複数の顔画像を識別し、前記顔画像の選択されたサブセットに基づいて、前記ユーザの少なくとも1つの人口統計学特性を推定する。
ユーザに関する人口統計学特性が利用可能でない場合であっても、ユーザの人口統計学特性を推定することが可能となる。
開示の技術が動作する実装のいくつかの環境を例示する。 実装のいくつかの分析サーバのブロック図を例示する。 実装のいくつかの写真から顔画像を抽出する処理を例示する。 実装のいくつかのユーザの写真を用いて、ユーザの人口統計学特性を識別する方法の第1のフローチャートを例示する。 実装のいくつかのユーザの写真を用いて、ユーザの人口統計学特性を識別する方法の第2のフローチャートを例示する。 実装のいくつかのユーザの写真を用いて、ユーザの人口統計学特性を識別する方法の第3のフローチャートを例示する。 実装のいくつかのユーザの写真を用いて、ユーザの人口統計学特性を識別する方法の第4のフローチャートを例示する。 実装のいくつかのユーザの写真を用いて、ユーザの人口統計学特性を識別する方法の第4のフローチャートを例示する。 実装のいくつかの自撮り特徴を用いて、ユーザの人口統計学特性を識別する技術を例示する。 実装のいくつかの自撮り特徴を用いて、ユーザの人口統計学特性を識別する技術を例示する。 実装のいくつかの外観コンセプトもしくはシーンに基づいて、ユーザの人口統計学特性を識別する処理を例示する。 実装のいくつかのユーザの写真を用いて、ユーザの人口統計学特性を識別する他の方法のフローチャートを例示する。 実装のいくつかの自撮り写真を識別する複数の手法の組み合わせを例示する。 実装のいくつかのユーザの人口統計学特性を識別する複数の技術を組み合わせる処理を例示する。 実装のいくつかのクライアント・デバイスを例示するブロック図を例示する。 実装のいくつかのユーザの人口統計学特性を識別する処理を例示する。 実装のいくつかのユーザの人口統計学特性を識別する処理を例示する。 実装のいくつかのユーザの人口統計学特性を識別する処理を例示する。
本開示は、マイクロブログもしくはソーシャル・ネットワークなどのソーシャル・メディア・サイトにユーザが投稿する写真に基づいて、ユーザの人口統計学特性を推定する新規な手法について記述する。いくつかの例において、処理は、投稿された写真から自分自身を撮影した写真(「自撮り」)画像を識別し、ユーザの各々の人口統計学特性(例えば、年齢及び性別など)を推定するために自撮り画像を分析する。ソーシャル・メディア・サイトは、「ソーシャル・ネットワーク」とも呼ばれる。ソーシャル・メディア・サイトのいくつかは、一般的に、少量の投稿にフォーカスしている場合には、「マイクロブログ」とも呼ばれる。ここで記述される技術は、マイクロブログ・サイトへの特定の適用性を有する何れのソーシャル・メディア・サイトにも適用可能である。
開示の技術は、ユーザ特定情報は正確である必要がないため、ユーザ・プロファイルが人口統計学情報を特定するソーシャル・メディア・サイトについても価値を有する。いくつかの場合において、ユーザは、ユーザのプライバシーを保護するため、実年齢より上にあるいは下に見せるため、もしくは他の理由で、不正確なプロファイル情報を提示する。
開示の技術はユーザがプロファイル写真を提供したか否かに関係なく、価値を有する。いくつかの場合、プロファイル写真は不正確であるか、もしくは、ユーザを示さない。さらに、プロファイル写真のいくつかは低解像度であり、したがって、ユーザのデジタル写真に基づく人口統計学特性を推定するほうが、より正確であるかもしれない。
マイクロブログに投稿されたユーザの写真からのキューは、ユーザの年齢及び性別を推定することを可能にする。投稿された写真を用いることに加えて、実装のいくつかは、他の(例えば、現在のマイクロブログ・アカウントのユーザによってリストされた)ソーシャル・ネットワーク・アカウントから取得されたユーザのプロファイル写真を用いる。他のソーシャル・メディア・サイトにユーザによって投稿された写真が公的に利用可能であれば、人口統計学推定を行うために、ユーザの現在のマイクロブログ写真と組み合わされてもよい。
実装のいくつかは、人物の年齢及び性別を決定するために、人物のマイクロブログの写真を分析することにフォーカスするが、同様の技術は、ユーザに関連する複数の写真が存在する他のコンテキストでも適用可能である。例えば、いくつかの例において、スマートTVはスマートフォンのユーザの写真にアクセスし得る。写真は、ユーザの年齢及び性別を判断するために用いられることが可能であり、したがって、広告に適切な対象を絞ることが可能である。現在のスマートTVのいくつかは、異なる時間にTVを見ている人物のビデオをスマートに録画するために用いることが可能なカメラを有する。人物の各々の年齢及び性別の推定要約は、異なる時刻に適応的に対象とされた広告に用いることが可能である。TVのコンテキストにおいて、ユーザのコンセプトは、(i)ユーザの電話とTVとを同期する人物、もしくは、(ii)異なる時間にTVを見ている人物(一台のTVに複数のユーザが存在し得る)であり得る。
ソーシャル・ネットワーク及びソーシャル・ネットワークにおいてアカウントを維持する人が急増しているので、異なるネットワークを越えてアカウントをマッピングすることは有用である。年齢、性別、もしくは(人種などの)ユーザの他の人口統計学特性を推定する機能はマッチング処理で改善し得る。
ソーシャル・メディア・データ・マイニングに関する問題は、何を、どこに、誰が投稿するか、に基づいて、ネットワークに参加する人物に関する推定を行うことにフォーカスする。十分なマイクロブログ・テキストが存在しない場合、ユーザが投稿した写真は、年齢、性別もしくは他の人口統計学特性を判定するための有用なキューを提供し得る。この情報は、広告、製品、映画、サービス、旅行などの人口統計学特性特定推奨を実行するために用いることが可能である。
実装のいくつかは、人物の年齢及び性別に関する推定を行うためにユーザが投稿した写真を分析する。実装のいくつかにおいて、人種などの他の人口統計学特性も同様に推定される。一括して分析された場合は、人物の写真は、人物の年齢及び性別を識別する重要なキューを与え得る。例えば、多くの写真に幼い子供達が存在する場合、ユーザが父母もしくは祖父母であることを示し得る。写真に10代もしくはヤング・アダルトが存在する場合、ユーザが10代もしくはヤング・アダルトであることを示し得る。自撮りの存在は、年齢/性別予測処理を促進する。
写真のシーンもしくはコンセプト検出は、特に、一括して(例えば、検出された複数の写真もしくは複数のシーンもしくはコンセプトに)適用された場合、ユーザの年齢もしくは性別を示し得る。例えば、ユーザの写真が洋服、香水、もしくはマニキュアの写真を含む場合、ユーザは女性である可能性が高い。ユーザの写真がスポーツの写真を含む場合、ユーザは男性である可能性が高い。コンセプトに関連するキューは、単独では、年齢もしくは性別を予測するために十分ではないが、自撮り画像の男性もしくは女性の特徴を識別すること、などの、顔ベース推定との組み合わせで有用となり得る。年齢及び性別の推定を支援するために、投稿した写真とユーザのプロファイル写真とを比較することも可能である。単一のプロファイル写真は、年齢及び性別の適切な推定は提供しない可能性がある。例えば、プロファイル写真は古いかもしれないし、画質が悪いかもしれないし、(イラストなどの)人物以外の画像かもしれないし、他の人物を含むかもしれない。
実装のいくつかにおいて、写真を用いて行われる人口統計学推定は、推定の正確さもしくは信頼性を向上するために、(利用可能である場合)テキスト・ベース・人口統計学推定と組み合わされる。
実装のいくつかにおいて、ユーザの写真はマイクロブログから取得され、写真の各々の顔画像を0個もしくは複数個識別するために、顔検出が写真の各々に適用される。顔検出は、OpenCV顔検出手段(face detector)などの様々なソフトウェアを用いて実行され得る。実装のいくつかにおいて、顔は、判別可能な顔の外観特徴を用いてクラスタリングされる。実装のいくつかは、顔を示すために、局所制約線形符号化(LLC)を用いる。LLCフレームワークにおいて、顔の各々は、21504次元(21の空間ピラミッド・グリッド(spatial pyramid grids)の各々について1024次元の符号)のベクトルによって表される。次に、空間ピラミッド・マッチング・フレームワークを用いて顔間の類似度を含む類似マトリックスを計算する。計算された類似度マトリックスは、顔の外観クラスタを検出するために用いられる。実装のいくつかにおいて、アフィニティ伝搬(Affinity Propagation)が顔クラスタリングを実行するために用いられる。アフィニティ伝搬は、データ・ポイント間で受け渡しされるメッセージのコンセプトに基づく、反復クラスタリング・アルゴリズムである。多くのクラスタリング・アルゴリズムは、予め決定されている数のクラスタを必要とするが、アフィニティ伝搬は予め決定されている数のクラスタを必要としない。予めクラスタ(別個の人物)の数を計算することは容易ではないため、ユーザのマイクロブログ写真コレクション内で顔のクラスタリングを行うために、予め決定されている数のクラスタを必要としないことは、特に有用である。ユーザのプロファイル写真からのキューは、自撮りとして識別するために用いられ得る。顔検出は、存在すれば、ユーザのプロファイル写真にも実行される。プロファイル写真が人物の顔であれば、いくつかの手法が、特定のクラスタが「自撮り」クラスタであるか否かを識別するために用いられ得る。
実装のいくつかは、プロファイル写真で検出された顔を用いて、全てのクラスタの外観類似チェックを実行する。クラスタのプロファイル写真及び多くの顔の間の類似度が閾値を越えれば、クラスタは、自撮りクラスタとして識別される。実装のいくつかにおいて、このステップは、プロファイルの顔のLLC特徴を計算し、プロファイルの顔と全ての計算されたクラスタの全ての顔との間の類似度を計算するために空間ピラミッド・マッチングを用いる。次に、プロファイルの顔とクラスタとの間の平均類似度の値を計算するために用いられ得る。クラスタは、次に、平均プロファイル類似度スコアによってランク付けされ得る。より高い値は、顔がよりプロファイルの顔に類似していることを示す。実装のいくつかにおいて、ユーザ(例えば、20人、50人、もしくは100人のユーザ)による制御されたテスト及びタグ付けされた自撮りクラスタを用いて、類似度の閾値が計算される。実装のいくつかにおいて、外観判定に基づいて適切な閾値を決定するためにクラスタの顔及び対応する類似度スコア(プロファイルの顔に対する類似度)を見ることを参加者は求められる。
実装のいくつかは、ユーザのコレクションの顔のクラスタリングを実行するためのシードとしてプロファイル写真で検出された顔を用い得る。顕著なクラスタが検出された場合、自撮りクラスタとして識別される。シードを特定することは、クラスタリング・アルゴリズムを導くために、クラスタの中心を初期化するための手法である。シードの値は、クラスタリング処理の間、クラスタ中心に、より高い重要度を与えられる。実装のいくつかにおいて、シードによる開始を含むアフィニティ伝搬の修正されたバージョンが適用される。
実装のいくつかは、クラスタリング・アルゴリズムを用い、最適なクラスタを選択するために複数の技術を用いる。上記したように、技術の1つはプロファイル写真へのマッチングである。実装のいくつかによって用いられた他の技術はクラスタのサイズである。最大クラスタが自撮りクラスタである場合がある。加えて、実装のいくつかはクラスタ純度に基づいて、クラスタを選択する。純度は様々な手法で測定され、クラスタ内の画像がどの程度類似しているかを示す。「完全」なクラスタは同一である顔画像の全てを含む。クラスタの画像が相互にあまり類似していない場合、クラスタの純度は低い。実装のいくつかは、最適なクラスタを識別するためにこれらの技術の組み合わせを用いる。実装のいくつかにおいて、技術の各々はクラスタの各々のスコアを計算し、スコアは加重平均を用いて組み合わされる。
実装のいくつかは、外観クラスタリングの代わりに外観サーチを用いる。外観サーチは、プロファイル写真で検出された顔を用いる。プロファイル写真は、ユーザの写真コレクションで検出された顔の各々と比較される。閾値より高い類似度スコアを有する顔画像は自撮りの候補であり得る。外観サーチの実装のいくつかは、プロファイル写真及び顔画像の各々のLLC特徴を計算し、空間ピラミッド・マッチングを用いて、プロファイルの顔とユーザの写真の顔との間の類似度の値を計算する。類似度の閾値は自撮り候補を検出するためのカットオフ値として選択される。実装のいくつかは、ユーザ(例えば、10人のユーザもしくは100人のユーザ)及びタグ付けされた自撮り候補による制御されたテストを用いる。実装のいくつかにおいて、参加者は、外観判定に基づいて、適切な閾値を決定するために、類似度スコア(プロファイルの顔への類似度)によってランク付けされた顔を見ることを求められる。
実装のいくつかにおいて、自撮りクラスタを識別するために1つ以上の手法が用いられる。この情報は、様々な手法で統合され、組み合わせられ得る。実装のいくつかは、複数の手法から推定された自撮りの結合セットを構築する。実装のいくつかは、顔画像の各々のn次元特徴ベクトルを形成する。nは、別個の推定手法の数である。顔画像の各々について、対応する特徴ベクトルの値は、推定手法の各々に基づいて、顔画像が自撮りである推定を示す。実装のいくつかにおいて、特徴ベクトルの値は0(自撮りではない)もしくは1(自撮りである)である。実装のいくつかにおいて、特徴ベクトルの値は、顔画像が自撮りである確率を示し、0と1との間の任意の値であり得る。実装のいくつかにおいて、推定手法のいくつかは、2値(値は0もしくは1である)であり、他の推定手法は連続値(例えば、0と1との間の値)である。特徴ベクトルは自撮りとして写真の各々を分類するために分類フレームワーク内で用いられ得る。例えば、分類ネットワークは、サポート・ベクター・マシン(SVM)もしくはニューラル・ネットワークなどの機械学習を用いることが可能である。
実装のいくつかにおいて、特徴ベクトルは自撮りである確率の閾値を有する顔画像についてのみ計算される。実装のいくつかにおいて、推定手法の少なくとも1つが顔画像として識別する場合のみ、顔画像は含められる。この手法は、一般に、2値出力(イエスもしくはノー)を手法の各々が生成する場合に用いられる。確率出力を生成する推定手法について、実装のいくつかは、「候補」を宣言する、下方境界の閾値を設定し、推定手法の少なくとも1つに基づいて候補である場合のみ、顔画像は最終処理に含められる。
実装のいくつかにおいて、別個の推定手法の各々は顔画像の各々の確率もしくはスコアを計算する。確率もしくはスコアは様々な手法で組み合わされる。例えば、スコアは加重平均を用いて組み合わされてもよい。実装のいくつかにおいて、加重は、推定手法の各々の正確さを示す履歴情報に基づいて割り当てられる。実装のいくつかにおいて、計算され、組み合わされた確率、もしくはスコアは、顔画像が自撮りであるか否かに関する最終決定を行うために、閾値と比較される。実装のいくつかにおいて、組み合わされる確率もしくはスコアは、特徴ベクトルを用いて上記されるように、候補顔画像についてのみ計算される。
ユーザがプロファイル写真を有さない場合、もしくは、プロファイル写真が顔を含まない(即ち、顔が検出されない)場合、実装のいくつかは、ユーザがプロファイルに他のソーシャル・メディアのアカウントをリストしているか否かチェックする。実装のいくつかは、次に、他の指定されたソーシャル・メディアから適切なプロファイル写真を取得する。実装のいくつかは、他のソーシャル・ネットワークのユーザのプロファイルを推定し、利用可能であれば、プロファイル写真を取得する。実装のいくつかは、プロファイル写真がマイクロブログ・サイトで利用可能な場合でさえも他のソーシャル・メディアのプロファイル写真を識別し、当該プロファイル写真を用いる。他のプロファイル写真は、ユーザの年齢及び性別を決定するために、ユーザのマイクロブログ写真と組み合わされ得る。さらに、他のソーシャル・メディアに投稿された写真は、データを増大するために、マイクロブログの写真と組み合わせられ得る。2以上のプロファイル写真が利用可能である場合、自撮りクラスタを取得するために、顔をクラスタリングする複数のシードとして、全て用いられ得る。
プロファイル写真に加えて、自撮り写真もしくは自撮りクラスタを識別するための他の手法が存在する。一般的に、自撮りは、伸ばした腕で保持されるカメラによって撮影される。自撮りの顔は、写真の大きな割合を占める可能性がある。他の自撮り特徴もしくは指標は、腕が部分的に含まれていること、もしくは、風景が存在しないこと、を含む。肌検出は、コンピュータ・ビジョンの分野で研究されてきた。当該手法は、腕の存在の可能性を示すために、写真の境界に沿った肌の存在を検出するために用いられ得る。さらに、(サポート・ベクター・マシンなどの)分類手段は、自撮りの肌画素の存在し得る位置を認識するためにトレーニングされ得る。実装のいくつかは、自撮りを識別するためにクローズアップ写真と関連する他のカメラ・パラメータを用いる。
1つもしくは複数の自撮り画像が識別されると、年齢及び性別が、顔の外観に基づいて推定され得る。自撮りとして識別される顔画像は、一般に、複数存在するため、ユーザの年齢及び性別を推定するために、一括投票が行われる。
自撮りクラスタもしくは自撮り候補を用いて年齢及び性別を推定することに加え、実装のいくつかは、ユーザが投稿した写真の顔の全てについて年齢及び性別を推定する。実装のいくつかは年齢及び性別のカテゴリに関する推定の分布を形成する。例えば、実装のいくつかは年齢を範囲セットに分割し、カテゴリの各々(年齢範囲、性別)について、当該カテゴリに属すると推定される顔画像の数の合計を計算する。人口統計学セグメントへの分布は、機械学習(例えば、サポート・ベクター・マシンもしくはニューラル・ネットワーク)に基づいて、教師付き分類手段機構への入力として用いられる特徴ベクトルである。即ち、ユーザの年齢及び性別は、ユーザの写真の人物の年齢及び性別の分布に基づいて推定される。実装のいくつかは、自撮りに基づいて、他の手法と推定手法とを組み合わせる。
実装のいくつかは、予め定められた年齢及び性別に関連するコンセプトを識別するためにユーザが投稿した写真に関する外観コンセプト検出を用いる。シーンもしくはコンセプト検出は複数の写真に一括して適用され、ユーザの年齢もしくは性別を識別するために有用であり得る。例えば、ユーザの写真が学校もしくは大学の設定を示すならば、ユーザは、10代もしくはヤング・アダルトである可能性が高い。ユーザの写真が観光地への旅行を示すならば、ユーザの年齢はもう少し上である可能性が高い。コンセプトもしくはシーン・ベースによる年齢及び性別の分類手段を学習させるために、実装のいくつかは、ユーザの制御されたセットを用い、ユーザの写真に外観コンセプト検出手段を適用する。次に、コンセプト分布の特徴ベクトルが、年齢及び性別推定の教師付き分類手段のために生成される。外観コンセプト検出は単一のアイテム(例えば、男性である可能性を示すフットボールの検出)だけでなく、多くのアイテム(例えば、10代もしくはヤング・アダルトよりは年齢が上である可能性を示す多くの異なる観光地での画像)をカバーする。
実装のいくつかは、外観コンセプト及び人口統計学特性の間の相関が地理的位置などの他のファクタに基づいて異なる事実に対処する。例えば、カリフォルニアの人物についての外観コンセプト指標は、合衆国の他の地域もしくは他の国の外観コンセプト指標とは異なり得る。実装のいくつかは、指定されたサブグループにデータを分割し、関連するサブグループに基づいてユーザの各々の分析を実行することにより、この問題に対処する。
実装のいくつかにおいて、複数の手法が自撮りクラスタもしくは自撮り画像のセットを検出するために適用される。上記したように、実装のいくつかは「アーリー・フュージョン(early fusion)」を用いたデータを組み合わせる。この手法において、様々な手法の出力は特徴ベクトルに含められ、最終的な結果を決定するために、組み合わされた特徴ベクトルは分類手段によって用いられる。実装のいくつかは「レイト・フュージョン(late fusion)」を用いる。この手法において、実装のいくつかは、加重アプローチを用いて異なる分類手段によって与えられるスコアを組み合わせ、組み合わされたスコアに基づいて最終的な決定を行う。
実装のいくつかは、遅延フュージョン分類手段のために、グリーディ・フォワード・セレクション(greedy forward selection)を用いる。この技術は、(既知のグラウンド・トルース(ground truth)を含む)妥当性検証データセットへの分類実行に基づいて、異なる分類手段の加重を学習する。即ち、分類手段の予測は、その実行(例えば、注意深く構築された妥当性検証データセットへの実行)に基づいて信頼される。効率的に分類手段の加重を学習させるために、実装のいくつかはユーザの制御されたセットから妥当性検証データセットを構築する。実装のいくつかにおいて、分類手段の各々が適切に実行するように、データが収集されるに従って、加重は継時的に更新される。
実装のいくつかによれば、処理はユーザの人口統計学特性を識別する。処理は、1つもしくは複数のプロセッサ及び1つもしくは複数のプロセッサによって実行される1つもしくは複数のプログラムを記憶するメモリを含む計算処理デバイスで実行される。処理は、ユーザによってソーシャル・メディア・サイトに投稿された複数の写真を取得し、次に、取得した写真の複数の顔画像を識別する。処理は選択された顔画像のサブセットに基づいて、ユーザの1つもしくは複数の人口統計学特性を推定する。
図面において、同様の参照符号は、同様の要素を参照する。
図1は、本発明の実装のいくつかが動作する環境を例示する。図1において、ユーザ100は、クライアント・デバイス102とインタラクションする。例えば、ユーザ100は、写真1330をキャプチャするために、クライアント・デバイス102の画像センサ1300を使用することが可能である(図13)。いくつかの場合、ユーザ100は、ソーシャル・メディア・アプリケーション1326もしくは、ソーシャル・メディア・ウェブ・アプリケーション1324を用いて、ソーシャル・メディア・サイト110−1に写真1330のいくつかをアップロードする。クライアント・デバイス102は、通信ネットワーク108を介して、ソーシャル・メディア・サイト110−1と通信する。通信ネットワーク108は、インターネット、ローカル・エリア・ネットワークなどを含むことが可能である。
ソーシャル・メディア・サイト110−1は、プロファイル写真408、ユーザ100によってアップロードされたその他の写真302、及び、テキスト・ベース・メッセージ、ビデオ、ユーザ・プロファイル、アカウント情報などのその他のデータ114などユーザ100に対応するいくつかのユーザ情報112を記憶する。図1に例示されるように、サイト110−2、…、110−kを含む多くの別個のソーシャル・メディア・サイト110が存在する。ユーザ100は、写真及び/またはプロファイル写真をこれらのその他のソーシャル・ウェブサイトにもアップロードすることが可能である。
いくつかの場合、ユーザ情報112は、パブリックに利用可能に生成される。従って、解析サーバ104によるアクセスが可能である。解析サーバ104は、ソーシャル・メディア・サイト110とは無関係の第三者によって操作可能である。実装のいくつかにおいて、解析サーバ104は、情報のいくつか(例えば、写真302)を抽出し、情報を分析する。実装のいくつかにおいて、抽出された、もしくは計算されたデータは、SQLデータベース、1つもしくは複数のCSVファイル、1つもしくは複数のXMLファイル、もしくはクラウド・ストレージなどのデータベース106に記憶される。
図2は、実装のいくつかによる分析サーバ104を例示するブロック図である。分析サーバ104は、一般的に、1つもしくは複数の処理ユニット(CPU)202、1つもしくは複数のネットワークもしくはその他の通信インターフェイス204、及び、これらの要素を相互に接続する1つもしくは複数の通信バス212を含む。通信バス212は、システム要素間の通信を相互に接続し、制御する回路(チップセットとも呼ばれる)を含むことが可能である。分析サーバ104は、ディスプレイ・デバイス208及び入力デバイス210(例えば、キーボード、マウス、タッチ・スクリーン、キーパッドなど)を含むユーザ・インターフェイス206を含むことが可能である。メモリ214は、DRAM、SRAM、DDR RAMもしくはその他のランダム・アクセス・ソリッド・ステート・メモリ・デバイスなどの高速ランダム・アクセス・メモリを含む。また、メモリ214は、1つもしくは複数の磁気ディスク・ストレージ・デバイス、光ディスク・ストレージ・デバイス、フラッシュ・メモリ・デバイス、もしくはその他の不揮発性ソリッド・ステート・ストレージ・デバイスなどの不揮発性メモリを含むことも可能である。メモリ214は、CPU202から離れて配置される1つもしくは複数のストレージ・デバイスを含むことが可能であるが、必須ではない。メモリ214、もしくはメモリ214内の不揮発性メモリ・デバイスは、非一時的コンピュータ可読ストレージ媒体を含む。実装のいくつかにおいて、メモリ214は、以下のプログラム、モジュール、及びデータ構造、もしくは、プログラム、モジュール、及びデータ構造のサブセットを記憶する。
●オペレーティング・システム216。
オペレーティング・システム216は、様々な基本システム・サービスを扱うためのプロシージャ及びハードウェア依存タスクを実行するためのプロシージャを含む。
●通信モジュール218。
通信モジュール218は、1つもしくは複数の通信インターフェイス204(有線もしくは無線)及び1つもしくは複数の通信ネットワーク108(インターネット、その他のワイド・エリア・ネットワーク、ローカル・エリア・ネットワーク、メトロポリタン・エリア・ネットワークなど)を介して、その他のコンピュータに分析サーバ104を接続するために使用される。
●ユーザ・インターフェイス・モジュール220(省略可能)。
ユーザ・インターフェイス・モジュール220は、入力デバイス210を介してユーザからコマンドを受信し、ディスプレイ・デバイス208のユーザ・インターフェイス・オブジェクトを生成する。
●人口統計学推定モジュール222。
人口統計学推定モジュール222は、年齢、性別など、ユーザの様々な人口統計学特性を推定するために、ソーシャル・メディア・サイト110に、ユーザ100によって投稿された写真302を用いる。人口統計学推定モジュール222は、以下に記述する様々なその他のモジュールもしくはプロシージャを呼び出す。
●機械学習モジュール224。
機械学習モジュール224は、サポート・ベクター・マシンもしくはニューラル・ネットワークなどの1つもしくは複数の機械学習アルゴリズムを実装する。一般的に、機械学習は、トレーニングにおける入力及び出力の双方の履歴データを用いて、監督指導される。機械学習モジュール224は、図10及び図11を用いて後述するように、様々な手法において適用され得る。
●顔抽出モジュール226。
顔抽出モジュール226は、写真302の顔画像306を識別する。この識別については、図3を用いて後述する。
●クラスタリング・モジュール228。
クラスタリング・モジュール228は、顔画像306にクラスタリング・アルゴリズムを実行する。実装のいくつかにおいて、クラスタリング・モジュール228は、クラスタリングを開始するために、1つもしくは複数のシード画像(例えば、1つもしくは複数のプロファイル写真408)を用いる。アフィニティ伝播、階層クラスタリング、K平均、分布ベース・クラスタリング、密度ベース・クラスタリングなど、様々なクラスタリング・アルゴリズムを用いることが可能である。
●画像マッチング・モジュール230。
画像マッチング・モジュール230は、画像の個別のペアのマッチング及びクラスタとの個別の画像のマッチングを行う。実施形態のいくつかにおいて、画像マッチング・モジュールは、空間ピラミッド・マッチングによって測定された類似性による局所制約線形符号化(LLC)に基づく外観特徴を用いる。実装のいくつかにおいて、画像マッチングは、画像のペアの類似スコアを求め、類似スコアがスコアの予め定められた閾値(画像マッチング閾値)248を越えた場合、画像のペアがマッチしたと判定する。
●外観コンセプト認識モジュール232。
外観コンセプト認識モジュール232は、データベース106に記憶された1つもしくは複数の外観コンセプトもしくはシーン250を識別する。詳細は、図9を用いて後述する。
●全体推定モジュール234。
全体推定モジュール234は、ユーザの顔画像306の各々の人口統計学特性を推定し、ユーザ100の人口統計学を推定するために、(例えば、機械学習によって)トレーニングされた分類手段に、入力として当該情報を適用する。詳細は、図10を用いて後述する。
●クラスタ純度計算モジュール236。
クラスタ純度計算モジュール236は、プロファイル写真408が存在しない場合にも効果的であり得る。顔画像306がクラスタリングされた後、クラスタ純度モジュールは、各クラスタの「純度」を求め、最高の純度を有するクラスタを自撮りクラスタであると推定する。クラスタ純度計算モジュール236については、図7A及び図7Bを用いて、後述する。実装のいくつかにおいて、最小クラスタ・サイズ238は、小さいが故に高い純度を有する小さいクラスタを選択することを避けるために用いられる。
●自撮り特徴検出モジュール240。
自撮り特徴検出モジュール240は、顔画像306もしくは自撮り特徴もしくは自撮り指標を含む写真302を識別するように構成される。実装のいくつかにおいて、自撮り特徴検出モジュール240は、腕認識モジュール242もしくは顔サイズ占有領域モジュール244などの特定の特徴を識別するために構成されたサブモジュールを含む。これらのモジュールについては、図8A及び図8Bを用いて後述する。
●データベース106。
データベース106は、様々なユーザ100のデータを含む。ユーザの各々について、データベース106は、ユーザID246のような固有の識別子を含む。ユーザID246の各々は、写真302、プロファイル写真408、写真302から抽出された顔画像306のセット、画像クラスタ404の1つもしくは複数のセット、推定された自撮り412のセット、及び様々な計算の中間結果252と関連付けられる。いくつかの場合、これらのアイテムの全ては記憶されず、実装のいくつかでは、他のデータ要素も保存される。実装のいくつかにおいて、データベース106は、画像のペアがマッチしたと識別するか否か判定するために用いられる画像マッチング閾値248を記憶する。実装のいくつかにおいて、データベース106は、外観コンセプト認識モジュール232によって用いられる外観コンセプト250のセットを記憶する。
上述した要素の各々は、上記メモリ・デバイスの1つもしくは複数に記憶されることが可能であり、上記機能を実行するための命令のセットに対応する。命令のセットは、1つもしくは複数のプロセッサ(例えば、CPU202)によって実行されることが可能である。上述したモジュールもしくはプログラム(即ち、命令のセット)は、別個のソフトウェア・プログラム、プロシージャもしくはモジュールとして実装される必要はなく、したがって、これらのモジュールの様々なサブセットは様々な実装において、組み合わされ、もしくは、再構成されることが可能である。実装のいくつかにおいて、メモリ214は、上述したモジュール及びデータ構造のサブセットを記憶することが可能である。さらに、メモリ214は、上述されていないその他のモジュール及びデータ構造を記憶してもよい。
図2は分析サーバ104を示すが、図2は、ここで説明される実装の構造的な概要ではなく、サーバのセットにおいてあり得る様々な特徴の機能的な記述を意図している。実用においては、別個に示されたアイテムは結合されてもよいし、アイテムのいくつかは分離されてもよい。例えば、図2で別個に示されるアイテムのいくつかは、単一のサーバに実装されてもよいし、単一のアイテムが1つもしくは複数のサーバによって実装されてもよい。分析サーバ104を実装するために使用されるサーバの実際の数、及び、特徴が複数のサーバにどのように割り当てられるのか、は実装毎に異なり、ピーク使用時及び平均使用時にシステムが扱わなければならないデータ・トラフィック量に部分的に依存してもよい。
図3は、ユーザがアップロードした写真302から顔画像306を抽出する(304)処理を例示する。いくつかの場合、写真302の全てが、単一のソーシャル・メディア・サイト110から受信されるが、写真302は、2以上のソーシャル・メディア・サイト110から受信される場合もある。実装のいくつかにおいて、写真が2以上のソーシャル・メディア・サイト110から取り出されると、同一の画像は取り除かれる。プロファイル写真408が利用可能である場合、顔抽出処理304は、プロファイル写真408にも適用される。顔検出は、OpenCV顔検出手段などの様々なソフトウェアを用いて実行されることが可能である。図3に例示されるように、単一の写真302は、任意の数の顔画像306を含み得る。この例示において、写真302−3は、顔画像306を含まない花の写真である。写真は、単一の人物のクローズアップ写真であり、したがって、単一の顔画像306−1が抽出される(304)。写真302−2は、二人の人物の写真であり、したがって、2つの顔画像306−2及び306−3が抽出される(304)。最後の写真302−mには、4人の人物が存在する。したがって、306−nを含む4つの顔画像306が抽出される。この図において、m個の写真302及びn個の顔画像306が存在する。n及びmは正の整数である。いくつかの場合、詳細には、写真の多くが複数の顔を含む場合、nはmよりも大きい。一方、人物を含まない風景写真が多く存在する場合、mはnより大きくなり得る。
図4及び図5は、ユーザの写真302から抽出される顔画像306にクラスタリング・アルゴリズムを用いて自撮りを識別する2つの方法を例示する。図4及び図5の双方は、ユーザのプロファイル写真408を異なる方法で用いる。いくつかの例において、ユーザの写真302が保存されているソーシャル・メディア・サイト110から抽出される単一のプロファイル写真が存在する。いくつかの例において、写真が、あるソーシャル・メディア・サイトから利用可能でない場合、リンクされている他のソーシャル・メディア・サイト110がチェックされる。例えば、あるソーシャル・メディア・サイトにおいて、ユーザ100は他のソーシャル・メディア・サイト110の1つもしくは複数のアカウントへのリンクを投稿することが可能である。実装のいくつかにおいて、リンクされているソーシャル・メディア・サイト110は、プロファイル写真が第1ソーシャル・メディア・サイト110−1から利用可能な場合であってもチェックされる。この場合、プロファイル写真は1つ以上存在してもよい。全体にわたって、プロファイル写真408は、複数のプロファイル写真が存在する場合を含む。異なるソーシャル・メディア・サイトにおけるプロファイル写真が同一である場合、実装のいくつかでは、重複したプロファイル写真を除去する。
顔画像360を一括してクラスタリングするために、2つの画像の「距離」即ち類似のコンセプトがいくつか存在すべきである。実装のいくつかは、局所制約線形符号化に基づく顔特徴を用いる。実装のいくつかにおいて、顔の各々は、21個の空間ピラミッド・グリッド(spatial pyramid grids)の各々の1024個の符号を含む、21,504の次元を有する特徴ベクトルによって示される。このコンテキストにおいて、画像の任意のペアの間の類似スコアを求めるために、空間ピラミッド・マッチングを用いることが可能である。その他の実装は、適切な顔認識システムもしくはその他の類似測定手法を用いる。実装のいくつかは、顔特徴を識別するために、もしくは、比較するために、ハフ変換を用いる。
ここで、適用されることが可能な、アフィニティ伝播、K平均、階層クラスタリング・アルゴリズムなど、様々な代替的なクラスタリング・アルゴリズムが存在する。クラスタリング・アルゴリズムのいくつかは、予め選択された数のクラスタを必要とする。アフィニティ伝播などのその他のアルゴリズムは、予め選択された数のクラスタを必要としない。凝集型クラスタリング・アルゴリズムのいくつかは、(単集合のクラスタから開始し、繰り返し結合することによって、)ボトム・アップからのクラスタを構築する。一方、分割クラスタリング・アルゴリズムは、全てを含む単一のクラスタリングで開始し、要素(顔画像306)が近くに存在するクラスタを形成するために分割される、トップ・ダウン・アプローチを有する。
クラスタリング処理402は、図4に例示するように、サイズが変動するいくつかのクラスタ404を構築する。ここでは、クラスタ404−1,404−2,404−3,…,404−rが存在し、rはnより小さい整数である。クラスタリングを行った場合でも、いくつかの単集合のクラスタが存在する可能性がある。実用的には、クラスタの各々は、単一の人物の画像を示すことが期待される。1人の人物に対応する1つより多いクラスタが存在してもよい。例えば、人物は、前面からいくつかの自撮りを撮影してもよく、側面からより多くのその他の自撮りを撮影してもよい。これらは、異なるクラスタとして出現してもよい。いくつかの例において、髪型などのその他のファクタもグループ化に影響を与える可能性がある。
図4において、クラスタ404の各々は、1つもしくは複数の自撮りクラスタを識別するためにプロファイル写真408と比較される(406)。比較406は、一般的に、クラスタリング処理において用いられる距離即ち類似測定手法と同一の手法を用いる。実装のいくつかにおいて、自撮りクラスタを識別することは、クラスタにおいて顔画像306の各々及びプロファイル写真408の間の距離を求め、平均を採ることによって達成される。実装のいくつかにおいて、クラスタにおける画像へのプロファイル写真の平均距離が、閾値よりも短い場合、クラスタは、自撮りクラスタとして識別される。実装のいくつかにおいて、考慮されるための最小クラスタ・サイズが必要とされる。比較の結果は、1つもしくは複数の自撮りクラスタ410を識別することである。自撮りクラスタ410の顔画像は、自撮り画像412として識別される。図12及び図14A〜図14Cのフローチャートに例示されるように、自撮り412は、ユーザの人口統計学特性を推定するために用いられる。例えば、自撮り画像412の年齢及び性別が個別に推定され、平均化されることが可能である。実装のいくつかにおいて、信頼度の値も求められる。例えば、3個の自撮り画像が、人物が男性であることを示唆し、その他の3個の自撮り画像が、人物が女性であることを示唆する場合、当該人物の性別に関する信頼は存在しない。一方、6個全ての自撮り画像が、ユーザが女性であると推定した場合、結果の信頼はかなり高い。年齢、性別及び人種を推定するための様々な技術が適用可能である。
図5は、図4と同様であるが、プロファイル写真408は、クラスタリング処理のシードとして用いられる。プロファイル写真シードは当該シードを中心とするクラスタを育てるので、異なる結果を生み、より正確な自撮りクラスタとなる可能性がある。これは、ボトム・アップからクラスタを構築するクラスタリング・アルゴリズムに特に有用である。クラスタが構築された後(502)、1つの自撮りクラスタを識別することは容易である。そのクラスタは、プロファイル写真408を含む。しかしながら、複数の自撮りクラスタが存在してもよい。実装のいくつかにおいて、クラスタの画像とプロファイル写真との間の平均距離が閾値より短い場合、他のクラスタが、自撮りクラスタとして識別される。この例示では、自撮りクラスタはクラスタ504−1である。他のクラスタ504−2,504−3,504−sは、自撮りクラスタとして識別されない。ここで、クラスタの数は、図4のクラスタの数と同様である必要はない。プロファイル写真408を用いることによって、異なるクラスタが存在することとなってもよい。
図4と同様に、識別された自撮りクラスタの顔画像は自撮りとして識別され、ユーザの人口統計学特性は自撮りに基づいて推定される。
図6は、クラスタリングせずに、自撮りを個別に識別する処理を例示する。この手法を用いる場合、顔画像306の各々がプロファイル写真408と比較され(604)、類似スコアが画像マッチング閾値248を越えると、顔画像は自撮りとして識別される。2以上のプロファイル写真が利用可能である場合、顔画像306の各々はプロファイル写真の各々と比較されることが可能であり、類似スコアのいずれかが閾値348を越えると、顔画像306は自撮りであると宣言される。図6において、顔画像306−2及び306−3は、プロファイル写真408とマッチする(例えば、類似スコアが閾値248より大きい)が、他の顔画像はマッチしない。従って、顔画像306−2及び306−3は自撮り画像412として識別されない。自撮り画像412が識別されると、ユーザの人口統計学特性は図4を用いて上記されたように推定されることが可能である。
図7A及び図7Bは図4と同様の処理を例示するが、この処理は、利用可能なプロファイル写真408が存在しない場合でさえも用いることが可能である。このアイデアは、自撮りクラスタは最も高い純度を有するか、もしくは、クラスタの画像間で最も高い類似度を有することに基づく。
図7Aの上部に例示するように、クラスタを構築することは図4と同様である。クラスタを構築した(402)後、純度計算に基づいて最適なクラスタ710が選択され(706)、クラスタ710の画像306が自撮り412として識別される。図4、5及び6に示すように、自撮りがユーザ100の人口統計学特性を推定するために用いられる。
最適なクラスタを識別するための処理を図7Bに例示する。実装のいくつかにおいて、純度は、クラスタ各々の画像306間の平均距離を計算することによって測定される。実装のいくつかにおいて、距離は、2つの画像の間の類似スコアの逆数として求められる。例えば、類似スコアが0〜1の間であり、1が完全なマッチを示す場合、逆数も0〜1の間である。しかしながら、類似スコアが1に近付くと逆数は0に近付く。画像306の間の距離の合計を最小化することは、純度を推定する手法の1つである。
実装のいくつかにおいて、画像の純度による選択(706)は最小(クラスタ)サイズ238を有するクラスタのみを推定する(720)。実装のいくつかにおいて、最小サイズは2もしくは3である。これによれば、単集合クラスタを「完全な」クラスタとして宣言することを避けることが可能である。実装のいくつかにおいて、最初のステップは、クラスタの各々の顔画像の各々の間の距離を計算する(722)ことである。実装のいくつかにおいて、この情報は、クラスタリング・アルゴリズム402から渡されてもよい。即ち、距離(もしくは、類似度)はクラスタリングのために計算されるので、データはクラスタ純度分析のためのその後の使用のために保存されていてもよい。計算された距離を用いる場合、各々のクラスタのために純度を計算する(724)ことが可能な複数の手法が存在する。実装のいくつかにおいて、クラスタ純度は、式724Aに例示されるように、クラスタの各々について計算された距離d(Fi,Fj)全ての平均、即ち、距離d(Fi,Fj)全てを加算した値に2/(|C|(|C|−1))を乗算した値である。ここで、|C|は、所与の顔クラスタのサイズである。純粋なクラスタは、画像間の平均距離が短い。実装のいくつかは、式724Bの純度を用いる。式724Bでは、距離d(Fi,Fj)の各々を二乗し、合計して、平方根を求め、当該値に2/(|C|(|C|−1))を乗算する。実用的には、式724Bは距離が大きいと高いペナルティを科す。純度が計算されると、最適なクラスタが、最も自撮りクラスタらしいクラスタとして選択される。
自撮りの性質は、それらを識別する特定の写真特性を導く。実装のいくつかは、これらの特性を、自撮りを識別する別個の手法として、もしくは、それらの精度を向上するために、上記された他の手法と共に用いる。例えば、実装のいくつかは、自撮りクラスタの識別を支援するために自撮り特徴を用いる。
図8Aに例示するように、自撮りでは、写真の境界に沿って、一般的に、ユーザの腕802が存在する。境界に沿った腕は、写真が他の人物によって撮影された場合、あまり一般的ではない。実装のいくつかにおいて、自撮り特徴検出モジュール240もしくは腕認識モジュール242は、写真の境界に沿って、人物の肌を識別するための技術を適用することが可能である。実装のいくつかは、境界に沿った肌画素の可能な位置を認識するために(サポート・ベクター・マシンなどの)、分類手段を用いる。
図8Bに例示するように、自撮りの他の一般的な特性は、写真の大きい割合を顔804が占めることである。自撮り特徴検出モジュール240もしくは顔サイズ占有領域モジュール244は、占有領域割合の閾値(例えば、25%)を設定し、写真で識別された顔804が当該閾値を越えた場合、写真は、仮に、自撮り画像であると識別される。
図8A及び図8Bの特性は組み合わせられることが可能である。大きな顔及び腕を有する画像は、自撮りである可能性が高い。実装のいくつかにおいて、自撮り特徴は2値である(例えば、顔画像は特定の自撮り特徴を有するか、有さない。)。実装のいくつかにおいて、自撮り特徴は連続値である(例えば、顔画像が自撮りである確率を計算する。)。実装のいくつかにおいて、自撮りを示す可能性がある様々な特性(例えば、境界に沿った腕及び顔画像範囲)が個別に追跡される。実装のいくつかにおいて、特性の各々は「特徴」として参照される。実装のいくつかにおいて、複数の特性は、単一のスコアを計算するために組み合わされる(例えば、自撮り写真を示す可能性がある5個の別個の特性に基づいて単一のスコアを計算する)。実装のいくつかにおいて、組み合わされた特性は「特徴」として参照される。実装のいくつかにおいて、値は、各々の実装された自撮り特性について計算され、値は、履歴データに関してトレーニングされた分類手段への入力特徴ベクトルとして用いられる。
図9は、外観コンセプト認識モジュール232が、ユーザの人口統計学特性を識別するために、どのように人物の顔以外の写真の要素を利用するかを例示する。データベース106は、人口統計学特性を識別するために有用なコンセプトを含む外観コンセプト250のセットを保存する。例えば、鉛筆もしくは椅子などの多くの一般的なオブジェクトは、ユーザの年齢、性別、もしくは、人種を識別するための支援となる可能性は低い。一方、いくつかのコンセプトは、年齢、性別もしくは人種と相関を有する。図9において、写真は、保存された外観コンセプト250にマッチする可能性があるフットボール・ヘルメット902及びフットボール904の画像を含む。これらの2つのアイテムは、男性のユーザをより示している。また、これらは、アメリカ人のユーザを示し、国籍もしくは地理的位置が判定されている人口統計学特性である場合、有用であり得る。
図9において、コンセプト902及び904の双方が同一の写真に現れるが、この条件が必要とされるものではない。実装のいくつかは、ユーザの写真に亘って外観コンセプトをサーチし、人口統計学推定のための識別されたコンセプトを全て組み合わせる。例えば、ユーザの写真は、異なるナショナル・パーク、様々なおいしそうなデザート、女性の衣装、もしくは、他のそのような識別可能なアイテムの写真を含み得る。
実装のいくつかにおいて、ユーザの写真302の識別されたコンセプトは、トレーニングされた識別手段のための入力ベクトルを生成するために用いられる。例えば、外観コンセプト250の各々は、ベクトルの次元に対応し、ユーザ写真でコンセプトが発見された回数は、当該次元の値として用いられる。実装のいくつかにおいて、値は、異なる数の写真を有するユーザのために正規化される。個人のサンプリング及び個人の写真を用いる場合、分類手段は、人口統計学特性とユーザ写真のコンセプトとを関連付けるためにトレーニングされ得る。実装のいくつかにおいて、トレーニング処理は、ユーザの人口統計学特性を区別する際に、最も有用なコンセプトを識別するために用いられる。実装のいくつかにおいて、実際に用いられる外観コンセプトの数は100、200、500、もしくは1000である。処理スピードが重要でない場合、実装のいくつかはさらに他の外観コンセプト250を用いる。
図10は、顔画像306のいくつかもしくは全ての人口統計学特性を推定し、当該推定に基づいてユーザの人口統計学特性を推定するアプローチを例示する。即ち、家族、友人及び自撮りのユーザ写真に基づいて、ユーザの特性を推定するが、いずれの写真が自撮りであるか詳細に識別しない。実装のいくつかにおいて、このアプローチは、全体推定モジュール234によって実行される。実装のいくつかにおいて、全体推定モジュール234は、顔画像306の全て(もしくは大部分)の人口統計学特性を推定する。これは、顔画像306の数が少ない(例えば、20もしくは30)場合に適している。顔画像の数がより多い(例えば、100以上)の場合、実装のいくつかは、顔画像のサンプルを採り、当該サンプルの顔画像の人口統計学特性を求める。実装のいくつかにおいて、サンプルは総数における予め定められた割合(例えば、少なくとも50%もしくは少なくとも25%)を越える必要がある。実装のいくつかにおいて、サンプル・セットは、統計的に大きく(例えば、サンプルの結果が全体セットの結果を示す95%の信頼度)なければならない。例のいくつかにおいて、30もしくは50の顔画像のサンプルは、1000の顔画像の人口統計学特性を合理的に推定するために十分であり得る。この手法において、顔画像の実質的な数は、分布を構築するために用いられる。
図10に例示されるように、全体アプローチは、顔画像306に対応する人口統計学特性を推定する(1002)ことによって開始する。これには、既知の技術の何れかを用いることが可能である。この例において、顔画像306−1、306−2、306−3、306−4、…、306−nは、n個の推定1004−1、1004−2、1004−3、1004−4、…、1004−nをもたらす。いくつかの場合、推定が特定の画像について不確定であれば、当該画像はこのアプローチの他の処理から除外される。この例において、デモグラフィック特性は、年齢及び性別のみを含むが、同一の手法は人口統計学特性の他のセットにも適用され得る。上記したように、顔画像のセットが大きい場合、処理は、顔画像のサンプルを選択し、サンプルの顔画像(即ち、相当数の顔画像)の人口統計学特性を求める。
全体推定モジュール234は、次に、人口統計学特性に基づいてセグメントに分解することにより、推定の分布1008を構築する(1006)。この例示において、8個の年齢範囲が存在するが、実装は、より多くのもしくはより少ない範囲を用いてもよいし、範囲のサイズを調整してもよい。例えば、ヤング・アダルトについて範囲をより小さくすることがより重要であり得る。実装のいくつかにおいて、データが広告対象に対してその後用いられる場合、広告対象に必要とされる年齢範囲が推定に用いられる。実装のいくつかにおいて、分布1008のデータは、ユーザの各々が有する写真の数について正規化される。例えば、分布エントリの全ての合計が1となるように、顔画像の合計によって数の各々を除算する。分布のデータは、トレーニングされた分類手段1016への入力(1014)として用いられる特徴ベクトル1012を構築する(1010)ために用いられる。分類手段は、ユーザ及びユーザの写真のサンプルに基づいてトレーニングされる。入力特徴ベクトル1012を用いた場合、トレーニングされた分類手段1016は、ユーザの人口統計学特性の推定(1020)を出力する(1018)。この例において、推定1020は、性別及び特定の年齢であるが、実装のいくつかにおいて、推定は性別及び年齢の範囲(例えば、分布1008で用いられている年齢の範囲の1つ)である。
上記されるように、多くの異なる技術が、ユーザの人口統計学特性を識別するために適用され得る。実装のいくつかは、これらの技術の一つもしくは複数を組み合わせる。これによれば、より正確な結果を生成し、生成された推定はより高い信頼度を備えることが可能となる。図11及び図12は、技術が併合され得る2つの手法を例示する。
図11において、自撮りを識別する技術は、どの写真が実際に自撮りであるかをより適切に推定するために組み合わされる。この例示において、3つの別個の技術1102−1、1102−2及び1102−3が別個に画像セット1100に適用され、技術の各々は、推定された自撮りセット1104−1、1104−2及び1104−3を識別する。これらは、図4、図5、図6、図7A、図7B、図8A、図8B、図9に例示される技術などの任意の技術であってよい。
個別の技術の各々は、自撮りセット1104−1、1104−2及び1104−3から構築される(1106)特徴ベクトル1108のセットの次元と関連する。顔画像の各々について、特徴ベクトル1108は生成され(1106)、特徴ベクトルの要素は、どの技術が画像を自撮りとして推定したかを示す。例えば、第1顔画像F.1(306−1)は最初の2つの技術1102−1及び1102−2によって自撮りであると推定されるが、第3の技術1102−3によっては自撮りであるとして推定されない。したがって、対応する特徴ベクトル1108−1は[1,1,0]である。実装のいくつかにおいて、値は1もしくは0であり、当該値は、顔画像が自撮りとして識別されるか、されないか、を示す。実装のいくつかにおいて、技術の1つもしくは複数は自撮り確率を出力する。その値は0と1との間であり、自撮り確率は特徴ベクトル1108に用いられる。一般的に、少なくとも1つの技術によって自撮りとして識別された画像だけがさらに処理される。ここで、完璧を期すために、特徴ベクトル1108−2、108−5、1108−6、及び1108−7を例示する。これらのベクトルは、全て0である。なぜならば、対応する画像はいずれの技術によっても自撮りとして識別されないからである。
顔画像F.8は、3つの技術全てによって自撮りとして識別されるため、特徴ベクトル1108−8の要素は全て1である。特徴ベクトル1108−3及び1108−4は顔画像F.3(306−3)及びF.4(306−4)に対応する。これらの画像は少なくとも1つの技術によって自撮りであると識別されるが、1つもしくは複数の他の技術によっては、自撮りであると識別されない。(図示されない)実装のいくつかにおいて、技術のシンプルな多数決が、自撮り推定を組み合わせるために用いられる。シンプルな多数決によれば、顔画像F.1、F.3及びF.8は自撮りとして識別されるが、3票の内、1票しか獲得していないため、画像F.4は自撮りに含められない。
実装のいくつかにおいて、特徴ベクトル1108は、トレーニングされた分類手段1110(例えば、機械学習モジュール224)への入力として用いられる。分類手段は、ユーザのサンプル及び対応する写真を用いて予めトレーニングされている。実装のいくつかにおいて、100人の人物のサンプルが、分類手段1110をトレーニングするために適切である。しかしながら、実装のいくつかにおいて、より多いもしくはより少ないサンプルが用いられる(例えば、50人の人物もしくは、500人の人物)。分類手段1110は、推定1114を求めるために入力ベクトル1108の各々を推定する(1112)。この例示において、推定1114−1,1114−3及び1114−8は、(画像F.1,F.3,及びF.8に対応する)自撮りを示し、推定1114−4は画像F.4が自撮りであると考えられないことを示す。実用において、推定1114−2,1114−5,1114−6及び1114−7は、入力ベクトルが全て0であるため、求められない。この手法において、複数の技術を組み合わせることによって、写真が自撮りである推定における信頼性が増大する。
図12は、レイト・フュージョンとして参照されることがある手法における技術の組み合わせを例示する。この例において、技術の各々はユーザの人口統計学特性を推定するために適用される。最後に、一般的に、加重平均を用いて、技術の全ての結果が組み合わされる。この例において、上記された他の技術の各々が適用されるが、実装のいくつかはこれらの技術の全てより少ない技術を用いる。
図4、図5、図6、図7A、図7B、図8A、図8Bに上記したように、自撮り画像を識別するための様々な技術が存在する。自撮り画像のセットが識別されると、画像は、人口統計学特性を推定するために推定されてもよい。この例において、第1の技術は、ユーザが27歳の男性であると推定し(1202−1)、第2の技術はユーザが25歳の男性であると推定し(1202−2)、第3の技術はユーザが27歳の女性であると推定し(1202−3)、第4の技術はユーザが30歳の男性であると推定し(1202−4)、第5の技術はユーザが28歳の男性であると推定する(1202−5)。この例において、これらは自撮り画像の識別に基づく5つの推定技術である。実装のいくつかにおいて、これらの技術(もしくはこれらの技術のサブセット)は、図11に例示されるように組み合わされてもよい。
自撮りを用いた技術に加えて、実装のいくつかは、自撮り画像を詳細に識別しない1つもしくは複数の技術を含む。例えば、上記図9は、外観コンセプトを用いた技術を例示し、図10は、顔画像の全てを用いた全体的アプローチを例示する。これらの技術の各々は、ユーザの人口統計学特性1202−6及び1202−7を推定するために適用され得る。
最後に、最終推定1206を生成するために、個別の推定1202の結果が組み合わされる(1204)。この例において、ユーザは、27歳の男性であると推定される。この組み合わせは、個別推定の加重平均を用いて実行され得る。推定は、技術の各々の正確さの履歴に基づいて加重され得る。実装のいくつかにおいて、個別推定1202は、トレーニングされた分類手段への入力のための特徴ベクトルとして用いられ、分類手段は最終推定を求める。分類手段は、一般的に、サポート・ベクター・マシンもしくはニューラル・ネットワークなどの機械学習手法を用いる。
図13は、実装のいくつかによるクライアント・デバイス102を例示するブロック図である。クライアント・デバイス102は、ソーシャル・メディア・サイト110にアクセス可能なデスクトップ・コンピュータ、ラップトップ・コンピュータ、モバイル・デバイス、もしくは、任意のほかの計算処理装置であってよい。クライアント・デバイス100は、一般的に、1つもしくは複数の処理ユニット(CPU)1302、1つもしくは複数のネットワークもしくは他の通信インターフェイス1304、メモリ1314、及びこれらの要素を相互に接続する1つもしくは複数の通信バス1312を含む。通信バス1312は、システム要素間を相互に接続し、システム要素間の通信を制御する(チップセットと呼ばれることがある)回路を含み得る。クライアント・デバイス102は、ディスプレイ・デバイス1308及び入力デバイス/機構1310(例えば、キーボード、マウス、タッチ・スクリーン、物理ボタンなど)を含むユーザ・インターフェイス1306を含む。例のいくつかにおいて、クライアント・デバイスは、さらに、写真を取得する画像センサ1300を含む。
メモリ1314は、DRAM、SRAM、DDR RAMもしくは他のランダム・アクセス・ソリッド・ステート・メモリ・デバイスなどの高速ランダム・アクセス・メモリを含む。メモリ1314は、1つもしくは複数の磁気ディスク・ストレージ・デバイス、光ディスク・ストレージ・デバイス、フラッシュ・メモリ・デバイスもしくは他の不揮発性ソリッド・ステート・ストレージ・デバイスなどの不揮発性メモリを含んでいてもよい。メモリ1314は、CPU1302から離して配置された1つもしくは複数のストレージ・デバイスを含んでいてもよいが、必須ではない。メモリ1314もしくは代替的にメモリ1314内の不揮発性メモリ・デバイスは、コンピュータ可読ストレージ・メディアを含む。実装のいくつかにおいて、メモリ1314は、以下のプログラム、モジュール及びデータ構造もしくは、プログラム、モジュール及びデータ構造のサブセットを記憶する。
●オペレーティング・システム1316。
オペレーティング・システム1316は、様々な基本システム・サービスを扱うための、及び、ハードウェア依存タスクを実行するためのプロシージャを含む。
●通信モジュール1318。
通信モジュール1318は、1つもしくは複数の通信インターフェイス1304(有線もしくは無線)、及び、インターネット、他のワイド・エリア・ネットワーク、ローカル・エリア・ネットワーク、メトロポリタン・エリア・ネットワークなどの1つもしくは複数の通信ネットワークを介して、他のコンピュータ・システムにクライアント・デバイス102を接続するために用いられる。
●ユーザ・インターフェイス・モジュール1320。
ユーザ・インターフェイス・モジュール1320は、入力デバイス1310を介してユーザから命令を受信し、ディスプレイ・デバイス1308にユーザ・インターフェイス・オブジェクトを生成する。
●ウェブ・ブラウザ1322。
ウェブ・ブラウザ1322は、通信ネットワークを介して、リソース、ウェブ・ページ、ウェブ・アプリケーションに、ユーザがアクセスすることを可能にする。いくつかの例において、ユーザ100は、ブラウザ内で稼働するソーシャル・メディア・ウェブ・アプリケーション1324を用いて、ソーシャル・メディア・サイト110にアクセスする。
●ソーシャル・メディア・アプリケーション1326。
ソーシャル・メディア・アプリケーション1326は、ウェブ・ブラウザ1322とは別個に稼働する。
●データベース1328。
実装のいくつかにおいて、データベースは、クライアント・デバイス102の画像センサ1300によって取得された写真1330を保存する。
上記要素の各々は、上記機能を実行するための命令セットに対応し、上記メモリ・デバイスの1つもしくは複数に保存されてもよい。命令セットは、1つもしくは複数のプロセッサ(例えば、CPU1302)によって実行され得る。上記モジュールもしくはプログラム(即ち、命令セット)は、別個のソフトウェア・プログラム、プロシージャ、もしくはモジュールとして実装される必要はなく、したがって、これらのモジュールの様々なサブセットが組み合わせられてもよいし、もしくは、様々な実装において再構成されてもよい。実装のいくつかにおいて、メモリ1314は、モジュールのサブセット及び上記データ構造を保存してもよい。さらに、メモリ1314は、上記されていない他のモジュール及びデータ構造を保存してもよい。
図13は、クライアント・デバイス102を示すが、図13は、ここで記述する実装の構造的概要ではなく、クライアント・デバイス102に存在する様々な特徴の機能的な記述を意図している。いくつかの例において、分析サーバ104に関して上記された機能は、クライアント・デバイス102によって実行されてもよいし、もしくは、処理は、クライアント・デバイス102と分析サーバ104との間で分割されてもよい。
図14A〜図14Cは、年齢及び性別などのユーザ人口統計学特性を識別する(1402)ための処理1400を例示する。処理は、1つもしくは複数のプロセッサ及び1つもしくは複数のプロセッサによる実行のための1つもしくは複数のプログラムを記憶するメモリを有する分析サーバ104などの計算処理デバイスによって実行される(1404)。処理1400は、ユーザ100によって、ソーシャル・メディア・サイト110に投稿された複数の写真302を取得する(1406)。実装のいくつかにおいて、写真302は、2以上のソーシャル・メディア・サイト110から取得される。実装のいくつかにおいて、写真302の1つもしくは複数は、他のユーザによってソーシャル・メディア・サイトに投稿され、ユーザ100に対応する写真として「タグ付け」される。いくつかの例において、タグ付け処理は、ユーザ100に対応する写真の特定の画像を識別する。実装のいくつかにおいて、ユーザ100のタグ付けされた写真は、ユーザ100の人口統計学特性を推定する他の手法を提供する。
処理は、図3を用いて上記されたように、取得された写真の顔画像を識別する(1408)。次に、図4〜12に例示された処理を用いて、処理は、顔画像の選択されたサブセットに基づいて、ユーザの1つもしくは複数の人口統計学特性を推定する(1410)。実装のいくつかにおいて、人口統計学特性は年齢及び性別を含む(1412)。実装のいくつかにおいて、人口統計学特性は人種を含む。
実装のいくつかにおいて、処理は、ソーシャル・メディア・サイト110からプロファイル写真408を取得する(1414)。いくつかの例において、処理は、2以上のソーシャル・メディア・サイト110から、ユーザのプロファイル写真408を取得する。いくつかの例において、プロファイル写真408は、写真302が取得されたサイトとは異なるソーシャル・メディア・サイトから取得される。実装のいくつかにおいて、処理は、図4及び図5に例示されるように、顔画像をクラスタにグループ化するクラスタリング・アルゴリズムを適用する(1416)。これらの実装のいくつかにおいて、プロファイル写真408は、図5に例示されるように、クラスタリング・シードとして用いられる(1418)。
実装のいくつかにおいて、顔画像がクラスタリングされた後、処理は、取得したプロファイル写真408と最もマッチするクラスタを選択する(1420)。これは、図4のステップ406に例示されている。実装のいくつかにおいて、クラスタは、クラスタ純度が最高である(例えば、クラスタの画像が全て相互に「近い」)ことに基づいて選択される(1422)。クラスタ純度の使用は、図7A及び図7Bを用いて上記された。実装のいくつかにおいて、選択されたクラスタは、ユーザの人口統計学特性を推定する顔画像のサブセットとして用いられる(1424)。実装のいくつかにおいて、プロファイル写真408がクラスタリング・シードとして用いられると、プロファイル画像を含むクラスタがユーザの人口統計学特性を決定する画像のサブセットとして用いられる(1426)。
実装のいくつかにおいて、人口統計学特性を推定するために用いられる顔画像のサブセットは、取得されたプロファイル写真408との類似度が予め定められた閾値よりも大きい画像セットである。これは、図6を用いて上記されている。実装のいくつかにおいて、類似度は、空間ピラミッド・マッチングを用いて測定される(1430)。
実装のいくつかにおいて、顔画像のサブセットは、1つもしくは複数の自撮り特徴を有する取得された写真の画像の存在に基づいて選択される(1432)。これは、自撮り特徴の2つの例を提供する図8A及び図8Bを用いて上記された。図8Bに例示されたように、実装のいくつかにおいて、自撮り特徴は、写真の占有領域割合の閾値を越える顔画像を含むことである(1434)。図8Bに例示するように、自撮りは、一般的に、単一の大きな顔画像804を有する。図8Aに例示するように、実装のいくつかにおいて、自撮り特徴は、写真の周囲に沿って、写真の人物の腕802の画像を検出することを含む(1436)。
実装のいくつかにおいて、人口統計学特性を推定することは、図9を用いて上記したように、取得した写真の識別されたオブジェクトの画像を用いる(1438)。識別されたオブジェクトは人口統計学特性の1つもしくは複数に対してスキューを有する(1438)。識別されたオブジェクトに基づいた推定は、複数のオブジェクトが同様のスキューを有すると識別された場合(例えば、男性ユーザと関連する可能性がより高い複数のオブジェクト)、より大きい信頼性を有する。識別されたオブジェクトは取得された写真の何れかに現れてもよく、同一の写真に現れる必要はない。実装のいくつかにおいて、識別されたオブジェクトの画像は、自撮りとして識別された写真に現れる(1440)。
実装のいくつかは、図10に例示された他の技術を用いる。この技術によれば、処理1400は、識別された顔画像の複数(実質的な数)についての人口統計学特性を決定する(1442)。図10を用いて上記したように、実質的な数は、画像の全て、割合の閾値よりも多い(例えば、25%より多い、もしくは、50%より多い)数、もしくは、統計的に大きい数(例えば、90%の信頼度もしくは95%の信頼度であると推定されるために十分な数)であってよい。決定された人口統計学特性に基づいて、処理1400は、決定された人口統計学特性の分布1008を構築する(1444)。図10に例示される分布1008は、特定の年齢幅と共に、年齢及び性別を用いる。しかしながら、分布は、他のもしくは異なる特性を用いてもよいし、年齢を異なる範囲に分割してもよい。図10の下部に例示されるように、実装のいくつかは、ユーザのソーシャル・メディア写真及びユーザの人口統計学データの人口統計学特性の履歴データに関してトレーニングされた分類手段への特徴入力として分布を用いる(1446)。
図11及び図12に例示されるように、ユーザの人口統計学特性を決定するために様々な開示の技術を組み合わせてもよい。実装のいくつかにおいて、処理1400は、顔画像に対してN個の別個の推定手法を適用する(1448)。手法の各々は、ユーザの画像であると推定される顔画像のセットの各々を識別する(1448)。Nは2以上の整数である。実装のいくつかにおいて、処理は、顔画像の候補セットを形成するために、顔画像の識別されたセットの各々を組み合わせる(1450)。
候補セットの顔画像の各々について(1452)、実装のいくつかは、N次元特徴ベクトルを各々形成する(1454)。特徴ベクトルの各々の次元の各々は、推定手法の1つに固有に対応し(1454)、特徴ベクトルの各々の値は、どの推定手法が顔画像の各々をユーザの画像であると推定したかを示す(1454)。処理1400は、顔画像の各々がユーザの画像であるか否かを推定するためにトレーニングされた分類手段への入力として特徴ベクトルの各々を用いる(1456)。これは、図11に上記される。顔画像の選択されたサブセットは、トレーニングされた分類手段によってユーザの画像であると決定された顔画像を含む(1458)。
実装のいくつかにおいて、複数の推定手法が顔画像に適用される(1460)。手法の各々は、ユーザの画像であると推定された顔画像のセット各々を識別する(1460)。顔画像の識別されたセットは、顔画像の候補セットを形成するために組み合わされる(1462)。処理は、次に、推定手法によって提供されたスコアの加重平均を用いて候補セットの顔画像の各々にスコアを付ける(1464)。これは図12を用いて上記されている。顔画像の選択されたサブセットは、予め定められた閾値を越える加重平均スコアを有する顔画像を含む(1466)。
説明のために、上記は特定の実装を参照して記述された。しかしながら、上記は、網羅的であること、もしくは、開示の詳細な形態に本発明を限定することを意図していない。多くの変形が上記教示の観点から可能である。例えば、上記様々な技術は、様々な手法で組み合わせ得る。これにより、推定のより高い正確性もしくは推定のより高い信頼性をもたらされる。本発明の原理及びその実用的な適用を最も適切に説明するために、実装が選択され、記述された。これにより、本発明及び様々な変更を含む様々な実装を考えられる特定の利用に適するように、もっとも適切に利用することが可能となる。
104 分析サーバ
202 CPU
222 人口統計学推定モジュール
226 顔抽出モジュール
232 外観コンセプト認識モジュール
234 全体推定モジュール
240 自撮り特徴検出モジュール

Claims (27)

  1. 少なくとも1つのプロセッサ、及び、少なくとも1つの前記プロセッサによって実行される少なくとも1つのプログラムを記憶するメモリを含む計算処理デバイスが、
    ユーザによってソーシャル・メディア・サイトに投稿される複数の写真を取得し、
    取得した前記写真から複数の顔画像を識別し、
    前記ソーシャル・メディア・サイトから前記ユーザのプロファイル写真を取得し、
    前記ソーシャル・メディア・サイトのプロファイルに、前記ユーザの他のソーシャル・メディアのアカウントが登録されているかを判定し、
    前記他のソーシャル・メディアのアカウントが登録されている場合、当該他のソーシャル・メディアから、前記ユーザの他のプロファイル写真を取得し、
    複数の前記顔画像を複数のクラスタにグループ化するクラスタリング・アルゴリズムを適用し、
    複数の前記クラスタの内の、取得した前記プロファイル写真と前記他のプロファイル写真とに最もマッチするクラスタを選択し、
    選択された前記クラスタに含まれる前記顔画像を含むサブセットに基づいて、前記ユーザの少なくとも1つの人口統計学特性を推定する、
    ユーザの人口統計学特性を推定する方法。
  2. 少なくとも1つのプロセッサ、及び、少なくとも1つの前記プロセッサによって実行される少なくとも1つのプログラムを記憶するメモリを含む計算処理デバイスが、
    ユーザによってソーシャル・メディア・サイトに投稿される複数の写真を取得し、
    取得した前記写真から複数の顔画像を識別し、
    前記ソーシャル・メディア・サイトに、前記ユーザのプロファイル写真が登録されていない場合、あるいは前記ユーザのプロファイル写真から顔が検出されない場合、前記ソーシャル・メディア・サイトのプロファイルに、前記ユーザの他のソーシャル・メディアのアカウントが登録されているかを判定し、
    前記他のソーシャル・メディアのアカウントが登録されている場合、当該他のソーシャル・メディアから、前記ユーザの他のプロファイル写真を取得し、
    複数の前記顔画像を複数のクラスタにグループ化するクラスタリング・アルゴリズムを適用し、
    複数の前記クラスタの内の、取得した前記他のプロファイル写真に最もマッチするクラスタを選択し、
    選択された前記クラスタに含まれる前記顔画像を含むサブセットに基づいて、前記ユーザの少なくとも1つの人口統計学特性を推定する、
    ユーザの人口統計学特性を推定する方法。
  3. 前記計算処理デバイスは、顔画像の前記サブセットを選択するために
    記プロファイル写真をクラスタリング・シードとして用いて、複数の前記顔画像を複数のクラスタにグループ化するクラスタリング・アルゴリズムを適用し、
    顔画像の選択された前記サブセットは、前記プロファイル写真に対応する前記クラスタの前記顔画像を含む、
    請求項1又は請求項2に記載の方法。
  4. 前記計算処理デバイスは、顔画像の前記サブセットを選択するために
    得した前記プロファイル写真に対する類似度が予め定められた類似度の閾値より大きい前記顔画像のサブセットを選択する、
    請求項1又は請求項2に記載の方法。
  5. 前記類似度は、空間ピラミッド・マッチングを用いて求められる、請求項4に記載の方法。
  6. 前記計算処理デバイスは、顔画像の前記サブセットを選択するために
    高クラスタ純度を有する複数の前記クラスタからクラスタを選択し、
    顔画像の選択された前記サブセットは、選択された前記クラスタの前記顔画像を含む、
    請求項1又は請求項2に記載の方法。
  7. 前記計算処理デバイスは、顔画像の前記サブセットを選択するために、
    少なくとも1つの自撮り特徴を有する取得した前記写真内の顔画像の存在に基づいて、前記顔画像の少なくとも1つを選択する、
    請求項1又は請求項2に記載の方法。
  8. 写真の前記自撮り特徴は、前記写真の占有領域割合閾値を越える顔画像を有することを含む、
    請求項7に記載の方法。
  9. 写真の前記自撮り特徴は、前記写真の周囲に沿った前記写真の内の人物の腕の画像を検出することを含む、
    請求項7又は請求項8に記載の方法。
  10. 前記ユーザの少なくとも1つの人口統計学特性を推定することは、
    さらに、取得した前記写真の内の識別されたオブジェクトの画像に基づき、
    識別された前記オブジェクトは、少なくとも1つの人口統計学特性に対するスキューを有する、
    請求項1〜9の何れか1項に記載の方法。
  11. 識別されたオブジェクトの前記画像は、自撮りとして識別された写真に現れる、請求項10に記載の方法。
  12. 前記少なくとも1つの人口統計学特性を推定することは、
    識別された前記顔画像の数について人口統計学特性を決定し、
    決定された前記人口統計学特性の分布を計算し、
    ユーザのソーシャル・メディア写真の人口統計学特性の履歴データ及びユーザの人口統計学データに関してトレーニングされた分類手段への特徴入力として前記分布を用いる、
    請求項1〜11の何れか1項の方法。
  13. 前記ユーザの少なくとも1つの人口統計学特性を推定することは、
    前記顔画像にN個の別個の推定手法を適用し、前記推定手法の各々は前記ユーザの画像であると推定された顔画像のセットの各々を識別し、Nは2以上の整数であり、
    顔画像の候補セットを形成するために識別された前記顔画像のセットの各々を組み合わせ、
    前記候補セットの内の顔画像の各々について、
    N次元特徴ベクトルを形成し、特徴ベクトルの各々の次元の各々は前記推定手法の1つに固有に対応し、特徴ベクトルの各々の値は、前記ユーザの画像であると顔画像の各々をどの推定手法が推定したかを示し、
    顔画像の各々が前記ユーザの画像であるか否か推定するためにトレーニングされた分類手段への入力として特徴ベクトルの各々を用い、
    前記顔画像の選択されたサブセットは、前記ユーザの画像であるとトレーニングされた前記分類手段によって決定された顔画像を含む、
    請求項1〜11の何れか1項に記載の方法。
  14. 前記ユーザの少なくとも1つの人口統計学特性を推定することは、
    前記顔画像に複数の推定手法を適用し、前記推定手法の各々は前記ユーザの画像であると推定された顔画像のセットの各々を識別し、
    顔画像の候補セットを形成するために顔画像の識別されたセットの各々を組み合わせ、
    前記推定手法によって提供されたスコアの加重平均を用いて前記候補セットの顔画像の各々にスコアを付け、
    前記顔画像の選択されたサブセットは加重平均されたスコアが予め定められた閾値を越える顔画像を含む、
    請求項1〜11の何れか1項に記載の方法。
  15. 少なくとも1つの前記人口統計学特性は年齢及び性別を含む、請求項1〜14の何れか1項に記載の方法。
  16. 少なくとも1つの前記人口統計学特性は人種を含む、請求項1〜14の何れか1項に記載の方法。
  17. 前記ソーシャル・メディア・サイトから取得した前記ユーザのプロファイル写真と、前記他のソーシャル・メディアから取得した前記ユーザの他のプロファイル写真とが同一である場合、重複したプロファイル写真を除去することを含む、
    請求項2、請求項2に従属する請求項3〜16の何れか1項に記載の方法。
  18. 少なくとも1つのプロセッサと、
    メモリと、
    前記メモリに記憶された少なくとも1つのプログラムと、
    を含み、
    少なくとも1つの前記プログラムは、
    ユーザによってソーシャル・メディア・サイトに投稿される複数の写真を取得し、
    取得した前記写真から複数の顔画像を識別し、
    前記ソーシャル・メディア・サイトから前記ユーザのプロファイル写真を取得し、
    前記ソーシャル・メディア・サイトのプロファイルに、前記ユーザの他のソーシャル・メディアのアカウントが登録されているかを判定し、
    前記他のソーシャル・メディアのアカウントが登録されている場合、当該他のソーシャル・メディアから、前記ユーザの他のプロファイル写真を取得し、
    複数の前記顔画像を複数のクラスタにグループ化するクラスタリング・アルゴリズムを適用し、
    複数の前記クラスタの内の、取得した前記プロファイル写真と前記他のプロファイル写真とに最もマッチするクラスタを選択し、
    選択された前記クラスタに含まれる前記顔画像を含むサブセットに基づいて、前記ユーザの少なくとも1つの人口統計学特性を推定する、
    ための命令を含む、
    ユーザの人口統計学特性を識別するコンピュータ・システム。
  19. 少なくとも1つのプロセッサと、
    メモリと、
    前記メモリに記憶された少なくとも1つのプログラムと、
    を含み、
    少なくとも1つの前記プログラムは、
    ユーザによってソーシャル・メディア・サイトに投稿される複数の写真を取得し、
    取得した前記写真から複数の顔画像を識別し、
    前記ソーシャル・メディア・サイトに、前記ユーザのプロファイル写真が登録されていない場合、あるいは前記ユーザのプロファイル写真から顔が検出されない場合、前記ソーシャル・メディア・サイトのプロファイルに、前記ユーザの他のソーシャル・メディアのアカウントが登録されているかを判定し、
    前記他のソーシャル・メディアのアカウントが登録されている場合、当該他のソーシャル・メディアから、前記ユーザの他のプロファイル写真を取得し、
    複数の前記顔画像を複数のクラスタにグループ化するクラスタリング・アルゴリズムを適用し、
    複数の前記クラスタの内の、取得した前記他のプロファイル写真に最もマッチするクラスタを選択し、
    選択された前記クラスタに含まれる前記顔画像を含むサブセットに基づいて、前記ユーザの少なくとも1つの人口統計学特性を推定する、
    ための命令を含む、
    ユーザの人口統計学特性を識別するコンピュータ・システム。
  20. 前記命令は、
    顔画像のサブセットを選択するために、
    複数のクラスタに複数の前記顔画像をグループ化するためにクラスタリング・アルゴリズムを適用し、
    複数の前記クラスタからクラスタ純度が最高であるクラスタを選択する、
    命令をさらに含み、
    顔画像の選択された前記サブセットは選択された前記クラスタの前記顔画像を含む、
    請求項18又は請求項19に記載のコンピュータ・システム。
  21. 前記ユーザの少なくとも1つの人口統計学特性を推定する命令は、さらに、
    識別された前記顔画像の複数について人口統計学特性を決定し、
    決定された前記人口統計学特性の分布を計算し、
    ユーザのソーシャル・メディア写真の人口統計学特性の履歴データ及びユーザの人口統計学データについてトレーニングされた分類手段への特徴入力として前記分布を用いる、
    命令をさらに含む、
    請求項18又は請求項19に記載のコンピュータ・システム。
  22. 少なくとも1つの前記人口統計学特性は人種を含む、請求項18〜21の何れか1項に記載のコンピュータ・システム。
  23. 前記ソーシャル・メディア・サイトから取得した前記ユーザのプロファイル写真と、前記他のソーシャル・メディアから取得した前記ユーザの他のプロファイル写真とが同一である場合、重複したプロファイル写真を除去することを含む、
    請求項19、請求項19に従属する請求項20〜請求項22の何れか1項に記載のコンピュータ・システム
  24. ユーザによってソーシャル・メディア・サイトに投稿される複数の写真を取得し、
    取得した前記写真から複数の顔画像を識別し、
    前記ソーシャル・メディア・サイトから前記ユーザのプロファイル写真を取得し、
    前記ソーシャル・メディア・サイトのプロファイルに、前記ユーザの他のソーシャル・メディアのアカウントが登録されているかを判定し、
    前記他のソーシャル・メディアのアカウントが登録されている場合、当該他のソーシャル・メディアから、前記ユーザの他のプロファイル写真を取得し、
    複数の前記顔画像を複数のクラスタにグループ化するクラスタリング・アルゴリズムを適用し、
    複数の前記クラスタの内の、取得した前記プロファイル写真と前記他のプロファイル写真とに最もマッチするクラスタを選択し、
    選択された前記クラスタに含まれる前記顔画像を含むサブセットに基づいて、前記ユーザの少なくとも1つの人口統計学特性を推定する、
    ユーザの人口統計学特性を推定する処理をコンピュータに実行させるためのプログラム。
  25. ユーザによってソーシャル・メディア・サイトに投稿される複数の写真を取得し、
    取得した前記写真から複数の顔画像を識別し、
    前記ソーシャル・メディア・サイトに、前記ユーザのプロファイル写真が登録されていない場合、あるいは前記ユーザのプロファイル写真から顔が検出されない場合、前記ソーシャル・メディア・サイトのプロファイルに、前記ユーザの他のソーシャル・メディアのアカウントが登録されているかを判定し、
    前記他のソーシャル・メディアのアカウントが登録されている場合、当該他のソーシャル・メディアから、前記ユーザの他のプロファイル写真を取得し、
    複数の前記顔画像を複数のクラスタにグループ化するクラスタリング・アルゴリズムを適用し、
    複数の前記クラスタの内の、取得した前記他のプロファイル写真に最もマッチするクラスタを選択し、
    選択された前記クラスタに含まれる前記顔画像を含むサブセットに基づいて、前記ユーザの少なくとも1つの人口統計学特性を推定する、
    ユーザの人口統計学特性を推定する処理をコンピュータに実行させるためのプログラム。
  26. 少なくとも1つの前記人口統計学特性は人種を含む、請求項24又は請求項25に記載のプログラム。
  27. 前記ソーシャル・メディア・サイトから取得した前記ユーザのプロファイル写真と、前記他のソーシャル・メディアから取得した前記ユーザの他のプロファイル写真とが同一である場合、重複したプロファイル写真を除去することを含む、
    請求項25又は請求項25に従属するに請求項26記載のプログラム。
JP2015022653A 2014-05-15 2015-02-06 ユーザの人口統計学特性を推定する方法、コンピュータ・システム、及びプログラム Active JP6536058B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14/279,184 2014-05-15
US14/279,184 US9589205B2 (en) 2014-05-15 2014-05-15 Systems and methods for identifying a user's demographic characteristics based on the user's social media photographs

Publications (2)

Publication Number Publication Date
JP2015219904A JP2015219904A (ja) 2015-12-07
JP6536058B2 true JP6536058B2 (ja) 2019-07-03

Family

ID=54538760

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015022653A Active JP6536058B2 (ja) 2014-05-15 2015-02-06 ユーザの人口統計学特性を推定する方法、コンピュータ・システム、及びプログラム

Country Status (2)

Country Link
US (1) US9589205B2 (ja)
JP (1) JP6536058B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11445148B1 (en) 2021-05-06 2022-09-13 Microsoft Technology Licensing, Llc Video teleconference curated user profile picture

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2945372A4 (en) * 2013-02-14 2016-03-30 Panasonic Ip Man Co Ltd ELECTRONIC MIRROR DEVICE
US20160019411A1 (en) * 2014-07-15 2016-01-21 Palo Alto Research Center Incorporated Computer-Implemented System And Method For Personality Analysis Based On Social Network Images
CN105488044A (zh) * 2014-09-16 2016-04-13 华为技术有限公司 数据处理的方法和设备
US10031925B2 (en) * 2014-10-15 2018-07-24 Thinkcx Technologies, Inc. Method and system of using image recognition and geolocation signal analysis in the construction of a social media user identity graph
WO2016098589A1 (ja) * 2014-12-15 2016-06-23 ソニー株式会社 情報処理装置、情報処理方法、プログラム、および情報処理システム
US11176602B2 (en) * 2015-02-20 2021-11-16 Shopper Scientist Llc Interactive transaction system, method, and device for physical merchant stores
CN105069073B (zh) * 2015-07-30 2019-12-13 小米科技有限责任公司 联系人信息推荐方法及装置
US10616351B2 (en) * 2015-09-09 2020-04-07 Facebook, Inc. Determining accuracy of characteristics asserted to a social networking system by a user
US10732809B2 (en) * 2015-12-30 2020-08-04 Google Llc Systems and methods for selective retention and editing of images captured by mobile image capture device
CN105913001A (zh) * 2016-04-06 2016-08-31 南京邮电大学盐城大数据研究院有限公司 基于聚类的在线式多人脸图像处理的方法
TWI618562B (zh) * 2016-04-27 2018-03-21 寶凱電子企業股份有限公司 具影像資料判斷功能之遊戲機
US9886651B2 (en) * 2016-05-13 2018-02-06 Microsoft Technology Licensing, Llc Cold start machine learning algorithm
CN106127732B (zh) * 2016-06-13 2019-01-01 深圳市太赫兹科技创新研究院 微波图像中人体性别检测方法和装置
GB2551715A (en) * 2016-06-27 2018-01-03 Image Capture Ltd A system and method for determining the age of an individual
US20180012237A1 (en) * 2016-07-07 2018-01-11 International Business Machines Corporation Inferring user demographics through categorization of social media data
US9870025B1 (en) * 2016-07-10 2018-01-16 Emotive Digital, LP Display case
US20180101540A1 (en) * 2016-10-10 2018-04-12 Facebook, Inc. Diversifying Media Search Results on Online Social Networks
US10606885B2 (en) * 2016-11-15 2020-03-31 Evolv Technology Solutions, Inc. Data object creation and recommendation using machine learning based online evolution
US10706289B2 (en) * 2017-03-03 2020-07-07 International Business Machines Corporation Crowd detection, analysis, and categorization
US11100572B1 (en) 2017-04-28 2021-08-24 Wells Fargo Bank, N.A. Customer verification and account creation systems and methods
US10277714B2 (en) 2017-05-10 2019-04-30 Facebook, Inc. Predicting household demographics based on image data
US10445558B2 (en) * 2017-07-17 2019-10-15 Facebook, Inc. Systems and methods for determining users associated with devices based on facial recognition of images
KR101972331B1 (ko) * 2017-08-29 2019-04-25 키튼플래닛 주식회사 영상 얼라인먼트 방법 및 그 장치
JP6829176B2 (ja) * 2017-09-29 2021-02-10 Kddi株式会社 判定装置、判定方法及び情報提供システム
US20190236450A1 (en) * 2017-12-22 2019-08-01 Snap Inc. Multimodal machine learning selector
CN111557014A (zh) * 2017-12-28 2020-08-18 连株式会社 提供多个个人资料的方法及系统
CN109086680A (zh) * 2018-07-10 2018-12-25 Oppo广东移动通信有限公司 图像处理方法、装置、存储介质和电子设备
KR101981634B1 (ko) * 2018-07-31 2019-05-23 주식회사 스토리안트 연령대별 얼굴사진 학습을 통한 지능형 얼굴사진 위치 검색장치
CN109284675B (zh) * 2018-08-13 2022-06-07 创新先进技术有限公司 一种用户的识别方法、装置及设备
CN109117891B (zh) * 2018-08-28 2022-04-08 电子科技大学 融合社交关系和命名特征的跨社交媒体账户匹配方法
US11526713B2 (en) * 2018-09-28 2022-12-13 Intel Corporation Embedding human labeler influences in machine learning interfaces in computing environments
JP7206761B2 (ja) * 2018-10-02 2023-01-18 富士フイルムビジネスイノベーション株式会社 情報処理装置
CN111104823A (zh) * 2018-10-25 2020-05-05 北京奇虎科技有限公司 人脸识别方法、装置及存储介质、终端设备
CN109886719B (zh) * 2018-12-20 2023-06-20 平安科技(深圳)有限公司 基于网格的数据挖掘处理方法、装置和计算机设备
KR102117528B1 (ko) * 2018-12-21 2020-06-01 아주대학교산학협력단 온라인 데이터에 기반한 사용자 특성 예측 장치 및 방법
US11029741B2 (en) * 2018-12-28 2021-06-08 Baidu Usa Llc Deactivating a display of a smart display device based on a vision-based mechanism
US11250243B2 (en) * 2019-03-26 2022-02-15 Nec Corporation Person search system based on multiple deep learning models
KR102300574B1 (ko) * 2019-07-10 2021-09-09 엘지전자 주식회사 사용자 신체 특성을 반영하여 파워 어시스트 모드로 이동하는 방법 및 이를 구현하는 카트로봇
CN112906725A (zh) * 2019-11-19 2021-06-04 北京金山云网络技术有限公司 统计人流特征的方法、装置及服务器
US11593445B2 (en) 2019-12-11 2023-02-28 At&T Intellectual Property I, L.P. Social communities assistant
US20240144720A1 (en) * 2022-10-26 2024-05-02 9219-1568 Quebec Inc. System and method for age estimation
CN116956097B (zh) * 2023-09-18 2023-12-12 湖南华菱电子商务有限公司 基于K-means的专家画像分析方法及系统

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7912246B1 (en) * 2002-10-28 2011-03-22 Videomining Corporation Method and system for determining the age category of people based on facial images
US7783085B2 (en) * 2006-05-10 2010-08-24 Aol Inc. Using relevance feedback in face recognition
JP2010081357A (ja) * 2008-09-26 2010-04-08 Olympus Corp 画像処理装置、画像処理方法、画像処理プログラム及び撮像装置
JP4544363B1 (ja) 2009-03-13 2010-09-15 オムロン株式会社 顔認証装置、人物画像検索システム、顔認証装置制御プログラム、コンピュータ読み取り可能な記録媒体、および顔認証装置の制御方法
JP2011107997A (ja) * 2009-11-18 2011-06-02 Sony Corp 情報処理装置、情報処理方法、およびプログラム
JP5574685B2 (ja) * 2009-12-07 2014-08-20 三菱電機株式会社 エリア情報制御装置
US9465993B2 (en) * 2010-03-01 2016-10-11 Microsoft Technology Licensing, Llc Ranking clusters based on facial image analysis
NL2004829C2 (en) * 2010-06-07 2011-12-08 Univ Amsterdam Method for automated categorization of human face images based on facial traits.
US8495143B2 (en) 2010-10-29 2013-07-23 Facebook, Inc. Inferring user profile attributes from social information
JP2013003631A (ja) * 2011-06-13 2013-01-07 Sony Corp 情報処理装置、情報処理方法、情報処理システム、及びプログラム
US8805117B2 (en) * 2011-07-19 2014-08-12 Fuji Xerox Co., Ltd. Methods for improving image search in large-scale databases
US8498491B1 (en) * 2011-08-10 2013-07-30 Google Inc. Estimating age using multiple classifiers
JP2013065110A (ja) * 2011-09-15 2013-04-11 Omron Corp 検出装置、該検出装置を備えた表示制御装置および撮影制御装置、物体検出方法、制御プログラム、ならびに、記録媒体
US9436705B2 (en) * 2013-09-17 2016-09-06 Google Technology Holdings LLC Grading images and video clips

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11445148B1 (en) 2021-05-06 2022-09-13 Microsoft Technology Licensing, Llc Video teleconference curated user profile picture
WO2022235387A1 (en) * 2021-05-06 2022-11-10 Microsoft Technology Licensing, Llc Video teleconference curated user profile picture

Also Published As

Publication number Publication date
US9589205B2 (en) 2017-03-07
US20150332087A1 (en) 2015-11-19
JP2015219904A (ja) 2015-12-07

Similar Documents

Publication Publication Date Title
JP6536058B2 (ja) ユーザの人口統計学特性を推定する方法、コンピュータ・システム、及びプログラム
US10796452B2 (en) Optimizations for structure mapping and up-sampling
US10565729B2 (en) Optimizations for dynamic object instance detection, segmentation, and structure mapping
US10733431B2 (en) Systems and methods for optimizing pose estimation
CN108304435B (zh) 信息推荐方法、装置、计算机设备及存储介质
US20230208793A1 (en) Social media influence of geographic locations
JP6451246B2 (ja) 人のソーシャルタイプを決定する方法、システム及びプログラム
EP3493106B1 (en) Optimizations for dynamic object instance detection, segmentation, and structure mapping
Wang et al. P2snet: Can an image match a video for person re-identification in an end-to-end way?
EP3493105A1 (en) Optimizations for dynamic object instance detection, segmentation, and structure mapping
WO2019132923A1 (en) Automatic image correction using machine learning
US20200143238A1 (en) Detecting Augmented-Reality Targets
CN104715023A (zh) 基于视频内容的商品推荐方法和系统
US10460174B2 (en) System and methods for analysis of user-associated images to generate non-user generated labels and utilization of the generated labels
US9652685B2 (en) Generating story graphs with large collections of online images
Pazho et al. Ancilia: Scalable intelligent video surveillance for the artificial intelligence of things
EP3493104A1 (en) Optimizations for dynamic object instance detection, segmentation, and structure mapping
JP6787831B2 (ja) 検索結果による学習が可能な対象検出装置、検出モデル生成装置、プログラム及び方法
Werner et al. DeepMoVIPS: Visual indoor positioning using transfer learning
US8270731B2 (en) Image classification using range information
CN114943549A (zh) 一种广告投放方法及装置
Chen et al. Evaluating feasibility of image-based cognitive APIs for home context sensing
Zhang et al. Multi-surface analysis for human action recognition in video
KR102060110B1 (ko) 컨텐츠에 포함되는 객체를 분류하는 방법, 장치 및 컴퓨터 프로그램
Prathiba et al. ALMEGA-VIR: face video retrieval system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180116

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190325

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190507

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190520

R150 Certificate of patent or registration of utility model

Ref document number: 6536058

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350