JP6451246B2 - 人のソーシャルタイプを決定する方法、システム及びプログラム - Google Patents

人のソーシャルタイプを決定する方法、システム及びプログラム Download PDF

Info

Publication number
JP6451246B2
JP6451246B2 JP2014233405A JP2014233405A JP6451246B2 JP 6451246 B2 JP6451246 B2 JP 6451246B2 JP 2014233405 A JP2014233405 A JP 2014233405A JP 2014233405 A JP2014233405 A JP 2014233405A JP 6451246 B2 JP6451246 B2 JP 6451246B2
Authority
JP
Japan
Prior art keywords
detected
human faces
faces
human
content items
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014233405A
Other languages
English (en)
Other versions
JP2016042346A (ja
Inventor
ジョシ ディラジ
ジョシ ディラジ
リン ディー. ウィルコックス
ディー. ウィルコックス リン
チェン フランシーン
チェン フランシーン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Publication of JP2016042346A publication Critical patent/JP2016042346A/ja
Application granted granted Critical
Publication of JP6451246B2 publication Critical patent/JP6451246B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • G06Q30/0271Personalized advertisement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/30Scenes; Scene-specific elements in albums, collections or shared content, e.g. social network photos or video

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Multimedia (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Description

本発明は、一般にはビジュアルコンテンツの分析のためのシステム、方法及びプログラムであって、より具体的には人に関係するビジュアルコンテンツを用いた人のソーシャルライフの状況について知識を得るものであり、任意には動画広告のようなコンテンツを推薦するために本知識を用いるシステム、方法及びプログラムに関する。
多くの特定の写真や動画中心のソーシャルネットワークが最近登場している(例えば、インスタグラム、スナップチャット、タンブラーやパス)。ツイッターはテキストベースのマイクロブロギングサービスを大規模に始めたが、今では画像や動画のツイートをサポートしている。写真は(1000語とまではいかないが)実にいくつかの言葉に値し、スマートフォンを用いてより簡単になっている写真のポスティングは時として分類よりも利点がある。人々がソーシャルネットワークを通して共有する写真の顔のタイプに注目することによって、写真の中の人々についてのあることを学ぶことが可能となる。例えば、人の写真が主に子供と、大人と子供の小さいグループだったとしたら、その人達は家族であろう。写真が主に人の大きなグループかほぼ同じ年齢だったとしたら、その人達はグループ活動を楽しむ誰かといった“グループの人”であろう。
米国特許出願公開第2011/0135168号明細書
チェン Yら、「グループ写真からの対の関係の予測と有益なソーシャルサブグラフの発見(Discovering informative social sub−graphs and predicting pairwise relationships from group photo)」、マルチメディアに関する第20回国際会議抄録(Proc of 20th ACM Int Conf on Mult)、米国、頁669〜678 シングラ パラグ(Singla Parag)、「マルコフ理論を用いたコンシューマ写真コレクションにおけるソーシャルリレーションの発見(Discovery of social relationships in consumer photo collections using Markov logic)」、コンピュータビジョン及びパターン認識ワークショップ(CVPRW)‘08 IEEE、米国、2008年、頁1〜7 ゴルベック ジェニファー(Golbeck Jennifer)、「ソーシャルメディアを伴うパーソナリティの予測(Predicting personality with social media)」、コンピューティングシステムにおけるヒューマンファクターに関する拡大抄録(Extended Abstracts on Human Factors in Computing Systems) ACM CHI‘11、米国、2011年、頁253〜262 チェン フィゾン(Chen Huizhong)、ギャラハーアンドリュー(Gallagher Andrew)、ジロ バーンド(Girod Bernd)、「名前には何が:顔の属性としてのファーストネーム(what‘s in a Name: First Names as Facial Attributes)」、IEEE CVPR 2013年抄録(Proc of IEEE CVPR 2013)、米国
しかしながら、関係するユーザのソーシャルライフを特徴づけるための、オンラインのソーシャルネットワーキングソースに接続された一般に利用可能なユーザの写真や動画を含むビジュアルコンテンツを活用できる決まったツールは無かった。
本明細書に記載の実施形態の一態様によれば、処理ユニットとメモリを備える計算機システムで実行する方法が提供される。この方法は、人に関係するビジュアルコンテンツアイテムを複数取得し、該取得したビジュアルコンテンツアイテムから1または複数の人間の顔を検知するよう処理ユニットを用い、該検知した人間の顔の年齢及び性別を特定するよう処理ユニットを用い、該検知した顔の数に基づき複数の特徴値を認識するよう処理ユニットを用いる。該複数の特徴値を認識することは、検知された1または複数の人間の顔から特定された年齢と性別に基づき、検知された1または複数の人間の顔の各々を複数のカテゴリーの1つに分類し、該分類された1または複数の人間の顔に基づき、検知された1または複数の人間の顔を伴う複数のビジュアルコンテンツアイテムの各々を複数のバケットの一つに割り当て、検知された1または複数の人間の顔のカテゴリーに基づき、複数のバケットの各々について特徴値を計算することを含む。該特定された複数の特徴値に基づき、人のソーシャルタイプを決定する。
一つもしくは複数の実施形態において、人のソーシャルタイプは、人に関する追加情報に基づき更に決定され、該追加情報は、人に関係するビジュアルコンテンツアイテム以外のソースから獲得される。
一つもしくは複数の実施形態において、人のソーシャルタイプの決定は、複数の異なるソーシャルタイプのモデルに基づき、機械学習を用いて実行される。
一つもしくは複数の実施形態において、複数の異なるソーシャルタイプは、個人、恋愛関係、家族の一員、または、グループの一員を含む。
一つもしくは複数の実施形態において、更に、決定された人のソーシャルタイプに基づき第二の複数のコンテンツアイテムから第二のコンテンツアイテムを選択することを含み、該選択された第二のコンテンツアイテムは最も適切に決定された人のソーシャルタイプである。
本明細書に記載の実施形態の一態様によれば、処理ユニット及びメモリを備える計算機システムで実行する方法が提供される。この方法は、人に関係するビジュアルコンテンツアイテムを複数取得し、該取得したビジュアルコンテンツアイテムから1または複数の人間の顔を検知するよう処理ユニットを用い、該検知した人間の顔の年齢及び性別を特定するよう処理ユニットを用い、該検知した顔の数に基づき複数の特徴値を認識するよう処理ユニットを用い、該特定された複数の特徴値に基づき、第二の複数のコンテンツアイテムから第二のコンテンツアイテムを選択する。
一つもしくは複数の実施形態において、複数の特徴値は人の特徴ベクトルから構成され、また該複数の特徴値は人の特徴ベクトル座標である。
一つもしくは複数の実施形態において、複数の特徴値を認識することは、検知された1または複数の人間の顔から特定された年齢及び性別に基づき、検知された1または複数の人間の顔の各々を複数のカテゴリーの一つに分類し、該分類された1または複数の人間の顔に基づき、検知された1または複数の人間の顔を伴う複数のビジュアルコンテンツアイテムの各々を複数のバケットの一つに割り当て、検知された1または複数の人間の顔のカテゴリーに基づき、複数のバケットの各々の特徴値を計算する。
一つもしくは複数の実施形態において、複数の人に関係するビジュアルコンテンツアイテムは複数の写真であり、更に複数の写真の内、1または複数の人間の顔を検知していない写真を除外する。
一つもしくは複数の実施形態において、複数の人に関係するビジュアルコンテンツアイテムは複数の動画であり、複数の動画の各々は複数の動画フレームを含み、1または複数の人間の顔は複数の動画フレームの各々から検知される。
一つもしくは複数の実施形態において、第二の複数のコンテンツアイテムは動画広告である。
一つもしくは複数の実施形態において、第二の複数のコンテンツアイテムは動画である。
一つもしくは複数の実施形態において、第二の複数のコンテンツアイテムから第二のコンテンツアイテムを選択することは、第二の複数のコンテンツアイテムの各々の第二の複数の特徴値を認識し、該認識した第二の複数の特徴値と前記認識した複数の特徴値とを直接比較し、該比較の結果に基づき第二のコンテンツアイテムを選択する。
一つもしくは複数の実施形態において、第二の複数のコンテンツアイテムの各々の第二の複数の特徴値を認識することは、第二の複数のコンテンツアイテムから1または複数の第二の人間の顔を検知し、該検知した人間の顔の年齢及び性別を特定し、該検出した人間の顔の数に基づき第二の複数の特徴値を認識する、ことを含む。
一つもしくは複数の実施形態において、第二の複数の特徴値を認識することは、検知された1または複数の人間の顔から特定された年齢及び性別に基づき、検知された1または複数の人間の顔の各々を複数のカテゴリーの一つに分類し、該分類された1または複数の人間の顔に基づき、検知された1または複数の人間の顔を伴う複数のビジュアルコンテンツアイテムの各々を複数のバケットの一つに割り当て、検知された1または複数の人間の顔のカテゴリーに基づき、複数のバケットの各々の特徴値を計算する、ことを含む。
本明細書に記載の実施形態の別態様によれば、計算機システムが提供される。このシステムは、(a)人に関係するビジュアルコンテンツアイテムを複数取得する手段と、該取得したビジュアルコンテンツアイテムから1または複数の人間の顔を検知する手段と、該検知した人間の顔の年齢及び性別を特定する手段と、該検知した顔の数に基づき複数の特徴値を認識する手段であって、検知された1または複数の人間の顔から特定された年齢及び性別に基づき、検知された1または複数の人間の顔の各々を複数のカテゴリーの一つに分類する手段と、該分類された1または複数の人間の顔に基づき、検知された1または複数の人間の顔を伴う複数のビジュアルコンテンツアイテムの各々を複数のバケットの一つに割り当てる手段と、検知された1または複数の人間の顔のカテゴリーに基づき、複数のバケットの各々の特徴値を計算する手段と、を含む手段と、該特定された複数の特徴値に基づき、人のソーシャルタイプを決定する手段と、を備える。
本明細書に記載の実施形態の別態様によれば、計算機システムが提供される。このシステムは、人に関係するビジュアルコンテンツアイテムを複数取得する手段と、該取得したビジュアルコンテンツアイテムから1または複数の人間の顔を検知する手段と、該検知した人間の顔の年齢及び性別を特定する手段と、該検知した顔の数に基づき複数の特徴値を認識する手段と、該特定された複数の特徴値に基づき、第二の複数のコンテンツアイテムから第二のコンテンツアイテムを選択する手段と、を備える。
本明細書に記載の実施形態の別の態様によれば、コンピュータにより実行されるプログラムが提供される。このプログラムは、コンピュータに、人に関係するビジュアルコンテンツアイテムを複数取得し、該取得したビジュアルコンテンツアイテムから1または複数の人間の顔を検知し、該検知した人間の顔の年齢及び性別を特定し、該検知した顔の数に基づき複数の特徴値を認識する、ことを実行させる。該複数の特徴値を認識することは、検知された1または複数の人間の顔から特定された年齢及び性別に基づき、検知された1または複数の人間の顔の各々を複数のカテゴリーの一つに分類し、該分類された1または複数の人間の顔に基づき、検知された1または複数の人間の顔を伴う複数のビジュアルコンテンツアイテムの各々を複数のバケットの一つに割り当て、検知された1または複数の人間の顔のカテゴリーに基づき、複数のバケットの各々の特徴値を計算することを含む。また、このプログラムは、コンピュータに、該特定された複数の特徴値に基づき、人のソーシャルタイプを決定する、ことを実行させる。
本明細書に記載の実施形態の別の態様によれば、コンピュータにより実行されるプログラムが提供される。このプログラムは、コンピュータに、人に関係するビジュアルコンテンツアイテムを複数取得し、該取得したビジュアルコンテンツアイテムから1または複数の人間の顔を検知し、該検知した人間の顔の年齢と性別を特定し、該検知した顔の数に基づき複数の特徴値を認識し、該特定された複数の特徴値に基づき、第二の複数のコンテンツアイテムから第二のコンテンツアイテムを選択する、ことを実行させる。
人に関係するビジュアルコンテンツを用いた人のソーシャルライフの状況についての知識を得ることができる。
本明細書に記載の様々な実施例によるコンテンツのマッチングフレームワークについての一般的な全体例を示す。 本明細書に記載の様々な実施例に関連して用いられる年齢・性別のカテゴリーを示す。 本明細書に記載の様々な実施例に関連して用いられる年齢・性別のカテゴリーを示す。 ユーザのビジュアルコンテンツアイテム(写真)と対応した特徴ベクトルをカテゴライズする4つの代表的なバケット例を示す。 人に関係するビジュアルコンテンツを用いた人のソーシャルライフの状況についての知識を得るものであって、動画広告のようなコンテンツを推薦するためにその知識を用いる方法の実施例の代表的な操作順序を示す。 人に関係するビジュアルコンテンツを用いた人のソーシャルライフの状況についての知識を得るものであって、動画広告のようなコンテンツを推薦するためにその知識を用いるコンピュータシステムの実施例を示す。
本発明に関するさらなる態様は、以下の記載で部分的に説明され、また記載から部分的に明白であり、発明の実施により習得することができる。本発明の態様は、以下の詳細な記載及び特許請求の範囲において特に指摘されたる要素、及び種々の要素と態様との組み合わせによって実施及び達成することができる。
上述また以下の記載は単なる例示や説明であり、特許請求の範囲に記載の発明もしくはその適用をいかなる形であれ制限することを意図したものではないことを理解されたい。
本明細書に組み込まれ本明細書の一部をなす添付図面は、本発明の実施形態を例示し、説明と相俟って本発明技術の原理の説明及び例示に供する。
以下の詳細な記述において、添付の図面を参照する。添付の図面において、同様の機能を有する構成要素は同様の参照符号を付されている。添付の図面は例示のためのものであり、限定を意図するものではない。特定の実施例及び実装は本発明の原理と矛盾しない。これらの実装は当業者が実施できる程度に十分詳細に記述される。その他の実装が使用されてもよく、様々な構成要素の構造の変更及び/もしくは置き換えが本発明の範囲及び思想から逸脱することなく可能であることは理解されるだろう。したがって、以下の詳細な記述は、限定的に解釈されるべきではない。さらに、記述される本発明の異なる実施例は、汎用計算機上で稼働するソフトウェアの形態によっても、専用ハードウェアの形態によっても、ソフトウェア及びハードウェアの組み合わせによっても、実装可能である。
本明細書に記載の実施例の一態様において、人に関係するビジュアルコンテンツを用いた人のソーシャルライフの状況についての知識を得るものであって、動画広告や音楽、書籍もしくは動画のようなコンテンツを推薦するためにその知識を用いるコンピュータシステムとコンピュータで実現される方法が提供されている。一つもしくは複数の実施例において、本明細書に記載のシステムは、人のソーシャルメディアの写真を用いて年齢・性別、グループの集まりの性質の集合的な統計が計算されるように、また、男性/女性が個人か、(これらに制限されるものではないが、)恋愛関係か、家族の一員かまたグループの一員かどうかの情報が包含されるだろう人のソーシャルな特徴をマップするために機械学習アプローチを用いるよう構成される。
人のソーシャルライフのプロフィール、特に年齢・性別のような標準的なプロフィール情報が結合された4つのソーシャルな特性に関連したもの、を知ることにより、パーソナライズされた広告配信において、たいへん価値を高めることが可能となる。例えば、自動車会社は、同じ車であっても、異なるタイプの人に対して適切な異なる広告を持つかもしれない。山でのレースをするスポーツカーを表す広告は、若い独身男性に対してはベストなターゲットになっているであろうし、同じ車でラクジュアリなホテルへドライブすることを示すものは、女性に向けた良いターゲットであろう。動画広告は、上述のカテゴリ(推薦のため)に直接的にラベルされ、また適切なタグを作るためにビジュアル的に分析される。あるいは、人を伴った動画広告はまた、そこに表される年齢・性別、グループの集まりの性質について、集合的な統計が計算するよう処理される。発明のフレームワークはそういうわけで(人のコレクションと広告における特徴ベクトルの類似性を直接計算することによって)類似の広告を引き出すために用いられる。
図1は、本明細書に記載の様々な実施例によるコンテンツのマッチングフレームワーク100についての一般的な全体例を示す。図1に示されるように、ユーザのソーシャルメディアの写真101のようなビジュアルコンテンツアイテムは、ユーザの特徴ベクトル102に用いられる。特徴ベクトル102は、例えば当業者により良く知られている機械学習技術を用いて、モデル103を生成するために順番に用いられる。類似の処理は、動画広告104のような他のコンテンツに関して実行される。特に、各々の動画広告のために特徴ベクトル105とモデル106もまた生成される。直接比較は、特徴ベクトル102と105との間で実行されるかもしれず、もしくは追加や代替により、モデル103及び106がユーザにとって最も適切なコンテンツを決定するためにマッチングされるかもしれない。上述した操作は、次により詳しく示されるだろう。
一つもしくは複数の実施例において、本明細書に記載のシステムは、最初に、他のストレージ場所のマイクロブログ(例えば、ツイッター、インスタグラムやテンセント ウェイボー)からの写真101のような人のビジュアルコンテンツアイテムを取得し、そこで顔検出を実行する。上述のビジュアルコンテンツアイテムのタイプにも依るが、顔検出は動画ファイルの分離フレームと同様に分離した写真で実行されてもよい。一つもしくは複数の実施例において、顔検出は当業者に良く知られているOpenCVの顔検出のような既製の顔検出を使って実行される。これは検出された顔の年齢・性別予測へと続く。本発明の実施例では、顔の年齢・性別の予測は、特許文献1及び非特許文献4に示されるアルゴリズムを用いることで実行される。
一つもしくは複数の実施例において、人のソーシャルライフが示されている4つの属性が(人のソーシャルタイプとしてここに言及されたものもまた)用いられる:個人、恋愛関係、家族の一員、グループの一員。加えて、年齢・性別のカテゴリー(例えば、図2A及び図2Bに示されるカテゴリー)もまた定義される。写真から検出されたグループの集まりの性質を表すために、顔の数は、シングル(1個の顔)、ペア(2個の顔)、小グループ(3〜6個の顔)、大グループ(7個或いはそれ以上の数の顔)に分類される。
一つもしくは複数の実施例において、すべての人は、図2A及び図2Bに示されている複数の年齢・性別のカテゴリーの実施例の一つに分類される。図2Aに示される最初の例には、3つの年齢のカテゴリー、C(赤ん坊か子供)、A(若い成人か成人)、S(高齢者)と6つの年齢・性別カテゴリー、C1(男の赤ん坊か子供)、C2(女の赤ん坊か子供)、C3(男の若い成人か成人)、C4(女の若い成人か成人)、C5(男の高齢者)、C6(女の高齢者)がある。図2Bに示される二番目の例にはまた、3つの年齢のカテゴリー、C(赤ん坊か子供)、A(若い成人か成人)、S(高齢者)と、またそれだけではなく、4つの年齢・性別カテゴリー、C1(男もしくは女の赤ん坊か子供)、C2(男の若い成人か成人)、C3(女の若い成人か成人)、C4(男もしくは女の高齢者)がある。本明細書に記載の発明のコンセプトは上述で列挙した年齢・性別カテゴリーに制限されるものではなく、他の適切な人の分類もまた用いられるかもしれないことも示されるべきであろう。このように、上述のカテゴリーの例は、限定された認識によって解釈されるべきものではない。
一つもしくは複数の実施例において、本明細書に記載のシステムは、次の方法において、男性/女性のソーシャルメディアの写真コレクション101を用いることにより人の特徴ベクトル102を構築するよう構成される。特に、一つもしくは複数の実施例において、図3に示される通り、システムは検出した顔が写っている写真を4つの異なるバケットの一つに入れる。その4つは(1)1個の顔の写真301、(2)2個の顔の写真302、(3)小グループ(3〜6個の顔)の写真、(4)大グループ(7個以上の顔)の写真である。本明細書に記載された写真のバケット301、302、303、304は一つの例であって、他の適切な写真分類が、本明細書に記載された実施例に関連して用いられることもできる。このように、上述のカテゴリーの例は、限定された認識によって解釈されるべきものではない。
その後、上述のバケット301〜304の各々のために、システムは年齢・性別、グループの集まりの性質についての集合的な統計を示す特徴ベクトルを計算する。これらの特徴は、人のための集合特徴ベクトル102を構築するよう集められることが可能である。本発明の実施例において、1個の顔のバケット301の特徴ベクトルは、例えば、図2Bに示される4つの年齢・性別カテゴリーC1、C2、C3、C4についてのヒストグラム(X1、X2、X3、X4)であってよい。
当業者により認められている通り、2個の顔のバケットの特徴ベクトルは、2個の顔における年齢・性別の関係を考慮して構成するためより複雑である。上述の顔での4つの年齢・性別カテゴリー(例えば、図2BのC1、C2、C3、C4)が与えられることで、システムは関係(C1^4+C2^4)のような10グループを構成することができる。図3に(Y1,Y2,…,Y10)のように示される特徴ベクトルは、したがって、それら10グループの集合のヒストグラムである。3〜6個の顔のグループであるバケット303と7個以上の顔のグループ304においては、組み合せ的に、多くのグループの集まりになるだろう。本発明の2つの実施例において、(i)4つの年齢・性別カテゴリーのヒストグラムを考えることができ、したがって4次元の特徴(Z1,Z2,Z3,Z4)及び(W1,W2,W3,W4)を構成することができ、もしくは(ii)10次元の特徴(Z1,Z2,…,Z10)と(W1,W2,…,W10)を得るために(写真における)隣接した顔のペア間の集まりを考えることができる。
一つもしくは複数の実施例において、クラシファイアー(分類器)は、次に、定義された特徴を用いて人を記述するベストな特性を予測するために構成される。一の実施例において、人々のソーシャルライフを示す4つの属性(個人、恋愛関係、家族の一員、グループの一員)は、各々の人を分類するために使われる。また、上述されたソーシャルの属性は、一例であり、他の適したソーシャルな人の分類を用いても良い。教師あり学習フレームワークにおいては、サポートベクターマシーン(SVM)や決定木(例えば、CARTやrandom forests)のようなクラシファイアー(分類器)は、ユーザコレクション(人手でラベリングされたソーシャルな属性)の学習セットを用いて学習させることができる。
変形例において、システムは、(すべての写真に一つの特徴ベクトルを組み合わせるよりも)各々の写真に同等の重みを与え、別の見本として各々の写真を扱うユーザを特定するよう構成されてもよい。一旦写真中のユーザの顔が認識されると、ユーザのソーシャルな関係は特徴づけられる。一の実施例では、写真中の顔のソーシャルなグラフが計算され、最近傍が特定される。ソーシャルグラフにおける近傍のユーザ間の関係のペアは、写真の特徴ベクトルを生成するために使われる。特徴ベクトルは、1)最近傍のユーザとユーザとの間での年齢の組み合わせのペアの分布(例えば総計)、2)ユーザを含まない年齢の組み合わせのペアの分類、3)写真中の顔の総数(すなわち、例えば{1、2、3、4―6、7+}のように、量子化された値)により構成される。望ましいコンセプト(上述の4つのソーシャルな属性、もしくは父や母のような追加されたコンセプト)がラベリングされた画像のセットは、クラシファイアーが各々のコンセプトに分類するための学習に用いられる。つまり、顔の関係をベースとした特徴ベクトルが入力として用いられる。新たな画像にラベリングするために、クラシファイアーの各々は画像上で実行される。
一つもしくは複数の実施例において、次の処理ステップは、人の写真コレクションにおいてすべての顔の分類をするよう実行される。その後、クラシファイアーもしくは当業者によく知られているガウシアンミクスチャモデル(GMM)が実行され、ユーザと写真コレクションの人々の各々のとの関係は、クラシファイアーやGMMの重みから与えられたラベルのセットに基づいて特徴づけられる。
一つもしくは複数の実施例において、動画広告は、2つの方法により適切なタグが関連付けられる。一の実施例では、広告のクリエーターは年齢・性別、ソーシャルライフの属性を動画広告に手作業でタグ付ける。変形例では、動画広告は対応する適切なタグを自動的に生成するよう分析される。一つもしくは複数の実施例において、システムは、各々の動画広告と関係する、上述で議論された(個人、恋愛関係、家族の一員、グループの一員)4つのソーシャルライフの属性(タイプ)を決定するよう構成される。一の実施例では、これは、動画広告からキーフレームを抽出することにより、またキーフレームを人の写真コレクションとして扱うことにより実行される。上述の分類の生成は、人の写真でなされたように動画広告を分類するために用いられる。そのような分類の結果は、個人、恋愛関係、家族の一員、グループの一員を含むソーシャルライフの属性(タイプ)の一つになるだろう。
一つもしくは複数の実施例において、動画広告のキーフレームは、次の処理により抽出される。最初に、動画広告は、1秒ごとにnフレーム(nは、1、2もしくは他の適切な数)がサブ抽出される。これは、仮に決定された期間の各々の動画セグメントからベストなフレームを抽出することにより実行される。一つもしくは複数の実施例において、ベストなフレームは、不鮮明さが最も小さいフレームとして定義される。しかしながら、ベストなフレームの他の定義が可能であれば、それらは本明細書に記載される実施例に関係して用いられても良い。
次に、顔の検出はそれらの抽出したフレームで実行される。一つもしくは複数の実施例において、人の顔が検出されないフレームは廃棄される。その後フレームは、フレーム間で計算された距離に基づき、凝集型クラスタリングを用いてクラスタリングされ、これらは、フレームあるいはフレームのクラスタを(凝縮のために)結合すべきかの決定に用いられる。一つもしくは複数の実施例において、これまでに述べられたフレーム間距離は、ビジュアル距離の測定に基づき決定される。
最後に、代表するキーフレームは、すべての他のクラスタのフレームと類似するフレームに基づき各々のクラスタの結果から選択されるが、本ケースにおける距離は、各々のキーフレームから検出された人の顔の数と同様にビジュアルの距離に基づく。一つもしくは複数の実施例において、フレーム間のビジュアル距離は、当業者によく知られているスケール普遍特徴変換(SIFT)に基づき計算される。しかしながら、変形例では、同目的で他のフレーム間距離計算技術を用いてもよい。
一つもしくは複数の実施例において、上述のSIFTの特徴は、最初にすべてのフレームから抽出され、ベクトル量子化のためビジュアルワードのセットを生成するのに用いられる。当業者によって認識されている通り、各々のキーフレームは、それに含まれる(まとまったビジュアルワード)ビジュアル特徴によって定義される。フレーム間の類似は、それらが共有するビジュアル特徴の数として計算される。凝集型クラスタリングの後に、クラスタのための最後のキーフレームは、クラスタのすべてのフレームにおいて人がカウントされるモードを最初に決定することにより、また人のカウントが決定されたモードと等しくないフレームを廃棄することにより選択される。それらの間、最後の代表キーフレームは、クラスタにおいて互いの写真で最もビジュアル的なワードを共有するものとして選択される。
動画広告を選択する方法の他の実施例は、上述の方法で、動画広告からキーフレームを選択する。しかしながら、直接広告を4つのソーシャルライフの属性の一つに分類するために、それら選択されたキーフレームを用いるのではなく、方法は、代わりに、人が共有する写真を用いて直接計算された特徴と、それら選択されたキーフレームの特徴とを直接比較する。ここで、(人のソーシャルメディアの写真から)計算された特徴は、(4つのソーシャルな属性への明確な分類の必要性なしに)顔のコンテンツに関して、人の年齢・性別、グループダイナミクスがマッチする最も適切な動画広告を引き出す検索フレームワークにおいて用いられる。そのようなシナリオにおいては、顔を伴う(上述で説明された)キーフレームのセットは、実用的に、写真コレクションのように扱われ、また上述の(年齢・性別、ソーシャルグループのコンテンツに代表される)特徴は、各々の広告動画のために抽出される。特定の人に対して、上述の方法の実施例は、年齢・性別、グループコンテンツにおいて最も類似する広告を得る。この目的のために、当業者によりよく知られているKLダイバージェンスやカイ二乗距離のようなヒストグラム類似尺度が用いられる。
変形例として、ガウシアンミクスチャモデル(GMM)は、顔を含む写真に対して顔の関係をベースとした特徴ベクトルの多くのコレクションにわたってはじめに計算され、そしてGMMの重みが使われる。コンセプトラベルのセットに対応するGMMの潜在的な状況及びGMMの重みは、ユーザと関連付く各々のコンセプトがどれくらい強いかにより示される。この情報は、ユーザのソーシャルな嗜好と最も適合する動画広告の選択に用いられる。
図4は、人の関係するビジュアルコンテンツを用いた人のソーシャルライフの状況についての知識を得るものであって、動画広告のようにコンテンツを推薦するためにその知識を使う方法の例における代表的な操作シーケンス400を示す。操作シーケンス400は、(i)ユーザの特徴は機械学習アプローチを用いて構成されるモデルによって分類され、(ii)そのユーザの特徴は動画広告から抽出された特徴と直接比較される、という、アプローチを含む、上述の異なる処理ステップが組み入れられる。
最初に、ステップ401では、ソーシャルメディアの写真やユーザの他のビジュアルコンテンツを取得する。異なる実施例においては、ビジュアルコンテンツは、様々なオンラインのソーシャルネットワークのリソースにおけるユーザのページからダウンロードされてもよい。変形例においては、サーチエンジンが、コンテンツの位置を特定し、ダウンロードに用いられてもよい。次に、ステップ402では、検知された人の顔における年齢・性別の認識及び顔検知が、取得されたユーザのビジュアルコンテンツを用いて実行される。ステップ403では、ユーザの特徴ベクトルは、検知された人の顔が予め定められた数のユーザコレクション(写真バケット)におけるビジュアルコンテンツ(例えば、写真等)のアイテムの数に基づいて構成される。上述の通り、一つの実施例において、シングル(1個の顔)、ペア(2個の顔)、小グループ(3〜6個の顔)、大グループ(7個或いはそれ以上の顔)が、ユーザの特徴ベクトル座標を計算するためにあり得る写真バケットである。
次に、上述の方法で構成されたユーザの特徴ベクトルは、ユーザのソーシャルライフの状況に最も適した動画広告の推薦に用いられる。次のステップ408〜410は、ステップ404〜407が上述の直接比較アプローチを実行するのに対して、動画広告の選択のための上述の機械学習アプローチの詳細である。
直接比較アプローチに従うと、ステップ404では、年齢・性別の認識及び顔検出が動画広告のセットで実行される。ステップ405では、広告の特徴ベクトルは、上述のような予め定められた写真バケットに割り当てられた、検出された人の顔に基づき、各々の動画広告のために構成される。上記のように、一つの実施例において、シングル(1個の顔)、ペア(2個の顔)、小グループ(3〜6個の顔)、大グループ(7個或いはそれ以上の顔)が、広告の特徴ベクトル座標、を計算するためにあり得る写真バケットである。
ステップ406では、ユーザの特徴ベクトルは、予め定められた基準を用いて動画広告の特徴ベクトルと直接比較される。様々な比較基準は、上述の特徴ベクトルの比較に用いられてもよい。それゆえ、本明細書に記載のされるコンセプトは、どの特定の特徴ベクトルの比較基準にも限定されるものではない。最後に、ステップ407では、システムは、ユーザの特徴ベクトルに最も類似する特徴ベクトルを持つ動画広告を選択するよう構成される。この動画広告の選択はその後、ユーザのソーシャルな嗜好に最も適合するものとして推薦される。
一方で、上述の機械学習アプローチに従うと、ステップ408では、異なるソーシャルタイプの人に対する機械学習ベースのモデルが構成され、記憶され、もしくは他で取得される。ステップ409では、ステップ403で構成されたユーザ特徴ベクトルは、ユーザを分類する学習モデルによって、ソーシャルタイプの一つに分類される。以上により、ユーザのソーシャルタイプの例は、個人か、恋愛関係か、家族の一員か、またグループの一員かを含む。最後に、ステップ410では、ユーザの決定されたソーシャルタイプに最も適合する動画広告が推薦される。
上述の発明のコンセプトは動画広告の選択に制限されるものではないことに注意が必要である。本明細書に記載の様々な実施例は、ユーザの決定された特徴ベクトルに基づき、様々なコンテンツの推薦に提供するために用いられてもよい。推薦されたコンテンツの例には、書籍のようなテキスト素材、音楽や動画を含む視聴覚コンテンツを含んでもよい。この場合システムは、上述の機械学習アプローチもしくは上述の特徴ベクトルの直接比較アプローチのどちらを用いてもよい。一つもしくは複数の実施例において、ユーザに関連したビジュアルコンテンツを用いて計算されたユーザの特徴ベクトルに加えて、他のオンラインソースからもしくはソーシャルネットワークから直接得られる、性別、年齢、人種、言語知識、身体障害、移動手段、収入、自宅所有、雇用状況、及び/もしくは所在地、(これらに制限されるものではないが、)を含むユーザの属性に関する情報は、コンテンツ推薦のために追加して用いられてもよい。本明細書に記載される方法は、ユーザが特定のオンライン資源にアクセスして実質上リアルタイムに実行されてもよい(また、広告やその他のコンテンツが推薦のために選択されてもよい)ことにも注意が必要である。
図5は、人に関係するビジュアルコンテンツを用いて人のソーシャルライフの状況についての知識を獲得するものであって、また動画広告のようなコンテンツの推薦にその知識を用いる、計算処理システム500の実施例を示す。一つもしくは複数の実施例において、計算処理システム500の全体もしくはその一部は、当業者にはよく知られたデスクトップ型のフォームファクタに基づいて実装されてもよい。変形例において、計算処理システム500は、ラップトップコンピュータ、ノートブックコンピュータ、タブレットコンピュータ、スマートフォン、その他モバイルコンピューティングデバイスに基づき実行されてもよい。
計算処理システム500はデータ・バス504あるいは計算処理システム500の様々なハードウェアの間で情報を伝達するためのその他の相互接続機構もしくは通信機構を含むことができる。中央処理ユニット(CPUあるいは単にプロセッサ)501はデータ・バス504に接続され、情報を処理し、その他の計算処理タスク及び制御タスクを実行する。計算処理システム500は、ランダム・アクセス・メモリ(RAM)もしくはその他の動的記憶装置などのメモリ512を含む。メモリ512は、データ・バス504に接続され、様々な情報及びプロセッサ501によって実行される指示を記憶する。メモリ512は、磁気ディスク、光ディスク、半導体フラッシュ・メモリ・デバイス、もしくは、その他の不揮発性記憶デバイスなどの永久記憶装置を含んでいてもよい。
一つもしくは複数の実施例において、プロセッサ501によって指示を実行する間、一時的な変数もしくはその他の中間的な情報を記憶するために、メモリ512が使用されてもよい。計算処理システム500は、さらに、リード・オンリー・メモリ(ROMもしくはEPROM)502もしくはその他の半導体記憶装置を含んでもよいが、含むか否かは任意である。リード・オンリー・メモリ(ROMもしくはEPROM)502もしくはその他の半導体記憶装置は、データ・バス504に接続され、計算処理システム500の操作に必要なファームウェア、BIOS(basic input-output system)、計算処理システム500の様々な構成パラメータなどの静的情報及びプロセッサ501への指示を記憶する。
一つもしくは複数の実施例において、計算処理システム500は、ディスプレイ509を備えていてもよく、ディスプレイ509は、データ・バス504に接続され、計算処理システム500のユーザに様々な情報を表示する。変形例において、ディスプレイ509は、(図示しない)グラフィック・コントローラ及び/もしくはグラフィック・プロセッサと関連付けられていてもよい。ディスプレイ509は、例えば、当業者にはよく知られているTFT(thin-film transistor)技術または有機LED(organic light emitting diode)技術を用いたLCD(liquid crystal display)として実装されていてもよい。異なる実施例において、ディスプレイ509は、計算処理システム500のその他の構成要素と同じ一般的な筐体に含まれていてもよい。変形例において、ディスプレイ509はそのような筐体の外側に配置されていてもよい。
一つもしくは複数の実施例において、計算処理システム500は、データ・バス504に接続されている音声再生装置525をさらに備えてもよく、当業者にはよく知られているMPEG−4ファイルのような様々な動画ファイルの音声トラックもしくはMPEG−3ファイルのような様々な音声ファイルを再生するように構成されてもよい。この場合、計算処理システム500は、(図示しない)波形または音声プロセッサもしくは同様の装置を備えていてもよい。また、計算処理システム500は、データ・バス504に接続されている音声録音装置503をさらに備えてもよい。
一つもしくは複数の実施例において、計算処理システム500は、コマンドの選択指示をプロセッサ501に送り、また、ディスプレイ509上のカーソルを制御するために、マウス/ポインティングデバイス510のような、もしくは、マウスやトラックボール、タッチパッドもしくは直接情報を通信するカーソルダイレクトキーのような一つもしくは複数の入力デバイスを備えてもよい。この入力デバイス510は、典型的には、平面上の位置を特定するために、第1の軸(例えばx)及び第2の軸(例えばy)という2つの軸における2つの自由度を有してよい。
計算処理システム500は、さらに様々な対象の動画や写真を取得するために、キーボード506と共にカメラ511を備えてもよい。キーボード506及びカメラ511は、プロセッサ501へのユーザコマンド、及び写真や動画(これらに限定されないが、)を含む情報を通信するためにデータ・バス504に接続されていてもよい。
一つもしくは複数の実施例において、計算処理システム500は、データ・バス504に接続されているネットワーク・インターフェイス505などの通信インターフェイスをさらに備えていてもよい。ネットワーク・インターフェイス505は、WiFiアダプタ507、GSM(登録商標)/CDMA(携帯電話ネットワーク)アダプタ508、及び/もしくはローカルエリアネットワーク(LAN)アダプタ526の少なくとも一つを用いて、計算処理システム500とインターネット524との間での通信を確立することができる。計算処理システム500とインターネット524との間で、双方向データ通信を提供してもよい。WiFiアダプタ507は、当業者にはよく知られている802.11a、802.11b、802.11g及び/もしくは802.11n、Bluetooth(登録商標)プロトコルに従って動作することができる。計算処理システム500のローカルエリアネットワークアダプタ526は、統合デジタルサービス網(ISDN)カードあるいはモデムであってよく、これにより、インターネットサービスプロバイダのハードウェア(不図示)を用いてインターネット524に接続する、電話回線とのデータ通信を確立する。他の例として、ローカルエリアネットワークアダプタ526は、ローカルエリアネットワークのインターフェイス/カード(LAN NIC)であってよく、これにより、インターネット524と互換性を有する通信を提供してよい。ある実施例において、WiFiアダプタ507、GSM(登録商標)/CDMA(携帯電話ネットワーク)アダプタ508、及び、ローカルエリアネットワーク(LAN)アダプタ526は、様々なタイプのデジタルデータストリームを伝送するための電子的もしくは電磁的な信号を送受信する。
一つもしくは複数の実施例において、一般的に、インターネット524は、一つもしくは複数のサブ−ネットワークを介して、その他のネットワーク資源へのデータ通信を提供する。したがって、計算処理システム500は、遠隔メディア・サーバ、ウェブ・サーバ、その他のコンテンツ・サービス、その他のネットワーク・データ・ストレージ資源などの、インターネット524のいずれかの位置に置かれている様々なネットワーク資源にアクセスすることができる。一つもしくは複数の実施例において、計算処理システム500はメッセージ、メディア、及び、アプリケーション・プログラム・コードを含むその他のデータを、ネットワーク・インターフェイス505によって、インターネット524を含む様々なネットワークを介して、送受信する。例示的なインターネットにおいて、計算処理システム500がネットワーク・クライアントとして動作する場合、計算処理システム500上で稼働しているアプリケーション・プログラムのコードもしくはデータを計算処理システム500は要求することができる。同様に、計算処理システム500は、その他のネットワーク資源へ様々なデータもしくは計算処理コードを送信することができる。
一つもしくは複数の実施例において、ここで記述される機能は、メモリ512に含まれる一つもしくは複数の指示の一つもしくは複数のシーケンスを実行するプロセッサ501に応じて、計算処理システム500によって実装される。指示は、他のコンピュータ読取可能媒体からメモリ512に読み込まれてもよい。メモリ512に含まれている指示のシーケンスを実行することによって、ここで記述されている様々な処理のステップがプロセッサ501によって実行される。変形例において、本発明の実施例を実装するために、ソフトウェアの指示に代えて、もしくは、ソフトウェアの指示と組み合わせて、ハードウェアによって実現されている回路が使用されてもよい。すなわち、本発明の実施例は、ハードウェア回路及びソフトウェアの任意の特定の組み合わせに限定されるものではない。
ここで使用される用語「コンピュータ読取可能媒体」は、プロセッサ501へ実行するための指示を提供する際に関与する任意の媒体であってよい。コンピュータ読取可能媒体は、機械読取可能媒体の単なる一例であり、ここで記述される方法及び/もしくは技術の何れかを実装するための指示を搬送することができる。このような媒体は、不揮発性媒体、揮発性媒体などを含むが、これらに限定されない、多くの形態を採ることができる。
非一時コンピュータ読取可能媒体の一般的な形態は、例えば、フロッピー(登録商標)・ディスク、フレキシブル・ディスク、ハード・ディスク、磁気テープ、もしくは、任意のその他の磁気媒体、CD−ROM、任意のその他の光媒体、パンチカード、紙テープ、孔パターンを有する任意のその他の物理的な媒体、RAM、PROM、EPROM、フラッシュEPROM、フラッシュ・ドライブ、メモリ・カード、任意のその他のメモリ・チップ、もしくはカートリッジ、もしくは、コンピュータがそこから読み取ることができる任意のその他の媒体を含む。コンピュータ読取可能媒体の様々な形態は、プロセッサ501への、一つもしくは複数の実行する指示の一つもしくは複数のシーケンスの搬送に関連してもよい。例えば、指示は、遠隔コンピュータから磁気ディスクにまず搬送されてもよい。代替的に、遠隔コンピュータは、遠隔コンピュータのダイナミック・メモリに指示をロードし、インターネット524によって指示を送信してもよい。詳細には、コンピュータの指示は、当業者にはよく知られている様々なネットワーク・データ通信プロトコルを用いて、インターネット524を介して、遠隔コンピュータから計算処理システム500のメモリ512へ、ダウンロードされてもよい。
一つもしくは複数の実施例において、計算処理システム500のメモリ512は、以下のソフトウェア・プログラム、アプリケーション、もしくは、モジュールのいずれかを記憶してもよい。
1.オペレーティング・システム(OS)513。オペレーティング・システム(OS)513は、基本システム・サービスを実装し、計算処理システム500の様々なハードウェア構成要素を管理する携帯型装置用オペレーティング・システムであってもよい。
2.アプリケーション514。アプリケーション514は、例えば、計算処理システム500のプロセッサ501によって実行される一連のソフトウェアを含んでよく、これによって、計算処理システム500は、予め定められたある処理、例えば、ユーザインターフェイスをディスプレイ509に表示し、カメラ511を用いて動画を録画する処理を行ってよい。一つもしくは複数の実施例において、アプリケーション514は、ユーザの写真における年齢・性別の認識及び顔検知を実行し、また対応するユーザの特徴ベクトルを構成するユーザ写真処理アプリケーション515を含んでもよい。加えて、動画広告処理アプリケーション516は、動画広告における年齢・性別認識及び顔検知を実行し、また対応するユーザ特徴ベクトルを構成するために提供されてもよい。直接比較アプリケーション517は、動画広告処理アプリケーション516によって構成された広告特徴ベクトルを伴うユーザ写真処理アプリケーション515により生成されたユーザ特徴ベクトルを比較し、また、ユーザに向けた最適な広告を推薦するために提供されてもよい。一方で、機械学習アプリケーション518は、上述の機械学習技術を用いてユーザ写真処理アプリケーション515により生成されたユーザ特徴ベクトルに基づき動画広告の推薦を生成するよう提供されてもよい。
3.データストレージ519。データストレージ519は、例えば、動画広告や他の推薦を目的とするコンテンツを記憶するための動画広告ストレージ521、及び、ユーザと関連したビジュアルコンテンツ(例えば、写真や動画)を記憶するためのビジュアルコンテンツストレージ520を備えてもよい。
最後に、ここで記述される処理及び技術は特定の装置の何れかに固有に関連するものではなく、適切に組み合わせられた構成要素の何れかによって実装されてもよいことが理解されるべきである。さらに、様々な種類の汎用目的装置が本明細書に記載される技術に従って使用されてもよい。本明細書に記載される方法ステップを実行するために専用装置を構築することは有利であるかもしれない。本発明は、特定の例示に関連して記述されているが、この記述は、限定ではなく、例示を意図している。多くの異なるハードウェア、ソフトウェア及びファームウェアの組み合わせが本発明を実行するために適切であることは、当業者には明らかである。例えば、記述されるソフトウェアは、アセンブラ、C/C++、Objective−C、perl、shell、PHP、Java(登録商標)、現在知られているもしくは今後開発されるプログラミング言語もしくはスクリプト言語の何れかなどの様々なプログラミング言語もしくは記述言語によって実装されてもよい。
さらに、本明細書に記載された詳細及び実行を考慮すれば、本発明のその他の実装が当業者には明らかであろう。記述された実装の様々な態様及び/もしくは構成要素は、音声/映像のコンテンツをユーザがキャプチャーするのを支援し、そして、意図したものと実際のキャプチャーされたコンテンツとの間におそらく生じている不整合をユーザに通知するシステム及び方法を個別に、もしくは、任意に組み合わせて使用することができる。詳細及び例は例示としてのみ考慮されることを意図し、本発明の真の範囲及び思想は特許請求の範囲の記載によって示される。
500 計算処理システム
501 CPU
502 EPROM/ファームウェアストレージ
503 音声録音装置
504 データ・バス
505 ネットワーク・インターフェイス
506 キーボード
507 WIFIアダプタ
508 GSM(登録商標)/CDMAアダプタ
509 ディスプレイ
510 マウス/ポインティングデバイス
511 カメラ
512 メモリ

Claims (18)

  1. 処理ユニットとメモリを備える計算機システムの前記処理ユニットが、
    a.人に関係するビジュアルコンテンツアイテムを複数取得し、
    b.該取得したビジュアルコンテンツアイテムから1または複数の人間の顔を検知し、
    c.該検知した人間の顔の年齢及び性別を特定し、
    d.該検知した顔の数に基づき複数の特徴値を認識し、
    該複数の特徴値を認識することは、
    i)検知された1または複数の人間の顔から特定された年齢及び性別に基づき、検知された1または複数の人間の顔の各々を複数のカテゴリーの一つに分類し、
    ii)該分類された1または複数の人間の顔に基づき、検知された1または複数の人間の顔を伴う複数のビジュアルコンテンツアイテムの各々を複数のバケットの一つに割り当て、
    iii)検知された1または複数の人間の顔のカテゴリーに基づき、複数のバケットの各々の特徴値を計算する、
    ことを含み、
    e.該特定された複数の特徴値に基づき、人のソーシャルタイプを決定する、
    方法。
  2. 前記人のソーシャルタイプは、人に関する追加情報に基づき更に決定され、該追加情報は、人に関係するビジュアルコンテンツアイテム以外のソースから獲得される、請求項1記載の方法。
  3. 前記人のソーシャルタイプの決定は、複数の異なるソーシャルタイプのモデルに基づき、機械学習を用いて実行される、請求項1記載の方法。
  4. 前記複数の異なるソーシャルタイプは、個人、恋愛関係、家族の一員、または、グループの一員を含む、請求項3記載の方法。
  5. 更に、決定された人のソーシャルタイプに基づき第二の複数のコンテンツアイテムから第二のコンテンツアイテムを選択することを含み、該選択された第二のコンテンツアイテムは最も適切に決定された人のソーシャルタイプである、請求項1記載の方法。
  6. 処理ユニットとメモリを備える計算機システムの前記処理ユニットが、
    a.人に関係するビジュアルコンテンツアイテムを複数取得し、
    b.該取得したビジュアルコンテンツアイテムから1または複数の人間の顔を検知し、
    c.該検知した人間の顔の年齢と性別を特定し、
    d.該検知した顔の数に基づき複数の特徴値を認識し、
    e.該特定された複数の特徴値に基づき、第二の複数のコンテンツアイテムから第二のコンテンツアイテムを選択する、
    方法であって、
    前記複数の特徴値を認識することは、
    i)検知された1または複数の人間の顔から特定された年齢及び性別に基づき、検知された1または複数の人間の顔の各々を複数のカテゴリーの一つに分類し、
    ii)該分類された1または複数の人間の顔に基づき、検知された1または複数の人間の顔を伴う複数のビジュアルコンテンツアイテムの各々を複数のバケットの一つに割り当て、
    iii)検知された1または複数の人間の顔のカテゴリーに基づき、複数のバケットの各々の特徴値を計算する、
    ことを含む方法。
  7. 前記複数の特徴値は人の特徴ベクトルから構成され、また該複数の特徴値は人の特徴ベクトル座標である、請求項1又は6記載の方法。
  8. 複数の前記人に関係するビジュアルコンテンツアイテムは複数の写真であり、更に、複数の写真の内、1または複数の人間の顔を検知していない写真を除外する、請求項1又は6記載の方法。
  9. 複数の前記人に関係するビジュアルコンテンツアイテムは複数の動画であり、複数の動画の各々は複数の動画フレームを含み、1または複数の人間の顔は複数の動画フレームの各々から検知される、請求項1又は6記載の方法。
  10. 前記第二の複数のコンテンツアイテムは動画広告である、請求項5又は6記載の方法。
  11. 前記第二の複数のコンテンツアイテムは動画である、請求項5又は6記載の方法。
  12. 前記第二の複数のコンテンツアイテムから第二のコンテンツアイテムを選択することは、第二の複数のコンテンツアイテムの各々の第二の複数の特徴値を認識し、該認識した第二の複数の特徴値と前記認識した複数の特徴値とを直接比較し、該比較の結果に基づき第二のコンテンツアイテムを選択することを含む、請求項6記載の方法。
  13. 前記第二の複数のコンテンツアイテムの各々の第二の複数の特徴値を認識することは、
    i)第二の複数のコンテンツアイテムから1または複数の第二の人間の顔を検知し、
    ii)該検知した人間の顔の年齢と性別を特定し、
    iii)該検した人間の顔の数に基づき第二の複数の特徴値を認識する、
    ことを含む、
    請求項12記載の方法。
  14. 前記第二の複数の特徴値を認識することは、
    i)検知された1または複数の人間の顔から特定された年齢及び性別に基づき、検知された1または複数の人間の顔の各々を複数のカテゴリーの一つに分類し、
    ii)該分類された1または複数の人間の顔に基づき、検知された1または複数の人間の顔を伴う複数のビジュアルコンテンツアイテムの各々を複数のバケットの一つに割り当て、
    iii)検知された1または複数の人間の顔のカテゴリーに基づき、複数のバケットの各々の特徴値を計算する、
    ことを含む、
    請求項13記載の方法。
  15. a.人に関係するビジュアルコンテンツアイテムを複数取得する手段と、
    b.該取得したビジュアルコンテンツアイテムから1または複数の人間の顔を検知する手段と、
    c.該検知した人間の顔の年齢及び性別を特定する手段と、
    d.該検知した顔の数に基づき複数の特徴値を認識する手段であって、
    i)検知された1または複数の人間の顔から特定された年齢と性別に基づき、検知された1または複数の人間の顔の各々を複数のカテゴリーの一つに分類する手段と、
    ii)該分類された1または複数の人間の顔に基づき、検知された1または複数の人間の顔を伴う複数のビジュアルコンテンツアイテムの各々を複数のバケットの一つに割り当てる手段と、 iii)検知された1または複数の人間の顔のカテゴリーに基づき、複数のバケットの各々に特徴値を計算する手段と、
    を含む手段と、
    e.該特定された複数の特徴値に基づき、人のソーシャルタイプを決定する手段と、
    を備えた計算機システム。
  16. a.人に関係するビジュアルコンテンツアイテムを複数取得する手段と、
    b.該取得したビジュアルコンテンツアイテムから1または複数の人間の顔を検知する手段と、
    c.該検知した人間の顔の年齢と性別を特定する手段と、
    d.該検知した顔の数に基づき複数の特徴値を認識する手段と、
    e.該特定された複数の特徴値に基づき、第二の複数のコンテンツアイテムから第二のコンテンツアイテムを選択する手段と、
    を備えた計算機システムであって、
    前記複数の特徴値を認識する手段は、
    i)検知された1または複数の人間の顔から特定された年齢及び性別に基づき、検知された1または複数の人間の顔の各々を複数のカテゴリーの一つに分類し、
    ii)該分類された1または複数の人間の顔に基づき、検知された1または複数の人間の顔を伴う複数のビジュアルコンテンツアイテムの各々を複数のバケットの一つに割り当て、
    iii)検知された1または複数の人間の顔のカテゴリーに基づき、複数のバケットの各々の特徴値を計算する、
    計算機システム
  17. a.人に関係するビジュアルコンテンツアイテムを複数取得し、
    b.該取得したビジュアルコンテンツアイテムから1または複数の人間の顔を検知し、
    c.該検知した人間の顔の年齢及び性別を特定し、
    d.該検知した顔の数に基づき複数の特徴値を認識し、
    該複数の特徴値を認識することは、
    i)検知された1または複数の人間の顔から特定された年齢及び性別に基づき、検知された1または複数の人間の顔の各々を複数のカテゴリーの一つに分類し、
    ii)該分類された1または複数の人間の顔に基づき、検知された1または複数の人間の顔を伴う複数のビジュアルコンテンツアイテムの各々を複数のバケットの一つに割り当て、
    iii)検知された1または複数の人間の顔のカテゴリーに基づき、複数のバケットの各々の特徴値を計算する、
    ことを含み、
    e.該特定された複数の特徴値に基づき、人のソーシャルタイプを決定する、
    ことをコンピュータに実行させるためのプログラム。
  18. a.人に関係するビジュアルコンテンツアイテムを複数取得し、
    b.該取得したビジュアルコンテンツアイテムから1または複数の人間の顔を検知し、
    c.該検知した人間の顔の年齢及び性別を特定し、
    d.該検知した顔の数に基づき複数の特徴値を認識し、
    e.該特定された複数の特徴値に基づき、第二の複数のコンテンツアイテムから第二のコンテンツアイテムを選択する、
    ことをコンピュータに実行させるためのプログラムであって、
    前記複数の特徴値を認識することは、
    i)検知された1または複数の人間の顔から特定された年齢及び性別に基づき、検知された1または複数の人間の顔の各々を複数のカテゴリーの一つに分類し、
    ii)該分類された1または複数の人間の顔に基づき、検知された1または複数の人間の顔を伴う複数のビジュアルコンテンツアイテムの各々を複数のバケットの一つに割り当て、
    iii)検知された1または複数の人間の顔のカテゴリーに基づき、複数のバケットの各々の特徴値を計算する、
    ことを含むプログラム
JP2014233405A 2014-08-18 2014-11-18 人のソーシャルタイプを決定する方法、システム及びプログラム Active JP6451246B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14/462,511 US10740802B2 (en) 2014-08-18 2014-08-18 Systems and methods for gaining knowledge about aspects of social life of a person using visual content associated with that person
US14/462,511 2014-08-18

Publications (2)

Publication Number Publication Date
JP2016042346A JP2016042346A (ja) 2016-03-31
JP6451246B2 true JP6451246B2 (ja) 2019-01-16

Family

ID=55302499

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014233405A Active JP6451246B2 (ja) 2014-08-18 2014-11-18 人のソーシャルタイプを決定する方法、システム及びプログラム

Country Status (2)

Country Link
US (1) US10740802B2 (ja)
JP (1) JP6451246B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7240188B2 (ja) 2019-01-28 2023-03-15 オークマ株式会社 工作機械

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11288584B2 (en) * 2016-06-23 2022-03-29 Tata Consultancy Services Limited Systems and methods for predicting gender and age of users based on social media data
US10699128B2 (en) * 2016-09-21 2020-06-30 Cisco Technology, Inc. Method and system for comparing content
CN106682686A (zh) * 2016-12-09 2017-05-17 北京拓明科技有限公司 一种基于手机上网行为的用户性别预测方法
KR101884874B1 (ko) * 2017-01-19 2018-08-03 한국과학기술원 부분 이미지 기반 객체 판별 방법 및 장치
CN107358343B (zh) * 2017-06-28 2020-12-15 中国能源建设集团甘肃省电力设计院有限公司 基于图像数据特征差异性的电力工程安全预警方法
WO2019023863A1 (zh) * 2017-07-31 2019-02-07 深圳传音通讯有限公司 一种基于智能终端的拍照方法及拍照系统
KR101961024B1 (ko) * 2017-08-03 2019-03-21 김남균 사진 인식을 이용한 정보제공시스템
US11379715B2 (en) * 2017-12-15 2022-07-05 Meta Platforms, Inc. Deep learning based distribution of content items describing events to users of an online system
CN108681928A (zh) * 2018-05-30 2018-10-19 中海云智慧(北京)物联网科技有限公司 一种智能广告投放方法
CN108985228A (zh) * 2018-07-16 2018-12-11 百度在线网络技术(北京)有限公司 应用于终端设备的信息生成方法和装置
CN109003134B (zh) * 2018-07-20 2022-02-22 齐怡 基于人脸识别的智能广告投放系统及方法
CN109003135B (zh) * 2018-07-20 2022-03-25 齐怡 基于人脸识别的智能广告匹配推送系统及方法
US10602207B2 (en) * 2018-08-03 2020-03-24 Facebook, Inc. Neural network based content distribution in an online system
US11144998B2 (en) 2018-09-20 2021-10-12 The Toronto-Dominion Bank Dynamic provisioning of data exchanges based on detected relationships within processed image data
US10958553B2 (en) * 2018-10-31 2021-03-23 Citrix Systems, Inc. Network configuration system
CN109874054B (zh) * 2019-02-14 2021-06-29 深兰科技(上海)有限公司 一种广告推荐方法及装置
CN112132616B (zh) * 2020-09-23 2021-06-01 广东省广汽车数字营销有限公司 一种基于大数据的移动多媒体广告智能推送管理系统
CN113051379B (zh) * 2021-02-24 2023-08-04 南京审计大学 一种知识点推荐方法、装置、电子设备及存储介质

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7362919B2 (en) * 2002-12-12 2008-04-22 Eastman Kodak Company Method for generating customized photo album pages and prints based on people and gender profiles
JP2004227158A (ja) * 2003-01-21 2004-08-12 Omron Corp 情報提供装置および情報提供方法
US8180112B2 (en) * 2008-01-21 2012-05-15 Eastman Kodak Company Enabling persistent recognition of individuals in images
JP2010025359A (ja) * 2008-07-15 2010-02-04 Fujitsu General Ltd 空気調和機
US20100106573A1 (en) * 2008-10-25 2010-04-29 Gallagher Andrew C Action suggestions based on inferred social relationships
US8831276B2 (en) * 2009-01-13 2014-09-09 Yahoo! Inc. Media object metadata engine configured to determine relationships between persons
JP4544363B1 (ja) 2009-03-13 2010-09-15 オムロン株式会社 顔認証装置、人物画像検索システム、顔認証装置制御プログラム、コンピュータ読み取り可能な記録媒体、および顔認証装置の制御方法
JP2011095906A (ja) * 2009-10-28 2011-05-12 Sony Corp 情報処理装置、情報処理方法、及びプログラム
US8873851B2 (en) * 2012-06-29 2014-10-28 Intellectual Ventures Fund 83 Llc System for presenting high-interest-level images
US20140244837A1 (en) * 2013-02-26 2014-08-28 Adience SER LTD Determining a user's identity from an interaction with an identifiable service

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7240188B2 (ja) 2019-01-28 2023-03-15 オークマ株式会社 工作機械

Also Published As

Publication number Publication date
JP2016042346A (ja) 2016-03-31
US10740802B2 (en) 2020-08-11
US20160048887A1 (en) 2016-02-18

Similar Documents

Publication Publication Date Title
JP6451246B2 (ja) 人のソーシャルタイプを決定する方法、システム及びプログラム
US11704899B2 (en) Resolving entities from multiple data sources for assistant systems
US10679047B2 (en) System and method for pose-aware feature learning
US11397763B1 (en) Live video recommendation by an online system
US10740690B2 (en) Automatically tagging topics in posts during composition thereof
US10565472B2 (en) Event image curation
US10318884B2 (en) Venue link detection for social media messages
US10061985B2 (en) Video understanding platform
CN105612514B (zh) 通过将语境线索与图像关联进行图像分类的系统和方法
US20180268244A1 (en) System and method for deep labeling
US9830534B1 (en) Object recognition
JP2015219904A (ja) ユーザの人口統計学特性を推定する方法、コンピュータ・システム、及びプログラム
CN108959323B (zh) 视频分类方法和装置
WO2019137391A1 (zh) 对视频进行分类匹配的方法、装置和挑选引擎
JP2020077343A (ja) ルール生成装置、ルール生成方法及びルール生成プログラム
US10474899B2 (en) Social engagement based on image resemblance
US20170186044A1 (en) System and method for profiling a user based on visual content
US11657596B1 (en) System and method for cascading image clustering using distribution over auto-generated labels
WO2018010147A1 (en) User feed with professional and nonprofessional content
US20220215431A1 (en) Social network optimization
US9619521B1 (en) Classification using concept ranking according to negative exemplars
CN116957036A (zh) 伪造多媒体检测模型的训练方法、装置和计算设备
US20220358357A1 (en) Utilizing a neural network model to predict content memorability based on external and biometric factors
Chen et al. Emotion recognition in videos via fusing multimodal features
US20240144079A1 (en) Systems and methods for digital image analysis

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170928

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180821

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180904

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181031

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181113

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181126

R150 Certificate of patent or registration of utility model

Ref document number: 6451246

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350