JP2014516490A

JP2014516490A - パーソナライズされたプログラム選択のシステムおよび方法

Info

Publication number: JP2014516490A
Application number: JP2014504133A
Authority: JP
Inventors: ソン、ジチャン; ワン、タオ; ワン、ペン; リ、ウェンロン; リ、チャン
Original assignee: Intel Corp
Current assignee: Intel Corp
Priority date: 2011-04-11
Filing date: 2011-04-11
Publication date: 2014-07-10
Also published as: CN103098079A; EP2697741A4; TW201310357A; WO2012139242A1; EP2697741A1; KR20130136574A; US20140310271A1

Abstract

【解決手段】消費者に提示するプログラムを選択するシステムおよび方法は、画像において顔領域を検出する段階と、画像において手ジェスチャを検出する段階と、画像に含まれる消費者の１以上の消費者特徴（気分、性別、年齢、手ジェスチャ等）を特定する段階と、複数のプログラムプロフィールを含むプログラムデータベースと消費者特徴とを比較することによって、消費者に提示する１以上のプログラムを特定する段階と、メディアデバイスにおいて、特定された１以上のプログラムのうち選択された一のプログラムを消費者に対して提示する段階とを備える。
【選択図】図１

Description

本開示は、データ処理に関する。特に、手ジェスチャ認識と共に顔検出／追跡（例えば、表情、性別、年齢および／または顔特定／認識）に基づいて１以上のプログラムを選択する方法、装置およびシステムに関する。

一部の推薦システムは、家庭用テレビジョンクライアント（例えば、セットトップボックス（ＳＴＢ））またはインターネットテレビジョンをエンドユーザと見なし、そこから視聴履歴を収集する。推薦システムは、視聴履歴全体およびプログラム同士の相関関係に基づき、視聴されなかったプログラムを選択して、これらのプログラムの紹介を家庭用テレビジョンクライアントに勧める。しかし、この方法には、家庭用テレビジョンクライアントは複数の人間が共有していることが多いという欠点がある。このため、複数のユーザの視聴履歴がまとめられてしまい、必ずしも任意の１人のユーザの好みを反映したものにならない。

図中では、同様の参照番号は概して、同一の構成要素、機能が同様の構成要素および／または構造が同様の構成要素を示す。ある構成要素が最初に図示されている図面は、参照番号の最大桁で示す。本発明は、添付図面を参照しつつ説明する。図面は以下の通りである。
本開示のさまざまな実施形態に応じた、消費者の顔分析に基づき消費者へプログラムを選択および表示するシステムの一実施形態を示す図である。本開示のさまざまな実施形態に応じた、顔検出モジュールの一実施形態を示す図である。本開示のさまざまな実施形態に応じた、手検出モジュールの一実施形態を示す図である。本開示の一実施形態に応じた、「親指上（親指を立てた）」の手ジェスチャ（左手）を示す画像である。本開示のさまざまな実施形態に応じた、プログラム選択モジュールの一実施形態を示す図である。本開示に応じた、プログラムを選択および表示する一実施形態を説明するためのフローチャートである。本開示に応じた、プログラムを選択および表示する別の実施形態を説明するためのフローチャートである。

概論として、本開示は概して、１以上の画像から特定された消費者特徴と、プログラムプロフィールから構成されるプログラムデータベースとを比較した結果に基づいて、消費者に提示すべき１以上のプログラムを選択するシステム、装置および方法に関する。消費者特徴は、顔分析および／または手ジェスチャ分析を用いて画像から特定されるとしてよい。システムは概して、消費者の１以上の画像を撮影するカメラと、画像を分析して消費者の１以上の特徴を決定する顔検出モジュールおよび手検出モジュールと、画像から特定された消費者特徴と、プログラムプロフィールから構成されるプログラムデータベースとを比較した結果に基づいて、消費者に供給するためのプログラムを選択するプログラム選択モジュールとを備えるとしてよい。本明細書で用いる場合、「プログラム」という用語は、単発放送、テレビシリーズおよびテレビムービー（例えば、ＴＶ用のドラマ、劇場上映用の映画のテレビでの放送）を含む、任意のテレビコンテンツを意味する。

図１を参照すると、本開示に応じたシステム１０の一実施形態の概略を示している。システム１０は、プログラム選択システム１２、カメラ１４、コンテンツプロバイダ１６およびメディアデバイス１８を備える。本明細書でより詳細に説明するが、プログラム選択システム１２は、カメラ１４が撮影した１以上の画像２０から少なくとも１つの消費者特徴を特定して、消費者に対してメディアデバイス１８で提示するためのプログラムをコンテンツプロバイダ１６から選択する。

具体的には、プログラム選択システム１２は、顔検出モジュール２２と、手検出モジュール２５と、消費者プロフィールデータベース２４と、プログラムデータベース２６と、プログラム選択モジュール２８とを有する。顔検出モジュール２２は、少なくとも１つのカメラ１４が撮影した１以上のデジタル画像２０を受信する。カメラ２０は、１以上の人物を含む環境を表すデジタル画像２０を撮影する任意のデバイス（公知のデバイスまたは今後発見されるデバイス）を含み、本明細書で説明しているように、環境に含まれている１以上の人物の顔分析について適切な分解能を持つとしてよい。例えば、カメラ２０は、スチルカメラ（つまり、静止写真を撮影するカメラ）またはビデオカメラ（つまり、複数のフレームで複数の動画を撮影するカメラ）を含むとしてよい。カメラ２０は、可視スペクトルの光または電磁スペクトルの他の部分（例えば、これに限定されないが、赤外スペクトル、紫外スペクトル等）の光に対して動作するように構成されているとしてよい。カメラ２０は、例えば、ウェブカメラ（パーソナルコンピュータおよび／またはＴＶモニタに対応付けられているもの）、手持ちデバイスカメラ（例えば、携帯電話のカメラ、スマートフォンのカメラ（例えば、ｉＰｈｏｎｅ（登録商標）、Ｔｒｉｏ（登録商標）、Ｂｌａｃｋｂｅｒｒｙ（登録商標）等に対応付けられているカメラ）、ラップトップコンピュータカメラ、タブレットコンピュータ（例えば、これに限定されないが、ｉＰａｄ（登録商標）、ＧａｌａｘｙＴａｂ（登録商標）等）を含むとしてよい。

顔検出モジュール２２は、画像２０において顔および／または顔領域（例えば、点線で示しているインセット２３ａ内の矩形ボックス２３が表している領域）を特定し、消費者の１以上の特徴（つまり、消費者特徴３０）を決定する。顔検出モジュール２２はマーカー方式（つまり、１以上のマーカーを消費者の顔に適用）を利用し得るが、一部の実施形態によると、顔検出モジュール２２は、マーカー無方式を利用するとしてもよい。例えば、顔検出モジュール２２は、全体的に良好に定義されており、標準的な形式の画像を受信し（例えば、これに限定されないが、ＲＧＢカラー画像）、少なくともある程度まで画像において顔を特定する、カスタムの、独自の、公知および／または開発中の顔認識コード（または命令セット）、ハードウェアおよび／またはファームウェアを含むとしてよい。

また、顔検出モジュール２２はさらに、全体的に良好に定義されており、標準的な形式の画像を受信し（例えば、これに限定されないが、ＲＧＢカラー画像）、少なくともある程度まで画像において１以上の顔の特徴を特定する、カスタムの、独自の、公知および／または開発中の顔特徴コード（または命令セット）を含むとしてよい。このような公知の顔特徴システムは、これに限定されないが、公開されているオープン・ソース・コンピュータ・ビジョン（ＯｐｅｎＣＶ（登録商標））パッケージに含まれている標準的なビオラ−ジョーンズ（Ｖｉｏｌａ−Ｊｏｎｅｓ）ブースティングカスケードフレームワークを含む。本明細書でさらに詳細に説明するが、消費者特徴３０は、これらに限定されないが、消費者の識別情報（例えば、消費者に対応付けられている識別子）および／または顔の特徴（例えば、これらに限定されないが、消費者の年齢、消費者の年齢グループ（例えば、子供または成人）、消費者の性別、消費者の人種）および／または消費者の感情の識別情報（例えば、うれしい、悲しい、笑顔、渋面、驚き、興奮等）を含むとしてよい。

顔検出モジュール２２は、画像２２（例えば、画像２０内の顔２３に対応する顔パターン）と、消費者プロフィールデータベース２４に含まれている消費者プロフィール３２（１）−３２（ｎ）（以下では、個別に「消費者プロフィール３２」と呼ぶ）とを比較して、消費者を特定するとしてよい。消費者プロフィールデータベース２４を検索しても一致しない場合、顔検出モジュール２２は、撮影した画像２０に含まれる顔２３に基づいて新しい消費者プロフィール３２を作成するとしてよい。

顔検出モジュール２２は、被写体の顔２３の画像２０から目印または特徴を抽出することによって顔２３を特定するとしてよい。例えば、顔検出モジュール２２は、例えば、目、鼻、頬骨および顎の相対的な位置、サイズおよび／または形状を分析して、顔パターンを形成するとしてよい。顔検出モジュール２２は、特定された顔パターンを利用して、消費者を特定するべく、一致する顔パターンを持つ他の画像について消費者プロフィール３２（１）−３２（ｎ）を検索するとしてよい。比較処理は、一連の顕著な顔の特徴にテンプレートマッチング法を適用して行われ、いわゆる圧縮された顔表現が得られるとしてよい。このような公知の顔認識システムは、これに限定されないが、幾何学的技術（際立つ特徴を調べる）および／または測光技術（画像を価に変換してこの値とテンプレートとを比較してばらつきを無くす統計的アプローチ）に基づいたシステムであるとしてよい。

全てを網羅しているわけではないが、顔検出モジュール２２は、固有顔を持つ主成分分析、線形判別分析、弾性バンチグラフマッチングフィッシャーフェイス（ＥｌａｓｔｉｃＢｕｎｃｈＧｒａｐｈＭａｔｃｈｉｎｇｆｉｓｈｅｒｆａｃｅ）、隠れマルコフモデル、および、ニューロン動機づけによるダイナミックリンクマッチング（ｎｅｕｒｏｎａｌｍｏｔｉｖａｔｅｄｄｙｎａｍｉｃｌｉｎｋｍａｔｃｈｉｎｇ）を利用するとしてよい。

一実施形態によると、消費者は、消費者プロフィール３２を作成して、プログラム選択システム１２に登録するとしてよい。これに代えて（またはこれに加えて）、消費者プロフィール３２（１）−３２（ｎ）の１以上は、本明細書で説明しているように、プログラム選択モジュール２８によって生成および／または更新するとしてもよい。各消費者プロフィール３２は、消費者識別子および消費者人口統計データを含む。消費者識別子は、本明細書で説明するように、顔検出モジュール２２が利用する顔認識技術（例えば、これに限定されないが、パターン認識等）に基づいて消費者を一意的に特定するデータを含むとしてよい。消費者人口統計データは、消費者の特定の特徴および／または好みを表す。例えば、消費者人口統計データは、特定の種類の品物またはサービスに対する好み、性別、人種、年齢または年齢グループ、収入、障害、可動性（通勤時間または利用可能な自動車の数等）、学歴、持ち家か賃貸か、雇用状態および／または場所を含むとしてよい。消費者人口統計データはさらに、特定の種類／カテゴリーの広告方法に対する好みを含むとしてよい。広告方法の種類／カテゴリーの例としては、これらに限定されないが、コメディー調、ドラマ調、リアリティ調の広告等を含むとしてよい。

手検出モジュール２５は概して、１以上の画像２０を処理して、画像２０において手および／または手ジェスチャ（例えば、インセット２７ａに点線で示す手ジェスチャ２７）を特定するとしてよい。本明細書で説明するように、カメラ１４が撮影する手ジェスチャ２７の例は、「停止」、「親指右」、「親指左」、「親指上」、「親指下」および「ＯＫサイン」の手を含む。言うまでもなく、これらは、本開示で利用され得る種類の手ジェスチャ２７の例に過ぎず、本開示で利用し得る種類の手ジェスチャをすべて網羅するものではない。

手検出モジュール２５は、全体的に良好に定義されており、標準的な形式の画像（例えば、ＲＧＢカラー画像）を受信し、少なくともある程度まで画像において手を特定する、カスタムの、独自の、公知および／または開発中の手認識コード（または命令セット）を含むとしてよい。このような公知の手検出システムは、物体認識のためのコンピュータビジョンシステム、３Ｄ再構築システム、２Ｄハールウェーブレット応答システム（およびその派生物）、皮膚色ベース方法、形状ベース検出、ＳＵＲＦ（Ｓｐｅｅｄ−ＵｐＲｏｂｕｓｔＦｅａｔｕｒｅｓ）顔認識方式（およびその拡張および／または派生物）を含む。

手検出モジュール２５で得られた結果は、プログラム選択モジュール２８で受信する消費者特徴３０に含められるとしてよい。このため、消費者特徴３０は、顔検出モジュール２２および／または手検出モジュール２５の結果を含むとしてよい。

プログラム選択モジュール２８は、消費者特徴３０（および、消費者の識別情報が公知の場合には、任意の消費者の人口統計データ）と、プログラムデータベース２６に格納されているプログラムプロフィール３４（１）−３４（ｎ）（以下では、個別に「プログラムプロフィール３４」と呼ぶ）とを比較するとしてよい。本明細書でより詳細に説明するように、プログラム選択モジュール２８は、消費者特徴３０とプログラムプロフィール３４（１）−３４（ｎ）とを比較した結果に基づいて１以上のプログラムを選択するべく、さまざまな統計分析技術を利用するとしてよい。例えば、プログラム選択モジュール２８は、重み付け平均（これらに限定されないが、重み付け算術平均、重み付け幾何平均および／または重み付け調和平均を含む）統計分析を利用するとしてよい。

プログラム選択モジュール２８は、消費者特徴３０および現在視聴されている特定のプログラムおよび／またはプログラムプロフィール３４に基づいて、消費者プロフィール３２を更新するとしてよい。例えば、プログラム選択モジュール２８は、消費者特徴３０に特定されている消費者の反応（例えば、賛成、反対等）を特定のプログラムおよび当該プログラムの対応するプログラムプロフィール３４に反映するべく、消費者プロフィール３２を更新するとしてよい。消費者の反応は、手検出モジュール２５が検出した手ジェスチャ２７に直接関連するとしてよい。

プログラム選択モジュール２８はさらに、消費者プロフィール３２（１）−３２（ｎ）の全てまたは一部をコンテンツプロバイダ１６に送信するとしてよい。本明細書で用いる場合、「コンテンツプロバイダ」という表現は、放送業者、広告会社、制作スタジオおよび広告主を含む。コンテンツプロバイダ１６はこうして、この情報を利用して、同様の視聴者に基づいて今後のプログラムを開発するとしてよい。例えば、プログラム選択モジュール２８は、コンテンツプロバイダ１６にネットワーク３６を介して送信するべく、消費者プロフィール３２（１）−３２（ｎ）に対応するデータを暗号化およびパッケージングするとしてよい。ネットワーク３６は、有線通信経路および／または無線通信経路を含み得るものと認めるとしてよい。有線通信経路および／または無線通信経路は、例えば、これらに限定されないが、インターネット、衛星経路、光ファイバー経路、ケーブル経路、または、任意のその他の適切な有線通信経路または無線通信経路、または、これらの経路の組み合わせであるとしてよい。

プログラムプロフィール３４（１）−３４（ｎ）は、コンテンツプロバイダ１６（例えば、ネットワーク３６を介して）によって提供されるとしてよく、プログラム識別子／分類子および／またはプログラム人口統計パラメータを含むとしてよい。プログラム識別子／分類子は、特定のプログラムを、１以上の所定のカテゴリーに識別および／または分類するために用いられるとしてよい。例えば、プログラム識別子／分類子は、これらに限定されないが、例えば、「コメディー」、「家のリフォーム」、「ドラマ」、「リアリティ」、「スポーツ」等の幅広いカテゴリーに特定のプログラムを分類するために用いられるとしてよい。プログラム識別子／分類子は、これに加えて／これに代えて、これらに限定されないが、例えば、「野球」、「サッカー」、「ゲームショー」、「アクション映画」、「ドラマ映画」、「コメディー映画」等のより狭いカテゴリーに特定のプログラムを分類するために用いられるとしてよい。プログラム人口統計パラメータは、これらに限定されないが、性別、人種、年齢または年齢グループ、収入、障害、可動性（通勤時間または利用可能な自動車の数）、学歴、持ち家か賃貸か、雇用状態および／または場所等のさまざまな人口統計パラメータを含むとしてよい。コンテンツプロバイダ１６は、プログラム人口統計パラメータの重みおよび／または優先順位を決めるとしてよい。

メディアデバイス１８は、プログラム選択システム１２が選択したプログラムを、コンテンツプロバイダ１６から表示する。メディアデバイス１８は、これらに限定されないが、テレビ、電子掲示板、電子看板、パーソナルコンピュータ（例えば、デスクトップ、ラップトップ、ネットブック、タブレット等）、携帯電話（例えば、スマートフォン等）、音楽プレーヤ等の任意の種類のディスプレイを含むとしてよい。

プログラム選択システム１２（またはその一部）は、これらに限定されないが、ケーブルＳＴＢ、衛星ＳＴＢ、ＩＰ−ＳＴＢ、地上波ＳＴＢ、総合アクセスデバイス（ＩＡＤ）、デジタルビデオレコーダ（ＤＶＲ）、スマートフォン（例えば、これらに限定されないが、ｉＰｈｏｎｅ（登録商標）、Ｔｒｉｏ（登録商標）、Ｂｌａｃｋｂｅｒｒｙ（登録商標）、Ｄｒｏｉｄ（登録商標）、等）、パーソナルコンピュータ（これらに限定されないが、デスクトップコンピュータ、ラップトップコンピュータ、ネットブックコンピュータ、タブレットコンピュータ（例えば、これらに限定されないが、ｉＰａｄ（登録商標）、ＧａｌａｚｙＴａｂ（登録商標）、等）を含む）等のセットトップボックス（ＳＴＢ）に一体化されるとしてよい。

図２を参照すると、本開示に応じた顔検出モジュール２２ａの一実施形態の概略を図示している。顔検出モジュール２２ａは、画像２０を受信して、少なくともある程度まで、顔（または複数の顔）を画像２０内で特定するとしてよい。顔検出モジュール２２ａはさらに、少なくともある程度まで、１以上の顔特徴を画像２０において特定し、１以上の消費者特徴３０（本明細書で説明する手ジェスチャの情報も含むとしてもよい）を決定するとしてよい。消費者特徴３０は、少なくとも部分的に、本明細書で説明しているように顔検出モジュール２２ａが特定した顔パラメータのうち１以上の顔パラメータに基づいて生成されるとしてよい。消費者特徴３０は、これに限定されないが、消費者識別情報（例えば、消費者に対応付けられている識別子）および／または顔特徴（例えば、これに限定されないが、消費者の年齢、消費者の年齢グループ（例えば、子供または成人）、消費者の性別、消費者の人種）、および／または、消費者表情識別情報（例えば、うれしい、悲しい、笑顔、渋面、驚き、興奮等）を含むとしてよい。

例えば、顔検出モジュール２２ａの一実施形態は、顔検出／追跡モジュール４０と、目印検出モジュール４４と、顔標準化モジュール４２と、顔パターンモジュール４６とを有するとしてよい。顔検出／追跡モジュール４０は、全体的に良好に定義されており、カメラから受信した静止画像またはビデオストリームにおいて人間の顔のサイズおよび位置を、少なくともある程度まで、検出および識別するカスタムの、独自の、公知および／または開発中の顔追跡コード（または命令セット）を含むとしてよい。このような公知の顔検出／追跡システムは、例えば、ポール・ビオラ（Paul Viola）およびマイケル・ジョーンズ（Michael Jones）、Rapid Object Detection using a Boosted Cascade of Simple Features, Accepted Conference on Computer Vision and Pattern Recognition, 2001.で公開されているビオラ・ジョーンズ技術を含む。これらの技術では、画像において余すところなくウィンドウをスキャンすることによって、顔を検出する一連のアダプティブ・ブースティング（ＡｄａｐｔｉｖｅＢｏｏｓｔｉｎｇ（ＡｄａＢｏｏｓｔ））分類子を利用する。顔検出／追跡モジュール４０はさらに、複数の画像２０にわたって、特定された顔または顔領域を追跡するとしてよい。

顔標準化モジュール４２は、全体的に良好に定義されており、画像２０に含まれている特定された顔を標準化する、カスタムの、独自の、公知および／または開発中の顔標準化コード（または命令セット）を含むとしてよい。例えば、顔標準化モジュール４２は、画像を回転させて、目の位置合わせを行い（目の座標が既知の場合）、画像をトリミングして顔のサイズに概して対応する小さいサイズとして、画像をスケーリングして目の間の距離を一定にして、通常の顔を含む楕円内に含まれない画素をゼロにするマスクを適用し、マスクが適用されていない画素の階調値の分布を平滑化するべく画像をヒストグラム均一化して、および／または、マスクが適用されていない画素の平均がゼロになり標準偏差が１になるように画像を標準化するとしてよい。

目印検出モジュール４４は、全体的に良好に定義されており、少なくともある程度まで、画像２０において顔が持つさまざまな顔特徴を検出および特定する、カスタムの、独自の、公知および／または開発中の目印検出コード（または命令セット）を含むとしてよい。目印検出において、少なくともある程度まで、顔が既に検出されていることは暗黙の了解である。ある程度の局所化（例えば、コース局所化）を実行して（例えば、顔標準化モジュール４２によって）、目印が発見され得る画像２０のゾーン／領域を特定、および／または、そのようなゾーン／領域に注目するとしてよい。例えば、目印検出モジュール４４は、ヒューリスティック分析に基づいて動作するとしてよく、目（および／または目の縁）、鼻（例えば、鼻の先端）、顎先（例えば、顎先の先端）、頬骨および顎の相対的な位置、サイズおよび／または形状を特定および／または分析するとしてよい。このような公知の目印検出システムは、６個の顔の上の点（つまり、左目／右目の目の縁、および、口角）および６個の顔の上の点（つまり、グリーンポイント）を含む。目の縁および口角はさらに、ビオラ・ジョーンズをベースとする分類子を用いて検出されるとしてよい。形状に関する制約を６個の顔の上の点に組み込んで、形状に関するそれらの関係を反映させるとしてもよい。

顔パターンモジュール４６は、全体的に良好に定義されており、画像２０において特定された顔の目印に基づいて顔パターンを特定および／または生成する、カスタムの、独自の、公知および／または開発中の顔パターンコード（または命令セット）を含むとしてよい。想到されるように、顔パターンモジュール４６は、顔検出／追跡モジュール４０の一部分と見なされるとしてもよい。

顔検出モジュール２２ａは、顔認識モジュール４８、性別／年齢識別モジュール５０、および／または、表情検出モジュール５２のうち１以上を含むとしてよい。具体的には、顔認識モジュール４８は、全体的に良好に定義されており、顔パターンと、データベースに格納されている対応する顔パターンとを一致させる、カスタムの、独自の、公知および／または開発中の顔識別コード（または命令セット）を含むとしてよい。例えば、顔認識モジュール４８は、顔パターンモジュール４６が特定した顔パターンを比較して、特定した顔パターンと、消費者プロフィールデータベース２４に格納されている消費者プロフィール３２（１）−３２（ｎ）に対応付けられている顔パターンとを比較して、画像２０に含まれている消費者の識別情報を求めるとしてよい。顔認識モジュール４８は、幾何学分析（識別可能な特徴を調べる）および／または測光分析（画像を値に変換して、これらの値をテンプレートと比較して、バラツキを無くす統計的方法）を利用してパターン比較を行うとしてよい。一部の顔認識技術としては、これらに限定されないが、固有顔を持つ主成分分析（およびその派生物）、線形判別分析（およびその派生物）、弾性バンチグラフマッチングフィッシャーフェイス（ＥｌａｓｔｉｃＢｕｎｃｈＧｒａｐｈＭａｔｃｈｉｎｇｆｉｓｈｅｒｆａｃｅ）（およびその派生物）、隠れマルコフモデル（およびその派生物）、および、ニューロン動機づけによるダイナミックリンクマッチング（ｎｅｕｒｏｎａｌｍｏｔｉｖａｔｅｄｄｙｎａｍｉｃｌｉｎｋｍａｔｃｈｉｎｇ）が挙げられる。

顔認識モジュール４８は、既存の消費者プロフィール３２と一致しない場合には、消費者プロフィールデータベース２４内に新しい消費者プロフィール３２を作成させるとしてよい。例えば、顔認識モジュール４８は、特定した消費者特徴３０を表すデータを、消費者プロフィールデータベース２４に転送するとしてよい。そして、新しい消費者プロフィール３２に対応付けられている識別子が作成されるとしてよい。

性別／年齢識別モジュール５０は、全体的に良好に定義されており、画像２０に含まれる人物の性別を検出および特定し、および／または、少なくともある程度まで、画像２０に含まれる人物の年齢を検出および特定する、カスタムの、独自の、公知および／または開発中の性別および／または年齢識別コード（または命令セット）を含むとしてよい。例えば、性別／年齢識別モジュール５０は、画像２０から生成された顔パターンを分析して、画像２０に含まれる人物の性別を特定するとしてよい。特定された顔パターンは、さまざまな顔パターンと性別との相関関係を含む性別データベースに対して比較するとしてもよい。

性別／年齢識別モジュール５０はさらに、画像２０に含まれる人物の年齢および／または年齢グループを決定および／または推定するとしてよい。例えば、性別／年齢識別モジュール５０は、特定された顔パターンを、さまざまな顔パターンと年齢との間の相関関係を格納している年齢データベースに対して比較するとしてよい。年齢データベースは、人物の実際の年齢を推定するとしてもよいし、および／または、人物を１以上の年齢グループに分類するとしてもよい。年齢グループの例としては、これらに限定されないが、成人、子供、１０代、老人／シニア等を含むとしてよい。

表情検出モジュール５２は、全体的に良好に定義されており、画像２０に含まれている人物の表情を検出および／または特定する、カスタムの、独自の、公知および／または開発中の表情検出および／または識別コード（または命令セット）を含むとしてよい。例えば、表情検出モジュール５２は、顔特徴（例えば、目、口、頬、歯等）のサイズおよび／または位置を決定するとしてよく、顔特徴を、対応する顔特徴グループ（例えば、笑顔、渋面、興奮、悲しい等）を持つ複数の顔特徴サンプルを含む顔特徴データベースに対して比較するとしてよい。

一実施形態例によると、顔検出モジュール２２ａの１以上の側面（例えば、これに限定されないが、顔検出／追跡モジュール４０、認識モジュール４８、性別／年齢モジュール５０、および／または、表情検出モジュール５２）は、１以上の入力を１以上の出力に繰り返しマッピングする多層パーセプトロン（ＭＬＰ）モデルを利用するとしてよい。ＭＬＰモデルの一般的なフレームワークは、公知であり良好に定義されており、線形分離可能でないデータを区別することによって標準的な線形パーセプトロンモデルを改良したフィードフォワードニューラルネットワークを概して含む。この例では、ＭＬＰモデルへの入力は、目印検出モジュール４４が生成する１以上の形状特徴を含むとしてよい。ＭＬＰモデルは、複数の入力ノードによって定義されている入力レイヤを含むとしてよい。各ノードは、顔画像の形状特徴を含むとしてよい。ＭＬＰモデルはさらに、「隠れ」ニューロンで定められる「隠れ」レイヤまたは繰り返しレイヤを含むとしてよい。通常、ＭはＮ未満であり、入力レイヤの各ノードは、「隠れ」レイヤの各ニューロンに接続されている。

ＭＬＰモデルはさらに、複数の出力ニューロンによって定められる出力レイヤを含むとしてよい。各出力ニューロンは、「隠れ」レイヤの各ニューロンに接続されているとしてよい。出力ニューロンは概して、所定の出力の確率を表す。出力の数は、予め定められているとしてよく、本開示では、顔検出／追跡モジュール４０、顔認識モジュール４８、性別／年齢モジュール５０、および／または、表情検出モジュール５２が特定するが特定する顔および／または顔ジェスチャの数に一致するとしてよい。このように、例えば、各出力ニューロンが、顔および／または顔ジェスチャ画像の一致の確率を示しているとしてよく、最後の出力は、最大確率を示している。

ＭＬＰモデルの各レイヤにおいて、レイヤｍの入力ｘ_ｊについて、レイヤｎ＋１の出力Ｌｉは、以下の式に応じて算出される。
ｆ関数は、シグモイド活性化関数を仮定して、以下のように定義するとする。

ＭＬＰモデルは、トレーニング手順で学習されるパラメータα、βを生成するべく利用され得るバックプロパゲーション技術を利用して学習することが可能であるとしてよい。各入力ｘ_ｊは、重みまたはバイアスをかけることによって、顔および／または顔ジェスチャタイプの可能性がより高いことを示すとしてよい。ＭＬＰモデルはさらに、例えば、既知の顔および／または顔ジェスチャを特定して、ＭＬＰモデルが、イテレーションの度に、これらの既知の顔および／または顔ジェスチャを「ターゲット」にできるようにすることを含むトレーニングプロセスを含むとしてよい。

顔検出／追跡モジュール４０、顔認識モジュール４８、性別／年齢モジュール５０、および／または、表情検出モジュール５２の出力は、特定した顔および／または顔ジェスチャのタイプを示すデータセットまたは信号を含むとしてよい。これは、消費者特徴データ／信号３０の一部を生成するために用いられるとしてよい。顔検出モジュール２２ａが生成する消費者特徴３０は、手検出モジュール２５に供給されるとしてよい。手検出モジュール２５は、画像２０において手（存在する場合）を検出して、消費者特徴３０を更新するとしてよい。消費者特徴３０は、本明細書で説明するように、１以上のプログラムプロフィール３４（１）−３２（ｎ）を選択するために用いられるとしてよい。

図３を参照すると、手検出モジュール２５ａの一実施形態の概略が図示されている。手検出モジュール２５ａは概して、一連の画像（例えば、毎秒２４フレームのペースで複数のビデオフレーム）にわたって、手領域（手検出モジュール８８によって定められる）を追跡するとしてよい。手追跡モジュール８０は、全体的に良好に定義されており、一連の画像（例えば、ＲＧＢカラー画像）を受信して少なくともある程度までこれらの一連の画像において手を追跡する、カスタムの、独自の、公知および／または開発中の追跡コード（または命令セット）を含むとしてよい。このような公知の追跡システムは、粒子フィルタ、オプティカルフロー、カルマンフィルタ等を含む。これらの技術はそれぞれ、エッジ分析、二乗和の差分の分析、特徴点分析、ミーンシフト（ｍｅａｎ−ｓｈｉｆｔｉｎｇ）法（または、その派生物）等を利用するとしてよい。

手検出モジュール２５ａはさらに、画像の手領域（手検出モジュール８８および／または手追跡モジュール８０が定義する）における手の皮膚の色を特定するように概して構成されている皮膚分割モジュール８２を含むとしてよい。皮膚分割モジュール８２は、全体的に良好に定義されており、手領域の他の部分から皮膚のトーンまたは色を区別する、カスタムの、独自の、公知および／または開発中の皮膚特定コード（または命令セット）を含むとしてよい。このような公知の皮膚特定システムとしては、色相−彩度の色成分に対する閾値分析、ＨＳＶ色統計学、色−テクスチャモデリング等が挙げられる。一実施形態例を挙げると、皮膚分割モジュール８２は、多変数ガウスモデル（およびその派生物）等の、一般化した統計学的な皮膚色モデルを利用するとしてよい。

手検出モジュール２５ａはさらに、皮膚分割モジュール８２が生成するバイナリ画像において手の１以上の形状特徴を特定するように概して構成されている形状特徴抽出モジュール８４を含むとしてよい。形状特徴は通常、バイナリ画像における手の形状の固有特性および／または「マーカー」を含み、画像内の手ジェスチャを特定するべく手ジェスチャ認識モジュール８６の効率を改善するために用いられるとしてよい。形状特徴は、例えば、偏心度、密集度、配向、矩形度、幅中心、高さ中心、欠陥数、左部分と右部分との間の差分、上部分と下部分との間の差分等を含むとしてよい。

例えば、手ジェスチャ認識モジュール８６は、例えば、以下で説明するように、形状特徴抽出モジュール８４が特定した手形状特徴に基づいて、画像２７の手領域で手ジェスチャを特定するように概して構成されているとしてよい。手ジェスチャ認識モジュール８６は、全体的に良好に定義されており、画像内の手ジェスチャを特定する、カスタムの、独自の、公知および／または開発中の皮膚特定コード（または命令セット）を含むとしてよい。本開示の教示内容に応じて利用され得る公知の手ジェスチャ認識システムは、例えば、パターン認識システム、ペルセウス（Ｐｅｒｓｅｕｓ）モデル（およびその派生物）、隠れマルコフモデル（およびその派生物）、サポートベクターマシン、線形判別分析、決定木等を含む。例えば、手ジェスチャ認識モジュール８６は、１以上の入力を１以上の出力に繰り返しマッピングする多層パーセプトロン（ＭＬＰ）モデルまたはその派生物を利用するとしてよい。ＭＬＰモデルの一般的なフレームワークは、公知であり良好に定義されている。そして一般的には、線形分離可能でないデータを区別することによって、標準的な線形パーセプトロンモデルを改善したフィードフォワードニューラルネットワークを含む。この例では、ＭＬＰモデルへの入力は、上述したように、形状特徴抽出モジュール８４が生成した１以上の形状特徴を含むとしてよい。

カメラ１４が撮影する手ジェスチャ２７の例には、「停止」８３Ａ、「親指右」８３Ｂ、「親指左」８３Ｃ、「親指上」８３Ｄ、「親指下」８３Ｅ、および「ＯＫサイン」８３Ｆがある。言うまでもなく、画像８３Ａ−８３Ｆは、本開示で用いられるタイプの手ジェスチャの例に過ぎず、本開示で用いられるタイプの手ジェスチャをすべて網羅したものではない。

手ジェスチャ認識モジュール８６の出力は、特定したタイプの手ジェスチャを示すデータセットまたは信号を含むとしてよい。これは、消費者特徴データ３０の一部を生成するために用いられるとしてよい。

図４は、本開示の一実施形態に応じた、「親指上」の手ジェスチャ（左手）の画像である。元の画像９１（図１の画像２７に対応）は、ＲＧＢ形式のカラー画像である。図３の皮膚分割モジュール８２が生成するバイナリ画像９２は、皮膚以外の画素を黒として、皮膚の画素を白として示している。図３の形状特徴抽出モジュール８４は、画像９３に示すように、バイナリ画像において手の周囲、または、周囲の一部を取り囲む境界形状を生成するとしてよい。境界形状は、図示しているように矩形であってよく、他の実施形態では、境界形状は、例えば、画像内の手の形状に応じて、円、楕円、正方形および／または他の正多角形状または多角形状を含むとしてよい。境界形状に基づいて、形状特徴抽出モジュール８４は、境界形状における偏心度、矩形度、密集度および画像中心を決定するとしてよく、さらに画像内の白い画素をカウントして面積を決定し、エッジにある白い画素（例えば、黒い画素に隣接している白い画素）をカウントして外周を決定するとしてよい。偏心度は、境界形状の幅と境界形状の高さとを乗算したものとして求められるとしてよい。矩形度は面積を境界ボックスの面積で除算したものとして求められるとしてよい。密集度は、外周（二乗値）を面積で除算したものとして求められるとしてよい。また、形状特徴抽出モジュール８４は、画像９４内に図示しているように、境界形状における手の中心を決定するとしてよい。中心は、水平軸（例えば、ｘ軸）および垂直軸（例えば、ｙ軸）の両方に沿った境界形状の中心として求めるとしてよい。

形状特徴抽出モジュール８４はさらに、画像９５に示すように、手の輪郭を特定するとしてよい。輪郭は、隣接する画素同士の間で、バイナリ１（白）からバイナリ０（黒）へと変化しているか否かを判断することによって、特定されるとしてよい。境界上の画素が輪郭を画定する。形状特徴抽出モジュール８４はさらに、輪郭に沿って存在する欠陥の数を決定するとしてよい。画像９６には、このような欠陥を４つ図示している。欠陥は、局所的な凸型の欠陥と定義されるとしてよい。例えば、凸領域が１以上の凸画素を持つ画素位置であるとしてよい。形状特徴抽出モジュール８４はさらに、画像９７に示すように、輪郭（９５）を取り囲む形状のうち最小形状を決定するとしてよい。最小形状（本例では矩形）は、画像において左端の白い画素、右端の白い画素、最も高い位置の白い画素、および、最も低い位置の白い画素によって画定されるとしてよく、図示しているように、画像の軸に対して斜めになっている場合がある。画像の水平軸に対する最小形状の角度は、形状特徴抽出モジュール８４によって決定されるとしてよい。また、形状特徴抽出モジュール８４は、最小ボックス幅を最小ボックス高さで除算した結果として定義される最小ボックスの幅と高さとの比率を決定するとしてよい。水平軸に対する最小形状の角度に基づき、形状特徴抽出モジュール８４はさらに、画像内の手の向きを決定するとしてよい。ここにおいて、向きは、画像９８に示すように、最小形状の幅に垂直であって最小形状の幅の中心から延伸している線と定義されるとしてよい。

形状特徴抽出モジュール８４はさらに、画像９９に示すように、境界形状（画像９３）を複数の略等分のセグメントに分割するとしてよい。本例では、境界形状は、Ａ、Ｂ、ＣおよびＤと示している４つの等分の矩形サブブロックに分割される。サブブロックに基づき、形状特徴抽出モジュール８４はさらに、各サブブロックに含まれる白い画素の数、画像の左半分および右半分に含まれる画素の数の差分（例えば、（Ａ＋Ｃ）−（Ｂ＋Ｄ））、および、画像の上半分および下半分の画素数の差分（例えば、（Ａ＋Ｂ）−（Ｃ＋Ｄ））を決定するとしてよい。

上述した形状特徴抽出モジュール８４の処理の例および説明した形状特徴は、全てを網羅したものではなく、上述した形状特徴は全てが、画像に含まれている手ジェスチャを決定する際に有用または必要であるわけではない。このように、一部の実施形態によると、他の手ジェスチャについては、追加で形状特徴を決定するとしてよく、または、上述した形状特徴の一部を決定するとしてもよい。

ここで図５を参照すると、本開示に応じたプログラム選択モジュール２８ａの一実施形態の概略が図示されている。プログラム選択モジュール２８ａは、少なくとも部分的に、プログラムデータベース２６に格納されているプログラムプロフィール３４（１）−３４（ｎ）と、顔検出モジュール２２および／または手検出モジュール２５が特定する消費者特徴データ３０との比較結果に基づいてプログラムデータベース２６から少なくとも１つのプログラムを選択する。プログラム選択モジュール２８ａは、消費者プロフィールデータベース２４から消費者プロフィール３２を特定するべく、特徴データ３０を利用するとしてよい。消費者プロフィール３２はさらに、本明細書で説明するようにプログラムを選択する際にプログラム選択モジュール２８ａが利用するパラメータを含むとしてよい。プログラム選択モジュール２８ａは、消費者プロフィールデータベース２４において消費者プロフィール３２を更新および／または作成し、消費者プロフィール３２と特徴データ３０とを対応付けるとしてよい。

一実施形態によると、プログラム選択モジュール２８ａは、１以上の推薦モジュール（例えば、性別および／または年齢推薦モジュール６０、消費者識別情報推薦モジュール６２、消費者表情推薦モジュール６４、および／または、ジェスチャ推薦モジュール６６）および決定モジュール６８を含む。本明細書で説明するように、決定モジュール６８は、推薦モジュール６０、６２、６４および６６の分析結果のまとめに基づいて、１以上のプログラムを選択する。

性別および／または年齢推薦モジュール６０は、プログラムプロフィール３４（１）−３２（ｎ）と、消費者の年齢（またはその近似値）、年齢グループ（例えば、成人、子供、１０代、シニア等）および／または性別（以下ではまとめて「年齢／性別データ」と呼ぶ）との比較結果に少なくとも部分的に基づいて、プログラムデータベース２６から１以上のプログラムを特定し、および／または、当該プログラムのランク付けをするとしてよい。例えば、性別および／または年齢推薦モジュール６０は、本明細書で説明しているように、特徴データ３０から、および／または、特定した消費者プロフィール３２から、消費者の年齢／性別データを特定するとしてよい。プログラムプロフィール３４（１）−３２（ｎ）はさらに、コンテンツプロバイダおよび／または広告代理店が供給する１以上のタイプの年齢／性別データ（つまり、対象）に対する各プログラムのグループ分け、ランク付け、および／または、関連性の重み付けを表すデータを含むとしてよい。性別および／または年齢推薦モジュール６０はこの後、消費者年齢／性別データと、プログラムプロフィール３４（１）−３４（ｎ）とを比較して、１以上のプログラムを特定および／またはランク付けするとしてよい。

消費者識別情報推薦モジュール６２は、プログラムプロフィール３４（１）−３２（ｎ）と、特定した消費者プロフィールとの比較結果に少なくとも部分的に基づいて、プログラムデータベース２６から１以上のプログラムを特定、および／または、当該プログラムをランク付けするとしてよい。例えば、消費者識別情報推薦モジュール６２は、本明細書で説明するように、特定した消費者プロフィール３２に対応付けられている、過去の視聴履歴およびそれに対する反応に基づいて、消費者の好みおよび／または習慣を特定するとしてよい。消費者の好み／習慣は、これらに限定されないが、消費者が特定のプログラムを視聴した時間（つまり、プログラム視聴時間）、どのタイプのプログラムを消費者が視聴したか、消費者がプログラムを視聴した日にち、曜日、月および／あるいは時刻、ならびに／または、消費者の表情（笑顔、渋面、興奮、凝視等）等を含むとしてよい。消費者識別情報推薦モジュール６２はさらに、特定した消費者の好み／習慣を特定した消費者プロフィール３２と共に、後に利用するべく格納するとしてよい。消費者識別情報推薦モジュール６２はこのため、特定の消費者プロフィール３２に対応付けられている消費者履歴と比較して、どのプログラムプロフィール３４（１）−３２（ｎ）を推薦するかを決定するとしてよい。

消費者識別情報推薦モジュール６２がどのプログラムを推薦すべきか特定するための要件は、消費者が特定の既存の消費者プロフィール３２で特定されることである。しかし、このように特定するためには必ずしも、コンテンツ選択モジュール２８ａが消費者の名前またはユーザネームを知っていることを要件としないが、単に、画像２０に含まれている消費者を消費者プロフィールデータベース２４にある対応する消費者プロフィール３２とコンテンツ選択モジュール２８ａが認識または対応付けできればよいので、匿名であってもよい。このため、消費者は対応する消費者プロフィール３２を登録するが、これは要件ではない。

消費者表情推薦モジュール６４は、消費者特徴データ３０に含まれている消費者表情と、消費者が現在視聴しているプログラムに対応付けられているプログラムプロフィール３４とを比較する。例えば、消費者特徴データ３０が消費者は笑っているかまたは凝視していることを示す（例えば、表情検出モジュール５２の判断結果が示す）場合、消費者表情推薦モジュール６４は、消費者が視聴しているプログラムのプログラムプロフィール３４は好ましいものであると推定するとしてよい。消費者表情推薦モジュール６４はこのため、視聴しているプログラムのプログラムプロフィール３４と類似しているプログラムプロフィール３４（１）−３２（ｎ）を追加で１以上特定するとしてよい。さらに、消費者表情推薦モジュール６４はまた、特定された消費者プロフィール３２を更新するとしてよい（消費者プロフィール３２が特定されたと仮定）。

ジェスチャ推薦モジュール６６は、消費者特徴データ３０内の手ジェスチャ情報と、消費者が現在視聴しているプログラムに対応付けられているプログラムファイル３２とを比較する。例えば、消費者特徴データ３０が消費者は「親指上」の手ジェスチャをしていることを示す（例えば、手検出モジュール２５の判断結果が示す）場合、ジェスチャ推薦モジュール６６は、消費者が視聴しているプログラムのプログラムプロフィール３４は好ましいものであると推定するとしてよい。ジェスチャ推薦モジュール６６はこのため、視聴中のプログラムのプログラムプロフィール３４に類似したプログラムプロフィール３４（１）−３２（ｎ）を追加で１以上特定するとしてよい。同様に、消費者特徴データ３０が消費者は「親指下」の手ジェスチャをしていることを示す場合、ジェスチャ推薦モジュール６６は、消費者が視聴しているプログラムのプログラムプロフィール３４が好ましくないと推定するので、視聴中のプログラムのプログラムプロフィール３４に類似した他のプログラムプロフィール３４（１）−３２（ｎ）を低減および／または削除するとしてよい。さらに、ジェスチャ推薦モジュール６６はさらに、特定した消費者プロフィール３２を（消費者プロフィール３２が特定されたと仮定）、視聴したプログラムプロフィールとの間で特定された相関関係に基づき更新するとしてよい。

決定モジュール６８は、さまざまな推薦モジュール６０、６２、６４および６６からの推薦の重みおよび／またはランクを決定するとしてよい。例えば、決定モジュール６８は、ヒューリスティック分析、最適適合タイプ分析、回帰分析、統計的推定、統計的帰納、および／または、推測統計に基づいて、そして、推薦モジュール６０、６２、６４および６６が推薦するプログラムプロフィール３４に基づいて、消費者に提示すべき１以上のプログラムプロフィール３４を特定および／またはランク付けして、１以上のプログラムを選択するとしてよい。決定モジュール６８は必ずしもすべての消費者データ３０を考慮する必要はないと考えられたい。また、決定モジュール６８は、複数の消費者が同時に視聴している場合に特定および推薦されたプログラムプロフィール３４を比較するとしてよい。例えば、決定モジュール６８は、視聴している複数の消費者の数、年齢、性別等に基づいて、複数の異なる分析技術を利用するとしてよい。例えば、決定モジュール６８は、視聴している一群の消費者の特徴に基づいて、１以上のパラメータを低減および／または無視するとしてよく、および／または、１以上のパラメータの関連性を高めるとしてよい。一例として、決定モジュール６８は、子供が特定されれば、成人が存在する場合であっても、子供向けのプログラムを提示するようにデフォルトで設定されるとしてよい。別の例を挙げると、決定モジュール６８は、男性より多くの女性が検出される場合には、女性向けのプログラムを提示するとしてよい。

また、決定モジュール６８は、全体的な手ジェスチャに基づいて、プログラムファイル３２を選択するとしてよい。例えば、顔検出モジュール２２が現在ディスプレイ１８を視聴している人物の識別情報を決定すると、決定モジュール６８は、手検出モジュール２５が検出した手ジェスチャに基づいて同様のプログラムプロフィール３４を選択するとしてよい。このため、消費者は、視聴しているプログラムの好みを評価することができ、この評価は今後プログラムを選択する際に利用され得る。言うまでもなく、これらの例は全てを網羅したものではなく、決定モジュール６８は他の選択技術および／または選択基準を利用するとしてもよい。

一実施形態によると、コンテンツ選択モジュール２８ａは、消費者に提示すべく選択された１以上のプログラムを表す信号をコンテンツプロバイダ１６に送信するとしてよい。コンテンツプロバイダ１６はこの後、信号を対応するプログラムを持つメディアデバイス１８に信号を送信するとしてよい。これに代えて、プログラムはローカルに格納されているとしてもよく（例えば、メディアデバイス１８および／またはプログラム選択システム１２に対応付けられているメモリ）、コンテンツ選択モジュール２８ａは、選択されたプログラムをメディアデバイス１８で提示させてもよい。

コンテンツ選択モジュール２８ａはさらに、収集した消費者プロフィールデータ（またはその一部をコンテンツプロバイダ１６に送信するとしてよい。コンテンツプロバイダ１６はこの後、この情報を転売して、および／または、この情報を利用して、潜在視聴者に基づき今後のプログラムを開発するとしてよい。

図６を参照すると、プログラムを選択して表示する方法６００の一実施形態を説明するためのフローチャートが図示されている。方法６００は、消費者の１以上の画像を撮影する段階を備える（処理６１０）。画像は１以上のカメラを用いて撮影されるとしてよい。撮影された画像において顔および／または顔領域を特定するとしてよく、少なくとも１つの消費者特徴を決定するとしてよい（処理６２０）。具体的には、画像を分析して、消費者の年齢、消費者の年齢グループ（例えば、子供か成人か）、消費者の性別、消費者の人種、消費者の表情の特定（例えば、うれしい、悲しい、笑顔、渋面、驚き、興奮等）、および／または、消費者の識別情報（例えば、消費者に対応付けられている識別子）といった消費者特徴のうち１以上を決定するとしてよい。例えば、方法６００は、特定の消費者を特定するべく、画像内で特定された１以上の顔目印パターンと、消費者プロフィールデータベースに格納されている一連の消費者プロフィールとを比較する段階を備えるとしてよい。方法６００は、一致しない場合、消費者プロフィールデータベースに新しい消費者プロフィールを作成する段階を備えるとしてよい。

方法６００はさらに、撮影した画像から１以上の手ジェスチャを特定する段階を備える（処理６３０）。手ジェスチャは、これらに限定されないが、親指上、親指下等のジェスチャであるとしてよい。特定した手ジェスチャを表す情報を消費者特徴に追加するとしてよい。

方法６００はさらに、消費者特徴に基づいて消費者に提示する１以上のプログラムを特定する段階を備える（処理６４０）。例えば、方法６００は、消費者特徴と、プログラムデータベースに格納されている一連のプログラムプロフィールとを比較して、消費者に提示する特定のプログラムを特定するとしてよい。これに代えて（またはこれに加えて）、方法６００は、消費者プロフィール（および対応する一群の消費者人口統計データ）と、プログラムプロフィールとを比較して、消費者に提示すべき特定のプログラムを特定するとしてよい。例えば、方法６００では、消費者特徴を利用して、消費者プロフィールデータベースに格納されている特定の消費者プロフィールを特定するとしてよい。

方法６００はさらに、選択されたプログラムを消費者に表示する段階を備える（処理６５０）。方法６００はこの後、繰り返されるとしてよい。方法６００は、視聴している特定のプログラムに関連する消費者特徴に基づいて、消費者プロフィールデータベースの消費者プロフィールを更新するとしてよい。この情報は、消費者プロフィールデータベースに格納されている消費者プロフィールに組み込まれるとしてよく、今後のプログラムを特定するべく利用されるとしてよい。

図７を参照すると、視聴環境において撮影した消費者の画像に基づいてプログラムを選択して表示する処理７００を説明する別のフローチャートである。本実施形態に係る処理は、１以上のカメラを用いて１以上の画像を撮影する処理を含む（処理７１０）。画像を撮影すると、画像に対して顔分析を実行する（処理５１２）。顔分析５１２は、撮影した画像において顔または顔領域が存在すること（または存在しないこと）を特定することを含み、顔／顔領域が検出されると、画像に関連する１以上の特徴を決定することを含む。例えば、消費者の性別および／または年齢（または年齢グループ）を特定するとしてよく（処理７１４）、消費者の表情を特定するとしてよく（処理７１６）、および／または、消費者の識別情報を特定するとしてよい（処理７１８）。

処理７００はさらに、１以上の画像に対して手分析を実行して、手ジェスチャを特定および／または分類することを含む（処理７１９）。手ジェスチャは、これらに限定されないが、親指上、親指下等のジェスチャを含むとしてよい。特定した手ジェスチャを表す情報は、消費者特徴に追加されるとしてよい。

顔分析および手ジェスチャ分析を実行すると、顔および手の分析に基づいて消費者特徴データを生成するとしてよい（処理７２０）。この後消費者特徴データと、複数の異なるプログラムに対応付けられている複数のプログラムプロフィールとを比較して、１以上のプログラムを推薦する（処理７２２）。例えば、消費者特徴データとプログラムプロフィールとを比較して、消費者の性別および／または年齢に基づいて１以上のプログラムを推薦するとしてよい（処理７２４）。消費者特徴データは、プログラムプロフィールと比較して、特定した消費者プロフィールに基づいて１以上のプログラムを推薦するとしてよい（処理７２６）。消費者特徴データと、プログラムプロフィールとを比較して、特定した表情に基づいて１以上のプログラムを推薦するとしてよい（処理７２８）。消費者特徴データと、プログラムプロフィールとを比較して、特定した手ジェスチャに基づいて１以上のプログラムを推薦するとしてよい（処理７２９）。処理７００はさらに、推薦したプログラムプロフィールの比較結果に基づいて、消費者に提示すべき１以上のプログラムを選択する処理を含む（処理７３０）。プログラムの選択は、さまざまな選択基準７２４、７２６、７２８および７２９の重み付けおよび／またはランク付けに基づいて行われるとしてよい。この後選択されたプログラムを消費者に表示する（処理７３２）。

処理７００はこの後、処理７１０から繰り返し開始されるとしてよい。撮影した画像に基づいてプログラムを選択する処理は、実質的に連続的に実行されるとしてよい。これに代えて、撮影した画像に基づきプログラムを選択する処理のうち１以上の処理（例えば、顔分析５１２および／または手分析７１９）は、定期的に実行されるとしてもよいし、および／または、少数のフレーム毎（例えば、３０フレーム毎）に実行するとしてもよい。これは、演算能力が低い（例えば、パーソナルコンピュータより能力が低い）プラットフォームにプログラム選択システム１２が組み込まれている場合に特に適しているとしてよい。

以下では、本開示に応じた疑似コードの一実施形態の一例を説明する。

図６および図７はさまざまな実施形態に係る方法に含まれる処理を図示しているが、任意の実施形態において、これらの処理のうち全てが必要なわけではないと理解されたい。本明細書では、本開示の他の実施形態において、図６および図７に図示した処理はどの図面にも具体的に図示していない方法で組み合わせ得るが、本開示には完全に一致しているものと考えられる。このように、一の図面で正確に図示していない特徴および／または処理に関する請求項も、本開示の範囲および内容に含まれるものとする

また、実施形態に係る演算はさらに、上記の図面および添付した例を参照しつつ説明した。図面の一部は、ロジックフローを含むとしてよい。本明細書に示すこのような図面は特定のロジックフローを含むが、ロジックフローは単に、本明細書で説明した一般的な機能をどのように実装するかの例を提示するものと考えられる。さらに、所与のロジックフローは、特に明示していない限りにおいて、必ずしも提示した順序で実施しなければならないわけではない。また、所与のロジックフローは、ハードウェア素子、プロセッサによって実行されるソフトウェア素子、または、これらの任意の組み合わせで実施されるとしてよい。実施形態はこれに限定されない。

本明細書で説明するように、さまざまな実施形態は、ハードウェア素子、ソフトウェア素子またはこれらの任意の組み合わせを用いて実現するとしてよい。ハードウェア素子の例としては、プロセッサ、マイクロプロセッサ、回路、回路素子（例えば、トランジスタ、抵抗、キャパシタ、インダクタ等）、集積回路、特定用途向け集積回路（ＡＳＩＣ）、プログラマブルロジックデバイス（ＰＬＤ）、デジタルシグナルプロセッサ（ＤＳＰ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、ロジックゲート、レジスタ、半導体デバイス、チップ、マイクロチップ、チップセット等が挙げられるとしてよい。

本明細書に記載した任意の実施形態で用いられる場合、「モジュール」という用語は、説明した処理を実行するソフトウェア、ファームウェアおよび／または回路を意味する。ソフトウェアは、ソフトウェアパッケージ、コード、および／または、命令セットあるいは命令として具現化されるとしてよい。「回路」は、本明細書に記載した任意の実施形態で用いられる場合、例えば、ハードワイヤード回路、プログラマブル回路、ステートマシン回路、および／または、プログラマブル回路が実行する命令を格納するファームウェアを、単独または任意の組み合わせで、含むとしてよい。モジュールは、集合的または個別に、より大型のシステム、例えば、集積回路（ＩＣ）、システムオンチップ（ＳｏＣ）等の一部を形成する回路として具現化されるとしてよい。

本明細書で説明した特定の実施形態は、コンピュータによって実行されると本明細書で説明した方法および／または処理をコンピュータに実行させるコンピュータ実行可能命令を格納している有形の機械可読媒体として提供されるとしてもよい。有形のコンピュータ可読媒体は、これらに限定されるものではないが、フロッピー（登録商標）ディスク、光ディスク、コンパクトディスクリードオンリーメモリ（ＣＤ−ＲＯＭ）、コンパクトディスクリライタブル（ＣＤ−ＲＷ）および光磁気ディスクを含む任意の種類のディスク、リードオンリーメモリ（ＲＯＭ）等の半導体デバイス、ダイナミックランダムアクセスメモリ（ＲＡＭ）およびスタティックＲＡＭ等のＲＡＭ、消去可能プログラム可能リードオンリーメモリ（ＥＰＲＯＭ）、電気的消去可能プログラム可能リードオンリーメモリ（ＥＥＰＲＯＭ）、フラッシュメモリ、磁気カードまたは光カード、または、電子命令を格納するのに適した任意の種類の有形媒体を含むとしてよい。コンピュータは、任意の適切な処理プラットフォーム、デバイスまたはシステム、コンピューティングプラットフォーム、デバイスまたはシステムを含むとしてよく、任意の適切なハードウェアおよび／またはソフトウェアの組み合わせを用いて実現されるとしてよい。命令は、任意の適切な種類のコードを含むとしてよく、任意の適切なプログラミング言語を用いて実現されるとしてよい。

このように、一実施形態によると、本開示は消費者に提示するプログラムを選択する方法を提供する。当該方法は、顔検出モジュールによって、画像において顔領域を検出する段階と、手検出モジュールによって、画像において手ジェスチャを検出する段階と、顔検出モジュールおよび手検出モジュールによって、消費者の検出した顔領域および検出した手ジェスチャに基づき１以上の消費者特徴を特定する段階と、プログラム選択モジュールによって、複数のプログラムプロフィールを含むプログラムデータベースと消費者特徴とを比較することによって、消費者に提示する１以上のプログラムを特定する段階と、メディアデバイスにおいて、特定されたプログラムのうち選択された一のプログラムを消費者に対して提示する段階とを備える。

別の実施形態によると、本開示は、画像に含まれている消費者に対して提示するプログラムを選択する装置を提供する。当該装置は、画像において顔領域を検出して、画像において消費者の１以上の消費者特徴を特定する顔検出モジュールと、画像において手ジェスチャを特定して消費者特徴を更新する手検出モジュールと、複数のプログラムプロフィールを含むプログラムデータベースと、消費者特徴と複数のプログラムプロフィールとを比較することに基づいて消費者に提示すべき１以上のプログラムを選択するプログラム選択モジュールとを備える。

さらに別の実施形態によると、本開示は、１以上のプロセッサによって実行されるとコンピュータシステムに以下の手順を実行させる命令を格納している有形のコンピュータ可読媒体を提供する。具体的には、画像において顔領域を検出する手順と、画像において手ジェスチャを検出する手順と、消費者の検出した顔領域および検出した手ジェスチャに基づいて１以上の消費者特徴を特定する手順と、複数のプログラムプロフィールを含むプログラムデータベースと消費者特徴とを比較することによって消費者に提示する１以上のプログラムを特定する手順とを実行させる。

本明細書において、「一実施形態」または「ある実施形態」という表現は、当該実施形態に関連付けて説明している特定の特徴、構造または特性が少なくとも１つの実施形態に含まれることを意味する。このため、「一実施形態において」または「ある実施形態によると」という記載は本明細書において何度も登場するが、必ずしも全てが同じ実施形態を指しているのではない。さらに、特定の特徴、構造または特性は、１以上の実施形態において、任意の適切な方法において組み合わせるとしてよい。

本明細書で使用した用語および表現は、説明のために用いられたものであって限定を目的としたものではない。特定の用語および表現を利用したからといって、図示および説明した特徴（またはその一部）の均等物を排除する意図はない。請求項に記載する範囲内においてさまざまな変形例が実現可能であるものと認める。したがって、請求項はこのような均等物も全て含むものとする。

さまざまな特徴、側面および実施形態を本明細書で説明した。記載した特徴、側面および実施形態は、当業者であれば想到するであろうが、変更および変形と同様に互いに組み合わせることも可能である。本開示は、このため、このような組み合わせ、変更および変形を含むものと考えるべきである。このため、本発明の範囲は、上述した実施形態例のいずれにおいても限定されるものではないが、以下に記載する請求項およびその均等物にのみしたがって定義されるべきである。

Claims

消費者に提示するプログラムを選択する方法であって、
顔検出モジュールによって、画像において顔領域を検出する段階と、
手検出モジュールによって、前記画像において手ジェスチャを検出する段階と、
前記顔検出モジュールおよび前記手検出モジュールによって、前記消費者について検出した前記顔領域および検出した前記手ジェスチャに基づき１以上の消費者特徴を特定する段階と、
プログラム選択モジュールによって、複数のプログラムプロフィールを含むプログラムデータベースと前記１以上の消費者特徴とを比較することによって、前記消費者に提示する１以上のプログラムを特定する段階と、
メディアデバイスにおいて、特定された前記１以上のプログラムのうち選択された一のプログラムを前記消費者に対して提示する段階と
を備える方法。
前記１以上の消費者特徴は、前記画像に含まれる前記消費者の年齢、年齢グループ、性別、および、表情から成る群から選択される請求項１に記載の方法。
前記１以上の消費者特徴は、手ジェスチャを表すデータを含む請求項１または２に記載の方法。
前記顔検出モジュールによって、前記画像に含まれる前記顔領域に対応する、消費者プロフィールデータベースに格納されている消費者プロフィールを特定する段階をさらに備え、
前記消費者プロフィールは、前記消費者の視聴履歴を含む請求項３に記載の方法。
前記消費者に提示されているプログラムのプログラムプロフィールと、前記手ジェスチャとの相関関係に基づいて、前記消費者プロフィールを更新する段階をさらに備える請求項４に記載の方法。
前記１以上の消費者特徴は、前記画像に含まれる前記消費者の年齢、年齢グループ、性別、表情から成る群から選択され、
前記１以上の消費者特徴は、手ジェスチャを表すデータを含み、
前記プログラムデータベースと前記消費者特徴とを比較する段階は、前記消費者の前記年齢、前記年齢グループ、前記性別、消費者プロフィールおよび前記表情のうち１以上についてランク付けする段階を有する請求項１に記載の方法。
前記消費者プロフィールの少なくとも一部分をコンテンツプロバイダに送信する段階をさらに備える請求項４から６のいずれか一項に記載の方法。
消費者に提示するプログラムを選択する装置であって、
画像において顔領域を検出して前記画像において前記消費者の１以上の消費者特徴を特定する顔検出モジュールと、
前記画像において手ジェスチャを特定して前記１以上の消費者特徴を更新する手検出モジュールと、
複数のプログラムプロフィールを有するプログラムデータベースと、
前記１以上の消費者特徴と前記複数のプログラムプロフィールとを比較することによって、前記消費者に提示する１以上のプログラムを選択するプログラム選択モジュールと
を備える装置。
前記１以上の消費者特徴は、前記画像に含まれる前記消費者の年齢、年齢グループ、性別、および、表情から成る群から選択される請求項８に記載の装置。
前記顔検出モジュールはさらに、前記画像に含まれる前記顔領域に対応する、消費者プロフィールデータベースに格納されている消費者プロフィールを特定し、
前記消費者プロフィールは、前記消費者の視聴履歴を含む請求項８または９に記載の装置。
前記プログラム選択モジュールはさらに、前記消費者に提示されているプログラムのプログラムプロフィールと、前記手ジェスチャとの相関関係に基づいて、消費者プロフィールを更新する請求項８から１０のいずれか一項に記載の装置。
前記１以上の消費者特徴は、前記画像に含まれている前記消費者の少なくとも１つの表情を含む請求項８から１１のいずれか一項に記載の装置。
前記１以上の消費者特徴は、前記画像に含まれる前記消費者の年齢、年齢グループ、性別、表情から成る群から選択され、
前記１以上の消費者特徴は、手ジェスチャを表すデータを含み、
前記プログラム選択モジュールはさらに、前記消費者の前記年齢、前記年齢グループ、前記性別、消費者プロフィール、前記表情および前記手ジェスチャのうち１以上についてランク付けすることに基づいて、前記プログラムデータベースと前記１以上の消費者特徴とを比較する請求項９に記載の装置。
前記装置は、消費者プロフィールの少なくとも一部をコンテンツプロバイダに送信する請求項１１から１３のいずれか一項に記載の装置。
コンピュータに、
画像において顔領域を検出する手順と、
前記画像において手ジェスチャを検出する手順と、
消費者について検出した前記顔領域および検出した前記手ジェスチャに基づき１以上の消費者特徴を特定する手順と、
複数のプログラムプロフィールを含むプログラムデータベースと前記１以上の消費者特徴とを比較することによって、前記消費者に提示する１以上のプログラムを特定する手順と
を実行させるためのプログラム。
特定された前記１以上の消費者特徴は、前記画像に含まれる前記消費者の年齢、年齢グループ、性別、および、少なくとも１つの表情のうち少なくとも１つを含む請求項１５に記載のプログラム。
前記コンピュータにさらに、
前記画像に含まれる前記顔領域に対応する、消費者プロフィールデータベースに格納されている消費者プロフィールを特定する手順
を実行させるためのプログラムであって、
前記消費者プロフィールは、前記消費者の視聴履歴を含む請求項１５または１６に記載のプログラム。
前記１以上の消費者特徴は、前記画像に含まれる前記消費者の年齢、年齢グループ、性別、表情から成る群から選択され、
前記１以上の消費者特徴は、手ジェスチャを表すデータを含み、
前記コンピュータにさらに、
前記消費者の前記年齢、前記年齢グループ、前記性別、消費者プロフィールおよび前記表情のうち１以上についてランク付けする手順を実行させるための請求項１５に記載のプログラム。
前記コンピュータにさらに、
前記消費者に提示されているプログラムのプログラムプロフィールと、前記手ジェスチャとの相関関係に基づいて、前記消費者プロフィールを更新する手順
を実行させるための請求項１７または１８に記載のプログラム。