JP2014516490A - パーソナライズされたプログラム選択のシステムおよび方法 - Google Patents

パーソナライズされたプログラム選択のシステムおよび方法 Download PDF

Info

Publication number
JP2014516490A
JP2014516490A JP2014504133A JP2014504133A JP2014516490A JP 2014516490 A JP2014516490 A JP 2014516490A JP 2014504133 A JP2014504133 A JP 2014504133A JP 2014504133 A JP2014504133 A JP 2014504133A JP 2014516490 A JP2014516490 A JP 2014516490A
Authority
JP
Japan
Prior art keywords
consumer
program
image
profile
age
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014504133A
Other languages
English (en)
Inventor
ソン、ジチャン
ワン、タオ
ワン、ペン
リ、ウェンロン
リ、チャン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Intel Corp
Original Assignee
Intel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intel Corp filed Critical Intel Corp
Publication of JP2014516490A publication Critical patent/JP2014516490A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/107Static hand or arm
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • G06F3/012Head tracking input arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/017Gesture based interaction, e.g. based on a set of recognized hand gestures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • G06V40/28Recognition of hand or arm movements, e.g. recognition of deaf sign language
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/4223Cameras
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44213Monitoring of end-user related data
    • H04N21/44218Detecting physical presence or behaviour of the user, e.g. using sensors to detect if the user is leaving the room or changes his face expression during a TV program
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4668Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/482End-user interface for program selection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2203/00Indexing scheme relating to G06F3/00 - G06F3/048
    • G06F2203/01Indexing scheme relating to G06F3/01
    • G06F2203/011Emotion or mood input determined on the basis of sensed human body parameters such as pulse, heart rate or beat, temperature of skin, facial expressions, iris, voice pitch, brain activity patterns

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Social Psychology (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Psychiatry (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Image Analysis (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

【解決手段】 消費者に提示するプログラムを選択するシステムおよび方法は、画像において顔領域を検出する段階と、画像において手ジェスチャを検出する段階と、画像に含まれる消費者の1以上の消費者特徴(気分、性別、年齢、手ジェスチャ等)を特定する段階と、複数のプログラムプロフィールを含むプログラムデータベースと消費者特徴とを比較することによって、消費者に提示する1以上のプログラムを特定する段階と、メディアデバイスにおいて、特定された1以上のプログラムのうち選択された一のプログラムを消費者に対して提示する段階とを備える。
【選択図】 図1

Description

本開示は、データ処理に関する。特に、手ジェスチャ認識と共に顔検出/追跡(例えば、表情、性別、年齢および/または顔特定/認識)に基づいて1以上のプログラムを選択する方法、装置およびシステムに関する。
一部の推薦システムは、家庭用テレビジョンクライアント(例えば、セットトップボックス(STB))またはインターネットテレビジョンをエンドユーザと見なし、そこから視聴履歴を収集する。推薦システムは、視聴履歴全体およびプログラム同士の相関関係に基づき、視聴されなかったプログラムを選択して、これらのプログラムの紹介を家庭用テレビジョンクライアントに勧める。しかし、この方法には、家庭用テレビジョンクライアントは複数の人間が共有していることが多いという欠点がある。このため、複数のユーザの視聴履歴がまとめられてしまい、必ずしも任意の1人のユーザの好みを反映したものにならない。
図中では、同様の参照番号は概して、同一の構成要素、機能が同様の構成要素および/または構造が同様の構成要素を示す。ある構成要素が最初に図示されている図面は、参照番号の最大桁で示す。本発明は、添付図面を参照しつつ説明する。図面は以下の通りである。
本開示のさまざまな実施形態に応じた、消費者の顔分析に基づき消費者へプログラムを選択および表示するシステムの一実施形態を示す図である。 本開示のさまざまな実施形態に応じた、顔検出モジュールの一実施形態を示す図である。 本開示のさまざまな実施形態に応じた、手検出モジュールの一実施形態を示す図である。 本開示の一実施形態に応じた、「親指上(親指を立てた)」の手ジェスチャ(左手)を示す画像である。 本開示のさまざまな実施形態に応じた、プログラム選択モジュールの一実施形態を示す図である。 本開示に応じた、プログラムを選択および表示する一実施形態を説明するためのフローチャートである。 本開示に応じた、プログラムを選択および表示する別の実施形態を説明するためのフローチャートである。
概論として、本開示は概して、1以上の画像から特定された消費者特徴と、プログラムプロフィールから構成されるプログラムデータベースとを比較した結果に基づいて、消費者に提示すべき1以上のプログラムを選択するシステム、装置および方法に関する。消費者特徴は、顔分析および/または手ジェスチャ分析を用いて画像から特定されるとしてよい。システムは概して、消費者の1以上の画像を撮影するカメラと、画像を分析して消費者の1以上の特徴を決定する顔検出モジュールおよび手検出モジュールと、画像から特定された消費者特徴と、プログラムプロフィールから構成されるプログラムデータベースとを比較した結果に基づいて、消費者に供給するためのプログラムを選択するプログラム選択モジュールとを備えるとしてよい。本明細書で用いる場合、「プログラム」という用語は、単発放送、テレビシリーズおよびテレビムービー(例えば、TV用のドラマ、劇場上映用の映画のテレビでの放送)を含む、任意のテレビコンテンツを意味する。
図1を参照すると、本開示に応じたシステム10の一実施形態の概略を示している。システム10は、プログラム選択システム12、カメラ14、コンテンツプロバイダ16およびメディアデバイス18を備える。本明細書でより詳細に説明するが、プログラム選択システム12は、カメラ14が撮影した1以上の画像20から少なくとも1つの消費者特徴を特定して、消費者に対してメディアデバイス18で提示するためのプログラムをコンテンツプロバイダ16から選択する。
具体的には、プログラム選択システム12は、顔検出モジュール22と、手検出モジュール25と、消費者プロフィールデータベース24と、プログラムデータベース26と、プログラム選択モジュール28とを有する。顔検出モジュール22は、少なくとも1つのカメラ14が撮影した1以上のデジタル画像20を受信する。カメラ20は、1以上の人物を含む環境を表すデジタル画像20を撮影する任意のデバイス(公知のデバイスまたは今後発見されるデバイス)を含み、本明細書で説明しているように、環境に含まれている1以上の人物の顔分析について適切な分解能を持つとしてよい。例えば、カメラ20は、スチルカメラ(つまり、静止写真を撮影するカメラ)またはビデオカメラ(つまり、複数のフレームで複数の動画を撮影するカメラ)を含むとしてよい。カメラ20は、可視スペクトルの光または電磁スペクトルの他の部分(例えば、これに限定されないが、赤外スペクトル、紫外スペクトル等)の光に対して動作するように構成されているとしてよい。カメラ20は、例えば、ウェブカメラ(パーソナルコンピュータおよび/またはTVモニタに対応付けられているもの)、手持ちデバイスカメラ(例えば、携帯電話のカメラ、スマートフォンのカメラ(例えば、iPhone(登録商標)、Trio(登録商標)、Blackberry(登録商標)等に対応付けられているカメラ)、ラップトップコンピュータカメラ、タブレットコンピュータ(例えば、これに限定されないが、iPad(登録商標)、Galaxy Tab(登録商標)等)を含むとしてよい。
顔検出モジュール22は、画像20において顔および/または顔領域(例えば、点線で示しているインセット23a内の矩形ボックス23が表している領域)を特定し、消費者の1以上の特徴(つまり、消費者特徴30)を決定する。顔検出モジュール22はマーカー方式(つまり、1以上のマーカーを消費者の顔に適用)を利用し得るが、一部の実施形態によると、顔検出モジュール22は、マーカー無方式を利用するとしてもよい。例えば、顔検出モジュール22は、全体的に良好に定義されており、標準的な形式の画像を受信し(例えば、これに限定されないが、RGBカラー画像)、少なくともある程度まで画像において顔を特定する、カスタムの、独自の、公知および/または開発中の顔認識コード(または命令セット)、ハードウェアおよび/またはファームウェアを含むとしてよい。
また、顔検出モジュール22はさらに、全体的に良好に定義されており、標準的な形式の画像を受信し(例えば、これに限定されないが、RGBカラー画像)、少なくともある程度まで画像において1以上の顔の特徴を特定する、カスタムの、独自の、公知および/または開発中の顔特徴コード(または命令セット)を含むとしてよい。このような公知の顔特徴システムは、これに限定されないが、公開されているオープン・ソース・コンピュータ・ビジョン(OpenCV(登録商標))パッケージに含まれている標準的なビオラ−ジョーンズ(Viola−Jones)ブースティングカスケードフレームワークを含む。本明細書でさらに詳細に説明するが、消費者特徴30は、これらに限定されないが、消費者の識別情報(例えば、消費者に対応付けられている識別子)および/または顔の特徴(例えば、これらに限定されないが、消費者の年齢、消費者の年齢グループ(例えば、子供または成人)、消費者の性別、消費者の人種)および/または消費者の感情の識別情報(例えば、うれしい、悲しい、笑顔、渋面、驚き、興奮等)を含むとしてよい。
顔検出モジュール22は、画像22(例えば、画像20内の顔23に対応する顔パターン)と、消費者プロフィールデータベース24に含まれている消費者プロフィール32(1)−32(n)(以下では、個別に「消費者プロフィール32」と呼ぶ)とを比較して、消費者を特定するとしてよい。消費者プロフィールデータベース24を検索しても一致しない場合、顔検出モジュール22は、撮影した画像20に含まれる顔23に基づいて新しい消費者プロフィール32を作成するとしてよい。
顔検出モジュール22は、被写体の顔23の画像20から目印または特徴を抽出することによって顔23を特定するとしてよい。例えば、顔検出モジュール22は、例えば、目、鼻、頬骨および顎の相対的な位置、サイズおよび/または形状を分析して、顔パターンを形成するとしてよい。顔検出モジュール22は、特定された顔パターンを利用して、消費者を特定するべく、一致する顔パターンを持つ他の画像について消費者プロフィール32(1)−32(n)を検索するとしてよい。比較処理は、一連の顕著な顔の特徴にテンプレートマッチング法を適用して行われ、いわゆる圧縮された顔表現が得られるとしてよい。このような公知の顔認識システムは、これに限定されないが、幾何学的技術(際立つ特徴を調べる)および/または測光技術(画像を価に変換してこの値とテンプレートとを比較してばらつきを無くす統計的アプローチ)に基づいたシステムであるとしてよい。
全てを網羅しているわけではないが、顔検出モジュール22は、固有顔を持つ主成分分析、線形判別分析、弾性バンチグラフマッチングフィッシャーフェイス(Elastic Bunch Graph Matching fisherface)、隠れマルコフモデル、および、ニューロン動機づけによるダイナミックリンクマッチング(neuronal motivated dynamic link matching)を利用するとしてよい。
一実施形態によると、消費者は、消費者プロフィール32を作成して、プログラム選択システム12に登録するとしてよい。これに代えて(またはこれに加えて)、消費者プロフィール32(1)−32(n)の1以上は、本明細書で説明しているように、プログラム選択モジュール28によって生成および/または更新するとしてもよい。各消費者プロフィール32は、消費者識別子および消費者人口統計データを含む。消費者識別子は、本明細書で説明するように、顔検出モジュール22が利用する顔認識技術(例えば、これに限定されないが、パターン認識等)に基づいて消費者を一意的に特定するデータを含むとしてよい。消費者人口統計データは、消費者の特定の特徴および/または好みを表す。例えば、消費者人口統計データは、特定の種類の品物またはサービスに対する好み、性別、人種、年齢または年齢グループ、収入、障害、可動性(通勤時間または利用可能な自動車の数等)、学歴、持ち家か賃貸か、雇用状態および/または場所を含むとしてよい。消費者人口統計データはさらに、特定の種類/カテゴリーの広告方法に対する好みを含むとしてよい。広告方法の種類/カテゴリーの例としては、これらに限定されないが、コメディー調、ドラマ調、リアリティ調の広告等を含むとしてよい。
手検出モジュール25は概して、1以上の画像20を処理して、画像20において手および/または手ジェスチャ(例えば、インセット27aに点線で示す手ジェスチャ27)を特定するとしてよい。本明細書で説明するように、カメラ14が撮影する手ジェスチャ27の例は、「停止」、「親指右」、「親指左」、「親指上」、「親指下」および「OKサイン」の手を含む。言うまでもなく、これらは、本開示で利用され得る種類の手ジェスチャ27の例に過ぎず、本開示で利用し得る種類の手ジェスチャをすべて網羅するものではない。
手検出モジュール25は、全体的に良好に定義されており、標準的な形式の画像(例えば、RGBカラー画像)を受信し、少なくともある程度まで画像において手を特定する、カスタムの、独自の、公知および/または開発中の手認識コード(または命令セット)を含むとしてよい。このような公知の手検出システムは、物体認識のためのコンピュータビジョンシステム、3D再構築システム、2Dハールウェーブレット応答システム(およびその派生物)、皮膚色ベース方法、形状ベース検出、SURF(Speed−Up Robust Features)顔認識方式(およびその拡張および/または派生物)を含む。
手検出モジュール25で得られた結果は、プログラム選択モジュール28で受信する消費者特徴30に含められるとしてよい。このため、消費者特徴30は、顔検出モジュール22および/または手検出モジュール25の結果を含むとしてよい。
プログラム選択モジュール28は、消費者特徴30(および、消費者の識別情報が公知の場合には、任意の消費者の人口統計データ)と、プログラムデータベース26に格納されているプログラムプロフィール34(1)−34(n)(以下では、個別に「プログラムプロフィール34」と呼ぶ)とを比較するとしてよい。本明細書でより詳細に説明するように、プログラム選択モジュール28は、消費者特徴30とプログラムプロフィール34(1)−34(n)とを比較した結果に基づいて1以上のプログラムを選択するべく、さまざまな統計分析技術を利用するとしてよい。例えば、プログラム選択モジュール28は、重み付け平均(これらに限定されないが、重み付け算術平均、重み付け幾何平均および/または重み付け調和平均を含む)統計分析を利用するとしてよい。
プログラム選択モジュール28は、消費者特徴30および現在視聴されている特定のプログラムおよび/またはプログラムプロフィール34に基づいて、消費者プロフィール32を更新するとしてよい。例えば、プログラム選択モジュール28は、消費者特徴30に特定されている消費者の反応(例えば、賛成、反対等)を特定のプログラムおよび当該プログラムの対応するプログラムプロフィール34に反映するべく、消費者プロフィール32を更新するとしてよい。消費者の反応は、手検出モジュール25が検出した手ジェスチャ27に直接関連するとしてよい。
プログラム選択モジュール28はさらに、消費者プロフィール32(1)−32(n)の全てまたは一部をコンテンツプロバイダ16に送信するとしてよい。本明細書で用いる場合、「コンテンツプロバイダ」という表現は、放送業者、広告会社、制作スタジオおよび広告主を含む。コンテンツプロバイダ16はこうして、この情報を利用して、同様の視聴者に基づいて今後のプログラムを開発するとしてよい。例えば、プログラム選択モジュール28は、コンテンツプロバイダ16にネットワーク36を介して送信するべく、消費者プロフィール32(1)−32(n)に対応するデータを暗号化およびパッケージングするとしてよい。ネットワーク36は、有線通信経路および/または無線通信経路を含み得るものと認めるとしてよい。有線通信経路および/または無線通信経路は、例えば、これらに限定されないが、インターネット、衛星経路、光ファイバー経路、ケーブル経路、または、任意のその他の適切な有線通信経路または無線通信経路、または、これらの経路の組み合わせであるとしてよい。
プログラムプロフィール34(1)−34(n)は、コンテンツプロバイダ16(例えば、ネットワーク36を介して)によって提供されるとしてよく、プログラム識別子/分類子および/またはプログラム人口統計パラメータを含むとしてよい。プログラム識別子/分類子は、特定のプログラムを、1以上の所定のカテゴリーに識別および/または分類するために用いられるとしてよい。例えば、プログラム識別子/分類子は、これらに限定されないが、例えば、「コメディー」、「家のリフォーム」、「ドラマ」、「リアリティ」、「スポーツ」等の幅広いカテゴリーに特定のプログラムを分類するために用いられるとしてよい。プログラム識別子/分類子は、これに加えて/これに代えて、これらに限定されないが、例えば、「野球」、「サッカー」、「ゲームショー」、「アクション映画」、「ドラマ映画」、「コメディー映画」等のより狭いカテゴリーに特定のプログラムを分類するために用いられるとしてよい。プログラム人口統計パラメータは、これらに限定されないが、性別、人種、年齢または年齢グループ、収入、障害、可動性(通勤時間または利用可能な自動車の数)、学歴、持ち家か賃貸か、雇用状態および/または場所等のさまざまな人口統計パラメータを含むとしてよい。コンテンツプロバイダ16は、プログラム人口統計パラメータの重みおよび/または優先順位を決めるとしてよい。
メディアデバイス18は、プログラム選択システム12が選択したプログラムを、コンテンツプロバイダ16から表示する。メディアデバイス18は、これらに限定されないが、テレビ、電子掲示板、電子看板、パーソナルコンピュータ(例えば、デスクトップ、ラップトップ、ネットブック、タブレット等)、携帯電話(例えば、スマートフォン等)、音楽プレーヤ等の任意の種類のディスプレイを含むとしてよい。
プログラム選択システム12(またはその一部)は、これらに限定されないが、ケーブルSTB、衛星STB、IP−STB、地上波STB、総合アクセスデバイス(IAD)、デジタルビデオレコーダ(DVR)、スマートフォン(例えば、これらに限定されないが、iPhone(登録商標)、Trio(登録商標)、Blackberry(登録商標)、Droid(登録商標)、等)、パーソナルコンピュータ(これらに限定されないが、デスクトップコンピュータ、ラップトップコンピュータ、ネットブックコンピュータ、タブレットコンピュータ(例えば、これらに限定されないが、iPad(登録商標)、Galazy Tab(登録商標)、等)を含む)等のセットトップボックス(STB)に一体化されるとしてよい。
図2を参照すると、本開示に応じた顔検出モジュール22aの一実施形態の概略を図示している。顔検出モジュール22aは、画像20を受信して、少なくともある程度まで、顔(または複数の顔)を画像20内で特定するとしてよい。顔検出モジュール22aはさらに、少なくともある程度まで、1以上の顔特徴を画像20において特定し、1以上の消費者特徴30(本明細書で説明する手ジェスチャの情報も含むとしてもよい)を決定するとしてよい。消費者特徴30は、少なくとも部分的に、本明細書で説明しているように顔検出モジュール22aが特定した顔パラメータのうち1以上の顔パラメータに基づいて生成されるとしてよい。消費者特徴30は、これに限定されないが、消費者識別情報(例えば、消費者に対応付けられている識別子)および/または顔特徴(例えば、これに限定されないが、消費者の年齢、消費者の年齢グループ(例えば、子供または成人)、消費者の性別、消費者の人種)、および/または、消費者表情識別情報(例えば、うれしい、悲しい、笑顔、渋面、驚き、興奮等)を含むとしてよい。
例えば、顔検出モジュール22aの一実施形態は、顔検出/追跡モジュール40と、目印検出モジュール44と、顔標準化モジュール42と、顔パターンモジュール46とを有するとしてよい。顔検出/追跡モジュール40は、全体的に良好に定義されており、カメラから受信した静止画像またはビデオストリームにおいて人間の顔のサイズおよび位置を、少なくともある程度まで、検出および識別するカスタムの、独自の、公知および/または開発中の顔追跡コード(または命令セット)を含むとしてよい。このような公知の顔検出/追跡システムは、例えば、ポール・ビオラ(Paul Viola)およびマイケル・ジョーンズ(Michael Jones)、Rapid Object Detection using a Boosted Cascade of Simple Features, Accepted Conference on Computer Vision and Pattern Recognition, 2001.で公開されているビオラ・ジョーンズ技術を含む。これらの技術では、画像において余すところなくウィンドウをスキャンすることによって、顔を検出する一連のアダプティブ・ブースティング(Adaptive Boosting(AdaBoost))分類子を利用する。顔検出/追跡モジュール40はさらに、複数の画像20にわたって、特定された顔または顔領域を追跡するとしてよい。
顔標準化モジュール42は、全体的に良好に定義されており、画像20に含まれている特定された顔を標準化する、カスタムの、独自の、公知および/または開発中の顔標準化コード(または命令セット)を含むとしてよい。例えば、顔標準化モジュール42は、画像を回転させて、目の位置合わせを行い(目の座標が既知の場合)、画像をトリミングして顔のサイズに概して対応する小さいサイズとして、画像をスケーリングして目の間の距離を一定にして、通常の顔を含む楕円内に含まれない画素をゼロにするマスクを適用し、マスクが適用されていない画素の階調値の分布を平滑化するべく画像をヒストグラム均一化して、および/または、マスクが適用されていない画素の平均がゼロになり標準偏差が1になるように画像を標準化するとしてよい。
目印検出モジュール44は、全体的に良好に定義されており、少なくともある程度まで、画像20において顔が持つさまざまな顔特徴を検出および特定する、カスタムの、独自の、公知および/または開発中の目印検出コード(または命令セット)を含むとしてよい。目印検出において、少なくともある程度まで、顔が既に検出されていることは暗黙の了解である。ある程度の局所化(例えば、コース局所化)を実行して(例えば、顔標準化モジュール42によって)、目印が発見され得る画像20のゾーン/領域を特定、および/または、そのようなゾーン/領域に注目するとしてよい。例えば、目印検出モジュール44は、ヒューリスティック分析に基づいて動作するとしてよく、目(および/または目の縁)、鼻(例えば、鼻の先端)、顎先(例えば、顎先の先端)、頬骨および顎の相対的な位置、サイズおよび/または形状を特定および/または分析するとしてよい。このような公知の目印検出システムは、6個の顔の上の点(つまり、左目/右目の目の縁、および、口角)および6個の顔の上の点(つまり、グリーンポイント)を含む。目の縁および口角はさらに、ビオラ・ジョーンズをベースとする分類子を用いて検出されるとしてよい。形状に関する制約を6個の顔の上の点に組み込んで、形状に関するそれらの関係を反映させるとしてもよい。
顔パターンモジュール46は、全体的に良好に定義されており、画像20において特定された顔の目印に基づいて顔パターンを特定および/または生成する、カスタムの、独自の、公知および/または開発中の顔パターンコード(または命令セット)を含むとしてよい。想到されるように、顔パターンモジュール46は、顔検出/追跡モジュール40の一部分と見なされるとしてもよい。
顔検出モジュール22aは、顔認識モジュール48、性別/年齢識別モジュール50、および/または、表情検出モジュール52のうち1以上を含むとしてよい。具体的には、顔認識モジュール48は、全体的に良好に定義されており、顔パターンと、データベースに格納されている対応する顔パターンとを一致させる、カスタムの、独自の、公知および/または開発中の顔識別コード(または命令セット)を含むとしてよい。例えば、顔認識モジュール48は、顔パターンモジュール46が特定した顔パターンを比較して、特定した顔パターンと、消費者プロフィールデータベース24に格納されている消費者プロフィール32(1)−32(n)に対応付けられている顔パターンとを比較して、画像20に含まれている消費者の識別情報を求めるとしてよい。顔認識モジュール48は、幾何学分析(識別可能な特徴を調べる)および/または測光分析(画像を値に変換して、これらの値をテンプレートと比較して、バラツキを無くす統計的方法)を利用してパターン比較を行うとしてよい。一部の顔認識技術としては、これらに限定されないが、固有顔を持つ主成分分析(およびその派生物)、線形判別分析(およびその派生物)、弾性バンチグラフマッチングフィッシャーフェイス(Elastic Bunch Graph Matching fisherface)(およびその派生物)、隠れマルコフモデル(およびその派生物)、および、ニューロン動機づけによるダイナミックリンクマッチング(neuronal motivated dynamic link matching)が挙げられる。
顔認識モジュール48は、既存の消費者プロフィール32と一致しない場合には、消費者プロフィールデータベース24内に新しい消費者プロフィール32を作成させるとしてよい。例えば、顔認識モジュール48は、特定した消費者特徴30を表すデータを、消費者プロフィールデータベース24に転送するとしてよい。そして、新しい消費者プロフィール32に対応付けられている識別子が作成されるとしてよい。
性別/年齢識別モジュール50は、全体的に良好に定義されており、画像20に含まれる人物の性別を検出および特定し、および/または、少なくともある程度まで、画像20に含まれる人物の年齢を検出および特定する、カスタムの、独自の、公知および/または開発中の性別および/または年齢識別コード(または命令セット)を含むとしてよい。例えば、性別/年齢識別モジュール50は、画像20から生成された顔パターンを分析して、画像20に含まれる人物の性別を特定するとしてよい。特定された顔パターンは、さまざまな顔パターンと性別との相関関係を含む性別データベースに対して比較するとしてもよい。
性別/年齢識別モジュール50はさらに、画像20に含まれる人物の年齢および/または年齢グループを決定および/または推定するとしてよい。例えば、性別/年齢識別モジュール50は、特定された顔パターンを、さまざまな顔パターンと年齢との間の相関関係を格納している年齢データベースに対して比較するとしてよい。年齢データベースは、人物の実際の年齢を推定するとしてもよいし、および/または、人物を1以上の年齢グループに分類するとしてもよい。年齢グループの例としては、これらに限定されないが、成人、子供、10代、老人/シニア等を含むとしてよい。
表情検出モジュール52は、全体的に良好に定義されており、画像20に含まれている人物の表情を検出および/または特定する、カスタムの、独自の、公知および/または開発中の表情検出および/または識別コード(または命令セット)を含むとしてよい。例えば、表情検出モジュール52は、顔特徴(例えば、目、口、頬、歯等)のサイズおよび/または位置を決定するとしてよく、顔特徴を、対応する顔特徴グループ(例えば、笑顔、渋面、興奮、悲しい等)を持つ複数の顔特徴サンプルを含む顔特徴データベースに対して比較するとしてよい。
一実施形態例によると、顔検出モジュール22aの1以上の側面(例えば、これに限定されないが、顔検出/追跡モジュール40、認識モジュール48、性別/年齢モジュール50、および/または、表情検出モジュール52)は、1以上の入力を1以上の出力に繰り返しマッピングする多層パーセプトロン(MLP)モデルを利用するとしてよい。MLPモデルの一般的なフレームワークは、公知であり良好に定義されており、線形分離可能でないデータを区別することによって標準的な線形パーセプトロンモデルを改良したフィードフォワードニューラルネットワークを概して含む。この例では、MLPモデルへの入力は、目印検出モジュール44が生成する1以上の形状特徴を含むとしてよい。MLPモデルは、複数の入力ノードによって定義されている入力レイヤを含むとしてよい。各ノードは、顔画像の形状特徴を含むとしてよい。MLPモデルはさらに、「隠れ」ニューロンで定められる「隠れ」レイヤまたは繰り返しレイヤを含むとしてよい。通常、MはN未満であり、入力レイヤの各ノードは、「隠れ」レイヤの各ニューロンに接続されている。
MLPモデルはさらに、複数の出力ニューロンによって定められる出力レイヤを含むとしてよい。各出力ニューロンは、「隠れ」レイヤの各ニューロンに接続されているとしてよい。出力ニューロンは概して、所定の出力の確率を表す。出力の数は、予め定められているとしてよく、本開示では、顔検出/追跡モジュール40、顔認識モジュール48、性別/年齢モジュール50、および/または、表情検出モジュール52が特定するが特定する顔および/または顔ジェスチャの数に一致するとしてよい。このように、例えば、各出力ニューロンが、顔および/または顔ジェスチャ画像の一致の確率を示しているとしてよく、最後の出力は、最大確率を示している。
MLPモデルの各レイヤにおいて、レイヤmの入力xについて、レイヤn+1の出力Liは、以下の式に応じて算出される。
f関数は、シグモイド活性化関数を仮定して、以下のように定義するとする。
MLPモデルは、トレーニング手順で学習されるパラメータα、βを生成するべく利用され得るバックプロパゲーション技術を利用して学習することが可能であるとしてよい。各入力xは、重みまたはバイアスをかけることによって、顔および/または顔ジェスチャタイプの可能性がより高いことを示すとしてよい。MLPモデルはさらに、例えば、既知の顔および/または顔ジェスチャを特定して、MLPモデルが、イテレーションの度に、これらの既知の顔および/または顔ジェスチャを「ターゲット」にできるようにすることを含むトレーニングプロセスを含むとしてよい。
顔検出/追跡モジュール40、顔認識モジュール48、性別/年齢モジュール50、および/または、表情検出モジュール52の出力は、特定した顔および/または顔ジェスチャのタイプを示すデータセットまたは信号を含むとしてよい。これは、消費者特徴データ/信号30の一部を生成するために用いられるとしてよい。顔検出モジュール22aが生成する消費者特徴30は、手検出モジュール25に供給されるとしてよい。手検出モジュール25は、画像20において手(存在する場合)を検出して、消費者特徴30を更新するとしてよい。消費者特徴30は、本明細書で説明するように、1以上のプログラムプロフィール34(1)−32(n)を選択するために用いられるとしてよい。
図3を参照すると、手検出モジュール25aの一実施形態の概略が図示されている。手検出モジュール25aは概して、一連の画像(例えば、毎秒24フレームのペースで複数のビデオフレーム)にわたって、手領域(手検出モジュール88によって定められる)を追跡するとしてよい。手追跡モジュール80は、全体的に良好に定義されており、一連の画像(例えば、RGBカラー画像)を受信して少なくともある程度までこれらの一連の画像において手を追跡する、カスタムの、独自の、公知および/または開発中の追跡コード(または命令セット)を含むとしてよい。このような公知の追跡システムは、粒子フィルタ、オプティカルフロー、カルマンフィルタ等を含む。これらの技術はそれぞれ、エッジ分析、二乗和の差分の分析、特徴点分析、ミーンシフト(mean−shifting)法(または、その派生物)等を利用するとしてよい。
手検出モジュール25aはさらに、画像の手領域(手検出モジュール88および/または手追跡モジュール80が定義する)における手の皮膚の色を特定するように概して構成されている皮膚分割モジュール82を含むとしてよい。皮膚分割モジュール82は、全体的に良好に定義されており、手領域の他の部分から皮膚のトーンまたは色を区別する、カスタムの、独自の、公知および/または開発中の皮膚特定コード(または命令セット)を含むとしてよい。このような公知の皮膚特定システムとしては、色相−彩度の色成分に対する閾値分析、HSV色統計学、色−テクスチャモデリング等が挙げられる。一実施形態例を挙げると、皮膚分割モジュール82は、多変数ガウスモデル(およびその派生物)等の、一般化した統計学的な皮膚色モデルを利用するとしてよい。
手検出モジュール25aはさらに、皮膚分割モジュール82が生成するバイナリ画像において手の1以上の形状特徴を特定するように概して構成されている形状特徴抽出モジュール84を含むとしてよい。形状特徴は通常、バイナリ画像における手の形状の固有特性および/または「マーカー」を含み、画像内の手ジェスチャを特定するべく手ジェスチャ認識モジュール86の効率を改善するために用いられるとしてよい。形状特徴は、例えば、偏心度、密集度、配向、矩形度、幅中心、高さ中心、欠陥数、左部分と右部分との間の差分、上部分と下部分との間の差分等を含むとしてよい。
例えば、手ジェスチャ認識モジュール86は、例えば、以下で説明するように、形状特徴抽出モジュール84が特定した手形状特徴に基づいて、画像27の手領域で手ジェスチャを特定するように概して構成されているとしてよい。手ジェスチャ認識モジュール86は、全体的に良好に定義されており、画像内の手ジェスチャを特定する、カスタムの、独自の、公知および/または開発中の皮膚特定コード(または命令セット)を含むとしてよい。本開示の教示内容に応じて利用され得る公知の手ジェスチャ認識システムは、例えば、パターン認識システム、ペルセウス(Perseus)モデル(およびその派生物)、隠れマルコフモデル(およびその派生物)、サポートベクターマシン、線形判別分析、決定木等を含む。例えば、手ジェスチャ認識モジュール86は、1以上の入力を1以上の出力に繰り返しマッピングする多層パーセプトロン(MLP)モデルまたはその派生物を利用するとしてよい。MLPモデルの一般的なフレームワークは、公知であり良好に定義されている。そして一般的には、線形分離可能でないデータを区別することによって、標準的な線形パーセプトロンモデルを改善したフィードフォワードニューラルネットワークを含む。この例では、MLPモデルへの入力は、上述したように、形状特徴抽出モジュール84が生成した1以上の形状特徴を含むとしてよい。
カメラ14が撮影する手ジェスチャ27の例には、「停止」83A、「親指右」83B、「親指左」83C、「親指上」83D、「親指下」83E、および「OKサイン」83Fがある。言うまでもなく、画像83A−83Fは、本開示で用いられるタイプの手ジェスチャの例に過ぎず、本開示で用いられるタイプの手ジェスチャをすべて網羅したものではない。
手ジェスチャ認識モジュール86の出力は、特定したタイプの手ジェスチャを示すデータセットまたは信号を含むとしてよい。これは、消費者特徴データ30の一部を生成するために用いられるとしてよい。
図4は、本開示の一実施形態に応じた、「親指上」の手ジェスチャ(左手)の画像である。元の画像91(図1の画像27に対応)は、RGB形式のカラー画像である。図3の皮膚分割モジュール82が生成するバイナリ画像92は、皮膚以外の画素を黒として、皮膚の画素を白として示している。図3の形状特徴抽出モジュール84は、画像93に示すように、バイナリ画像において手の周囲、または、周囲の一部を取り囲む境界形状を生成するとしてよい。境界形状は、図示しているように矩形であってよく、他の実施形態では、境界形状は、例えば、画像内の手の形状に応じて、円、楕円、正方形および/または他の正多角形状または多角形状を含むとしてよい。境界形状に基づいて、形状特徴抽出モジュール84は、境界形状における偏心度、矩形度、密集度および画像中心を決定するとしてよく、さらに画像内の白い画素をカウントして面積を決定し、エッジにある白い画素(例えば、黒い画素に隣接している白い画素)をカウントして外周を決定するとしてよい。偏心度は、境界形状の幅と境界形状の高さとを乗算したものとして求められるとしてよい。矩形度は面積を境界ボックスの面積で除算したものとして求められるとしてよい。密集度は、外周(二乗値)を面積で除算したものとして求められるとしてよい。また、形状特徴抽出モジュール84は、画像94内に図示しているように、境界形状における手の中心を決定するとしてよい。中心は、水平軸(例えば、x軸)および垂直軸(例えば、y軸)の両方に沿った境界形状の中心として求めるとしてよい。
形状特徴抽出モジュール84はさらに、画像95に示すように、手の輪郭を特定するとしてよい。輪郭は、隣接する画素同士の間で、バイナリ1(白)からバイナリ0(黒)へと変化しているか否かを判断することによって、特定されるとしてよい。境界上の画素が輪郭を画定する。形状特徴抽出モジュール84はさらに、輪郭に沿って存在する欠陥の数を決定するとしてよい。画像96には、このような欠陥を4つ図示している。欠陥は、局所的な凸型の欠陥と定義されるとしてよい。例えば、凸領域が1以上の凸画素を持つ画素位置であるとしてよい。形状特徴抽出モジュール84はさらに、画像97に示すように、輪郭(95)を取り囲む形状のうち最小形状を決定するとしてよい。最小形状(本例では矩形)は、画像において左端の白い画素、右端の白い画素、最も高い位置の白い画素、および、最も低い位置の白い画素によって画定されるとしてよく、図示しているように、画像の軸に対して斜めになっている場合がある。画像の水平軸に対する最小形状の角度は、形状特徴抽出モジュール84によって決定されるとしてよい。また、形状特徴抽出モジュール84は、最小ボックス幅を最小ボックス高さで除算した結果として定義される最小ボックスの幅と高さとの比率を決定するとしてよい。水平軸に対する最小形状の角度に基づき、形状特徴抽出モジュール84はさらに、画像内の手の向きを決定するとしてよい。ここにおいて、向きは、画像98に示すように、最小形状の幅に垂直であって最小形状の幅の中心から延伸している線と定義されるとしてよい。
形状特徴抽出モジュール84はさらに、画像99に示すように、境界形状(画像93)を複数の略等分のセグメントに分割するとしてよい。本例では、境界形状は、A、B、CおよびDと示している4つの等分の矩形サブブロックに分割される。サブブロックに基づき、形状特徴抽出モジュール84はさらに、各サブブロックに含まれる白い画素の数、画像の左半分および右半分に含まれる画素の数の差分(例えば、(A+C)−(B+D))、および、画像の上半分および下半分の画素数の差分(例えば、(A+B)−(C+D))を決定するとしてよい。
上述した形状特徴抽出モジュール84の処理の例および説明した形状特徴は、全てを網羅したものではなく、上述した形状特徴は全てが、画像に含まれている手ジェスチャを決定する際に有用または必要であるわけではない。このように、一部の実施形態によると、他の手ジェスチャについては、追加で形状特徴を決定するとしてよく、または、上述した形状特徴の一部を決定するとしてもよい。
ここで図5を参照すると、本開示に応じたプログラム選択モジュール28aの一実施形態の概略が図示されている。プログラム選択モジュール28aは、少なくとも部分的に、プログラムデータベース26に格納されているプログラムプロフィール34(1)−34(n)と、顔検出モジュール22および/または手検出モジュール25が特定する消費者特徴データ30との比較結果に基づいてプログラムデータベース26から少なくとも1つのプログラムを選択する。プログラム選択モジュール28aは、消費者プロフィールデータベース24から消費者プロフィール32を特定するべく、特徴データ30を利用するとしてよい。消費者プロフィール32はさらに、本明細書で説明するようにプログラムを選択する際にプログラム選択モジュール28aが利用するパラメータを含むとしてよい。プログラム選択モジュール28aは、消費者プロフィールデータベース24において消費者プロフィール32を更新および/または作成し、消費者プロフィール32と特徴データ30とを対応付けるとしてよい。
一実施形態によると、プログラム選択モジュール28aは、1以上の推薦モジュール(例えば、性別および/または年齢推薦モジュール60、消費者識別情報推薦モジュール62、消費者表情推薦モジュール64、および/または、ジェスチャ推薦モジュール66)および決定モジュール68を含む。本明細書で説明するように、決定モジュール68は、推薦モジュール60、62、64および66の分析結果のまとめに基づいて、1以上のプログラムを選択する。
性別および/または年齢推薦モジュール60は、プログラムプロフィール34(1)−32(n)と、消費者の年齢(またはその近似値)、年齢グループ(例えば、成人、子供、10代、シニア等)および/または性別(以下ではまとめて「年齢/性別データ」と呼ぶ)との比較結果に少なくとも部分的に基づいて、プログラムデータベース26から1以上のプログラムを特定し、および/または、当該プログラムのランク付けをするとしてよい。例えば、性別および/または年齢推薦モジュール60は、本明細書で説明しているように、特徴データ30から、および/または、特定した消費者プロフィール32から、消費者の年齢/性別データを特定するとしてよい。プログラムプロフィール34(1)−32(n)はさらに、コンテンツプロバイダおよび/または広告代理店が供給する1以上のタイプの年齢/性別データ(つまり、対象)に対する各プログラムのグループ分け、ランク付け、および/または、関連性の重み付けを表すデータを含むとしてよい。性別および/または年齢推薦モジュール60はこの後、消費者年齢/性別データと、プログラムプロフィール34(1)−34(n)とを比較して、1以上のプログラムを特定および/またはランク付けするとしてよい。
消費者識別情報推薦モジュール62は、プログラムプロフィール34(1)−32(n)と、特定した消費者プロフィールとの比較結果に少なくとも部分的に基づいて、プログラムデータベース26から1以上のプログラムを特定、および/または、当該プログラムをランク付けするとしてよい。例えば、消費者識別情報推薦モジュール62は、本明細書で説明するように、特定した消費者プロフィール32に対応付けられている、過去の視聴履歴およびそれに対する反応に基づいて、消費者の好みおよび/または習慣を特定するとしてよい。消費者の好み/習慣は、これらに限定されないが、消費者が特定のプログラムを視聴した時間(つまり、プログラム視聴時間)、どのタイプのプログラムを消費者が視聴したか、消費者がプログラムを視聴した日にち、曜日、月および/あるいは時刻、ならびに/または、消費者の表情(笑顔、渋面、興奮、凝視等)等を含むとしてよい。消費者識別情報推薦モジュール62はさらに、特定した消費者の好み/習慣を特定した消費者プロフィール32と共に、後に利用するべく格納するとしてよい。消費者識別情報推薦モジュール62はこのため、特定の消費者プロフィール32に対応付けられている消費者履歴と比較して、どのプログラムプロフィール34(1)−32(n)を推薦するかを決定するとしてよい。
消費者識別情報推薦モジュール62がどのプログラムを推薦すべきか特定するための要件は、消費者が特定の既存の消費者プロフィール32で特定されることである。しかし、このように特定するためには必ずしも、コンテンツ選択モジュール28aが消費者の名前またはユーザネームを知っていることを要件としないが、単に、画像20に含まれている消費者を消費者プロフィールデータベース24にある対応する消費者プロフィール32とコンテンツ選択モジュール28aが認識または対応付けできればよいので、匿名であってもよい。このため、消費者は対応する消費者プロフィール32を登録するが、これは要件ではない。
消費者表情推薦モジュール64は、消費者特徴データ30に含まれている消費者表情と、消費者が現在視聴しているプログラムに対応付けられているプログラムプロフィール34とを比較する。例えば、消費者特徴データ30が消費者は笑っているかまたは凝視していることを示す(例えば、表情検出モジュール52の判断結果が示す)場合、消費者表情推薦モジュール64は、消費者が視聴しているプログラムのプログラムプロフィール34は好ましいものであると推定するとしてよい。消費者表情推薦モジュール64はこのため、視聴しているプログラムのプログラムプロフィール34と類似しているプログラムプロフィール34(1)−32(n)を追加で1以上特定するとしてよい。さらに、消費者表情推薦モジュール64はまた、特定された消費者プロフィール32を更新するとしてよい(消費者プロフィール32が特定されたと仮定)。
ジェスチャ推薦モジュール66は、消費者特徴データ30内の手ジェスチャ情報と、消費者が現在視聴しているプログラムに対応付けられているプログラムファイル32とを比較する。例えば、消費者特徴データ30が消費者は「親指上」の手ジェスチャをしていることを示す(例えば、手検出モジュール25の判断結果が示す)場合、ジェスチャ推薦モジュール66は、消費者が視聴しているプログラムのプログラムプロフィール34は好ましいものであると推定するとしてよい。ジェスチャ推薦モジュール66はこのため、視聴中のプログラムのプログラムプロフィール34に類似したプログラムプロフィール34(1)−32(n)を追加で1以上特定するとしてよい。同様に、消費者特徴データ30が消費者は「親指下」の手ジェスチャをしていることを示す場合、ジェスチャ推薦モジュール66は、消費者が視聴しているプログラムのプログラムプロフィール34が好ましくないと推定するので、視聴中のプログラムのプログラムプロフィール34に類似した他のプログラムプロフィール34(1)−32(n)を低減および/または削除するとしてよい。さらに、ジェスチャ推薦モジュール66はさらに、特定した消費者プロフィール32を(消費者プロフィール32が特定されたと仮定)、視聴したプログラムプロフィールとの間で特定された相関関係に基づき更新するとしてよい。
決定モジュール68は、さまざまな推薦モジュール60、62、64および66からの推薦の重みおよび/またはランクを決定するとしてよい。例えば、決定モジュール68は、ヒューリスティック分析、最適適合タイプ分析、回帰分析、統計的推定、統計的帰納、および/または、推測統計に基づいて、そして、推薦モジュール60、62、64および66が推薦するプログラムプロフィール34に基づいて、消費者に提示すべき1以上のプログラムプロフィール34を特定および/またはランク付けして、1以上のプログラムを選択するとしてよい。決定モジュール68は必ずしもすべての消費者データ30を考慮する必要はないと考えられたい。また、決定モジュール68は、複数の消費者が同時に視聴している場合に特定および推薦されたプログラムプロフィール34を比較するとしてよい。例えば、決定モジュール68は、視聴している複数の消費者の数、年齢、性別等に基づいて、複数の異なる分析技術を利用するとしてよい。例えば、決定モジュール68は、視聴している一群の消費者の特徴に基づいて、1以上のパラメータを低減および/または無視するとしてよく、および/または、1以上のパラメータの関連性を高めるとしてよい。一例として、決定モジュール68は、子供が特定されれば、成人が存在する場合であっても、子供向けのプログラムを提示するようにデフォルトで設定されるとしてよい。別の例を挙げると、決定モジュール68は、男性より多くの女性が検出される場合には、女性向けのプログラムを提示するとしてよい。
また、決定モジュール68は、全体的な手ジェスチャに基づいて、プログラムファイル32を選択するとしてよい。例えば、顔検出モジュール22が現在ディスプレイ18を視聴している人物の識別情報を決定すると、決定モジュール68は、手検出モジュール25が検出した手ジェスチャに基づいて同様のプログラムプロフィール34を選択するとしてよい。このため、消費者は、視聴しているプログラムの好みを評価することができ、この評価は今後プログラムを選択する際に利用され得る。言うまでもなく、これらの例は全てを網羅したものではなく、決定モジュール68は他の選択技術および/または選択基準を利用するとしてもよい。
一実施形態によると、コンテンツ選択モジュール28aは、消費者に提示すべく選択された1以上のプログラムを表す信号をコンテンツプロバイダ16に送信するとしてよい。コンテンツプロバイダ16はこの後、信号を対応するプログラムを持つメディアデバイス18に信号を送信するとしてよい。これに代えて、プログラムはローカルに格納されているとしてもよく(例えば、メディアデバイス18および/またはプログラム選択システム12に対応付けられているメモリ)、コンテンツ選択モジュール28aは、選択されたプログラムをメディアデバイス18で提示させてもよい。
コンテンツ選択モジュール28aはさらに、収集した消費者プロフィールデータ(またはその一部をコンテンツプロバイダ16に送信するとしてよい。コンテンツプロバイダ16はこの後、この情報を転売して、および/または、この情報を利用して、潜在視聴者に基づき今後のプログラムを開発するとしてよい。
図6を参照すると、プログラムを選択して表示する方法600の一実施形態を説明するためのフローチャートが図示されている。方法600は、消費者の1以上の画像を撮影する段階を備える(処理610)。画像は1以上のカメラを用いて撮影されるとしてよい。撮影された画像において顔および/または顔領域を特定するとしてよく、少なくとも1つの消費者特徴を決定するとしてよい(処理620)。具体的には、画像を分析して、消費者の年齢、消費者の年齢グループ(例えば、子供か成人か)、消費者の性別、消費者の人種、消費者の表情の特定(例えば、うれしい、悲しい、笑顔、渋面、驚き、興奮等)、および/または、消費者の識別情報(例えば、消費者に対応付けられている識別子)といった消費者特徴のうち1以上を決定するとしてよい。例えば、方法600は、特定の消費者を特定するべく、画像内で特定された1以上の顔目印パターンと、消費者プロフィールデータベースに格納されている一連の消費者プロフィールとを比較する段階を備えるとしてよい。方法600は、一致しない場合、消費者プロフィールデータベースに新しい消費者プロフィールを作成する段階を備えるとしてよい。
方法600はさらに、撮影した画像から1以上の手ジェスチャを特定する段階を備える(処理630)。手ジェスチャは、これらに限定されないが、親指上、親指下等のジェスチャであるとしてよい。特定した手ジェスチャを表す情報を消費者特徴に追加するとしてよい。
方法600はさらに、消費者特徴に基づいて消費者に提示する1以上のプログラムを特定する段階を備える(処理640)。例えば、方法600は、消費者特徴と、プログラムデータベースに格納されている一連のプログラムプロフィールとを比較して、消費者に提示する特定のプログラムを特定するとしてよい。これに代えて(またはこれに加えて)、方法600は、消費者プロフィール(および対応する一群の消費者人口統計データ)と、プログラムプロフィールとを比較して、消費者に提示すべき特定のプログラムを特定するとしてよい。例えば、方法600では、消費者特徴を利用して、消費者プロフィールデータベースに格納されている特定の消費者プロフィールを特定するとしてよい。
方法600はさらに、選択されたプログラムを消費者に表示する段階を備える(処理650)。方法600はこの後、繰り返されるとしてよい。方法600は、視聴している特定のプログラムに関連する消費者特徴に基づいて、消費者プロフィールデータベースの消費者プロフィールを更新するとしてよい。この情報は、消費者プロフィールデータベースに格納されている消費者プロフィールに組み込まれるとしてよく、今後のプログラムを特定するべく利用されるとしてよい。
図7を参照すると、視聴環境において撮影した消費者の画像に基づいてプログラムを選択して表示する処理700を説明する別のフローチャートである。本実施形態に係る処理は、1以上のカメラを用いて1以上の画像を撮影する処理を含む(処理710)。画像を撮影すると、画像に対して顔分析を実行する(処理512)。顔分析512は、撮影した画像において顔または顔領域が存在すること(または存在しないこと)を特定することを含み、顔/顔領域が検出されると、画像に関連する1以上の特徴を決定することを含む。例えば、消費者の性別および/または年齢(または年齢グループ)を特定するとしてよく(処理714)、消費者の表情を特定するとしてよく(処理716)、および/または、消費者の識別情報を特定するとしてよい(処理718)。
処理700はさらに、1以上の画像に対して手分析を実行して、手ジェスチャを特定および/または分類することを含む(処理719)。手ジェスチャは、これらに限定されないが、親指上、親指下等のジェスチャを含むとしてよい。特定した手ジェスチャを表す情報は、消費者特徴に追加されるとしてよい。
顔分析および手ジェスチャ分析を実行すると、顔および手の分析に基づいて消費者特徴データを生成するとしてよい(処理720)。この後消費者特徴データと、複数の異なるプログラムに対応付けられている複数のプログラムプロフィールとを比較して、1以上のプログラムを推薦する(処理722)。例えば、消費者特徴データとプログラムプロフィールとを比較して、消費者の性別および/または年齢に基づいて1以上のプログラムを推薦するとしてよい(処理724)。消費者特徴データは、プログラムプロフィールと比較して、特定した消費者プロフィールに基づいて1以上のプログラムを推薦するとしてよい(処理726)。消費者特徴データと、プログラムプロフィールとを比較して、特定した表情に基づいて1以上のプログラムを推薦するとしてよい(処理728)。消費者特徴データと、プログラムプロフィールとを比較して、特定した手ジェスチャに基づいて1以上のプログラムを推薦するとしてよい(処理729)。処理700はさらに、推薦したプログラムプロフィールの比較結果に基づいて、消費者に提示すべき1以上のプログラムを選択する処理を含む(処理730)。プログラムの選択は、さまざまな選択基準724、726、728および729の重み付けおよび/またはランク付けに基づいて行われるとしてよい。この後選択されたプログラムを消費者に表示する(処理732)。
処理700はこの後、処理710から繰り返し開始されるとしてよい。撮影した画像に基づいてプログラムを選択する処理は、実質的に連続的に実行されるとしてよい。これに代えて、撮影した画像に基づきプログラムを選択する処理のうち1以上の処理(例えば、顔分析512および/または手分析719)は、定期的に実行されるとしてもよいし、および/または、少数のフレーム毎(例えば、30フレーム毎)に実行するとしてもよい。これは、演算能力が低い(例えば、パーソナルコンピュータより能力が低い)プラットフォームにプログラム選択システム12が組み込まれている場合に特に適しているとしてよい。
以下では、本開示に応じた疑似コードの一実施形態の一例を説明する。
図6および図7はさまざまな実施形態に係る方法に含まれる処理を図示しているが、任意の実施形態において、これらの処理のうち全てが必要なわけではないと理解されたい。本明細書では、本開示の他の実施形態において、図6および図7に図示した処理はどの図面にも具体的に図示していない方法で組み合わせ得るが、本開示には完全に一致しているものと考えられる。このように、一の図面で正確に図示していない特徴および/または処理に関する請求項も、本開示の範囲および内容に含まれるものとする
また、実施形態に係る演算はさらに、上記の図面および添付した例を参照しつつ説明した。図面の一部は、ロジックフローを含むとしてよい。本明細書に示すこのような図面は特定のロジックフローを含むが、ロジックフローは単に、本明細書で説明した一般的な機能をどのように実装するかの例を提示するものと考えられる。さらに、所与のロジックフローは、特に明示していない限りにおいて、必ずしも提示した順序で実施しなければならないわけではない。また、所与のロジックフローは、ハードウェア素子、プロセッサによって実行されるソフトウェア素子、または、これらの任意の組み合わせで実施されるとしてよい。実施形態はこれに限定されない。
本明細書で説明するように、さまざまな実施形態は、ハードウェア素子、ソフトウェア素子またはこれらの任意の組み合わせを用いて実現するとしてよい。ハードウェア素子の例としては、プロセッサ、マイクロプロセッサ、回路、回路素子(例えば、トランジスタ、抵抗、キャパシタ、インダクタ等)、集積回路、特定用途向け集積回路(ASIC)、プログラマブルロジックデバイス(PLD)、デジタルシグナルプロセッサ(DSP)、フィールドプログラマブルゲートアレイ(FPGA)、ロジックゲート、レジスタ、半導体デバイス、チップ、マイクロチップ、チップセット等が挙げられるとしてよい。
本明細書に記載した任意の実施形態で用いられる場合、「モジュール」という用語は、説明した処理を実行するソフトウェア、ファームウェアおよび/または回路を意味する。ソフトウェアは、ソフトウェアパッケージ、コード、および/または、命令セットあるいは命令として具現化されるとしてよい。「回路」は、本明細書に記載した任意の実施形態で用いられる場合、例えば、ハードワイヤード回路、プログラマブル回路、ステートマシン回路、および/または、プログラマブル回路が実行する命令を格納するファームウェアを、単独または任意の組み合わせで、含むとしてよい。モジュールは、集合的または個別に、より大型のシステム、例えば、集積回路(IC)、システムオンチップ(SoC)等の一部を形成する回路として具現化されるとしてよい。
本明細書で説明した特定の実施形態は、コンピュータによって実行されると本明細書で説明した方法および/または処理をコンピュータに実行させるコンピュータ実行可能命令を格納している有形の機械可読媒体として提供されるとしてもよい。有形のコンピュータ可読媒体は、これらに限定されるものではないが、フロッピー(登録商標)ディスク、光ディスク、コンパクトディスクリードオンリーメモリ(CD−ROM)、コンパクトディスクリライタブル(CD−RW)および光磁気ディスクを含む任意の種類のディスク、リードオンリーメモリ(ROM)等の半導体デバイス、ダイナミックランダムアクセスメモリ(RAM)およびスタティックRAM等のRAM、消去可能プログラム可能リードオンリーメモリ(EPROM)、電気的消去可能プログラム可能リードオンリーメモリ(EEPROM)、フラッシュメモリ、磁気カードまたは光カード、または、電子命令を格納するのに適した任意の種類の有形媒体を含むとしてよい。コンピュータは、任意の適切な処理プラットフォーム、デバイスまたはシステム、コンピューティングプラットフォーム、デバイスまたはシステムを含むとしてよく、任意の適切なハードウェアおよび/またはソフトウェアの組み合わせを用いて実現されるとしてよい。命令は、任意の適切な種類のコードを含むとしてよく、任意の適切なプログラミング言語を用いて実現されるとしてよい。
このように、一実施形態によると、本開示は消費者に提示するプログラムを選択する方法を提供する。当該方法は、顔検出モジュールによって、画像において顔領域を検出する段階と、手検出モジュールによって、画像において手ジェスチャを検出する段階と、顔検出モジュールおよび手検出モジュールによって、消費者の検出した顔領域および検出した手ジェスチャに基づき1以上の消費者特徴を特定する段階と、プログラム選択モジュールによって、複数のプログラムプロフィールを含むプログラムデータベースと消費者特徴とを比較することによって、消費者に提示する1以上のプログラムを特定する段階と、メディアデバイスにおいて、特定されたプログラムのうち選択された一のプログラムを消費者に対して提示する段階とを備える。
別の実施形態によると、本開示は、画像に含まれている消費者に対して提示するプログラムを選択する装置を提供する。当該装置は、画像において顔領域を検出して、画像において消費者の1以上の消費者特徴を特定する顔検出モジュールと、画像において手ジェスチャを特定して消費者特徴を更新する手検出モジュールと、複数のプログラムプロフィールを含むプログラムデータベースと、消費者特徴と複数のプログラムプロフィールとを比較することに基づいて消費者に提示すべき1以上のプログラムを選択するプログラム選択モジュールとを備える。
さらに別の実施形態によると、本開示は、1以上のプロセッサによって実行されるとコンピュータシステムに以下の手順を実行させる命令を格納している有形のコンピュータ可読媒体を提供する。具体的には、画像において顔領域を検出する手順と、画像において手ジェスチャを検出する手順と、消費者の検出した顔領域および検出した手ジェスチャに基づいて1以上の消費者特徴を特定する手順と、複数のプログラムプロフィールを含むプログラムデータベースと消費者特徴とを比較することによって消費者に提示する1以上のプログラムを特定する手順とを実行させる。
本明細書において、「一実施形態」または「ある実施形態」という表現は、当該実施形態に関連付けて説明している特定の特徴、構造または特性が少なくとも1つの実施形態に含まれることを意味する。このため、「一実施形態において」または「ある実施形態によると」という記載は本明細書において何度も登場するが、必ずしも全てが同じ実施形態を指しているのではない。さらに、特定の特徴、構造または特性は、1以上の実施形態において、任意の適切な方法において組み合わせるとしてよい。
本明細書で使用した用語および表現は、説明のために用いられたものであって限定を目的としたものではない。特定の用語および表現を利用したからといって、図示および説明した特徴(またはその一部)の均等物を排除する意図はない。請求項に記載する範囲内においてさまざまな変形例が実現可能であるものと認める。したがって、請求項はこのような均等物も全て含むものとする。
さまざまな特徴、側面および実施形態を本明細書で説明した。記載した特徴、側面および実施形態は、当業者であれば想到するであろうが、変更および変形と同様に互いに組み合わせることも可能である。本開示は、このため、このような組み合わせ、変更および変形を含むものと考えるべきである。このため、本発明の範囲は、上述した実施形態例のいずれにおいても限定されるものではないが、以下に記載する請求項およびその均等物にのみしたがって定義されるべきである。

Claims (19)

  1. 消費者に提示するプログラムを選択する方法であって、
    顔検出モジュールによって、画像において顔領域を検出する段階と、
    手検出モジュールによって、前記画像において手ジェスチャを検出する段階と、
    前記顔検出モジュールおよび前記手検出モジュールによって、前記消費者について検出した前記顔領域および検出した前記手ジェスチャに基づき1以上の消費者特徴を特定する段階と、
    プログラム選択モジュールによって、複数のプログラムプロフィールを含むプログラムデータベースと前記1以上の消費者特徴とを比較することによって、前記消費者に提示する1以上のプログラムを特定する段階と、
    メディアデバイスにおいて、特定された前記1以上のプログラムのうち選択された一のプログラムを前記消費者に対して提示する段階と
    を備える方法。
  2. 前記1以上の消費者特徴は、前記画像に含まれる前記消費者の年齢、年齢グループ、性別、および、表情から成る群から選択される請求項1に記載の方法。
  3. 前記1以上の消費者特徴は、手ジェスチャを表すデータを含む請求項1または2に記載の方法。
  4. 前記顔検出モジュールによって、前記画像に含まれる前記顔領域に対応する、消費者プロフィールデータベースに格納されている消費者プロフィールを特定する段階をさらに備え、
    前記消費者プロフィールは、前記消費者の視聴履歴を含む請求項3に記載の方法。
  5. 前記消費者に提示されているプログラムのプログラムプロフィールと、前記手ジェスチャとの相関関係に基づいて、前記消費者プロフィールを更新する段階をさらに備える請求項4に記載の方法。
  6. 前記1以上の消費者特徴は、前記画像に含まれる前記消費者の年齢、年齢グループ、性別、表情から成る群から選択され、
    前記1以上の消費者特徴は、手ジェスチャを表すデータを含み、
    前記プログラムデータベースと前記消費者特徴とを比較する段階は、前記消費者の前記年齢、前記年齢グループ、前記性別、消費者プロフィールおよび前記表情のうち1以上についてランク付けする段階を有する請求項1に記載の方法。
  7. 前記消費者プロフィールの少なくとも一部分をコンテンツプロバイダに送信する段階をさらに備える請求項4から6のいずれか一項に記載の方法。
  8. 消費者に提示するプログラムを選択する装置であって、
    画像において顔領域を検出して前記画像において前記消費者の1以上の消費者特徴を特定する顔検出モジュールと、
    前記画像において手ジェスチャを特定して前記1以上の消費者特徴を更新する手検出モジュールと、
    複数のプログラムプロフィールを有するプログラムデータベースと、
    前記1以上の消費者特徴と前記複数のプログラムプロフィールとを比較することによって、前記消費者に提示する1以上のプログラムを選択するプログラム選択モジュールと
    を備える装置。
  9. 前記1以上の消費者特徴は、前記画像に含まれる前記消費者の年齢、年齢グループ、性別、および、表情から成る群から選択される請求項8に記載の装置。
  10. 前記顔検出モジュールはさらに、前記画像に含まれる前記顔領域に対応する、消費者プロフィールデータベースに格納されている消費者プロフィールを特定し、
    前記消費者プロフィールは、前記消費者の視聴履歴を含む請求項8または9に記載の装置。
  11. 前記プログラム選択モジュールはさらに、前記消費者に提示されているプログラムのプログラムプロフィールと、前記手ジェスチャとの相関関係に基づいて、消費者プロフィールを更新する請求項8から10のいずれか一項に記載の装置。
  12. 前記1以上の消費者特徴は、前記画像に含まれている前記消費者の少なくとも1つの表情を含む請求項8から11のいずれか一項に記載の装置。
  13. 前記1以上の消費者特徴は、前記画像に含まれる前記消費者の年齢、年齢グループ、性別、表情から成る群から選択され、
    前記1以上の消費者特徴は、手ジェスチャを表すデータを含み、
    前記プログラム選択モジュールはさらに、前記消費者の前記年齢、前記年齢グループ、前記性別、消費者プロフィール、前記表情および前記手ジェスチャのうち1以上についてランク付けすることに基づいて、前記プログラムデータベースと前記1以上の消費者特徴とを比較する請求項9に記載の装置。
  14. 前記装置は、消費者プロフィールの少なくとも一部をコンテンツプロバイダに送信する請求項11から13のいずれか一項に記載の装置。
  15. コンピュータに、
    画像において顔領域を検出する手順と、
    前記画像において手ジェスチャを検出する手順と、
    消費者について検出した前記顔領域および検出した前記手ジェスチャに基づき1以上の消費者特徴を特定する手順と、
    複数のプログラムプロフィールを含むプログラムデータベースと前記1以上の消費者特徴とを比較することによって、前記消費者に提示する1以上のプログラムを特定する手順と
    を実行させるためのプログラム。
  16. 特定された前記1以上の消費者特徴は、前記画像に含まれる前記消費者の年齢、年齢グループ、性別、および、少なくとも1つの表情のうち少なくとも1つを含む請求項15に記載のプログラム。
  17. 前記コンピュータにさらに、
    前記画像に含まれる前記顔領域に対応する、消費者プロフィールデータベースに格納されている消費者プロフィールを特定する手順
    を実行させるためのプログラムであって、
    前記消費者プロフィールは、前記消費者の視聴履歴を含む請求項15または16に記載のプログラム。
  18. 前記1以上の消費者特徴は、前記画像に含まれる前記消費者の年齢、年齢グループ、性別、表情から成る群から選択され、
    前記1以上の消費者特徴は、手ジェスチャを表すデータを含み、
    前記コンピュータにさらに、
    前記消費者の前記年齢、前記年齢グループ、前記性別、消費者プロフィールおよび前記表情のうち1以上についてランク付けする手順を実行させるための請求項15に記載のプログラム。
  19. 前記コンピュータにさらに、
    前記消費者に提示されているプログラムのプログラムプロフィールと、前記手ジェスチャとの相関関係に基づいて、前記消費者プロフィールを更新する手順
    を実行させるための請求項17または18に記載のプログラム。
JP2014504133A 2011-04-11 2011-04-11 パーソナライズされたプログラム選択のシステムおよび方法 Pending JP2014516490A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2011/000620 WO2012139242A1 (en) 2011-04-11 2011-04-11 Personalized program selection system and method

Publications (1)

Publication Number Publication Date
JP2014516490A true JP2014516490A (ja) 2014-07-10

Family

ID=47008761

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014504133A Pending JP2014516490A (ja) 2011-04-11 2011-04-11 パーソナライズされたプログラム選択のシステムおよび方法

Country Status (7)

Country Link
US (1) US20140310271A1 (ja)
EP (1) EP2697741A4 (ja)
JP (1) JP2014516490A (ja)
KR (1) KR20130136574A (ja)
CN (1) CN103098079A (ja)
TW (1) TW201310357A (ja)
WO (1) WO2012139242A1 (ja)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8761448B1 (en) 2012-12-13 2014-06-24 Intel Corporation Gesture pre-processing of video stream using a markered region
US9104240B2 (en) 2013-01-09 2015-08-11 Intel Corporation Gesture pre-processing of video stream with hold-off period to reduce platform power
JP5783385B2 (ja) * 2013-02-27 2015-09-24 カシオ計算機株式会社 データ処理装置及びプログラム
US9292103B2 (en) 2013-03-13 2016-03-22 Intel Corporation Gesture pre-processing of video stream using skintone detection
US20150082330A1 (en) * 2013-09-18 2015-03-19 Qualcomm Incorporated Real-time channel program recommendation on a display device
CN103716702A (zh) * 2013-12-17 2014-04-09 三星电子(中国)研发中心 电视节目推荐装置和方法
EP2905678A1 (en) * 2014-02-06 2015-08-12 Université catholique de Louvain Method and system for displaying content to a user
JP6326847B2 (ja) * 2014-02-14 2018-05-23 富士通株式会社 画像処理装置、画像処理方法および画像処理プログラム
US9449221B2 (en) * 2014-03-25 2016-09-20 Wipro Limited System and method for determining the characteristics of human personality and providing real-time recommendations
CN104202640B (zh) * 2014-08-28 2016-03-30 深圳市国华识别科技开发有限公司 基于图像识别的智能电视交互控制系统和方法
US9710071B2 (en) * 2014-09-22 2017-07-18 Rovi Guides, Inc. Methods and systems for recalibrating a user device based on age of a user and received verbal input
GB2530515A (en) * 2014-09-24 2016-03-30 Sony Comp Entertainment Europe Apparatus and method of user interaction
KR101541254B1 (ko) * 2014-11-13 2015-08-03 이호석 의인화된 캐릭터 이미지를 이용한 서비스 제공 시스템 및 방법
US10928914B2 (en) * 2015-01-29 2021-02-23 Misapplied Sciences, Inc. Individually interactive multi-view display system for non-stationary viewing locations and methods therefor
US10362284B2 (en) 2015-03-03 2019-07-23 Misapplied Sciences, Inc. System and method for displaying location dependent content
CN104768309B (zh) * 2015-04-23 2017-10-24 天脉聚源(北京)传媒科技有限公司 一种根据用户情绪调节灯光的方法及装置
US9600715B2 (en) * 2015-06-26 2017-03-21 Intel Corporation Emotion detection system
WO2017035790A1 (zh) * 2015-09-01 2017-03-09 深圳好视网络科技有限公司 电视节目定制方法、机顶盒系统和智能终端系统
KR102339478B1 (ko) * 2015-09-08 2021-12-16 한국과학기술연구원 Dna 정보를 이용한 얼굴 추정 방법, 이를 수행하기 위한 기록 매체 및 장치
CN106547337A (zh) * 2015-09-17 2017-03-29 富泰华工业(深圳)有限公司 使用手势的拍照方法、系统与电子装置
CN105426850B (zh) * 2015-11-23 2021-08-31 深圳市商汤科技有限公司 一种基于人脸识别的关联信息推送设备及方法
US10410045B2 (en) 2016-03-23 2019-09-10 Intel Corporation Automated facial recognition systems and methods
WO2017204596A1 (ko) * 2016-05-26 2017-11-30 주식회사 시어스랩 얼굴 윤곽 보정 방법 및 장치
US10289900B2 (en) * 2016-09-16 2019-05-14 Interactive Intelligence Group, Inc. System and method for body language analysis
CN107800499A (zh) * 2017-11-09 2018-03-13 周小凤 一种收音机节目播控方法
CN109768840A (zh) * 2017-11-09 2019-05-17 周小凤 收音机节目播控系统
US10558849B2 (en) * 2017-12-11 2020-02-11 Adobe Inc. Depicted skin selection
CN108182624A (zh) * 2017-12-26 2018-06-19 努比亚技术有限公司 商品推荐方法、服务器及计算机可读存储介质
CN108260008A (zh) * 2018-02-11 2018-07-06 北京未来媒体科技股份有限公司 一种视频推荐方法、装置及电子设备
CN110263599A (zh) * 2018-03-12 2019-09-20 鸿富锦精密工业(武汉)有限公司 信息传送系统及信息传送方法
CN108763423A (zh) * 2018-05-24 2018-11-06 哈工大机器人(合肥)国际创新研究院 一种基于用户照片的玉石推荐方法及装置
CN111079474A (zh) * 2018-10-19 2020-04-28 上海商汤智能科技有限公司 乘客状态分析方法和装置、车辆、电子设备、存储介质
US10885322B2 (en) * 2019-01-31 2021-01-05 Huawei Technologies Co., Ltd. Hand-over-face input sensing for interaction with a device having a built-in camera
TWI792035B (zh) * 2019-09-03 2023-02-11 財團法人工業技術研究院 製作產品之材料推薦系統與材料推薦方法
CN111417017A (zh) * 2020-04-28 2020-07-14 安徽国广数字科技有限公司 基于人体识别的iptv节目推荐方法及系统
CN111782878B (zh) * 2020-07-06 2023-09-19 聚好看科技股份有限公司 服务器、显示设备及其视频搜索排序方法
TWI755287B (zh) * 2021-02-24 2022-02-11 國立中興大學 防欺騙之人臉身分驗證系統

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004527954A (ja) * 2001-03-28 2004-09-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ユーザ行動に基づき代替アイテムを自動的に選択する方法及び装置
JP2007310620A (ja) * 2006-05-18 2007-11-29 Sony Corp 情報処理装置、情報処理方法、及びプログラム
JP2010057039A (ja) * 2008-08-29 2010-03-11 Sony Corp 情報処理装置及び情報処理方法
JP2011504710A (ja) * 2007-11-21 2011-02-10 ジェスチャー テック,インコーポレイテッド メディア嗜好

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8751957B1 (en) * 2000-11-22 2014-06-10 Pace Micro Technology Plc Method and apparatus for obtaining auditory and gestural feedback in a recommendation system
JP2005512249A (ja) * 2001-12-13 2005-04-28 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ メディアシステム上のメディアコンテンツの推薦
US7606790B2 (en) * 2003-03-03 2009-10-20 Digimarc Corporation Integrating and enhancing searching of media content and biometric databases
US20060018522A1 (en) * 2004-06-14 2006-01-26 Fujifilm Software(California), Inc. System and method applying image-based face recognition for online profile browsing
US20070073799A1 (en) * 2005-09-29 2007-03-29 Conopco, Inc., D/B/A Unilever Adaptive user profiling on mobile devices
US20070140532A1 (en) * 2005-12-20 2007-06-21 Goffin Glen P Method and apparatus for providing user profiling based on facial recognition
JP2007207153A (ja) * 2006-02-06 2007-08-16 Sony Corp 通信端末装置、情報提供システム、サーバ装置、情報提供方法および情報提供プログラム
JP4539712B2 (ja) * 2007-12-03 2010-09-08 ソニー株式会社 情報処理端末、情報処理方法、およびプログラム
CN101482772B (zh) * 2008-01-07 2011-02-09 纬创资通股份有限公司 电子装置及其操作方法
US9077951B2 (en) * 2009-07-09 2015-07-07 Sony Corporation Television program selection system, recommendation method and recording method
US8428368B2 (en) * 2009-07-31 2013-04-23 Echostar Technologies L.L.C. Systems and methods for hand gesture control of an electronic device

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004527954A (ja) * 2001-03-28 2004-09-09 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ユーザ行動に基づき代替アイテムを自動的に選択する方法及び装置
JP2007310620A (ja) * 2006-05-18 2007-11-29 Sony Corp 情報処理装置、情報処理方法、及びプログラム
JP2011504710A (ja) * 2007-11-21 2011-02-10 ジェスチャー テック,インコーポレイテッド メディア嗜好
JP2010057039A (ja) * 2008-08-29 2010-03-11 Sony Corp 情報処理装置及び情報処理方法

Also Published As

Publication number Publication date
CN103098079A (zh) 2013-05-08
EP2697741A4 (en) 2014-10-22
TW201310357A (zh) 2013-03-01
WO2012139242A1 (en) 2012-10-18
EP2697741A1 (en) 2014-02-19
KR20130136574A (ko) 2013-12-12
US20140310271A1 (en) 2014-10-16

Similar Documents

Publication Publication Date Title
JP2014516490A (ja) パーソナライズされたプログラム選択のシステムおよび方法
US20160148247A1 (en) Personalized advertisement selection system and method
KR102339915B1 (ko) 셀피를 촬영하도록 사용자를 안내하기 위한 시스템 및 방법
US10810409B2 (en) Identifying facial expressions in acquired digital images
CN110175595B (zh) 人体属性识别方法、识别模型训练方法及装置
US20170330029A1 (en) Computer based convolutional processing for image analysis
US20190172458A1 (en) Speech analysis for cross-language mental state identification
US20190034706A1 (en) Facial tracking with classifiers for query evaluation
US10019653B2 (en) Method and system for predicting personality traits, capabilities and suggested interactions from images of a person
Yang et al. Benchmarking commercial emotion detection systems using realistic distortions of facial image datasets
US20200134295A1 (en) Electronic display viewing verification
US20170171614A1 (en) Analytics for livestreaming based on image analysis within a shared digital environment
Durga et al. A ResNet deep learning based facial recognition design for future multimedia applications
CN111008971B (zh) 一种合影图像的美学质量评价方法及实时拍摄指导系统
WO2010133661A1 (en) Identifying facial expressions in acquired digital images
Zhuang et al. Recognition oriented facial image quality assessment via deep convolutional neural network
US20210012503A1 (en) Apparatus and method for generating image
De Pessemier et al. Enhancing recommender systems for TV by face recognition
US20210158399A1 (en) System and method for interactive perception and content presentation
Gupta et al. Intelligent Music Recommendation System Based on Face Emotion Recognition
AU2021100211A4 (en) Predict Gender: Detect Faces and Predict their Gender, Age and Country Using Machine Learning Programming
Selvam Student Behaviour Detection in Eductation Training Institution.
Cheng et al. Digital interactive kanban advertisement system using face recognition methodology
Billings et al. Blacksburg, VA 24061, USA; rbillings@ vt. edu* Correspondence: ajm@ vt. edu

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141104

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150203

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20150714