JP2018534700A - メディアコンテンツのパフォーマンスの即時予測のための方法及び装置 - Google Patents

メディアコンテンツのパフォーマンスの即時予測のための方法及び装置 Download PDF

Info

Publication number
JP2018534700A
JP2018534700A JP2018526589A JP2018526589A JP2018534700A JP 2018534700 A JP2018534700 A JP 2018534700A JP 2018526589 A JP2018526589 A JP 2018526589A JP 2018526589 A JP2018526589 A JP 2018526589A JP 2018534700 A JP2018534700 A JP 2018534700A
Authority
JP
Japan
Prior art keywords
performance data
media content
feature vector
content
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018526589A
Other languages
English (en)
Other versions
JP6807389B2 (ja
Inventor
ハジエフ,エルナー
サロ,マーティン
オロズコ,ヤビエル
Original Assignee
リアルアイズ・オーウー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by リアルアイズ・オーウー filed Critical リアルアイズ・オーウー
Publication of JP2018534700A publication Critical patent/JP2018534700A/ja
Application granted granted Critical
Publication of JP6807389B2 publication Critical patent/JP6807389B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0242Determining effectiveness of advertisements

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

潜在的な消費者からデータを収集することなく、1つのメディアコンテンツの商業的な効果を予測するコンピュータ実装式の方法。方法は、このメディアコンテンツから情報の豊富なコンテンツベースのパラメータを抽出することを含む。このパラメータは、パフォーマンスデータ予測エンジンにおける入力として設計された、所定の、例えば固定された次元数を有するベクトルであってよい。異なるタイプ及び異なる持続時間のメディアコンテンツから同じタイプのパラメータを抽出することを可能にすることによって、提案される技術は、パフォーマンスデータが既に集められたメディアコンテンツを使用して、新たなメディアコンテンツに関するパフォーマンスデータを予測することを可能にする。この予測は、メディアコンテンツから抽出したコンテンツベースのパラメータの比較に基づいて行うことができる。あるいは、マシンラーニング技術を利用して、既知のパフォーマンスデータを利用してモデルを生成する場合もあり、これによりこのモデルが、新たなメディアコンテンツからのコンテンツベースのパラメータを利用してパフォーマンスデータを予測することができる。

Description

本発明は、エンドユーザに対するその影響を判定するためのメディアコンテンツの分析及び処理作業に関する。例えば、本発明の実施形態は、例えばメディアコンテンツに曝される間、そのメディアコンテンツがユーザに対して与える効果を、例えば他のメディアコンテンツと比較して評価するためのコンピュータユーザの行動に関する情報の予測に関する。本発明の実施形態は、例えば売り上げ高(例えばメディアコンテンツが広告である場合)、ソーシャルメディア反応(例えば拡散する確率)または受賞する確率 (例えば広告に関するカンヌライオンズ賞)などの他の関連するパフォーマンスデータの予測に関する場合もある。パフォーマンスデータは、様々なタイプのユーザに関して異なる効果を反映することができる。
商業的観点から、例えば広告(「ad」)、ゲーム、音楽ビデオ、テレビショウなどのオンラインで提供されるコンテンツのパフォーマンスを評価することができることは重要なことである。この点において、例えば好適な格付けの値(例えば星の数)を選択することによってコンテンツを手入力で格付けすることによってフィードバックを提供するために、コンピュータユーザのためにシステムを提供することが一般的である。広告の効果を追跡する方式の一部としてアンケート調査やインタビューを行うことも同様に一般的である。
より近年は、例えば顔の特徴の追跡などによるコンピュータユーザの感情を測るための技術がビデオコンテンツのパフォーマンスを評価する方法に組み込まれている。例えばウェブカメラなどの撮像装置を利用して、コンピュータユーザがビデオコンテンツを見ているときの彼らの顔の特徴を含む画像を取り込むことができる。取り込まれた画像を処理することで、ビデオ内の特定の時点におけるコンピュータユーザの感情に関する情報をもたらすことができ、このことはビデオのパフォーマンスに関する価値のあるフィードバックを提供する。
ビデオ及び取り込まれた画像は、インターネットを介して伝達することができるため、複数の離れたコンピュータユーザから自動的にフィードバックを集めることができる。例えばUS2012/0222057は、ウェブ対応のインターフェースにビデオが嵌め込まれ、嵌め込まれたビデオを見ているコンピュータユーザに関する精神状態のデータを収集するように構成されたシステムを考察している。ウェブ対応のインターフェース自体は、例えば適切なURLを複数の見込みのある閲覧者に送ることによって配信することができる。
最も一般的な場合において、本発明は、1つのメディアコンテンツのパフォーマンスを潜在的な消費者から全くデータを収集することなく予測することができる技術を提案している。本質的に、この技術は、パフォーマンスデータを予測することができる任意の1つのメディアコンテンツから情報の豊富なコンテンツベースのパラメータを抽出する方法を提供する。一実施形態において、このパラメータは、パフォーマンスデータ予測エンジンにおける入力として設計された、所定の、例えば固定された次元数を有するベクトルである。異なるタイプ及び異なる持続時間のメディアコンテンツから同じタイプのパラメータを抽出することを可能にすることによって、本明細書で提案される技術は、パフォーマンスデータが既に集められたメディアコンテンツを使用して、これまでは不可能だった方法で新たなメディアコンテンツに関するパフォーマンスデータを予測することを可能にする。予測は、メディアコンテンツから抽出したコンテンツベースのパラメータの比較に基づいて行うことができる。あるいは、マシンラーニング技術を利用して、既に集められたパフォーマンスデータからモデルを生成し、これによりこのモデルが、新たなメディアコンテンツからのコンテンツベースのパラメータを利用してそのメディアコンテンツに関するパフォーマンスデータを予測することができる。
本発明の一態様によって、メディアコンテンツに関するパフォーマンスデータを予測するコンピュータによって実装される方法が提供されており、この方法は、メディアコンテンツを第1の分類子に入力することと、第1の分類子によってコンテンツ識別子ストリームを生成することと、マッピングモジュールによってコンテンツ識別子ストリームを所定の次元数を有する特徴ベクトルにマッピングすることと、特徴ベクトルを予測エンジンに入力することと、予測エンジンによってメディアコンテンツに関して予測されるパフォーマンスデータを生成することとを含み、該予測エンジンは、特徴ベクトルと、他のメディアコンテンツに関する既知のパフォーマンスデータとの関係を判定するように構成されており、また予測されるパフォーマンスデータは、特徴ベクトルと、他のメディアコンテンツに関する既知のパフォーマンスデータとの関係に基づいている。方法はこれにより、予測されるパフォーマンスデータを生成するのに適した既知の減少された次元数を有する特徴ベクトルを生成するために、コンテンツ識別子ストリームの任意の次元数を減少させるための技術を提供する。方法は、メディアコンテンツに関する特徴ベクトルの生成と、これに続いて、その特徴ベクトルを利用することによって予測されるパフォーマンスデータを生成することの2つの段階を有する。
特徴ベクトルの生成は、メディアコンテンツの次元数を減少させるが、その一方でなおも有効な比較を可能にする情報コンテンツは維持するためのツールとして分類子を利用する。コンテンツ識別子ストリームはよって、メディアコンテンツの減少された次元数の表現として解釈されてよい。実際には、メディアコンテンツは、コンテンツ識別子ストリームを生成するために、例えば順番にまたは並列して複数の分類子に入力されてよい。当然のことながら、異なる次元数を有する複数の特徴ベクトルが同一のメディアコンテンツに関して生み出される場合もある。予測エンジンは、予測されるべきパフォーマンスデータのタイプによって異なる次元数の特徴ベクトルを必要とする場合もある。
一例において、第1の分類子によって生成されたコンテンツ識別子ストリームは、メディアコンテンツ内の主題の数値的な表現を含んでおり、この場合マッピングモジュールが、コンテンツ識別子ストリームの数値的な表現を特徴ベクトルに対してマップする。しかしながら第1の分類子は、メディアコンテンツの主題のみを分析するのではない場合があり、但し即時出力を実現することが可能であるという点において有益である。他の例では、第1の分類子は、メディアコンテンツから得た、またはそれ以外の方法でそれに関連付けられた情報を分析することができる。例えば分類子は、そのメディアコンテンツに関して入手可能な行動データ(例えば感情の状態のデータ)を分析する場合がある。
あるいは、方法は、第1の分類子からのコンテンツ識別子ストリームを第2の分類子に入力することと、第2の分類子によって、コンテンツ識別子ストリームの数値的な表現を生成することとを含む場合もある。この場合、マッピングモジュールが、コンテンツ識別子ストリームの数値的な表現を特徴ベクトルに対してマップしてよい。本発明は、メディアコンテンツを特徴ベクトルにマッピングするのに適した表現に変換するために、上記に記載したものと同様の任意の数の次元減少ステップを含んでよい。
分類子は、入力情報を様々なフォーマットにエンコードするように構成されてよい。例えば第1の分類子は、画像データを人間が読み取ることが可能なまたは機械可読のフォーマットにエンコードしてよい。第2の分類子は、人間が読み取ることが可能なデータを機械可読フォーマットにエンコードするように構成されてよい。機械可読フォーマットは、複数の数値的な成分を有するベクトルで構成されてよい。
特徴ベクトルと、既知のパフォーマンスデータとの関係は任意の好適な形態を採ることができる。例えば予測エンジンは、他のメディアコンテンツに関する既知のパフォーマンスデータを利用して教育されたモデルを有することができ、これは特徴ベクトルを入力として受信し、予測されるパフォーマンスデータを出力として提供するように構成される。一実施形態において、このモデルは、他のメディアコンテンツに関する複数の既知の特徴ベクトルに基づくことができ、(すなわちこれを利用して教育される)、複数の既知の特徴ベクトルは各々が、特徴ベクトルと同一の所定の次元数を有する。よって特徴ベクトルの次元数は、そのモデルに関する入力として適切であるように選択される。
モデルは、パフォーマンスデータが既に知られている特徴ベクトルのライブラリを利用して取得されてよい。
代替としてまたは追加として、予測エンジンは、特徴ベクトルを他のメディアコンテンツに関する複数の既知の特徴ベクトルと比較するように構成されてよく、この既知の特徴ベクトルは各々が同一の所定の次元数を有しており、予測されるパフォーマンスデータは、この比較の結果に基づいている。よって、新たなメディアコンテンツに関するパフォーマンスデータの予測は、特徴ベクトルと、既知の特徴ベクトルとの関係に応じて既知のパフォーマンスデータから得ることができる。例えば、特徴ベクトルを複数の既知の特徴ベクトルと比較するステップは、特徴ベクトルと、複数の既知のベクトルとの相関関係を計算することを含んでよい。当分野で知られるように、距離行列を利用して、特徴ベクトルと複数の既知の特徴ベクトルとの相関係数を計算することができる。
方法は、既知の特徴ベクトルのパターンライブラリから複数の既知の特徴ベクトルを選択することを含んでよい。一例において、複数の既知の特徴ベクトルは、このパターンライブラリに格納された全ての既知の特徴ベクトルであってよい。しかしながら一実施形態において、複数の既知の特徴ベクトルは、分析されるべきメディアコンテンツに対して調整された完璧なパターンライブラリのサブセットである場合もある。例えば方法は、メディアコンテンツに関連する外的基準を入力することを含む場合があり、この場合、複数の既知の特徴ベクトルを選択するステップは、この入力された外的基準に基づいている。外的基準は、メディアコンテンツの任意の属性に関連してよい。一実施形態において、メディアコンテンツは、広告であってよく、外的基準は、この広告の対象となる客層の識別、及びこの広告に関するマーケットの識別のうちの任意の1つまたは複数を含むことができる。
パターンライブラリは、所与の1つのこれまで分析されたメディアコンテンツに関して複数の特徴ベクトルを有する場合がある。例えばメディアコンテンツのパフォーマンスをテストするのに利用されるユーザを複数のユーザグループに区分することができ、各々のユーザグループに対して、1つのメディアコンテンツに関して別々の特徴ベクトルを算出することができる。換言すると、各々のメディアコンテンツに関して収集されたパフォーマンスデータをさらに区分することで、多様な特徴ベクトルの計算を可能にすることができる。区分され収集されたパフォーマンスデータに基づいた特徴ベクトルに加えて、その1つのメディアコンテンツに関して全ての収集されたパフォーマンスデータに基づいたただ1つの特徴ベクトルを有することも可能である。このただ1つの特徴ベクトルはよって、その1つのメディアコンテンツに関して取り込まれるパフォーマンスデータの十分なリッチネスを表現することができる。
予測されるパフォーマンスデータの生成に関して言えば、方法は、この特徴ベクトルに最も密接に相関する複数の既知の特徴ベクトルのサブセットを選択することを含むことができ、この場合、予測されるパフォーマンスデータを生成するステップにおいて使用される既知のパフォーマンスデータは、複数の既知の特徴ベクトルのサブセットに対応付けられている。換言すると、方法は、特徴ベクトルと、複数の既知の特徴ベクトルとの相関関係に基づいて既知のパフォーマンスデータをフィルタリングすることができる。パターンライブラリは、数百または数千の既知の特徴ベクトルを含んでよい。複数の既知の特徴ベクトルのサブセットは、20個未満の特徴ベクトル、例えば10個の特徴ベクトルを含んでよい。
本明細書で言及されるマッピングステップは、コンテンツ識別子ストリームを減少された次元数の特徴スペースに投入するステップとして概して表される場合がある。本明細書で言及される特徴ベクトルは、そのような減少された次元数の特徴スペースにおけるベクトルであり得る。
特徴スペースは、所定の、例えば固定された次元数を有してよい。特徴スペースは、上記で考察したタイプの数値的な表現の教育セットにマシンラーニング技術を適用することによって取得された次元数減少モデルに基づいて生成されてよい。例えば次元数減少モデルは、数値的な表現の教育セットをクラスター化アルゴリズムに適用することによって取得することができる。他の例では、次元数減少モデルは、手入力で決められたルールを含む、またはそのようなルールで構成されてよい。数値的な表現の教育セットは、第1の分類子と、第2の分類子によって他のメディアコンテンツから、すなわちパフォーマンスデータが知られているメディアコンテンツから抽出された数値的な表現であってよい。マッピングのステップは、上記で定義したようにコンテンツ識別子ストリームの数値的な表現を特徴スペースにマッピングすることを含んでよい。特徴スペースは、大きな数の次元数、例えば80,000までの次元数を有する可能性がある。
上記で述べたように、異なる次元数を有する特徴ベクトルが、同一のメディアコンテンツから取得される場合がある。方法は、その特徴ベクトルに関して減少された次元数を選択することと、コンテンツ識別子ストリームを、選択された減少された次元数を有する減少された次元数の特徴スペースに投入することとを含んでよい。予測エンジンによって必要とされる抽出のレベルに応じて複数のレベルの次元数が存在する可能性がある。一実施形態において、マッピングステップは、80,000または10,000または500または20の次元数を有する特徴ベクトルを出力するように構成されてよい。
一実施形態において、特徴ベクトルの生成は、2段階のプロセスであってよい。まず、メディアコンテンツの分析(好ましくは自動化された分析)が行われる。次に、コンテンツの分析の結果が、特徴ベクトルにマップすることが可能な機械可読フォーマットに変換される。他の実施形態において、コンテンツの分析が、特徴ベクトルにマップすることが可能な機械可読出力を直接生み出す場合もある。上記で説明したように、分析ステップは、複数の分類子を利用してよい。
第1の段階は、複雑なコンテンツ分析が可能な任意の既知のアルゴリズム、例えばClarify,Inc.によって提供されるClarify API、またはAlchemyAPI,Inc.からのImage Tagging APIまたはMicrosoft Corporation’s Project Oxfordからの1つまたは複数のAPIなどを利用する場合がある。そのようなアルゴリズムまたはAPIは典型的には、例えば単語などの人間によって理解することが可能な要素だけでなく、例えば明るさのレベル、シーンの変更、カラースキームなどの他の下位レベルの特徴を示す要素も含む場合がある出力を生成する。コンテンツ識別子ストリームは、人間が読み取ることが可能なフォーマットであってよい。例えばコンテンツ識別子ストリームは、複数の単語を含んでよい。メディアコンテンツが複数の画像フレーム(例えばビデオなど)を含む場合、第1の分類子を、画像フレーム毎に所定の数の単語を出力するように構成することができる。
コンテンツ識別子ストリームを、特徴ベクトルにマッピングするのに適したフォーマットに変換する別のステップを必要とする実施形態では、第2の段階が、人間が読み取ることが可能なデータを機械可読フォーマットにエンコードすることが可能な任意の既知のアルゴリズムを利用する場合がある。機械可読フォーマットは、複数の数値的な成分を有するベクトルで構成されてよい。このベクトルのサイズは、コンテンツ識別子ストリームのサイズ及び/または性質に応じて変化し得る。この理由のために、第2の段階の出力は、入力(すなわちコンテンツ識別子ストリーム)が同一のフォーマットを持たない限り、容易に比較することができない。本発明は、このような出力を共通のフォーマットにマッピングすることによってこの問題を克服する。
上記で述べたように、上記で考察した第1の段階と、第2の段階が組み合わされる場合もあり、すなわち第1の分類子と、第2の分類子が、試験状態にあるメディア内のコンテンツの数値的な表現を出力するように構成された1つの分類子に統合される場合がある。
既知のパフォーマンスデータは好ましくは、予測されるパフォーマンスデータと同一のタイプである。予測されるパフォーマンスデータは、任意の好適な技術を用いて既知のパフォーマンスデータから判定することができる。
上記で考察したように、既知のパフォーマンスデータを利用して、その入力として特徴ベクトルを受信し、予測されるパフォーマンスデータをその出力として生成するモデルを生成できる。このモデルは、任意の既知のマシンラーニング技術を用いて生成することができる。
代替または追加として、既知のパフォーマンスデータは、従来の統計的な方法を利用して組み合わされて、予測されるパフォーマンスデータを生み出す場合もある。例えば、予測されるパフォーマンスデータは、上記で考察した既知のパフォーマンスデータのサブセットからの既知のパフォーマンスデータの平均値であってよい。この平均値は、特徴ベクトルと、サブセット内の既知の特徴ベクトルとの相関係数に基づいて重み付けされてよい。代替または追加として、予測されるパフォーマンスデータは、既知のパフォーマンスデータから抽出されたある範囲の値を有する場合もあり、この範囲は、上限境界(最大値)と下限境界(最小値)の一方またはその両方を有する。
パフォーマンスデータは、1つのメディアコンテンツに対応付けられた任意の定量化できるパラメータであってよい。例えば予測されるパフォーマンスデータは、消費者に関する起こり得る行動データ(とりわけ消費者に関する感情の状態の情報)、ソーシャルメディア反応データ、受賞する確率、アンケート用紙の回答データ及び売り上げ効果の情報のうちのいずれか1つである。一実施形態において、予測されるパフォーマンスデータは、メディアコンテンツに反応する概念的なユーザの1つまたは複数の感情の反応を示す感情の状態のデータであってよい。1つまたは複数の感情の反応は、役立つ可能性のある何らかの感情の状態のパラメータを含むことができる。例えば感情の状態のパラメータは、例えば喜び、悲しみ、驚き、恐怖、嫌悪及び怒りなどの6つの普遍的な感情の各々に関する測定基準を含んでよい。分析もまた、感情とは無関係である、またはこれ以外の組み合わせの顔のパーツの移動に基づく場合のある1つまたは複数の別の測定基準を生成することができる。例えば別の測定基準は、没頭度、注意力、退屈、混乱、中立、誘発及び喚起を含んでよい。行動データはまた、皮膚の色のわずかな変化によって視覚的に読み取ることができる心拍数などの測定法を含む場合もある。データが収集される感情は、怒り、嫌悪、中立、悲しみ、恐怖、喜び、驚き及びそれに派生するものを含むことができる。他の行動情報(例えば頭の向き、または上半身の姿勢などの物理的データ)が収集される場合もある。例えば、ユーザの接近または後退(すなわちディスプレイに対して前方にまたは後方に傾いている)が収集される場合もある。この情報を他の情報、例えば感情の状態の情報と組み合わせることで、コンピュータユーザの反応、例えば没頭度などのさらなる指標を得ることができる。上記で指摘したように、行動データは、コンピュータユーザがメディアコンテンツを見ているとき、彼らの顔の表情から検出される感情を含むことができる。加えてまたは代替として、行動データは、これに限定するものではないがメディアコンテンツと対話するユーザから収集することができる他の情報、例えばジェスチャー、血圧(例えば皮膚の色またはモニタリング用の付属品に基づいた)、まばたきなどのいずれかを含む場合もある。
一実施形態において、予測されるパフォーマンスデータは、メディアコンテンツが対象とされ得る特定の消費者または消費者のグループを反映するように調整される場合がある。例えば既知のパフォーマンスデータは、複数の異なる概念的なユーザタイプに関して集められた感情の反応データを含む場合があり、各々の概念的なユーザタイプは異なる感情プロファイルを有する。方法は、予測されるパフォーマンスデータが望まれるユーザタイプを予測エンジンに入力することを含むことができる。
方法は、コンピュータ可読記憶媒体に記憶されたコンピュータ可読命令(すなわちプログラムコード)として具現化することができ、これが、コンピューティングデバイスによって実行される際、コンピューティングデバイスに上記に記載されるメディアコンテンツに関するパフォーマンスデータを予測する方法を実行させる。
上記の方法は、ネットワークコンピュータシステム上に実装されてよい。例えば分類子及び予測エンジンは、その素材のパフォーマンスに関する予測を取得することを希望するリモートカスタマーデバイスから(例えばメディアコンテンツプロバイダから)リクエストを受信するようにサーバ内に構成されてよい。本発明の別の態様において、メディアコンテンツに関するパフォーマンスデータを予測するためのシステムが提供されており、このシステムは、メディアコンテンツプロバイダから分析するためにメディアコンテンツを受信するように構成された予測サーバであって、受信したメディアコンテンツからコンテンツ識別子ストリームを生成するための第1の分類子と、コンテンツ識別子ストリームを所定の次元数を有する特徴ベクトルにマッピングするためのマッピングモジュールと、この特徴ベクトルを用いて予測されるパフォーマンスデータを生成するための予測エンジンとを備える予測サーバと、予測サーバに通信可能に結合され、複数の他のメディアコンテンツに関するパフォーマンスデータエントリを格納するパターンライブラリとを備え、この予測エンジンは、特徴ベクトルと、他のメディアコンテンツに関する既知のパフォーマンスデータとの関係を求め、特徴ベクトルと、他のメディアコンテンツに関する既知のパフォーマンスデータとの関係に基づいて予測されるパフォーマンスデータを生成するように構成される。
各々のパフォーマンスデータエントリは、特徴ベクトルと、他のメディアコンテンツに関するパフォーマンスデータとを含んでよく、各々の特徴ベクトルは所定の次元数を有しており、予測エンジンは、特徴ベクトルを他のメディアコンテンツに関する特徴ベクトルと比較し、この比較の結果と、他のメディアコンテンツに関するパフォーマンスデータとに基づいて予測されるパフォーマンスデータを生成するように構成される。
上記で考察したように、パターンライブラリ内の各々1つのメディアコンテンツに関して複数の特徴ベクトルが存在する場合がある。各々の特徴ベクトルは、異なる次元数を有してよい、及び/またはその1つのメディアコンテンツに関して収集されたパフォーマンスデータのサブセットに基づいている場合もある。
システムは、分析するためにメディアコンテンツを入力するために予測サーバに通信可能に接続された1つまたは複数のリモートカスタマーデバイス(例えばメディアコンテンツプロバイダ)を含んでよい。ここでカスタマデバイスは、メディアコンテンツを予測サーバに入力する、及び/またはそのメディアコンテンツに関する予測されるパフォーマンスデータを受信するように構成された任意のコンピューティングデバイス、例えばネットワーク対応のコンピューティングデバイスを指す場合がある。
システムはさらに、パターンライブラリ内に格納されるべきパフォーマンスデータを入力するために1つまたは複数のパフォーマンスデータ収集デバイスを含んでよい。パフォーマンスデータ収集デバイスは、収集されたパフォーマンスデータを予測サーバまたはパターンライブラリに伝達するように構成された任意のコンピューティングデバイス、例えばネットワーク対応のコンピューティングデバイスであってよい。一実施形態において、パフォーマンスデータ収集デバイスは、メディアコンテンツを再生し、そのメディアコンテンツを消費するユーザに関する行動データを収集するように構成されたユーザデバイス(例えば、PC、ラップトップ、スマートフォンなど)を含むことができる。
本発明の機能は、1つのメディアコンテンツに関してパフォーマンスデータの即時予測を提供することである。そのような定性比較の利用は、公式リリースより前に消費者からのフィードバックを獲得する必要がもはやないため、コンテンツの作者、配給業者、ネットワークオペレータ及び同様のエンティティが、メディアコンテンツの送信を制限することを可能にする。ネットワーク資源及び計算資源をそれ故保護することができる。さらに、定性比較を実現するのに必要な時間は、リアルなユーザによるテストが必要とされる場合とは対照的に一瞬である。したがって、他のコンテンツ評価手法で必要とされる人的資源に対するコストも削減される。
ここで、用語「行動データ」は、ユーザの活動または状態に関する任意のデータを指すのに使用されている。それは、感情的な状態のデータを含む、すなわち任意の所与の時間のユーザの感情を示す情報を含む場合もある。感情の状態のデータは、何らかの方法で、例えばウェブカメラを介して取得された顔の画像または他の生理学的な指標から取得されてよい。行動データはまた、ユーザのコンピュータとの対話に関するデータ、例えば音声データ、クリックデータまたはディスプレイの一部におけるユーザの関与を示す他のデータなどを含む場合がある。行動データに加えて、本発明はまた、例えばユーザに関する他の詳細、例えば性別、年齢、位置などを示す他のユーザデータの収集及び伝達を提供する場合もある。
本発明の実施形態を、添付の図面を参照して以下に詳細に説明する。
本発明の一実施形態である、メディアコンテンツに関するパフォーマンスデータを予測する方法におけるステップを描く概略的なフロー図である。 本発明において使用することができるパターンライブラリを概略的に表す図である。 本発明の実施形態においてパフォーマンスデータを予測するのに使用することができるベクトル表現の比較におけるステップを描くフローチャートである。 本発明の実施形態において使用されるパターンライブラリに関するエントリを生成する方法におけるステップを描く概略的なフロー図である。 本発明の実施形態を実装することができるネットワークコンピュータシステムを示す概略図である。
本発明は、1つのメディアコンテンツに関するパフォーマンスデータを、そのコンテンツに対する何らかの外部からの測定された反応に基づくのではなく、そのコンテンツ自体に基づいて予測することを可能にするための技術を提供する。これは、時間を消費し、かつ場合によっては費用がかかるフィードバックを収集する段階を必要とせずに、それがメディアコンテンツの即時評価を可能にすることができるために有利である。一般に、本発明の技術は、メディアコンテンツを所定の次元数を有する特徴スペース内のベクトル表現に変換する2段階のマッピングプロセスに基づいている。全てのタイプ(例えばビデオ、音響など)の及び継続時間のメディアコンテンツを同一の特徴スペースにマッピングすることによって、例えば異なるメディアコンテンツに属するベクトル間の相関関係のレベルを判定することによって、それらの間で意義深い比較を行うことができる。このプロセスを支えているのはパターンライブラリであり、これはそれに関するパフォーマンスデータ(例えば収集された行動データ、売り上げ高データ、ソーシャルメディア反応の統計、受賞する確立、アンケート用紙の回答データなど)が利用可能であり(例えば既に収集されている)、かつ特徴スペースにおけるベクトル表現に対応付けられているメディアコンテンツを利用して構築される。
図1は、1つのメディアコンテンツに関するパフォーマンスデータを予測する方法100におけるステップを描く概略的なフロー図である。方法100は、1つのメディアコンテンツ102を受信するステップによって始まる。メディアコンテンツは、ビデオ(例えば複数のまたは一連の画像フレーム)であってよい。ビデオは、付随する音声を含んでよい。メディアコンテンツは音声のみである場合もある。メディアコンテンツは、メディアコンテンツを分析し、コンテンツ識別子ストリーム106を出力するように構成された第1の分類子104に入力される。一実施形態において、コンテンツ識別子ストリームは、メディアコンテンツ内で示されるもの、または聞かれるものに関する複数のキーワードまたはキーフレーズを含む。例えばClarify,Inc.によって提供される分類APIを使用して、コンテンツ識別子のストリームを生成することができる。一実施形態では、コンテンツ識別子は、1つのビデオの各々のフレームに関して、一揃いのキーワード、例えば20個のキーワードを含む。このキーワードは、例えば「犬」「追いかける」「猫」などのビデオ内に示されるオブジェクトまたは行為に関連してよく、または例えば「列車」「通過する」などの付随する音声で聞かれる音、またはビデオに関連する編集上のもしくは映写情報、例えば「クローズアップ」「かすんだ背景」、シーンの変化の頻度、動きの速度、明暗のシーン、色の変化の頻度、色のスペクトラム、特定のオブジェクトの外見の変化の頻度及びその時間的な特色に関する情報、例えば速度、持続時間などに関連してよい。
コンテンツ識別子ストリーム106は、人間が読み取り可能であってよい。使用される分類子及びメディアコンテンツの持続時間に応じて、コンテンツ識別子ストリームは、様々なメディアコンテンツに関して様々なサイズを有することになる。
方法は、コンテンツ識別子ストリームを第2の分類子108に入力することによって継続する。第2の分類子108は、コンテンツ識別子ストリームを機械が読み取ることが可能な形式に変換する、すなわち数値的な表現110に変換するように構成される。数値的な表現110は、例えばコンテンツ識別子ストリームを、オープンソースWord2vecコードなどのコンピューティングベクトル表現に関する既知のニューラルネットアルゴリズムに適用することによって取得されるベクトルであってよい。
そこから得られるコンテンツ識別子ストリーム106と同様に、数値的な表現110も、コンテンツ識別子ストリームを生成するのに使用されるメディアコンテンツ102の持続時間及び分類子104のタイプに応じて異なるサイズを有することになる。このような理由のために、異なるメディアコンテンツからの数値的な表現を互いに比較することは難しい。しかしながら本発明は、この数値的な表現を、固定された次元数の特徴スペースにおけるベクトル表現114にそれをマップするマッピングアルゴリズム112に入力することによってこの問題を解決する。特徴スペースの次元は、クラスター化アルゴリズムを利用して、例えば様々なメディアコンテンツからの複数の数値的な表現に関して決定されてよい。
ベクトル表現114は、全てのメディアコンテンツに関して同一の次元数を有し、それ故その間の直接の比較を可能にする。方法は、ベクトル表現を予測分析モジュール116に入力することによって継続する。予測分析モジュール116は、入力されたベクトル表現を、パターンライブラリ118内の一揃いの格納されたベクトル表現(ここでは「特徴ベクトル」とも呼ばれる)と比較することで、メディアコンテンツ102に関する予測されるパフォーマンスデータ120を出力するように構成される。どのように比較を行うことができるかの一例が、図3を参照して以下で考察される。
予測されるパフォーマンスデータは、様々な形態の任意の1つを採る可能性がある。一実施形態において、予測されるパフォーマンスデータは、例えば期待される収益に関する格付けまたは期待される消費者のフィードバックを示す格付けなどの1つまたは複数の予測される売り上げ高のパラメータを指す場合がある。別の実施形態において、予測されるパフォーマンスデータは、例えば期待される気に入りに関する格付け、もしくは共有に関する格付け、または拡散する確率の格付けなどの1つまたは複数のソーシャルメディア反応パラメータを指す場合がある。別の実施形態において、メディアコンテンツが広告である場合、予測されるパフォーマンスデータは、例えば賞品の「金」「銀」または「銅」を獲得する予測される確率などのコンペにおける賞に関する確率の格付けを指す場合もある。
別の実施形態では、予測されるパフォーマンスデータは、予測される行動反応、例えばメディアコンテンツを消費するユーザの起こり得る感情の反応を含む場合もある。予測される行動反応は、例えば全てのユーザの中での平均値など包括的であってよい。あるいは、それはユーザのタイプによって調整される場合もあり、すなわち予測される行動反応は、ユーザプロファイルに従って変化する場合がある。このような例では、ユーザプロファイルデータベース122が1人または複数のユーザに関する行動プロファイルを格納してよい。予測分析モジュール116に、予測が行われるべきユーザ(またはユーザプロファイルのタイプ)が知らされてよく、これに従って予測を調整することができる。
図2は、パターンライブラリ118の中身を概略的に表す図である。パターンライブラリは、複数のエントリを含んでおり、各エントリは、それに関して特徴ベクトルが取得されているメディアコンテンツと、それに関して任意のパフォーマンスデータが知られているメディアコンテンツ両方のそれぞれ1つずつのためにある。各々のエントリは、それぞれの特徴ベクトル126に対応付けられて格納された独自のメディアID値124を有してよい。このような例では、各々の特徴ベクトル126は、カテゴリ「売り上げ高」130、「感情」132及び「ソーシャルメディア」134のうちのいずれか1つにおけるパフォーマンスデータ128に対応付けられている。各々のエントリは、各カテゴリ内のパフォーマンスデータを有する必要はない。さらに、各カテゴリは、さらに分割される場合もある。例えば、「感情」カテゴリ132は、複数の異なるユーザプロファイルのタイプに対して記録された感情の反応データを反映するために、各メディアコンテンツ(例えばメディアIDYYYに対して示されるような)に対して複数のエントリを有することができる。
より一般的には、上記に記載した技術を利用して、特定の(例えば標的とする)グループの一般大衆に対するメディアコンテンツの影響を評価することができる。本発明は、一般的な集団に関して予測されるパフォーマンスデータを取得するように限定されない。故に、予測される効果を、それが意図されたグループに対して調整することが望ましい。これは、外的基準を入力することで、予測されるパフォーマンスデータの生成元である既知のパフォーマンスデータを提供するのに使用されるパターンライブラリから複数の既知の特徴ベクトルをフィルタリングすることによって行うことができる。図1において、予測分析116は、分析が行われるべき既知の特徴ベクトル(及びそれ故既知のパフォーマンスデータ)を選択するのに使用される外的基準121の追加の入力を含んでよい。
外的基準は、任意の好適な形態を採ることができる。例えば、外的基準は、予測が計算されるべき人口区分を記述する追加情報を含んでよい。例には、特定の人口統計グループ、例えば女性に関するパフォーマンスの予測、または特定の地理的な地域、例えば米国もしくはブラジルなどに関するパフォーマンスの予測が含まれてよい。別の例では、外的基準は、予測されるパフォーマンスデータが望まれる特定の人口区分または固定されたセットの人口区分(全人口、男性、女性、年齢のグループ、位置)を特定する場合がある。さらに別の例では、外的基準は、既知のパフォーマンスデータに関する特定の時間を特定する場合もあり、例えば外的基準は、予測に使用される既知の特徴ベクトルが、1ヶ月以下のものであることを特定する場合、または予測に使用される既知の特徴ベクトルが10年経ったものであることを特定する場合もある。
図3は、出力された予測されるパフォーマンスデータを算出する方法の一例を示すフローチャートである。方法は、予測分析モジュール116において、試験状態にある1つのメディアに関するコンピュータベクトル表現(すなわち特徴ベクトル)を受信すること136によって始まる。方法は、複数の特徴ベクトルの各々と、受信した特徴ベクトルとの相関係数を計算することによって、受信した特徴ベクトルをパターンライブラリ118からの複数の特徴ベクトルと比較するステップ138によって継続する。この計算は、距離行列法を利用して、複数の特徴ベクトルのうちのどれが受信した特徴ベクトルに最も近いかを判定することによって行われてよい。
方法は、計算した相関係数に基づいて最も近い近傍の特徴ベクトルのサブセットを決定するステップ140によって継続する。最も近い近傍の特徴ベクトルのサブセットが特定された後、そのパフォーマンスデータをパターンライブラリから読み取ることができる。方法は、最も近い近傍の特徴ベクトルのサブセットに関して読み取ったパフォーマンスデータに基づいた予測される効果を出力するステップによって継続する。例えば、予測される効果は、最も近い近傍の特徴ベクトルのサブセットからのパフォーマンスデータパラメータの平均値を採ることによって取得されてよい。
上記に記載した特徴ベクトルの一態様は、それらが、メディアコンテンツの時間的な特色に関する情報をエンコードすることができることである。例えばコンテンツ識別子ストリームは、いつオブジェクトを繰り返し見ることができるか、またはいつオブジェクトが他のアイテムと合わせて示されるかを指示する。適切な場合に、パターンライブラリ内に格納されたパフォーマンスデータが時間的な特色を示すことは有益であり得る。とりわけ、感情のデータが記録される場合、そのデータをメディアの特定のセグメントに関連付けるのが有益な場合がある。
図4は、メディアコンテンツの時間的な特色に関係付けることができる行動データ(好ましくは感情の状態)を記録する方法200を示す概略図である。これは、本発明と共に使用することができるパフォーマンスデータの1つのタイプの一例である。しかしながら、本発明は、このタイプのパフォーマンスデータに限定されないことに留意されたい。分析すべきメディアコンテンツが広告である一実施形態では、予測されるパフォーマンスデータが売り上げ高に対する影響を示すことが望ましい場合があり、これは、それが恐らく鍵となるパフォーマンスの指標であるためである。このような例では、他のタイプのパフォーマンスデータを予測することもできるが、それらは予測される売り上げ高を導き出すプロセスにおける中間位置を表す場合がある。
例えば、感情の状態のデータのみが入手可能であるビデオに関する売り上げを予測する必要があるという設定では、本発明は、その感情の状態のデータから特徴ベクトルを算出するように構成された分類子と、マッピングモジュールとを含むことができる。この特徴ベクトルをその後使用して、パターンライブラリにおいて同様の特徴ベクトルを見つけることができ、そこから既知の売り上げ高データを使用してこのビデオに関する売り上げ高データを予測することができる。
別の例では、メディアコンテンツの分析は、特徴ベクトルを構築するのに使用される複数のシーンのタグを生み出す場合がある。この特徴ベクトルは、それらに対応付けられた既知の感情の反応を有する(但し売り上げ高データは全く持たない)既知の特徴ベクトルと比較することで、このメディアコンテンツに関する中間の予測される感情の反応を取得することができる。この中間の予測される感情の反応を利用して、上記に記載したプロセスと一致するように新たな特徴ベクトルを生成することができ、これを利用して、売り上げ高データが知られている同様の特徴ベクトルを見つけることで、このメディアコンテンツに関する売り上げ高を予測することができる。
方法200は、ユーザ202が、ネットワーク対応のコンピューティングデバイス(図示せず)に対応付けられたディスプレイ204上でメディアコンテンツを見ることによって始まる。ディスプレイ204は、任意のネットワーク対応のディスプレイデバイスに対応付けられてよい。例えば、ディスプレイ204は、ネットワーク対応のテレビジョン、セットトップボックス、ゲーミングコンソール、PC、ラップトップコンピュータ、タブレットコンピュータまたはスマートフォンによって提供される、またはそれらに接続されてよい。コンピューティングデバイスはよって、例えばインターネット等のネットワークを介してデータを送受信することが可能である。メディアは、例えばWindows(登録商標) Media Player、QuickTime Player、Audacious、Amarok、Banshee、MPlayer、Rhythmbox、SMPlayer、Totem、VLC及びxineなどのウェブブラウザもしくはビデオプレイヤ208を介して、または例えばJW Player、Flowplayer及びBrightcoveなどのオンラインビデオプレイヤを介して表示されてよい。
コンピューティングデバイスまたはディスプレイ204は、例えばマイクロフォン、ウェブカメラ206などの行動データを記録するための内蔵手段に接続される、またはその内蔵手段を有する。
コンピューティングデバイスは、例えばそこにあるメモリに記憶された、またはネットワークを介してダウンロード可能なもしくはアクセス可能な、それに対応付けられた行動データ収集アプリケーションを有する。実際には、ユーザ202は、例えばメデイアプレイヤ208上でメディアコンテンツを見ている間、行動データ収集エクササイズに参加するための招待をコンピューティングデバイス上で受け取ることができる。実行すると、行動データ収集アプリケーションは、ネットワーク212を介してリモート分析サーバ214と通信して、行動データ210を収集し、これを配信することができる。
行動データ収集アプリケーションは、ユーザの感情の状態を示す情報を収集するための感情追跡アプリケーションであってよい。データ収集アプリケーションは、他のタイプの行動データを収集するように構成される場合もある。収集された行動データは、ユーザがビデオプレイヤ208上で再生されるメディアと対話する間、ユーザの感情を追跡することを可能にすることができる。
行動データ収集アプリケーションは、分析サーバ214と、行動データを記録する手段(例えばウェブカメラ206)の間の通信を設定する初期化プロセスを実行するまたは制御することで、収集されたデータ210(例えばウェブカメラ画像、行動データ、メディアの属性など)をそれらの間で伝送することを可能にする。例えば、初期化プロセスは、ネットワーク212にわたる通信を設定する(例えばそれに関する権限を取得する)ことを含むことができる。収集されたデータ210はこれにより、ネットワークを介して分析サーバ214に送信されてよく、そこでユーザの感情に関する情報を抽出し、さらなる処理のために使用することができる。
一実施形態では、収集された行動データ210は、複数の画像フレームと、音声トラックで構成されたウェブカメラ記録を含む場合がある。収集されたデータはまた、メディア識別子を含むため、どのメディアコンテンツが収集されたデータに対応付けられるかが分かる。メディアコンテンツと、ウェブカメラ記録は、既知の技術を利用して同期させることができる。これによりウェブカメラ記録の各画像フレームをメディアコンテンツの対応する部分と対応付けることが可能になる。
分析サーバ214は、フレーム毎に画像フレームから感情の状態の情報を抽出するように構成される。これは任意の既知の方法で行われてよい。例えば、分析は、画像フレームにおける顔の有無を検出する、鍵となる顔の特徴(例えば目の端、口の位置など)を特定する、及びメディアコンテンツの持続時間を通して鍵となる顔のパーツの相対的な位置をモニターすることを含んでよい。
方法は、分析サーバ214から感情の可能性のベクトルストリーム216を出力するステップによって継続する。感情の可能性のベクトルストリーム216は、ウェブカメラ記録における複数の(またはその全ての)画像フレームに相当する一揃いのベクトルである。各々のベクトルは、複数の成分で構成されており、その各々が、そのそれぞれの画像フレームが所与の感情を表す顔を含む可能性を表している。この可能性は、従来式の方法で分析サーバ214によって計算される。
一部の例では、感情の可能性のベクトルストリーム216を直接使用して、例えばメディアコンテンツの持続時間の中で感情がどのように変化するかを示すためのディスプレイを生成する場合がある。しかしながらこのような例では、感情の可能性のベクトルストリームは、感情の状態のデータによってより深いパターンを定めるように構成されたパターン分析モジュール218に入力される。詳細には、パターン分析モジュールは、感情の可能性のベクトルストリームの時間的な特色に注目することができる。時間的な特色は、事前に決定されてよい。例えば、「驚く直前の喜び」、「メディアコンテンツの最初の3秒間における笑顔」または「商標を見た後の驚き」などが生じることは、異なる感情同士の、または検出された感情と、メディアコンテンツの段階との時間的関係に応じた感情の状態のデータの特色を表している。別の例では、メディアコンテンツは、セグメント(例えば持続時間のうちの1/4、または「最初の10秒」もしくは「最後の5秒」など)に分割されてよい。事前決定された感情同士の時間的な関係は、各々のセグメントに関して判定されてよい。
事前決定された時間的特色は、1つのメディアコンテンツに関する望ましい特徴または望ましくない特色に対応するように選択されてよい。一部の実施形態では、時間的な特色は、マシンラーニング技術によって判定されてよい。
方法は、パターンライブラリにおけるメディアコンテンツに対応付けて格納することができる感情のパフォーマンスデータ220をパターン分析モジュール218から出力するステップによって継続する。メディアコンテンツは、図1に関して上記で考察したプロセスに従って評価され得るため、パターンライブラリもまた、このメディアコンテンツに関する特徴ベクトルを含んでいる。
感情のパフォーマンスデータ220は、ユーザの感情プロファイルなどのユーザに関する追加情報を含んでよい。これは、パターンライブラリ118内に保持される感情のパフォーマンスデータに対してより細分性を与えることができる。
上記で考察したように、パターンライブラリは、1つのメディアコンテンツに対応付けられた他の外部のパフォーマンスデータ222を含む場合もある。外部のパフォーマンスデータ222は、上記に記載したように、売り上げ高、ソーシャルメディア反応、コンペの成功などに関する情報であってよい。
図4に関する考察は、単一の1つのメディアコンテンツを一度見ることに関連するが、パターンライブラリにおける感情のパフォーマンスデータは、より多数のメディアコンテンツに基づくように意図されており、その各々が、多数のユーザから記録された感情のパフォーマンスデータを有することを理解されたい。パターンライブラリ118における各々1つのメディアコンテンツに関する感情のパフォーマンスデータ220は故に、多数のユーザに関して集計したパフォーマンスデータに相当すると理解することができる。
図5は、本発明を実装するのに使用することができるシステム300の概略図である。このシステムの中核は予測サーバ318である。予測サーバ318は、メディアコンテンツプロバイダ324(例えば広告主、フィルムメーカーなど)からリクエストを受信して、新たなメディアコンテンツ326に関するパフォーマンスデータの予測328を提供することができる。このリクエストは、ネットワーク312(またはインターネット)を介して、または任意の他の好適な方法で配信されてよい。例えばリクエストは、配信ウェブサイトまたは配信ポータル321を介してよく、そこでは顧客が1つのメディアコンテンツをアップロードして即時予測の結果を取得することができる。
このような例では、予測サーバ318は、(例えば図1を参照して上記に記載したプロセスを実行するように構成された)反応予測エンジン322と、(上記で考察したパターンライブラリと同じ機能を果たす)パターンライブラリ320とを含む。しかしながらいくつかの実施形態では、パターンライブラリは、予測サーバ318から離れて位置する場合もある。
システムはまた、パフォーマンスデータ抽出及び収集サーバ314を含む。このような例では、これは、予測サーバ318とは異なるデバイスとして示されるが、これは必須ではない(すなわちそれらは組み合わされる場合もある)。パフォーマンスデータ抽出及び収集サーバ314は、例えばウェブポータルなどのユーザインターフェース(図示せず)を有してよく、これによりメディアコンテンツに関して外部のパフォーマンスデータ(例えば売り上げ高またはソーシャルメディア反応データ)の手入力が可能になる。パフォーマンスデータ抽出及び収集サーバ314はまた、クライアント(ユーザ)デバイス302からネットワーク312を介して行動データ(例えば複数の画像フレーム316を有する生ウェブカメラ記録)を受信するように構成される。クライアントデバイスは、行動データ収集アプリケーション304を稼働するための任意の好適なネットワーク対応デバイスであってよい。クライアントデバイス302及びパフォーマンスデータ抽出及び収集サーバ314は、パターンライブラリ320にデータを読み込むために、組み合わさって、図4に関して上記で考察したプロセスを行う。図4と共通の特徴は、同一の参照番号を与えられており、ここではさらに説明しない。
図5は、1つのメディアコンテンツプロバイダ324と、1つのクライアントデバイス302のみを示しているが、パフォーマンスデータ抽出及び収集サーバ314及び予測サーバ318は、複数のクライアントデバイス及びメディアコンテンツプロバイダのそれぞれと動作するようにされることを理解されたい。

Claims (30)

  1. メディアコンテンツに関するパフォーマンスデータを予測するコンピュータによって実装される方法であって、
    メディアコンテンツを第1の分類子に入力することと、
    前記第1の分類子によって、コンテンツ識別子ストリームを生成することと、
    マッピングモジュールによって前記コンテンツ識別子ストリームを所定の次元数を有する特徴ベクトルにマッピングすることと、
    前記特徴ベクトルを予測エンジンに入力することと、
    前記予測エンジンによって、前記メディアコンテンツに関して予測されるパフォーマンスデータを生成することとを含み、
    前記予測エンジンが、前記特徴ベクトルと、他のメディアコンテンツに関する既知のパフォーマンスデータとの関係を求めるように構成され、かつ
    前記予測されるパフォーマンスデータが、前記特徴ベクトルと、前記他のメディアコンテンツに関する前記既知のパフォーマンスデータとの前記関係に基づいている、前記コンピュータによって実装される方法。
  2. 前記予測エンジンは、前記他のメディアコンテンツに関する前記既知のパフォーマンスデータを利用して教育されたモデルを有し、これは前記特徴ベクトルを入力として受信し、前記予測されるパフォーマンスデータを出力として提供するように構成される、請求項1に記載の方法。
  3. 前記モデルは、前記他のメディアコンテンツに関する複数の既知の特徴ベクトルに基づいており、前記複数の既知の特徴ベクトルの各々が、前記特徴ベクトルと同一の所定の次元数を有する、請求項2に記載の方法。
  4. 前記予測エンジンは、前記特徴ベクトルを他のメディアコンテンツに関する複数の既知の特徴ベクトルと比較するように構成され、前記既知の特徴ベクトルは各々同一の所定の次元数を有しており、前記予測されるパフォーマンスデータは、前記比較の結果に基づいている、請求項1に記載の方法。
  5. 前記予測されるパフォーマンスデータを出力することを含む、先行請求項のいずれかに記載の方法。
  6. 前記コンテンツ識別子ストリームは、前記メディアコンテンツ内の主題の数値的な表現を含んでおり、前記マッピングモジュールは、前記コンテンツ識別子ストリームの前記数値的な表現を前記特徴ベクトルに対してマップする、先行請求項のいずれかに記載の方法。
  7. 前記コンテンツ識別子ストリームを第2の分類子に入力することと、
    前記第2の分類子によって、前記コンテンツ識別子ストリームの数値的な表現を生成することとを含み、
    前記マッピングモジュールが、前記コンテンツ識別子ストリームの前記数値的な表現を前記特徴ベクトルに対してマップする、請求項1〜5のいずれか一項に記載の方法。
  8. 前記第2の分類子は、人間が読み取ることが可能なデータを機械可読フォーマットにエンコードするように構成される、請求項7に記載の方法。
  9. 前記機械可読フォーマットは、複数の数値的な成分を有するベクトルで構成される、請求項8に記載の方法。
  10. 既知の特徴ベクトルのパターンライブラリから前記複数の既知の特徴ベクトルを選択することを含む、請求項3または4に記載の方法。
  11. 前記メディアコンテンツに関連する外的基準を入力することを含み、前記複数の既知の特徴ベクトルを選択するステップは、前記入力された外的基準に基づいている、請求項10に記載の方法。
  12. 前記メディアコンテンツは広告であり、前記外的基準は、前記広告の対象となる客層の識別、及び前記広告に関するマーケットの識別のうちの任意の1つまたは複数を含む、請求項11に記載の方法。
  13. 前記特徴ベクトルを複数の既知の特徴ベクトルと比較するステップは、前記特徴ベクトルと、前記複数の既知のベクトルとの相関関係を計算することを含む、請求項4に記載の方法。
  14. 距離行列を利用して、前記特徴ベクトルと前記複数の既知の特徴ベクトルとの相関係数を計算する、請求項13に記載の方法。
  15. 前記特徴ベクトルに最も密接に相関する前記複数の既知の特徴ベクトルのサブセットを選択することを含み、前記予測されるパフォーマンスデータを生成するステップにおいて使用される前記既知のパフォーマンスデータは、前記複数の既知の特徴ベクトルの前記サブセットに対応付けられている、請求項13または14に記載の方法。
  16. 前記複数の既知の特徴ベクトルの前記サブセットが、10個またはそれ以上の既知の特徴ベクトルを含む、請求項15に記載の方法。
  17. マッピングのステップは、前記コンテンツ識別子ストリームを減少された次元数の特徴スペースに投入することを含む、先行請求項のいずれかに記載の方法。
  18. 前記投入することは、数値的な表現の教育セットにマシンラーニング技術を適用することによって取得された次元数減少モデルに基づいている、請求項17に記載の方法。
  19. マッピングのステップは、前記特徴ベクトルに関して減少された次元数を選択することと、前記コンテンツ識別子ストリームを、前記選択された減少された次元数を有する減少された次元数の特徴スペースに投入することとを含む、請求項17に記載の方法。
  20. 前記コンテンツ識別子ストリームは、人間が読み取ることが可能なフォーマットまたは機械可読フォーマットである、先行請求項のいずれかに記載の方法。
  21. 前記コンテンツ識別子ストリームは、複数の単語を含む、請求項20に記載の方法。
  22. 前記メディアコンテンツは複数の画像フレーム含んでおり、前記第1の分類子は、画像フレーム毎に所定の数の単語を出力するように構成される、請求項20または21に記載の方法。
  23. 前記既知のパフォーマンスデータは、前記予測されるパフォーマンスデータと同一のタイプである、先行請求項のいずれかに記載の方法。
  24. 前記予測されるパフォーマンスデータは、感情の状態の情報、ソーシャルメディア反応データ、受賞する確率、アンケート用紙の回答データ及び売り上げ高情報のうちのいずれか1つである、先行請求項のいずれかに記載の方法。
  25. 前記予測されるパフォーマンスデータは、前記メディアコンテンツに反応する概念的なユーザの1つまたは複数の感情の反応を示す感情の状態のデータである、請求項24に記載の方法。
  26. 前記既知のパフォーマンスデータは、複数の異なる概念的なユーザタイプに関して集められた感情の反応データを含んでおり、各々の概念的なユーザタイプ、前記方法はさらに、予測されるパフォーマンスデータが望まれるユーザタイプを前記予測エンジンに入力することを含む、請求項25に記載の方法。
  27. 記憶されたコンピュータプログラムコードを有するコンピュータ可読記憶媒体を備え、コンピューティングデバイスによって実行される際、前記コンピューティングデバイスに先行請求項のいずれかに記載されるメディアコンテンツに関するパフォーマンスデータを予測する方法を実行させるコンピュータプログラム製品。
  28. メディアコンテンツに関するパフォーマンスデータを予測するためのシステムであって、
    メディアコンテンツプロバイダから分析するためにメディアコンテンツを受信するように構成された予測サーバであって、
    前記受信したメディアコンテンツからコンテンツ識別子ストリームを生成するための第1の分類子と、
    前記コンテンツ識別子ストリームを所定の次元数を有する特徴ベクトルにマッピングするためのマッピングモジュールと、
    前記特徴ベクトルを用いて予測されるパフォーマンスデータを生成するための予測エンジンとを備える、前記予測サーバと、
    前記予測サーバに通信可能に結合され、複数の他のメディアコンテンツに関するパフォーマンスデータエントリを格納するパターンライブラリとを備え、
    前記予測エンジンは、
    前記特徴ベクトルと、他のメディアコンテンツに関する既知のパフォーマンスデータとの関係を求め、かつ
    前記特徴ベクトルと、前記他のメディアコンテンツに関する前記既知のパフォーマンスデータとの前記関係に基づいて前記予測されるパフォーマンスデータを生成するように構成される、前記システム。
  29. 各々のパフォーマンスデータエントリは、特徴ベクトルと、前記他のメディアコンテンツに関するパフォーマンスデータとを含んでおり、各々の特徴ベクトルは所定の次元数を有しており、前記予測エンジンは、
    前記特徴ベクトルを前記他のメディアコンテンツに関する特徴ベクトルと比較し、
    前記比較の結果と、前記他のメディアコンテンツに関するパフォーマンスデータとに基づいて前記予測されるパフォーマンスデータを生成するように構成される、請求項28に記載のシステム。
  30. 前記予測サーバは、前記コンテンツ識別子ストリームの数値的な表現を生成するために第2の分類子を含んでおり、前記マッピングモジュールは、前記コンテンツ識別子ストリームの前記数値的な表現を前記特徴ベクトルに対してマップするように構成される、請求項28または29に記載のシステム。
JP2018526589A 2015-11-19 2016-11-17 メディアコンテンツのパフォーマンスの即時予測のための方法及び装置 Active JP6807389B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB1520398.7 2015-11-19
GBGB1520398.7A GB201520398D0 (en) 2015-11-19 2015-11-19 Method and apparatus for immediate prediction of performance of media content
PCT/EP2016/077959 WO2017085168A1 (en) 2015-11-19 2016-11-17 Method and apparatus for immediate prediction of performance of media content

Publications (2)

Publication Number Publication Date
JP2018534700A true JP2018534700A (ja) 2018-11-22
JP6807389B2 JP6807389B2 (ja) 2021-01-06

Family

ID=55133023

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018526589A Active JP6807389B2 (ja) 2015-11-19 2016-11-17 メディアコンテンツのパフォーマンスの即時予測のための方法及び装置

Country Status (6)

Country Link
US (1) US11481791B2 (ja)
EP (1) EP3378025A1 (ja)
JP (1) JP6807389B2 (ja)
CN (1) CN108475381A (ja)
GB (1) GB201520398D0 (ja)
WO (1) WO2017085168A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019021175A (ja) * 2017-07-20 2019-02-07 株式会社コラージュ・ゼロ 広告制作支援システム、方法及びプログラム

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10158898B2 (en) 2012-07-26 2018-12-18 Comcast Cable Communications, Llc Customized options for consumption of content
US10958742B2 (en) * 2017-02-16 2021-03-23 International Business Machines Corporation Cognitive content filtering
JP7020215B2 (ja) * 2018-03-19 2022-02-16 日本電気株式会社 余所見判定装置、余所見判定システム、余所見判定方法、プログラム
JP6844568B2 (ja) * 2018-03-27 2021-03-17 日本電気株式会社 余所見判定装置、余所見判定システム、余所見判定方法、プログラム
US10802406B2 (en) 2018-08-17 2020-10-13 Taiwan Semiconductor Manufacturing Co., Ltd. Apparatus and method for generating extreme ultraviolet radiation
US11799930B2 (en) 2019-06-25 2023-10-24 Spotify Ab Providing related content using a proxy media content item
US11340531B2 (en) 2020-07-10 2022-05-24 Taiwan Semiconductor Manufacturing Company, Ltd. Target control in extreme ultraviolet lithography systems using aberration of reflection image
US12032957B2 (en) * 2021-12-08 2024-07-09 Capital One Services, Llc Systems and methods for providing software development performance predictions
US20240016438A1 (en) * 2022-07-13 2024-01-18 Brainvivo Ltd. Segmenting audiences using brain type information

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11161670A (ja) * 1997-12-01 1999-06-18 Ntt Data Corp 情報フィルタリング方法、装置及びシステム
JP2000163477A (ja) * 1998-11-27 2000-06-16 Nec Corp 表示広告選択方法
US20080249832A1 (en) * 2007-04-04 2008-10-09 Microsoft Corporation Estimating expected performance of advertisements
US20140040019A1 (en) * 2012-08-03 2014-02-06 Hulu, LLC Predictive video advertising effectiveness analysis
WO2015075035A1 (en) * 2013-11-20 2015-05-28 Realeyes Oü Method of benchmarking media content based on viewer behaviour

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5304786A (en) * 1990-01-05 1994-04-19 Symbol Technologies, Inc. High density two-dimensional bar code symbol
EP1921866A3 (en) * 2005-03-10 2010-07-28 QUALCOMM Incorporated Content adaptive multimedia processing
JP4591793B2 (ja) * 2008-04-22 2010-12-01 ソニー株式会社 推定装置および方法、並びにプログラム
US8959540B1 (en) * 2009-05-27 2015-02-17 Google Inc. Predicting engagement in video content
US8442849B2 (en) * 2010-03-12 2013-05-14 Yahoo! Inc. Emotional mapping
US9106958B2 (en) 2011-02-27 2015-08-11 Affectiva, Inc. Video recommendation based on affect
AU2010355789B2 (en) * 2010-06-24 2016-05-12 Arbitron Mobile Oy Network server arrangement for processing non-parametric, multi-dimensional, spatial and temporal human behavior or technical observations measured pervasively, and related method for the same
US8381969B1 (en) * 2011-04-28 2013-02-26 Amazon Technologies, Inc. Method and system for using machine-readable codes to perform a transaction
US10491694B2 (en) * 2013-03-15 2019-11-26 Oath Inc. Method and system for measuring user engagement using click/skip in content stream using a probability model
US20150095111A1 (en) * 2013-09-27 2015-04-02 Sears Brands L.L.C. Method and system for using social media for predictive analytics in available-to-promise systems
WO2015112878A1 (en) * 2014-01-23 2015-07-30 Barnett Samuel Benjamin Method for measuring engagement
US10567838B2 (en) * 2014-10-01 2020-02-18 Adobe Inc. Digital content consumption analysis
US9269374B1 (en) * 2014-10-27 2016-02-23 Mattersight Corporation Predictive video analytics system and methods

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11161670A (ja) * 1997-12-01 1999-06-18 Ntt Data Corp 情報フィルタリング方法、装置及びシステム
JP2000163477A (ja) * 1998-11-27 2000-06-16 Nec Corp 表示広告選択方法
US20080249832A1 (en) * 2007-04-04 2008-10-09 Microsoft Corporation Estimating expected performance of advertisements
US20140040019A1 (en) * 2012-08-03 2014-02-06 Hulu, LLC Predictive video advertising effectiveness analysis
WO2015075035A1 (en) * 2013-11-20 2015-05-28 Realeyes Oü Method of benchmarking media content based on viewer behaviour

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019021175A (ja) * 2017-07-20 2019-02-07 株式会社コラージュ・ゼロ 広告制作支援システム、方法及びプログラム

Also Published As

Publication number Publication date
CN108475381A (zh) 2018-08-31
EP3378025A1 (en) 2018-09-26
US11481791B2 (en) 2022-10-25
US20180330249A1 (en) 2018-11-15
WO2017085168A1 (en) 2017-05-26
GB201520398D0 (en) 2016-01-06
JP6807389B2 (ja) 2021-01-06

Similar Documents

Publication Publication Date Title
JP6807389B2 (ja) メディアコンテンツのパフォーマンスの即時予測のための方法及び装置
JP6260979B1 (ja) 事象評価支援システム、事象評価支援装置、及び事象評価支援プログラム
US11064257B2 (en) System and method for segment relevance detection for digital content
JP7111711B2 (ja) メディアコンテンツ成果の予測のためのデータ処理方法
US9563901B2 (en) Generating audience response metrics and ratings from social interest in time-based media
US20170251262A1 (en) System and Method for Segment Relevance Detection for Digital Content Using Multimodal Correlations
US20130151333A1 (en) Affect based evaluation of advertisement effectiveness
KR20190011829A (ko) 컴퓨터 실행 방법, 시스템 및 컴퓨터 판독 가능 매체
JP6661036B2 (ja) 閲覧者行動に基づいてメディアコンテンツをベンチマークする方法
EP3285222A1 (en) Facilitating television based interaction with social networking tools
US20190297384A1 (en) System and Method for Segment Relevance Detection for Digital Content Using Multimodal Correlations
US20200074481A1 (en) System, method, and device for analyzing media asset data
CN112685596B (zh) 视频推荐方法及装置、终端、存储介质
CN113506124B (zh) 一种智慧商圈中媒体广告投放效果的评价方法
US20190050890A1 (en) Video dotting placement analysis system, analysis method and storage medium
US11812105B2 (en) System and method for collecting data to assess effectiveness of displayed content
KR20220019750A (ko) 인공지능을 이용한 성과 기반 콘텐츠 스타일 추천방법
US20210295186A1 (en) Computer-implemented system and method for collecting feedback
JP2016506553A (ja) オンラインビデオ用の自動化サムネイル選択
CN113569668A (zh) 确定视频中高光片段的方法、介质、装置和计算设备
Turov et al. Digital signage personalization through analysis of the visual information about viewers
JP7267341B2 (ja) 広告評価システム、広告評価方法及び広告評価プログラム
WO2023120263A1 (ja) 情報処理装置及び情報処理方法
US20230177532A1 (en) System and Method for Collecting Data from a User Device
KR20200128220A (ko) 인공지능을 이용한 성과 기반 콘텐츠 스타일 추천방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190927

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200317

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200611

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201110

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201207

R150 Certificate of patent or registration of utility model

Ref document number: 6807389

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250