JP2015512081A - オンラインオーディエンスを測定するシステム、方法及び製造品 - Google Patents

オンラインオーディエンスを測定するシステム、方法及び製造品 Download PDF

Info

Publication number
JP2015512081A
JP2015512081A JP2014554879A JP2014554879A JP2015512081A JP 2015512081 A JP2015512081 A JP 2015512081A JP 2014554879 A JP2014554879 A JP 2014554879A JP 2014554879 A JP2014554879 A JP 2014554879A JP 2015512081 A JP2015512081 A JP 2015512081A
Authority
JP
Japan
Prior art keywords
audience
panelist
data
panelists
panel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014554879A
Other languages
English (en)
Inventor
ジェームス アール. オリヴァー,
ジェームス アール. オリヴァー,
ハーバート エフ. スタックハウス,
ハーバート エフ. スタックハウス,
ピーター シー. ドー,
ピーター シー. ドー,
キャンディ タン,
キャンディ タン,
ミッシェル ハ,
ミッシェル ハ,
Original Assignee
ザ ニールセン カンパニー (ユーエス) エルエルシー
ザ ニールセン カンパニー (ユー エス) エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ザ ニールセン カンパニー (ユーエス) エルエルシー, ザ ニールセン カンパニー (ユー エス) エルエルシー filed Critical ザ ニールセン カンパニー (ユーエス) エルエルシー
Publication of JP2015512081A publication Critical patent/JP2015512081A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0204Market segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0242Determining effectiveness of advertisements
    • G06Q30/0246Traffic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Environmental & Geological Engineering (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

コンテンツ表示サイトにおいてメディアコンテンツをモニタリングする方法及び装置について記載する。例示的な方法は、測定位置でウェブページにアクセスする複数のパネリストに対応するパネリストデータを取得するステップと、パネリストの人口統計学的情報に従ってパネリストデータを分類するステップと、非測定位置におけるウェブページアクセスの推定値に基づいて仮想パネルを生成するステップと、仮想パネルに対応するデータに基づいて非測定位置に関連するページビューデータを分類するステップとを含む。【選択図】 図4

Description

[0002]本開示は、一般に、オーディエンス測定に関し、さらに詳細には、オンラインオーディエンスを測定するシステム、方法及び製造品に関する。
[関連出願]
[0001]本特許は、参照によりその全体を本明細書に組み込む、2012年1月26日出願の米国仮特許出願第61/591263号の優先権を主張するものである。
[0003]パネリストデバイス計測に基づくオンラインオーディエンス測定とウェブサイト/ウェブページのタグ付けに基づくオーディエンス測定は、ウェブトラフィックを測定するという共通の目的を有する。それぞれの場合において、その目的は、ある人があるオンラインメディア要素(例えばコンテンツや広告など)を目にする機会を持つ回数をカウント又は推定することである。この目的には、特定のウェブサイトに接触する総個別オーディエンスを推定することが含まれることもある。
オンラインオーディエンスを測定するように本開示の教示に従って構築された開示する例示的なシステムを示すブロック図である。 図1のハイブリッドオンラインオーディエンス測定システムを実装するために使用することができる例示的なシステムを示すブロック図である。 図2の仮想パネル生成器を実装するための例示的な仮想パネル生成器を示すブロック図である。 ウェブサイトのオンラインオーディエンスを測定するための図1及び/又は図2のハイブリッドオンラインオーディエンス測定システムを実装するために実行することができる、例示的なコンピュータ可読命令を表す流れ図である。 実行時にプロセッサに1組のトラフィックデータのセットから人間以外によるトラフィックをフィルタリングさせる、例示的なコンピュータ可読命令を表す流れ図である。 実行時にプロセッサに非測定位置からのウェブサイトへのアクセスを推定させる、例示的なコンピュータ可読命令を表す流れ図である。 実行時にプロセッサに負の2項分布のパラメータを計算させる、例示的なコンピュータ可読命令を表す流れ図である。 実行時にプロセッサに負の2項分布を計算させる、例示的なコンピュータ可読命令を表す流れ図である。 実行時にプロセッサに非測定位置のオーディエンスを表すパネリストを選択させる、例示的なコンピュータ可読命令を表す流れ図である。 実行時にプロセッサに選択したパネリストを用いて非測定位置のオーディエンスを推定させる、例示的なコンピュータ可読命令を表す流れ図の一部である。 実行時にプロセッサに選択したパネリストを用いて非測定位置のオーディエンスを推定させる、例示的なコンピュータ可読命令を表す流れ図の一部である。 実行時にプロセッサに選択したパネリストを用いて非測定位置のオーディエンスを推定させる、例示的なコンピュータ可読命令を表す流れ図の一部である。 実行時にプロセッサに選択したパネリストを用いて非測定位置のオーディエンスを推定させる、例示的なコンピュータ可読命令を表す流れ図の一部である。 実行時にプロセッサにボリュームメトリックを平滑化させる、例示的なコンピュータ可読命令を表す流れ図である。 実行時にプロセッサにオンラインオーディエンスを計算させる、例示的なコンピュータ可読命令を表す流れ図の一部である。 実行時にプロセッサにオンラインオーディエンスを計算させる、例示的なコンピュータ可読命令を表す流れ図の一部である。 ある曜日のある時間帯の人口統計学的グループの間の例示的なパネルストリーム分布の割合を示す図である。 図14の人口統計学的グループ、時間帯及び曜日のストリームの数の分布を示す図である。 報告期間の図14の人口統計学的グループのうちの例示的な1つについてのセンサスストリームの数の計算を示す図である。 図14の例示的な人口統計学的グループのスケーリングされたセンサスセッションの計算を示す図である。 図4から図13の命令を実行して図1、図2及び/又は図3のシステムを実行することができる例示的なプロセッサプラットフォームを示すブロック図である。
詳細な説明
[0022]本明細書に開示する例示的なシステム、方法、装置及び製造品は、パネルデータ(例えば自身のオンラインブラウズアクティビティをモニタリングされることに同意しているパネリストなど参加者パネルから得られるデータなど)をコアソースデータとして使用する観測的ユーザセントリック手法によってハイブリッドオンラインオーディエンス測定データを生成する。いくつかの例では、パネルデータは、ウェブサイトサーバのウェブページヒット数など、ウェブサイトセントリックなセンサスデータから得られる情報を用いて較正される。本明細書に開示する例示的な観測的ユーザセントリック手法は、既知のオンラインオーディエンス測定システムの弱点を効果的に修正し、任意のウェブサイト上での報告を可能にし、及び/又は以前はセンサスに基づくデータから決定することができなかったパネルデータから入手できる追加の分析論の決定を可能にする。
[0023]本明細書に開示する例示的なシステム、方法、装置及び製造品は、以前は測定されなかった位置(例えば家庭及び仕事環境外の位置など)におけるオーディエンスの接触及び挙動の測定を実現する。このような以前は測定されなかった位置の例としては、複数のユーザが共有するワークコンピュータでの使用、家庭の第2コンピュータ、公共アクセス位置(例えば公共の図書館のコンピュータなど)、モバイルデバイスの使用、及び/又はその他の以前は測定されなかったデバイスなどが挙げられる。非測定位置からのオーディエンスを測定位置からのオーディエンスと結合して、総個別オーディエンスを得る。結合される測定オーディエンス及び非測定オーディエンスは、以前の方法で得られる総個別オンラインオーディエンスより正確である。
[0024]いくつかの例では、参加する発行元及び/又はウェブサイトが、それぞれのコンテンツのソースコード(例えばHTMLコードなど)にタグを挿入する、又は埋め込む。このタグは、そのタグがブラウザで実行されたときにデータ収集機構にページビューを記録させる、Java(登録商標)、Javascript(登録商標)、及び/又はその他の実行可能命令を含むことができる。
[0025]タグは、参照によりその全体を本明細書に組み込む、Blumenauの米国特許第6108637号から周知である。ウェブページを規定するHTMLにタグが埋め込まれること、及び/又はタグがウェブページのHTML中でポインタによって参照されることから、そのタグは、ブラウザが対応するウェブページを描画するときには必ず実行される。通常、タグは、ブラウザに、コンテンツを求める要求をデータ収集機構に送信させる。この要求は、従来のインターネット要求と異なり、通常はコンテンツのダウンロードを求めていないので、「ダミー要求」と考えることもできる。コンテンツのダウンロードを求めるのではなく、このダミー要求は、実際には、オーディエンス測定情報をデータ収集機構に伝達するために使用されている。この目的のために、ダミー要求のペイロードは、データ収集機構が収集、コンパイル及び/又は分析を行う識別情報を搬送する。識別情報は、タグが関連付けられたウェブページ、そのウェブページがアクセスされたユーザデバイス、そのウェブページがアクセスされたブラウザ、ユーザなどを識別することができる。いくつかの例では、データ収集機構は、ダミー要求を受信したのに応答して、要求側ユーザデバイスにクッキーを要求する。いくつかのこのような例では、クッキーが受信されない場合(すなわちデータ収集機構のドメインのクッキーが、現在ユーザデバイスに設定されていない)には、ウェブページの訪問のたびごとにそのデバイスの識別を容易にするようにクッキーを設定する。
[0026]上述のようなタグ付けは、センサスのようなデータの収集を可能にするので有利である。換言すれば、タグ付きのウェブページにアクセスする全てのブラウザは、そのタグに応答してダミー要求を送信するので、そのウェブページへの全てのアクセスが、データ収集機構に知られることになる。さらに、このデータの収集には、特殊なブラウザを使用したり、又はユーザデバイスにおいて特殊な計測ソフトウェアを使用したりする必要がない。逆に、ダミー要求は、従来の市販のブラウザ(例えばFirefox(登録商標)、Microsoft Explorer(登録商標)など)にはインターネットメディアを検索するその他の任意の要求(例えばウェブページの一部として表示するコンテンツ又は広告素材を取得する要求など)のように見えるので、任意のそれらのブラウザが、修正を必要とすることなく、オーディエンス測定プロセスに参加することになる。その結果、タグ付けは、パネリストからも非パネリストからも同じようにこのオーディエンス測定データの収集を可能にする。したがって、上述のようなタグ付け手法によって収集されるデータを、本明細書ではセンサスデータと記す。
[0027]上述のように、パネリストとは、例えばニールセン社(米国)などのオーディエンス測定エンティティによってモニタリングされることに同意している人々である。通常、これらのパネリストは、パネルに参加する登録を行うときに、詳細な人口統計学的情報(例えば、人種、年齢、収入、住所、学齢、性別など)を提供する。さらに、パネリストには、自分のメディア接触を収集するための計測器が与えられる。例えば、参照によりその全体を本明細書に組み込むCoffeyの米国特許第5675510号に開示されるような計測器ソフトウェアを、パネリストのコンピュータ、スマートフォン、タブレット、及び/又はその他のブラウザデバイスにダウンロードすることができる。この計測器は、メディアアクセスアクティビティを示すデータ(例えばウェブサイト名、アクセス日時、クリックストリームデータ、及び/又はパネリストが接触するメディア(例えばウェブページコンテンツ、広告など)を識別するその他の情報)を収集する。このデータは、定期的又は不定期に、データ収集機構にアップロードされる。計測器によって収集されるデータを、本明細書では、「パネリストデータ」と呼ぶ。パネリストデータは、詳細な人口統計学的情報と結合するので有利であるが、これは、パネリストが自分の人口統計を登録の一部として提供しており、したがって計測器が収集したアクティビティデータを人口統計学的情報と関連付けることができるからである。パネリストのユーザデバイスがタグ付きのページにアクセスすると、そのアクセスは、上述のタグ付け機構を介して計測器及びデータ収集機構によってロギングされる。このように、タグ付きのウェブページにアクセスするパネリストが、パネリストデータとセンサスデータの間のブリッジを提供する。
[0028]計測器を介して受信したパネリスト情報、及びタグを介して受信したセンサス情報に基づいて、本明細書に開示する例示的なシステム及び方法は、以下の1つ又は複数の技術を用いて、オンラインオーディエンス測定情報(例えば接触統計、人口統計など)を生成する。(1)センサスに基づくデータにフィルタリング技術を適用して、不要なトラフィックを除去する(例えばウェブページの追加ヒット、ロボットトラフィック、市場外の地理学的位置から発生するトラフィックなどを引き起こすウェブページの自動/プログラム式リフレッシュ)、(2)辞書定義を適用して、観察した挙動、ウェブサイト、ブランド、及び/又はチャネルを分類する、(3)非測定位置からウェブページにアクセスする母集団のサイズ及び/又は人口統計を決定する、並びに(4)測定位置の挙動及び非測定位置の挙動に重みづけして、観察したトラフィックを表現する。
[0029]本明細書に開示するいくつかの例示的な方法は、測定位置でウェブページにアクセスする複数のパネリストに対応するパネリストデータを取得するステップと、パネリストの人口統計学的情報に従ってパネリストデータを分類するステップと、非測定位置におけるウェブページアクセスの推定値に基づいて仮想パネルを生成するステップと、仮想パネルに対応するデータに基づいて非測定位置に関連するページビューデータを分類するステップとを含む。
[0030]本明細書に開示するいくつかの例示的な方法は、第1の推定した特徴に基づいて複数のパネリストに重みを割り当てるステップと、重みに基づいてパネリストのサブセットを選択するステップと、第2の推定した特徴に基づいて選択したパネリストに再重み付けするステップと、選択したパネリストを仮想パネリストとして含む仮想パネルを生成するステップとを含み、仮想パネルについての選択したパネリストから収集したデータは、再重み付けに基づいて重みを割り当てられる。
[0031]本明細書に開示する例示的な装置は、測定位置でウェブページにアクセスする複数のパネリストに対応するパネリストデータを収集するパネルデータ収集器と、非測定位置におけるウェブページアクセスの推定値に基づいて仮想パネルを生成する仮想パネル生成器と、パネリストの人口統計学的情報に従ってパネリストデータを分類し、仮想パネルに対応するデータに基づいて非測定位置に関連するページビューデータを分類するオーディエンス分類器とを備える。
[0032]本明細書に開示する例示的な装置は、第1の推定した特徴に基づいて複数のパネリストに重みを割り当てる標本重み付け器と、重みに基づいてパネリストのサブセットを選択する標本選択器と、第2の推定した特徴に基づいて選択したパネリストに再重み付けし、選択したパネリストを仮想パネリストとして含む仮想パネルを生成する標本再重み付け器とを備え、仮想パネルについての選択したパネリストから収集したデータは、再重み付けに基づいて重みを割り当てられる。
[0033]本明細書で使用する語は、次のような意味を有するものと定義される。
[0034]統一資源ロケータ(URL)パターンは、コンテンツ及び/又は目的の類似性によってまとめて分類される、1組の同様のURLインスタンスのセットである。
[0035]URLインスタンスは、一意的なURLストリングである。URLインスタンスは、そのURLストリングの詳細、そのURLストリング中の引数、及び/又はそのURLを一意的にするURLストリング上のその他の任意の差違に基づいて、URLパターンに属する他のURLインスタンスと異なることもある。
[0036]ページビュー。本明細書では「接触」と交換可能に使用される。消費者又は要求者又はデバイスに提供されている(例えばうまく伝送されている)ウェブページ又はその他のオンラインメディア(例えばコンテンツ、広告、ビデオ、画像、音声など)を指す。提供されているウェブページを消費者又は要求者が実際に見たことを示す何らかの指示がある場合もない場合もある。
[0037]ストリーム。これも「接触」と交換可能に使用される。ストリーミングビデオ及び/又は音声のインスタンスを提供することを指す。様々なタイプのメディアを指すことを除けば、ページビューと同様である。
[0038]セッション。ログオンからログオフまでにインターネット上で費やされる時間、或いは個人による特定の1つ又は複数のウェブサイトの連続的なサーフィン。
[0039]母集合(universe)/母集団(population)。関心のある個人/デバイス/家庭の全体。オンラインの個人/デバイス/家庭のみに限定されることもある。
[0040]センサスに基づくデータ。パネル測定のみに限定されない、タグ又は別の機構に基づいて収集されるデータ。
[0041]パネリスト。自身の行動の1つ又は複数の側面(例えばブラウズアクティビティ、テレビジョンの視聴など)をモニタリングされることに同意している人、又は人の集団。
[0042]パネリストデータ。パネリストに関連付けられた計測器によって収集されるデータ。
[0043]計測器。ユーザの識別及び/又は人(例えばパネリストなど)が接触しているメディアの識別を反映する(又はそうした識別の決定を可能にする)データを収集する任意のタイプ(例えばソフトウェア及び/又はハードウェアなど)のツール。
[0044]メディア。任意のタイプの配信機構を介して配信される任意のタイプのコンテンツ及び/又は広告(例えばウェブページ、テレビジョン、ビデオ、音声など)。
[0045]測定サイト。パネリストデータを収集するために計測器が設置される、ユーザデバイス又は物理的位置(例えば部屋など)。
[0046]非測定サイト。計測器によってモニタリングされないユーザデバイス又は物理的位置。
[0047]測定トラフィック。1又は複数の測定サイトからメディアへの1回又は複数回のアクセス。
[0048]非測定トラフィック。非測定サイトからメディアへの1回又は複数回のアクセス。
[0049]以下のいくつかの例は、簡潔にするためにページビューのみに関連して述べる。しかし、本明細書に開示するいくつかの例は、ビデオストリーム、音声ストリーム、及び/又はその他の任意のタイプの測定可能なオンライントラフィックなど、その他のタイプのメディアにも適用することができる。
[0050]図1は、オンラインオーディエンスを測定するように本開示の教示に従って構築された、開示する例示的なシステム100を示すブロック図である。図1の例示的なシステム100は、回答者又はパネリストのパネルに基づいて測定サイトからオンラインオーディエンストラフィックの測定値を取得し、センサスデータに基づいて非測定サイトからのオンラインオーディエンストラフィックを推定し、測定サイトからの測定トラフィック及び非測定トラフィックの推定値に基づいてウェブサイトの総オンラインオーディエンスを推定する。例示的なシステム100は、さらに、ウェブサイトについての推定総オンラインオーディエンス(例えば測定サイト及び非測定サイトにまたがるものなど)に関する人口統計データを提供することもできる。
[0051]図1の例示的なシステム100は、ハイブリッドオンラインオーディエンス測定システム102と、母集合推定器104と、測定ウェブサーバ106及び108と、ネットワーク110と、オンラインオーディエンスパネル112とを含む。
[0052]図1の例示的なハイブリッドオンラインオーディエンス測定システム102は、パネルに基づくオンラインオーディエンス測定データ、センサスに基づく測定データ、及び調査に基づくオーディエンスデータを取得(例えば受信、検索、収集など)し、特定のメディアのオンラインオーディエンス(サイズ及び/又は人口統計学的組成)を決定する。図1の例示的なハイブリッドオンラインオーディエンス測定システム102は、例示的なウェブサーバ106及び108がサービスするウェブサイトなどの関心のあるウェブサイト、並びに/或いはチャネル、ブランド及び/又は親エンティティに属するウェブサイトの集合体について、指定された報告期間のオンラインオーディエンスを決定することができる。例示的なハイブリッドオンラインオーディエンス測定システム102によって生成されたオンラインオーディエンス測定情報は、ウェブサイトトラフィックの改善、広告スペース購入のためのウェブサイトの分析、広告掲載の値付け、及び/又はその他のオンラインオーディエンス測定情報の用途に使用することができる。
[0053]以下に述べるように、図1の例示的なハイブリッドオンラインオーディエンス測定システム102は、パネルに基づくオーディエンス測定の利点をセンサスに基づくオーディエンス測定の利点と組み合わせることによって、既知のオーディエンス測定システムより正確なオンラインオーディエンスの測定を実現する。例えば、パネルに基づく測定には、人口統計及びその他の有用な統計に関して測定する母集団又は母集合をより正確に表現できるという利点がある。これに対して、センサスに基づくオーディエンス測定には、オンライントラフィックの総量が正確に測定できるという利点がある。
[0054]図1の例示的な母集合推定器104は、オンラインオーディエンスの人口統計、位置及び/又は挙動を含む、オンラインオーディエンスの推定値を生成する。いくつかの例では、母集合推定器104は、オンライン母集団の現在の推定値を提供するための独立及び/又は連続的な列挙研究を提供する。図1の例示的な母集合推定器104は、継続的な四半期ごとのインターネット母集合列挙調査から推定値を生成する。例示的な調査では、リモートデジタルダイヤル(RDD)方式で募集したパネリストの標本を使用して、インターネットユーザのインターネットアクセス情報(例えば訪問したウェブページ、インターネット接続時間など)及び/又は人口統計プロフィル(例えば年齢、性別など)を収集する。図1の例示的な母集合推定器104は、パネリストの測定環境(例えば仕事及び/又は家庭など)以外の位置(例えば複数のユーザが共有するコンピュータでの仕事領域の環境での使用、家庭環境の第2コンピュータ、公共アクセス位置、モバイルでの使用、及び以前は測定されなかったデバイスなどの非測定位置など)におけるオンライン挙動の推定値を含む、インターネットアクセス情報を収集する。非測定位置に対応する挙動を推定することにより、全体の応答速度が向上し、非プロプライエタリなオムニバス調査に関連する可能性がある応答バイアスが減少する。
[0055]図1の例示的なウェブサーバ106及び108は、ネットワーク110(例えばインターネットなど)に通信可能に結合されて、ウェブページ、ビデオストリーム及び/又はその他の要求側デバイスへのウェブトラフィックをサービスする。図1の例示的なシステム100では、ウェブサーバ106及び108は、上記で説明したBlumenauの方法に従って測定のためにタグ付けされているウェブページ及び/又はビデオストリームをサービスする。例えば、ウェブサーバ106及び108は、サービスするウェブページ及び/又はビデオストリームのそれぞれに1つ又は複数のモニタリング命令を含めることによって、サービスするウェブページ及び/又はビデオストリームにタグ付けすることができる。例示的なタグコードは、タグ付けされたウェブページ及び/又はビデオストリームを受信したデバイスに、例示的なハイブリッドオンラインオーディエンス測定システム102(例えばブラウザ情報を格納するデーモン136)、ウェブサーバ106及び/又は108、並びに/或いは別のロギングサーバへの情報をブラウズする命令を実行させる、アクティブなコンテンツ(例えばJavascript命令、Java命令、HTML5命令など)とすることができる。
[0056]図1の例示的なオンラインオーディエンスパネル112は、訪問したウェブページ、ダウンロードしたビデオストリーム、並びに/或いはそれらのウェブページのブラウズ及び/又はビデオストリームの再生に費やした時間の長さなど、パネリスト114のオンラインアクティビティの測定値を提供する。例示的なパネリスト114は、それぞれのコンピュータ116と関連付けられ、それらのコンピュータ116はそれぞれ、パネリスト114がオンラインオーディエンスパネル112のメンバになったときに、オンラインモニタアプリケーション(すなわち計測器118)が与えられる。オンラインモニタアプリケーション118は、それぞれのユーザデバイス116と一意的に関連付けられるので、それらが収集するアクティビティデータは、パネリスト114の人口合計学的特徴にマッピングすることができる。したがって、測定したパネリスト114のアクティビティは、パネリスト114の人口統計学的特徴と相関がある。例示的なオンラインモニタアプリケーション118は、コンピュータ116で受信されたウェブページ及び/又はビデオストリームの統一資源ロケータ(URL)、入力されたキーストローク、カーソルを介してクリックされたアイテム、並びに/或いはパネリスト114がコンピュータ116を用いて実行したその他の任意の1つ又は複数の命令を記録する。例示的なコンピュータ118は、モニタリングするウェブページに埋め込まれたタグ(例えばモニタリング命令など)も実行する。いくつかの例では、タグは、計測器118によって認識される。他の例では、タグはハイブリッドオンラインオーディエンス測定システム102でデーモン136によってロギングされ、計測器118には認識されない。オンラインモニタアプリケーション118は、パネリストのオンラインアクティビティのログを、例示的なハイブリッドオンラインオーディエンス測定システム102に伝送する。これらのログは、一定間隔(例えば毎日、毎週、隔週、毎月など)で伝送してもよいし、オンデマンドで伝送してもよいし、ある事象又は要求に応答して伝送してもよいし、所定の時間に伝送してもよいし、並びに/或いはその他の任意の1つ又は複数のスケジュール及び/又は1つ又は複数の条件に従って伝送してもよい。
[0057]1つ又は複数の計測器118によってモニタリングされるユーザデバイス及び/又は位置を、測定位置と呼ぶ。測定位置は、家庭環境120(例えばパネリストの家庭にあるコンピュータなど)、及び仕事環境122(例えばパネリストの職場にあるコンピュータなど)を含むことができる。所与のパネリスト114のアクティビティは、家庭環境120、仕事環境122、及び/又は家庭環境と仕事環境の両方で測定することができる。仕事によっては計測器118が設置できないので、一部のパネリストは家庭環境のみでモニタリングされ、仕事環境ではモニタリングされない。
[0058]オンラインアクティビティは、家庭環境120及び仕事環境122の外部でも行われる。図1の例示的なシステム100は、非測定位置で行われるオンラインアクティビティを直接は測定しないが、これらのアクティビティにより、追加のページビュー及び/又はビデオストリームが例示的なサーバ106及び108によってサービスされることになる。ウェブトラフィックを生じる可能性があるこのような例示的な非測定位置は、計測器118を備えないコンピュータ124(例えば非パネリストを含む、パネリストと非パネリストを含むなど、複数のユーザ126が共有するコンピュータなど)、家庭環境120の第2(例えば非メインの)コンピュータ128、公共のアクセス位置(例えば図書館、大学など)のコンピュータ132、モバイルデバイス132(例えば携帯電話、スマートフォン、タブレットコンピュータなど)、及び/或いはその他の任意の1つ又は複数のタイプの非測定デバイス(例えばスマートテレビジョン、デジタルメディアプレーヤ、ゲームコンソールなどのインターネット接続機器)を介して仕事環境122で生成されるトラフィックを含む。非測定位置におけるアクティビティ(例えばメディア接触など)は、パネリスト及び/又は非パネリストによって行われる可能性がある。
[0059]図1の例示的なウェブサーバ106及び108は、それぞれのウェブサーバ106及び108によってサービスされるウェブトラフィック(例えばサービスされるウェブページ、サービスされるビデオストリームなど)を測定するサーバモニタ134を含む。図1の例示的なサーバモニタ134は、サーバ106及び108にウェブページ及び/又はビデオストリームを要求しているブラウザ又はその他のアプリケーションの詳細、要求側のIPアドレス、サーバ106及び108における人のブラウズセッションの長さ、並びに/或いはサーバ106及び108が(例えばウェブページを求める要求のロギング及び/又は分析、並びに/或いはクッキーによって)決定することができるその他の任意の情報などの情報を収集する。サーバモニタ134によって収集されたデータは、サーバに基づく、サーバセントリックなデータであると考えられる。サーバセントリックなデータは、制限を有すると考えられる。例えば、このようなサーバ側のデータは、操作(例えばサーバの所有権者、及び/或いはサーバに繰返しデータを要求するようにプログラムされたロボット又はその他のデバイスによる操作など)を受ける。したがって、サーバ側のデータは、ページビューをオーバカウントする可能性がある。ウェブページはユーザデバイスにキャッシュされることが多いので、ウェブページへの2回目以降のアクセスは、サーバに対する要求を含まないこともある。サーバに要求する代わりに、ウェブページは、単にユーザデバイスのローカルキャッシュから取り出す、又は介在するプロキシサーバからサービスすることができる。したがって、サーバ側のデータは、ページビューをさらにアンダーカウントする可能性もある。
[0060]サーバ側のデータにはこのようなオーバカウント及びアンダーカウントの問題がある可能性があるのに対して、タグ付けシステムによって収集されるセンサスデータは、タグ付けされたウェブページへの全てのアクセスが(キャッシュからのものであってもそうでなくても)タグを起動して、ダミー要求が発行され、タグ付けされたウェブページへの接触がロギングされることになるので、正確である。
[0061]図2は、図1のハイブリッドオンラインオーディエンス測定システム102の例示的な実施態様を示すブロック図である。図2の例示的なハイブリッドオンラインオーディエンス測定システム102は、パネルに基づくオンラインアクティビティデータ、オンライン母集団の全体及び/又はサブセットの推定値、並びに/或いは特定の1つ又は複数のウェブサイトのトラフィックのセンサスデータ測定値を含む入力データを取得する。この入力データに基づいて、図2の例示的なハイブリッドオンラインオーディエンス測定システム102は、1つ若しくは複数のウェブサイト、1つ若しくは複数のチャネル、1つ若しくは複数のブランド、1つ若しくは複数の親、及び/又はその他の任意の関心のある組織単位のオンラインオーディエンスを反映するデータの分類並びに/或いは出力を行う。いくつかの例では、ハイブリッドオンラインオーディエンス測定システム102は、特定の報告期間、1つ又は複数の曜日、或いは1日のうちの1つ又は複数の時間帯のオンラインオーディエンスを反映するデータを分類する。
[0062]図2の例示的なハイブリッドオンラインオーディエンス測定システム102は、センサスに基づくデータ収集器202、調査に基づくデータ収集器204、及びパネルデータ収集器206からデータを取得する。例示的なハイブリッドオンラインオーディエンス測定システム102は、ネットワーク(例えば図1のネットワーク110など)を介して、手作業によるデータ入力(例えば調査の回答の入力など)によって、及び/又はその他のデータ受け取り方法を用いることによって、データを取得することもできる。
[0063]図2の例示的なセンサスに基づくデータ収集器202は、センサスに基づくトラフィック情報を受信する。センサスに基づくデータは、例えば、サーバモニタ134によって生成されたサーバログ、デーモン136によって収集されたタグに基づくデータ、及び/又はその他の任意のセンサスデータソースから取得することができる。センサスに基づくトラフィック情報は、タグ付けされたウェブページのタグが実行されることによって発生するセンサスに基づくデータ収集器202に対するダミー要求から収集されるデータ、並びに/或いはウェブページ、セッション測定及び/又はサーバモニタ134が収集することができるその他のトラフィック情報を求める要求を反映するサーバログに基づいてサーバモニタ134によって収集される統計を含むことができる。いくつかの例では、センサスに基づくデータ収集器202は、例示的なデーモン136を実施して、タグ命令の実行に応答して図1のデバイス116、124、128、130、132から受信するデータの収集、構文解析及び/又は格納を行う。
[0064]図2の例示的な調査に基づくデータ収集器204は、(例えば図1の例示的な母集合推定器104からの)オンラインオーディエンスの全体及び/又はサブセットの「母集合推定値」など、調査に基づく挙動情報を受信する。図1及び図2の例では、母集合推定値は、電話で行うこともできる個人インタビューによって得られる。インタビューにより、仕事及び家庭などの測定位置、並びに仕事及び家庭以外などの非測定位置の推定値など、インターネットユーザのインターネットアクセス情報及び人口統計プロフィルが得られる。調査データは、回答者の自分のアクティビティを正確に思い出す能力、及び正直に報告しようとする意思に基づく。
[0065]図2の例示的なパネルデータ収集器206は、(例えば計測器などのモニタリングアプリケーション118によって収集される)パネルアクティビティを表すページビューデータなど、パネリストデータを受信する。パネリストデータは、訪問したウェブサイト(例えばURLなど)、複数のURLを含むセッション、ウェブサイトの要求及び/又はセッションの発生日時を反映するタイムスタンプ、パネリストの人口統計学的特徴、並びに/或いは図1のオンラインモニタアプリケーションによって収集することができるその他の任意の情報を含むことができる。図示の例の例示的なパネルデータ収集器206は、受信したパネリストデータを規則に従ってフィルタリングする。これに加えて、又は別法として、例示的なパネルデータ収集器206は、受信したパネリストデータを、人口統計学的カテゴリ、曜日情報、及び/又は時刻情報に従ってソートして、より精密なデータを得ることができる。
[0066]図2の例示的なパネルデータ収集器206は、母集合に対して決定したパネリストの表現に基づいて、パネリストのウェブサイト要求及び/又はセッションを重み付けする。例えば、母集合の中で第2のパネリストより大きな部分を表す第1のパネリストの挙動は、第2のパネリストのアクティビティより重く重み付けする(例えばより大きな乗数を掛けるなど)。図2の例示的なパネルデータ収集器206は、個々の測定位置についての推定アクティビティと、測定位置全体についての推定アクティビティ(例えば重複している、又は二重になっているオーディエンスエントリを削除することによる)とを決定する。個々のパネリストは、複数の測定位置(例えば家庭と仕事など)でカウントされる可能性があるので、二重になっているように見えるオーディエンスメンバを除去することによって、複数の位置にパネリストが存在することを考慮する。
[0067]図2の例示的なハイブリッドオンラインオーディエンス測定システム102は、センサスに基づくトラフィック情報を処理して、データをクリーニング及び分類する。この目的のために、例示的なハイブリッドオンラインオーディエンス測定システム102は、トラフィックフィルタ208、及びサイト分類器210を含む。
[0068]多くのウェブサイト(例えばウェブサーバ106及び108)は、人間以外、及び/又は間接的な人間のアクティビティ(例えばロボット、ウェブクローラ、ウェブスパイダ、自動ページリフレッシュ、及び/又は人間が意識的又は無意識的にウェブサイトを要求することによって生成されるのではないその他のトラフィックなど)によって生成されたトラフィック(例えばページビューなど)を受信する。例示的なトラフィックフィルタ208は、無関係なデータ及び/又はその他の人間以外のアクティビティをカウントすることを回避するために、センサスに基づく情報(例えばサーバログ及び/又はタグに基づくカウントなど)をクリーニングする。例えば、図2のトラフィックフィルタ208は、既知のユーザエージェント、既知のIPアドレス、及び/又はアクティビティ持続時間しきい値のリストをセンサスに基づく情報に適用して、人間以外のトラフィックを識別し、除去する。既知のユーザエージェント及び/又は既知のIPアドレスのリストは、Interactive Advertizing Bureau(IAB)/Audit Bureau of Circulations Electronic(ABCe) International Spider&Robotから入手することができる。いくつかの例では、トラフィックフィルタ208は、さらにアクティビティに基づくフィルタを適用して、人間以外のトラフィックを検出する。
[0069]図2の例示的なトラフィックフィルタ208は、要求側デバイスのIPアドレスを用いて、センサスに基づくデータを地理学的領域(例えば州、地域、国、大陸など)によってカテゴライズする。したがって、ウェブサーバ106及び108への国際トラフィックは、特定の用途で関心がないものである場合には除去することができる。図2の例示的なトラフィックフィルタ208は、また、自動ウェブページリフレッシュ(例えば同じウェブページの更新版を求める要求を、通常は最初のウェブページの受信後ある程度の間隔をおいて送信させるウェブページコードなど)も除去する。例示的なモニタアプリケーション118はタグを認識するので、例示的なパネルデータ収集器206は、人間が要求したページビューを識別することによってページビュー自動リフレッシュアクティビティを推定し、自動リフレッシュによって生じたページビューを区別することができる。例えば、モニタアプリケーション118(例えば計測器など)は、ブラウザのアクティビティを追跡し、対応するパネリストのアクション(例えばボタンクリック、キーストロークなど)が起こってウェブページリフレッシュを引き起こしたかどうか、及び/又はウェブページソースコード中の命令のブラウザによる実行がウェブページリフレッシュを引き起こすかどうかを判定することによって、ウェブページリフレッシュ(例えばウェブページ要求など)を識別することができる。
[0070]人間によるページビューと自動リフレッシュページビューは、率又は比率に変換することができ、この率又は比率を、図2の例示的なトラフィックフィルタ208がセンサスに基づくトラフィック(例えばページビューなど)に適用して、自動リフレッシュに帰することができるページビューを減少させる、又は除去する。例えば、自動リフレッシュ率は、全ページビューに対する自動リフレッシュによって生成されたページビュー数の比率として、曜日及び時間帯によるURLパターンのパネルに基づくデータから決定することができる。次いで、自動リフレッシュ率又は比率を、選択したURLパターンのセンサスに基づくページビュー(URLページビュー)(例えば他の人間以外及び/又は非人口統計学的な市場トラフィックはクリーニングされているもの)に適用して、調整又はクリーニングしたセンサスに基づくURLページビュー数(調整URLページビュー)を決定する。計算例は、次の数式で表される。調整URLページビュー=URLページビュー×(1−自動リフレッシュ率)
[0071]図2の例示的なサイト分類器210は、フィルタリングされたセンサスに基づくトラフィック情報(例えば関心のあるURLの調整URLページビューなど)を受信し、それらのURL(例えばウェブページ及び/又はビデオストリームなど)をカテゴリ(例えばスポーツ、小売りなど)に分類する。例えば、図2のサイト分類器210は、分類辞書を適用して、カテゴリによるパネリストアクティビティの分類及び/又はモデリングを補助する。例示的なサイト分類器210は、ブランド、親エンティティ、チャネル、インターネットドメイン、インターネットサブドメイン、及び/又はその他の任意の方法など、複数の方法で分類を行う。例えば、親は、複数のブランドを含むこともでき、それらのブランドのそれぞれが複数のチャネルを含むこともできる。
[0072]図2の例示的なハイブリッドオンラインオーディエンス測定システム102は、は、さらに、仮想パネル生成器212を含む。図3は、図2の例示的な仮想パネル生成器212の例示的な実施態様を示すブロック図である。例示的なパネリストデータ及び例示的なセンサスデータを使用して、測定位置(例えば図1の仕事環境120及び家庭環境122など)のオンラインオーディエンスは効果的に推定及び/又は分類することができるが、センサスに基づくトラフィックが、非測定位置から生じるトラフィックの量が増加していることを示すことも多い。例示的な仮想パネル生成器212は、仮想パネルを生成して、従来可能であったよりも正確な非測定位置からのトラフィックの推定を可能にする。例示的な非測定位置としては、仕事環境の共有コンピュータ、家庭環境の第2又は第3のコンピュータ、公共のアクセス位置のコンピュータ、モバイルデバイス、並びに/或いはパネルに基づく方法では測定されない、及び/又は測定不能なその他のデバイスなどが挙げられるが、これらに限定されるわけではない。
[0073]図2の例では、負の2項分布(NBD)計算機214が、非測定位置から1つ又は複数のウェブサイトにアクセスする人数を決定する。負の2項分布は、連続したn個の独立したベルヌーイ試行(各ベルヌーイ試行の結果は、成功か失敗かで定義される)における成功数rの離散的な確率分布である。例示的なNBD計算機214は、「成功」を、パネリストがURLを訪問するかどうかの試行における、特定のパネリストによるURLのページビューと考えることができる。図2の例示的なNBD計算機214は、(例えば測定位置を測定したパネリストデータでは表されない)非測定位置のみからウェブページにアクセスするオーディエンスの特徴(例えばサイズ及び/又は人口統計学的組成など)を決定する。非測定位置のオーディエンスを決定するために、図2の例示的なNBD計算機214は、パネリストデータから決定された複数の人口統計学的グループのそれぞれについての重み付けされたオーディエンス特徴データ、パネリストデータから決定されたそれらの人口統計学的グループのそれぞれについての重み付けされたセッションデータ、トラフィックフィルタ208による処理後にセンサスに基づくデータから決定されたそれらの人口統計学的グループのそれぞれのクリーニング済みセッションの数、及び調査データから決定されたオーディエンスのサイズの母集合推定値を受信する。人口統計学的グループは、母集合又は母集団のサブセットを定義することがある。したがって、図示の例の例示的なNBD計算機214は、複数の人口統計学的グループに対応する複数回のNBD計算を実行する。図2の例示的なNBD計算機214は、NBDプロセスで使用される変数を決定し、それらの変数に基づいて人口統計学的グループのNBDを計算する。NBDを計算する例示的なプロセス(例えばコンピュータ可読命令など)及びNBDへの入力変数については、以下に述べる。
[0074]非測定位置からのみウェブサイトにアクセスする人数が(例えばNBD計算機214から)決定されたら、例示的な仮想パネル生成器は、非測定位置のオーディエンスを表現する仮想パネルを生成する。図2の例示的な仮想パネル生成器212は、測定位置(例えば家庭環境及び仕事環境など)のパネリストのサブセットを選択し、選択したパネリスト(及び対応するオンライン挙動)を複製して非測定位置標本を形成することによって、この仮想パネル(例えば非測定位置標本)を生成する。図2の例では、パネリストの複製版は、複製したパネリストを実際のパネリストとしてシミュレート又は表現する別個の識別子を備える。例示的な仮想パネル生成器212は、非測定位置のオーディエンスの推定人口統計学的分布と同様の人口統計学的組成を有するように、また複製したパネリストのアクティビティが、非測定位置のオーディエンスの調査した挙動を表現するように、このパネリストのサブセットを選択する。例示的な仮想パネル生成器212は、ボリュームターゲット(パネリストデータとセンサスに基づくデータの間の差に基づいて計算されるウェブサイトのページビューの数)に適合するように、複製したパネリストのアクティビティの全て又は一部を選択することができる。
[0075]図3の例示的な仮想パネル生成器212は、標本重み付け器302、標本選択器304、及び標本再重み付け器306を含む。例示的な仮想パネル生成器212は、得られた仮想パネルの選択標本サイズ308(例えば10000メンバなど所望のパネルサイズを反映する動作によって入力される値など)、1つ又は複数の人口統計学的グループの1つ又は複数のオーディエンスターゲット310(例えばセンサスに基づくオーディエンスとパネルに基づくオーディエンス及び/又は非測定位置から生じるページビューの推定数との間の差など)、パネル挙動データ312(例えばオンラインアクティビティなど)、NBD出力314(例えば図2のNBD計算機214による計算結果など)、並びに非測定位置の推定母集合サイズ316を受信する。
[0076]図3の選択標本サイズ308は、仮想パネルを形成するために(例えば標本選択器304によって)選択されるパネリストの数を表す。選択標本サイズ308は、少なくとも人口統計を表現するために必要なパネリスト及び/又は非測定位置からのみウェブページにアクセスするオーディエンス(例えば家庭環境又は仕事環境などの測定位置ではアクティブオンラインではない人など)のアクティビティの数と同じ大きさにすることができる。
[0077]例示的なパネリスト挙動データ312(例えばパネリストデータのサブセットなど)は、仮想パネルについて重み付け及び/又は考慮される各パネリストのアクティビティを表現するデータを含む。図3の例示的な標本重み付け器302及び/又は例示的な標本再重み付け器306は、パネル挙動データ312に反映されるアクティビティを、非測定位置のアクティビティと比較して、それらのパネリストの重みを決定する。
[0078]図3の例示的な1つ又は複数のオーディエンスターゲット310(例えばオーディエンスメンバの予想又は推定数など)は、センサスに基づくオーディエンス推定値(例えばクリーニング済みのセンサスに基づくページビューに基づく1つ又は複数のウェブページの総オーディエンスの推定値など)とパネルに基づくオーディエンス推定値(例えば測定位置のオーディエンスの推定値など)の間の差として計算される。図3のオーディエンスターゲット310は、非測定位置でのみ発生するオンラインアクティビティを行うオーディエンスメンバの推定数又は予想数である。パネルに基づくオーディエンス推定値は、図2のNBD計算機214によって計算される。センサスに基づくオーディエンス推定値は、センサスに基づくウェブトラフィック(例えばページ要求又はインプレッションの数、ビデオストリームの数など)及びパネルに基づくページビューボリューム計算(例えばウェブページ要求又はインプレッション及びパネリストセッションなど)に基づいて計算される。例えば、クリーニング済みのセンサスに基づくデータからあるURLパターンについて決定されるページビューの数を、パネリスト(例えばオーディエンスメンバなど)あたりのページビューの平均数で割って、センサスに基づくデータのオーディエンスメンバの推定数を決定することができる。いくつかの例では、1つ又は複数のオーディエンスターゲット310は、母集団全体の同オーディエンスターゲット、及び人口統計学的サブグループに対応する母集団の個別のサブセットのオーディエンスターゲットを含む。
[0079]非測定位置の母集合サイズ316は、図示の例では、総母集合サイズ(例えば調査から決定される総オンライン母集団など)、及び測定位置の総オーディエンス(例えばパネリストデータから決定される全ての測定位置のオーディエンスなど)に基づいて決定される。図3の例では、非測定位置の母集合サイズ316は、総母集合サイズと測定位置の総オーディエンスとの間の差である。
[0080]図2の例示的な調査に基づくデータ収集器204は、仮想パネル生成器212に、非測定位置からウェブサイトにアクセスする母集団の推定サイズ及び人口統計学的組成を提供する。センサスに基づくデータ収集器202は、センサスに基づくページビュー情報を仮想パネル生成器212に提供し、パネルデータ収集器206は、パネルに基づく情報を仮想パネル生成器212に提供する。パネリストデータ及びセンサスデータは、測定位置からのページビューの推定値とセンサスに基づくデータ収集器202が(例えばサーバモニタ134及び/又はデーモン136を介して)測定したページビューとの間のページビューボリュームの不一致など、非測定位置からのページビューについての案内をサイトごとに提供する。
[0081]仮想パネル(例えば非測定位置標本など)を作成するために、例示的な仮想パネル生成器212は、(例えば標本重み付け器302を介して)各パネリストに重みを適用する、又は割り当てる。標本重み付け器302は、非測定位置のオーディエンスを表現するための例示的なパネリストのそれぞれの所望度又は適応性を表現する重みを生成する。例えば、標本重み付け器302は、人口統計学的ターゲット(例えば非測定位置の推定人口統計など)及び/又はエンティティターゲット(例えばNBD計算機214によって決定される非測定位置の推定個別オーディエンス314、センサスに基づくデータとパネリストデータの間のページビューの推定差など)などのオーディエンスターゲット310に基づいて所望度を決定することができる。Calmar重み付けを用いて、図2の例示的な標本重み付け器302は、パネリストの個別オンラインアクティビティ並びに/或いは人口統計学的ターゲット及び/又はエンティティターゲットと比較した人工統計学的特徴に基づいて、各パネリストに重みを割り当てる。重みは、Calmar重み付けが収束するときに、各パネリストについて決定される。重みは、パネリストが非測定位置の代表的な人をどの程度厳密に表現しているかを指定する。非測定位置からウェブサイトにアクセスする人の推定人口統計学的プロフィル及び/又は挙動プロフィルと類似しているパネリストには、より大きな重みが与えられる。
[0082]重み付け後、図3の例示的な標本選択器304は、無作為選択を用いて、仮想パネルに含めるパネリストの数を選択する。標本重み付け器302によって計算される各パネリストの重みを、選択(又は包含)確率として使用する。大きな重みを有するパネリストは、標本選択器304によって選択される可能性が高い。例示的な仮想パネル生成器212は、例えばFastCube法を用いて、パネリストの数(例えば一定数など)を無作為に選択することができる。選択したパネリスト及び対応する人口統計学的データ、挙動データ及び/又はその他のデータを複製して、パネルの元のパネリストは保持したまま、仮想パネリストを作成する。
[0083]仮想パネリストを選択(例えば生成)した後で、図3の例示的な標本再重み付け器306は、人口統計学的ターゲット及び/又はオーディエンスターゲットと突き合わせて、選択した仮想パネリストに再重み付けする。再重み付けに使用される例示的なターゲットは、非測定位置のオーディエンス及び/又は挙動についてどの程度分かっているかに応じて、第1の重み付け中のものと同じであってもよいし、第1の重み付けに使用したものと異なっていてもよい。例示的な仮想パネル生成器212は、オーディエンスターゲット及び/又は挙動ターゲットを表すこの1組の選択したパネリスト及び対応する重みのセットを含む仮想パネルを出力する。
[0084]例示的なパネリストデータ(例えばパネリストの挙動情報など)、センサスに基づくデータ、及び仮想パネル(例えば仮想パネル用に選択及び/又は複製されたパネリストのパネリストデータなど)は、アクティビティ遂行器216に提供される。図2の例示的なアクティビティ遂行器216は、測定及び非測定のパネルボリュームと測定したセンサスに基づくボリュームとの間の任意の残りのアクティビティを遂行する(任意の残りのアクティビティの起点を推定する)。仮想パネルアクティビティを遂行するために、例示的なアクティビティ遂行器216は、各時間帯の各人口統計学的グループの、センサスに基づくデータ収集器202によって収集されるがパネリストデータ及び仮想パネルでは考慮されないアクティビティを遂行(例えば推定、マッチング)するためのアクティビティ量を決定する。アクティビティの不一致は、測定環境の非測定アクティビティ(例えば家庭環境及び/又は仕事環境内に位置するが計測されないデバイスにおけるアクティビティなど)から生じることもある。その場合、例示的なアクティビティ遂行器216は、パネリストアクティビティのインスタンス(例えばパネリストについてロギングされたページビュー及び/又はビデオストリームのセット、パネリストのオンラインセッションなど)を無作為及び/又は確率的に複製して、アクティビティの差を補償する。
[0085]図2の例示的なアクティビティ遂行器216は、オーディエンス、オーディエンスの人口統計、並びに/或いは測定したURL、測定した同様のURLのセット、測定したブランド、測定したチャネル、測定した親エンティティ、及び/又はその他の任意の測定したエンティティ若しくはサブエンティティについて決定したオーディエンスのアクティビティの報告を生成及び/又は出力する。
[0086]図2の例示的なハイブリッドオンラインオーディエンス測定システム102は、は、さらに、オーディエンス分類器218を含む。例示的なオーディエンス分類器218は、(例えばパネルデータ収集器206からの)測定位置の決定したオーディエンス、及び(例えば仮想パネル生成器212からの)非測定位置の決定したオーディエンス、並びに(例えばアクティビティ遂行器216からの)パネルで表現されていない追加のアクティビティを受信する。例示的なオーディエンス分類器218は、さらに、例示的なセンサスに基づくデータ収集器202からのページビューデータ及び/又はサイト分類器210からのクリーニング済みページビューデータを受信する。図2のオーディエンス分類器218は、(例えば測定位置の)パネリストデータに基づいてページビューデータの第1の部分を分類し、(例えば非測定位置の)仮想パネルに基づいてページビューデータの第2の部分を分類する。ページビューデータの分類は、URL及び/又はエンティティ、時間帯、曜日、並びに/或いはその他の任意の分類の組合せについてオーディエンス及び/又はトラフィックを分類するための統計及び/又は報告を生成することを含むこともある。図2の例示的なオーディエンス分類器218は、報告期間中の1つ又は複数のウェブサイトのオーディエンスを推定する。例えば、図示の例のオーディエンス分類器218は、ウェブサイトの個別オーディエンスメンバの数及びウェブサイトオーディエンスの人口統計を推定する。
[0087]図1のハイブリッドオンラインオーディエンス測定システム102を実施する例示的な様式を図2に示し、図2の仮想パネル生成器212を実施する例示的な様式を図3に示したが、図1から図3に示す要素、プロセス及び/又はデバイスは、そのうちの1つ又は複数を、他の任意の方法で結合、分割、再配列、省略、削除及び/又は実施することができる。さらに、図1、図2及び/又は図3の例示的なハイブリッドオンラインオーディエンス測定システム102、例示的な母集合推定器104、例示的なウェブサーバ106及び108、例示的なモニタリングアプリケーション118、例示的なサーバモニタ134、例示的なセンサスに基づくデータ収集器202、例示的な調査に基づくデータ収集器204、例示的なパネルデータ収集器206、例示的なトラフィックフィルタ208、例示的なサイト分類器210、例示的な仮想パネル生成器212、例示的なNBD計算機214、例示的なアクティビティ遂行器216、例示的なオーディエンス分類器218、例示的な標本重み付け器302、例示的な標本選択器304、例示的な標本再重み付け器306、並びに/或いはさらに一般的に、例示的なシステム100、例示的なオンラインオーディエンス測定システム102、及び/又は例示的な仮想パネル生成器212は、ハードウェア、ソフトウェア、ファームウェア並びに/或いはハードウェア、ソフトウェア及び/又はファームウェアの任意の組合せによって実装することができる。したがって、例えば、例示的なハイブリッドオンラインオーディエンス測定システム102、例示的な母集合推定器104、例示的なウェブサーバ106及び108、例示的なモニタリングアプリケーション118、例示的なサーバモニタ134、例示的なセンサスに基づくデータ収集器202、例示的な調査に基づくデータ収集器204、例示的なパネルデータ収集器206、例示的なトラフィックフィルタ208、例示的なサイト分類器210、例示的な仮想パネル生成器212、例示的なNBD計算機214、例示的なアクティビティ遂行器216、例示的なオーディエンス分類器218、例示的な標本重み付け器302、例示的な標本選択器304、例示的な標本再重み付け器306、並びに/或いはさらに一般的に、例示的なシステム100、例示的なオンラインオーディエンス測定システム102、及び/又は例示的な仮想パネル生成器212はいずれも、1つ又は複数の回路、1つ又は複数のプログラマブルプロセッサ、1つ又は複数の特定用途向け集積回路(ASIC)、1つ又は複数のプログラマブル論理デバイス(PLD)及び/或いは1つ又は複数のフィールドプログラマブル論理デバイス(FPLD)などで実装することもできる。純粋にソフトウェア及び/又はファームウェアの実施態様をカバーする本特許の装置クレーム及び/又はシステムクレームのいずれかを読むときには、例示的なハイブリッドオンラインオーディエンス測定システム102、例示的な母集合推定器104、例示的なウェブサーバ106及び108、例示的なモニタリングアプリケーション118、例示的なサーバモニタ134、例示的なセンサスに基づくデータ収集器202、例示的な調査に基づくデータ収集器204、例示的なパネルデータ収集器206、例示的なトラフィックフィルタ208、例示的なサイト分類器210、例示的な仮想パネル生成器212、例示的なNBD計算機214、例示的なアクティビティ遂行器216、例示的なオーディエンス分類器218、例示的な標本重み付け器302、例示的な標本選択器304、並びに/又は例示的な標本再重み付け器306のうちの少なくとも1つは、この記述により、そのソフトウェア及び/又はファームウェアを格納するメモリ、DVD、CD、Blu−ray(登録商標)などの有形のコンピュータ可読記憶媒体を含むように明白に定義される。さらに、図1、図2及び/又は図3の例示的なシステム100、例示的なハイブリッドオンラインオーディエンス測定システム102、及び/又は例示的な仮想パネル生成器212は、図1、図2及び/又は図3に示す要素、プロセス及び/又はデバイスに加えて、又はそれらの代わりに、1つ又は複数の要素、プロセス及び/又はデバイスを含むことができ、並びに/或いは図示の要素、プロセス及びデバイスのうちのいずれか又は全てを複数含むこともできる。
[0088]図1から図3のハイブリッドオンラインオーディエンス測定システム102を実施する例示的なマシン可読命令を表す流れ図が、図4から図13Bに示してある。これらの例では、マシン可読命令は、図18に関連して以下で述べる例示的な処理プラットフォーム1800に示すプロセッサ1812などのプロセッサによって実行される1つ又は複数のプログラムを含む。プログラムは、CD−ROM、フロッピー(登録商標)ディスク、ハードドライブ、デジタル汎用ディスク(DVD)、Blu−rayディスク、又はプロセッサ1812に関連付けられたメモリなどの有形のコンピュータ可読記憶媒体に格納されるソフトウェアで実施することができるが、別法として、プログラム全体及び/又はその一部を、プロセッサ1812以外のデバイスによって実行し、及び/或いはファームウェア又は専用ハードウェアで実施することもできる。さらに、図4から図13Bに示す流れ図を参照して例示的なプログラムについて述べるが、例示的なハイブリッドオンラインオーディエンス測定システム102及び/又は例示的な仮想パネル生成器212を実施するその他の多くの方法を使用することもできる。例えば、ブロックの実行順序の変更、及び/或いは記載するブロックの一部の変更、削除又は結合を行うことができる。
[0089]上述のように、図4から図13Bの例示的なプロセスは、記憶ドライブ、記憶ディスク、ハードディスクドライブ、フラッシュメモリ、読取り専用メモリ(ROM)、コンパクトディスク(CD)、デジタル汎用ディスク(DVD)、Blu−rayディスク、キャッシュ、ランダムアクセスメモリ(RAM)及び/或いは情報が任意の期間(例えば長期間、永久、短期間、一時バッファリング、及び/又は情報のキャッシュなど)格納されるその他の任意の記憶デバイス又は記憶ディスクなどの有形のコンピュータ可読記憶媒体に格納された符号化命令(例えばコンピュータ可読命令など)を用いて実施することができる。本明細書で使用する「有形のコンピュータ可読記憶媒体」という用語は、任意のタイプのコンピュータ可読記憶デバイス及び/又は記憶ディスクを含み、伝搬信号を排除するものとして明白に定義される。これに加えて、又は別法として、図4から図13Bの例示的なプロセスは、ハードディスクドライブ、フラッシュメモリ、読取り専用メモリ、コンパクトディスク、デジタル汎用ディスク、キャッシュ、ランダムアクセスメモリ及び/或いは情報が任意の期間(例えば長期間、永久、短期間、一時バッファリング、及び/又は情報のキャッシュなど)格納されるその他の任意の記憶デバイス又は記憶ディスクなどの非一時的なコンピュータ可読媒体に格納された符号化命令(例えばコンピュータ可読命令など)を用いて実施することができる。本明細書で使用する「非一時的なコンピュータ可読媒体」という用語は、格納期間にかかわらず任意のタイプのコンピュータ可読記憶デバイス及び/又は記憶ディスクを含み、伝搬信号を排除するものとして明白に定義される。本明細書で使用する「少なくとも」という表現を特許請求の範囲のプリアンブルで移行語として使用するときには、「含む」という用語が非限定であるのと同様に、非限定である。
[0090]図4は、ウェブサイトのオンラインオーディエンスを測定するために図1及び/又は図2のハイブリッドオンラインオーディエンス測定システム102を実施するために実行することができる、例示的なコンピュータ可読命令400を表す流れ図である。
[0091]図4の例示的な命令400は、(例えば図2の調査に基づくデータ収集器204を介して)母集合推定値を取得(例えば受信、収集)するステップを含む(ブロック402)。例示的な母集合推定値は、オンライン母集団の推定値(例えばウェブサイトにアクセスすることができる人の数、又はオンライン母集団の別の定義など)を含む。母集合推定値は、さらに、オンライン母集団の調査した挙動を含むこともできる。
[0092]例示的なハイブリッドオンラインオーディエンス測定システム102は、(例えばセンサスに基づくデータ収集器202を介して)ウェブサイトのサーバセントリックな、又はセンサスに基づくデータを取得する(ブロック404)。センサスに基づくデータは、タグに基づくデータ、及び/又は図1の例示的なサーバモニタ134によって実行されるウェブサイトトラフィックの測定値を含むことができる。例示的なハイブリッドオンラインオーディエンス測定システム102は、(例えばトラフィックフィルタ208を介して)センサスに基づくデータをフィルタリングして、不要なトラフィックを除去する(ブロック406)。不要な(又は非代表的な)トラフィックの例としては、ロボット又はスパイダなどの人間以外によるトラフィック、非代表的な地理学的位置からのトラフィック、及び/又は自動ページリフレッシュによって生じるトラフィックなどが挙げられる。ブロック406を実施するための例示的なコンピュータ可読命令については、図5を参照して後述する。例示的なハイブリッドオンラインオーディエンス測定システム102は、(例えば図2のパネルデータ収集器206を介して)測定位置のパネリストデータを取得する(ブロック408)。例示的なパネリストデータとしては、個別のパネリストについての人口統計学的情報及びオンライン挙動情報などが挙げられる。
[0093]例示的なハイブリッドオンラインオーディエンス測定システム102は、(例えば図2のサイト分類器210を介して)パネリストデータ、センサスに基づくデータ、及び/又は調査に基づくデータ中の1つ又は複数のウェブサイトを分類する(ブロック410)。例えば、サイト分類器210は、分類辞書(例えばスポーツ、小売りなど)を使用して、URL、複数組の同様のURLのセット、チャネル、ブランド、親エンティティ、及び/又はその他の任意のウェブサイトの組織を分類することができる。
[0094]例示的なハイブリッドオンラインオーディエンス測定システム102は、(例えば図2のNBD計算機214を介して)非測定位置からのトラフィック及び/又はオーディエンスを推定する(ブロック412)。例示的なNBD計算機214は、センサスに基づくデータ、パネリストデータ、及び調査に基づくデータに基づいて、非測定位置からのトラフィック及び/又はオーディエンスを推定する。ブロック412を実施するための例示的なコンピュータ可読命令については、図6から図8を参照して後述する。
[0095]例示的なハイブリッドオンラインオーディエンス測定システム102は、(例えば図2の仮想パネル生成器212を介して)非測定位置のオーディエンスの推定値に基づいて仮想パネルを生成する(ブロック414)。例えば、図2の仮想パネル生成器212は、人口統計学的ターゲット、オーディエンスターゲット、及び/又はアクティビティターゲット、並びにパネリストの人口統計学的特徴及び/又はオンライン挙動に基づいて、パネリストデータに含まれるパネリストに重み付けすることができる。例示的な仮想パネル生成器212は、それらの重みに基づいて、仮想パネルに含めるパネリストの数を選択する。ブロック414を実施するための例示的なコンピュータ命令については、図9を参照して後述する。
[0096]例示的なハイブリッドオンラインオーディエンス測定システム102は、(例えば図2の仮想パネル生成器212を介して)選択したパネリストを用いて非測定位置のオーディエンスを推定する(ブロック416)。例えば、仮想パネル生成器212は、ブロック414で選択したパネリストに再重み付けして、人口統計学的ターゲット、オーディエンスターゲット、及び/又はアクティビティターゲットを表現することができる。仮想パネルの再重み付けされたパネリストの組合せが、推定オーディエンスの人口統計学的特徴を含む非測定位置の推定オーディエンスを与えることができる。
[0097]例示的なハイブリッドオンラインオーディエンス測定システム102は、(例えば図2のアクティビティ遂行器216を介して)パネル測定値では表現されていない追加のアクティビティを決定する(ブロック418)。例えば、アクティビティ遂行器216は、ウェブサイトトラフィックのセンサスに基づく測定値とウェブサイトトラフィックのパネルに基づく推定値(例えば測定パネルと仮想パネル)の間の差を決定することができる。例示的なアクティビティ遂行器216は、実際のパネリストアクティビティに基づいて追加のオーディエンスアクティビティを生成及び/又は分類して、この差を表現する。アクティビティの差は、測定位置(例えば家庭環境、仕事環境など)では実行されるがパネルでは測定又は表現されないアクティビティを含むことができる。ブロック418を実施するための例示的なコンピュータ可読命令については、図10A及び図10B並びに/又は図11A及び図11Bを参照して後述する。
[0098]例示的なハイブリッドオンラインオーディエンス測定システム102は、測定位置のオーディエンス、非測定位置のオーディエンス、及び追加のアクティビティを用いて、ウェブサイトの1つ又は複数のオンラインオーディエンスを決定する(ブロック420)。いくつかの例では、ハイブリッドオンラインオーディエンス測定システム102は、オンラインオーディエンスの分類、並びに/或いは人口統計学的グループ、地理学的位置、時間帯、曜日、及び/又はその他の基準など、特定の基準に対応するオンラインオーディエンスの一部分の決定を行う。いくつかの例では、ハイブリッドオンラインオーディエンス測定システム102は、仮想パネルに対応するデータに基づいて、非測定位置に関連するページビューデータを分類する。図4の例示的な命令400は、これで終了することもできるし、及び/又は追加のオンラインオーディエンスを決定するために反復してもよい。
[0099]図5は、実行時にプロセッサに1組のトラフィックデータのセット(例えばページビューデータなど)からトラフィック(例えばページビューなど)をフィルタリングさせる、例示的なコンピュータ可読命令500を表す流れ図である。図5の例示的な命令500は、図2の例示的なトラフィックフィルタ208によって実行して、図4のブロック406を実行することができる。例示的な命令500は、測定ウェブサイトのセンサスに基づくデータ(例えば図1のウェブサーバ106及び108のサーバモニタ134によって生成されるトラフィックログなど)を取得した後で実行される。
[00100]例示的なトラフィックフィルタ208は、人間以外のトラフィックを表す既知のユーザエージェント及び/又はIPアドレスのリストを取得する(ブロック502)。例えば、トラフィックフィルタ208は、IAB/ABCe International Spider&Robot Listを取得することができる。例示的なトラフィックフィルタ208は、センサスに基づくデータ中のURLを選択する(ブロック504)。センサスに基づくデータは、URLについての複数のエントリ(例えばページビュー、ビデオストリームなど)、及び/或いは同じURLパターンに対応するURLの1つ又は複数のバリエーションを有することがある。例示的なトラフィックフィルタ208は、選択したURLについてのセンサスに基づくデータ中のエントリを選択する(ブロック506)。それぞれの例示的なエントリは、要求側デバイスのIPアドレス、デバイスに要求するために使用されたユーザエージェント、ページビューが要求された時間、及び/又はその他の情報など、ページビュー又はビデオストリームについての情報を含む。
[00101]例示的なトラフィックフィルタ208は、選択したエントリのIPアドレス及び/又はユーザエージェントがユーザエージェント及び/又はIPアドレスのリストと一致するかどうかを判定する(ブロック508)。一致がない場合には、例示的なトラフィックフィルタ208は、IPアドレスがオンラインオーディエンス測定値から排除すべき地理学的領域に対応するかどうか(例えば別の国からのトラフィックかどうか)を判定する(ブロック510)。例えば、トラフィックフィルタ208は、選択したエントリのIPアドレスを、IPアドレスから地理学的領域へのマッピングと比較することができる。選択したエントリのIPアドレス及び/又はユーザエージェントが人間以外のIPアドレス及び/又はユーザエージェントのリストと一致する場合(ブロック508)、或いは選択したエントリのIPアドレスが排除された地理学的領域に対応する場合(ブロック510)には、例示的なトラフィックフィルタ208は、その選択したエントリを、センサスに基づくデータから削除する(ブロック512)。いくつかの例では、トラフィックフィルタ208は、選択したエントリがオンラインオーディエンスの決定に使用されないように、アーカイブする、又はその他の方法でマークする。
[00102]選択したエントリを削除した(ブロック512)後で、或いは選択したエントリがIPアドレス及び/又はユーザエージェントのリストと一致せず(ブロック508)、排除された地理学的領域に対応しない(ブロック510)場合には、例示的なトラフィックフィルタは、選択したURL(又はURLパターン)について追加のエントリがあるかどうかを判定する(ブロック514)。追加のエントリがある場合(ブロック514)には、制御がブロック506に戻り、センサスに基づくデータ中の別のエントリを選択する。選択したURLについて追加のエントリがない場合(例えば人間以外によるエントリ及び/又は排除された地理学的領域のエントリが削除されている場合)(ブロック514)には、例示的なトラフィックフィルタ208は、そのURL(又はURLパターン)について利用可能な自動リフレッシュ率があるかどうかを判定する(ブロック516)。例えば、自動リフレッシュ率は、そのURLについて、URLの自動リフレッシュの平均数のパネルに基づく観察に基づいて決定することができる。
[00103]利用可能なリフレッシュ率がある場合(ブロック516)には、例示的なトラフィックフィルタ208は、その自動リフレッシュ率に基づいて、選択したURLについてのいくつかのエントリを削除する(ブロック518)。例えば、トラフィックフィルタ208は、人間による要求1つあたりの自動リフレッシュの平均数に比例する数のそのURLのエントリを削除することができる。エントリを削除した(ブロック518)で、又はそのURLについて利用可能な自動リフレッシュ率データがない場合(ブロック516)には、例示的なトラフィックフィルタ208は、センサスに基づくデータ中に追加のURLがあるかどうかを判定する(ブロック520)。追加のURL(又はURLパターン)がある場合(ブロック520)には、制御がブロック504に戻り、センサスに基づくデータから別のURLを選択する。それ以上URLがない場合(ブロック520)には、図5の例示的な命令500は終了し、制御は図4のブロック408に戻る。
[00104]図6は、実行時にプロセッサに非測定位置からウェブサイトへのアクセスを推定させる、例示的なコンピュータ可読命令600を表す流れ図である。図6の例示的な命令600は、図2の例示的なNBD計算機214によって実行して、図4のブロック412を実施することができる。いくつかの例では、命令600は、NBD計算機214に、非測定位置からのみアクセスする人のオーディエンスを推定させる。
[00105]図2の例示的なNBD計算機214は、NBDパラメータを計算する(ブロック602)。例えば、NBD計算機214は、ポアッソンの条件が存在するかどうかの判定、及び/又は測定する人口統計学的グループのそれぞれについてのNBDプロセスで使用される変数の計算を行うことができる。NBDパラメータを計算するための例示的な命令については、図7を参照して後述する。計算したパラメータを用いて、例示的なNBD計算機214は、それらの人口統計学的グループのNBDを計算する(ブロック604)。NBDを計算するための例示的な命令については、図8を参照して後述する。
[00106]図6の例示的な命令600は、これで終了し、非測定位置からのオーディエンスを含む総オーディエンス推定値を、図2の仮想パネル生成器212及び/又はアクティビティ遂行器216に戻すことができる。制御は、図4のブロック414に戻る。
[00107]図7は、実行時にプロセッサに負の2項分布のパラメータを計算させる例示的なコンピュータ可読命令700を表す流れ図である。図7の例示的な命令700は、図2の例示的なNBD計算機214によって実行して、図6のブロック602を実施することができる。
[00108]例示的なNBD計算機214は、NBDパラメータを決定するための入力を取得する(ブロック702)。NBD計算機214への例示的な入力としては、人口統計学的グループの重み付けされたパネルオーディエンス(Ui)、人口統計学的グループの重み付けされたパネルセッション(Vi)、人口統計学的グループのクリーニング済みサーバセッション(Xi)、及び人口統計学的グループの推定母集合(Yi)などが挙げられる。
[00109]人口統計学的グループの重み付けされたパネルオーディエンスUiは、関心のあるURLについて少なくとも1つのページビューを有する選択された人口統計学的グループ中の人の推定数であり、測定位置の母集合を表すようにスケーリングされている。人口統計学的グループの重み付けされたオーディエンスの例示的な決定については、後述する。人口統計学的グループの重み付けされたパネルセッションViは、パネリストのセッションの推定数であり、測定位置の母集合を表すようにスケーリングされている。人口統計学的グループのクリーニング済みサーバセッションXiの決定については、図13A及び図13Bを参照して後述する。人口統計学的グループの推定母集合Yiは、調査データから決定することができ、関心のある総母集団のうち人口統計学的グループに含まれる人の数を表す。
[00110]これらの入力に基づいて、例示的なNBD計算機214は、人口統計学的グループの母集合中の人1人あたりのパネルセッション(例えばGr=100×Vi/Yi)、人口統計学的グループの母集合中の人1人あたりの調整されたパネルセッション(例えばGp=100×Xi/Yi)、及びページビューがゼロの人の重み付けされた母集団(例えばfr(0)=1−Ui/Yi)を含む、追加情報を計算することができる。
[00111]次いで、例示的なNBD計算機214は、人口統計学的グループの到達率100%(例えば人口統計学的グループの母集合の全てのメンバが報告期間中にウェブサイトを訪れている)及び/又は人口統計学的グループの到達率0%(例えば人口統計学的グループの母集合のメンバが全くウェブサイトを訪れていない)を示している状態から、(必要に応じて)変数を修正する(ブロック704)。例えば、fr(0)=1である場合には、fr(0)を、1よりわずかに小さい数(多生えば0.999など)に変更する。逆に、fr(0)=0である場合には、fr(0)を、0よりわずかに大きい数(例えば0.001など)に変更する。
[00112]例示的なNBD計算機214は、さらに、NBDパラメータの計算に使用する定数「c」の値を決定する(ブロック706)。図7の例では、定数「c」は、c=Gr/(100×ln(fr(0)))となるように計算される。例示的なNBD計算機214は、定数「c」の値が−1以上であるかどうかを判定して、ポアッソン条件が存在するかどうかを判定する(ブロック708)。ポアッソン条件は、人口統計学的グループのメンバがあるウェブサイト又はあるウェブサイトのジャンルを訪れる可能性がしきい値未満であるシナリオを表す。
[00113]ポアッソン条件が存在しない(例えば定数「c」が−1未満である)場合には、例示的なNBD計算機214は、NBDパラメータ「A」を推定する。パラメータ「A」を推定するために、例示的なNBD計算機214は、A=−2×(1+c)と設定する(ブロック710)。例示的なNBD計算機214は、「A」に等しいプレースホルダ変数「B」を設定する(ブロック712)。NBD計算機214は、「A」の以前の値及び定数「C」に基づいてAの更新値を計算する(例えばA=C×(A−(1+A)×LN(1+A))/(1+A+C))(ブロック714)。
[00114]例示的なNBD計算機214は、「A」の値が収束しているかどうか(例えばAの更新値がBのしきい値量以内、又はAの以前の値以内であるかどうか)を判定する(ブロック716)。「A」の値が収束していない場合(ブロック716)には、制御がブロック712に戻り、計算を繰り返す。「A」の値が収束している場合に(ブロック716)には、例示的なNBD計算機214は、第2のNBDパラメータ「k」を設定する(ブロック718)。図7の例では、NBD計算機214は、NBDパラメータk=Gr/(100×A)を設定する。
[00115]例示的なNBD計算機214は、パラメータA’=A×(Xi/Vi)を計算し(ブロック720)、調節したNBDパラメータα=1/A’を計算する(ブロック722)ことにより、クリーニング済みのページビュー及び/又はビデオストリームと整合するようにNBDパラメータAをスケーリングする。
[00116]ポアッソン条件が存在する場合(ブロック708)には、NBDは、1つのパラメータ(λ)を有するポアッソン分布として扱われる。したがって、例示的なNBD計算機214は、NBDパラメータα及びkを計算せず、その代わりに、ポアッソンパラメータλ=Gr/100を計算する(ブロック724)。NBDパラメータα及びkを計算したら(ブロック722)、又はポアッソンパラメータを計算したら(ブロック724)、図7の例示的な命令700は終了し、制御は図6のブロック604に戻る。
[00117]図8は、実行時にプロセッサに負の2項分布を計算させる例示的なコンピュータ可読命令800を表す流れ図である。図8の例示的な命令800は、図2の例示的なNBD計算機214によって実行して、図6のブロック604を実施することができる。図8の例示的なNBD計算は、人口統計について実行される。したがって、例示的なNBD計算機214は、報告期間の間、異なる人口統計学的グループについて命令800を繰り返すことができる。
[00118]図2の例示的なNBD計算機214は、ポアッソン条件が存在するかどうかを判定する(ブロック802)。例えば、NBD計算機214は、NBD計算のためにどの1つ又は複数のパラメータ(例えばポアッソン条件が存在する場合にはλ、ポアッソン条件が存在しない場合にはα及びk)が計算されたかを決定することができる。ポアッソン条件が存在しない場合(ブロック802)には、例示的なNBD計算機214は、人口統計学的グループのスケーリングされた到達率を計算する(ブロック804)。例えば、図2のNBD計算機214は、スケーリングされた到達率100×(1−(α/α+t)))を計算する。ここで、時間変数「t」は、報告期間などの時間単位である(例えばt日など)。時間変数「t」を1に設定すると、個別オーディエンスメンバを、図示の例のクリーニング済みのページビュー及び/又はビデオストリーム(例えば1日のページビュー、1日の報告など)に一致するようにスケーリングすることができる。
[00119]図2の例示的なNBD計算機214は、ゼロ接触(例えばページビュー)の確率を計算する(ブロック806)。例えば、ゼロページビューの確率fp(0)は、fp(0)=(α/(α+t))に従って決定することができる。ここで、時間変数「t」は、1に設定して、個別オーディエンスメンバを、クリーニング済みのページビュー及び/又はビデオストリームに一致するようにスケーリングする。図2の例示的なNBD計算機214は、n≧1についてのページビューの数nの確率を計算する(ブロック808)。例えば、nページビューの確率fp(n)は、fp(n)=((k+n−1)/n)×((t/(α+t))×fp(n−1)に従って決定することができる。ここで、時間変数「t」は、1に設定して、個別オーディエンスメンバを、クリーニング済みのページビュー及び/又はビデオストリームに一致するようにスケーリングする。したがって、ページビューの数の確率fp(n)は、それより少ないページビューの数の確率(fp(n−1),fp(n−x))に基づいている。
[00120]図2の例示的なNBD計算機214は、ページビューの平均数(又は平均頻度)AveFを計算する(ブロック810)。ページビューの平均数は、AveF=kt/αによって決定することができる。ここで、時間変数「t」は、1に設定して、個別オーディエンスメンバを、クリーニング済みのページビュー及び/又はビデオストリームに一致するようにスケーリングする。
[00121]例示的なNBD計算機214は、人口統計学的グループの母集合について、時間「t」の延べ視聴率(GRP(t))を表す人1人あたりのパネルセッションの数を計算する(ブロック812)。人1人あたりのパネルセッションの数は、GRP(t)=t×Grによって決定することができる。ここで、時間変数「t」は、1に設定して、個別オーディエンスメンバを、クリーニング済みのページビュー及び/又はビデオストリームに一致するようにスケーリングする。
[00122]ポアッソン条件が存在する場合(ブロック802)には、例示的なNBD計算機214は、時間tの間の頻度分布fp(i)を決定する(ブロック814)。ここで、「i」は、ページビューの数である。例えば、NBD計算機214は、時間tの間の頻度分布fp(i)(例えばページビューの数の分布など)を、fp(i)=(λt)×e−λt/i!に従って決定することができる(!は、階乗演算子を示す)。
[00123]図2の例示的なNBD計算機214は、t日にわたるスケジュール到達率(百分率で表される)を決定する(ブロック816)。スケーリングされた到達率は、到達率=100×(1−e−λt)に従って決定することができる。図2の例示的なNBD計算機214は、人1人あたりのパネルセッションの数(Gp(t))を決定する(ブロック818)。人1人あたりのパネルセッションの数(Gp(t))は、Gp(t)=t×Grによって決定することができる。
[00124]ポアッソン条件のNBDを実行した(ブロック814から818)後で、又は非ポアッソン条件のNBDを実行した(ブロック804から812)後で、例示的な命令800は終了し、制御は図4のブロック414に戻る。例示的な命令800は、入力変数(例えばXi、Vi、Yi、Uiなど)、1つ又は複数の人口統計学的グループのスケーリングされた到達率、1つ又は複数の人口統計学的グループのn回のページビュー(n≧0)の確率、1つ又は複数の人口統計学的グループのページビューの1つ又は複数の平均数、1つ又は複数の人口統計学的グループの人1人あたりのパネルセッション、及び/或いは1つ又は複数の人口統計学的グループの1つ又は複数の期間についての1つ又は複数の頻度分布など、NBDから決定される計算に戻ることもできる。
[00125]図9は、実行時にプロセッサに非測定位置のオーディエンスを表すパネリストを選択させる例示的なコンピュータ可読命令900を表す流れ図である。例示的な命令900は、図2の例示的な仮想パネル生成器212によって実行して、図4のブロック414を実施することができる。
[00126]図2の例示的な仮想パネル生成器212は、非測定位置に対応するオーディエンスの人口統計学的ターゲットを取得する(ブロック902)。人口統計学的ターゲットは、調査に基づくデータ収集器202から受信することができ、非測定位置の推定人口統計を提供することができる。例示的な標本重み付け器302は、オーディエンスターゲット及びボリュームターゲットを取得する(ブロック904)。例示的なオーディエンスターゲットは、測定位置(例えば家庭環境及び仕事環境など)について報告された個別オーディエンスとNBD計算機214によって決定された推定個別オーディエンス(例えば家庭、仕事、及び非測定環境又は位置など)の間の差である。例示的なボリュームターゲットは、ページビュー(例えばセンサスに基づくデータ収集器202から受信したものなど)及び/又はビデオストリームの報告されたボリュームと、ページビュー及び/又はビデオストリームの平滑化されたボリュームとの間の差であり、非測定位置からのトラフィックによって減量されている。図2の仮想パネル生成器212は、ページビュー及びビデオストリームなどのボリュームメトリックがパレート分布に従うものと仮定する。平滑化されたボリュームを生成するための例示的な命令については、図12を参照して後述する。特定のエンティティのオーディエンスターゲット及びボリュームターゲットが与えられれば、パレート分布の選択した百分位数を計算することによって標本選択のためのボリュームターゲットを生成することができる。いくつかの例では、百分位数を計算する前に、ボリュームメトリックを有限レベルにカテゴライズする。
[00127]例示的な標本重み付け器302は、1つ又は複数の測定位置のパネリストのセットからパネリストを選択する(ブロック906)。パネリストのセットは、例示的なパネルデータ収集器206から取得することができる。例示的な標本重み付け器302は、選択したパネリストの人口統計学的情報及び/又は測定したアクティビティの、非測定位置の母集団のターゲット人口統計及び/又はターゲット挙動への一致度に基づいて、選択したパネリストに重みを割り当てる(ブロック908)。例示的な標本重み付け器302は、重み付けすべき追加のパネリストがあるかどうかを判定する(ブロック910)。追加のパネリストがある場合(ブロック906)には、制御がブロック906に戻り、別のパネリストを選択する。
[00128]重み付けすべき追加のパネリストがない場合(ブロック910)には、例示的な標本選択器304は、パネリストの重みを選択確率に変換する(ブロック912)。例えば、パネリストの重みが大きければ、対応するパネリストの選択確率は高くなる。選択確率に基づいて、例示的な標本選択器304は、パネリストの数を選択する(ブロック914)。いくつかの例では、標本選択器304は、選択確率を用いて無作為にパネリストを選択して、任意の所与のパネリストを無作為に選択する確率を決定する。選択されるパネリストの数は、非測定位置のオーディエンスを表すパネリストの数に基づいて予め決定しておいてもよいし(例えば図3の選択された標本サイズ308など)、及び/又は動的に決定してもよい。
[00129]標本再重み付け器306は、選択したパネリストに再重み付けする(ブロック916)。再重み付けは、ブロック908で行う重み付けと同様又は同じであってもよいし、及び/或いは同様又は同じ要因に基づいていてもよい。再重み付けにより、選択したパネリストは、非測定位置のオーディエンスの人口統計、オーディエンスターゲット及び/又はボリュームターゲットを、より厳密に表すようになる。例示的な命令900は、これで終了することができ、制御は図4のブロック416に戻る。
[00130]図10A及び図10Bは、実行時にプロセッサに確率に基づく方法を用いて追加のアクティビティを遂行させる例示的なコンピュータ可読命令1000を表す流れ図である。例示的な命令1000を実行して、図2の例示的なアクティビティ遂行器216を実施して、図4のブロック418を実行することができる。
[00131]図2の例示的なアクティビティ遂行器216は、パネルに基づくボリューム(例えばウェブページビュー、ビデオストリームなど)を、センサスに基づくボリュームと比較して、センサスに基づくデータとパネルに基づくデータの間のボリュームのギャップを埋めるためにどのくらいのアクティビティが必要かを決定する(ブロック1002)。例示的なパネルに基づくボリュームは、測定位置及び非測定位置からのパネルのアクティビティ(例えば実際のパネリストデータ及び仮想パネルデータ)に基づく。例示的なアクティビティ遂行器216は、URLパターンのリストから(例えばサーバ106及び108に要求され、並びに/又はサーバ106及び108から提供されるURL及び/又はURLパターンのセンサスに基づくリストから)URLパターンを選択する。いくつかの例では、図1及び/又は図2のアクティビティ遂行器216及び/又はサーバモニタ134は、URLの複数のインスタンスをURLパターンに集約する。
[00132]例示的なアクティビティ遂行器216は、時間帯と人口統計学的グループの組合せを選択する(ブロック1006)。例示的な時間帯のカテゴリを、以下の表1に示す。例示的な人口統計学的グループ(例えば性別/年齢カテゴリなど)を、以下の表2に示す。人口統計学的グループは、追加及び/又は代替の区別を含むこともできる。図2の例示的なアクティビティ遂行器216は、例示的な時間帯カテゴリのうちの1つ、及び例示的な人口統計学的グループのうちの1つを選択する。
Figure 2015512081

Figure 2015512081
[00133]図2の例示的なアクティビティ遂行器216は、選択したグループの(例えば測定位置の)重み付けした測定パネルボリュームを、変数Aとして計算する(ブロック1008)。例示的な変数Aは、時間帯中のトラフィックを推定することによって、並びにパネリストデータから選択した性別及び年齢のグループによって決定することができる。このデータは、測定位置のオーディエンスを表すように、仮想パネルデータと突き合わせて重み付けされ、測定位置から選択したグループからのページビューのボリュームを予測することができる。アクティビティ遂行器216は、選択したグループの(例えば測定位置の)重み付けされた仮想パネルボリュームを、変数Bとして計算する(ブロック1010)。例示的な変数Bは、仮想パネルデータから選択した性別グループによる時間帯中のトラフィックを推定することによって決定することができる。例示的な仮想パネルデータは、非測定位置のオーディエンスを表すように、パネリストデータと突き合わせて重み付けされ、非測定位置からの選択したグループからのページビューのボリュームを予測することができる。アクティビティ遂行器216は、選択したグループの総サーバページビューボリュームを、変数Cとして計算する(ブロック1012)。例示的な変数Cは、選択した時間帯中のセンサスに基づくページビューボリューム全体のうち、選択した人口統計学的グループに帰することができる推定部分とすることができる。
[00134]図2の例示的なアクティビティ遂行器216は、選択した時間帯、人口統計学的グループ、及びURLパターンについてのアクティビティ複製確率を計算する(ブロック1014)。例示的なアクティビティ複製確率は、(例えばブロック1008から1012で得られる)変数A、B及びCから、(C−A−B)/A×100%として決定することができる。
[00135]例示的なアクティビティ遂行器216は、処理すべき追加のカテゴリがあるかどうかを判定する(ブロック1016)。追加のカテゴリがある場合には、制御はブロック1006に戻って、別の時間帯及び人口統計学的グループを選択する。選択したURLパターンについて追加のカテゴリがない場合(ブロック1016)には、例示的なアクティビティ遂行器216は、処理すべき追加のURLパターンがあるかどうかを判定する(ブロック1018)。追加のURLパターンがある場合(ブロック1018)には、制御はブロック1004に戻って、別のURLパターンを選択する。
[00136]追加のURLパターンがない場合(ブロック1018)には、例示的なオーディエンス分類器は、URLパターン、時間帯カテゴリ及び人口統計学的グループの各組合せについての複製確率を指定する確率参照テーブルを生成する(ブロック1020)。
[00137]図10Bを参照すると、図2の例示的なアクティビティ遂行器216は、URLインスタンス(例えばページビューURL、ビデオストリームURLなど)を選択する(ブロック1022)。URLインスタンスは、パネルのアクティビティ及び/又は仮想パネルのアクティビティの表から選択することができる。アクティビティ遂行器216は、選択したURLインスタンスの時間帯及び人口統計学的グループに基づいて、そのURLインスタンスが属するURLパターンの参照テーブルから複製確率を取り出す(ブロック1024)。アクティビティ遂行器216は、複製確率が1(例えば100%)未満であるかどうかを判定する(ブロック1026)。例えば、パネルのアクティビティがその時間帯及び人口統計学的グループの総サーバボリュームの大きな部分を構成している場合には、複製確率は1未満である可能性がある。
[00138]複製確率が1以上である場合(ブロック1026)には、例示的なアクティビティ遂行器216は、選択したインスタンスを複製し、表中のそのURLパターンの複製確率を1だけ減少させる(ブロック1028)。選択したインスタンスを複製することにより、同じインスタンスが生成される。複製確率が1未満である場合(ブロック1026)には、例示的なアクティビティ遂行器216は、0から1の間の一様分布を有する乱数を生成する(ブロック1030)。生成された乱数が複製確率以下である場合(ブロック1032)には、例示的なアクティビティ遂行器216は、選択したインスタンスを複製する(ブロック1034)。
[00139]アクティビティ遂行器216がインスタンスを複製する場合(ブロック1028又はブロック1034)には、例示的なオーディエンス分類器は、そのインスタンスが含まれるセッション全体を複製する(ブロック1036)。セッションの複製により、そのセッション中の全てのインスタンスが複製される(選択したインスタンスが2回複製されることはない)。セッションを複製した(ブロック1036)後、又はインスタンスが複製されない場合(ブロック1032)には、例示的なオーディエンス分類器は、パネルのアクティビティ及び/又は仮想パネルのアクティビティの表中に追加のインスタンスがあるかどうかを判定する(ブロック1038)。追加のインスタンスがある場合(ブロック1038)には、制御はブロック1022に戻って、別のインスタンスを選択する。
[00140]追加のインスタンスがない場合(ブロック1038)には、図10Aから図10Bの例示的な命令は終了することができ、制御は、図4のブロック420に戻る。例示的なアクティビティ遂行器216は、命令1000によって生成された追加のアクティビティのリスト、並びに/或いはパネルに基づくアクティビティ、仮想パネルに基づくアクティビティ、及び命令1000によって生成された追加のアクティビティを含む更新されたアクティビティのリストを戻すことができる。
[00141]図11は、実行時にプロセッサにスケーリングに基づく方法を用いて追加のアクティビティを遂行させる、例示的なコンピュータ可読命令1100を表す流れ図である。図11の例示的なスケーリングに基づく方法は、パネルセッションを複製することによって表に行を追加するのではなく、「ミッシング(missing)」アクティビティのスケーリングファクタを計算することにより、図10Aから図10Bの確率に基づく方法とは異なる。例示的な命令1100を実行して、図2の例示的なアクティビティ遂行器216を実施して、図4のブロック418を実行することができる。
[00142]図2の例示的なアクティビティ遂行器216は、パネルに基づくボリューム(例えばウェブページビュー、ビデオストリームなど)を、センサスに基づくボリュームと比較して、センサスに基づくデータとパネルに基づくデータの間のボリュームのギャップを埋めるためにはどの程度のアクティビティが必要かを決定する(ブロック1102)。例示的なパネルに基づくボリュームは、測定位置及び非測定位置からのパネルのアクティビティ(例えば実際のパネリストデータ及び仮想パネルデータ)に基づく。例示的なアクティビティ遂行器216は、URLパターンのリストから(例えばサーバ106及び108に要求され、並びに/又はサーバ106及び108から提供されるURL及び/又はURLパターンのセンサスに基づくリストから)URLパターンを選択する(ブロック1104)。いくつかの例では、図1及び/又は図2のアクティビティ遂行器216及び/又はサーバモニタ134は、URLの複数のインスタンスをURLパターンに集約する。
[00143]例示的なアクティビティ遂行器216は、時間帯と人口統計学的グループの組合せを選択する(ブロック1106)。例示的な時間帯のカテゴリは、上記の表1に示す。例示的な人口統計学的グループ(例えば性別/年齢カテゴリなど)は、上記の図2に示す。図2の例示的なアクティビティ遂行器216は、例示的な時間帯カテゴリのうちの1つ、及び例示的な人口統計学的グループのうちの1つを選択する。
[00144]図2の例示的なアクティビティ遂行器216は、選択したグループの(例えば測定位置の)重み付けした測定パネルボリュームを、変数Aとして計算する(ブロック1108)。例示的な変数Aは、パネリストデータから選択した性別及び年齢のグループによる時間帯中のトラフィックを推定することによって決定することができる。このデータは、測定位置のオーディエンスを表すように、仮想パネルデータと突き合わせて重み付けされ、測定位置からの選択したグループからのページビューのボリュームを予測することができる。アクティビティ遂行器216は、選択したグループの(例えば測定位置の)重み付けされた仮想パネルボリュームを、変数Bとして計算する(ブロック1110)。例示的な変数Bは、仮想パネルデータから選択した性別グループによる時間帯中のトラフィックを推定することによって決定することができる。例示的な仮想パネルデータは、非測定位置のオーディエンスを表すように、パネリストと突き合わせて重み付けされ、非測定位置からの選択したグループからのページビューのボリュームを予測することができる。アクティビティ遂行器216は、選択したグループの総センサスページビューボリュームを、変数Cとして計算する(ブロック1112)。例示的な変数Cは、選択した時間帯中のセンサスに基づくページビューボリューム全体のうち、選択した人口統計学的グループに帰することができる推定部分とすることができる。
[00145]図2の例示的なアクティビティ遂行器216は、選択した時間帯、人口統計学的グループ、及びURLパターンについてのスケーリングファクタを計算する(ブロック1114)。例示的なアクティビティ複製確率は、(例えばブロック1108から1112で得られる)変数A、B及びCから、(C−A−B)/A×100%として決定することができる。
[00146]例示的なアクティビティ遂行器216は、処理すべき追加のカテゴリがあるかどうかを判定する(ブロック1116)。追加のカテゴリがある場合には、制御はブロック1106に戻って、別の時間帯及び人口統計学的グループを選択する。選択したURLパターンについて追加のカテゴリがない場合(ブロック1116)には、例示的なアクティビティ遂行器216は、処理すべき追加のURLパターンがあるかどうかを判定する(ブロック1118)。追加のURLパターンがある場合(ブロック1118)には、制御はブロック1004に戻って、別のURLパターンを選択する。
[00147]追加のURLパターンがない場合(ブロック1118)には、例示的なオーディエンス分類器は、URLパターン、時間帯カテゴリ及び人口統計学的グループの各組合せについての複製確率を指定する確率参照テーブルを生成する(ブロック1120)。
[00148]図11Bを参照すると、図2の例示的なアクティビティ遂行器216は、URLパターン、時間帯カテゴリ及び人口統計学的グループの各組合せのスケーリングファクタを含むスケーリングファクタ参照テーブルを生成する(ブロック1122)。図2の例示的なアクティビティ遂行器216は、URLインスタンス(例えばページビューURL、ビデオストリームURLなど)を選択する(ブロック1124)。選択したインスタンスが属するURLパターンに基づいて、例示的なアクティビティ遂行器216は、その時間帯及びそのURLインスタンスの人口統計学的グループについて参照テーブルからスケーリングファクタを取り出す(ブロック1126)。
[00149]アクティビティ遂行器216は、このスケーリングファクタをインスタンスに適用する(ブロック1128)。例えば、アクティビティ遂行器216は、インスタンスにスケーリング値を適用して、そのインスタンスに対応するページビュー又はストリームの数をスケーリングすることができる。選択したインスタンスのスケーリングされた値は、必ずしも整数であるとは限らない。例示的なアクティビティ遂行器216は、追加のインスタンスがあるかどうかを判定する(ブロック1130)。追加のインスタンスがある場合には(ブロック1130)、制御はブロック1124に戻って、別のインスタンスを選択する。
[00150]追加のインスタンスがない場合(ブロック1130)には、命令1100は終了することができ、制御は、図4のブロック420に戻る。例示的なアクティビティ遂行器216は、命令1100によって生成された追加のアクティビティのリスト、並びに/或いはパネルに基づくアクティビティ、仮想パネルに基づくアクティビティ、及び命令1100によって生成された追加のアクティビティを含む更新されたアクティビティのリストを戻すことができる。
[00151]図12は、実行時にプロセッサに平滑化されたボリュームメトリックを計算させる、例示的なコンピュータ可読命令を表す流れ図である。図12の例示的な命令は、ボリュームターゲットの決定(例えば図9のブロック904)の一部として実行することができる。
[00152]図3の例示的な標本重み付け器302は、URLパターン、時間帯、及び曜日の各組合せについていくつかのセンサスで測定されたページビューを決定する(ブロック1202)。例えば、サーバモニタ134及び/又はデーモン136が、あるURLパターンが月曜日の午後1時23分45秒に120万のページビューを有していたことを示すデータを提供することがある。例示的な標本重み付け器302は、URLパターン、時間帯、曜日及び人口統計学的グループの各組合せについて、センサスで測定されたページビューの平均を計算する(ブロック1204)。例えば、標本重み付け器302は、(例えばセンサスに基づくデータ収集器202を介して)センサスデータから、直前の4週間の月曜日の午後1時23分45秒を含む時間帯のURLパターンのセンサスページビューの平均が800,000ページビューであると決定する。
[00153]標本重み付け器302は、URLパターン、時間帯、曜日及び人口統計学的グループの各組合せについて、パネルに基づくページビューの平均を決定する(ブロック1206)。例えば、パネルに基づくデータから、人口統計学的グループ「男性18〜24才」が、直前の4週間の月曜日の午後1時23分45秒を含む時間帯について、60,000ページビューであると決定されることがある。標本重み付け器302は、その選択した人口統計学的グループの非測定位置ファクタを決定する(ブロック1208)。例えば、URLパターンに関係する例示的なジャンルの「男性18〜24才」の非測定位置ファクタは、1.1である。
[00154]例示的な標本重み付け器302は、人口統計学的グループ、時間帯、及び曜日の各組合せについて、平滑化されたボリュームメトリックを計算する(ブロック1210)。標本重み付け器302は、平滑化されたボリュームメトリック=Fi×Pi×S/Tに従って、平滑化されたボリュームメトリックを決定する。午後1時23分45秒を含む月曜日の時間帯についての「男性18〜24才」の例示的な平滑化されたページビューは、(1.1×60000×1200000)/800000である。例示的な命令1200は、これで終了することができ、制御は図9のブロック906に戻る。
[00155]図13は、実行時にプロセッサにNBD計算のための入力を計算させる、例示的なコンピュータ可読命令1300を表す流れ図である。例示的な命令1300は、図2の例示的なNBD計算機214によって実行して、図7のブロック702を実行することができる。命令1300を実行するために、NBD計算機214は、入力として、(例えば図2のパネルデータ収集器206からの)重み付けされたパネルアクティビティ、(例えば図2のセンサスに基づくデータ収集器202からの)センサスページビュー及び/又はビデオストリームの測定値、並びにURLパターン、チャネル、ブランド及び/又は親のリストを受信する。
[00156]NBD計算機214は、(例えば測定対象のURLパターンのリストから)URLパターンを選択する(ブロック1302)。NBD計算機214は、曜日及び/又は時間帯による選択したURLパターンのページビューの人口統計学的分布を計算する(ブロック1304)。ページビューの人口統計学的分布は、その曜日及び/又は時間帯の間の人口統計学的グループあたりの選択したURLパターンのページビューの割合を決定する。ページビューの人口統計学的分布は、以下の数式を用いて決定することができる。すなわち、パネルストリーム分布%=(時間帯及び/又は曜日の人口統計学的グループの重み付けしたパネル測定ページビュー)/(同じ時間帯及び/又は曜日の全ての人口統計学的グループの重み付けされたパネル測定ページビュー)。
[00157]図14は、例示的な選択したURLパターン、曜日1402、及び時間帯1404についての例示的な人口統計学的分布1400を示す図である。この例示的な人口統計学的分布は、このURLパターンについて、残りの時間帯と曜日の組合せについても生成することができる。この例示的な人口統計学的分布は、1組の人口統計学的グループ1408のそれぞれについて、URLパターン、曜日1402及び時間帯1404の選択した組合せについてのページビュー1406を示している。ページビュー1406は、(例えばパネルデータ収集器206によって収集される)重み付けされたパネルの測定によって決定される。人口統計学的分布、又はパネルページビュー分布1410(%)は、対応する曜日1402及び時間帯1404の対応する人口統計学的グループ1408からのページビューの割合を表す。
[00158]図13Aに戻って、NBD計算機214は、調節されたセンサスページビューに各曜日及び時間帯の人口統計分布を掛けることによって、調節された(例えばクリーニング済みの)センサスページビューを人口統計グループに分散させる(ブロック1306)。調節されたセンサスページビューは、図2のセンサスに基づくデータ収集器202から得られる。人口統計学的分布は、ブロック1304で決定したパネルストリーム分布1410から得られる。図15は、図14の人口統計学的グループ、時間帯及び曜日についてのストリームの数の分布1500を示す図である。図15の例示的な分布1500は、図14の曜日1402、時間帯1404、人口統計学的グループ1408、及びパネルページビュー分布1410を含む。分布1500は、さらに、曜日1402及び時間帯1404についてのいくつかの調節されたセンサスページビューの数1502を含む。例示的なNBD計算機214は、対応する調節されたセンサスページビュー1502に対応するパネルページビュー分布1410を掛けることによって、曜日1402及び時間帯1404についての各人口統計グループ1408についてのセンサスで測定されたページビューの算出数1504を決定する。
[00159]図13Aに戻って、例示的なNBD計算機214は、追加のURLパターンがあるかどうかを判定する(ブロック1308)。追加のパターンがある場合(ブロック1308)には、制御はブロック1302に戻り、別のURLパターンを選択する。調整されたセンサスで測定されたページビューを決定する追加のURLパターンがない場合(ブロック1308)には、例示的なNBD計算機214は、チャネル、ブランド又は親を選択する(ブロック1310)。チャネル、ブランド又は親の選択は、測定を行おうとするエンティティに基づいていてもよい。例示的なNBD計算機214は、人口統計学的グループ(例えば図14及び/又は図15の人口統計学的グループ1408のうちの1つなど)を選択する(ブロック1312)。
[00160]例示的なNBD計算機214は、URLパターンを、選択した人口統計学的グループの選択したチャネル、ブランド及び/又は親に集約する(ブロック1314)。例えば、NBD計算機214は、選択したエンティティに属する複数のURLパターンからのセンサスで測定されたページビューを合計することもできる。NBD計算機214は、報告期間全体からのページビューを、選択したグループの時間帯及び/又は曜日に集約する(ブロック1316)。報告期間は、選択した時刻、日、週、月又はその他の任意の報告期間のページビューなど、指定又は要求された報告期間とすることができる。図16は、報告期間の間の図14の人口統計学的グループ1408のうちの例示的な1つについての集約されたセンサスで測定されたページビューの数を示している。集約されたセンサスで測定されたページビューの例示的な数は、図13Aのブロック1314及び1316で実行される集約を表すことができる。
[00161]集約されたページビューの例示的な数1602が、図14及び/又は図15の例示的な曜日1402及び時間帯1404、並びに図14及び/又は図15には示していない曜日及び時間帯のそれぞれについて示してある。図16の例では、第1の人口統計学的グループ(例えば図14及び/又は図15の14個の例示的なグループのうちのグループ1)は、指定された報告期間中の第3の曜日の第1の時間帯の間に、選択したチャネル、ブランド及び/又は親について、ページビュー(例えば選択したチャネル、ブランド及び/又は親に属するURLパターンなど)が21,305回であるとされている。
[00162]図13Aに戻って、例示的なNBD計算機214は、選択したグループ並びに選択したチャネル、ブランド及び/又は親についての重み付けされたパネルセッションを集約する(ブロック1318)。例示的な重み付けされたパネルセッションは、図2のパネルデータ収集器206から得られる。これらのセッションを集約して、選択した人口統計学的グループについて、全ての時間帯及び曜日を含む選択した報告期間中に起こるセッションを表すこともできる。
[00163]図13Bを参照すると、例示的なNBD計算機214は、スケーリングされたセンサスセッションの数を計算する(ブロック1320)。例えば、NBD計算機214は、計算したセンサスページビューと重み付けされたパネルページビューの比、及び重み付けされたパネルセッションの集約数を用いて、スケーリングされたセンサスセッションの数を計算することができる。以下の数式を使用して、選択した人口統計学的グループ並びにチャネル、ブランド及び/又は親についてのスケーリングされたセンサスセッションを計算することができる。
Figure 2015512081
[00164]スケーリングされたセンサスセッションを決定するその他の方法を使用することもできる。例示的な数式では、センサスに基づくページビューに対するパネルに基づくページビューの比を使用して、パネルに基づくセッション数からセンサスセッションの数を決定する。図17は、図14から図16の例示的な人口統計学的グループ1408の例示的な計算したスケーリングされたセンサスセッション1702を示す図である。例示的なスケーリングされたセンサスセッション1702は、(例えばパネルに基づくデータ収集器206から得られる)重み付けされたパネルページビューの数1704、(例えば図13Aのブロック1316で計算する、図16の計算したページビュー1602から得られる)計算したセンサスページビューの数1706、及び(例えばパネルに基づくデータ収集器206から得られる)重み付けされたパネルセッションの数1708に基づいて、例示的な人口統計学的グループについて計算される。なお、図16に示す計算したセンサスページビュー1602の例示的な総数が、例示のために人口統計学的グループ1について図17に示す計算したセンサスページビュー1706と異なっているが、例示的な計算したセンサスページビュー1706は、ブロック1316で決定される計算したセンサスページビュー1602の総数として得ることもできることに留意されたい。図17に示すように、人口統計学的グループ2のスケーリングされたセンサスセッションは、18130627=6989826×(72732430/28040233)として計算される(例、端数は切り捨てる)。
[00165]図13Bに戻って、例示的なNBD計算機214は、選択したチャネル、ブランド及び/又は親に属し、センサスに基づくデータとパネルに基づくデータの間で一致するパネル結合オーディエンス(例えば測定位置のオーディエンス)を取り出す(ブロック1322)。URLパターンは、図13Aから図13Bの例では、そのURLパターンがセンサスで測定され(例えばサーバモニタ134及び/又はデーモン136)、且つパネルのメンバが訪れた場合に、一致すると考えられる。オーディエンスの重複を含む全ての測定位置(例えば図1の家庭環境120及び仕事環境122など)の総オーディエンスである、例示的なパネル結合オーディエンスは、例示的なパネルに基づくデータ収集器206から取り出すことができる。パネルに基づくデータ収集器206は、例えばパネルが表す母集団を表すようにパネリストデータに重み付けし、その母集団からオーディエンスの推定値を特定するようにパネルオーディエンスを補外することによって、パネル結合オーディエンスを決定する。
[00166]例示的なNBD計算機214は、選択したブランド、チャネル及び/又は親の複製ファクタがあるがどうかを判定する(ブロック1324)。複製ファクタは、異なる測定位置の間のオーディエンスの重複(例えば百分率、比率など)(例えば、家庭環境及び仕事環境の両方で測定され、複数の個別オーディエンスメンバとしてカウントされるオーディエンスメンバなど)を表す。複製ファクタは、例示的なパネルに基づくデータ収集器206から得ることができる。利用できる複製ファクタがない場合(ブロック1324)には、例示的なNBD計算機214は、人口統計学的グループのパネル結合オーディエンスとして、取り出したパネル結合オーディエンスを使用する(ブロック1326)。
[00167]複製ファクタがある場合(ブロック1324)には、例示的なNBD計算機は、選択したブランド、チャネル及び/又は親の複製ファクタを取り出し(ブロック1328)、測定位置及び選択したグループについての重み付けされたオーディエンスを計算する(ブロック1330)。ブロック1330で計算する重み付けされたオーディエンスは、それらのURLがセンサスに基づくデータと一致するかどうかにかかわらず、選択したチャネル、ブランド及び/又は親の任意のURLのオーディエンスを使用する。NBD計算機は、選択したチャネル、ブランド及び/又は親、並びに選択したグループについての調節された結合オーディエンスを計算する(ブロック1332)。調節された結合オーディエンスを計算するための例示的な数式は、以下の通りである。
Figure 2015512081

ここで、測定位置のオーディエンスは、各測定位置(例えば家庭環境及び仕事環境など)のパネルを介して決定されたオーディエンスを含む。この率を、複製ファクタによって調節して(例えば(1−複製ファクタ)を掛けて)、測定位置の間で重複しているオーディエンスメンバを除去する。調節された結合オーディエンスは、選択した人口統計学的グループにおける、選択したチャネル、ブランド及び/又は親のURLについて少なくとも1つのページビューを有する人の推定数であり、NBDパラメータの計算においてパラメータUiとして使用される。
[00168]例示的なNBD計算機214は、追加の人口統計学的グループがあるかどうかを判定する(ブロック1334)。追加の人口統計学的グループがある場合(ブロック1334)には、制御は、図13Aのブロック1312に戻る。選択したチャネル、ブランド及び/又は親についての計算のための追加の人口統計学的グループがない場合(ブロック1334)には、例示的なNBD計算機214は、NBDを計算する追加のチャネル、ブランド及び/又は親があるかどうかを判定する(ブロック1336)。追加のチャネル、ブランド及び/又は親がある場合(ブロック1336)には、制御は、図13Aのブロック1310に戻る。追加のチャネル、ブランド及び/又は親がない場合(ブロック1336)には、例示的な命令1300は終了し、制御は図7のブロック704に戻る。例示的な命令1300は、スケーリングされたセンサスセッション(Xi)及び調節された結合オーディエンス(Ui)のNBD入力を、NBD計算に戻す。命令1300は、重み付けされたパネルセッションが独立して与えられない場合には、重み付けされたパネルセッション(Vi)をさらに戻すこともできる。
[00169]図18は、図4から図13の命令を実行して、図1から図3のハイブリッドオンラインオーディエンス測定システム102及び/又は仮想パネル生成器212を実装することができる、例示的な処理プラットフォーム1800を示すブロック図である。処理プラットフォーム1800は、例えば、サーバ、パーソナルコンピュータ、及び/又はその他の任意のタイプのコンピューティングデバイスとすることができる。
[00170]本例のシステム1800は、プロセッサ1812を含む。例えば、プロセッサ1812は、任意の所望のファミリ又は製造業者の1つ又は複数のマイクロプロセッサ又は制御装置で実装することができる。
[00171]プロセッサ1812は、ローカルメモリ(例えばキャッシュなど)1813を含み、揮発性メモリ1814及び不揮発性メモリ1816を含むメインメモリとバス1818を介して通信している。揮発性メモリ1814は、シンクロナスダイナミックランダムアクセスメモリ(SDRAM)、ダイナミックランダムアクセスメモリ(DRAM)、RAMBUSダイナミックランダムアクセスメモリ(RDRAM)、及び/又はその他の任意のタイプのランダムアクセスメモリデバイスによって実装することができる。不揮発性メモリ1816は、フラッシュメモリ及び/又はその他の任意の所望のタイプのメモリデバイスによって実装することができる。メインメモリ1814及び1816へのアクセスは、メモリ制御装置によって制御される。
[00172]処理プラットフォーム1800は、インタフェース回路1820も含む。インタフェース回路1820は、イーサネット(登録商標)インタフェース、ユニバーサルシリアルバス(USB)、及び/又はPCI Expressインタフェースなど、任意のタイプのインタフェース標準によって実装することができる。
[00173]1つ又は複数の入力デバイス1822が、インタフェース回路1820に接続される。1つ又は複数の入力デバイス1822により、ユーザは、データ及びコマンドをプロセッサ1812に入力することができる。1つ又は複数の入力デバイス1822は、例えば、キーボード、マウス、タッチスクリーン、トラックパッド、トラックボール、アイソポイント、及び/又は音声認識システムによって実装することができる。
[00174]1つ又は複数の出力デバイス1824も、インタフェース回路1820に接続される。出力デバイス1824は、例えば、表示デバイス(例えば液晶ディスプレイ、陰極線管ディスプレイ(CRT)、プリンタ及び/又はスピーカなど)によって実装することができる。したがって、インタフェース回路1820は、通常はグラフィックドライバカードを含む。
[00175]インタフェース回路1820は、モデム又はネットワークインタフェースなど、ネットワーク1826(例えばイーサネット接続、デジタル加入者回線(DSL)、電話回線、同軸ケーブル、携帯電話システムなど)を介した外部コンピュータとのデータ交換を容易にする通信デバイスも含む。
[00176]処理プラットフォーム1800は、ソフトウェア及びデータを格納するための1つ又は複数の大容量記憶デバイス1828も含む。このような大容量記憶デバイス1828の例としては、フロッピーディスクドライブ、ハードディスクドライブ、コンパクトディスクドライブ、及びデジタル汎用ディスク(DVD)ドライブなどが挙げられる。
[00177]図4から図13Bのコード化された命令1832は、大容量記憶デバイス1828、揮発性メモリ1814、不揮発性メモリ1816、及び/或いはCD又はDVDなどの取外し可能な記憶媒体に格納することができる。
[00178]本明細書では、特定の例示的なシステム、方法、装置及び製造品について述べたが、本特許の範囲は、これらに限定されない。限定されるのではなく、本特許は、本特許の特許請求の範囲内に含まれる全てのシステム、方法、装置及び製造品をカバーするものである。

Claims (41)

  1. 測定位置でウェブページにアクセスする複数のパネリストに対応するパネリストデータを取得するステップと、
    前記パネリストの人口統計学的情報に従って前記パネリストデータを分類するステップと、
    非測定位置におけるウェブページアクセスの推定値に基づいて仮想パネルを生成するステップと、
    前記仮想パネルに対応するデータに基づいて前記非測定位置に関連するページビューデータを分類するステップとを含む、オーディエンスデータを分類する方法。
  2. 前記仮想パネルが、前記複数のパネリストのサブセットを含む、請求項1に記載の方法。
  3. 前記仮想パネルを生成するステップが、総オーディエンスを推定するステップを含む、請求項1に記載の方法。
  4. 前記仮想パネルを生成するステップが、センサスに基づくページビューのカウント、前記パネリストデータ、及び推定母集合に基づく、請求項1に記載の方法。
  5. 前記仮想パネルを生成するステップが、負の2項分布を用いて前記非測定位置のオーディエンスを推定するステップを含む、請求項4に記載の方法。
  6. 前記仮想パネルを生成するステップが、人口統計学的ターゲット又はアクティビティターゲットのうちの少なくとも1つに基づく、請求項1に記載の方法。
  7. 前記パネリストデータを分類するステップが、前記パネリストデータに基づいてオンラインオーディエンスの第1の部分を推定するステップを含む、請求項1に記載の方法。
  8. 前記ページビューデータを分類するステップが、前記オンラインオーディエンスの第2の部分を推定するステップを含み、前記第1の部分及び前記第2の部分が、個別オーディエンスメンバの数を含む、請求項7に記載の方法。
  9. センサスに基づくページビューのカウントと前記ページビューデータの第1の部分及び第2の部分に関連するページビューの数の間の差を決定するステップと、
    前記差に基づいて、前記複数のパネリスト及び前記仮想パネルによって表されない追加のオーディエンスアクティビティを推定するステップとをさらに含む、請求項1に記載の方法。
  10. 第1の推定した特徴に基づいて複数のパネリストに重みを割り当てるステップと、
    前記重みに基づいて前記パネリストのサブセットを選択するステップと、
    第2の推定した特徴に基づいて前記選択したパネリストに再重み付けするステップと、
    仮想パネリストとして前記選択したパネリストを含む仮想パネルを生成するステップとを含み、前記仮想パネルについての前記選択したパネリストから収集したデータが、前記再重み付けに基づいて重みを割り当てられる、仮想パネルを生成する方法。
  11. オーディエンスを推定するステップをさらに含み、前記パネリストの前記第1の推定した特徴が、前記推定したオーディエンスに基づく、請求項10に記載の方法。
  12. 前記第1の推定した特徴が、前記推定したオーディエンスと測定したオーディエンスの間の差に基づく、請求項11に記載の方法。
  13. 前記パネリストの前記サブセットを選択するステップが、対応するパネリストに割り当てられた前記重みを前記対応するパネリストの選択確率として用いて前記パネリストを無作為に選択するステップを含む、請求項10に記載の方法。
  14. 人口統計学的ターゲット又はアクティビティターゲットのうちの少なくとも1つに基づいて前記第1の推定した特徴を計算するステップをさらに含む、請求項10に記載の方法。
  15. 前記第1の推定した特徴を計算するステップが、前記パネリストのオンラインアクティビティをセンサスに基づくページビューデータと比較するステップを含む、請求項14に記載の方法。
  16. 測定位置でウェブページにアクセスする複数のパネリストに対応するパネリストデータを収集するパネルデータ収集器と、
    非測定位置におけるウェブページアクセスの推定値に基づいて仮想パネルを生成する仮想パネル生成器と、
    前記パネリストの人口統計学的情報に従って前記パネリストデータを分類し、前記仮想パネルに対応するデータに基づいて前記非測定位置に関連するページビューデータを分類するオーディエンス分類器とを備える、装置。
  17. 前記複数のパネリスト及び母集合推定値に基づいて非測定位置のオーディエンスを推定する、負の2項分布計算機をさらに備える、請求項16に記載の装置。
  18. 前記複数のパネリストに基づいてオンラインアクティビティを決定するアクティビティ遂行器をさらに備え、前記オーディエンス分類器が、前記オンラインアクティビティに基づいて前記ページビューデータの第3の部分を分類する、請求項16に記載の装置。
  19. 測定位置及び非測定位置からのウェブページのページビューの数を表す前記ページビューデータを受信するセンサスに基づくデータ収集器をさらに備える、請求項16に記載の装置。
  20. 母集合推定値を収集する調査に基づくデータ収集器をさらに備え、前記仮想パネル生成器が、前記母集合推定値に基づいて前記仮想パネルを生成する、請求項16に記載の装置。
  21. 第1の推定した特徴に基づいて複数のパネリストに重みを割り当てる標本重み付け器と、
    前記重みに基づいて前記パネリストのサブセットを選択する標本選択器と、
    第2の推定した特徴に基づいて前記選択したパネリストに再重み付けし、仮想パネリストとして前記選択したパネリストを含む仮想パネルを生成する標本再重み付け器とを備え、前記仮想パネルについての前記選択したパネリストから収集したデータが、前記再重み付けに基づいて重みを割り当てられる、装置。
  22. 前記標本重み付け器が、
    推定したオーディエンスを取得し、
    前記推定したオーディエンスに基づいて前記パネリストの前記第1の推定した特徴を計算する、請求項21に記載の装置。
  23. 前記標本重み付け器が、前記推定したオーディエンスと測定したオーディエンスの間の差に基づいて前記第1の推定した特徴を計算する、請求項22に記載の装置。
  24. 前記標本選択器が、対応するパネリストに割り当てられた前記重みを前記対応するパネリストの選択確率として用いて前記パネリストを無作為に選択することによって、前記サブセットの前記パネリストを選択する、請求項21に記載の装置。
  25. 前記標本重み付け器が、人口統計学的ターゲット又はアクティビティターゲットのうちの少なくとも1つに基づいて前記第1の推定した特徴を計算する、請求項21に記載の装置。
  26. 前記標本重み付け器が、前記パネリストのオンラインアクティビティを測定されたページビューデータと比較することによって前記第1の推定した特徴を計算する、請求項25に記載の装置。
  27. 実行されたときに、プロセッサに、少なくとも
    測定位置でウェブページにアクセスする複数のパネリストに対応するパネリストデータを取得させ、
    前記パネリストの人口統計学的情報に従って前記パネリストデータを分類させ、
    非測定位置におけるウェブページアクセスの推定値に基づいて仮想パネルを生成させ、
    前記仮想パネルに対応するデータに基づいて前記非測定位置に関連するページビューデータを分類させる
    マシン可読命令を含む、有形のコンピュータ可読記憶媒体。
  28. 前記仮想パネルが、前記複数のパネリストのサブセットを含む、請求項27に記載の記憶媒体。
  29. 前記命令が、前記プロセッサに、総オーディエンスを推定することによって前記仮想パネルを生成させる、請求項27に記載の記憶媒体。
  30. 前記命令が、前記プロセッサに、センサスに基づくページビューのカウント、前記パネリストデータ、及び推定母集合に基づいて前記仮想パネルを生成させる、請求項27に記載の記憶媒体。
  31. 前記命令が、前記プロセッサに、負の2項分布を用いて前記非測定位置のオーディエンスを推定することによって前記仮想パネルを生成させる、請求項27に記載の記憶媒体。
  32. 前記命令が、前記プロセッサに、人口統計学的ターゲット又はアクティビティターゲットのうちの少なくとも1つに基づいて前記仮想パネルを生成させる、請求項27に記載の記憶媒体。
  33. 前記命令が、前記プロセッサに、前記パネリストデータに基づいてオンラインオーディエンスの第1の部分を推定することによって前記パネリストデータを分類させる、請求項27に記載の記憶媒体。
  34. 前記命令が、前記プロセッサに、前記オンラインオーディエンスの第2の部分を推定することによって前記ページビューデータを分類させ、前記第1の部分及び前記第2の部分が、何人かの個別オーディエンスメンバを含む、請求項33に記載の記憶媒体。
  35. 前記命令が、前記プロセッサにさらに、
    センサスに基づくページビューのカウントと前記ページビューデータの第1の部分及び第2の部分に関連するページビューの数の間の差を決定させ、
    前記差に基づいて、前記複数のパネリスト及び前記仮想パネルによって表されない追加のオーディエンスアクティビティを推定させる、請求項27に記載の記憶媒体。
  36. 実行されたときに、プロセッサに、
    第1の推定した特徴に基づいて複数のパネリストに重みを割り当てさせ、
    前記重みに基づいて前記パネリストのサブセットを選択させ、
    第2の推定した特徴に基づいて前記選択したパネリストに再重み付けさせ、
    仮想パネリストとして前記選択したパネリストを含む仮想パネルを生成させ、前記仮想パネルについての前記選択したパネリストから収集したデータが、前記再重み付けに基づいて重みを割り当てられるマシン可読命令を含む、コンピュータ可読記憶媒体。
  37. 前記命令が、前記プロセッサにさらに、オーディエンスを推定させ、前記パネリストの前記第1の推定した特徴が、前記推定したオーディエンスに基づく、請求項36に記載のコンピュータ可読記憶媒体。
  38. 前記第1の推定した特徴が、前記推定したオーディエンスと測定したオーディエンスの間の差に基づく、請求項37に記載のコンピュータ可読記憶媒体。
  39. 前記命令が、前記プロセッサに、対応するパネリストに割り当てられた重みを前記対応するパネリストの選択確率として用いて前記パネリストを無作為に選択することによって、前記パネリストの前記サブセットを選択させる、請求項36に記載のコンピュータ可読記憶媒体。
  40. 前記命令が、前記プロセッサにさらに、人口統計学的ターゲット又はアクティビティターゲットのうちの少なくとも1つに基づいて前記第1の推定した特徴を計算させる、請求項36に記載のコンピュータ可読記憶媒体。
  41. 前記命令が、前記プロセッサに、前記パネリストのオンラインアクティビティをセンサスに基づくページビューデータと比較することによって、前記第1の推定した特徴を計算させる、請求項40に記載のコンピュータ可読記憶媒体。
JP2014554879A 2012-01-26 2013-01-25 オンラインオーディエンスを測定するシステム、方法及び製造品 Pending JP2015512081A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261591263P 2012-01-26 2012-01-26
US61/591,263 2012-01-26
PCT/US2013/023259 WO2013112911A1 (en) 2012-01-26 2013-01-25 Systems, methods, and articles of manufacture to measure online audiences

Publications (1)

Publication Number Publication Date
JP2015512081A true JP2015512081A (ja) 2015-04-23

Family

ID=48871161

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014554879A Pending JP2015512081A (ja) 2012-01-26 2013-01-25 オンラインオーディエンスを測定するシステム、方法及び製造品

Country Status (5)

Country Link
US (4) US9224094B2 (ja)
JP (1) JP2015512081A (ja)
CN (1) CN104205158B (ja)
CA (2) CA3013711C (ja)
WO (1) WO2013112911A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021150639A1 (en) * 2020-01-20 2021-07-29 The Nielsen Company (Us), Llc Methods and apparatus for analyzing an internet audience

Families Citing this family (75)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4167169A1 (en) 2010-09-22 2023-04-19 The Nielsen Company (US), LLC Methods and apparatus to determine impressions using distributed demographic information
US10089592B2 (en) 2010-12-29 2018-10-02 Comcast Cable Communications, Llc Measuring video asset viewing
US10945011B2 (en) 2010-12-29 2021-03-09 Comcast Cable Communications, Llc Measuring video viewing
EP3693914A1 (en) 2011-03-18 2020-08-12 The Nielsen Company (US), LLC Methods and apparatus to determine media impressions
US10440428B2 (en) * 2013-01-13 2019-10-08 Comcast Cable Communications, Llc Measuring video-program-viewing activity
US10645433B1 (en) 2013-08-29 2020-05-05 Comcast Cable Communications, Llc Measuring video-content viewing
AU2013204865B2 (en) 2012-06-11 2015-07-09 The Nielsen Company (Us), Llc Methods and apparatus to share online media impressions data
AU2013204953B2 (en) 2012-08-30 2016-09-08 The Nielsen Company (Us), Llc Methods and apparatus to collect distributed user information for media impressions
US9179185B2 (en) * 2013-03-14 2015-11-03 The Nielsen Company (Us), Llc Methods and apparatus to determine a number of people in an area
US9355176B2 (en) 2013-03-15 2016-05-31 The Nielsen Company (Us), Llc Methods and apparatus to supplement web crawling with cached data from distributed devices
US9697533B2 (en) 2013-04-17 2017-07-04 The Nielsen Company (Us), Llc Methods and apparatus to monitor media presentations
US9519914B2 (en) 2013-04-30 2016-12-13 The Nielsen Company (Us), Llc Methods and apparatus to determine ratings information for online media presentations
US20150006255A1 (en) * 2013-06-28 2015-01-01 Streetlight Data, Inc. Determining demographic data
US9661088B2 (en) * 2013-07-01 2017-05-23 24/7 Customer, Inc. Method and apparatus for determining user browsing behavior
US10068246B2 (en) 2013-07-12 2018-09-04 The Nielsen Company (Us), Llc Methods and apparatus to collect distributed user information for media impressions
US9313294B2 (en) 2013-08-12 2016-04-12 The Nielsen Company (Us), Llc Methods and apparatus to de-duplicate impression information
US9332035B2 (en) 2013-10-10 2016-05-03 The Nielsen Company (Us), Llc Methods and apparatus to measure exposure to streaming media
EP3065103A4 (en) * 2013-10-30 2017-01-18 Panasonic Intellectual Property Management Co., Ltd. Information provision system, specific-information generation device, and specific-information generation method
US10956947B2 (en) 2013-12-23 2021-03-23 The Nielsen Company (Us), Llc Methods and apparatus to measure media using media object characteristics
US9852163B2 (en) * 2013-12-30 2017-12-26 The Nielsen Company (Us), Llc Methods and apparatus to de-duplicate impression information
US9237138B2 (en) 2013-12-31 2016-01-12 The Nielsen Company (Us), Llc Methods and apparatus to collect distributed user information for media impressions and search terms
US10147114B2 (en) 2014-01-06 2018-12-04 The Nielsen Company (Us), Llc Methods and apparatus to correct audience measurement data
US20150193816A1 (en) 2014-01-06 2015-07-09 The Nielsen Company (Us), Llc Methods and apparatus to correct misattributions of media impressions
US8910195B1 (en) * 2014-02-20 2014-12-09 Google Inc. Systems and methods for enhancing audience measurement data
AU2014384203A1 (en) * 2014-02-26 2016-09-15 Verto Analytics Oy Measurement of multi-screen internet user profiles, transactional behaviors and structure of user population through a hybrid census and user based measurement methodology
US10742753B2 (en) 2014-02-26 2020-08-11 Verto Analytics Oy Measurement of multi-screen internet user profiles, transactional behaviors and structure of user population through a hybrid census and user based measurement methodology
US9953330B2 (en) 2014-03-13 2018-04-24 The Nielsen Company (Us), Llc Methods, apparatus and computer readable media to generate electronic mobile measurement census data
WO2015138016A1 (en) 2014-03-13 2015-09-17 The Nielsen Company (Us), Llc Methods and apparatus to compensate impression data for misattribution and/or non-coverage by a database proprietor
US10311464B2 (en) 2014-07-17 2019-06-04 The Nielsen Company (Us), Llc Methods and apparatus to determine impressions corresponding to market segments
US9923942B2 (en) * 2014-08-29 2018-03-20 The Nielsen Company (Us), Llc Using messaging associated with adaptive bitrate streaming to perform media monitoring for mobile platforms
US20160063539A1 (en) 2014-08-29 2016-03-03 The Nielsen Company (Us), Llc Methods and apparatus to associate transactions with media impressions
US10652127B2 (en) * 2014-10-03 2020-05-12 The Nielsen Company (Us), Llc Fusing online media monitoring data with secondary online data feeds to generate ratings data for online media exposure
US20160189182A1 (en) 2014-12-31 2016-06-30 The Nielsen Company (Us), Llc Methods and apparatus to correct age misattribution in media impressions
US10219039B2 (en) 2015-03-09 2019-02-26 The Nielsen Company (Us), Llc Methods and apparatus to assign viewers to media meter data
US20160342699A1 (en) * 2015-05-18 2016-11-24 Turn Inc. Systems, methods, and devices for profiling audience populations of websites
US20190213612A1 (en) * 2015-06-09 2019-07-11 Clickagy, LLC Map based visualization of user interaction data
US20160364736A1 (en) 2015-06-09 2016-12-15 Clickagy, LLC Method and system for providing business intelligence based on user behavior
US10380633B2 (en) 2015-07-02 2019-08-13 The Nielsen Company (Us), Llc Methods and apparatus to generate corrected online audience measurement data
US10045082B2 (en) 2015-07-02 2018-08-07 The Nielsen Company (Us), Llc Methods and apparatus to correct errors in audience measurements for media accessed using over-the-top devices
US9838754B2 (en) 2015-09-01 2017-12-05 The Nielsen Company (Us), Llc On-site measurement of over the top media
US10127567B2 (en) * 2015-09-25 2018-11-13 The Nielsen Company (Us), Llc Methods and apparatus to apply household-level weights to household-member level audience measurement data
US10356485B2 (en) * 2015-10-23 2019-07-16 The Nielsen Company (Us), Llc Methods and apparatus to calculate granular data of a region based on another region for media audience measurement
US20170169460A1 (en) * 2015-12-15 2017-06-15 Facebook, Inc. Measuring performance of content presented on an online system based on user information received at variable rates
US10205994B2 (en) 2015-12-17 2019-02-12 The Nielsen Company (Us), Llc Methods and apparatus to collect distributed user information for media impressions
US9800928B2 (en) * 2016-02-26 2017-10-24 The Nielsen Company (Us), Llc Methods and apparatus to utilize minimum cross entropy to calculate granular data of a region based on another region for media audience measurement
US9872072B2 (en) 2016-03-21 2018-01-16 Google Llc Systems and methods for identifying non-canonical sessions
US10210459B2 (en) * 2016-06-29 2019-02-19 The Nielsen Company (Us), Llc Methods and apparatus to determine a conditional probability based on audience member probability distributions for media audience measurement
US10319023B2 (en) * 2016-06-29 2019-06-11 Go Daddy Operating Company, LLC Universal purchase path that may be optimized for conversion or revenue
WO2018020079A1 (en) * 2016-07-27 2018-02-01 Verto Analytics Oy Arrangement and method for digital media measurements involving user panels
US11151589B2 (en) * 2016-12-16 2021-10-19 The Nielsen Company (Us), Llc Methods and apparatus to determine reach with time dependent weights
US10791355B2 (en) * 2016-12-20 2020-09-29 The Nielsen Company (Us), Llc Methods and apparatus to determine probabilistic media viewing metrics
US10602224B2 (en) 2017-02-28 2020-03-24 The Nielsen Company (Us), Llc Methods and apparatus to determine synthetic respondent level data
US10728614B2 (en) 2017-02-28 2020-07-28 The Nielsen Company (Us), Llc Methods and apparatus to replicate panelists using a local minimum solution of an integer least squares problem
US10681414B2 (en) 2017-02-28 2020-06-09 The Nielsen Company (Us), Llc Methods and apparatus to estimate population reach from different marginal rating unions
US20180249211A1 (en) * 2017-02-28 2018-08-30 The Nielsen Company (Us), Llc Methods and apparatus to estimate population reach from marginal ratings
US10382818B2 (en) 2017-06-27 2019-08-13 The Nielson Company (Us), Llc Methods and apparatus to determine synthetic respondent level data using constrained Markov chains
IT201700105724A1 (it) * 2017-09-25 2019-03-25 Matthaeis Andrea De Metodo per l’estrapolazione di dati da più canali di comunicazione e apparato per l’implementazione di detto metodo
US11057659B2 (en) * 2017-10-13 2021-07-06 Comscore, Inc. Deterministic household assignment model
WO2019191875A1 (en) * 2018-04-02 2019-10-10 The Nielsen Company (Us), Llc Processor systems to estimate audience sizes and impression counts for different frequency intervals
US11249965B2 (en) * 2018-05-24 2022-02-15 Paypal, Inc. Efficient random string processing
US10856027B2 (en) 2019-03-15 2020-12-01 The Nielsen Company (Us), Llc Methods and apparatus to estimate population reach from different marginal rating unions
US11216834B2 (en) 2019-03-15 2022-01-04 The Nielsen Company (Us), Llc Methods and apparatus to estimate population reach from different marginal ratings and/or unions of marginal ratings based on impression data
US11561942B1 (en) 2019-07-05 2023-01-24 The Nielsen Company (Us), Llc Methods and apparatus to estimate audience sizes of media using deduplication based on vector of counts sketch data
US11416461B1 (en) 2019-07-05 2022-08-16 The Nielsen Company (Us), Llc Methods and apparatus to estimate audience sizes of media using deduplication based on binomial sketch data
US11741485B2 (en) 2019-11-06 2023-08-29 The Nielsen Company (Us), Llc Methods and apparatus to estimate de-duplicated unknown total audience sizes based on partial information of known audiences
US11153392B2 (en) 2019-12-03 2021-10-19 The Nielsen Company (Us), Llc Methods and apparatus for session building from ping-level data
US11553054B2 (en) * 2020-04-30 2023-01-10 The Nielsen Company (Us), Llc Measurement of internet media consumption
US11582183B2 (en) 2020-06-30 2023-02-14 The Nielsen Company (Us), Llc Methods and apparatus to perform network-based monitoring of media accesses
US11783354B2 (en) 2020-08-21 2023-10-10 The Nielsen Company (Us), Llc Methods and apparatus to estimate census level audience sizes, impression counts, and duration data
US11481802B2 (en) 2020-08-31 2022-10-25 The Nielsen Company (Us), Llc Methods and apparatus for audience and impression deduplication
US11941646B2 (en) 2020-09-11 2024-03-26 The Nielsen Company (Us), Llc Methods and apparatus to estimate population reach from marginals
US11553226B2 (en) 2020-11-16 2023-01-10 The Nielsen Company (Us), Llc Methods and apparatus to estimate population reach from marginal ratings with missing information
US20220207543A1 (en) * 2020-12-30 2022-06-30 The Nielsen Company (Us), Llc Methods and apparatus to deduplicate audiences across media platforms
WO2022170204A1 (en) 2021-02-08 2022-08-11 The Nielsen Company (Us), Llc Methods and apparatus to perform computer-based monitoring of audiences of network-based media by using information theory to estimate intermediate level unions
US11949932B2 (en) * 2021-05-25 2024-04-02 The Nielsen Company (Us), Llc Synthetic total audience ratings

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110246641A1 (en) * 2010-04-05 2011-10-06 Comscore, Inc. Measurements based on panel and census data
US20120005213A1 (en) * 2010-06-30 2012-01-05 Kevin Michael Hannan Methods and apparatus to obtain anonymous audience measurement data from network server data for particular demographic and usage profiles

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPQ206399A0 (en) * 1999-08-06 1999-08-26 Imr Worldwide Pty Ltd. Network user measurement system and method
US7950999B2 (en) * 2004-09-16 2011-05-31 Bally Gaming, Inc. User interface system and method for a gaming machine
US20040088212A1 (en) 2002-10-31 2004-05-06 Hill Clarke R. Dynamic audience analysis for computer content
WO2006029022A2 (en) * 2004-09-03 2006-03-16 Arbitron Inc. Out-of-home advertising inventory ratings methods and systems
WO2006071246A1 (en) * 2004-12-23 2006-07-06 Massive Incorporated Matching and scoring of advertisements for targeted delivery into multiple video games, such as single and multiplayer games
US20080086741A1 (en) * 2006-10-10 2008-04-10 Quantcast Corporation Audience commonality and measurement
US20080228543A1 (en) * 2007-03-16 2008-09-18 Peter Campbell Doe Methods and apparatus to compute reach and frequency values for flighted schedules
JP2012016575A (ja) * 2010-06-07 2012-01-26 Toshiba Corp 画像処理装置及び医用画像診断装置
US8549103B2 (en) * 2010-10-07 2013-10-01 Yahoo! Inc. Multisided audience-related hybrid measurements
US20130064109A1 (en) * 2011-09-12 2013-03-14 Jacques Combet Analyzing Internet Traffic by Extrapolating Socio-Demographic Information from a Panel

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110246641A1 (en) * 2010-04-05 2011-10-06 Comscore, Inc. Measurements based on panel and census data
US20120005213A1 (en) * 2010-06-30 2012-01-05 Kevin Michael Hannan Methods and apparatus to obtain anonymous audience measurement data from network server data for particular demographic and usage profiles

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021150639A1 (en) * 2020-01-20 2021-07-29 The Nielsen Company (Us), Llc Methods and apparatus for analyzing an internet audience

Also Published As

Publication number Publication date
WO2013112911A1 (en) 2013-08-01
US9224094B2 (en) 2015-12-29
AU2013204255A1 (en) 2013-08-15
US11562385B2 (en) 2023-01-24
CN104205158B (zh) 2017-11-28
CA2862549A1 (en) 2013-08-01
CN104205158A (zh) 2014-12-10
US20160086208A1 (en) 2016-03-24
US20230162216A1 (en) 2023-05-25
CA3013711A1 (en) 2013-08-01
US20200250692A1 (en) 2020-08-06
US20130198125A1 (en) 2013-08-01
AU2013204255B2 (en) 2015-10-01
CA2862549C (en) 2018-09-18
CA3013711C (en) 2022-08-09
US10552855B2 (en) 2020-02-04

Similar Documents

Publication Publication Date Title
US11562385B2 (en) Systems, methods, and articles of manufacture to measure online audiences
US20240007382A1 (en) Combining measurements based on beacon data
US10970726B2 (en) Measurements based on panel and census data
KR102317823B1 (ko) 데이터베이스 사업자에 의한 기인오류 및/또는 논-커버리지에 대해 노출 데이터를 보상하기 위한 방법 및 장치
US11068928B2 (en) Methods and apparatus to determine impressions corresponding to market segments
US20220147559A1 (en) Methods and apparatus for estimating total unique audiences
AU2014353157B2 (en) Methods and apparatus to measure a cross device audience
US20220198493A1 (en) Methods and apparatus to reduce computer-generated errors in computer-generated audience measurement data
US11816698B2 (en) Methods and apparatus for audience and impression deduplication
US20200058037A1 (en) Reporting of media consumption metrics
US10171602B2 (en) Determining device counts
AU2013204255B9 (en) Systems, methods, and articles of manufacture to measure online audiences
KR102663453B1 (ko) 데이터베이스 사업자에 의한 기인오류 및/또는 논-커버리지에 대해 노출 데이터를 보상하기 위한 방법 및 장치

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150730

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150811

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20151109

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20160223