JP2016524259A

JP2016524259A - 動的リサーチパネル

Info

Publication number: JP2016524259A
Application number: JP2016524290A
Authority: JP
Inventors: オーガストイーグラント
Original assignee: １ワールドオンラインインコーポレイテッド
Priority date: 2013-06-28
Filing date: 2014-06-30
Publication date: 2016-08-12
Also published as: EP3014554A4; KR20160051723A; US20150006547A1; EP3014554A1; WO2014210597A1

Abstract

動的重み付け及び無作為割り当ての適用による、大きな代表的でないデータセットから代表標本を抽出するための技法及びアルゴリズム。アルゴリズムにより、集団として、顕著な変数の任意の所望の比率と密接に適合する、個々の標本選択が可能となる。無作為化アルゴリズムにより、多数の代表的な集団が、同一の大きな代表的でないデータセットから抽出されることが可能となる。【選択図】図１

Description

関連出願の相互参照
本出願は、本明細書に完全に含まれるように参照により組み込まれている、２０１３年６月２８日に出願された米国仮出願第６１／８４１，１１８号の優先権を主張するものである。

本出願は、一般に、オンライン世論調査に関し、より詳細には、世論調査データの結果の無作為標本を作成し、結果として生じるデータセットにおける外的妥当性を可能にすることに関する。

Ｗｅｂ２．０やビッグデータサービスとして知られる、インターネット及びオンライン上の場やデジタルプロパティ内において、社会的及び専門的ネットワークを介して構築され共有される情報は、有用であるためにより確実で代表的である必要がある、という新たなレベルの理解に我々は現在移行している。特に、人々が自身の生活における様々な話題や自身の世界における問題について実際に考えていることに関する、正確で、数値化可能で、包括的なデータを獲得するという満たされない需要がある。一例として、どんな製品またはサービスも開発及び販売を最適に計画するためには、商品担当者やマーケティング担当者が、製品の特長、サービスの魅力、動向、価格設定に関して顧客の意見を最も良く理解することと同様に、顧客の興味や意思決定過程への信頼できる測定可能な洞察力を有することが不可欠である。政治、文化、スポーツ、娯楽、地理的、教育的及び職業的な動向の推定等を含め、人々の生活のその他全ての分野における分析者についても同じことが言える。

調査研究における無作為標本の使用は、回答者のかなりの割合が有志であるか、または自身を被験者プールに自薦する、回答者の便宜的標本に置き換わってきている。自薦の回答者は基礎をなす母集団を通常は代表せず、標本から母集団にパラメータを投影するために推計統計学を適用できない。現在のところ、これらのデータは修正せずに表されるか、または重み付けされて、すなわち、過少に表された集団の代表を増加させ、過剰に表された集団の代表を減少させるように相対的な数学的重みを各被験者に割り当てて表される。

重み付けは、スキューされたデータセットから、より代表的な結果を生成するための許容可能な技法と考えられている。しかし、この技法には２つの問題がある。第一に、情報をデータセットに付加するために（横断的観察ではなく、縦断的観察を提供するために）、初期標本の全ての構成員が、通常は回答者につきかなりの費用で、再度調査されなければならない。第二に、過剰に表されたケースはデータセットにおける個人のごく一部として集計されるのに対して、過少に表されたケースは一個人よりも多いものとして集計されるので、重みは、個人の行動を投影するように結果を適用することに関する問題を引き起こす。

本発明は、調査または世論調査への代表的でない回答のセットから、統計上代表的な副次標本を抽出するための方法及びシステムに関する。この目的は、回答の体系的且つ合目的な選択を提供するようにアルゴリズム（「ＤＲＰアルゴリズム」）を適用することによって達成される。

一実施形態において、技法は、ケースの標本のためのデータを受信するステップであって、ケースが少なくとも１つの変数を備え、ケースの標本におけるケースのそれぞれが、少なくとも１つの変数のそれぞれのための標識を有する、ステップと、ケースのセットにおけるケースのそれぞれに、そのケースの標識のそれぞれのためのケースのセット中の度数に基づき重みを割り当てるステップであって、前記重みが、標識のそれぞれのための所望のパネル度数にさらに基づく、ステップと、ケースのセットからケースのサブセットを無作為に選択するステップと、を含み、標識のそれぞれのために、選択されたサブセットにおける標識の度数が、その標識のための所望のパネル度数に近似するように、無作為な選択が、ユーザの割り当てられた重みに従って重み付けされる、方法として実現できる。

この実施形態の他の態様によれば、標識は人口動態変数とすることができ、所望のパネル度数は、人口動態変数に関する母集団における既知の度数である。

この実施形態の他の態様によれば、当該方法はさらに、所望のパネル度数に近似する度数を備える標識を有する選択されたサブセットに基づき、選択されたサブセットと関連するデータを分析することを含むことができる。

この実施形態の他の態様によれば、ケースのサブセットを無作為に選択することは、ケースのそれぞれに確率変数を割り当てることと、選択閾値を生成するように、それぞれのケースの割り当てられた重みを、ケースの割り当てられた確率変数によって除算することと、最も高い選択閾値を有するケースを選択すること、を含むことができる。

この実施形態の他の態様によれば、無作為な選択は、標識のそれぞれのために、選択されたサブセットにおける標識の度数が、その標識のための所望のパネル度数に近似するように、ユーザの割り当てられた重みに従って重み付けできる。

この実施形態の他の態様によれば、当該方法はさらに、サブセットからのデータをデータの代表標本として表示することを含むことができる。

別の実施形態によれば、技法は、少なくとも１つのプロセッサ可読の記憶媒体と、当該少なくとも１つの媒体に記憶された命令と、を含む製品として実現できる。命令は、少なくとも１つのプロセッサによって、少なくとも１つの媒体から可読であるように構成でき、これにより、少なくとも１つのプロセッサを、上述の方法におけるあらゆるステップを実行するように動作させる。

別の実施形態によれば、技法は、ネットワークに通信可能に結合された１つまたは複数のプロセッサを含むシステムとして実現でき、当該１つまたは複数のプロセッサは、上記の実施形態のいずれかに関して説明されたあらゆるステップを実行するように構成される。

本開示は、添付の図面に示したように、その特定の実施形態を参照して次にさらに詳細に説明される。本開示は特定の実施形態を参照して以下で説明されるが、本開示はその実施形態に限定されないことを理解すべきである。本明細書における教示を利用する当業者は、追加の実施態様、修正形態及び実施形態ならびにその他の使用分野を認識するであろう。それらは、本明細書において説明される本開示の範囲内にあり、また、それらに対して本開示には重要な有用性がある。

本発明のさらなる理解は、後続の詳細な説明と併せて考察される際に、添付の図面を参照することによって獲得できる。
本発明に従った代表標本を生成するための方法を表すフローチャートである。本発明に従った１つの標識を有する例示的な標本のためのデータを示す図である。本発明に従った図２Ａの例示的な標本からの選択されたパネルを含む選択リストである。本発明に従った２つの標識を有する例示的な標本のためのデータを示す図である。本発明に従った２つの標識を有する例示的な標本のためのデータを示す図である。本発明に従った図３Ａ及び図３Ｂの例示的な標本からの選択されたパネルを示す図である。本発明に従った３つの標識を有する例示的な標本のためのデータを示す図である。本発明に従った図４Ａの例示的な標本からの第１の選択されたパネルを示す図である。本発明に従った図４Ａの例示的な標本からの第１の選択されたパネルからのデータを示す図である。本発明に従った図４Ａの例示的な標本からの第２の選択されたパネルからのデータを示す図である。本発明に従った図４Ａの例示的な標本からの第３の選択されたパネルからのデータを示す図である。

本発明は、調査または世論調査への代表的でない回答のセットから、統計上代表的な副次標本を抽出するための方法及びシステムに関する。当該方法は、大きなデータセットの副次標本を選択するアルゴリズムを使用し、検討される母集団を表すユーザのサブセットを作成する。本発明のために作成されるアルゴリズムは、大きなデータセットを分析する新規且つ固有の方法である。

本発明は、代表的でないデータセットから１つまたは複数の代表的な副次標本を生成するアルゴリズムを提供する。本発明は、我々が動的リサーチパネル（ＤｙｎａｍｉｃＲｅｓｅａｒｃｈＰａｎｅｌ）と呼ぶものを生成する選択過程及び多段階過程において使用されるアルゴリズムを包含する。

初期標本から新たな副次標本を作成し、異なる被験者による多数のフォローアップの機会を可能にし、また、代表性の程度を測定するために副次標本の相互の比較を可能にするように、アルゴリズムが回数の制限なく実行できるので、「動的（Ｄｙｎａｍｉｃ）」という用語が使用される。

本発明は、大きな代表的でないデータセットと関連する２つの問題を解決する。第一に、本発明は、初期データセットよりも基礎をなす母集団をより良好に表すデータセットの副次標本を生成する。第二に、本発明は、初期標本の代表的な副次標本を特定することにより、フォローアップリサーチを行う費用を削減する。調査研究の主な費用は、調査を行い、回答者に報酬を支払う費用であるので、フォローアップに必要とされるケースの数が減少すると、フォローアップリサーチをする費用が実質的に削減され、また、より迅速でより手ごろなリサーチ結果を提供できる。

本発明はまた、無作為割り当てと重み付けとの組合せを使用して大きなデータセットの代表的な副次標本を定義及び抽出することにより、無作為標本を必要とする統計的分析技法を、大きなデータセットの分析に適用することを可能にする。

初期標本から新たな副次標本を作成し、異なる被験者による多数のフォローアップの機会を可能にし、また、代表性の程度を測定するために副次標本の相互の比較を可能にするように、アルゴリズムが回数の制限なく実行できるので、「動的」という用語が使用される。新たな動的リサーチパネルを作成するための手順は初期シーケンスと同一であり、唯一の変更は各ケースのために新たな「乱数種」を生成することである。このアルゴリズムで使用されるこれらの用語は、以下で説明される。

いくつかの実施形態において、「標識（Ｍａｒｋｅｒ）」とは、母集団中の既知の分布を有する単一の変数であると理解できる。様々な異なる変数が調査される個人に対して使用できることを、当業者は認識するであろう。例として、また、列挙される以下に限定されることを意図しないが、変数は、人口動態、地理的、心理的及び行動変数ならびにその他を含むことができる。

人口動態変数は、例えば、年齢や性別、所得、学歴、婚姻関係の有無、所属政党、世帯人員、子どもの数、所属宗教、雇用状態を含むことができる。地理的変数は、例えば、郵便番号や市、郡、州、地域、国、地域サービス区域（ＬＡＴＡ）、開発レベル（都市、郊外または地方）を含むことができる。心理的変数は、例えば、性格、生活様式、社会階級、活動や興味（健康状態、趣味、買い物、読書等）、見解（政治、経済、社会問題等）、考え方や価値観（健康、安全性、セキュリティ、自己尊重、他人との友好関係、達成感、自己充足、被尊重感、帰属意識、面白さ・享楽・興奮等）を含むことができる。行動変数は、例えば、購買行動や通勤距離、メディア消費（テレビ、ラジオ、インターネット、新聞、ソーシャルメディア、雑誌等）を含むことができる。他の変数は、例えば、知性や成績評価平均値、大学の専攻、職種を含むことができる。多くの他の変数が当分野で知られている。

いくつかの実施形態において、「乱数種（ＲａｎｄｏｍＳｅｅｄ）」とは、コンピュータによって割り当てられる０と１の間の疑似乱数であると理解できる。生成される各「乱数種」は、０と１の間の線上の任意の場所にある機会をほぼ平等に有すると想定される（すなわち、０と１の間の数の分布は、ほぼ均一のはずである）。

いくつかの実施形態において、「初期標本の大きさ（ＩｎｉｔｉａｌＳａｍｐｌｅＳｉｚｅ）」とは、動的リサーチパネルが導き出されるデータセットにおけるケースの数であると理解できる。場合によっては、初期標本の大きさは、取得されたデータ全体を表さないこともあることが理解されよう。例えば、利用可能なデータの母集団が大きすぎて全ての被験者にアルゴリズムを実行できないいくつかの実施態様においては、無作為標本が、初期標本を形成するために、データのより大きな母集団から選択できる。他の実施態様において、初期標本は、調査される被験者の母集団全体であってもよい。いずれにせよ、初期標本は、データのどんなセットも、ＤＲＰを形成するために被験者が無作為に抜き取られるデータのセットを表すものであって、「初期標本の大きさ」は、どんな数もこの集団内にいる構成員の数である。

いくつかの実施形態において、「指定された標本の大きさ（ＤｅｓｉｇｎａｔｅｄＳａｍｐｌｅＳｉｚｅ、ＤＳＳ）」とは、「初期標本の大きさ」の値よりも小さな、ユーザによって特定されたパラメータであると理解できる。ＤＳＳは、ＤＲＰアルゴリズムが実行される場合に、結果として生じるパネルの大きさである。

ＤＲＰアルゴリズムを使用する場合に結果的に適切な代表標本になるように、ＤＳＳには最大の大きさがあることを認識すべきである。初期標本の大きさよりも小さくする必要性に加えて、母集団内の任意の特定の下位集団が、パネルにおいて所望の割合を達成するために、パネル内に存在する母集団からのその構成員全てを有する必要がある場合に、ＤＳＳの大きさは最大である。例えば、ある集団がパネルのうちの１０％を占め、初期標本におけるその集団の構成員が２０人である場合、ＤＳＳは、２００よりも著しく大きいものとすることができない。パネルが２００を著しく超える被験者を含む場合、その特定の集団から２０を超えて選択することはさらに不可能であり、そうすると、その集団はやがてパネルのうちの１０％よりも低いものとなる。

いくつかの実施形態において、「選択リスト」とは、初期データセットからのケースの順序付きリストであると理解でき、その初期データセットから、第１のＮ個のケースが動的リサーチパネルを構成する。ＤＲＰアルゴリズムの目的は、所望の標識の濃度を正確に表す選択リストを作成することである。

動的リサーチパネルは、図１に表すように、多段階過程１００において作成される。分析における最初のステップは、母集団を表すことのできる、または表すことのできない大きなデータセットを獲得することであり、当該データセットは代表のために作成される。これ以降で「標識」と呼ばれる、既知の分布を有する変数のセットが定義され、母集団及び標本における相対的な比率が、次の式を使用して各標識のための重みを作成するのに使用される。
ＭＷ（ＭａｒｋｅｒＷｅｉｇｈｔ、標識重み）＝ＰＰ／ＳＰ
ここで、ＰＰとは結果として生じるパネルにおける標識の目標の比率であり、ＳＰとは初期標本における標識の比率である。

例えば、我々の初期標本は大卒者が３０パーセントであり、我々が、大卒者が２０パーセントであるパネルを必要とする場合、大卒者のための我々の標識重みは、ＭＷ＝．２／．３、すなわち、．６７であろう。各変数のための各値は、標識重みを割り当てられなければならない（ステップ１０２）。

各標識が標識重みを割り当てられると、初期標本における各特定のケースは、そのケースと関連した標識のそれぞれの重みに基づいて、動的重みを割り当てられる（ステップ１０４）。動的重みは、標識重みのそれぞれの積である。
ＤＷ（ＤｙｎａｍｉｃＷｅｉｇｈｔ、動的重み）＝ＭＷ_Ａ ^＊ＭＷ_Ｂ ^＊ＭＷ_Ｃ ^＊・・・ＭＷ_Ｎ
ここで、ＭＷ_Ｘとは標識Ｘに割り当てられる重みであり、Ｎとは特定のケースに適用される異なる標識の数である。

例えば、単に２つの変数として人種及び学歴について、「白人」は．５の標識重みを有し、「大卒者」は．６７の標識重みを有する場合、白人の大卒者である初期標本内のケースは、．５^＊．６７＝．３３の動的重みを有することになる。

初期標本内のケースのそれぞれにケースの標識に基づいて動的重みを割り当てることに加えて、各ケースは乱数種も割り当てられる（ステップ１０６）。乱数種の値はそれぞれが、上述のように、０と１の間の均一な分布から無作為に選択されなければならない。すなわち、乱数種の値は、ＤＷまたは特定のケースと関連した任意のその他の値に依存すべきでない。

次に、選択閾値が各ケースのために計算される（ステップ１０８）。選択閾値は、動的重みを乱数種で除算したものである。選択閾値は、任意の正の実数とすることができる。ケースの選択閾値が高ければ高いほど、すぐにそれはパネル内に含まれるように選択される。

どのケースがパネルに載るかを決定するために、まず最も高い選択閾値を有するケースを選び、その後そのケースをパネルに付加する。選択されたケースの数がＤＳＳと等しくなるまで、残りのケースの中で最も高い選択閾値をはじめとしてケースを付加し続ける（ステップ１１０）。

このステップを表す別の方法は、選択閾値によりケースを降順にソートして、選択リストを作成することである。選択リスト上の第１のＤＳＳのケースが、動的リサーチパネルを構成する。

初期標本から新たな副次標本を作成し、異なる被験者による多数のフォローアップの機会を可能にし、また、代表性の程度を測定するために副次標本の相互の比較を可能にするように、アルゴリズムが回数の制限なく実行できるので、「動的」という用語が使用される。

同一の初期標本を用いて再びアルゴリズムを実行するために、ケースのための乱数種の新たなセットを生成し、その新たな乱数種及び既存のＤＷの値に基づき選択閾値を再計算し、その後、新たな選択閾値に基づき選択リストを再度ソートする。

残りの図は、本明細書において説明される方法に従ってソートされたデータセットのいくつかの実施例を提供するものである。図２Ａは、１５人が女性あり、５人が男性である、２０個のケースの例示的なデータセットである。半分が男性であり、半分が女性である１０個のケースのパネルを選択することが所望される。

図２Ｂは、各ケースが乱数種を割り当てられ、結果として生じる選択閾値が計算された後の選択リストを示す。陰影付きのケースは、最も高い選択閾値を有する１０個のケースを表す。結果は、期待通り、男性の標識が５人であり女性の標識が５人であるパネルである。

図３Ａ及び図３Ｂは、２つの変数を表す６０個のケースのより大きなデータセットを示す。ケースのうちの２５％が男性であり、７５％が女性である。ケースのうちの３分の１が都市であり、３分の２が地方である。所望のパネルは、２０人の構成員を含み、且つ、同数の男性及び女性、ならびに同数の地方候補者及び都市候補者で構成される。

図３Ｃは、ＤＲＰアルゴリズムの適用からのパネル構成員のみを列挙するものであり、乱数種が割り当てられた後の最も大きな選択閾値の値を有した２０個のケースである。結果として生じるパネルは、１１人が男性で９人が女性であり、同様に１０人が都市であり１０人が地方の標識である。予期される誤差内で、選択されたパネルは両標識の所望の比率を正しく表す。

別の実施例として、図４Ａは、７３７個のケースの初期標本のための３つの標識に比率を与えるものである。この実施例のためにパネルの所望の比率を形成する、これらの標識のための容認される母集団の分布も与えられる。

図４Ｂは、７３７個のケースの標本から２００個のケースのパネルを選択するように、ＤＲＰアルゴリズムを適用する第１の実施例を示す。結果として生じるパネルは、例えば、学校教育を受けていない４人の女性、学士号を持つ２５歳〜２９歳の８人の人々、及び、７５歳以上の５人の男性を含む。図４Ｃは、結果として生じるパネル内に存在する標識をまとめたものである。

上述のように、多数のパネルは、乱数種を再度割り当て、選択閾値の値を再計算することにより、同一の初期標本から得ることができる。図４Ｄ及び図４Ｅはそれぞれが、７３７個のケースの同一の初期標本から得られた付加的なパネルのための標識の値を含む。

パネルの比率は初期標本よりも所望の値にはるかに近いものであるが、いくつかの欠点が留意されよう。例えば、３つの生成されたパネルはいずれも、「学校教育を受けていない」ケースの割合が６．５パーセントを超えない。これは、パネルが、初期標本全体において見つけられるものと同数の、一定の標識を有するケースを得ることしかできないという点で、先に留意されたものの一例であり、７３７個のケースの標本全体において「学校教育を受けていない」ケースは１３個のみである。結果として、これらの同一の１３個のケースが、全ての３つのパネルにおいて選択され、この特定の標識は母集団に対して過少に表されたままである。

本発明を行う論理は、ソフトウェアモジュールとして提供される。当該モジュールは例示的であることに留意されたい。モジュールは、様々な用途に対応するように、組み合せることができ、一体化でき、分離でき、及び／または複製できる。また、特定のモジュールで動作するものとして本明細書において説明される機能は、１つまたは複数の他のモジュールで動作でき、及び／または、当該特定のモジュールで動作される機能の代わりに、またはこれと共に、１つまたは複数の他のデバイスによって動作できる。さらに、モジュールは、互いに対してローカルまたはリモートの多数のデバイス及び／または他の構成要素間で実施できる。また、モジュールは、１つのデバイスから移動されて別のデバイスに付加でき、及び／または、両方のデバイスに含むことができる。

ここで、上述のような本開示に従った技法は、入力データの処理及び出力データの生成をある程度含むことができることに留意すべきである。この入力データの処理及び出力データの生成は、ハードウェアまたはソフトウェアにおいて実施できる。例えば、特定の電子部品が、上述のような本開示に従った機能を実施するための回路に用いることができる。あるいは、命令に従って動作する１つまたは複数のプロセッサが、上述のような本開示に従った機能を実施できる。このような場合、そのような命令が、１つまたは複数の非一時的なプロセッサ可読の記憶媒体（例えば、磁気ディスクまたは他の記憶媒体）に記憶できること、または、１つまたは複数の搬送波に具現化される１つまたは複数の信号を介して１つまたは複数のプロセッサに伝送できることは、本開示の範囲内にある。

Claims

ケースの標本のためのデータを受信することであって、
前記ケースが少なくとも１つの変数を備え、ケースの前記標本における前記ケースのそれぞれが、前記少なくとも１つの変数のそれぞれのための標識を有し、
ケースのセットにおける前記ケースのそれぞれに、そのケースの前記標識のそれぞれのためのケースのセット中の度数に基づき重みを割り当てることであって、前記重みが、前記標識のそれぞれのための所望のパネル度数にさらに基づき、
ケースのセットからケースのサブセットを無作為に選択することであって、前記標識のそれぞれのために、選択された前記サブセットにおける前記標識の度数が、その標識のための前記所望のパネル度数に近似するように、前記無作為な選択が、ユーザの前記割り当てられた重みに従って重み付けされる、
を含む、
コンピュータにより実施される方法。
前記標識が人口動態変数であり、前記所望のパネル度数が、前記人口動態変数に関する母集団における既知の度数である、請求項１に記載のコンピュータにより実施される方法。
前記所望のパネル度数に近似する度数を備える標識を有する前記選択されたサブセットに基づき、前記選択されたサブセットと関連するデータを分析すること
をさらに含む、請求項１に記載のコンピュータにより実施される方法。
ケースのサブセットを前記無作為に選択することが、
前記ケースのそれぞれに確率変数を割り当てることと、
選択閾値を生成するように、それぞれのケースの前記割り当てられた重みを、前記ケースの割り当てられた確率変数によって除算することと、
最も高い選択閾値を有するケースを選択すること
を含む、請求項１に記載のコンピュータにより実施される方法。
ケースのセットから、ケースの第２のサブセットを無作為に選択することをさらに含み、前記標識のそれぞれのために、前記選択されたサブセットにおける前記標識の度数が、その標識のための前記所望のパネル度数に近似するように、前記無作為な選択が、ユーザの前記割り当てられた重みに従って重み付けされる、
請求項１に記載のコンピュータにより実施される方法。
前記サブセットからのデータを前記データの代表標本として表示すること
をさらに含む、請求項１に記載のコンピュータにより実施される方法。
請求項１に記載の前記方法を実施するためのコンピュータプロセスを実行するように、少なくとも１つのプロセッサに命令するために、前記少なくとも１つのプロセッサに可読であるように構成された命令のコンピュータプログラムを記憶する、少なくとも１つの非一時的なプロセッサ可読の記憶媒体。
ネットワークに通信可能に結合された１つまたは複数のプロセッサを含むシステムであって、
前記１つまたは複数のプロセッサが、
ケースの標本のためのデータを受信し、前記ケースが少なくとも１つの変数を備え、ケースの前記標本における前記ケースのそれぞれが、前記少なくとも１つの変数のそれぞれのための標識を有するものであり、
ケースのセットにおける前記ケースのそれぞれに、そのケースの前記標識のそれぞれのためのケースのセット中の度数に基づき重みを割り当て、前記重みが、前記標識のそれぞれのための所望のパネル度数にさらに基づくものであり、
ケースのセットからケースのサブセットを無作為に選択するように構成され、前記標識のそれぞれのために、選択された前記サブセットにおける前記標識の度数が、その標識のための前記所望のパネル度数に近似するように、前記無作為な選択が、ユーザの前記割り当てられた重みに従って重み付けされる、
システム。
前記標識が人口動態変数であり、前記所望のパネル度数が、前記人口動態変数に関する母集団における既知の度数である、請求項８に記載のシステム。
前記プロセッサがさらに、前記所望のパネル度数に近似する度数を備える標識を有する前記選択されたサブセットに基づき、前記選択されたサブセットと関連するデータを分析するように動作可能である、請求項８に記載のシステム。
ケースのサブセットを前記無作為に選択することが、
前記ケースのそれぞれに確率変数を割り当てることと、
選択閾値を生成するように、それぞれのケースの前記割り当てられた重みを、前記ケースの割り当てられた確率変数によって除算することと、
最も高い選択閾値を有するケースを選択すること
を含む、請求項８に記載のシステム。
前記プロセッサがさらに、ケースのセットから、ケースの第２のサブセットを無作為に選択するように動作可能であり、前記標識のそれぞれのために、前記選択されたサブセットにおける前記標識の度数が、その標識のための前記所望のパネル度数に近似するように、前記無作為な選択が、ユーザの前記割り当てられた重みに従って重み付けされる、請求項８に記載のシステム。
前記プロセッサがさらに、前記サブセットからのデータを前記データの代表標本として表示するように動作可能である、請求項８に記載のシステム。
少なくとも１つのプロセッサ可読の記憶媒体と、
前記少なくとも１つの記憶媒体に記憶された命令と
を含む製品であって、
前記命令が、少なくとも１つのプロセッサによって、前記少なくとも１つの記憶媒体から可読であるように構成され、これにより、前記少なくとも１つのプロセッサに、
ケースの標本のためのデータを受信し、前記ケースが少なくとも１つの変数を備え、ケースの前記標本における前記ケースのそれぞれが、前記少なくとも１つの変数のそれぞれのための標識を有するものであり、
ケースのセットにおける前記ケースのそれぞれに、そのケースの前記標識のそれぞれのためのケースのセット中の度数に基づき重みを割り当て、前記重みが、前記標識のそれぞれのための所望のパネル度数にさらに基づくものであり、
ケースのセットからケースのサブセットを無作為に選択するように動作させ、前記標識のそれぞれのために、選択された前記サブセットにおける前記標識の度数が、その標識のための前記所望のパネル度数に近似するように、前記無作為な選択が、ユーザの前記割り当てられた重みに従って重み付けされる、
製品。
前記標識が人口動態変数であり、前記所望のパネル度数が、前記人口動態変数に関する母集団における既知の度数である、請求項１４に記載の製品。
前記命令がさらに、前記少なくとも１つのプロセッサを、前記所望のパネル度数に近似する度数を備える標識を有する前記選択されたサブセットに基づき、前記選択されたサブセットと関連するデータを分析するように動作させる、請求項１４に記載の製品。
ケースのサブセットを前記無作為に選択することが、
前記ケースのそれぞれに確率変数を割り当てることと、
選択閾値を生成するように、それぞれのケースの前記割り当てられた重みを、前記ケースの割り当てられた確率変数によって除算することと、
最も高い選択閾値を有するケースを選択すること
を含む、請求項１４に記載の製品。
前記命令がさらに、前記少なくとも１つのプロセッサを、ケースのセットから、ケースの第２のサブセットを無作為に選択するように動作させ、前記標識のそれぞれのために、前記選択されたサブセットにおける前記標識の度数が、その標識のための前記所望のパネル度数に近似するように、前記無作為な選択が、ユーザの前記割り当てられた重みに従って重み付けされる、請求項１４に記載の製品。
前記命令がさらに、前記少なくとも１つのプロセッサを、前記サブセットからのデータを前記データの代表標本として表示させるように動作させる、請求項１４に記載の製品。