[0001]本出願は、参照によってその全体が本明細書に組み込まれる、2009年1月29日に出願された「Methods and Apparatus to Measure Market Statistics」と題する米国仮出願第61/148251号の利益を主張する。
[0012]以下では、例示的な方法、及びコンポーネントの中でも特に、ハードウェア上で実行されるソフトウェアを含む装置が開示されるが、そのような方法及び装置は、説明的なものにすぎず、限定的なものと見なされるべきではない。例えば、これらのハードウェアコンポーネント及びソフトウェアコンポーネントのいずれか又はすべては、排他的にハードウェアで、排他的にソフトウェアで、又はハードウェアとソフトウェアの任意の組み合わせで具現することができる。したがって、以下では、例示的な方法、システム、及び装置が説明されるが、提供される例は、そのような方法、システム、及び装置を実施するための唯一の方法ではない。
[0013]市場統計を測定するための例示的な方法及び装置が開示される。開示される例示的な方法は、マネージドデータソース(managed data source)からサービス浸透値(service penetration value)を取り出すステップと、コンビニエンスデータソース(convenience data source)からインターネットプロトコル(IP)アドレスを取り出すステップと、取り出されたIPアドレスに関連付けられた家庭識別番号(household identification number)を識別するステップを含む。例示的な方法は、家庭識別番号に関連付けられた家庭データを取り出すステップと、コンビニエンスデータソースによって提供されたサービスプロバイダ名を検証するステップと、コンビニエンスデータソースによって提供されたサービスプロバイダ名が現在のサービスプロバイダ名と異なる場合に、取り出された家庭データの重み値を調整するステップも含む。加えて、例示的な方法は、調整された重み値及びサービス浸透値に基づいて、サービスプロバイダのフロー占有率(flow share)を計算するステップと、計算されたサービスプロバイダのフロー占有率を含むレポートを生成するステップも含む。
[0014]開示される例示的な装置は、マネージドデータソースからサービス浸透値を取り出すためのレジストリマネージャ(registry manager)と、家庭識別番号に関連付けられたコンビニエンスデータソースを識別し、家庭識別番号に関連付けられたインターネットプロトコル(IP)アドレスを獲得するためのデータソースロケータ(data source locator)と、家庭識別番号に関連付けられたコンビニエンスデータソースからデータを取り出すためのネットワークインタフェースを含む。例示的な装置は、コンビニエンスデータソースから取り出され、IPアドレスに関連付けられたサービスプロバイダ名に基づいて、検証されるサービスプロバイダ名を生成するためのデータソースコンバイナ(data source combiner)と、コンビニエンスデータソースから取り出されたサービスプロバイダ名が検証されるサービスプロバイダ名と異なる場合に、コンビニエンスデータソースから取り出されたデータの重み値を調整するためのデータソース重みカリキュレータ(data source weight calculator)と、コンビニエンスデータソースからの調整された重み値、及びサービス浸透値に基づいて計算された市場占有率に基づいて、サービスプロバイダのフロー占有率を計算するためのテストマネージャ(test manager)も含む。
[0015]以下の例では、インターネットサービスプロバイダ(ISP)について説明するが、そのような例は、便宜的に提供されるものであり、ISPに限定されると解釈すべきではなく、本明細書で説明される方法及び装置は、他の任意のタイプのプロバイダにも適用することができる。メディアプロバイダ(例えば、ケーブルテレビプロバイダ、衛星プロバイダ)及び/又はISPなどのプロバイダが、加入者を増やす、又は減らす場合、プロバイダは、競合相手も同様の増加又は減少を経験したかどうかを知ることに特に関心がある。例えば、ISP及び1つ又は複数の競合相手が、同様の増加を経験する場合、市場地域全体が、成長を経験していることがある。ISPは、そのような兆候に促されて、広告及び/又は販売促進リソースを増やし、獲得し得る加入者のより大きな部分を1つ又は複数の競合相手が獲得する前に、そのような成長(例えば市場占有率)機会を獲得しようと試みることがある。あるいは、ISP及び1つ又は複数の競合相手が、加入者の減少を経験する場合、市場地域全体が、停滞及び/又は縮小していることがあり、そのことが、広告及び/又は販売促進努力を1つ又は複数の代替市場に集中すべきであることを示唆することがある。他方、ISPの市場占有率が、1つ若しくは複数の競合相手よりも高い場合、及び/又は新規加入者の比率が、1つ若しくは複数の競合相手と比較して増加している場合、ISPは、広告キャンペーン及び/又は販売促進に効果があったことを見抜くことができる。
[0016]本明細書で説明される方法及び装置は、一つには、IPアドレスがアクティブか、それとも非アクティブかにかかわらず、加入者に関連付けることができる候補インターネットプロトコル(IP)アドレス、各IPアドレスに関連付けられたISP、及び/又はIPアドレスのロケーションを識別する。以下でさらに詳細に説明されるように、本明細書で説明される方法及び装置は、ユーザが、対象とする1つ若しくは複数の市場(複数可)についてのブロードバンド市場データを収集すること、及び/又は対象とする1つ若しくは複数のデータソースから収集することを可能にする。そのため、一つには、市場統計計算の信頼性は統計的に有意な量の代表データが入手可能な場合に増加するので、ユーザは、1つ又は複数のブロードバンドISPについての市場占有率をより良く計算することができる。例示的な市場占有率データベースは、既知のISP、ネームサーバ、並びに/又はISP及び/若しくはIPアドレスに関連付けられたルータ名称(例えば、ge−0−1−ubr01.warren.ma.boston.comcast.net)を記憶するために、スケジュールされたタイミングで、手動で、定期的に、又は不定期に更新される。特に、本明細書で説明される例示的な方法及び装置は、地理(例えば、「ma」、「boston」など)及び/又は対象とする1つ若しくは複数の市場を表すことができる、1つ若しくは複数のキーワード、文字、数字、ラベル、及び/又はそれらの組み合わせを識別する。
[0017]図1は、ブロードバンド市場統計を測定するための例示的なシステム100の図である。図1の説明的な例では、システムは、レジストリデータベース(registry database)104及び市場情報データベース(market information database)106に通信可能に接続された市場占有率エバリュエータ(market share evaluator)102を含む。例示的なレジストリデータベース104は、1つ若しくは複数の登録IPアドレス及び/又はドメイン名にどの登録者が関連付けられるかを識別する、1つ又は複数のデータベースを含むことができる。そのようなレジストリデータベース104は、限定することなく、アメリカンレジストリフォーインターネットナンバーズ(ARIN:American Registry for Internet Numbers)、インターネットコーポレーションフォーアサインネームアンドナンバー(ICANN:Internet Corporation for Assigned Names and Number)、マックスマインド(Maxmind)(登録商標)によるIPジオロケーション(IP Geolocation)などからの情報を含む。加えて、例示的な市場情報データベース106は、一つには、暗号化されていることがある、及び/又は別の理由で本明細書で説明される方法及び装置のユーザにはよく分からない1つ又は複数のホスト名ラベルの解決を可能にする、例示的な解決キーワードテーブル(resolution keyword table)107内に解決キーワードを含む。例えば、ARINへの例示的なWhoisクエリに対する応答として、州、市、及び/又は既知のISP名と明白な関係をもたない、1つ又は複数のラベルが返されることがある。したがって、例示的な解決キーワード107は、そのようなラベルを解読するために使用することができる。
[0018]例示的な市場占有率エバリュエータ102は、インターネットなどの1つ又は複数のネットワーク108にも通信可能に接続される。例示的なISP「A」110、ISP「B」112、及びISP「C」など、任意の数のISPが、ネットワーク108に通信可能に接続され、各ISPは、家庭用通信デバイス(household communication device)116a〜116dに1つ又は複数のサービスを提供する。家庭用通信デバイス116a〜116dは、限定することなく、ルータ、モデム、及び/又はISPに通信可能に接続される他の機器を含むことができる。各例示的なISPは、識別された地理的な市場地域において、(例えば、家庭用インターネットアクセス、電話、及び/又はメディアサービスなどの)サービスを提供することを担当することができる。図1の説明的な例では、ISP「A」110は、1つ又は複数の家庭用通信デバイス116aにサービスを提供し、ISP「B」112は、1つ又は複数の家庭用通信デバイス116bにサービスを提供し、その両方とも、例示的な第1の市場地域118内に所在する。他方、例示的なISP「C」114は、例示的な第2の市場地域120内の1つ又は複数の家庭用通信デバイス116cにサービスを提供する。
[0019]図1の説明的な例では、ISP「A」110は、第1の市場地域118及び第2の市場地域120の両方で、1つ又は複数の家庭用通信デバイスにサービスを提供する。以下でさらに詳細に説明されるように、各家庭用通信デバイスには、ISPによって、そのISPによる使用及び/又は管理のために登録されたIPアドレス(例えば、静的IPアドレス又は動的IPアドレス)が割り当てられる。対象ISPが(例えば、1つは第1の市場地域118に、1つは第2の市場地域120になど)2つ以上の市場地域に存在する場合、本明細書で説明される方法及び装置は、1つ又は複数の技法を実行して、家庭用通信デバイス(複数可)に割り当てられたIPアドレスに対して最もよく当てはまる地理的インジケータ(例えば、州、市など)を確定する。例えば、例示的な家庭用通信デバイス116aの1つが、208.180.36.166というIPアドレスを有し、例示的な家庭用通信デバイス116dの1つが、208.180.250.75というIPアドレスを有し、その両方がISP「A」110によって登録される場合、本明細書で説明される方法及び装置は、各IPアドレスを、地理的ロケーション手掛かり(geographic location cue)を提供する対応するISPルータに関連付ける。特に、本明細書で説明される方法及び装置は、208.180.36.166というIPアドレスへの通信経路内の最終ルータホップが、ホスト名「s208−180−36−166.snjs.ca.sta.suddenlink.net」に関連付けられ、そのホスト名が、1つ又は複数の地理的ロケーション手掛かり(例えば、「snjs」はサンノゼ(San Jose)を指示する)を含むことを識別することができる。
[0020]限定することなく、本明細書で説明される方法及び装置は、1つ又は複数のIPアドレスをテストして、対象IPアドレスがアクティブか、それとも非アクティブかを決定する。一般的に言って、ISPは、加入者に割り当てることができるIPアドレスの1つ又は複数のブロックを登録する。ARINは、IPアドレスリソースを管理する5つの地域インターネットレジストリ(RIR:Regional Internet Registry)のうちの1つである。他のRIRは、アジア太平洋ネットワーク情報センタ(APNIC:Asia Pacific Network Information Centre)と、ラテンアメリカ及びカリブIPアドレス地域レジストリ(LACNIC:Latin American and Caribbean IP Address Regional Registry)を含む。ARINは、ユーザ(例えばISP)が、排他的に使用するための1つ又は複数のIPアドレスを(通常は手数料を取って)登録し、登録IPアドレスをホスト名と関連付けることを可能にする、1つ又は複数のプロセスを円滑化する。ARINは、IPアドレスの問い合わせ(例えば、Whoisクエリ)が、対応するホスト名、組織情報、及び/又は組織が他の登録IPアドレス(例えば、IPアドレスのブロック)を有するかどうかを返すことを可能にする、データベース検索機能も円滑化する。しかし、組織情報は、対応する連絡先名及び/又はアドレスを含むこともあるが、そのような組織情報は、登録IPアドレス(複数可)がどこで使用されているか(どこに所在するか)を示さないこともある。これを説明すると、本明細書が書かれている時点で、IPアドレス68.87.148.146は、ニュージャージー州マウントローレルに組織アドレスを有する、コムキャストケーブルコミュニケーションズ社(Comcast Cable Communications, Inc.)に関連付けられている。ARINデータベースは、この組織が、68.80.0.0〜68.87.255.255の範囲のIPアドレスのブロックを登録していることも示す。しかし、IPアドレス68.87.148.146についてのユーザデータグラムプロトコル(UDP)及び/又はインターネット制御メッセージプロトコル(ICMP)のトレースルート(trace−route)は、最終ルータホスト名が「ge−0−1−ubr01.warren.ma.boston.comcast.net」であることを明らかにする。上で説明されたように、例示的なホスト名内のラベルは、対象IPアドレスがどこで使用されている可能性が高いかについての少なくとも2つの地理的手掛かり(すなわち、「ma」及び「boston」)を提供する。この例では、IPアドレス68.87.148.146に関連付けられた最もよく当てはまる地理的ロケーションは、マサチューセッツ州ボストンである。
[0021]ホスト名の概念は、一つには、特定のIPアドレスとの関連を人間が読めるようにする手助け行うが、ホスト名及び/又はドットを用いて連結された1つ若しくは複数のホスト名のラベルは、それを読もうと試みる人間にとって依然として暗号化されているように見えることがある。例えば、例示的なホスト名「snjs.ca.sta.suddenlink.net」内のラベルは、サンノゼ地域に馴染のない人間には、有用な情報を明かしているとは容易に思えないことがある。あるいは、ユーザは、ラベル「ca」を、カリフォルニアではなく、カナダに関連する名称と勘違いすることがある。ホスト名ラベルの解決、並びに地理的及び/又は組織的な関連(複数可)の決定をより良く行うため、本明細書で説明される方法及び装置は、ホスト名ラベルを解析し、(例えば、論理AND判定により)マッチする組み合わせを求めて、例示的な市場情報データベース106を検索する。論理ANDの後で2つ以上のラベルのマッチが見出された場合、IPアドレスに関連付けられた候補地理的ロケーション及び/又は関連組織を決定することができる。上で識別された例示的なホスト名「snjs.ca.sta.suddenlink.net」を用いて説明すると、本明細書で説明される方法及び装置は、ルータホスト名が、カリフォルニア州サンノゼに所在する組織サドンリンクコミュニケーションズ社(Suddenlink Communications, Inc.)に適切に関連付けられていると結論する前に、ラベル「snjs」、「ca」、及び「suddenlink」の組み合わせを検索する。
[0022]図1の説明的な例に戻ると、1つ又は複数の家庭用通信デバイスは、パネリストルータ「A」122a、パネリストルータ「B」122b、及びパネリストルータ「C」122cなどの1つ又は複数のパネリストに関連付けることができる。1つ又は複数のパネリスト家庭は、より大きな母集団に対する予測を許容可能な程度の信頼性で行うことができるような、行動についての統計的に有意な標本サイズを獲得するために、例えば、マーケティングエンティティによって選択することができる。パネリストは、統計的有意性を達成し、参加者のより大きな母集団(例えば、インターネットサービスの加入者、メディアデバイスの視聴者、ヒスパニック系消費者、日本人消費者など)についての1つ又は複数の特定の地理的及び/又は人口統計的な側面を表すように、一般に十分な数が選択される。一般に、1つ又は複数の家庭は、一つには、1つ又は複数の家庭行動が監視されることについてのモニタリングエンティティ(例えばマーケティングエンティティ)との合意に基づいて、パネリストになる。モニタリングエンティティが関心を示す家庭行動は、限定することなく、視聴されるテレビ番組、番組が視聴される日時、ショッピング行動、訪問されるウェブサイト、及び/又は購入される家庭向けサービス(例えば、インターネットサービス、電話サービスなど)を含む。家庭パネリストとの合意は、家庭アドレスに関する明示的な情報も含み、それによって、家庭パネリストのロケーションが明らかになる。図1の説明的な例では、パネリスト122a〜122cは、それらのルータ(複数可)に割り当てられたIPアドレス、及び家庭が加入するISPに関する情報も提供する。
[0023]以下でさらに詳細に説明されるように、例示的な市場占有率エバリュエータ102は、定期的に、不定期に、手動で、又はスケジュールされたタイミングで、パネリスト家庭122a〜122cからアップデートを取り出して、その家庭によって直近に使用されたIPアドレス及びISPを獲得する。例えば、各パネリスト家庭は、割り当てられたルータIPアドレスを決定し、そのようなIPアドレス情報をマーケティングエンティティに電子メールで返信する1つ又は複数のアプリケーションを実行する、1つ又は複数のパーソナルコンピュータを有することができる。どのISPがインターネットサービスを供給するかを家庭が変更しようと決定した場合、例示的な市場占有率エバリュエータ102は、新規及び/又は代替ISPに関する情報を用いて、例示的な市場情報データベース106を更新する。このようにして、システム100は、第1の市場地域118及び/又は第2の市場地域120に参入する追加のISPについても評価済の状態に保つことができる。加えて、例示的な市場占有率エバリュエータ102は、新規及び/又は代替ISPを表す、1つ又は複数の新規及び/又は代替ホスト名ラベルを識別する。結果として、IPアドレスロケーション及びそれに関連する組織(例えば関連するISP)に関するホスト名解決を、適切なラベル(複数可)を使用して実行することができる。
[0024]図2は、図1に示された例示的な市場占有率エバリュエータ102の詳細な概略図である。例示的な市場占有率エバリュエータ102は、テストマネージャ202と、IPアドレスアグリゲータ(IP address aggregator)204と、例示的なピングマネージャ(ping manager)206及びポートスキャンマネージャ(port scan manager)208を含むアクティビティデターミナ(activity determiner)205とを含む。例示的な市場占有率エバリュエータ102は、例示的なレジストリデータベース104に通信可能に接続されたレジストリマネージャ210も含む。さらに、例示的な市場占有率エバリュエータ102は、ホスト名リゾルバ(hostname resolver)212と、例示的なネットワーク202(例えばインターネット)に通信可能に接続されたネットワークインタフェース214と、パネリストアップデータ(panelist updater)216と、データソースロケータ218と、データソース重みカリキュレータ220と、データソースコンバイナ222とを含む。例示的なテストマネージャ202は、市場情報データベース106、IPアドレスアグリゲータ204、ピングマネージャ206、ポートスキャンマネージャ208、レジストリマネージャ210、ホスト名リゾルバ212、ネットワークインタフェース214、パネリストアップデータ216、データソースロケータ218、データソース重みカリキュレータ220、及びデータソースコンバイナ222に通信可能に接続されて、それらの1つ又は複数のサービスを起動する。例示的なテストマネージャ202は、定期的に、スケジュールされたタイミングで、不定期に、及び/又は手動で、1つ又は複数のIPアドレスのテストを起動して、それがアクティブか、それとも非アクティブかを決定する。加えて、例示的なテストマネージャ202は、IPアドレスに関連付けられた対応する組織及びロケーションを決定する。IPアドレスのアクティブ/非アクティブステータス、組織、及びロケーションに関する情報が獲得されると、例示的なテストマネージャ202は、加入者にインターネットサービスを提供する各組織について、市場占有率統計を計算する。
[0025]動作中、例示的なテストマネージャ202は、テストを実行しているときに、例示的なIPアドレスアグリゲータ204を起動して、1つ又は複数の対象IPアドレスを獲得する。例えば、IPアドレスアグリゲータ204は、市場情報データベース106から1つ又は複数の対象IPアドレスを提供することができ、市場情報データベース106は、アクティブ/非アクティブ状態を決定するために以前に行われた1つ又は複数のテストから識別されたIPアドレスを記憶することができる。そのため、例示的な市場情報データベース106内のデータは、最新に維持することができる。限定することなく、例示的なIPアドレスアグリゲータ204は、1つ又は複数のパネリスト家庭122a〜122cの1つ又は複数のIPアドレスを選択する。加えて、IPアドレスアグリゲータ204は、パネリストに関連付けられたISPによって登録されたIPアドレスのブロックの一部とすることができる、1つ又は複数の近隣IPアドレスも選択することができる。IPアドレスアグリゲータ204は、レジストリマネージャ210を起動して、特定の組織/ISPに関連付けられた1つ又は複数のIPアドレスを獲得することもできる。例えば、IPアドレスアグリゲータ204は、組織名「WOW MEDIA」を指定して、どのIPアドレス及び/又はIPアドレスのブロックが対象とする組織/ISPによって登録されたかを決定することができる。動作中、例示的なレジストリマネージャ210は、ARINなどの少なくとも1つのレジストリデータベースとコンタクトを取り、レジストリデータベースへの入力として組織名キーワードを提供する。問い合わせに対する応答として、例示的なレジストリマネージャ210は、キーワード入力(複数可)に関連付けられた対応するIPアドレス、シード開始IPアドレス(seed starting IP address)、及び/又はIPアドレスのブロックを受け取る。レジストリデータベースへの問い合わせから識別された戻りIPアドレスのすべてをテストする代わりに、例示的なテストマネージャ202は、ブロック(例えばブロックのサブセット)から所定の数のIPアドレスをランダムに選択して、テストすることができる。そのため、IPアドレスを代表するランダムな標本は、市場における組織の存在感の妥当な指標を提供することができる。加えて、又は代替的に、例示的なテストマネージャ202は、組織に関連付けられた範囲内でランダムに選択されたIPアドレスとして、シード開始IPアドレスを利用することができる。ランダムに選択されたシード開始IPアドレスは、テストするIPアドレスの範囲内で、開始IPアドレス、終了IPアドレス、及び/又は中間点IPアドレスとして機能することができる。
[0026]対象IPアドレスがアクティブであるかどうかを決定するため、例示的なピングマネージャ206は、対象IPアドレスを使用し、例示的なネットワークインタフェース214を介して、ICMPピング(ICMP Ping)動作を実行する。一般的に言って、ピングは、ネットワークを介してホストに到達可能であるかどうかを決定するために利用される、コンピュータネットワークツールであり、対象とするターゲットIPアドレスにICMPエコー要求パケットを送信する。各エコー要求パケットを送信した後、例示的なピングマネージャ206は、ネットワークインタフェース214を介して、ICMPエコー応答返信メッセージをリスン(listen)する。そのような返信メッセージを受信した場合、対象IPアドレスはアクティブであると見なされる。いくつかの例では、ISP及び/又は経路内の1つ若しくは複数のルータが、(例えばセキュリティ上の懸念から)ピング要求をブロックすることがあり、その時点で、例示的なポートスキャンマネージャ208が、対象IPアドレスに関連付けられた、マシンの1つ又は複数のポート(例えば、httpサービスのTCPポート80、httpsサービスのTCPポート443など)をスキャンしようと試みる。ポートスキャンが成功すれば、対象IPアドレスはアクティブであると見なされる。一般的に言って、いくつかのISPは、ポートスキャン若しくはピングのどちらか、又はそれらの両方をブロックすることがある。ピングもポートスキャンも成功しなかった場合、対象IPアドレスは非アクティブであると見なされ、市場情報データベース106がしかるべく更新される。
[0027]ピング又はポートスキャンに成功した対象IPアドレスは、北米、カナダ、カリブ、及び北大西洋諸島のIPアドレスについてのレジストリ情報を記憶しているARINデータベースなどの、1つ又は複数のレジストリデータベース104から獲得された情報にさらに関連付けられる。ARINデータベースへの問い合わせは、Whoisクエリとも呼ばれ、Whoisクエリは、入力としてIPアドレス又はホスト名を受け入れ、限定することなく、関連組織、連絡先人物(複数可)、連絡先電話番号(複数可)、連絡先アドレス、及び/又は連絡先電子メールアドレスを含む情報を返す。ARINへの問い合わせから返された組織情報は、組織が会社か、大学か、それともISPかを表すマッチを求めて、市場情報データベース106と照合される。対象IPアドレスがISPに関連付けられる場合、それは家庭用に使用されるとも見なされる。
[0028]本明細書で説明される方法及び装置は、対応するロケーション及びさらに詳細な所有情報をさらに決定する。言い換えると、上で説明されたARINへの問い合わせは、対象IPアドレスを登録した組織を識別するが、そのような組織は、最終ユーザではなく、IPアドレスのリセラ(reseller)であることがある。そのため、図2の例示的なホスト名リゾルバ212は、真の所有を表す1つ又は複数の手掛かりを識別するために、IPアドレスに対してリバースドメインネームサーバ(DNS)検索(reverse domain name server lookup)(NSLookup(ネームサーバ検索)と呼ばれることもある)を実行する。例えば、IPアドレス64.236.16.20についてのARINデータベースへの問い合わせは、64.236.0.0〜64.236.255.255の範囲の登録IPアドレスを有する組織として、「AOL Transit Data Network」を識別する。しかし、IPアドレス64.236.16.20に対する最終団体及び/又はエンドユーザは、例示的なホスト名リゾルバ212によって実行されるリバースDNS検索(リバース解決(reverse resolve)とも呼ばれる)に基づいて、より正確に決定され、「www2.cnn.com」というホスト名が判明する。したがって、例示的なホスト名リゾルバ212は、ホスト名を解析し、「cnn」を抽出し、ラベルマッチが例示的な市場情報データベース106において見出された場合、真のエンドユーザがCNNであることを確定する。
[0029]対象IPアドレスに関連付けられたロケーションを決定するため、例示的なホスト名リゾルバ212は、マルチロケーショントレースルート(multi−location trace−route)を実行する。一般的に言って、トレースルートは、IPネットワーク内でパケットが横断するルータを識別するためのコンピュータネットワークアプリケーションである。トレースルートアプリケーションは、要求者に最も近いルータから開始し、ターゲットIPアドレスに最も近い最終ルータで終了する、ルータの複数のホップを識別する。各ホップ中のルータ識別は、一つには、各ルータの名前を含む。ルータホップは、一つには、代替ホップ宛先を生じさせる1つ又は複数のファイヤウォールによって影響されることがある。一般に、最終ルータとして挙げられるのは、一連のルータホップのうちで対象IPアドレスに関連付けられたデバイスに地理的に最も近いものである。トレースルートテストを実行している要求者のロケーションに応じて、1つ又は複数のルータホップが、別のロケーションにいる要求者と比較した場合に、異なることがある。どちらの場合も、最終ルータホップは、通常は同じであるが、いくつかの例では、最終ルータホップが、異なるルータを識別することがある。そのような代替経路は、例えば、ハードウェア故障(複数可)、電源障害(複数可)、及び/又は局所的な天候上のトラブルが原因で、1つ又は複数のルータ経路(複数可)がダウンするような例示的な場合において、生じることがある。
[0030]トレースルート中の最終ルータホップが正しいことの信頼性レベルを向上させるため、例示的なホスト名リゾルバ212は、マルチロケーショントレースルートを実行し、マルチロケーショントレースルートでは、開始トレースルートテストは、同じ対象IPアドレスを使用するが、開始ロケーションは別々である。例えば、IPアドレス24.32.38.55についての第1のトレースルートは、カリフォルニア州サンフランシスコにおいて開始することができ、同じIPアドレスについての第2のトレースルートは、テキサス州ダラスにおいて開始することができ、同じIPアドレスについての第3のトレースルートは、ヴァージニア州リンドバーグにおいて開始することができる。これらの開始ロケーションは3つともすべて、1つ又は複数の独自の初期ルータホップを含むが、テストパケットの最終経路は、同じ最終ホップルータに到達することが期待される。すべてのトレースルートテストが同じ最終ホップルータ情報(例えば、s208−180−36−166.snjs.ca.sta.suddenlink.net)を識別した場合、例示的なホスト名リゾルバ212は、ロケーションを表す手掛かりを求めて、ホスト名のラベルを解析する。そのような手掛かり(例えば、ラベル「snjs」、「ca」、及び「suddenlink」)は、組織(例えばISP)、市(例えば「snjs」)、州(例えば「ca」、「ma」など)、又は他の任意の地理的識別子を指示する暗号的な省略形及び/又は符号を解決し、又は他の方法で変換するために、例示的な市場情報データベース106に記憶されたそれらのラベルと照合される。他方、別々の開始ロケーションの必ずしもすべてが、最終的に同じ最終ホップルータをもたらさない場合、例示的なホスト名リゾルバ212は、ロケーション手掛かりを求めてホスト名からのラベルを解析する前に、閾値テストを利用することができる。言い換えると、すべてよりも少ない別々の開始ロケーションしか同じ最終ホップルータ名をもたらさない場合、最終ホップルータが実際のIPアドレスロケーションであることの信頼性の程度は低くなる。
[0031]対象IPアドレスがアクティブか、それとも非アクティブかを識別した後、また対応するIPアドレス所有者(例えば、単にレジストリによって名前が挙げられた組織ではなく、真のエンドユーザ)を識別した後、また対象IPアドレスに対応するロケーションを識別した後、本明細書で説明される方法及び装置は、そのような情報を(例えば表形式情報として)例示的な市場情報データベース106に保存する。一般に、ブロードバンド市場統計を測定することに関心がある1つ又は複数のエンティティは、いかなる計算結果でもそれを統計的に有意であると見なす前に、十分な量の標本測定値を獲得することを好む。そのため、本明細書で説明される方法及び装置は、任意の所定の期間中におけるアクティブなIPアドレスに対応する市場占有率(例えば、1日当たり、1週間当たり、2週間当たり、1月当たりで計算された市場占有率)を計算する前に、任意の数の対象IPアドレスをテストすることができる。例えば、例示的な市場占有率エバリュエータ102が、第1のISPに関連付けられた500のIPアドレスと、第2のISPに関連付けられた500のIPアドレスをテストする場合、例示的なテストマネージャ202は、第1のISP及び第2のISPの各々について、アクティブなIPアドレスに対応するパーセンテージを計算する。そのような計算されたパーセンテージは、地理的地域別の予測されるブロードバンド市場存在感を決定し、及び/又は競合ISPの市場占有率浸透の1つ若しくは複数のトレンドを識別するために、例えば週ベースで求めることができる。
[0032]以前にアクティブとして識別されたIPアドレス、及び/又は組織に関連付けられたIPアドレスは、後の日/時における以降のテストのために、例示的な市場情報データベース106に保存される。例えば、ISPサービスの加入者は、そのISPを解約して、競合相手のISPに乗り換えることがあり、それによって、以前はアクティブだったIPアドレスが、非アクティブ/休眠状態にされる。その同じIPアドレスについての以降のテストは、そのIPアドレスが、ある期間にわたって休眠/非アクティブ状態にあること、又は別の加入者に再割り当てされていることを明らかにすることがある。加えて、以前に識別されたIPアドレス(複数可)に対して1つ又は複数の以降のテストを実行することで、各問い合わせがアクセス料に関連付けられることがある、レジストリデータベース(複数可)への追加的な問い合わせの必要性をなくすこと、及び/又は最低限に抑えることができる。
[0033]本明細書で説明される方法及び装置はまた、一つには、1つ若しくは複数のより大きな母集団に対する予測を行うのに十分な数の標本を獲得するために、及び/又は統計的に有意な計算(複数可)を可能にするのに十分に大きな若しくは十分に代表的な標本サイズを単独では含まないことがある1つ若しくは複数のデータソースを利用するために、2つ以上のデータソースを組み合わせる。図11〜図13に関連してさらに詳細に説明されるように、例示的なデータソースロケータ218は、図10の例示的なデータベース情報プール(database information pool)1060によって記憶された、及び/又は他の方法で識別される、1つ又は複数のデータソースを識別する。例えば、新しいマネージド及び/又はアンマネージド(コンビニエンス)データソースがユーザによって識別された、及び/又は知られた場合、そのようなデータソースは、その特性とともに例示的なデータベース情報プール1060に記憶することができる。データソース特性は、限定することなく、データソースの標本サイズに関する情報、標本が獲得された日付(複数可)、標本が獲得された地理、及び/又はデータソース(複数可)に対応する重み付け係数を含むことができる。データベース情報プール1060において識別される1つ又は複数のデータソースが、一般に地理的な標本範囲を表す、対応する重み値を含まない場合、例示的なデータソース重みカリキュレータ220は、1つ又は複数の重み計算を実行して、識別されたデータソースに対応する地理的範囲に基づいて重み値を生成する。加えて、例示的なデータソースコンバイナ222は、1つ又は複数のデータソースを組み合わせて、代表標本サイズを増やし、そのサイズは、標本数がより多い対象とする地域に対する1つ又は複数の予測及び/又は市場統計計算を可能にする。
[0034]図1及び図2では、ブロードバンド市場統計を測定するための例示的なシステム100、及び例示的な市場占有率エバリュエータ102が説明されたが、図1及び図2で説明されたインタフェース、データ構造、要素、プロセス、及び/又はデバイスの1つ又は複数は、組み合わせ、分割、再配置、省略、排除、及び/又は他の任意の方法で実施することができる。さらに、図1、図2、及び図10の例示的な市場占有率エバリュエータ102、例示的なテストマネージャ202、例示的なIPアドレスアグリゲータ204、例示的なピングマネージャ206、例示的なポートスキャンマネージャ208、例示的なレジストリマネージャ210、例示的なホスト名リゾルバ212、例示的なネットワークインタフェース214、例示的なパネリストアップデータ216、例示的なデータソースロケータ218、例示的なデータソース重みカリキュレータ220、及び/又は例示的なデータソースコンバイナ222は、ハードウェア、ソフトウェア、及び/又はファームウェアによって実施することができる。したがって、例えば、例示的な市場占有率エバリュエータ102、例示的なテストマネージャ202、例示的なIPアドレスアグリゲータ204、例示的なピングマネージャ206、例示的なポートスキャンマネージャ208、例示的なレジストリマネージャ210、例示的なホスト名リゾルバ212、例示的なネットワークインタフェース214、例示的なパネリストアップデータ216、例示的なデータソースロケータ218、例示的なデータソース重みカリキュレータ220、及び/又は例示的なデータソースコンバイナ222のいずれも、1つ又は複数の回路(複数可)(ASIC(複数可))、プログラム可能論理回路(複数可)(PLD(複数可))、及び/又はフィールドプログラム可能論理回路(複数可)(FPLD(複数可))などによって実施することができる。純粋なソフトウェア及び/又はファームウェア実施に言及する添付の特許請求の範囲のいずれかが読まれる場合、例示的な市場占有率エバリュエータ102、例示的なテストマネージャ202、例示的なIPアドレスアグリゲータ204、例示的なピングマネージャ206、例示的なポートスキャンマネージャ208、例示的なレジストリマネージャ210、例示的なホスト名リゾルバ212、例示的なネットワークインタフェース214、例示的なパネリストアップデータ216、例示的なデータソースロケータ218、例示的なデータソース重みカリキュレータ220、及び/又は例示的なデータソースコンバイナ222のうちの少なくとも1つは、ファームウェア及び/又はソフトウェアを記憶する、メモリ、デジタル多用途ディスク(DVD)、コンパクトディスク(CD)などの、有形な媒体を含むことが、ここで明示的に確定される。またさらに、通信システムは、インタフェース、データ構造、要素、プロセス、及び/若しくはデバイスを、図1、図2、及び図10に図示されるものの代わりに、若しくはそれらに加えて含むことができ、並びに/又は図示されるインタフェース、データ構造、要素、プロセス、及び/若しくはデバイスのいずれか若しくはすべてを2つ以上含むことができる。
[0035]図3〜図8及び図11〜図13は、図1、図2、及び図10の例示的な市場占有率エバリュエータ102を実施するために実行することができる、例示的なプロセスを示している。図3〜図8及び図11〜図13の例示的なプロセスは、プロセッサ、コントローラ、及び/又は他の任意の適切な処理デバイスによって実施することができる。例えば、図3〜図8及び図11〜図13の例示的なプロセスは、フラッシュメモリ、CD、DVD、フロッピディスク、リードオンリメモリ(ROM)、ランダムアクセスメモリ(RAM)、プログラム可能ROM(PROM)、電気的プログラム可能ROM(EPROM)、及び/又は電気的消去可能PROM(EEPROM)、光記憶ディスク、光記憶デバイス、磁気記憶ディスク、磁気記憶デバイス、並びに/或いはマシン可読命令又はデータ構造の形式でプログラムコード及び/又は命令を搬送若しくは記憶するために使用でき、また汎用若しくは専用コンピュータ、又はプロセッサを有する他のマシン(例えば、図14に関連して以下で説明される例示的なプロセッサプラットフォームP100)によってアクセスできる他の任意の媒体など、任意の有形なコンピュータ可読媒体上に記憶された符号化命令で具現することができる。上記のものの組み合わせも、コンピュータ可読媒体の範囲内に含まれる。マシン可読命令は、例えば、プロセッサ、汎用コンピュータ、専用コンピュータ、又は専用処理マシンに1つ又は複数の特定のプロセスを実施させる、命令及び/又はデータを含む。代替として、図3〜図8及び図11〜図13の例示的なプロセスのいくつか又はすべては、ASIC(複数可)、PLD(複数可)、FPLD(複数可)、個別論理、ハードウェア、ファームウェアなどの任意の組み合わせを使用して実施することができる。また、図3〜図8及び図11〜図13の例示的なプロセスの1つ又は複数の動作は、代わりに、手動で、又は以下の技法のいずれかの任意の組み合わせとして、例えば、ファームウェア、ソフトウェア、個別論理、及び/若しくはハードウェアの任意の組み合わせとして、実施することができる。さらに、図3〜図8及び図11〜図13の例示的な動作を実施する他の多くの方法を利用することができる。例えば、ブロックの実行の順序は、変更することができ、及び/又は説明されるブロックの1つ若しくは複数は、変更し、排除し、細分化し、若しくは組み合わせることができる。加えて、図3〜図8及び図11〜図13の例示的なプロセスのいずれか又はすべては、順次的に実施することができ、及び/又は例えば、別個の処理スレッド、プロセッサ、デバイス、個別論理、回路などによって、並列に実施することができる。
[0036]図3の例示的なプロセス300は、テストマネージャ202が、テストする候補IPアドレスを選択することで開始する(ブロック302)。候補IPアドレスは、既知のパネリストに関連付けられたIPアドレス(複数可)に基づいて、例示的な市場情報データベース106から取り出すことができ、及び/又は候補IPアドレス(複数可)は、対象ISPに関連する問い合わせに対する応答として、例示的なレジストリデータベース104から獲得することができる。例えば、例示的なテストマネージャ202は、組織が1つ又は複数のIPアドレス及び/又はIPアドレスのブロックを登録しているかどうかを決定するために、組織名(例えばVerizon)を使用して、レジストリデータベース104(例えばARINデータベース)に問い合わせることができる(ブロック302)。
[0037]図4の例示的なプロセス400を手短に参照すると、例示的なテストマネージャ202は、テスト及び/又は再テストするパネリストのIPアドレスを獲得するために、例示的なパネリストアップデータ216を起動することができる。一般的に言って、多くのISPは、加入者にIPアドレスを静的にではなく動的に割り当てるので、そのような割り当てIPアドレスは、定期的な満了及び再割り当ての影響下にある。したがって、1つ又は複数のパネリストは、現在のIPアドレスを開示することに、並びに/又はさもなければ現在のIPアドレスを定期的に、手動で、不定期に、及び/若しくはスケジュールされたタイミングで報告する家庭用監視機器が、パネリスト家庭内で動作することを可能にすることに、同意することができる。限定することなく、家庭用監視機器は、どのIPアドレスがパネリスト家庭に割り当てられているかを決定するために、1つ又は複数の家庭用パーソナルコンピュータ上でアプリケーション(例えばipconfig)及び/又はスクリプトを起動することができる。
[0038]図4の説明的な例では、例示的なパネリストアップデータ216は、市場情報データベース106からパネリストを選択し(ブロック402)、パネリストに関連付けられた現在のIPアドレスを獲得する(ブロック404)。加えて、例示的なパネリストアップデータ216は、調査及び/又は家庭用監視デバイス(複数可)(例えば、ニールセン(Nielsen)(登録商標)ピープルメータ(PeopleMeter))を介して、他のパネリストISP情報を獲得する(ブロック406)。パネリストISP情報は、限定することなく、ISPの商号、パネリスト家庭に提供されるISPサービスのタイプ(例えば、DSLインターネットサービス、ケーブルインターネットサービス、光ファイバサービス(FiOS)など)を含むことができる。限定することなく、例示的なパネリストアップデータ216は、例示的な市場情報データベース106、調査、及び/又は家庭用監視デバイス(複数可)から、パネリスト人口統計情報を獲得することができる(ブロック408)。新しい及び/又は追加の情報が、1つ若しくは複数の調査を介して、及び/又は例えばニールセン(登録商標)オンライン視聴者測定サービスに関連する家庭用監視デバイス(複数可)を介して獲得される場合、そのような情報は、将来の使用のために市場情報データベース106に保存される(ブロック410)。例えば、以下でさらに詳細に説明されるように、図4の説明的で例示的なプロセス400の1回又は複数回の反復によって、テストのための追加の候補IPアドレスが収集される。1回又は複数回の反復によって獲得されるIPアドレスは、一つには、各候補IPアドレスのアクティブ又は非アクティブなステータスを決定する個々のテストのために、メモリ及び/又はデータベースに保存することができる。したがって、例示的なパネリストアップデータ216及び/又はIPアドレスアグリゲータ204は、一つには、例示的なテストマネージャ202が、必要な程度の信頼性を有する1つ又は複数の市場統計上の結論を下すのに十分な及び/又は統計的に有意な数の候補IPアドレスを有するように、チェックするパネリストがさらに存在するかどうかを決定する(ブロック412)。
[0039]図4の説明的で例示的なプロセス400は、テストのための1つ又は複数の候補IPアドレスをパネリストから獲得するが、図5の説明的で例示的なプロセス500も、IPアドレス登録者が近隣IPアドレスの1つ又は複数のブロックも管理しているかどうかを決定することによって、テストのための候補IPアドレスを獲得する。例示的なパネリストアップデータ216は、例示的な市場情報データベース106に記憶されたパネリストの一覧を問い合わせることによって、シードIPアドレスをパネリストから獲得する(ブロック502)。ARINデータベースなどのレジストリデータベース104への問い合わせのための入力としてシードIPアドレスを使用して、例示的なレジストリマネージャ210は、シードIPアドレスが、やはり同じ組織エンティティによって管理される、及び/又は登録された1つ又は複数の近隣IPアドレスを有するかどうかを表す、情報を獲得する(ブロック504)。例えば、69.47.21.141というパネリストシードIPアドレスを使用するARINデータベースへの問い合わせは、一つには、69.47.0.0〜69.47.255.255の範囲の登録IPアドレスを有する組織名「WideOpenWest Finance LLC」を明らかにする。同じ組織によって登録されたIPアドレスのこの見出された範囲に基づいて、例示的なテストマネージャ202は、ランダムな数のテストするIPアドレスを選択する(ブロック506)。選択されたランダムなIPアドレスは、テストマネージャ202によって、キュー又はメモリに一時的に保存することができ、組織についての登録IPアドレスの既知の範囲に関する情報が、将来の使用のために、例示的な市場情報データベース106に保存される(ブロック508)。言い換えると、「WideOpenWest Finance LLC」によって登録されたIPアドレスの範囲を決定するために、1つ又は複数のレジストリデータベース104への別の問い合わせを実行する代わりに、テストマネージャ202は、代わりに、テストするランダムなIPアドレスの別のグループを市場情報データベース106から選択する。例えば、より多数のIPアドレスを獲得して、統計的に有意な閾値を満たすために、別のシードIPアドレスが選択される場合(ブロック510)、制御はブロック502に戻る。加えて、結果を例示的な市場情報データベース106に保存した後(ブロック508)、テストするIPアドレスを獲得しようとする市場占有率エバリュエータ102による以降の試みは、1つ又は複数のレジストリデータベース104へのいかなる問い合わせもさらに必要としないことがある。代わりに、例示的なテストマネージャ202は、特定のISPに関連付けられているとして識別された候補IPアドレスを、市場情報データベース106から直接的に獲得することができる。
[0040]図3の説明的で例示的なプロセス300に戻ると、任意の数のIPアドレスが選択された後(ブロック302)、例示的なピングマネージャ206は、選択された候補IPアドレスの1つを使用して、ピング動作を実行し(ブロック304)、エコー応答メッセージが受信されるかどうかを決定し、受信された場合(ブロック306)、選択された候補IPアドレスはアクティブであると見なされる(ブロック308)。言い換えると、例示的なピングマネージャ206は、対象とする候補IPアドレスの活動ステータスを決定する。他方、ピング動作が、1つ又は複数のエコー応答メッセージを正常に返さない場合(ブロック306)、例示的なテストマネージャ202は、ポートスキャンを開始するようポートスキャンマネージャ208に指図し(ブロック310)、それが成功した場合(ブロック312)、選択された候補IPアドレスはアクティブであると見なされる(ブロック308)。しかし、ポートスキャンが成功しない場合(ブロック312)、選択されたIPアドレスは非アクティブであると見なされ(ブロック314)、制御はブロック304に戻って、テストする別の候補IPアドレスを選択する。
[0041]ピング又はポートスキャンによってアクティブであると見なされた(ブロック308)IPアドレスは、ARINデータベースなどの1つ又は複数のレジストリデータベース104への問い合わせのための入力としてさらに使用される(ブロック316)。レジストリデータベース104から取り出される情報は、限定することなく、選択されたIPアドレスを登録した組織の名前及び/又はアドレス、名前の判明した組織が他のIPアドレス及び/又はIPアドレスの1つ若しくは複数のブロックも登録しているかどうか、並びに/或いはIPアドレスに責任がある連絡先の連絡先名、電話番号、及び/又は電子メールアドレスを含むことができる。会社、病院、学校、大学、並びに/又は同様の事業体及び/若しくは組織に関連付けられたIPアドレスは、例示的な市場占有率エバリュエータ102によって、家庭使用に関連付けられたIPアドレスから区別される(ブロック318)。
[0042]特に、例示的なレジストリマネージャ210は、返された組織名を、市場情報データベース106に記憶された識別された組織名と照合する。例示的な市場情報データベース106は、組織が家庭であり、すなわち、提供するのが、家庭目的のIPアドレスかどうか、又は組織が非家庭であり、すなわち、提供及び/若しくは他の方法で管理するのが、会社、学校、及び/若しくは他の任意の非家庭目的のIPアドレスかどうかを識別するために、組織名に関連付けられた少なくとも1つのパラメータを含む(ブロック318)。IPアドレスが家庭用でない場合(ブロック320)、例示的なテストマネージャ202は、テストする対象IPアドレスがさらに存在するかどうかを決定し(ブロック322)、存在する場合、制御はブロック302に戻る。そうではなく、例示的なテストマネージャ202が、テストする対象IPアドレスがさらに存在しないと決定した場合、以下でさらに詳細に説明されるように、獲得したテスト結果に基づいて、市場占有率統計が計算される(ブロック324)。
[0043]IPアドレスが家庭用であると見なされた場合(ブロック320)、例示的な市場占有率エバリュエータ102は、IPアドレスに対応するロケーションを決定し、1つ又は複数のレジストリデータベースによって識別される登録者(例えば、ARINデータベースによってOrgNameに関連付けられた組織)と比較するような、真のエンドユーザを識別するための第2のテストを実行する(ブロック326)。上で説明されたように、登録IPアドレスに責任があるとして識別された組織は、最終的なエンドユーザではなく、IPアドレスのリセラであることがある。
[0044]図6は、IPアドレスに対応するロケーションを決定するため、及び第2のテストを実行して真のエンドユーザを識別するための例示的なプロセス326を示している。図6の説明的な例では、例示的なテストマネージャ202は、対象IPアドレスが例示的な市場情報データベース106に記憶されているかどうかを決定する(ブロック602)。記憶されている場合、記憶された情報が比較的最近なものであるときは、例示的な市場占有率エバリュエータ102は、真の所有及びロケーションを決定するために、さらなる処理リソース及び/又は時間を費やす必要がないことがある。そのため、例示的なテストマネージャ202は、対象IPアドレスに関連付けられた情報が、日付及び/又は時間閾値を超えているかどうかを決定し、その閾値は、記憶情報がどれだけ最近又は最新のものかの指標として機能する。閾値を超えておらず、それによって、例示的な市場情報データベース106に記憶されたIPアドレス情報が比較的最近又は最新であることが示された場合(ブロック604)、そのような記憶情報に依存して、対象IPアドレスの真の所有者及びロケーションを確定する(ブロック606)。
[0045]他方、対象IPアドレスが例示的な市場情報データベース106に記憶されていない場合(ブロック602)、又は時間/日付閾値を超えている場合(ブロック604)、例示的なホスト名リゾルバ212は、関連ホスト名を取り出すために、対象IPアドレスを使用して、リバースDNS検索(リバース解決とも呼ばれる)を実行する(ブロック608)。対象IPアドレス68.87.148.146を使用するリバースDNS検索に対する例示的な応答は、「ge−0−1−ubr01.warren.ma.boston.comcast.net」である。組織名を識別するための、これと同じ対象IPアドレスを使用したARINデータベースへのWhoisクエリに対する例示的な応答が、「Comcast Cable Communications, Inc.」であることにも留意されたい。したがって、リバースDNS検索及びレジストリデータベース検索はともに、同じエンドユーザエンティティを識別する。
[0046]しかし、いくつかの状況では、ARINへの問い合わせから得た組織名とリバースDNSから得た組織名は一致せず、例示的な対象IPアドレスが64.236.16.20である場合などがそうである。この例では、ARINへの問い合わせは、IPアドレスを登録する責任がある組織は「AOL Transit Data Network」であると識別する。他方、同じ対象IPアドレスを使用するリバースDNSは、「www2.cnn.com」を開示する。そのような不一致を解決し、対象IPアドレスに関連付けられた真のエンドユーザを決定するため、例示的なホスト名リゾルバ212は、図7に関連してさらに詳細に説明されるように、リバースDNSラベルを、例示的な市場情報データベース106に記憶されているラベルと照合する(ブロック610)。
[0047]図7の説明的な例では、例示的なホスト名リゾルバ212は、受け取ったホスト名、ドメイン名、及び/又はルータラベルを解析して、別々のフィールドに入れ(ブロック702)、それらが、例示的な市場情報データベース106の解決キーワードテーブル107に解決キーワードとして記憶された、既知の家庭用ISPのマッチを満たすかどうかを識別する(ブロック704)。例示的な解決キーワードテーブル107内の1つ又は複数のキーワードは、限定することなく、ISP、組織、及び/又はロケーションを表す、文字、単語、数、及び/又は1つ若しくは複数の英数字表現を含むことができる。言い換えると、例示的なホスト名リゾルバ212は、受け取ったホスト名から解析されたラベルの組み合わせに関連付けられた有効なISPを識別するために、1つ又は複数のルールを適用する。上述の例を続けると、ホスト名「ge−0−1−ubr01.warren.ma.boston.comcast.net」は、ホスト名リゾルバ212によって分析することができ、その結果、ラベル「ma」、「boston」、及び「comcast」が、比較目的のために、解析結果として出力される。この例では、ホスト名リゾルバ212は、これら3つのラベルが、受け取った単一のホスト名内ですべて識別された場合に、最終的なエンドユーザISPとして、コムキャスト(Comcast)(登録商標)の識別をもたらすルールを含む。
[0048]しかし、返されたホスト名が代わりに「ge−0−1−ubr01.warren.ma.comcast.net」であったと仮定すると、コムキャスト(登録商標)を適切に識別するために少なくとも3つの特定のラベルを必要とする例示的なルールは、満たされない。ラベルの1つが「comcast」を含むという事実にもかかわらず、コムキャスト(登録商標)が(例えばリセラとして)IPアドレスを別のISPに再分配した可能性がある。したがって、コムキャスト(登録商標)及び/又はその家庭顧客は、この例における最終的なエンドユーザではなく、したがって、対象IPアドレスは、最終結論のエンドユーザに適切に関連付けることができない。図7の例示的なプロセス610について続けると、例示的なホスト名リゾルバ212は、いずれかのラベルマッチが市場情報データベース106において見出されたかどうかを決定し(ブロック706)、見出された場合、必要な数の閾値ラベルマッチが検出されたかどうかを決定する(ブロック708)。必要な数の閾値ラベルマッチが満たされた場合(ブロック708)、対象IPアドレスは、市場情報データベース106において識別されたISP及び/又は候補結果に関連付けられる(ブロック710)。
[0049]図6に戻ると、図7に関連して説明されたように、市場情報データベース106への1つ又は複数の問い合わせの後で、ホスト名所有が解決されない場合(ブロック612)、リバースDNSから受け取ったホスト名には、手動フォローアップのためのフラグが立てられる(ブロック614).手動フォローアップは、限定することなく、関連するISP組織名及び/又は対応するロケーションを決定するための、新しい、代替の、及び/又は他の方法では認識されないラベルキーワードを調査する1人又は複数人のユーザを含むことができる。そのような新たに見出された情報は、将来/以降の状況において、それらのラベルキーワードに遭遇したときに、即座の解決が可能になるように、例示的な市場情報データベース106及び/又は解決キーワード107にさらに追加することができる。この状況は、IPアドレスの1つ又は複数のテスト中に、かつて識別されたことのないホスト名ラベルを有する新しいISPが、市場に参入した場合に、生じることがある。結果として、本明細書で説明される市場情報データベース106は、ブロードバンド市場統計を測定するために、本明細書で説明される方法及び装置を用いて長期にわたって使用されるほど、より完全なものになってゆく。
[0050]他方、受け取ったホスト名が解決されている場合(ブロック612)、例示的なホスト名リゾルバ212は、マルチロケーショントレースルートを開始して(ブロック616)、共通の最終ホップルータホスト名を確定する(ブロック618)。例えば、対象IPアドレス68.87.148.146についての第1のトレースルートがサンフランシスコで開始し(例えば、開始ルータホスト名「bdrrtr−a.22.c4.sf2.telephia.com」)、同じIPアドレスについての第2のトレースルートがダラスで開始し(例えば、開始ルータホスト名「tbr1.dlstx.ip.att.net」)、同じIPアドレスについての第3のトレースルートがリンドバーグで開始し(例えば、開始ルータホスト名「host−criterion−83−225.customer.ntelos.net」)、すべてが最終ホップルータホスト名「ge−0−1−ubr01.warren.ma.boston.comcast.net」を識別した場合、対象IPアドレスが所在する対応する市及び/又は州を識別するために、ロケーションを表すラベルが抽出される(ブロック620)。この例では、ラベル手掛かり「boston」及び「ma」が、マサチューセッツ州ボストン市を識別する。しかし、ホスト名内にロケーションのインジケータが存在しない場合、例示的な市場情報データベース106内のいずれかの情報が使用される。
[0051]代わりに、3つのトレースルートのすべてが、共通のホップルータホスト名を識別するわけではない場合(ブロック618)、例示的なホスト名リゾルバ212は、例示的な市場情報データベース106において、マッチを求めて、返された各ホスト名を照合し、マッチが見出された場合は、対応するロケーションを解決し(ブロック622)、見出されない場合は、対象IPアドレスには、フォローアップのためのフラグが立てられる(ブロック624)。
[0052]図3の説明的で例示的なプロセス300に戻ると、テストマネージャ202が、テストするいかなる対象IPアドレスもさらに有さない場合(ブロック322)、テストマネージャ202は、例えば市場占有率などの、1つ又は複数のブロードバンド市場統計を計算する(ブロック324)。図3の説明的で例示的なプロセス300は、図11に関連して以下でさらに詳細に説明されるように、呼び出しプロセスによって実行することができる例示的なサブプロセス328(破線)も含む。図8を参照すると、例示的なテストマネージャ202は、それについてのブロードバンド市場統計が望まれる対象ISPを選択する(ブロック802)。IPアドレスの1回又は複数回の反復テストから返されたデータは、市場情報データベース106に記憶されており、各対象ISPについて、検出されたアクティブなIPアドレスの数が、テストされたIPアドレスの総数で除算され、所定の期間におけるアクティブなIPアドレスのパーセンテージが求められる(ブロック804)。テストされたIPアドレスの総数が、統計的に有意な標本サイズを表す閾値を満たす場合、例示的なテストマネージャ202は、所定の市場地域(例えば、第1の市場地域118、第2の市場地域120など)における、ISPについての1つ又は複数の予測推定値を計算する(ブロック806)。例えば、割り当てIPアドレスの数が、テストされた500個のIPアドレスのうち325個であると分かった場合、アクティブなIPアドレスを表す係数として、0.65という係数が計算される。加えて、対象ISPが、(例えば、ARINデータベースなどの1つ又は複数のレジストリデータベースから決定されるものとして)数量が例えば1万個のIPアドレスを制御していると考えられる場合、アクティブなIPアドレスの総数は、6500(例えば、325÷0.05、又は0.65×10000)と計算/予測することができる。ユーザが、代替ISPについての1つ又は複数のブロードバンド市場統計を計算することを望む場合(ブロック808)、制御はブロック802に戻り、さもなければ、図9A及び図9Bに示される例示的な出力テーブル900及び/又は950など、1つ又は複数の出力テーブルを、ユーザのために生成することができる(ブロック810)。
[0053]図9Aの例示的なデータ出力テーブル900は、IPアドレスカラム902と、IPアドレスに対応するホスト名を識別するためのリバースDNS検索カラム904と、IPアドレスに関連付けられた対応する登録者名を識別するためのWhoisカラム906と、ピング動作が成功したかどうかを識別するためのピングカラム908と、1つ又は複数のポートスキャニング動作が成功したかどうかを識別するためのポートカラム910とを含む。加えて、図9Aの例示的なテーブル900は、IPアドレスのロケーションを識別するための地理カラム912と、カラム902のIPアドレスがアクティブか、それとも非アクティブかを識別するためのアクティブカラム914とを含む。
[0054]図9Bの例示的なデータ出力テーブル950は、ISPカラム952と、ISPがIPアドレスのどのグループ(例えば、IPアドレスの1つ又は複数のグループ化された範囲)に対して責任があるかを識別するためのIPアドレス範囲カラム954と、カラム954内のIPアドレスのプールの中でテストされたIPアドレスの総数を識別するための被テストIPアドレス数カラム956と、アクティブIPアドレス数カラム958とを含む。例示的なデータ出力テーブル950はまた、非アクティブIPアドレス数カラム960と、被テストIPアドレス総数に基づいたアクティブIPアドレスに対応するパーセンテージのカラム962とを含む。図9A及び図9Bは、例示的な市場占有率エバリュエータ102によって生成及び/又は計算することができる、2つの例示的な出力テーブルを示しているが、本明細書で説明される方法及び装置は、それらに限定されない。ユーザ(複数可)の様々な要求に対処するために、限定することなく、市、州、地方について最大若しくは最小の市場占有率を有するISPを示すためのランク付けデータテーブル、及び/又は1つの期間から別の期間にかけての加入者の変化の比率を示すためのデータテーブルなど、他の任意のデータ出力構成を市場占有率エバリュエータ102によって生成することができる。加えて、例示的な市場占有率エバリュエータ102によって計算される例示的なデータテーブル900及び950は、加入者の増加、加入者の減少、並びに/又は広告及び/若しくは販売促進努力に応じた1つ若しくは複数の効果に関する、1つ又は複数のトレンドも識別することができる。例えば、本明細書で説明される方法及び装置を使用するISPは、1つ又は複数の広告及び/又は販売促進キャンペーンを開始する前に、基準ブロードバンド加入者占有率、並びに/又はISP及び/若しくはISPの競合相手の新規加入者の比率を確定することができる。そのような広告及び/又は販売促進キャンペーンの間、ISPは、そのような広告努力の効果(例えば、加入者のパーセンテージの閾値上昇、新規加入者の比率の増加など)を決定するために、本明細書で説明される方法及び装置を利用し続けることができる。
[0055]図10は、市場占有率を測定し、フロー占有率を計算するための例示的なシステム1000の図である。本明細書で説明される方法及び装置は、ブロードバンド市場(例えば、ブロードバンドインターネットサービス、ファイバインターネットサービスなど)、及び/又はビデオ市場(例えば、無線サービス、衛星サービス、ケーブルサービスなど)についての市場占有率及び/又はフロー占有率を測定すること、及び/又は他の方法で計算することができる。簡潔にするため、図10の例示的なシステム1000は、図1の例示的なシステム100における要素と同様の要素を含み、図10においては、同様の要素を表すために、同様の参照番号が示される。図10の説明的な例では、システム1000は、米国国勢調査局データベース(United States Census Bureau database)1050と、マネージドパネルデータベース(managed panel database)1052と、コンビニエンスデータベース(convenience database)1054と、調査プール(survey pool)1056とを含む。例示的な米国国勢調査局データベース1050は、米国北東部、米国中西部、米国西部、及び米国南部についての米国人口統計に関する情報を含む。以下でさらに詳細に説明されるように、例示的な米国国勢調査局データベース1050は、家庭データに重み付け係数を適用する場合の、1つ又は複数のベンチマークを提供する。例示的なマネージドパネルデータベース1052は、一つには、人口統計グループの相対的に信頼性が高い代表を有するパネリストデータを含む。例えば、マネージドパネルデータベース1052の信頼性は、米国行政管理予算局(United States Office of Management and Budget)が主管する、統計政策情報委員会(ICSP:Interagency Council on Statistical Policy)に準拠する1つ又は複数の統計ガイドラインに基づいた、人口統計的に識別された人口のより大きな母集団に対する予測を可能にする。
[0056]例示的なコンビニエンスデータベース1054は、1つ又は複数の家庭に関連付けられたデータ及び/又はパネリストを含むが、ICSPに準拠した方式では管理されない。例えば、コンビニエンスデータベース1054は、例示的なマネージドパネルデータベース1052よりもかなり少量のパネル標本サイズを含めばよく、結果として、維持するのに著しく低い費用しかかからない。例示的なコンビニエンスデータベース1054を考慮して適用される1つ又は複数の予測は、例示的なマネージドパネルデータベース1052の信頼性レベルよりも低い、関連する信頼性レベルを含む。同様に、例示的な調査プール1056は、調査質問、及び利用可能な参加者からの調査回答を含む。そのような調査回答は、マネージドパネルデータベース1052及び/又はコンビニエンスデータベース1054と比較した場合に、著しく低い運用費でデータを提供するが、相対的により低い信頼性レベルを含むこともある。
[0057]一つには、家庭向けブロードバンド及び/又はビデオプロバイダの消費者の選択についてのさらなる洞察を提供する、例示的なコンビニエンスデータベース1054によって提供される利用可能なデータを考慮した、市場占有率及び/又はフロー占有率の計算を行うため、複数のデータソースが、ハイブリッド方式で利用される。1つ又は複数のコンビニエンスデータベース内の利用可能なデータは、限定することなく、新規加入者ISP、新しい家庭アドレスを有するIPアドレスに関連付けられた従来通りのISP、及び/又はサービスタイプ(例えば、ダイアルアップ、ブロードバンド、ファイバ、ビデオなど)など、関連するIPアドレスステータスについての任意の数の表示を含むことができる。例えば、インターネット使用についての全体的市場サイズ及び/又は市場浸透は、マネージドパネルデータベース1052によって提供されるが、特定のISPに関する情報は、特定の地理的ロケーションを考慮して、例示的なコンビニエンスデータベース1054によって提供される。サービスプロバイダについての新規移転者(new mover)、解約者(disconnect)、及び/又は新規加入者(new inward)を示すことを可能にする、例示的なコンビニエンスデータベース1054によって提供される利用可能なデータ、及び利用可能な調査データを考慮した、フロー占有率データの計算を行うため、以下でさらに詳細に説明されるように、複数のデータソースがハイブリッド方式で利用される。
[0058]図11は、例示的なマネージドパネルデータベース1052及び例示的なコンビニエンスデータベース1054など、1つ又は複数のマネージドデータベース及び1つ又は複数のコンビニエンスデータベースを使用して、サービスプロバイダのフロー占有率を計算するための、例示的なプロセス1100を示している。図11に関連して説明される例は、マネージドデータベース及びコンビニエンスデータベースの両方を含むが、本明細書で説明される方法及び装置は、代わりに、マネージドデータベースのみ又はコンビニエンスデータベースのみを使用することもできる。その場合、そのようなデータベースに関連付けられた標本サイズ及び重みは、1つ又は複数の予測及び/又は計算の統計的な整合性を維持するように調整することができる。図11の説明的な例では、例示的なテストマネージャ202は、インターネットサービス及び/又はビデオサービス(例えば、インターネットベースのビデオサービス)の値など、サービス浸透値を獲得するために(ブロック1102)、マネージドパネルデータベース1052に問い合わせる。受け取ったインターネット浸透値は、ダイアルアップ、ブロードバンド、ビデオ、及び/又はファイバベースのサービスの加入者などのサービス加入者を含むが、どのサービスプロバイダがそれらのサービスに責任があるかは一般に識別しない。例示的なマネージドパネルデータベース1052は、例えば、代表性が高いと思われる1つ若しくは複数の人口統計グループ及び/又は1つ若しくは複数の地理的地域に関連付けられた、インターネット浸透値を報告するが、マネージドパネルデータベース1052の管理は、ICSPに適合した相対的に高い程度の代表性を維持する努力において、いくつかの家庭をパネルから削除し、新しい家庭を追加することを必要とすることがある。例示的なマネージドパネルデータベース1052から利用可能でない情報によるギャップを埋めるため、例示的なテストマネージャ202は、コンビニエンスデータベース1054に問い合わせ、パネルメンバに関連付けられた有効な家庭IPアドレスを取り出す。例示的なコンビニエンスデータベース1054に関連付けられた各家庭メンバは、一つには、家庭活動の変化を1つの期間から別の期間にかけて追跡できるように、関連する家庭識別番号を含む。加えて、例示的なコンビニエンスデータベース1054に関連付けられた各家庭メンバは、現在のIPアドレスを定期的に、不定期に、手動で、及び/又はスケジュールされたタイミングで報告する、監視機器及び/又は監視ソフトウェアを含む。結果として、家庭識別番号に関連付けられた家庭が、後の期間において、異なるIPアドレスを報告した場合、本明細書で説明される方法及び装置は、その家庭がインターネットサービスプロバイダを変更したことを識別することができる。
[0059]コンビニエンスデータベース1054内の各家庭識別番号に関連付けられた家庭メンバは、例示的なテストマネージャ202によって取り出される、地理的ロケーションに関する情報(例えば郵便番号)も提供する(ブロック1106)。加えて、例示的なテストマネージャ202は、家庭メンバがダイアルアップ、ブロードバンド、ファイバ、又は他のインターネットサービスのうちのどれを有するかを識別するために、家庭メンバによって報告された情報を取り出し(ブロック1108)、またどのISPがそのようなインターネットサービスを提供するかを識別するために、家庭メンバによって報告された情報を取り出す(ブロック1110)。しかし、コンビニエンスデータベース1054はマネージドデータベースではないので、家庭メンバから自己報告された情報が正確でない可能性がある。例示的なテストマネージャ202によって取り出された自己報告されたISP情報(ブロック1110)が正確かどうかを検証するため、テストマネージャ202は、図3、図6、及び図7に関連して上で説明されたような、(図3の破線枠によって示されるような)例示的なISP検証プロセス328を起動する。
[0060]図11の説明的で例示的なプロセス1100では、テストマネージャ202は、コンビニエンスデータベース1054からのISP情報が、例示的なISP検証プロセス328からの情報とマッチするかどうかを決定する(ブロック1112)。マッチしない場合、例示的なテストマネージャ202は、例えば、例示的なシステム1000のユーザからの命令に基づいて、及び/又はISP検証プロセス328がISPを識別できない状況において、コンビニエンスデータベース内のISP情報を無効にすべきかどうかを決定する(ブロック1114)。ISP情報が無効にされる場合(ブロック1114)、例示的なテストマネージャ202は、ISP検証プロセス328から取り出されたISP情報を、コンビニエンスデータベース1054からの与えられたパネリストについての信用できるISPとして使用し(ブロック1116)、パネリストに関連付けられた情報の信頼性係数及び/又は信頼性を反映させるために、コンビニエンスデータベース1054に記憶された与えられたパネリスト識別番号に関連付けられた情報に、1つ又は複数の重み付け調整が適用される(ブロック1118)。
[0061]しかし、ISP情報がマッチした場合(ブロック1112)、又はコンビニエンスデータベース1054のISP情報が無効にされない場合(ブロック1114)、又はコンビニエンスデータベース1054がISP情報とマッチした場合(ブロック1112)、例示的なテストマネージャ202は、コンビニエンスデータベース1054のデータ整合性/正確性についてより大きな程度の信頼性を表す重み付け係数を適用する(ブロック1119)。例えば、適用される重み付け係数(ブロック1119)は、(例えば、標本数が相対的に多いため、マネージドデータベース及び/又はICSP基準と比較してかなりの整合性があるためなど)コンビニエンスデータベース1054が高い信用を有する場合、単位重み(例えば1.00)を含むことができる。他方、例示的なテストマネージャ202は、データベースが管理されていないという事実を理由として、1つ又は複数のコンビニエンスデータベースに、程度が低下した信頼性を表すデフォルト重みを適用することができる。
[0062]例示的なテストマネージャ202は、引き続いて、コンビニエンスデータベース内のいずれか残りのパネリスト情報及び関連するIPアドレスを評価する(ブロック1120)。評価すべきパネリストがさらに存在する場合(ブロック1120)、制御はブロック1104に戻り、存在しない場合、例示的なテストマネージャ202は、人種、既婚未婚、収入、及び/又は学歴などの、しかしそれらに限定されない、家庭人口統計情報をコンビニエンスデータベースから取り出す(ブロック1122)。加えて、例示的なデータソース重みカリキュレータ220は、例示的な米国国勢調査データベース1050からの米国国勢調査地方データに関連付けられたベンチマークを反映させるために、1つ又は複数の家庭重み付け係数を適用する(ブロック1124)。適用される国勢調査重みは、コンビニエンスデータベースが、より信頼できる基準ソース(すなわち米国国勢調査データベース1050)を用いた方法で調整されていることを確認することによって、一つには、コンビニエンスデータソース(例えばデータベース)に関連付けられた偏向の低減を可能にする。1つ又は複数の国勢調査地方(複数可)が、追加的及び/又は代替的な人口統計学的存在の亜母集団(sub−populations)を含むことを考慮して、例示的なテストマネージャ202は、各国勢調査地方内のそのような亜母集団に対して層化抽出法(stratified sampling)を適用する(ブロック1126)。加えて、層化抽出法の適用は、1つ又は複数の地理的偏向の抑制(例えば最小化)を可能にする。家庭加入者数の予測が、層化抽出法の出力に基づいて、例示的なテストマネージャ202によって実行されて、与えられた対象とする地理内における各ISPの市場占有率をもたらす(ブロック1128)。例示的なコンビニエンスデータベース1054の分解能、代表性、及び/又は信頼性レベルに基づいて、1つ又は複数の市場占有率予測を、直接市場地域(DMA:direct marketing area)レベルで行うことができ、又は閾値信頼性レベルを満たしている場合、及び/又は超えている場合、粒度が増加した市及び/又は町レベルの予測を行うことができる。その後、例示的なテストマネージャ202は、ブロードバンドフロー占有率を計算することができる(ブロック1130)。
[0063]図12は、1つ又は複数のマネージドパネルデータベース1052、コンビニエンスデータベース1054からの情報、及び例示的な調査プール1056からの調査データを使用して、ブロードバンドフロー占有率を計算するための、例示的なプロセス1130の図である。例示的な調査プールデータ1056は、回答者/顧客フィードバック及び他の情報を獲得するより経済的な方法を含むが、より大きな母集団に対して予測を行うのに必要な標本サイズは、法外なコストになる。加えて、調査プールデータ1056は、一般に管理されておらず、及び/又は代表性の1つ又は複数の測定されたレベル内にあることが検証されていないので、調査回答者からの回答が不正確である可能性がある。しかし、調査プールデータ1056は、ブロードバンド総追加(gross addition)、新規移転者、及び/又は新規加入行動(new inward behavior)に関する価値のある情報を含む。例示的な調査プールデータ1056は、限定することなく、日録データ(diary data)を含むことができる。
[0064]図12には、サービスプロバイダに関連付けられた総追加、新規移転者、及び/又は新規加入行動を識別する1つ又は複数のフロー占有率測定値を計算するための、例示的なプロセス1200が示されている。図12の説明的な例では、例示的なテストマネージャ202は、例示的なコンビニエンスデータベース1054からIPアドレス交換(IP address switch)の1つ又は複数の表示を取り出す(ブロック1202)。以前の顧客/加入者ISP情報、顧客/加入者が新居に移転して、新しいISPを獲得したかどうか、顧客/加入者が新居に移転して、同じISPを維持したかどうか、及び/又は顧客/加入者が新しいタイプのサービス(例えば、ブロードバンドへのダイアルアップ)を獲得したかどうかに関する情報を決定するため、例示的なテストマネージャ202は、例示的な調査プール1056から調査回答を取り出す(ブロック1204)。例示的な調査プール1056から獲得された例示的な調査情報は、限定することなく、以前のISP名、新しいISP名、ISPサービスの継続期間、ISPサービスのタイプ(例えば、ダイアルアップ、ブロードバンド、ケーブル、DSL、ファイバ、フリーWi−Fi、ワイヤレスエアカードなど)、及び/又はISPに関連付けられた1つ若しくは複数のサービス名(例えば、AT&T UVerse(登録商標)など)を含む、他の任意のタイプの回答を含むことができる。
[0065]例示的な調査プール1056から受け取ったデータは、マネージドデータソースにおいて見出される標本サイズよりも著しく小さい標本サイズを含むことがあるが、例示的なテストマネージャ202は、例示的な米国国勢調査データベース1050からの米国国勢調査データに合った方法で、1つ又は複数の人口統計ベンチマークを受け取った調査データに適用する(ブロック1206)。加えて、図11の例示的なプロセス1110に関連して計算された市場占有率予測が、選択されたクライアント/サービスプロバイダの主要な競合地理に合った方法で、フロー占有率量を制限するために、調査データに適用される(ブロック1208)。言い換えると、与えられたクライアントから返されたフロー占有率データは、与えられたクライアントが他のサービスプロバイダと競合する地理的地域のみに関連するように調整することができる。対象とする各地理的地域内で、例示的なテストマネージャ202は、市場占有率データ及びベンチマーク調査データを使用して、競合が生じる既知の地理的地方に基づいて、クライアント及びクライアントの主要競合相手についての総追加及び利用停止(deactivation)を予測する(ブロック1210)。いくつかの例では、パネリスト及び/又は調査回答者が行うプロバイダの変更は、利用停止及び総追加と解釈することができるが、代替アドレスに移転する加入者は、その加入者が同じサービスプロバイダを維持する場合に、利用停止及び総追加と解釈することができる。他の例では、新しいアドレスに移転し、ブロードバンドサービス初体験の加入者は、総追加と解釈することができ、例えばダイアルアップを好んで、ブロードバンドサービスを解約した加入者は、利用停止と解釈することができる。さらに、他の例では、以前ダイアルアップサービスを利用していた、又はサービスを利用していなかったブロードバンド加入者は、総追加と解釈することができる。正味の追加は、総追加と加入者の利用停止の間の差としてさらに計算することができる。
[0066]調査データの前述した使用に信頼性の閾値レベルが含まれることを保証し、それによって、予測されたフロー占有率データ(例えば、総追加、利用停止、新規加入者、新規移転者など)の市場性価値を高めるように、1つ又は複数の検証手順を実行することができる。図12の説明的で例示的なプロセス1200では、テストマネージャ202は、総追加と解約の間の差を計算して、与えられた期間中の加入者数の変化を求める(ブロック1212)。そのような計算は、調査プールデータから受け取った情報から導出される。しかし、例示的なテストマネージャ202によって、コンビニエンスデータベース1054から受け取る情報を使用し、クライアントの開始加入者数と終了加入者数の間の差を計算して、与えられた期間中の加入者数の変化を決定することができる(ブロック1214)。与えられた期間中の計算された加入者数(ブロック1212とブロック1214)の間の差が、閾値を超えていない場合(ブロック1216)、予測されるフロー占有率結果が、各クライアントにレポートとして提供される(ブロック1218)。しかし、例示的な閾値を超えている場合(ブロック1216)、与えられた対象とするクライアント及び/又は対象とする地理についての予想結果をより良く表すために、予測されるフロー占有率結果を平均化、正規化、及び/又は増減することができる(ブロック1220)。
[0067]市場占有率及び/又はフロー占有率を計算するための上述の例は、ブロードバンドインターネットサービス及びブロードバンドISPを識別したが、本明細書で説明される方法及び装置は、それらに限定されない。例えば、本明細書で説明される方法及び装置は、衛星、ケーブル、及び/又は無線サービスのプロバイダなど、メディアプロバイダについての市場占有率及び/又はフロー占有率の計算を容易にする。上で説明されたISPと同様に、メディアプロバイダの単独調査は、目標とする地理について統計的に有意な要件を満たすのに適当な標本サイズを収集するための費用効果のよい手法を一般に可能にしない。図1の例示的なマネージドパネルデータベース1052など、1つ又は複数のマネージドデータソースは、相対的に高い程度の地理的及び人口統計的な代表性を有するパネリストデータを含むが(例えば、ICSPによって公表された基準を満たす1つ又は複数のマネージドデータベース)、そのようなマネージドデータソースは、より大きな母集団に対する予測(複数可)を可能にするには依然として不十分な標本サイズを有することがある。よく管理されたパネリストをマネージドデータベースに追加することで、予測目的にとって十分な標本サイズを可能にすることがあるが、コスト制約が、そのような試みの妨げになることがある。
[0068]図13は、複数のデータソースからの情報を使用して、市場占有率を計算するための、及び/又はフロー占有率を計算するための、例示的なプロセス1300を示している。市場占有率及び/又はフロー占有率を計算するための、本明細書で説明される方法及び装置の少なくとも1つの利点は、単独で用いたのでは、許容できる正確性基準をそのような計算がもち得なかった、1つ又は複数のデータソースを組み合わせることができることである。図13の説明的な例では、例示的なデータソースロケータ218は、標本が閾値数に達するように、2つ以上の候補データソースを識別する(ブロック1302)。標本の閾値数は、予測が行われる目標とする地理に基づいて、異なることがある。データソースは、限定することなく、マネージドデータソース及び/又はコンビニエンスデータソースを含むことができる。例示的なデータソースロケータ218が、例えばデータベース情報プール1060から、いずれの候補マネージドデータソースも識別しない場合、コンビニエンスデータソース(複数可)の代表性の信頼性レベルの潜在的な低下を計算に入れて、標本の対応する必要(閾値)数を増やすことができる。
[0069]識別された各マネージドデータソースは、一つには、標本が抽出された代表的な地理に基づいた関連する重みを含む。加えて、又は代替的に、対応する重みは、識別されたデータソースごとに計算することもできる。例えば、ニールセンカンパニー(Nielsen Company)(登録商標)によって運営管理されるニールセン(登録商標)ピープルメータ(登録商標)などのマネージドデータソースは、国家レベルで標本を収集し、標本多様性に関連付けられた地理的な重みを有する。しかし、局所化された地理(例えば、地方、DMAレベル、市、町など)から抽出された標本グループを有する他のデータソースは、国家レベルとは異なる対応する重みを含む。結果として、2つの例示的なデータソースを、それらに対応する重みを調整することなく、単純に組み合わせた場合、例えばICSPに準拠した統計基準は満たされない。例示的なデータソース重みカリキュレータ220は、マネージドデータソースごとに対応する重みを取り出し、及び/又は計算し(ブロック1304)、各データソースが異なる地理的範囲に由来するかどうかを決定する(ブロック1306)。異なる地理的範囲からではない場合、データソースは、組み合わされる標本を再重み付けすることなく、例示的なデータソースコンバイナ222によって組み合わせることができ(ブロック1308)、異なる地理的範囲からの場合、例示的なデータソースコンバイナ222が、各データソースからの標本を組み合わせ、データソース重みカリキュレータ220が、組み合わされた標本を再計算して、組み合わされた重み付け値及び/又は正規化された重み付け値を求める(ブロック1310)。組み合わせるさらなる候補データソースが存在する場合(ブロック1312)、制御はブロック1306に戻る。
[0070]インターネットサービスのプロバイダ又はビデオメディアのプロバイダなどのクライアントにとって意味のある方法で予測を提供するため、例示的なデータソース重みカリキュレータ220は、各クライアント及び対応する地理的地域についてのマネージドデータソース(複数可)に基づいて、ベンチマーク重みを導出する(ブロック1314)。例えば、国家マネージドデータソースは、全国にわたるビデオサービスプロバイダに関する情報を含むが、そのようなデータは、ビデオプロバイダが存在する特定の地理(例えばサンフランシスコ)を代表していないことがある。そのため、マネージドデータソース(複数可)の範囲に基づいてベンチマーク重みを導出及び/又は計算することで、サービスプロバイダ(複数可)が、自らが営業活動を行う限定された地理及び/又は人口統計により合った方法で、予測を較正することが可能になる。
[0071]例示的なデータソース重みカリキュレータ220はまた、各コンビニエンスデータソースについての重みを取り出し、及び/又は計算し(ブロック1316)、識別されたデータソース(複数可)が異なる地理的範囲を有するかどうかを決定する(ブロック1318)。異なる地理的範囲を有さない場合、例示的なデータソースコンバイナ222は、データソースを組み合わせ(ブロック1320)、異なる地理的範囲を有する場合、データソースは、組み合わされ、後の計算及び/又は予測のために統計的な整合性を維持するために、データソース重みカリキュレータ220によって、再重み付けが行われる(ブロック1322)。組み合わせるコンビニエンスデータソースがさらに存在する場合(ブロック1324)、制御はブロック1318に戻り、存在しない場合、コンビニエンスデータソースは、マネージドデータソースに対するタイミング差について調整及び/又は較正される(ブロック1326)。タイミング差は、コンビニエンスデータソースがマネージドデータソースによって獲得されたデータよりも一時的に遅れた場合に生じることがある。そのようなタイミング遅れは、日録データソースの場合、1週間又は2週間など、相対的に長い期間が過ぎた後に、コンビニエンスデータソースが獲得されたときに生じることがある。マネージドデータソース及びコンビニエンスデータソースのすべてが、組み合わされ、集約データソースにおいて再重み付けが行われた後(ブロック1328)、市場占有率が計算され(ブロック1330)、及び/又は市場占有率計算(複数可)によって制限された方法で、フロー占有率が計算される(ブロック1332)。
[0072]図14は、図1、図2、及び図10の例示的な市場占有率エバリュエータ102、例示的なテストマネージャ202、例示的なIPアドレスアグリゲータ204、例示的なピングマネージャ206、例示的なポートスキャンマネージャ208、例示的なレジストリマネージャ210、例示的なホスト名リゾルバ212、例示的なネットワークインタフェース214、及び/又は例示的なパネリストアップデータ216のいずれか又はすべてを実施するために使用及び/又はプログラムできる、例示的なプロセッサプラットフォームP100の概略図である。例えば、プロセッサプラットフォームP100は、1つ又は複数の汎用プロセッサ、プロセッサコア、マイクロコントローラなどによって実施することができる。
[0073]図14の例のプロセッサプラットフォームP100は、少なくとも1つの汎用プログラム可能プロセッサP105を含む。プロセッサP105は、プロセッサP105のメインメモリ内(例えば、RAM P115及び/又はROM P120内)に存在する符号化された命令P110及び/又はP112を実行する。プロセッサP105は、プロセッサコア、プロセッサ、及び/又はマイクロコントローラなど、任意のタイプの処理ユニットとすることができる。プロセッサP105は、とりわけ、図3〜図8及び図11〜図13の例示的なプロセスを実行して、本明細書で説明された例示的な方法及び装置を実施することができる。
[0074]プロセッサP105は、バスP125を介して(ROM P120及び/又はRAM P115を含む)メインメモリと通信する。RAM P115は、ダイナミックランダムアクセスメモリ(DRAM)、同期ダイナミックランダムアクセスメモリ(SDRAM)、及び/又は他の任意のタイプのRAMデバイスによって実施することができ、ROMは、フラッシュメモリ、及び/又は他の任意の所望のタイプのメモリデバイスによって実施することができる。メモリP115及びメモリP120へのアクセスは、メモリコントローラ(図示されず)によって制御することができる。例示的なメモリP115は、図1及び図10の例示的な市場情報データベース106を実施するために使用することができる。
[0075]プロセッサプラットフォームP100は、インタフェース回路P130も含む。インタフェース回路P130は、外部メモリインタフェース、シリアルポート、汎用入出力など、任意のタイプのインタフェース規格によって実施することができる。1つ又は複数の入力デバイスP135及び1つ又は複数の出力デバイスP140が、インタフェース回路P130に接続される。
[0076]本明細書では、いくつかの例示的な方法、装置、及び製造物品が説明されたが、本発明がカバーする範囲は、それらに限定されない。反対に、本発明は、文字通りに又は均等論の下で添付の特許請求の範囲内に適正に含まれる、すべての方法、装置、及び製造物品をカバーする。