JP2021522629A - 全世界の都会性測定用のマシン及び方法 - Google Patents

全世界の都会性測定用のマシン及び方法 Download PDF

Info

Publication number
JP2021522629A
JP2021522629A JP2021506611A JP2021506611A JP2021522629A JP 2021522629 A JP2021522629 A JP 2021522629A JP 2021506611 A JP2021506611 A JP 2021506611A JP 2021506611 A JP2021506611 A JP 2021506611A JP 2021522629 A JP2021522629 A JP 2021522629A
Authority
JP
Japan
Prior art keywords
shapes
computer
shape
population
latitude
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021506611A
Other languages
English (en)
Inventor
トマーキン、クレイグ
Original Assignee
アクシオム エルエルシー
アクシオム エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アクシオム エルエルシー, アクシオム エルエルシー filed Critical アクシオム エルエルシー
Publication of JP2021522629A publication Critical patent/JP2021522629A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Abstract

全世界の都会性を測定するためのシステム及び方法において、2次元の2つの異なるスケールを使用して、緯度/経度の境界に基づいて台形形状が構築され、それにより4つの異なる形状/サイズの台形を得る。緯度線/経度線によって描かれたこれらの台形が地球の両極に近づくにつれて、これらの台形のサイズが小さくなることを補償するために、乗数を適用して台形内の計数を調整する。所与の国からの国勢調査データが適用され、次いで計数に関連する外部のデータ・セットを使用して合計される。最終的に計数は、特定の用途に望ましい一定数の都会性の「バンド」又はレベルにロールアップされる。

Description

本発明は、人口密度を測定し割り当てることによって人口計数製品を改良する分野にあり、詳細には、特定の国が国勢調査タイプの情報を収集しているかどうかに関係なく世界的な規模で人口密度を割り当てる分野にある。
本明細書では、「都会性(urbanicity)」を、所与のエリアにおける人口密度(population density)のレベルと定義することができ、より都会のエリアであるほど人口密度(すなわち、単位面積当たりの居住者)は高くなり、一方、より田舎のエリアであるほど人口密度は低くなる。人口密度の決定は、例えばターゲット・マーケティングを含むいくつかの分野に非常に関連している。特定の消費者の都会性は、その消費者に関連する推定される一定の人口統計学的な購買傾向データの有益な情報をもたらし、したがって、都会性により、マーケティング担当者は、消費者の居住エリアの都会性に基づいて、消費者に関する一定の性質を推論することができる。例えば、同様の都会性を有する人は、いくつかの点で同様の特性を有すると推論されるので、すべての国及び地理にわたる都会性の正確で標準化された測定は、人間の買物行動、メディア消費、製品の親和性、及び生活条件に関する予測並びに推論を簡素化することになる。しかしながら、都会性を測定することは、湖、森の境界、又は州若しくは国などの人為的境界に人が居住しているかどうかなどの因子を、それらの境界の場所又は存在についての事前知識なしでも考慮することを含むため、標準サイズのエリアごとの正確な世帯数を必要とする。このような自然的境界が考慮されない場合、あるエリアについて実際の正確な状態よりも低い都会密度又は都会性を示す可能性がある。例えば、湖岸の人口密度が高く、当然のことながら湖の人口密度がゼロである場合、湖岸とその同様のものとの両方を含むエリアは平均人口密度を有することになり、これは非常に誤解を招く恐れがある。
この問題の解決策の潜在的な価値をよりよく理解するために、米国の世帯の人口統計学的な傾向値の対象範囲が、10,000もの調査質問の回答に達する可能性がある点を考慮することができる。ドイツ、英国、フランス、及びオーストラリアなどの他の先進国では、そのような入手可能な回答が何百もある可能性がある。一方、世界のほとんどの国では、そのような情報が入手できるとしてもごくわずかである。これらの国のデータ・セットの不足を埋める手段は、非常に有益である。
国ごとに異なる国勢調査収集手法を使用する可能性があり、したがって、国勢調査収集手法は標準化されていない。加えて、様々な管轄区域からのデータは、個人又は世帯レベルで常に利用可能であるとは限らない。実際、多くの国には、アクセスできる公開された国勢調査タイプのデータが一切ないため、都会性を世界規模で適用しようとする試みは、極めて困難な提案になる。米国などの先進国においてデータが異なる方法で測定される場合、国勢調査データ及び都会性に関して有益な情報をもたらし得る他のデータが同じ方法で収集されなければ、別の国の消費者について何も推論することはできず、したがって、「同一条件」での比較は不可能になる。例えば、米国国勢調査局は、国勢調査で定義された「ブロック・グループ」に基づいて人口に関する非常に詳細な情報を提供しているが、このブロック・グループの概念は他の国では採用されておらず、したがって、推論を生成するために、別の国で利用可能であり得るいかなるデータにもこのようなデータを直接適用することは不可能である。
関連する問題は、各国が都会性について異なる尺度を有することである。例えば、米国国勢調査局は、都会性(人口密度)を、12の異なるバンドすなわちカテゴリに分けることで分類している。フランス、ドイツ、及びイタリアは、それぞれ5つ、9つ、及び3つの異なるバンドを使用している。これらのバンド間の分類はすべて様々に定義されている。ブラジル、メキシコ、及びオーストラリアなどの多くの国では、都会性のバンドに関連する標準化された公開情報を、一切利用することができない。したがって、国を越えて都会性を標準化しようとする場合、人口密度のバンドの異なる使用(又は、使用なし)の問題についても考慮しなければならない。
この基準データを米国から他国に適用するために、2つの異なるオプションを検討することができる。1つ目のオプションは、対象となる他国で利用可能なデータにおける不足分を単純に認識し、データが実際に比較的完全なものとなる解決策を実装することである。これは、今日一般的に採用されている手法である。データが利用可能になる場合、その後解決策を他国に拡大することができるが、情報が依然として利用不可であれば、その解決策は大きな相違点を残したままである。もう1つのオプションは、メタレベルでデータを入力することであり、この場合、都市別の人口数を、各都市内で作成され得る(六角形などの)標準形状の数で割る。この後者のオプションは、厳密ではないが、良好なデータを利用できない場合に少なくともある程度の洞察を提供する。しかしながら、これらのオプションはどちらも、完全に満足できるものではない。六角形などの形状を使用する場合の問題は、この手法が自然的境界を考慮することが不得手であることである。例えば、海岸線にある大都市が所与の六角形に分類される場合、海域には誰も居住していないという理由により、六角形全体の平均人口密度は比較的低くなる可能性があるが、六角形の都市部は実際には人口が密集している可能性があるので、この結果は、実際の都会性を不正確に反映することになる。
したがって、表面上の消費者又は他のグループに関する推論を世界規模で行うことができ、且つ、水域、山などの自然的境界又は地理的/地政学的境界に関わらず都会性を正確に反映する、表面内の国又は他の定義された領域全体の都会性データを標準化するためのマシン及び方法は、多くの目的にとって非常に望ましい。
本発明は、様々な国及び他の領域を越えて都会性の尺度を標準化するためのマシン及び方法を対象とする。本発明は、緯度及び経度の座標に従って描画された入れ子形状を使用することによって、このタスクを達成する。緯度及び経度は世界共通であり、どこでも同じように測定されるので、これらを使用して、都会性を測定するための世界的なフレームワークを提供することができる。緯度及び経度の情報を使用して、領域を捕捉し、領域内の都会性を定義するための形状が描画されてもよい。ある特定の実装形態において、形状は、一定の緯度及び経度の範囲内にある台形であり、形状は地球の表面の湾曲に一致するように湾曲している。例えば、サンフランシスコの大都市圏は、北緯37°から38°の間、西経122°から123°の間にある。これらの緯度線/経度線は、これらの線の交点に角がある台形を定義するが、台形は、地球の湾曲により第3の空間次元に湾曲している。当然ながら、大都市圏は緯度線/経度線によって定義されておらず、この特定の台形内のエリアの大部分はサンフランシスコの大都市圏内にはなく、実際には、この台形のかなりの割合が海洋内にある。本発明は、ある特定の実装形態において、複数の重複するサイズの湾曲した台形を採用することによって、自然的境界並びに州及び国の境界などの地理的境界のこれらの選別に対処する。
湾曲した台形が緯度及び経度の一定の間隔で描かれる場合、形状は赤道からのそれらの距離に応じて、異なる総面積を占めることが理解され得る。経度線が両極に近づくにつれて共に近づくという事実により、両極により近接する台形は、東西方向により狭くなり、したがって、より高い(北又は南)緯度の台形又は他の形状は、面積がより小さくなる。したがって、本発明は、ある特定の実装形態において、エリアが両極に近づくときの(すなわち、緯度値が0°から離れて北又は南に90°により近づくときの)エリアのサイズの「縮小」を考慮するために、これらのエリアの形状に乗数コンポーネントを適用する方法をさらに対象とする。
本発明は、ある特定の実装形態において、人間の世帯数を対象とするが、本発明は、そのように限定されず、人口密度が対象となる事柄である任意の他の計数に適用することができる。これには、例えば、あるエリア内のサイバー通貨マイニング・マシンの計数が含まれ得る。
本発明のこれらの並びに他の特徴、目的、及び利点は、好ましい実施例の以下の詳細な説明及び添付の特許請求の範囲を、以下に説明する図面と併せて検討することにより、よりよく理解されよう。
本発明の一実装形態による、方法におけるステップの順序を示す流れ図である。 本発明の一実装形態による、表面上に描写されたピン(台形形状)の図である。 本発明の一実装形態による、マシン内の論理コンポーネントの図である。
本発明について、1つ又は複数の特定の実装形態を参照して以下に説明するが、これらの実装形態は本発明に限定するものではなく、本発明の全範囲は、特許請求の範囲のみに記載される通りであることが理解されよう。
概説すると、本発明の一実装形態は、図1に示すような主要ステップからなる(ただし、これらのステップは、以下でより具体的に説明するように複数のサブステップに分割されてもよい)。地理データを入力するステップ1では、基本情報がシステムに入力される。4つのピン形状のそれぞれに世帯を割り当てるステップ2に移動し、緯度/経度の境界に基づいて4つの異なる台形形状(「ピン」)が構築される。これらは、緯度/経度の各方向に2つの異なる尺度を使用して作成され、したがって、4つの異なる形状/サイズの台形、すなわち、「大きい(big)」台形(緯度と経度の両方の尺度がより大きい)、「縦長の(tall)」台形(緯度の尺度がより大きく、経度の尺度がより小さい、本明細書ではピン22と呼ばれる)、「幅広の(wide)」台形(緯度の尺度がより小さく、経度の尺度がより大きい)、及び「小さい(small)」台形(緯度と経度の両方の尺度がより小さい)が存在する。一実例では、10進法の緯度/経度の測定値を使用して台形を作成することによって、尺度が作成され、大きい方の尺度は小数第1位に丸められ、小さい方の尺度は小数第2形状に丸められる。
ステップ3では、緯度線/経度線によって描かれたこれらの台形が両極に近づくにつれて、これらの台形のサイズが小さくなり、赤道に近づくにつれてサイズが大きくなることを補償するために、乗数を適用して台形内の計数を調整する。これは、経度線が両極に近接するほど、経度線が共に近づくためである。
ステップ4では、各ピン内の世帯の重み付き和、及び対応する2乗和と、世帯ごとの各ピン・タイプの重み付き和のランクと、世帯別のランクの最小値、最大値、及び最小値/最大値の比とを含む、モデルに対する変数が作成される。
ステップ5では、都会性モデルが作成され、モデルに対して変数の回帰が実行される。
ステップ6では、出力データが準備され、モデルのスコア化に対する変数が作成される。出力は、世帯を合計すること又はCIESINを使用することによって出力データ内のピンに世帯数を割り当てること、及びステップに従って変数を作成することを含む。具体的には、使用可能なデータ・セットの2つの特定の実例が本明細書に記載されているが、本発明はそのように限定されない。一方の実例では、米国における世帯データを提供するために、Acxiom Corporationが保持しているInfoBaseデータベースが使用される。別の実例では、NASAからのCIESINデータが使用される。
ステップ7では、出力データ上でモデルがスケーリングされ、生の都会性スコアが各世帯数に割り当てられる。
ステップ8では、計数が、特定の用途に望ましい都会性の「バンド」又はレベルにロールアップされる。本明細書に記載の一実装形態では、ロールアップを使用して、それぞれが5%ごとの密度区分を含む20の都会性レベルを作成する。本明細書に記載の別の実装形態では、7つの都会性レベル、すなわち、農場(farm)(密度が最も低い10%)、田舎(rural)(次の15%)、町(town)(次の15%)、準郊外(exurb)(次の20%)、郊外(suburb)(次の20%)、都市(city)(次の10%)、都会(urban)(人口密度が最も高い10%)が使用される。出力は、都会性スコアによって世帯にランク付けされる。
ステップ9では、ランクが都会性バンドにロールアップされ、出力は各世帯の都会性への割り当てである。
最後に、任意選択のステップ10では、集合住宅(multi−unit dwelling)の指標がある場合、都会性が分割され、その場合、任意選択の二次割り当てが行われる。
この概要を踏まえて、次に、前述のように主要ステップ内に一定のサブステップを含む、本発明の特定の実装形態について説明する。まず、対応する緯度、経度、及び既知の都会性を備えた米国の世帯住所を含むデータ・セットが利用される。これは、米国国勢調査からブロック・グループに分割された米国国勢調査局のデータでもよく、このデータは、本明細書においてIB1273データ・セットと呼ばれる。広範囲の緯度及び都会性を活用するために、このファイルは、全国的な対象範囲を有することが理想的である。このデータから、次のデータ要素が作成される(なお、以下に提示するデータ要素の名前は任意である)。
a.lat1は、小数第1位に丸められた緯度である。
b.long1は、小数第1位に丸められた経度である。
c.lat2は、小数第2位に丸められた緯度である。
d.long2は、小数第2位に丸められた経度である。
前述のように、これらの値は「ピン」と呼ばれ、4つのエリアを定義する。ピン11の形状は、lat1とlong1の連結であり、これは「大きい」形状(赤道で約11.132km×11.132km)を表す。ピン11の値の例は「12.3_12.3」である。ピン12の形状は、lat1_long2の連結であり、これは、縦長の細い形状(赤道で約11.132km×1.1132km)で、地理的にピン11の内側にあるエリアを表す。ピン12の値の例は「12.3_12.34」である。ピン21の形状は、lat2_long1の連結であり、これは、幅広の短い形状(赤道で約1.1132km×11.132km)で、地理的にピン11の内側にあるエリアを表す。ピン21の値の例は「12.34_12.3」である。ピン22の形状は、lat2_long2の連結であり、これは、小さく、地理的にピン11、ピン12、ピン21の内側にあるエリア(赤道で約1.1132km×1.1132km)を表す。ピン22の値の例は「12.34_12.34」である。これらの形状間の関係を図2に図形で示す。
次に、各世帯に、赤道からのその緯度方向の距離に基づいてブースティング重みが割り当てられる。ブースティング重みは、本明細書において「hh_multiplier」と呼ばれ、近似値を使用して、110/((110−3*(緯度(latitude)の絶対値)/15)の2乗−(緯度の絶対値)/15)として計算される。これを、次の式1及び式2のように書くこともでき、この値は後の合計で使用されるので、「縮小(shrink)」は中間ステップとして計算される。
Figure 2021522629

Figure 2021522629
次のステップでは、ピン11、ピン12、ピン21、及びピン22のそれぞれについて、世帯の合計が計算される。これらの合計は、hh11、hh12、hh21、及びhh22と呼ばれる対応する要素に格納され得る。ピン形状ごとに世帯を合計するための基礎として使用できる、少なくとも2つの主要なデータ・ソースがある。最も利用できそうなデータは、現時点までに使用された分析ファイルである。次のプロセスは、単に住所を合計することである。しかしながら、このデータが全世界のすべての世帯を占めている可能性は低いため、好ましいオプションでは、別のソースからのより完全なデータを使用して、それらの計数をこの分析ファイルに整合させる。CIESINデータは、NASAによって収集され、コロンビア大学で提供されているデータであり、重心座標に基づく緯度及び経度に対する人口密度の推定値から構成されている。次いで、このデータは、本明細書に記載の対応する要素hh1、hh12、hh21、及びhh22に値を割り当てる際に使用するために、同じピン形状(ピン11、ピン12、ピン21、及びピン22で表される湾曲した台形)に変換される。
次に、予め定義されたhh_multiplier値が各世帯数に適用される。これにより、赤道からの距離に基づいて生の計数は増加する。これらの重み付き和は、hh11_wt、hh12_wt、hh21_wt、及びhh22_wtと呼ばれる対応する要素に格納され得る。さらに、これらの和のそれぞれについて計数の2乗が計算される。2乗値は、hh11_wt_sq、hh12_wt_sq、hh21_wt_sq、及びhh22_wt_sqと呼ばれる対応する要素に格納され得る。
次のサブステップは、hh11_wt、hh12_wt、hh21_wt、及びhh22_wtのそれぞれについて、計数によって世帯のランクを計算して、5%ごとの20区分にすることである。(任意選択で、hh11_wt_sq、hh12_wt_sq、hh21_wt_sq、及びhh22_wt_sqにより同じランク順が得られるので、これらを代わりに使用することができる。)1から20までの値を有するこれらのランクは、pop_density11、pop_density12、pop_density21、及びpop_density22と呼ばれる対応する要素に格納され得る。
次のタスクは、最大人口密度、最小人口密度、及び最小比/最大比を見出すことである。値max_pop_densityは、pop_density11、pop_density12、pop_density21、及びpop_density22全体からの最大都会性ランクである(最も都会である)。値min_pop_densityは、pop_density11、pop_density12、pop_density21、及びpop_density22全体からの最小都会性ランクである(最も都会ではない)。値min_over_max_pop_densityは、max_pop_densityとmin_pop_densityの比である。
この処理が完了すると、次のデータ要素に基づいてIB1273を予測する回帰モデルが構築される。
Figure 2021522629
結果として得られるモデルは次のようになり、結果として得られる予測人口密度はpop_density_rawと呼ばれるデータ要素に格納される。
Figure 2021522629
本発明の代替の実装形態において、例えば、前述のモデルで使用される変数のいくつかのサブセットを使用して他のモデルが使用されてもよいことが理解され得る。実際には、本発明の様々な代替の実装形態において、変数の任意のサブセットが使用されてもよい。このような手法を使用すると正確性が低下する可能性があるが、結果として生じるファイル・サイズ及び計算要件の減少は、ある特定の実装形態では有利である場合がある。代替モデルで使用され得る変数サブセットの非限定的な例は次の通りである。
代替モデル1:hh22_wt_sq、hh21_wt_sq、hh12_wt_sq、及びhh11_wt_sqの値を削除する。
代替モデル2:hh22_wt、hh21_wt、hh12_wt、及びhh11_wtの値を除くすべてを削除する。
代替モデル3:pop_density11、pop_density12、pop_density21、及びpop_density22の値を除くすべてを削除する。
代替モデル4:hh22_wt、hh21_wt、hh12_wt、hh11_wt、hh22_wt_sq、hh21_wt_sq、hh12_wt_sq、及びhh11_wt_sqの値を削除する。
代替モデル5:hh22_wt、hh21_wt、hh12_wt、hh11_wt、max_pop_density、及びmin_pop_densityの値を除くすべてを削除する。
代替モデル6:hh22_wt、hh21_wt、hh11_wt、及びmin_pop_densityの値を除くすべてを削除する。
代替モデル7:hh22_wt、hh21_wt、hh12_wt、hh11_wt、及びmin_pop_densityの値を除くすべてを削除する。
代替モデル8:hh22_wt、hh12_wt、hh11_wt、及びmin_pop_densityの値を除くすべてを削除する。
代替モデル9:hh21_wt、及びmin_over_max_pop_densityの値を除くすべてを削除する。
代替モデル10:hh21_wt、hh21_wt_sq、及びmin_over_max_pop_densityの値を除くすべてを削除する。
本発明者は、これらの代替モデルのうち、代替モデル10が他の代替モデルと比較して最も正確な結果を提供できることを見出した。これは、モデリングに幅広の短い湾曲した台形形状を使用すると予測品質が明らかに高くなることを反映しており、これらの形状のみを使用すると、4つのすべての形状及びそれらに関連する値を使用した完全なモデルの90%を上回る正確な結果が生成される。
所望されるいずれかのモデルを使用してpop_density_raw値を計算した後、図1の参照番号8において、その値を使用して、都会性をそれぞれが世帯の5%を表す1から20までの番号が付けられた20のグループにランク付けしてもよい。これは、pop_density20と呼ばれる新しいデータ要素に格納され得る。pop_density_rawスコアが20のグループのそれぞれを形成するというカットオフを使用して、これらの20のランクを、緯度及び経度を有する任意のファイルに割り当てることができる。グループを、次のように、pop_farm、pop_rural、pop_town、pop_exurb、pop_suburb、pop_city、pop_urbanなどの名前を有する7つの同等ではないグループなど、様々な用途にさらにロールアップすることができる。
Figure 2021522629
都会性の割り当てが行われると、これらは緯度及び経度の座標を伴う任意のデータベースに適用されてもよい。都会性は、pop_density_rawを作成するために使用されるモデル式を適用することによって割り当てられる。pop_density_rawスコアが20のグループのそれぞれを形成したカットオフを使用して、独自の5%ごと20のランクを割り当てることができる。これらの都会性の割り当てによってスコア化されるファイルは、モデルを構築するために使用されたファイルと同じ配分を有していない可能性があるので、いくらかの偏りが存在すること、すなわち、20のグループがそれぞれ5%を含まない可能性があることが予想される。均等な配分にするために、都会性の使用に応じて、ランク付けの割り当てを再割り当て(又は再較正)することを選択することが可能である。
米国外の場所に都会性を割り当てるための信頼できる方法は、NASAによって収集され、コロンビア大学で提供されている、CIESINデータを使用することである。このデータは、重心座標に基づく緯度及び経度に対する人口密度の推定値で構成されている。次いで、このデータは、本明細書に記載の実装形態で使用するために、同じピン形状(ピン11、ピン12、ピン21、及びピン22で表される湾曲した台形)に変換され、世帯レベルのデータが重心座標レベルでこの新しいデータ・ソースに置き換えられる。同じ一般的な手順に従って、割り当てを作成する。
任意選択のステップは、問題としている住所が、集合住宅であるのか、一戸建て住宅(single−unit dwelling)であるのかに基づいて、都会性をさらに分割することである。このステップが使用される場合、当然ながら、世帯が集合住宅に対応するのか、一戸建て住宅に対応するのかに関する適用可能なデータベースからの知識が必要である。この割り当ては、第2の住所行を伴う世帯又は住所内に「アパート(apt)」を伴う住所に集合住宅としてフラグを立て、それ以外の場合は一戸建て住宅であると仮定するなどの概算とすることができる。例えば、7つの人口密度がある場合、これらを、次の名前を使用して、集合住宅又は一戸建て住宅によって分割することができる。
Figure 2021522629

このステップの理論的根拠は、正確性を向上させることである。例えば、マンハッタンの中心部などの最も都会のエリアを表すことを意図したpop_urbanに世帯が割り当てられている場合、一戸建て住宅と思われる住所と、アパートと思われる住所を分割することが好ましい場合がある。同様に、農場として割り当てられているがアパートの建物であるように思われる住所を有する世帯は、正確には最も田舎というわけではない。
CIESINデータを使用した上記の実装形態の改善は、ピン11にゼロ以外の値が入力されているレコードのみを保持することによって出力に関連するファイル・サイズが大幅に低減されることで実現され得る。中に世帯のない地理的エリアを保持する必要はない。地球の表面の大部分は無人であるので、これは、データベースを大幅に縮小し、それによってストレージ要件を軽減するとともにこのデータ・セットで行われるすべての処理の実行を改善する機能をもたらす。
別の任意選択の手法は、データのファイル・サイズの最小化を実現するために回答キーを使用することである。この手法では、ピン11、ピン12、ピン21、及びピン22に基づいて都会性の割り当てが格納された、回答キーが作成される。ここでも、手法は、ピン11にゼロ以外の値が入力されているレコードのみを保持する。中に世帯のない地理的エリアを保持する必要はなく、また地球の大部分は無人であるので、これは、データベースのサイズを大幅に縮小する機能をもたらす。緯度及び経度を伴うデータベースに回答キーを適用するには、ピン22値を作成し、それらをルックアップと照合して人口密度を取得する。ピン22値のサブセットを20の人口密度バンドのうちの1つと照合する、特定の実例での回答キーの一部がどのようなものであり得るかの一例は、次の通りである。
Figure 2021522629
次に、図3を参照して、前述の方法を実装するためのマシンの論理コンポーネントについて記載する。台形作成ブロック20は、IB1273データ・セット26を使用して、生のピンを作成する。これらは世帯ブースト・ブロック22に供給され、世帯ブースト・ブロック22は、さらなる計算用のピン11、ピン12、ピン21、ピン22の値を生成し、また、その後の処理のためにhh_multiplierを渡す。世帯合計ブロック24は、CIESINデータベース28を使用して、上記のように合計を実行してhh11、hh12、hh21、及びhh22の値を生成し、これらの値は世帯データベース30に格納される。世帯数乗算ブロック32は、世帯データベース30からのデータ及びhh_multiplier値を使用して、hh11_wt、hh12_wt、hh21_wt、及びhh22_wtの値を生成する。これらの値は、人口ランク付けブロック34に渡され、人口ランク付けブロック34は、これらの値を使用して、pop_density11、pop_density12、pop_density21、及びpop_density22の値を生成する。(上記で概説した他の任意選択の値も同様である。)このデータは回帰分析器ブロック36に渡され、IB1273データ・セットのデータベース26を使用して回帰分析が再度実行される。これが完了すると、処理はバンド・グループ化ブロック38に移り、バンド・グループ化ブロック30は最終的に、人口エリアのバンドへの分割を可能にするpop_density20値を計算し、次いで、このデータは、その後の処理及び分析のために、pop_density20データベース40に格納される。
代替の実装形態において、本発明は、任意の3次元表面上の個体群密度を測定するために使用されてもよい。他の適用例には、限定ではなく例として、作物、野生生物、腫瘍の表面上にある白血球、又は細菌、本質的に、個体群密度又は他の密度に関連して緯度及び経度の割り当て(又は、より一般的には、任意の簡便な座標系)が行われ得る表面を有するあらゆるものが含まれ得る。同様に、本発明は、ビデオ・ゲーム又は仮想世界の設定に使用されてもよく、この場合、緯度及び経度の割り当てをゲーム設計に行うことができ、且つ、それが曲面レイアウトに適合する限りにおいて、様々なデジタル上の場所にあるゲーム・キャラクタの個体群密度が、実世界の人間の場所に取って代わる。例えば、多くの「サンド・ボックス」タイプのゲームでは、惑星又は他の球体の表面上のプレーヤ、リソース、及び同様のゲーム要素の位置について球座標を使用する。
別の実装形態では、モノのインターネット(IoT)を使用して、実際の人物の位置ではなくIoTマシンの位置に基づいて都会性を検出できることが理解され得る。いくつかの実例では、マシンの位置に基づいて人物の位置が推測されてもよく、又はマシン自体の位置が対象であってもよい。これは、IoTマシンが実行し得るアクション、及びIoTマシンが他の接続されているデバイスに送信し得る情報につながる場合がある。マシン自体の個体群密度が対象となる場合、世帯に関する上記の実例のうちの1つでCIESINデータが使用される方法と同様に、システムは、緯度及び経度のエリアに関連付けられた形状ごとのマシン数に関する外部ソースを必要とする場合があることに留意されたい。一方、IoTデバイスと連携することの大きな利点は、これらのデバイスがしばしば、それ自体の位置を、緯度及び経度として直接、又は緯度及び経度に変換され得る何らかの形式で自己報告することであり、このデータは自己蓄積しているので、デバイス自体からの通信を使用して、各「ピン」(すなわち、緯度(latitude)及び経度(longitude)によって定義される形状)内にデバイスがいくつあるかを理解することができる。IoTデバイスの場合、米国国勢調査データに合わせて較正するのではなく、方法では単に「pop_density_raw」値によって与えられる重みをデフォルトとして使用するだけであることにも留意されたい。さらに、IoTの実装形態では、都会性の概念が全く異なる場合があることに留意すべきである。例えば、農地は、関連する領域内の世帯密度が非常に低いことを理由として、人間にとっての「田舎」と見なされるが、例えば、作物用カメラ、衛星接続された栽培、灌漑用及び収穫用設備、農薬及び/又は除草剤を散布するための無人航空機(UAV:unmanned aerial vehicle)、土壌サンプリング機などの存在を理由として、農場は実際には、IoTマシンにとって個体群密度が非常に高いエリアである可能性がある。IoTの実装形態に固有の別の因子は、エリアの都会性が1日を通して変化する可能性があることであり、人間は一般的に一貫した世帯の場所を維持する一方で、IoTデバイスは様々な時間にオンとオフが切り替えられる。例えば、作物の監視に使用されるカメラは、日の出時にオンに切り替えられ、日没時にオフに切り替えられる場合がある。したがって、エリアにおけるIoTデバイスの都会性は、その局所的なエリアの時刻に基づいて、おそらく劇的に変動する可能性がある。
本発明の別の実装形態は、ブロックチェーン技術に関する。例えば、任意の特定の暗号通貨のノード又は「採掘者」の数に関して都会性の測定が行われてもよい。この情報は、様々な理由から有益であり得る。例えば、ノード(すなわち、暗号通貨ネットワークのバックボーンを形成する高性能コンピューティング施設)が密集している領域がある場合、これは、ノードが密集したエリアに影響を与える戦争、政治政策、又は自然災害によって、ブロックチェーン・システムが崩壊するリスクがあることを示し得る。同様に、ノードの都会性が低い場所に関する知識は、ブロックチェーン・ネットワーク全体の耐障害性を向上させるためにこれらのエリアに新しい格納場所を開設することを採掘者に奨励する機会を示し得る。ノードが最も密集している場所に関する知識は、この分野で働く人が就職する可能性がより高いエリアを示すなど、他の多くの理由からも利用され得る。
本発明の一実装形態では、コンピューティング環境において本発明を実装するために、統計解析ソフトウェア(SAS:statistical analysis software)コードが使用されてもよい。次のコード例では、CIESINデータを使用するのではなく、米国の世帯を合計する手法が使用されているが、CIESINデータの使用は上記の説明に従って同様にコード化され得ることが理解されよう。
Figure 2021522629

Figure 2021522629

Figure 2021522629

Figure 2021522629

Figure 2021522629

Figure 2021522629

Figure 2021522629

Figure 2021522629

Figure 2021522629

Figure 2021522629

Figure 2021522629
特に明記しない限り、本明細書で使用されるすべての技術用語及び科学用語は、本発明が属する技術分野の当業者によって一般的に理解される意味と同じ意味を有する。本発明の実践又は試験では、本明細書に記載の方法及び材料と類似又は同等の任意の方法及び材料も使用できるが、本明細書には限定された数の例示的な方法及び材料が記載されている。本明細書の本発明の概念から逸脱することなくさらに多くの変更形態が可能であることは、当業者には明らかであろう。
本明細書で使用されるすべての用語は、コンテキストと一致した可能な限り最も広範な意味で解釈されるべきである。本明細書においてグループ化が使用されるとき、グループのすべての個々のメンバー、及びグループの可能なすべての組合せ及び部分組合せは、個別に本開示に含まれるよう意図されている。本明細書で引用されるすべての参考文献は、本明細書の開示と矛盾しない範囲で参照により本明細書に組み込まれる。本明細書において範囲が記載されている場合、その範囲は、その範囲内のすべての部分範囲及びその範囲内のすべての特定の点を包含及び開示するよう意図されている。
本発明は、特定の好ましい実施例及び代替の実施例を参照して説明されており、これらは、例示のみを意図したものであり、添付の特許請求の範囲に記載されている本発明の全範囲に限定するよう意図したものではない。

Claims (20)

  1. 1つ又は複数のプロセッサで曲面上の領域の都会性を計算するためのコンピュータ化された方法であって、
    a.前記1つ又は複数のプロセッサと通信しているコンピュータ可読媒体から1組の地図情報を受信し、前記地図情報から緯度/経度の境界によって定義される複数の形状を構築するステップと、
    b.前記形状の緯度を補償するために前記複数の形状のそれぞれに関連付けられた計数を調整して、調整後の計数を生成するステップと、
    c.国からの国勢調査データを較正し、前記調整後の計数に適用するステップと、
    d.前記調整後の計数に外部の人口データ・セットを適用して、前記調整後の計数を合計するステップと、
    e.前記調整後の計数のそれぞれを複数の都会性バンドのうちの1つにロールアップし、緯度/経度の境界によって定義される前記複数の形状のそれぞれに前記複数の都会性バンドのうちの1つを適用するステップと
    を含む、コンピュータ化された方法。
  2. 前記複数の形状がそれぞれ、2つの異なるスケールのうちの1つの形状を含む、請求項1に記載の方法。
  3. 前記複数の形状が、垂直方向の尺度が大きく水平方向の尺度が大きい形状と、垂直方向の尺度が大きく水平方向の尺度が小さい形状と、垂直方向の尺度が小さく水平方向の尺度が大きい形状と、垂直方向の尺度が小さく水平方向の尺度が小さい形状とを含む、請求項2に記載の方法。
  4. 前記複数の形状が台形を含む、請求項3に記載の方法。
  5. 国勢調査データを較正する前記ステップが、前記複数の形状からの最大人口密度、及び前記複数の形状からの最小人口密度を計算するステップをさらに含む、請求項1に記載の方法。
  6. 国勢調査データを較正する前記ステップが、前記複数の形状からの最大人口密度、及び前記複数の形状からの最小人口密度を計算するステップをさらに含む、請求項1に記載の方法。
  7. 生の人口密度を生成するための、前記調整後の計数への回帰モデルの適用をさらに含む、請求項6に記載の方法。
  8. 前記領域の重心ベースの人口データを使用して、前記形状に前記複数の都会性バンドを適用するステップをさらに含む、請求項1に記載の方法。
  9. 前記調整後の計数の正確度を向上させるために、形状が集合住宅を含むかどうかを判定するステップと、そうである場合、前記集合住宅の中で住所を分割するステップとをさらに含む、請求項1に記載の方法。
  10. 前記調整後の計数を合計する前記ステップの前に、前記領域の人口ゼロのエリアに対応するすべての形状を削除するステップをさらに含む、請求項1に記載の方法。
  11. 曲面上の都会性を計算するためのマシンであって、
    a.前記曲面上の複数の領域のそれぞれについて4つの台形形状のうちの1つを生成するように構成された台形作成エンジンと、
    b.前記台形形状を受け取り、台形形状内の計数を、関連する前記台形形状の緯度位置に基づいて調整するように構成された世帯ブースト・エンジンと、
    c.前記台形形状のそれぞれについて調整後の計数を生成するように構成された世帯合計エンジンと、
    d.前記台形形状のそれぞれについて重み付き計数を生成するように構成された計数乗算エンジンと、
    e.前記台形形状のそれぞれについて人口密度値を生成するように構成された人口ランク付けエンジンと、
    f.前記台形形状のそれぞれについて回帰分析を実行して生の人口密度値を生成するように構成された回帰分析エンジンと、
    g.前記生の人口密度値に基づいて、前記台形形状のそれぞれを人口バンドに割り当てるように構成されたバンド・グループ化エンジンと
    を備える、マシン。
  12. コンピュータによって実行されると、コンピュータに、
    a.曲面上に、緯度/経度の境界によって定義される複数の台形形状を構築すること、
    b.前記形状の緯度を補償するために前記複数の台形形状のそれぞれに関連付けられた計数を調整して、調整後の計数を生成すること、
    c.国からの国勢調査データを較正し、前記較正後の国勢調査データを前記調整後の計数に適用すること、
    d.前記調整後の計数に外部の人口データ・セットを適用して、前記調整後の計数を合計すること、及び
    e.前記台形形状のそれぞれについて、前記調整後の計数のそれぞれを複数の都会性バンドのうちの1つにロールアップすること
    をさせる命令を記憶する、コンピュータ可読媒体。
  13. 前記複数の台形形状がそれぞれ、少なくとも1つの次元において2つの異なるスケールのうちの一方を含む、請求項12に記載のコンピュータ可読媒体。
  14. 前記複数の台形形状が、垂直方向の尺度が大きく水平方向の尺度が大きい形状と、垂直方向の尺度が大きく水平方向の尺度が小さい台形形状と、垂直方向の尺度が小さく水平方向の尺度が大きい台形形状と、垂直方向の尺度が小さく水平方向の尺度が小さい台形形状とを含む、請求項13に記載のコンピュータ可読媒体。
  15. コンピュータによって実行されると、前記複数の台形形状についての最大人口密度、及び前記複数の台形形状についての最小人口密度を計算する命令をさらに含む、請求項12に記載のコンピュータ可読媒体。
  16. コンピュータによって実行されると、前記複数の台形形状からの最大人口密度、及び前記複数の台形形状からの最小人口密度を計算する命令をさらに含む、請求項12に記載のコンピュータ可読媒体。
  17. コンピュータによって実行されると、前記調整後の計数に回帰モデルを適用して生の人口密度を生成する命令をさらに含む、請求項16に記載のコンピュータ可読媒体。
  18. コンピュータによって実行されると、前記領域の重心ベースの人口データを使用して、前記形状に前記複数の都会性バンドを適用する命令をさらに含む、請求項12に記載のコンピュータ可読媒体。
  19. コンピュータによって実行されると、前記調整後の計数の正確度を向上させるために、形状が集合住宅を含むかどうかを判定し、そうである場合、前記集合住宅の中で住所を分割する命令をさらに含む、請求項12に記載のコンピュータ可読媒体。
  20. コンピュータによって実行されると、前記曲面の人口ゼロのエリアに対応するすべての形状を削除する命令をさらに含む、請求項12に記載のコンピュータ可読媒体。
JP2021506611A 2018-04-20 2018-11-16 全世界の都会性測定用のマシン及び方法 Pending JP2021522629A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862660785P 2018-04-20 2018-04-20
US62/660,785 2018-04-20
PCT/US2018/061514 WO2019203897A1 (en) 2018-04-20 2018-11-16 Global urbanicity measurement machine and method

Publications (1)

Publication Number Publication Date
JP2021522629A true JP2021522629A (ja) 2021-08-30

Family

ID=68239138

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021506611A Pending JP2021522629A (ja) 2018-04-20 2018-11-16 全世界の都会性測定用のマシン及び方法

Country Status (5)

Country Link
US (1) US11861629B2 (ja)
EP (1) EP3782025A4 (ja)
JP (1) JP2021522629A (ja)
CN (1) CN112041813A (ja)
WO (1) WO2019203897A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220277409A1 (en) * 2022-05-19 2022-09-01 Chengdu Qinchuan Iot Technology Co., Ltd. Methods and systems for civil administration in smart city based on internet of things (iot)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0643804A (ja) * 1992-07-24 1994-02-18 Toshiba Corp 地図情報システム
JP2003091620A (ja) * 2001-09-19 2003-03-28 Kao Corp 統計情報集計装置
JP2011164889A (ja) * 2010-02-09 2011-08-25 Kozo Keikaku Engineering Inc バス路線評価支援システム、バス路線評価支援方法、バス路線評価支援プログラム、及び記録媒体
US20140365246A1 (en) * 2013-06-07 2014-12-11 State Farm Mutual Automobile Insurance Company Systems and methods for grid-based insurance rating
JP2015225128A (ja) * 2014-05-26 2015-12-14 株式会社Nttドコモ 提示システム、提示装置、及び提示方法
US9418337B1 (en) * 2015-07-21 2016-08-16 Palantir Technologies Inc. Systems and models for data analytics

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003030373A (ja) 2001-07-10 2003-01-31 Fujitsu Ltd 人口分布解析装置
US7844417B2 (en) 2003-02-21 2010-11-30 First American Real Estate Solutions, Llc GIS-based rapid population assessment tool
US8612176B2 (en) 2007-01-26 2013-12-17 Auburn University Nominal population metric: clustering of nominal application attributes
WO2011052473A1 (ja) 2009-10-30 2011-05-05 株式会社エヌ・ティ・ティ・ドコモ 管理サーバ、人口情報算出管理サーバ、不在エリア管理方法および人口情報算出方法
US8478289B1 (en) 2010-06-01 2013-07-02 Google Inc. Predicting geographic population density
JP5690757B2 (ja) 2012-02-08 2015-03-25 株式会社Nttドコモ 層別割当装置
US8948927B1 (en) 2012-12-27 2015-02-03 Google Inc. Methods and systems for determining a distribution of balloons based on population densities
CN103218517B (zh) 2013-03-22 2016-01-20 南京信息工程大学 基于gis的区域网格化人口密度空间化计算方法
US9230169B2 (en) 2013-08-29 2016-01-05 Digitalglobe, Inc. Generation of high resolution population density data sets through exploitation of high resolution overhead imagery data and low resolution population density data sets
WO2016063424A1 (ja) 2014-10-24 2016-04-28 株式会社Agoop 人口推定装置、プログラム及び人口推定方法
US20160358190A1 (en) * 2015-06-04 2016-12-08 The Nielsen Company (Us), Llc Methods and apparatus to estimate a population of a consumer segment in a geographic area
US20170248434A1 (en) 2016-02-29 2017-08-31 Blake Dearring Best Car-top mount with population density estimation

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0643804A (ja) * 1992-07-24 1994-02-18 Toshiba Corp 地図情報システム
JP2003091620A (ja) * 2001-09-19 2003-03-28 Kao Corp 統計情報集計装置
JP2011164889A (ja) * 2010-02-09 2011-08-25 Kozo Keikaku Engineering Inc バス路線評価支援システム、バス路線評価支援方法、バス路線評価支援プログラム、及び記録媒体
US20140365246A1 (en) * 2013-06-07 2014-12-11 State Farm Mutual Automobile Insurance Company Systems and methods for grid-based insurance rating
JP2015225128A (ja) * 2014-05-26 2015-12-14 株式会社Nttドコモ 提示システム、提示装置、及び提示方法
US9418337B1 (en) * 2015-07-21 2016-08-16 Palantir Technologies Inc. Systems and models for data analytics

Also Published As

Publication number Publication date
US11861629B2 (en) 2024-01-02
WO2019203897A1 (en) 2019-10-24
US20210182444A1 (en) 2021-06-17
CN112041813A (zh) 2020-12-04
EP3782025A4 (en) 2021-12-22
EP3782025A1 (en) 2021-02-24

Similar Documents

Publication Publication Date Title
Mustafa et al. Coupling agent-based, cellular automata and logistic regression into a hybrid urban expansion model (HUEM)
Dramowicz Retail trade area analysis using the Huff model
Chakir et al. Predicting land use allocation in France: A spatial panel data analysis
Getz et al. A local nearest‐neighbor convex‐hull construction of home ranges and utilization distributions
CN108876027B (zh) 一种基于gis的农村居民点集中居住区选址和优化方法
Streltsov et al. Estimating residential building energy consumption using overhead imagery
Maithani A neural network based urban growth model of an Indian city
Dezhkam et al. Performance evaluation of land change simulation models using landscape metrics
He et al. Alternative future analysis for assessing the potential impact of climate change on urban landscape dynamics
Yang et al. Machine learning based estimation of land productivity in the contiguous US using biophysical predictors
Thies et al. Projecting land-use and land-cover changes in a tropical mountain forest of Southern Ecuador
Louthan et al. Aridity weakens population-level effects of multiple species interactions on Hibiscus meyeri
Fecht et al. A GIS-based urban simulation model for environmental health analysis
Casalegno et al. Regional scale prioritisation for key ecosystem services, renewable energy production and urban development
CN110956412A (zh) 基于实景模型的洪灾动态评估方法、装置、介质和设备
Iannella et al. A step towards SDMs: A “couple‐and‐weigh” framework based on accessible data for biodiversity conservation and landscape planning
Quevedo et al. Predicting the potential distribution of the endangered huemul deer Hippocamelus bisulcus in North Patagonia
Wang et al. Using MaxEnt model to guide marsh conservation in the Nenjiang River Basin, Northeast China
CN110348896A (zh) 划分地理网格的方法、商圈确定方法及设备
Dhanaraj et al. Analysis of urban expansion patterns through landscape metrics in an emerging metropolis of Mangaluru Community Development Block, India, During 1972–2018
Bocchiola et al. Hydropower potential of run of river schemes in the himalayas under climate change: a case study in the dudh koshi basin of Nepal
JP2021522629A (ja) 全世界の都会性測定用のマシン及び方法
Mubea et al. Spatial effects of varying model coefficients in urban growth modeling in Nairobi, Kenya
de Sherbinin Remote sensing and socioeconomic data integration: lessons from the NASA socioeconomic data and applications center
Abrar et al. Shahfahad,; Rahman, A.; Islam, ARMT; Mosavi, A. Assessing the Spatial Mapping of Heat Vulnerability under Urban Heat Island (UHI) Effect in the Dhaka Metropolitan Area

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210824

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220930

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221025

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230519