CN112041813A - 全球城市化程度测量机器和方法 - Google Patents
全球城市化程度测量机器和方法 Download PDFInfo
- Publication number
- CN112041813A CN112041813A CN201880092542.2A CN201880092542A CN112041813A CN 112041813 A CN112041813 A CN 112041813A CN 201880092542 A CN201880092542 A CN 201880092542A CN 112041813 A CN112041813 A CN 112041813A
- Authority
- CN
- China
- Prior art keywords
- pop
- shapes
- trapezoid
- computer
- shape
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000000611 regression analysis Methods 0.000 claims description 3
- 238000004891 communication Methods 0.000 claims description 2
- 230000004931 aggregating effect Effects 0.000 claims 2
- 230000001755 vocal effect Effects 0.000 claims 1
- 239000003292 glue Substances 0.000 description 23
- 238000013459 approach Methods 0.000 description 11
- 101100182247 Caenorhabditis elegans lat-1 gene Proteins 0.000 description 6
- 238000006467 substitution reaction Methods 0.000 description 5
- 101100182248 Caenorhabditis elegans lat-2 gene Proteins 0.000 description 4
- 241000282412 Homo Species 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 239000004009 herbicide Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003973 irrigation Methods 0.000 description 1
- 230000002262 irrigation Effects 0.000 description 1
- 210000000265 leukocyte Anatomy 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000000575 pesticide Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005527 soil sampling Methods 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
- 239000003643 water by type Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/10—Geometric CAD
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- General Engineering & Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- Tourism & Hospitality (AREA)
- Geometry (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Game Theory and Decision Science (AREA)
- Probability & Statistics with Applications (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Computer Hardware Design (AREA)
- Educational Administration (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Algebra (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
Abstract
在一种用于测量全球城市化程度的系统和方法中,不规则四边形形状是基于纬度/经度边界、使用二维中的两个不同比例尺来构建的,从而产生了四种不同形状/大小的不规则四边形。应用倍增器来调整不规则四边形内的计数,以补偿以下事实:由纬度/经度线描绘的这些不规则四边形在接近地球两极时尺寸会减小。从给定国家应用人口普查数据,然后使用与计数有关的外部数据集进行求和。最后,将计数汇总为特定应用所需的一定数目的城市化程度“带”或级别。
Description
技术领域
本发明属于通过测量和分配人口密度来改善人口计数产品的领域,尤其涉及如下领域:在全世界范围内分配人口密度,而不管特定国家是否收集人口普查类型信息。
背景技术
出于本文目的,“城市化程度(urbanicity)”可以被定义为给定区域中的人口密度水平;较城市化的区域具有较高人口密度(即每单位面积的居民),而农村化的区域具有较低人口密度。确定人口密度与许多领域高度相关,包括例如有针对性的营销。特定消费者的城市化程度可提供与该消费者有关的某些可能的人口统计和购买倾向数据,并因此,城市化程度允许营销人员基于消费者居住区的城市化程度来推断出关于消费者的某些特质。跨所有国家和地理位置来准确且标准化地测量城市化程度将简化关于例如人类购物行为、媒体消费、产品亲和力和生活条件的预测和推断,因为可以推断出城市化程度相类似的人们在某些方面具有类似的特性。然而,测量城市化程度需要对每个标准大小的区域的住户进行准确计数,包括考虑例如是否有人居住在湖泊、森林的边界或任意的人工界线(诸如州或国家)等因素,即使没有事先知道这些界线的位置或存在。此类自然界限(如果未被考虑)可能指示某区域的都会密度或城市化程度低于实际准确度;例如,如果湖岸上的人口密度很高,而湖泊的人口密度理所当然为零,那么包括湖岸等在内的区域的平均人口密度将极具误导性。
为了更好地理解该问题的解决方案的潜在价值,可以认为,美国住户的人口统计和倾向值覆盖范围可达到10,000个那么多的调查问答。在其他发达国家,诸如德国、英国、法国和澳大利亚,可能有数百种这样的答案可用。另一方面,世界上大多数国家几乎没有此类信息(如果存在任何可用的信息的话)。弥合这些国家缺乏数据集的手段将非常有价值。
每个国家可能使用不同的人口普查收集办法,并因此没有标准化。另外,在个人或住户层面上,并非始终都能获得来自不同司法管辖区的数据。实际上,许多国家根本没有公开可用的人口普查类型数据,因此,任何在全球范围内应用城市化程度的尝试都是一项艰巨的任务。如果在一个发达国家(诸如美国)对数据进行了不同的测量,那么如果人口普查数据和其他可能提供有关城市化程度的信息的数据的收集方式不同,则无法推断出另一个国家的消费者的任何信息,因此,不可能进行“苹果与苹果(apples to apples)”的比较。例如,美国人口普查局基于人口普查定义的“块组(block groups)”提供有关人口的高度详细的信息;但是此块组概念未在任何其他国家采用,因此不可能将此类数据直接应用于另一国家可能提供的任何数据以便生成推论。
一个相关的问题是,每个国家对城市化程度都有不同的衡量标准。例如,美国人口普查局将城市化程度(人口密度)划分为十二个不同的带或类别。法国、德国和意大利分别使用五个、九个和三个不同的带。这些带之间的划分均以不同的方式定义。许多国家,诸如巴西、墨西哥和澳大利亚,都没有关于城市化程度带的可用标准化公共信息。因而,任何使国家间城市化程度标准化的尝试都必须考虑人口密度带的不同使用(或不使用)的问题。
为了将此基准数据从美国应用到其他国家,可以考虑两种不同选项。第一种选项是简单地确认其他感兴趣国家中可用数据的不足,并在数据实际上相对完整的情况下实施解决方案。这是当今普遍采用的办法。然后,可以在有数据变得可用时将解决方案扩展到其他国家,但是只要信息仍然不可用,便会留下大的缺口。另一种选项是在元级别(meta-level)上充填数据,其中按城市的人口计数除以在每个城市中可能被创建的标准形状(诸如六边形)的数目。后一种选项是不精确的,但是在没有更好的数据可用的情况下,至少可以提供一些洞察。然而,这些选择都不是完全令人满意的。使用诸如六边形之类的形状的问题在于,这种办法在解释自然边界方面做得很差。例如,如果海洋海岸线上的一个大城市落入了给定的六边形,则由于没有人居住在海洋区域中的事实,跨该六边形的平均人口密度可能会相对较低,然而该结果无法准确反映实际的城市化程度,因为六边形的城市部分实际上可能是人口稠密的。
因此,一种用于跨地表中的各国家或其他定义的区域来标准化城市化程度数据的机器和方法出于多种目的将是高度期望的,这样一来,将允许在全球范围内做出关于该地表上的消费者或其他群体的推断,并且尽管存在自然边界(例如水域、山脉等)或地理/地缘政治界线,也可以准确反映城市化程度。
发明内容
本发明涉及一种用于跨各个国家和其他区域来标准化城市化程度的测量的机器和方法。本发明通过使用根据纬度和经度坐标绘制的嵌套形状来完成该任务。由于纬度和经度是世界范围的,并且到处都可以同样地测量,因此可以用来提供一个在全球范围测量城市化程度的框架。使用纬度和经度信息,可以绘制形状以捕获区域并定义该区域内的城市化程度。在某些实施方式中,形状是位于一定纬度和经度范围内的不规则四边形(trapezoids),形状是弯曲的以匹配地球表面的曲率。例如,旧金山大都会区位于北纬37°至38°之间,西经122°至123°之间。这些纬度/经度线定义了一个不规则四边形,在这些线的交点处具有拐角,但是由于地球的曲率,该不规则四边形被弯曲到第三空间维度中。当然,大都会区域不是由纬度/经度线定义的,并且该特定不规则四边形中的大部分区域都不在旧金山大都会区域内;实际上,这种不规则四边形的很大一部分位于海洋内。在某些实施方式中,本发明通过采用弯曲的不规则四边形的多个交叠尺寸来解决这些种类的自然边界以及地理边界,诸如州和国家边界。
可以理解,如果弯曲的不规则四边形在纬度和经度上以规则的间隔来描绘,则形状将取决于它们与赤道的距离而占据不同的总面积。由于经线在接近极点时会拉得更近的事实,因此在极点附近的不规则四边形在东西方向上会更窄,并因此在较高(北或南)纬度上的不规则四边形或其他形状的面积会更小。因此,在某些实施方式中,本发明进一步涉及一种将倍增分量应用于这些区域形状以考虑区域接近极点时(即,随着纬度值进一步偏离0°并接近北或南90°)区域尺寸“缩小”的方法。
在某些实施方式中,尽管本发明针对人类住户计数,但是本发明不限于此,而是可以应用于人口密度是关注事项的任何其他计数。例如,这可包括某区域中的数字货币采矿机的计数。
本发明的这些和其他特征、目标及优点将通过结合如以下描述的附图考虑以下对优选实施例和所附权利要求书的详细描述而变得更好理解:
附图说明
图1是描述根据本发明的实施方式的方法中的步骤顺序的流程图。
图2是根据本发明的实施方式在表面上绘制的销钉(不规则四边形形状)的描绘。
图3是根据本发明的实施方式的机器中的逻辑组件的描绘。
具体实施方式
下面将参考一种或多种具体实施方式描述本发明;然而,应当理解,这些实施方式不限于本发明,并且本发明的全部范围仅在权利要求中阐明。
总的来说,本发明的实施方式包括如图1所解说的主要步骤(尽管这些步骤可以分成多个子步骤,如下文更具体地描述)。在输入地理数据步骤1中,基本信息被输入到系统中。移至步骤2,将住户分配到每一个四销钉形状,四个不同的不规则四边形形状(“销钉”)是基于纬度/经度边界构建的。这些是在每个纬度/经度方向上使用两种不同的比例尺来创建的,并且因此有四种不同形状/尺寸的不规则四边形:“大”不规则四边形(比例尺在经度和纬度两者上都较大);“高”不规则四边形(比例尺在纬度上较大,而在经度上较小,在本文中被称为pin22);“宽”不规则四边形(比例尺在纬度上较小,而在经度上较大);以及“小”不规则四边形(比例尺在经度和纬度两者上均较小)。在一个示例中,通过使用十进制纬度/经度测量创建不规则四边形来创建比例尺,其中较大比例尺四舍五入到小数点后一位,而较小比例尺四舍五入到两个小数位。
在步骤3中,应用倍增器来调整不规则四边形内的计数,以补偿以下事实:由纬度/经度线描绘的这些不规则四边形在它们接近极点时尺寸会减小,而在它们接近赤道时尺寸会增大。这是因为经线在极点附近变得更加靠近。
在步骤4中,为模型创建变量,包括每个销钉中住户的加权求和,以及相应的平方和;每种销钉类型的按住户的加权求和的排名;以及按住户排名的最小值、最大值和最小值/最大值比率。
在步骤5,创建城市化程度模型,并对模型执行变量回归。
在步骤6,准备输出数据,并创建变量以进行模型评分。输出包括通过对住户求和或使用CIENSIN并按照以下步骤创建变量来将住户计数分配给输出数据中的销钉。具体地,在此描述了可用数据集的两个特定示例,但是本发明不限于此。在一个示例中,由AcxiomCorporation维护的InfoBase数据库用于提供美国的住户数据。在另一示例中,使用了来自NASA的CIESIN数据。
在步骤7,根据输出数据对模型进行缩放,并将原始城市化程度分数分配给每个住户计数。
在步骤8,将计数汇总为特定应用所需的城市化程度“带”或级别。在本文描述的一种实施方式中,汇总被用来创建二十个城市化程度级别,每个级别包括5%的密度范围(density bracket)。在本文描述的另一实施方式中,使用七个城市化程度级别:农场(farm)(密度最低的10%);农村(rural)(接下来的15%),城镇(town)(接下来的15%),远郊(exurb)(接下来的20%),近郊(suburb)(接下来的20%),城市(接下来的10%),以及都会(urban)(人口密度最高的10%)。输出是按城市化程度分数排名的住户。
在步骤9,将排名汇总成城市化程度带,其中输出是每个住户到一个城市化程度的分配。
最后,在可选步骤10,如果有多户住宅迹象,则将城市化程度进行拆分,并且如果有的话,则进行可选的二级分配。
借助该概览,现在可以描述本发明的特定实施方式,其包括刚刚描述的这些主要步骤中的某些子步骤。首先,采用一个数据集,其包含美国的住户住址以及相应的纬度、经度和已知的城市化程度。这可能是美国人口普查局的数据,其从美国人口普查分成多个块组,在此将其称为IB1273数据集。理想情况下,此文件应具有全国性的覆盖范围,以利用各种纬度和城市化程度。根据此数据,创建以下数据元素(请注意,以下提供的数据元素是任意的):
lat1是四舍五入到小数点后一位的纬度;
long1是四舍五入到小数点后一位的经度;
lat2是四舍五入到小数点后两位的纬度;以及
long2是四舍五入到小数点后两位的经度。
如前所述,这些值将被称为“销钉”以定义四个区域。pin11形状是lat1和long1的并置,其表示“大”形状(其在赤道处大致为11.132km x 11.132km)。pin11值的示例是“12.3_12.3”。pin12形状是lat1_long2的并置,其表示形状既高且瘦(在赤道处大致为11.132km x 1.1132km),并且在地理上位于pin11内部的区域。pin12值的示例是“12.3_12.34”。pin21形状是lat2_long1的并置,其表示形状既宽又短(在赤道处大致为1.1132kmx 11.132km),并且在地理上位于pin11内部的区域。pin21值的示例是“12.34_12.3”。pin22形状是lat2_long2的并置,其表示面积很小并且在地理上位于pin11、pin 12和pin 21内部(在赤道处大致为1.1132km x 1.1132km)的区域。pin22值的示例是“12.34_12.34”。这些形状之间的关系如图2中图形化地解说的。
接下来,基于每个住户到赤道的纬度距离为其分配推升(boosting)权重。使用近似为110/((110-3*(latitude(纬度)的绝对值)/15)的平方-(纬度的绝对值)/15)来计算推升权重,其在本文中被称为“hh_multiplier”。也可以在式1和式2中将其写为以下形式,其中将“shrink(收缩)”计算为中间步骤,因为此值将在稍后的求和中使用:
在下一步骤中,为pin11、pin12、pin21和pin22中的每一个计算住户的求和。这些求和可以被存储在称为hh1、hh12、hh21和hh22的相应元素中。至少有两个主要数据来源可被用作针对每种销钉形状对住户进行求和的基础。至此,最有可能的可用数据将是分析文件。然后,该过程便是简单地对地址求和。但是,由于此数据不可能考虑到整个世界的所有住户,因此优选选项是使用来自另一更完整来源的数据,并且随后将这些计数与该分析文件匹配。由NASA收集并托管于哥伦比亚大学的CIESIN数据由基于质心坐标的纬度和经度人口密度估计组成。该数据随后被转换为相同的销钉形状(由pin11、pin12、pin21和pin22表示的弯曲的不规则四边形),以用于将值分配给此处所描述的相应元素hh1、hh12、hh21和hh22。
接下来,将先前定义的hh_multiplier值应用于每个住户计数。这会基于距赤道的距离而增大原始计数。这些加权求和可以被存储在称为hh11_wt、hh12_wt、hh21_wt和hh22_wt的相应元素中。另外,计算这些中的每一者的计数的平方。平方可以被存储在称为hh11_wt_sq、hh12_wt_sq、hh21_wt_sq和hh22_wt_sq的相应元素中。
对于每个hh11_wt、hh12_wt、hh21_wt和hh22_wt,下一个子步骤是通过计数(分为每个5%的20个间隔)来计算住户的排名。(可选地,可改为使用hh11_wt_sq、hh12_wt_sq、hh21_wt_sq和hh22_wt_sq,因为它们产生相同的排名排序)。可以具有从1到20的值的排名存储在称为pop_density11、pop_density12、pop_density21和pop_density22的相应元素中。
下一个任务是找到最大人口密度、最小人口密度以及最小/最大比率。值max_pop_density是来自跨pop_density11、pop_density12、pop_density21和pop_density22的最大城市化程度排名(最都会的)。值min_pop_density是来自跨pop_density11、pop_density12、pop_density21和pop_density22的最小城市化程度排名(最不都会的)。值min_over_max_pop_density是min_pop_density与max_pop_density之比。
一旦此处理完成,便基于以下数据元素构建回归模型来预测IB1273:
hh22_wt hh21_wt hh12_wt hh11_wt
hh22_wt_sq hh21_wt_sq hh12_wt_sq hh11_wt_sq
pop_density11 pop_density12 pop_density21 pop_density22
max_pop_density,min_pop_density,min_over_max_pop_density.
所得模型可能如下所示,其中所得经预测人口密度被存储在称为
pop_density_raw的数据元素中。
pop_density_raw=
13.42868
+hh22_wt*0.00035618
+hh21_wt*0.00009114
+hh12_wt*0.00004767
+hh11_wt*0.00000374
+hh22_wt_sq*-0.00000000523929
+hh21_wt_sq*-0.00000000043506
+hh12_wt_sq*-0.00000000015016
+hh11_wt_sq*-0.0000000000056024
+pop_density11*0.09108
+pop_density12*0.10001
+pop_density21*0.08818
+pop_density22*0.03525
+max_pop_density*-1.07204
+min_pop_density*1.35745
+min_over_max_pop_density*-21.36822
可以理解,可以在本发明的替代实施方式中使用其他模型,例如使用刚刚描述的模型中所使用的变量的某些子集实际上,变量的任何子集均可以在本发明的各种替代实施方式中使用。尽管使用这种办法可能会降低准确度,但在某些实施方式中,所得到的文件大小和计算要求中的减少可能是有利的。可以在替代模型中使用的变量子集的非限制性示例如下:
替代模型1:除去hh22_wt_sq、hh21_wt_sq、hh12_wt_sq和hh11_wt_sq值。
替代模型2:除去hh22_wt、hh21_wt、hh12_wt和hh11_wt值之外的所有值。
替代模型3:除去pop_density11、pop_density12、pop_density21和pop_density22值之外的所有值。
替代模型4:除去hh22_wt、hh21_wt、hh12_wt、hh11_wt、hh22_wt_sq、hh21_wt_sq、hh12_wt_sq和hh11_wt_sq值。
替代模型5:除去hh22_wt、hh21_wt、hh12_wt、hh11_wt、max_pop_density和min_pop_density值之外的所有值。
替代模型6:除去hh22_wt、hh21_wt、hh11_wt和min_pop_density值之外的所有值。
替代模型7:除去hh22_wt、hh21_wt、hh12_wt、hh11_wt和min_pop_density值之外的所有值。
替代模型8:除去hh22_wt、hh12_wt、hh11_wt和min_pop_density值之外的所有值。
替代模型9:除去hh21_wt和min_over_max_pop_density值之外的所有值。
替代模型10:除去hh21_wt、hh21_wt_sq和min_over_max_pop_density值之外的所有值。
在这些替代模型中,发明人已经发现,相对于其他替代模型,替代模型10能够提供最准确的结果。这反映了使用宽、短弯曲不规则四边形形状进行建模的明显较高的预测质量;仅使用这些形状生成了如使用所有四个形状及它们的相关值的完整模型的准确度的超过90%的准确度。
在使用所需的任何模型计算出pop_density_raw值之后,可以使用该值将城市化程度排成编号从1到20的20个组,每组表示5%的住户,在图1中以参考数字18表示。可以将其存储在称为pop_density20的新数据元素中。其中pop_density_raw分数形成二十个组中的每个组的截断(cutoff)可被用来在具有纬度和经度的任何文件上分配这二十个排名。可以将这些组进一步汇总以用于各种用途,诸如分成七个不均等的组,其名称诸如以下:pop_farm、pop_rural、pop_town、pop_exurb、pop_suburb、pop_city,pop_urban,如下所示。
If pop_density20=1 or pop_density20=2 then Pop_farm=1
If pop_density20=3 or pop_density20=4 or pop_density20=5 then Pop_rural=1
If pop_density20=6 or pop_density20=7 or pop_density20=8 then Pop_town=1
If pop_density20=9 or pop_density20=10 or pop_density20=11 or pop_density20=12 then Pop_exurb=1
If pop_density20=13 or pop_density20=14 or pop_density20=15 orpop_density20=16 then Pop_suburb=1
If pop_density20=17 or pop_density20=18 then Pop_city=1
If Pop_urban=0;if pop_density20=19 or pop_density20=20 then Pop_urban=1
一旦做出城市化程度分配,便可以将其应用于具有经度和纬度坐标的任何数据库。通过应用用于创建pop_density_raw的模型公式来分配城市化程度。其中pop_density_raw分数构成了二十个组中的每个组的截断可被用来分配原始的20个排名,每个排名5%。由于利用这些城市化程度分配评分的文件可能与用于构建模型的文件具有不同的分布,因此,预计可能存在一些偏差,这意味着二十个组可能不各自包含5%。取决于城市化程度的使用,可能优选重分配(或重校准)排名分配以强制均匀分布。
将城市化程度分配给美国以外地点的一种可靠方式是使用CIESIN数据,该数据由NASA收集并托管于哥伦比亚大学。该数据由基于质心坐标的纬度和经度人口密度估计组成。该数据随后被转换为相同的销钉形状(由pin11、pin12、pin21和pin22表示的弯曲的不规则四边形),以与本文描述的实施方式配合使用,在这些实施方式中,住户级数据被质心坐标级别的新数据源替代。遵循相同的一般步骤来创建分配。
可选步骤是基于所讨论的地址是多户住宅还是单户住宅来进一步拆分城市化程度。如果被使用,那么该步骤当然需要从适用的数据库中获得有关住户是多户住宅还是单户住宅的知识。此分配可以是近似的,诸如将具有第二地址线或者其中带“apt(公寓)”的地址的住户旗标为多户住宅,否则假定为单户住宅。例如,如果有七个人口密度,则可以使用以下名称按多户或单户住宅进行对其进行拆分:Pop_farm_m、Pop_rural_m、Pop_town_m、Pop_exurb_m、Pop_suburb_m、Pop_city_m、Pop_urban_m、Pop_farm_s、Pop_rural_s、Pop_town_s、Pop_exurb_s、Pop_suburb_s、Pop_city_s、Pop_urban_s。此步骤的基本原理是提高准确度。例如,如果为一个住户分配pop_urban(其可能旨在表示大多数都会区域,诸如曼哈顿市中心),那么可能优选将被认为是单户住宅的地址与那些被认为是公寓的地址拆分开。同样,被分配为农场但地址使其看起来像是公寓楼的住户并不真正是最农村的。
可以达成对上述使用CIESIN数据的实施方式的改进,从而通过仅保留其中pin11填充有非零值的记录来显著减小与输出相关联的文件大小。无需保留其中没有住户的地理区域。由于地球的大部分表面都是无人居住的,因此这提供了以显著方式缩小数据库,并由此减少存储需求且提高利用此数据集进行的所有处理的执行力的能力。
另一可选办法是使用应答键(answer key),以便达成数据文件大小最小化。在这种办法中,创建一个应答键,其中基于pin11、pin12、pin21和pin22存储城市化程度分配。同样在这里,该办法仅保留其中pin11填充有非零值的记录。无需保留其中无住户的地理区域,并且由于地球上大部都是无人居住的,因此这提供了显著地缩小数据库规模的能力。为了将应答键应用于具有经度和纬度的数据库,可以创建pin22值并将其与查找进行匹配以获取人口密度。在特定示例中,将pin22值的子集与二十个人口密度带之一进行匹配的应答键的一部分可能看起来像什么样的示例如下所示:
pin22 pop_density20
32.65_-93.72 5
32.65_-93.79 1
32.65_-93.83 4
32.65_-93.89 1
32.65_-93.91 1
32.65_-93.92 1
32.65_-93.98 2
32.65_-94.34 1
32.65_-94.35 5
32.65_-94.39 6
32.65_-94.54 2
32.65_-94.57 4
32.65_-94.58 4
32.65_-94.61 2
32.65_-94.69 1
现在参考图3,可以阐述实现方才描述的方法的机器的逻辑组件。不规则四边形创建块20使用IB1273数据集26来创建原始销钉。这些被馈送到住户推升模块22,其生成pin11、pin12、pin21、pin 22值以供进一步计算,并且还沿hh_multiplier传递以供后续处理。住户求和块24使用CIESIN数据库28来执行如上描述的求和,以产生hh11、hh12、hh21和hh22值,这些值被存储在住户数据库30中。住户计数倍增块32使用来自住户数据库30的数据和hh_multiplier值来产生hh11_wt、hh12_wt、hh21_wt和hh22_wt的值。这些被传递到人口排名块34,其使用它们来产生pop_density11、pop_density12、pop_density21和pop_density22值。(以及如上概述的其他可选值。)该数据被传递到回归分析器块36,在此使用IB1273数据集数据库26再次执行回归分析。一旦这完成,处理便传递至带分组块30,其最终计算pop_density20值,这些pop_density20值虑及将人口区域划分成带,并且该数据随后被存储以供稍后在pop_density20数据库40中进行处理和分析。
在替代实施方式中,本发明可以用于测量任何三维表面上的人口密度。作为示例而非限制,其他应用可包括农作物、野生生物、位于肿瘤表面上的白细胞、或细菌;从本质上讲,与种群或其他密度有关的、具有其中可做出纬度和经度分配(或更笼统地说,任何便利坐标系)的表面的任何事物。同样,本发明可以用在视频游戏或虚拟世界设置中,其中在不同数字位置中游戏角色的人口密度代替现实世界位置中的人类,只要可以对游戏设计进行纬度和经度分配并且其符合曲面布局。例如,许多“沙盒”型游戏使用球面坐标来确定玩家、资源以及类似游戏元素在行星或其他球面上的位置。
在另一实施方式中,可以看到,物联网(IoT)可被用来基于IoT机器的位置而不是实际人员的位置来检测城市化程度。在一些示例中,可以基于机器的位置来推断人员的位置,或者机器本身的位置可能是令人感兴趣的。这可能会导致IoT机器可能采取的动作以及它们可能发送到其他所连接设备的信息。可能要注意的是,在关注机器本身的群体密度的情况下,系统可能需要机器计数的外部源,每个机器形状与纬度和经度区域相关联,类似于CIESIN数据如何在上述有关住户的示例之一中被使用。另一方面,利用IoT设备工作的强大优势在于,这些设备通常直接以纬度和经度或以某种可以转换为纬度和经度的形式自我报告其位置;这些数据将是自我累积的,因此可以使用来自设备本身的通信来了解有多少个设备位于每个“销钉”(即由纬度和经度定义的形状)中。还可能需要注意的是,在IoT设备的情况下,该方法可以仅使用由“pop_density_raw”值给出的权重作为默认值,而不是校准至美国人口普查数据。此外,应注意的是,在IoT实施方式中,城市化程度的概念可能大不相同。例如,尽管由于相关联区域中的住户的密度非常低,农田被认为对人类而言是“农村”,但是由于存在例如农作物相机、与卫星连接的种植、灌溉和收割装备、用于喷洒农药和/或除草剂的无人飞行器(UAV)、土壤采样机等等,因此农场实际上可能是IoT机器群体密度非常高的区域。IoT实施方式的另一独特因素在于,区域的城市化程度可能在一天内发生变化;人类通常会保持一惯的住户位置,但IoT设备会在不同的时间被打开和关闭。例如,用于监视农作物的相机可以在日出时被打开,而在日落时被关闭。因而,基于本地区域中的一天的时间,一个区域中IoT设备的城市化程度可能会发生巨大变化。
本发明的另一实施方式涉及区块链技术。例如,可以针对任何特定加密货币的节点或“矿工”的数目进行城市化程度测量。由于各种原因,此信息可能很有价值。例如,如果存在节点(即形成加密货币网络主干的高性能计算设施)密实填集的区域,则这可能表明区块链系统处于受到战争、政治政策或影响密实填集的节点区域的自然灾害的扰乱的风险中。同样,知晓节点的城市化程度较低的地方可能表明有激励矿工在这些区域开设新位置的机会,以提高整个区块链网络的容错性。还可以出于许多其他原因来使用关于节点最密实填集的位置的知识,诸如表明在该领域工作的人更有可能找到雇用的区域
在本发明的一种实施方式中,统计分析软件(SAS)代码可被用来在计算环境中实现本发明。在下面的代码示例中,该方法用于对美国住户进行求和,而不是使用CIESIN数据,但是可以理解,可以按照上面的描述类似地编码CIESIN数据的使用。
libname glue'G:\data\projects\ctomar\glue';
libname gc1pct'G:\GlobalConsulting_1pct';
libname gc5pct'G:\GlobalConsulting_5pct';
data us;set gc5pct.lat_long_ib1273(keep=ConsLink13 latitudelongitude IB1273);
ib1273_n=1*ib1273;
format lat1n long1n comma8.1;
format lat2n long2n comma8.2;
lat1n=round(Latitude,.1);long1n=round(longitude,.1);
lat2n=round(Latitude,.01);long2n=round(longitude,.01);
length lat1$7lat2$7long1$7long2$7pin11$15pin12$15pin21$15pin22$15;
lat1=lat1n;lat2=lat2n;long1=long1n;long2=long2n;
/*ASSIGN 4SHAPES TO EACH HH(向每个HH分配4种形状)*/
pin11=lat1||"_"||long1;/*BIG(100k)*/
pin12=lat1||"_"||long2;/*TALL*/
pin21=lat2||"_"||long1;/*WIDE*/
pin22=lat2||"_"||long2;/*SMALL(i million)*/
/*ASSIGN EACH HH A BOOSTING WEIGHT BASED ON ITS LATITUDINAL DISTANCEFROM EQUATOR(基于其距赤道的纬度距离,向每个HH分配推升权重)*/
shrink=(110-3*(abs(latitude)/15)**2-(abs(latitude)/15));
hh_multiplier=1/(shrink/110);
run;
/*CREATE COUNTS OF HH BY SHAPE(按形状创建HH的计数)*/proc sort data=us;by pin11;
proc means noprint;by pin11;output out=pinsum11(rename=(_freq_=hh11)drop=_type_)sum(shrink)=shrink_sum11;run;
data us;merge us pinsum11;by pin11;run;
proc sort data=us;by pin12;
proc means noprint;by pin12;output out=pinsum12(rename=(_freq_=hh12)drop=_type_)sum(shrink)=shrink_sum12;run;
data us;merge us pinsum12;by pin12;run;
proc sort data=us;by pin21;
proc means noprint;by pin21;output out=pinsum21(rename=(_freq_=hh21)drop=_type_)sum(shrink)=shrink_sum21;run;
data us;merge us pinsum21;by pin21;run;
proc sort data=us;by pin22;
proc means noprint;by pin22;output out=pinsum22(rename=(_freq_=hh22)drop=_type_)sum(shrink)=shrink_sum22;RUN;
data us;merge us pinsum22;by pin22;run;
/*CREATE WEIGHTED COUNTS OF HH BY SHAPE(按形状创建加权的HH计数)*/
data glue.pinsum110;set pinsum11;
hh11_wt=hh11*(1/((shrink_sum11/hh11)/110));hh11_wt=round(hh11_wt,.1);
keep pin11 hh11_wt;
proc sort;by hh11_wt;
data glue.pinsum12;set pinsum12;
hh12_wt=hh12*(1/((shrink_sum12/hh12)/110));hh12_wt=round(hh12_wt,.1);
keep pin12 hh12_wt;
proc sort;by hh12_wt;
data glue.pinsum21;set pinsum21;
hh21_wt=hh21*(1/((shrink_sum21/hh21)/110));hh21_wt=round(hh21_wt,.1);
keep pin21 hh21_wt;
proc sort;by hh21_wt;
data glue.pinsum22;set pinsum22;
hh22_wt=hh22*(1/((shrink_sum22/hh22)/110));hh22_wt=round(hh22_wt,.1);
keep pin22 hh22_wt;
proc sort;by hh22_wt;
RUN;
/*ASSIGN 20RANKS(分配20个排名)*/
proc rank data=glue.pinsum110 groups=20out=glue.pinsum11_ranks;
var hh11_wt;ranks pop_density11;
proc rank data=glue.pinsum12 groups=20out=glue.pinsum12_ranks;
var hh12_wt;ranks pop_density12;
proc rank data=glue.pinsum21 groups=20out=glue.pinsum21_ranks;
var hh21_wt;ranks pop_density21;
proc rank data=glue.pinsum22 groups=20out=glue.pinsum22_ranks;
var hh22_wt;ranks pop_density22;
run;
/*CREATE DATABASE(创建数据库)*/
proc sort data=us;by pin11;
proc sort nodupkey data=glue.pinsum11_ranks;by pin11;
data us_all;merge us glue.pinsum11_ranks;by pin11;
proc sort data=us_all;by pin12;
proc sort nodupkey data=glue.pinsum12_ranks;by pin12;
data us_all;merge us_all glue.pinsum12_ranks;by pin12;
proc sort data=us_all;by pin21;
proc sort nodupkey data=glue.pinsum21_ranks;by pin21;
data us_all;merge us_all glue.pinsum21_ranks;by pin21;
proc sort data=us_all;by pin22;
proc sort nodupkey data=glue.pinsum22_ranks;by pin22;
data us_all;merge us_all glue.pinsum22_ranks;by pin22;
data us_new;set us_all(keep=ConsLink13 latitude longitude IB1273pin22ib1273_n pop_density11 pop_density12 pop_density21 pop_density22 hh11_wthh12_wt hh21_wt hh22_wt);
pop_density11=pop_density11+1;
pop_density12=pop_density12+1;
pop_density21=pop_density21+1;
pop_density22=pop_density22+1;
hh22_wt_sq=hh22_wt*hh22_wt;
hh21_wt_sq=hh21_wt*hh21_wt;
hh12_wt_sq=hh12_wt*hh12_wt;
hh11_wt_sq=hh11_wt*hh11_wt;
max_pop_density=max(pop_density11,pop_density12,pop_density21,pop_density22);/*find max urbanness across all 4shapes(找到跨所有4种形状的最大都市化)*/
min_pop_density=min(pop_density11,pop_density12,pop_density21,pop_density22);/*find max ruralness across all 4shapes(找到跨所有4种形状的最大农村化)*/
min_over_max_pop_density=min(pop_density11,pop_density12,pop_density21,pop_density22)/max(pop_density11,pop_density12,pop_density21,pop_density22);
/*UPDATE MODEL(更新模型)*/
proc reg data=us_new OUTEST=glue.hh_urbanicity;
model ib1273_n=
hh22_wt hh21_wt hh12_wt hh11_wt
hh22_wt_sq hh21_wt_sq hh12_wt_sq hh11_wt_sq
pop_density11 pop_density12 pop_density21 pop_density22
max_pop_density
min_pop_density
min_over_max_pop_density
;
run;
/*****MUST REPLACE THIS MODEL WITH UPDATED MODEL ABOVE(必须用上面的经更新模型替换这个模型)******/
data us_new;set us_all(keep=ConsLink13 latitude longitude IB1273pop_density11 pop_density12 pop_density21 pop_density22 hh11_wt hh12_wt hh21_wthh22_wt);
pop_density11=pop_density11+1;
pop_density12=pop_density12+1;
pop_density21=pop_density21+1;
pop_density22=pop_density22+1;
hh22_wt_sq=hh22_wt*hh22_wt;
hh21_wt_sq=hh21_wt*hh21_wt;
hh12_wt_sq=hh12_wt*hh12_wt;
hh11_wt_sq=hh11_wt*hh11_wt;
max_pop_density=max(pop_density11,pop_density12,pop_density21,pop_density22);/*find max urbanness across all 4shapes(找到跨所有4种形状的最大都市化)*/
min_pop_density=min(pop_density11,pop_density12,pop_density21,pop_density22);/*find max ruralness across all 4shapes(找到跨所有4种形状的最大农村化)*/
min_over_max_pop_density=min(pop_density11,pop_density12,pop_density21,pop_density22)/max(pop_density11,pop_density12,pop_density21,pop_density22);
pop_density_raw=
13.42868
+hh22_wt*0.00035618
+hh21_wt*0.00009114
+hh12_wt*0.00004767
+hh11_wt*0.00000374
+hh22_wt_sq*-0.00000000523929
+hh21_wt_sq*-0.00000000043506
+hh12_wt_sq*-0.00000000015016
+hh11_wt_sq*-0.0000000000056024
+pop_density11*0.09108
+pop_density12*0.10001
+pop_density21*0.08818
+pop_density22*0.03525
+max_pop_density*-1.07204
+min_pop_density*1.35745
+min_over_max_pop_density*-21.36822
;
drop
hh22_wt
hh21_wt
hh12_wt
hh11_wt
hh22_wt_sq
hh21_wt_sq
hh12_wt_sq
hh11_wt_sq
pop_density11
pop_density12
pop_density21
pop_density22
max_pop_density
min_pop_density
min_over_max_pop_density
;
/*CREATE 20RANKS(创建20个排名)*/
proc sort data=us_new;by pop_density_raw;
proc rank data=us_new groups=20out=lat_long_ib1273_pin22;
var pop_density_raw;ranks pop_density20;
run;
pop_density20=pop_density20+1;
Pop_farm=0;if pop_density20=1 or pop_density20=2 then Pop_farm=1;
Pop_rural=0;if pop_density20=3 or pop_density20=4 or pop_density20=5 then Pop_rural=1;
Pop_town=0;if pop_density20=6 or pop_density20=7 or pop_density20=8 then Pop_town=1;
Pop_exurb=0;if pop_density20=9 or pop_density20=10 or pop_density20=11 or pop_density20=12 then Pop_exurb=1;
Pop_suburb=0;if pop_density20=13 or pop_density20=14 or pop_density20=15or pop_density20=16 then Pop_suburb=1;
Pop_city=0;if pop_density20=17 or pop_density20=18 then Pop_city=1;
Pop_urban=0;if pop_density20=19 or pop_density20=20 then Pop_urban=1;
Pop_farm_m=0;
Pop_rural_m=0;
Pop_town_m=0;
Pop_exurb_m=0;
Pop_suburb_m=0;
Pop_city_m=0;
Pop_urban_m=0;
Pop_farm_s=0;
Pop_rural_s=0;
Pop_town_s=0;
Pop_exurb_s=0;
Pop_suburb_s=0;
Pop_city_s=0;
Pop_urban_s=0;
/*SPLIT URBANICITY BY MULTI UNIT DWELLING INDICATOR(按多户住宅迹象来拆分城市化程度)*/
if MULTI_UNIT_DWELLING='Y'then do;
if Pop_farm=1 then Pop_farm_m=1;
if Pop_rural=1 then Pop_rural_m=1;
if Pop_town=1 then Pop_town_m=1;
if Pop_exurb=1 then Pop_exurb_m=1;
if Pop_suburb=1 then Pop_suburb_m=1;
if Pop_city=1 then Pop_city_m=1;
if Pop_urban=1 then Pop_urban_m=1;
end;
if MULTI_UNIT_DWELLING='N'then do;
if Pop_farm=1 then Pop_farm_s=1;
if Pop_rural=1 then Pop_rural_s=1;
if Pop_town=1 then Pop_town_s=1;
if Pop_exurb=1 then Pop_exurb_s=1;
if Pop_suburb=1 then Pop_suburb_s=1;
if Pop_city=1 then Pop_city_s=1;
if Pop_urban=1 then Pop_urban_s=1;
end;
run;
除非以其他方式说明,否则本文中所使用的所有技术和科学术语具有如本发明所属的本领域的普通技术人员共同理解的相同含义。虽然类似于或等同于本文所描述的方法或材料的任何方法和材料可在实践或测试本发明时使用,本文中描述了有限数目的示例性的方法和/或材料。本领域的那些技术人员将领会,更多的修改是可能的,而不背离本文中的发明概念。
本文中使用的所有术语应当以与上下文一致的尽可能最宽的方式来解释。当本文中使用编组时,该组中的所有个体成员以及该组中所有可能的组合和子组合均旨在被个体地包括在本公开中。本文中引用的所有参考都被通过援引纳入在此到不存在与本说明书的公开不一致的程度。如果在此表达范围,则该范围旨在涵盖和公开该范围内的所有子范围以及该范围内的所有特定点。
本发明已参考某些优选和替换实施例来描述,这些实施例旨在仅为示例性的而非旨在限制如所附权利要求书中阐述的本发明的整个范围。
Claims (20)
1.一种用于在一个或多个处理器上计算曲面上某个区域的城市化程度的计算机化方法,该方法包括以下步骤:
a.从与所述一个或多个处理器通信的计算机可读介质接收地图信息集,并从所述地图信息构造由纬度/经度边界定义的多个形状;
b.调整与所述多个形状中的每一者相关联的计数以补偿所述形状的纬度以产生经调整计数;
c.校准来自一个国家的人口普查数据并应用于所述经调整计数;
d.将外部人口数据集应用于所述经调整计数,以对所述经调整计数求和;以及
e.将所述经调整计数中的每一者汇总为多个城市化程度带之一,并将所述多个城市化程度带之一应用于由纬度/经度边界定义的所述多个形状中的每一者。
2.如权利要求1所述的方法,其特征在于,所述多个形状各自包括两个不同比例尺之一中的形状。
3.如权利要求2所述的方法,其特征在于,所述多个形状包括具有大的垂直比例尺和大的水平比例尺的形状;具有大的垂直比例尺和小的水平比例尺的形状;具有小的垂直比例尺和大的水平比例尺的形状;以及具有小的垂直比例尺和小的水平比例尺的形状。
4.如权利要求3所述的方法,其特征在于,所述多个形状包括不规则四边形。
5.如权利要求1所述的方法,其特征在于,所述校准普查数据步骤进一步包括以下步骤:根据所述多个形状计算最大人口密度,并且根据所述多个形状计算最小人口密度。
6.如权利要求1所述的方法,其特征在于,所述校准普查数据步骤进一步包括以下步骤:从所述多个形状计算最大人口密度,并且从所述多个形状计算最小人口密度。
7.如权利要求6所述的方法,进一步包括将回归模型应用于所述经调整计数以产生原始人口密度。
8.如权利要求1所述的方法,进一步包括使用用于所述区域的基于质心的人口数据将所述多个城市化程度带应用于所述形状的步骤。
9.如权利要求1所述的方法,进一步包括以下步骤:标识形状是否包含多户住宅,如果是的话,则在所述多户住宅中拆分地址以提高所述经调整计数的准确度。
10.如权利要求1所述的方法,进一步包括以下步骤:在对所述经调整计数求和的步骤之前,除去与所述区域的零人口区域相对应的所有形状。
11.一种用于计算曲面上的城市化程度的机器,包括:
a.不规则四边形创建引擎,其被配置为针对所述曲面上的多个区域中的每一者产生四种不规则四边形形状中的一种;
b.住户推升引擎,其被配置为接收所述不规则四边形形状并基于一不规则四边形形状的纬度位置来调整该相关联不规则四边形形状中的计数;
c.住户求和引擎,其被配置为针对所述不规则四边形形状中的每一者产生经调整计数;
d.计数倍增引擎,其被配置为针对所述不规则四边形形状中的每一者生成加权计数;
e.人口排名引擎,其被配置用于所述不规则四边形形状中的每一者的人口密度值;
f.回归分析引擎,其被配置为执行回归分析以生成所述不规则四边形形状中的每一者的原始人口密度值;以及
g.带分组引擎,其被配置为基于所述原始人口密度值来将所述不规则四边形形状中的每一者分配给一个人口带。
12.一种存储指令的计算机可读介质,当所述指令由计算机执行时,致使它:
a.在曲面上构造多个不规则四边形,其中所述不规则四边形由纬度/经度边界限定;
b.调整与所述多个不规则四边形形状中的每一者相关联的计数以补偿所述形状的纬度以产生经调整计数;
c.校准来自一个国家的人口普查数据并将所校准的人口普查数据应用于所述经调整计数;
d.将外部人口数据集应用于所述经调整计数,以对所述经调整计数求和;以及
e.针对所述不规则四边形形状中的每一者,将所述经调整计数中的每一者汇总为多个城市化程度带之一。
13.如权利要求12所述的计算机可读介质,其特征在于,所述多个不规则四边形形状各自包括至少一个维度上的两个不同比例尺之一。
14.如权利要求13所述的计算机可读介质,其特征在于,所述多个不规则四边形形状包括具有大的垂直比例尺和大的水平比例尺的形状;具有大的垂直比例尺和小的水平比例尺的不规则四边形形状;具有小的垂直比例尺和大的水平比例尺的不规则四边形形状;以及具有小的垂直比例尺和小的水平比例尺的不规则四边形形状。
15.如权利要求12所述的计算机可读介质,进一步包括指令,所述指令在由计算机执行时计算所述多个不规则四边形形状的最大人口密度和所述多个不规则四边形形状的最小人口密度。
16.如权利要求12所述的计算机可读介质,进一步包括指令,所述指令在由计算机执行时根据所述多个不规则四边形形状计算最大人口密度并根据所述多个不规则四边形形状计算最小人口密度。
17.如权利要求16所述的计算机可读介质,进一步包括指令,所述指令在由计算机执行时将回归模型应用于所述经调整计数以产生原始人口密度。
18.如权利要求12所述的计算机可读介质,进一步包括指令,所述指令在由计算机执行时使用用于区域的基于质心的人口数据来将所述多个城市化程度带应用于所述形状。
19.如权利要求12所述的计算机可读介质,进一步包括指令,所述指令在由计算机执行时标识形状是否包含多户住宅,并且如果是的话,则在所述多户住宅中拆分地址以提高所述经调整计数的准确度。
20.如权利要求12所述的计算机可读介质,进一步包括指令,所述指令在由计算机执行时消除与所述曲面的零人口区域相对应的所有形状。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862660785P | 2018-04-20 | 2018-04-20 | |
US62/660,785 | 2018-04-20 | ||
PCT/US2018/061514 WO2019203897A1 (en) | 2018-04-20 | 2018-11-16 | Global urbanicity measurement machine and method |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112041813A true CN112041813A (zh) | 2020-12-04 |
Family
ID=68239138
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880092542.2A Pending CN112041813A (zh) | 2018-04-20 | 2018-11-16 | 全球城市化程度测量机器和方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11861629B2 (zh) |
EP (1) | EP3782025A4 (zh) |
JP (1) | JP2021522629A (zh) |
CN (1) | CN112041813A (zh) |
WO (1) | WO2019203897A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220277409A1 (en) * | 2022-05-19 | 2022-09-01 | Chengdu Qinchuan Iot Technology Co., Ltd. | Methods and systems for civil administration in smart city based on internet of things (iot) |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0643804A (ja) * | 1992-07-24 | 1994-02-18 | Toshiba Corp | 地図情報システム |
JP2003030373A (ja) | 2001-07-10 | 2003-01-31 | Fujitsu Ltd | 人口分布解析装置 |
JP2003091620A (ja) * | 2001-09-19 | 2003-03-28 | Kao Corp | 統計情報集計装置 |
US7844417B2 (en) | 2003-02-21 | 2010-11-30 | First American Real Estate Solutions, Llc | GIS-based rapid population assessment tool |
US8612176B2 (en) | 2007-01-26 | 2013-12-17 | Auburn University | Nominal population metric: clustering of nominal application attributes |
WO2011052473A1 (ja) | 2009-10-30 | 2011-05-05 | 株式会社エヌ・ティ・ティ・ドコモ | 管理サーバ、人口情報算出管理サーバ、不在エリア管理方法および人口情報算出方法 |
JP5476148B2 (ja) * | 2010-02-09 | 2014-04-23 | 株式会社構造計画研究所 | バス路線評価支援装置、バス路線評価支援方法及びバス路線評価支援プログラム |
US8478289B1 (en) | 2010-06-01 | 2013-07-02 | Google Inc. | Predicting geographic population density |
JP5690757B2 (ja) | 2012-02-08 | 2015-03-25 | 株式会社Nttドコモ | 層別割当装置 |
US8948927B1 (en) | 2012-12-27 | 2015-02-03 | Google Inc. | Methods and systems for determining a distribution of balloons based on population densities |
CN103218517B (zh) | 2013-03-22 | 2016-01-20 | 南京信息工程大学 | 基于gis的区域网格化人口密度空间化计算方法 |
US10262373B2 (en) * | 2013-06-07 | 2019-04-16 | State Farm Mutual Automobile Insurance Company | Systems and methods for grid-based insurance rating |
US9230169B2 (en) | 2013-08-29 | 2016-01-05 | Digitalglobe, Inc. | Generation of high resolution population density data sets through exploitation of high resolution overhead imagery data and low resolution population density data sets |
JP6371587B2 (ja) * | 2014-05-26 | 2018-08-08 | 株式会社Nttドコモ | 提示システム、提示装置、及び提示プログラム |
JP6130524B2 (ja) | 2014-10-24 | 2017-05-17 | 株式会社Agoop | 人口推定装置、プログラム及び人口推定方法 |
US20160358190A1 (en) * | 2015-06-04 | 2016-12-08 | The Nielsen Company (Us), Llc | Methods and apparatus to estimate a population of a consumer segment in a geographic area |
US9418337B1 (en) | 2015-07-21 | 2016-08-16 | Palantir Technologies Inc. | Systems and models for data analytics |
US20170248434A1 (en) | 2016-02-29 | 2017-08-31 | Blake Dearring Best | Car-top mount with population density estimation |
-
2018
- 2018-11-16 EP EP18915513.8A patent/EP3782025A4/en active Pending
- 2018-11-16 US US17/048,786 patent/US11861629B2/en active Active
- 2018-11-16 WO PCT/US2018/061514 patent/WO2019203897A1/en active Application Filing
- 2018-11-16 CN CN201880092542.2A patent/CN112041813A/zh active Pending
- 2018-11-16 JP JP2021506611A patent/JP2021522629A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
JP2021522629A (ja) | 2021-08-30 |
EP3782025A4 (en) | 2021-12-22 |
WO2019203897A1 (en) | 2019-10-24 |
US20210182444A1 (en) | 2021-06-17 |
US11861629B2 (en) | 2024-01-02 |
EP3782025A1 (en) | 2021-02-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Pokhriyal et al. | Combining disparate data sources for improved poverty prediction and mapping | |
Biemans et al. | Impact of reservoirs on river discharge and irrigation water supply during the 20th century | |
Schneiberg et al. | Urbanization homogenizes the interactions of plant-frugivore bird networks | |
Chakir et al. | Predicting land use allocation in France: A spatial panel data analysis | |
Roura-Pascual et al. | Relative roles of climatic suitability and anthropogenic influence in determining the pattern of spread in a global invader | |
Shrestha et al. | Assessment of historical and future land‐use–land‐cover changes and their impact on valuation of ecosystem services in Kathmandu Valley, Nepal | |
Thies et al. | Projecting land-use and land-cover changes in a tropical mountain forest of Southern Ecuador | |
Li et al. | Non-point source pollutant load variation in rapid urbanization areas by remote sensing, Gis and the L-THIA model: A case in Bao’an District, Shenzhen, China | |
CN112085250B (zh) | 一种人口空间分布模拟方法、终端设备及存储介质 | |
Fialkowski et al. | Universal rules for fragmentation of land by humans | |
Shahriar et al. | Climate change projection using statistical downscaling model over Chittagong Division, Bangladesh | |
Makovníková et al. | An Approach to Mapping the Potential of Cultural Agroecosystem Services. | |
Benra et al. | Balancing ecological and social goals in PES design–Single objective strategies are not sufficient | |
Bocchiola et al. | Hydropower potential of run of river schemes in the himalayas under climate change: a case study in the dudh koshi basin of Nepal | |
Fantappiè et al. | Digital soil mapping of Italy to map derived soil profiles with neural networks | |
Quevedo et al. | Predicting the potential distribution of the endangered huemul deer Hippocamelus bisulcus in North Patagonia | |
Sharma et al. | Longitudinal study of changes in ecosystem services in a city of lakes, Bhopal, India | |
CN110348896A (zh) | 划分地理网格的方法、商圈确定方法及设备 | |
CN112041813A (zh) | 全球城市化程度测量机器和方法 | |
Venevsky et al. | Large‐scale energetic and landscape factors of vegetation diversity | |
Wang et al. | Temporal–spatial change in soil degradation and its relationship with landscape types in a desert–oasis ecotone: a case study in the Fubei region of Xinjiang Province, China | |
Rathore et al. | Water scarcity challenges across urban regions with expanding irrigation | |
Landry et al. | On the wind resource mapping of Burkina Faso | |
Liu et al. | Population spatialization in Zhengzhou city based on multi-source data and random forest model | |
Elsheikh et al. | Mango suitability evaluation based on GIS, multi criteria weights and sensitivity analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40033396 Country of ref document: HK |
|
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20201204 |