CN112052280B - 一种基于时空数据的实有人口分析方法及系统 - Google Patents
一种基于时空数据的实有人口分析方法及系统 Download PDFInfo
- Publication number
- CN112052280B CN112052280B CN202010948857.1A CN202010948857A CN112052280B CN 112052280 B CN112052280 B CN 112052280B CN 202010948857 A CN202010948857 A CN 202010948857A CN 112052280 B CN112052280 B CN 112052280B
- Authority
- CN
- China
- Prior art keywords
- time
- resident
- data
- space
- personnel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 52
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 36
- 238000000034 method Methods 0.000 claims abstract description 28
- 238000010606 normalization Methods 0.000 claims abstract description 28
- 230000003203 everyday effect Effects 0.000 claims abstract description 25
- 230000002776 aggregation Effects 0.000 claims abstract description 22
- 238000004220 aggregation Methods 0.000 claims abstract description 22
- 230000004931 aggregating effect Effects 0.000 claims abstract description 10
- 238000004364 calculation method Methods 0.000 claims abstract description 10
- 238000001914 filtration Methods 0.000 claims abstract description 6
- 238000012545 processing Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 5
- 239000000284 extract Substances 0.000 claims description 5
- 230000000295 complement effect Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 10
- 238000007405 data analysis Methods 0.000 description 4
- 241001622623 Coeliadinae Species 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Probability & Statistics with Applications (AREA)
- Tourism & Hospitality (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明给出了一种基于时空数据的实有人口分析方法及系统,包括基于对象归一算法将时空轨迹数据中大量的拥有共同的主体对象的数据压缩成一条数据记录,再利用场所聚合算法将时空轨迹数据中同一个主体对象的多个相近的位置聚合成同一个位置,从而形成一个对象时空库;基于人员停留类型对对象时空库进行过滤,提取出其中的居住人员和路过人员,分别保存为居住人员集合和路过人员集合,并每天对居住人员集合进行更新并保存,统计每天计算得到的居住人员集合构成当地的实有人口库。相比于传统的实有人口分析方法,本发明极大地减小了数据的规模,提高了针对海量时空数据的分析效率和准确率,实现了对当地实有人口的更加准确且及时的自动分析。
Description
技术领域
本发明涉及数据分析技术领域,尤其是一种基于时空数据的实有人口分析方法及系统。
背景技术
实有人口管理是公安机关基层派出所的重要工作,是公安机关实行社会管理职能和推动维护社会稳定的基础,目前各地的实有人口分析普遍是依靠基层民警或社区工作人员逐一入户采集登记,这种模式需要耗费大量的人力物力财力,且存在更新不及时、遗漏很多、信息不全、标准不规范、查询困难等诸多问题,如何通过时空等海量数据实现实有人口的自动分析,成为辖区人员动态管理和市域治理的关键环节。
目前市场上现有的实有人口分析方法,主要基于基层民警或社区工作人员逐一入户采集登记的数据,通过简单的加工处理,最后分析出当地的实有人口数量,这些技术存在以下不足:
(1)数据分析的准确性差,传统方法分析实有人口,只是对人工采集的数据进行简单的加工处理,没有成型算法对数据的准确性进行反复的验证,识别出人户分离等诸多异常情况,导致无法对实有人口进行有效把控;
(2)数据分析的时效性低,所使用的数据主要基于人工采集,受限于采集的时效性,传统方法分析实有人口,无法实时掌握人员的流入和流出情况,影响预警效率。
而本发明公开的基于时空数据的实有人口分析方法,通过时空数据归一算法,以号码为维度作归一化处理,将海量时空数据处理成可分析可计算的数据池;通过人员停留类型分析算法,分析数据池的时空数据,找出轨迹数据的特征,分析出人员的停留类型,实现当地实有人口的自动分析,及时准确摸清实有人口的底数,能有效地支撑辖区人员的动态管理和智慧警务的开展。
发明内容
本发明提出了一种基于时空数据的实有人口分析方法及系统,以解决上文提到的现有技术的缺陷。
在一个方面,本发明提出了一种基于时空数据的实有人口分析方法,该方法包括以下步骤:
S1:根据多种渠道获取当地人员的时空轨迹数据,利用时空归一算法基于对象对所述时空轨迹数据进行归一化处理,抽取所述时空轨迹数据的主体对象,对每个不同的主体对象构建一个数据块表,将同一主体对象在一定时间段内的不同子时间段内对应的数据,作为附加列储存在对应主体对象的数据块表中;
S2:基于场所聚合算法对同一主体对象的位置进行聚合,将同一主体对象在连续时间内的相近的位置聚合成同一个位置,将聚合后的位置以及相应的经纬度和位置编码整合构成对象时空表;
S3:将所述数据块表和所述对象时空表整合形成对应于各主体对象的对象时空库子集,将所有的所述对象时空库子集构成一个对象时空库;
S4:基于人员停留类型对所述对象时空库进行过滤,提取出其中的居住人员和路过人员,分别保存为居住人员集合和路过人员集合,并每天对所述居住人员集合进行更新并保存,统计每天计算得到的所述居住人员集合构成当地的实有人口库。
以上方法主要利用了时空数据归一算法和人员停留类型分析算法,其中时空数据归一算法中的对象归一算法实现了将大量的拥有共同的主体对象的数据压缩成一条数据记录,场所聚合算法实现了将同一个主体对象的多个相近的位置聚合成同一个位置,极大降低了数据的分析规模。相比于传统的实有人口分析方法,提高了针对海量时空数据的分析效率和准确率,通过对人员的停留类型的分析,实现了对当地实有人口的自动分析,使得实有人口分析的结果更加准确且及时。
在具体的实施例中,所述多种渠道包括:人员的手机与基站的连接和摄像头对人脸的抓拍。在实际生活中,每个人都会通过不同的渠道,如手机与基站连接和摄像头人脸抓拍等,产生大量的时空轨迹数据,利用这些数据组合成的时空轨迹数据库进行分析是本发明的方案的基础。
在具体的实施例中,所述数据块表是一个储存各主体对象与其包括对象标识、偏移量、时长、发生时间、连续出现天数和位置在内的相关信息的数据集。由于获取到的时空轨迹数据存在体量大、重复性高、单条价值密度低等复杂特征,在传统的方法中时空数据在利用上存在需要巨大的计算成本、分析复杂程度高等问题,故本发明构建用于时空轨迹数据分析的数据块表,便于后续采用时空归一算法对数据进行分析。
在具体的实施例中,所述步骤S2中相近的位置的判断,具体包括:根据不同类型的渠道获取的所述时空轨迹数据特性,设置一个位置聚合的距离参数,以所述距离参数为参考判断两个位置的所述位置编码是否相近。
在具体的实施例中,所述距离参数的设置基于Geohash精度库,并且,所述位置编码是根据经纬度进行Geohash编码后得到的值。
在具体的实施例中,所述步骤S4中居住人员的提取,具体包括步骤S401:循环遍历所述对象时空库,根据主体对象的连续出现天数、出现时长和偏移量与相应的设定的阈值之间的关系,判断对应主体对象是否为当地的居住人员,若是,则将该主体对象加入所述居住人员集合,若否,则将该主体对象加入非居住人员集合。
在具体的实施例中,所述步骤S4中路过人员的提取,具体包括步骤S402:循环遍历所述非居住人员集合,根据主体对象的偏移量和出现时长与相应的设定的阈值之间的关系,判断对应主体对象是否为路过人员,若是,则将该主体对象加入路过人员集合,当处理完全部主体对象,取所述路过人员集合在所述非居住人员集合中的补集作为待定人员集合。
在优选的实施例中,所述根据主体对象的连续出现天数、出现时长和偏移量与相应的设定的阈值之间的关系,判断对应主体对象是否为当地的居住人员,具体包括:
当所述主体对象的连续出现天数大于连续出现天数的设定的阈值时,所述主体对象为当地的居住人员;
当所述主体对象的出现时长大于出现时长的设定的阈值时,所述主体对象为当地的居住人员;
当所述主体对象的偏移量小于当地最小半径时,所述主体对象为当地的居住人员。
在优选的实施例中,所述根据主体对象的偏移量和出现时长与相应的设定的阈值之间的关系,判断对应主体对象是否为路过人员,具体包括:
当所述主体对象的偏移量大于当地最小半径,且所述主体对象的出现时长小于偏移量除以偏移速度的设定的阈值时,所述主体对象为路过人员。
在具体的实施例中,所述步骤S4中每天对所述居住人员集合进行更新并保存,具体包括步骤S403:每天执行所述步骤S401和S402,并将前一天的所述待定人员集合加入到当天的所述居住人员集合中,并保存。
根据本发明的第二方面,提出了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被计算机处理器执行时实施上述方法。
根据本发明的第三方面,提出一种基于时空数据的实有人口分析系统,该系统包括:
时空轨迹数据归一处理模块:配置用于根据多种渠道获取当地人员的时空轨迹数据,利用时空归一算法,基于对象对所述时空轨迹数据进行归一化处理,抽取所述时空轨迹数据的主体对象,对每个不同的主体对象构建一个数据块表,将同一主体对象在一定时间段内的不同子时间段内对应的数据,作为附加列储存在对应主体对象的数据块表中;
时空轨迹数据场所聚合模块:配置用于基于场所聚合算法对同一主体对象的位置进行聚合,将同一主体对象在连续时间内的相近的位置聚合成同一个位置,将聚合后的位置以及相应的经纬度和位置编码整合构成对象时空表;
对象时空库输出模块:配置用于将所述数据块表和所述对象时空表整合形成对应于各主体对象的对象时空库子集,将所有的所述对象时空库子集构成一个对象时空库;
人员停留类型分析模块:配置用于基于人员停留类型对所述对象时空库进行过滤,提取出其中的居住人员和路过人员,分别保存为居住人员集合和路过人员集合,并每天对所述居住人员集合进行更新并保存,统计每天计算得到的所述居住人员集合构成当地的实有人口库。
本发明利用时空归一算法基于对象对所述时空轨迹数据进行归一化处理,抽取所述时空轨迹数据的主体对象,对每个不同的主体对象构建一个数据块表,将同一主体对象在一定时间段内的不同子时间段内对应的数据,作为附加列储存在对应主体对象的数据块表中;基于场所聚合算法对同一主体对象的位置进行聚合,将同一主体对象在连续时间内的相近的位置聚合成同一个位置,将聚合后的位置以及相应的经纬度和位置编码整合构成对象时空表;将所述数据块表和所述对象时空表整合形成对应于各主体对象的对象时空库子集,将所有的所述对象时空库子集构成一个对象时空库;基于人员停留类型对所述对象时空库进行过滤,提取出其中的居住人员和路过人员,分别保存为居住人员集合和路过人员集合,并每天对所述居住人员集合进行更新并保存,统计每天计算得到的所述居住人员集合构成当地的实有人口库。本发明公开的方法相比于传统的实有人口分析方法,提高了针对海量时空数据的分析效率和准确率,再通过对人员的停留类型的分析,实现了对当地实有人口的自动分析,使得实有人口分析的结果更加准确且及时。
附图说明
包括附图以提供对实施例的进一步理解并且附图被并入本说明书中并且构成本说明书的一部分。附图图示了实施例并且与描述一起用于解释本发明的原理。将容易认识到其它实施例和实施例的很多预期优点,因为通过引用以下详细描述,它们变得被更好地理解。通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本发明的一个实施例的一种基于时空数据的实有人口分析方法的流程图;
图2是本发明的一个具体的实施例的对象时空表图;
图3是本发明的一个具体的实施例的数据块表示意图;
图4是本发明的一个具体的实施例的Geohash精度表图;
图5是本发明的一个具体的实施例的场所聚合示意图;
图6是本发明的一个实施例的一种基于时空数据的实有人口分析系统的框架图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
根据本发明的一个实施例的一种基于时空数据的实有人口分析方法,图1示出了根据本发明的实施例的一种基于时空数据的实有人口分析方法的流程图。如图1所示,该方法包括以下步骤:
S101:根据多种渠道获取当地人员的时空轨迹数据,利用时空归一算法基于对象对所述时空轨迹数据进行归一化处理,抽取所述时空轨迹数据的主体对象,对每个不同的主体对象构建一个数据块表,将同一主体对象在一定时间段内的不同子时间段内对应的数据,作为附加列储存在对应主体对象的数据块表中。
在具体的实施例中,所述多种渠道包括:人员的手机与基站的连接和摄像头对人脸的抓拍。
在具体的实施例中,所述数据块表是一个储存各主体对象与其包括对象标识、偏移量、时长、发生时间、连续出现天数和位置在内的相关信息的数据集。
图2示出了本发明的一个具体的实施例的对象时空表图,根据图2示出的表格,获取不同主体对象在不同时间的表中的各项数据,并写入数据块表中。
图3示出了本发明的一个具体的实施例的数据块表示意图,本实施例以从人员的手机与基站的连接数据中收集到的时空轨迹数据为例,来阐述本发明的方案中对象归一算法的部分:在处理手机产生的时空数据时,将共同主体对象“手机号|IMSI|手机号+IMSI”产生的hash值作为唯一主键,一个手机号一天只会有一条记录(如图3所示表格),将该手机不同时间的数据写入该条记录的不同的列,列名依据时间添加一个偏移量,如“1天=86400秒=2kc0(32进制)”,当这一天中的某一秒有数据时,将该数据写入相应的列。
S102:基于场所聚合算法对同一主体对象的位置进行聚合,将同一主体对象在连续时间内的相近的位置聚合成同一个位置,将聚合后的位置以及相应的经纬度和位置编码整合构成对象时空表。
在具体的实施例中,所述步骤S102中相近的位置的判断,具体包括:根据不同类型的渠道获取的所述时空轨迹数据特性,设置一个位置聚合的距离参数,以所述距离参数为参考判断两个位置的所述位置编码是否相近。
图4示出了本发明的一个具体的实施例的Geohash精度表图,在优选的实施例中,距离参数的设置基于图4示出的Geohash精度表,并且,所述位置编码是根据经纬度进行Geohash编码后得到的值。
图5示出了本发明的一个具体的实施例的场所聚合示意图,本实施例以从人员的手机与基站的连接数据中收集到的时空轨迹数据为例,来阐述本发明的方案中场所聚合算法的部分:根据人员的手机与基站连接产生的时空轨迹数据,如果在空旷区域,根据图4示出的Geohash精度表,设置聚合点相互之间的距离参数为1200米;每天遍历同一主体对象的时空轨迹数据列,若经纬度的Geohash编码值的前六位相同(如图5所示),且时间连续,即可聚合成一个点。如图5所示,前两条位置数据中的点可以聚合成一个点。
S103:将所述数据块表和所述对象时空表整合形成对应于各主体对象的对象时空库子集,将所有的所述对象时空库子集构成一个对象时空库。
在具体的实施例中,利用对象归一算法和场所聚合算法,最终得到对象时库Sn,Sn包含n个子集合{S1,S2,…,Sn},将对象标识、偏移量、时长、发生时间、连续出现天数、位置1...位置N存储在数据块表里,保存Sn,即得到了最终的对象时空库。
S104:基于人员停留类型对所述对象时空库进行过滤,提取出其中的居住人员和路过人员,分别保存为居住人员集合和路过人员集合,并每天对所述居住人员集合进行更新并保存,统计每天计算得到的所述居住人员集合构成当地的实有人口库。
在具体的实施例中,所述步骤S104中居住人员的提取,具体步骤包括:循环遍历所述对象时空库,根据主体对象的连续出现天数、出现时长和偏移量与相应的设定的阈值之间的关系,判断对应主体对象是否为当地的居住人员,若是,则将该主体对象加入所述居住人员集合,若否,则将该主体对象加入非居住人员集合。
在具体的实施例中,所述步骤S104中路过人员的提取,具体步骤包括:循环遍历所述非居住人员集合,根据主体对象的偏移量和出现时长与相应的设定的阈值之间的关系,判断对应主体对象是否为路过人员,若是,则将该主体对象加入路过人员集合,当处理完全部主体对象,取所述路过人员集合在所述非居住人员集合中的补集作为待定人员集合。
在优选的实施例中,所述根据主体对象的连续出现天数、出现时长和偏移量与相应的设定的阈值之间的关系,判断对应主体对象是否为当地的居住人员,具体包括:
当所述主体对象的连续出现天数大于连续出现天数的设定的阈值时,所述主体对象为当地的居住人员;
当所述主体对象的出现时长大于出现时长的设定的阈值时,所述主体对象为当地的居住人员;
当所述主体对象的偏移量小于当地最小半径时,所述主体对象为当地的居住人员。
在优选的实施例中,所述根据主体对象的偏移量和出现时长与相应的设定的阈值之间的关系,判断对应主体对象是否为路过人员,具体包括:
当所述主体对象的偏移量大于当地最小半径,且所述主体对象的出现时长小于偏移量除以偏移速度的设定的阈值时,所述主体对象为路过人员。
在具体的实施例中,居住人员分析算法的具体步骤为:循环遍历对象时空集合Sn,取相应的主体对象连续出现天数大于一定阀值(设为MaxDay)的子集Xn;取连续出现天数小于MaxDay的子集Yn;遍历集合Yn中的元素yn,当yn的出现时长>时长阀值或yn的偏移量<当地最小半径时,则将元素yn对应的主体对象判定为当地的居住人员,将元素yn增加到集合Xn中。
在优选的实施例中,连续出现天数超过30天且时长超过16小时的即为居住人员。
在具体的实施例中,路过人员分析算法的具体步骤为:进行了居住人员分析算法得到集合Xn和Yn后,循环遍历数据集合Yn中的元素yn;当yn的偏移量>当地最小半径and yn的出现时长<偏移量/速度阀值时,则将元素yn对应的主体对象判定为路过人员,并将元素yn增加到集合Mn中;最后取集合Wn=Yn-Mn为无法判定人员,作为第二天需要继续分析的集合。
在优选的实施例中,主体对象的连续偏移速度保持在60M/小时以上,则视为路过人员。
在具体的实施例中,所述步骤S104中每天对所述居住人员集合进行更新并保存,具体步骤包括:每天执行以上的居住人员分析算法和路过人员分析算法,并将前一天的所述待定人员集合加入到当天的所述居住人员集合中,并保存。
图6示出了本发明的一个实施例的一种基于时空数据的实有人口分析系统的框架图。该系统包括时空轨迹数据归一处理模块601、时空轨迹数据场所聚合模块602、对象时空库输出模块603和人员停留类型分析模块604。
在具体的实施例中,时空轨迹数据归一处理模块601被配置用于根据多种渠道获取当地人员的时空轨迹数据,利用时空归一算法,基于对象对所述时空轨迹数据进行归一化处理,抽取所述时空轨迹数据的主体对象,对每个不同的主体对象构建一个数据块表,将同一主体对象在一定时间段内的不同子时间段内对应的数据,作为附加列储存在对应主体对象的数据块表中;时空轨迹数据场所聚合模块602被配置用于基于场所聚合算法对同一主体对象的位置进行聚合,将同一主体对象在连续时间内的相近的位置聚合成同一个位置,将聚合后的位置以及相应的经纬度和位置编码整合构成对象时空表;对象时空库输出模块603被配置用于将所述数据块表和所述对象时空表整合形成对应于各主体对象的对象时空库子集,将所有的所述对象时空库子集构成一个对象时空库;人员停留类型分析模块604基于人员停留类型对所述对象时空库进行过滤,提取出其中的居住人员和路过人员,分别保存为居住人员集合和路过人员集合,并每天对所述居住人员集合进行更新并保存,统计每天计算得到的所述居住人员集合构成当地的实有人口库。通过以上模块的共同作用,极大地减小了数据的规模,提高了针对海量时空数据的分析效率和准确率,实现了对当地实有人口的更加准确且及时的自动分析。
本发明的实施例还涉及一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被计算机处理器执行时实施上文中的方法。该计算机程序包含用于执行流程图所示的方法的程序代码。需要说明的是,本申请的计算机可读介质可以是计算机可读信号介质或者计算机可读介质或者是上述两者的任意组合。
本发明基于对象归一算法将时空轨迹数据中大量的拥有共同的主体对象的数据压缩成一条数据记录,再利用场所聚合算法将时空轨迹数据中同一个主体对象的多个相近的位置聚合成同一个位置,从而形成一个对象时空库;基于人员停留类型对对象时空库进行过滤,提取出其中的居住人员和路过人员,分别保存为居住人员集合和路过人员集合,并每天对居住人员集合进行更新并保存,统计每天计算得到的居住人员集合构成当地的实有人口库。相比于传统的实有人口分析方法,本发明极大地减小了数据的规模,提高了针对海量时空数据的分析效率和准确率,实现了对当地实有人口的更加准确且及时的自动分析。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (11)
1.一种基于时空数据的实有人口分析方法,其特征在于,包括以下步骤:
S1:根据多种渠道获取当地人员的时空轨迹数据,利用时空归一算法将拥有共同的主体对象的数据压缩成一条数据记录,并基于对象对所述时空轨迹数据进行归一化处理,抽取所述时空轨迹数据的主体对象,对每个不同的主体对象构建一个数据块表,将同一主体对象在一定时间段内的不同子时间段内对应的数据,作为附加列储存在对应主体对象的数据块表中,其中,所述数据块表是一个储存各主体对象与其包括对象标识、偏移量、时长、发生时间、连续出现天数和位置在内的相关信息的数据集;
S2:基于场所聚合算法对同一主体对象的位置进行聚合,将同一主体对象在连续时间内的相近的位置聚合成同一个位置,将聚合后的位置以及相应的经纬度和位置编码整合构成对象时空表;
S3:将所述数据块表和所述对象时空表整合形成对应于各主体对象的对象时空库子集,将所有的所述对象时空库子集构成一个对象时空库;
S4:基于人员停留类型对所述对象时空库进行过滤,提取出其中的居住人员和路过人员,分别保存为居住人员集合和路过人员集合,并每天对所述居住人员集合进行更新并保存,统计每天计算得到的所述居住人员集合构成当地的实有人口库。
2.根据权利要求1所述的方法,其特征在于,所述多种渠道包括:人员的手机与基站的连接和摄像头对人脸的抓拍。
3.根据权利要求1所述的方法,其特征在于,步骤S2中相近的位置的判断,具体包括:根据不同类型的渠道获取的时空轨迹数据特性,设置一个位置聚合的距离参数,以所述距离参数为参考判断两个位置的所述位置编码是否相近。
4.根据权利要求3所述的方法,其特征在于,所述距离参数的设置基于Geohash精度库,并且,所述位置编码是根据经纬度进行Geohash编码后得到的值。
5.根据权利要求1所述的方法,其特征在于,步骤S4中居住人员的提取,具体包括步骤S401:循环遍历所述对象时空库,根据主体对象的连续出现天数、出现时长和偏移量与相应的设定的阈值之间的关系,判断对应主体对象是否为当地的居住人员,若是,则将该主体对象加入所述居住人员集合,若否,则将该主体对象加入非居住人员集合。
6.根据权利要求5所述的方法,其特征在于,步骤S4中路过人员的提取,具体包括步骤S402:循环遍历所述非居住人员集合,根据主体对象的偏移量和出现时长与相应的设定的阈值之间的关系,判断对应主体对象是否为路过人员,若是,则将该主体对象加入路过人员集合,当处理完全部主体对象,取所述路过人员集合在所述非居住人员集合中的补集作为待定人员集合。
7.根据权利要求5所述的方法,其特征在于,所述根据主体对象的连续出现天数、出现时长和偏移量与相应的设定的阈值之间的关系,判断对应主体对象是否为当地的居住人员,具体包括:
当所述主体对象的连续出现天数大于连续出现天数的设定的阈值时,所述主体对象为当地的居住人员;
当所述主体对象的出现时长大于出现时长的设定的阈值时,所述主体对象为当地的居住人员;
当所述主体对象的偏移量小于当地最小半径时,所述主体对象为当地的居住人员。
8.根据权利要求6所述的方法,其特征在于,所述根据主体对象的偏移量和出现时长与相应的设定的阈值之间的关系,判断对应主体对象是否为路过人员,具体包括:
当所述主体对象的偏移量大于当地最小半径,且所述主体对象的出现时长小于偏移量除以偏移速度的设定的阈值时,所述主体对象为路过人员。
9.根据权利要求6所述的方法,其特征在于,步骤S4中每天对所述居住人员集合进行更新并保存,具体包括步骤S403:每天执行步骤S401和S402,并将前一天的所述待定人员集合加入到当天的所述居住人员集合中,并保存。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被计算机处理器执行时实施权利要求1至9中任一项所述的方法。
11.一种基于时空数据的实有人口分析系统,其特征在于,包括:
时空轨迹数据归一处理模块:配置用于根据多种渠道获取当地人员的时空轨迹数据,利用时空归一算法将拥有共同的主体对象的数据压缩成一条数据记录,并基于对象对所述时空轨迹数据进行归一化处理,抽取所述时空轨迹数据的主体对象,对每个不同的主体对象构建一个数据块表,将同一主体对象在一定时间段内的不同子时间段内对应的数据,作为附加列储存在对应主体对象的数据块表中,其中,所述数据块表是一个储存各主体对象与其包括对象标识、偏移量、时长、发生时间、连续出现天数和位置在内的相关信息的数据集;
时空轨迹数据场所聚合模块:配置用于基于场所聚合算法对同一主体对象的位置进行聚合,将同一主体对象在连续时间内的相近的位置聚合成同一个位置,将聚合后的位置以及相应的经纬度和位置编码整合构成对象时空表;
对象时空库输出模块:配置用于将所述数据块表和所述对象时空表整合形成对应于各主体对象的对象时空库子集,将所有的所述对象时空库子集构成一个对象时空库;
人员停留类型分析模块:配置用于基于人员停留类型对所述对象时空库进行过滤,提取出其中的居住人员和路过人员,分别保存为居住人员集合和路过人员集合,并每天对所述居住人员集合进行更新并保存,统计每天计算得到的所述居住人员集合构成当地的实有人口库。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010948857.1A CN112052280B (zh) | 2020-09-10 | 2020-09-10 | 一种基于时空数据的实有人口分析方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010948857.1A CN112052280B (zh) | 2020-09-10 | 2020-09-10 | 一种基于时空数据的实有人口分析方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112052280A CN112052280A (zh) | 2020-12-08 |
CN112052280B true CN112052280B (zh) | 2022-04-29 |
Family
ID=73610504
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010948857.1A Active CN112052280B (zh) | 2020-09-10 | 2020-09-10 | 一种基于时空数据的实有人口分析方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112052280B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112800830B (zh) * | 2020-12-22 | 2023-05-26 | 杭州腾未科技有限公司 | 一种实有人口管理方法、装置及存储介质 |
CN112685428B (zh) * | 2021-03-10 | 2021-07-06 | 南京烽火星空通信发展有限公司 | 一种基于海量位置轨迹数据时空分析方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106096631A (zh) * | 2016-06-02 | 2016-11-09 | 上海世脉信息科技有限公司 | 一种基于手机大数据的流动人口分类识别分析方法 |
CN109190588A (zh) * | 2018-09-19 | 2019-01-11 | 东方网力科技股份有限公司 | 一种人口分类的方法及装置 |
CN109460428A (zh) * | 2018-11-12 | 2019-03-12 | 百度在线网络技术(北京)有限公司 | 时空分析方法、装置和存储介质 |
KR101976189B1 (ko) * | 2018-06-07 | 2019-05-08 | 넥스엔정보기술(주) | 유동 인구의 분석 서비스 제공 방법 |
CN111615054A (zh) * | 2020-05-25 | 2020-09-01 | 和智信(山东)大数据科技有限公司 | 人口分析方法及装置 |
-
2020
- 2020-09-10 CN CN202010948857.1A patent/CN112052280B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106096631A (zh) * | 2016-06-02 | 2016-11-09 | 上海世脉信息科技有限公司 | 一种基于手机大数据的流动人口分类识别分析方法 |
KR101976189B1 (ko) * | 2018-06-07 | 2019-05-08 | 넥스엔정보기술(주) | 유동 인구의 분석 서비스 제공 방법 |
CN109190588A (zh) * | 2018-09-19 | 2019-01-11 | 东方网力科技股份有限公司 | 一种人口分类的方法及装置 |
CN109460428A (zh) * | 2018-11-12 | 2019-03-12 | 百度在线网络技术(北京)有限公司 | 时空分析方法、装置和存储介质 |
CN111615054A (zh) * | 2020-05-25 | 2020-09-01 | 和智信(山东)大数据科技有限公司 | 人口分析方法及装置 |
Non-Patent Citations (1)
Title |
---|
基于手机信令数据的人口流动分析;孔扬鑫;《中国优秀硕士学位论文全文数据库 信息科技辑》;20180115(第1期);I138-935 * |
Also Published As
Publication number | Publication date |
---|---|
CN112052280A (zh) | 2020-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104484993B (zh) | 用于交通小区划分的手机信令信息的处理方法 | |
CN112052280B (zh) | 一种基于时空数据的实有人口分析方法及系统 | |
CN104778642A (zh) | 基于WiFi的校园用户数据处理方法、服务器和监测系统 | |
CN105354196A (zh) | 信息推送方法和信息推送装置 | |
CN111930868A (zh) | 一种基于多维数据采集的大数据行为轨迹分析方法 | |
CN106339716A (zh) | 一种基于加权欧氏距离的移动轨迹相似度匹配方法 | |
WO2016070673A1 (zh) | 用户属性分析方法及装置 | |
CN103605651A (zh) | 一种基于olap多维分析的数据处理展现方法 | |
CN115034600A (zh) | 一种用于地质灾害监测的预警方法及系统 | |
CN108733774B (zh) | 一种基于大数据的失业人口动态监测方法 | |
CN112131325A (zh) | 轨迹确定方法、装置及设备、存储介质 | |
CN109753526A (zh) | 一种基于时序相似度对告警信息分析查询的装置及方法 | |
CN110874369A (zh) | 一种多维数据融合侦查系统及其方法 | |
CN112738729A (zh) | 一种用手机信令数据判别探亲返乡游客的方法及系统 | |
CN114078277A (zh) | 一人一档的人脸聚类方法、装置、计算机设备及存储介质 | |
CN117010537A (zh) | 目标区域预测方法、装置、计算机设备和存储介质 | |
CN110502521B (zh) | 一种档案库的建立方法 | |
CN111581304B (zh) | 一种基于社会人口家族关系自动绘制家系图谱的方法 | |
CN114706988A (zh) | 基于知识图谱的监控预警方法及装置 | |
CN116233759A (zh) | 一种居民出行轨迹调查方法及系统 | |
CN116089448A (zh) | 一种基于多维感知建立人口画像的实时人口管理系统 | |
CN115578231A (zh) | 一种多维度分析方法和系统 | |
CN111221832B (zh) | 一种学生失联预警方法、系统及存储介质 | |
Aung et al. | Identification and classification of land use types in yangon city by using mobile call detail records (cdrs) data | |
CN114564521A (zh) | 一种基于聚类算法确定农机工作时间段的方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |