CN116980833B - 一种基于信令数据的区域人口年龄段识别方法及系统 - Google Patents
一种基于信令数据的区域人口年龄段识别方法及系统 Download PDFInfo
- Publication number
- CN116980833B CN116980833B CN202311226951.6A CN202311226951A CN116980833B CN 116980833 B CN116980833 B CN 116980833B CN 202311226951 A CN202311226951 A CN 202311226951A CN 116980833 B CN116980833 B CN 116980833B
- Authority
- CN
- China
- Prior art keywords
- population
- age
- value
- user
- resident
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000011664 signaling Effects 0.000 title claims abstract description 168
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000004364 calculation method Methods 0.000 claims description 16
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
- G06F18/15—Statistical pre-processing, e.g. techniques for normalisation or restoring missing data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/021—Services related to particular areas, e.g. point of interest [POI] services, venue services or geofences
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/029—Location-based management or tracking services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/20—Services signaling; Auxiliary data signalling, i.e. transmitting data via a non-traffic channel
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Biology (AREA)
- Tourism & Hospitality (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Educational Administration (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开的一种基于信令数据的区域人口年龄段识别方法及系统,本方法选择区域范围内的全部基站,通过基站获取的人口信令轨迹,分析其时空规律,锁定待统计人口,结合合适的参数阈值进行年龄段识别,最后统计,该方法相对传统的区域人口年龄端识别更加便捷,可以每日或实施获取,不受人口流动影响。
Description
技术领域
本发明涉及时空大数据处理领域,更具体的,涉及一种基于信令数据的区域人口年龄段识别方法及系统。
背景技术
现有的区域人口年龄段识别统计领域,比如北京市,传统方法通过人口普查识别统计,新型技术通过人脸识别和深度学习等方式进行年龄段识别统计,其中新型技术通过人脸识别和深度学习等方式需要大量的资源,特别是城市人口多,成本费用高,周期长;人口普查最准确,但无法短期内完成,且受人口流动影响,无法识别统计当下在北京市各年龄段人口,无法识别统计某些特定区域的年龄段人口,比如:公园、道路上等,需要大量的人工成本。
因此,现有技术存在缺陷,亟待改进。
发明内容
鉴于上述问题,本发明的目的是提供一种基于信令数据的区域人口年龄段识别方法及系统,能够更加便捷的统计特定区域内各年龄段人口数量。
本发明第一方面提供了一种基于信令数据的区域人口年龄段识别方法,包括:
获取待统计人口的区域边界信息;
根据待统计人口的区域边界信息,得到对应区域边界范围内的基站信息;
基于预设第一时间周期,根据对应区域边界范围内的基站,获取经过或停留在区域内的人口信令轨迹信息;
根据人口信令轨迹信息,得到对应人口信令轨迹中的驻留点;
将驻留点进行分类,得到驻留点的类型,并根据驻留点的类型在预设权重值表中查询,得到对应驻留点的权重值;
将驻留点的权重值乘以对应驻留点的预设权重系数,得到第一数据;将所述第一数据进行累加,得到对应人口信令轨迹的年龄预测值;
根据对应人口信令轨迹的年龄预测值,确定对应区域人口年龄段人数。
本方案中,所述获取经过或停留在区域内的人口信令轨迹信息之后,还包括:
获取人口信令轨迹经过或停留在区域内的时间值;
判断人口信令轨迹经过或停留在区域内的时间值是否大于预设第一时间阈值,若是,将人口信令轨迹对应的用户设为该区域人口,将对应人口信令轨迹进行保存;
若否,将对应人口信令轨迹进行删除。
本方案中,所述得到对应人口信令轨迹中的驻留点之后,还包括:
获取用户在驻留点上停留的时间值;
判断所述用户在驻留点上停留的时间值是否大于预设第二时间阈值,若是,将对应驻留点进行保存;若否,将对应驻留点进行删除。
本方案中,还包括:
获取保存下来的驻留点数量值;
判断所述保存下来的驻留数量值是否大于预设数量阈值,若是,触发计算第一数据信息,根据计算第一数据信息计算对应人口信令轨迹的第一数据;
若否,基于预设基数降低预设第二时间阈值以提高保存下来的驻留点数量值。
本方案中,所述驻留点的权重值的获取步骤,具体包括:
基于预设第二时间周期,获取访问该类型的驻留点的用户年龄信息;
判断访问该类型的驻留点的用户年龄是否大于或等于预设年龄阈值,若是,将对应用户年龄进行保存;若否,将对应用户年龄进行删除;
将保存下来的用户年龄进行平均值计算,得到对应驻留点的权重值。
本方案中,还包括:
提取访问该类型的驻留点的用户年龄最小值和最大值;
将对应用户年龄最大值减去用户年龄最小值,得到第一年龄差值;
判断所述第一年龄差值是否大于预设年龄差阈值,若否,将对应类型的驻留点进行保存;
若是,将访问该类型的驻留点的任意两个用户年龄进行差值计算,得到第二年龄差值集;
将由相同用户年龄计算得到的第二年龄差值进行累加,得到对应用户年龄的第二年龄总差值;
将用户年龄的第二年龄总差值按照从大到小的顺序进行排序,得到用户年龄的第二年龄最大总差值;
将用户年龄的第二年龄最大总差值对应的用户年龄进行删除,并重新计算第一年龄差值。
本方案中,所述驻留点的预设权重系数的获取步骤,具体包括:
获取用户在不同驻留点上停留的时间值;
将所述用户在不同驻留点上停留的时间值进行累加,得到总时间值;
将用户在驻留点上停留的时间值除以总时间值,得到该用户在对应驻留点的预设权重系数。
本发明第二方面提供了一种基于信令数据的区域人口年龄段识别系统,包括存储器和处理器,所述存储器中存储有一种基于信令数据的区域人口年龄段识别方法程序,所述一种基于信令数据的区域人口年龄段识别方法程序被所述处理器执行时实现如下步骤:
获取待统计人口的区域边界信息;
根据待统计人口的区域边界信息,得到对应区域边界范围内的基站信息;
基于预设第一时间周期,根据对应区域边界范围内的基站,获取经过或停留在区域内的人口信令轨迹信息;
根据人口信令轨迹信息,得到对应人口信令轨迹中的驻留点;
将驻留点进行分类,得到驻留点的类型,并根据驻留点的类型在预设权重值表中查询,得到对应驻留点的权重值;
将驻留点的权重值乘以对应驻留点的预设权重系数,得到第一数据;
将所述第一数据进行累加,得到对应人口信令轨迹的年龄预测值;
根据对应人口信令轨迹的年龄预测值,确定对应区域人口年龄段人数。
本方案中,所述获取经过或停留在区域内的人口信令轨迹信息之后,还包括:
获取人口信令轨迹经过或停留在区域内的时间值;
判断人口信令轨迹经过或停留在区域内的时间值是否大于预设第一时间阈值,若是,将人口信令轨迹对应的用户设为该区域人口,将对应人口信令轨迹进行保存;
若否,将对应人口信令轨迹进行删除。
本方案中,所述得到对应人口信令轨迹中的驻留点之后,还包括:
获取用户在驻留点上停留的时间值;
判断所述用户在驻留点上停留的时间值是否大于预设第二时间阈值,若是,将对应驻留点进行保存;若否,将对应驻留点进行删除。
本方案中,还包括:
获取保存下来的驻留点数量值;
判断所述保存下来的驻留数量值是否大于预设数量阈值,若是,触发计算第一数据信息,根据计算第一数据信息计算对应人口信令轨迹的第一数据;
若否,基于预设基数降低预设第二时间阈值以提高保存下来的驻留点数量值。
本方案中,所述驻留点的权重值的获取步骤,具体包括:
基于预设第二时间周期,获取访问该类型的驻留点的用户年龄信息;
判断访问该类型的驻留点的用户年龄是否大于或等于预设年龄阈值,若是,将对应用户年龄进行保存;若否,将对应用户年龄进行删除;
将保存下来的用户年龄进行平均值计算,得到对应驻留点的权重值。
本方案中,还包括:
提取访问该类型的驻留点的用户年龄最小值和最大值;
将对应用户年龄最大值减去用户年龄最小值,得到第一年龄差值;
判断所述第一年龄差值是否大于预设年龄差阈值,若否,将对应类型的驻留点进行保存;
若是,将访问该类型的驻留点的任意两个用户年龄进行差值计算,得到第二年龄差值集;
将由相同用户年龄计算得到的第二年龄差值进行累加,得到对应用户年龄的第二年龄总差值;
将用户年龄的第二年龄总差值按照从大到小的顺序进行排序,得到用户年龄的第二年龄最大总差值;
将用户年龄的第二年龄最大总差值对应的用户年龄进行删除,并重新计算第一年龄差值。
本方案中,所述驻留点的预设权重系数的获取步骤,具体包括:
获取用户在不同驻留点上停留的时间值;
将所述用户在不同驻留点上停留的时间值进行累加,得到总时间值;
将用户在驻留点上停留的时间值除以总时间值,得到该用户在对应驻留点的预设权重系数。
本发明公开的一种基于信令数据的区域人口年龄段识别方法及系统,本方法选择区域范围内的全部基站,通过基站获取的人口信令轨迹,分析其时空规律,锁定待统计人口,结合合适的参数阈值进行年龄段识别,最后统计,该方法相对传统的区域人口年龄端识别更加便捷,可以每日或实施获取,不受人口流动影响。
附图说明
图1示出了本发明一种基于信令数据的区域人口年龄段识别方法的流程图;
图2示出了本发明一种基于信令数据的区域人口年龄段识别系统的框图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
图1示出了本发明一种基于信令数据的区域人口年龄段识别方法的流程图。
如图1所示,本发明公开了一种基于信令数据的区域人口年龄端识别方法,包括:
S101,获取待统计人口的区域边界信息;
S102,根据待统计人口的区域边界信息,得到对应区域边界范围内的基站信息;
S103,基于预设第一时间周期,根据对应区域边界范围内的基站,获取经过或停留在区域内的人口信令轨迹信息;
S104,根据人口信令轨迹信息,得到对应人口信令轨迹中的驻留点;
S105,将驻留点进行分类,得到驻留点的类型,并根据驻留点的类型在预设权重值表中查询,得到对应驻留点的权重值;
S106,将驻留点的权重值乘以对应驻留点的预设权重系数,得到第一数据;
S107,将所述第一数据进行累加,得到对应人口信令轨迹的年龄预测值;
S108,根据对应人口信令轨迹的年龄预测值,确定对应区域人口年龄段人数。
根据本发明实施例,比如将预设第一时间周期设为1天,则人口信令轨迹信息为对应区域内的基站在一天时间内的人口信令轨迹信息;所述人口信令轨迹中的驻留点为对应手机用户在人口信令轨迹上停留的位置点,比如手机用户在人口信令轨迹中的a位置停留过,则对应a位置为对应人口信令轨迹中的一个驻留点,根据GPS系统等定位软件,确定驻留点的位置以及名称等信息,并根据对应驻留点的位置以及名称等信息进行分类,确定对应驻留点的类型,比如驻留点为理发店、玩具店、公园等,不同的驻留点类型具有不同的权重值,所述预设权重值表中存储有个各种类型的驻留点以及不同类型的驻留点对应的权重值,比如将公园的权重值设为65;将区域人口年龄端按照预设年龄基数进行划分,比如以5岁一个年龄基数,则区域人口年龄端可划分为、/>、/> …以此类推,若对应人口信令轨迹的年龄预测值为25岁,则对应区域人口年龄段在的人数加一。
根据本发明实施例,所述获取经过或停留在区域内的人口信令轨迹信息之后,还包括:
获取人口信令轨迹经过或停留在区域内的时间值;
判断人口信令轨迹经过或停留在区域内的时间值是否大于预设第一时间阈值,若是,将人口信令轨迹对应的用户设为该区域人口,将对应人口信令轨迹进行保存;
若否,将对应人口信令轨迹进行删除。
需要说明的是,为了防止一些空间交叉或者路过的人口信令轨迹对该区域内的人口年龄段人数进行干扰,提取对应人口信令轨迹在经过或停留在区域内的时间值,若对应人口信令轨迹经过或停留在区域内的时间值大于预设第一时间阈值,则将人口信令轨迹对应的用户设为该区域内的人口,若对应人口信令轨迹经过或停留在区域内的时间值小于或等于预设第一时间阈值,则将对应人口信令轨迹进行删除,比如预设第一时间阈值设为8小时。
根据本发明实施例,所述得到对应人口信令轨迹中的驻留点之后,还包括:
获取用户在驻留点上停留的时间值;
判断所述用户在驻留点上停留的时间值是否大于预设第二时间阈值,若是,将对应驻留点进行保存;若否,将对应驻留点进行删除。
需要说明的是,比如将预设第二时间阈值设为20分钟,则当用户在驻留点停留的时间值大于20分钟,则将对应驻留点进行保留;若用户在驻留点上停留的时间值是否小于或等于预设第二时间阈值,则将对应驻留点设为无效驻留点,且将对应驻留点进行删除。
根据本发明实施例,还包括:
获取保存下来的驻留点数量值;
判断所述保存下来的驻留数量值是否大于预设数量阈值,若是,触发计算第一数据信息,根据计算第一数据信息计算对应人口信令轨迹的第一数据;
若否,基于预设基数降低预设第二时间阈值以提高保存下来的驻留点数量值。
需要说明的是,当保存下来的驻留点数量值小于或等于预设数量阈值时,说明保存下来的驻留点数量值不够,比如预设数量阈值为5,则保存下来的驻留点数量值需要大于5个,才能计算第一数据,否则通过降低第二时间阈值以提高保持下来的驻留数量值,比如预设第二时间阈值设为20分钟,当保存下来的驻留数量值小于或等于预设数量阈值时,通过预设基数降低预设第二时间阈值,若预设基数为5分钟,则调整之后的预设第二时间阈值为20-5=15分钟。
根据本发明实施例,所述驻留点的权重值的获取步骤,具体包括:
基于预设第二时间周期,获取访问该类型的驻留点的用户年龄信息;
判断访问该类型的驻留点的用户年龄是否大于或等于预设年龄阈值,若是,将对应用户年龄进行保存;若否,将对应用户年龄进行删除;
将保存下来的用户年龄进行平均值计算,得到对应驻留点的权重值。
需要说明的是,比如将预设第二时间周期设为7天,则获取7天内该访问类型的驻留点的用户年龄信息,比如通过访问登记方式获取对应用户年龄,将预设年龄阈值设为18岁,则剔除年龄低18岁的访问用户,所述驻留点的权重值由访问该类型的驻留点的用户年龄的平均值。
根据本发明实施例,还包括:
提取访问该类型的驻留点的用户年龄最小值和最大值;
将对应用户年龄最大值减去用户年龄最小值,得到第一年龄差值;
判断所述第一年龄差值是否大于预设年龄差阈值,若否,将对应类型的驻留点进行保存;
若是,将访问该类型的驻留点的任意两个用户年龄进行差值计算,得到第二年龄差值集;
将由相同用户年龄计算得到的第二年龄差值进行累加,得到对应用户年龄的第二年龄总差值;
将用户年龄的第二年龄总差值按照从大到小的顺序进行排序,得到用户年龄的第二年龄最大总差值;
将用户年龄的第二年龄最大总差值对应的用户年龄进行删除,并重新计算第一年龄差值。
需要说明的是,为防止偶然性,通过访问该类型的驻留点的用户年龄的差值对该驻留点的年龄特征进行判定,所述用户年龄的差值包括第一年龄差值和第二年龄差值,所述第二年龄差值集中包括多个第二年龄差值,比如a用户年龄和其他用户年龄的差值集为{2,2,5},则对应a用户年龄的第二年龄总差值为2+2+5=9,通过删除第二年龄最大总差值,提高对应类型的驻留点的权重值。
根据本发明实施例,所述驻留点的预设权重系数的获取步骤,具体包括:
获取用户在不同驻留点上停留的时间值;
将所述用户在不同驻留点上停留的时间值进行累加,得到总时间值;
将用户在驻留点上停留的时间值除以总时间值,得到该用户在对应驻留点的预设权重系数。
需要说明的是,所有驻留点的预设权重系数之和为1,每个人口信令轨迹中对应驻留点的预留权重系数均不同,且由对应用户在该驻留点上停留的时间值确定,所述用户在不同驻留点上停留的时间值为对应用户在不同驻留点上停留的时间长度。
根据本发明实施例,还包括:
将区域内的人口信令轨迹进行对比分析,得到相似值;
判断所述相似值是否大于预设相似阈值,若是,将对应人口信令轨迹的用户设为同一用户;若否,将对应人口信令轨迹设的用户设为不同用户。
需要说明的是,所述区域内的人口信令轨迹包括用户的位置信息以及用户在对应位置的时间信息,当用户的位置相同,但是用户在对应位置的时间不相同时,设为不同的人口信令轨迹,比如预设相似阈值为95%,则将相似值大于95%的人口信令轨迹设为同一用户的人口信令轨迹,消除同一用户存在多个信令数据的影响。
根据本发明实施例,还包括:
获取区域内的人口信令轨迹在运动时的时间值;
将预设第一时间周期减去区域内的人口信令轨迹在运动时的时间值,得到第一时间差值;
判断所述第一时间差值是否小于预设时间差阈值,若是,将对应区域内的人口信令轨迹进行删除。
需要说明的是,比如将预设时间差阈值设为5小时,预设第一时间周期设为24小时,则当第一时间差值小于预设时间差阈值时,说明对应人口信令轨迹在运动时的时间值过长,因此将对应人口信令轨迹设为非正常用户的人口信令轨迹,比如为机械的信令轨迹,所述区域内的人口信令轨迹在运动时的时间值为对应人口信令轨迹在时刻变化的时间长度。
图2示出了本发明一种基于信令数据的区域人口年龄段识别系统的框图。
如图2所示,本发明第二方面提供了一种基于信令数据的区域人口年龄段识别系统2,包括存储器21和处理器22,所述存储器中存储有一种基于信令数据的区域人口年龄段识别方法程序,所述一种基于信令数据的区域人口年龄段识别方法程序被所述处理器执行时实现如下步骤:
获取待统计人口的区域边界信息;
根据待统计人口的区域边界信息,得到对应区域边界范围内的基站信息;
基于预设第一时间周期,根据对应区域边界范围内的基站,获取经过或停留在区域内的人口信令轨迹信息;
根据人口信令轨迹信息,得到对应人口信令轨迹中的驻留点;
将驻留点进行分类,得到驻留点的类型,并根据驻留点的类型在预设权重值表中查询,得到对应驻留点的权重值;
将驻留点的权重值乘以对应驻留点的预设权重系数,得到第一数据;将所述第一数据进行累加,得到对应人口信令轨迹的年龄预测值;
根据对应人口信令轨迹的年龄预测值,确定对应区域人口年龄段人数。
根据本发明实施例,比如将预设第一时间周期设为1天,则人口信令轨迹信息为对应区域内的基站在一天时间内的人口信令轨迹信息;所述人口信令轨迹中的驻留点为对应手机用户在人口信令轨迹上停留的位置点,比如手机用户在人口信令轨迹中的a位置停留过,则对应a位置为对应人口信令轨迹中的一个驻留点,根据GPS系统等定位软件,确定驻留点的位置以及名称等信息,并根据对应驻留点的位置以及名称等信息进行分类,确定对应驻留点的类型,比如驻留点为理发店、玩具店、公园等,不同的驻留点类型具有不同的权重值,所述预设权重值表中存储有个各种类型的驻留点以及不同类型的驻留点对应的权重值,比如将公园的权重值设为65;将区域人口年龄端按照预设年龄基数进行划分,比如以5岁一个年龄基数,则区域人口年龄端可划分为、/>、/> …以此类推,若对应人口信令轨迹的年龄预测值为25岁,则对应区域人口年龄段在的人数加一。
根据本发明实施例,所述获取经过或停留在区域内的人口信令轨迹信息之后,还包括:
获取人口信令轨迹经过或停留在区域内的时间值;
判断人口信令轨迹经过或停留在区域内的时间值是否大于预设第一时间阈值,若是,将人口信令轨迹对应的用户设为该区域人口,将对应人口信令轨迹进行保存;
若否,将对应人口信令轨迹进行删除。
需要说明的是,为了防止一些空间交叉或者路过的人口信令轨迹对该区域内的人口年龄段人数进行干扰,提取对应人口信令轨迹在经过或停留在区域内的时间值,若对应人口信令轨迹经过或停留在区域内的时间值大于预设第一时间阈值,则将人口信令轨迹对应的用户设为该区域内的人口,若对应人口信令轨迹经过或停留在区域内的时间值小于或等于预设第一时间阈值,则将对应人口信令轨迹进行删除,比如预设第一时间阈值设为8小时。
根据本发明实施例,所述得到对应人口信令轨迹中的驻留点之后,还包括:
获取用户在驻留点上停留的时间值;
判断所述用户在驻留点上停留的时间值是否大于预设第二时间阈值,若是,将对应驻留点进行保存;若否,将对应驻留点进行删除。
需要说明的是,比如将预设第二时间阈值设为20分钟,则当用户在驻留点停留的时间值大于20分钟,则将对应驻留点进行保留;若用户在驻留点上停留的时间值是否小于或等于预设第二时间阈值,则将对应驻留点设为无效驻留点,且将对应驻留点进行删除。
根据本发明实施例,还包括:
获取保存下来的驻留点数量值;
判断所述保存下来的驻留数量值是否大于预设数量阈值,若是,触发计算第一数据信息,根据计算第一数据信息计算对应人口信令轨迹的第一数据;
若否,基于预设基数降低预设第二时间阈值以提高保存下来的驻留点数量值。
需要说明的是,当保存下来的驻留点数量值小于或等于预设数量阈值时,说明保存下来的驻留点数量值不够,比如预设数量阈值为5,则保存下来的驻留点数量值需要大于5个,才能计算第一数据,否则通过降低第二时间阈值以提高保持下来的驻留数量值,比如预设第二时间阈值设为20分钟,当保存下来的驻留数量值小于或等于预设数量阈值时,通过预设基数降低预设第二时间阈值,若预设基数为5分钟,则调整之后的预设第二时间阈值为20-15=15分钟。
根据本发明实施例,所述驻留点的权重值的获取步骤,具体包括:
基于预设第二时间周期,获取访问该类型的驻留点的用户年龄信息;
判断访问该类型的驻留点的用户年龄是否大于或等于预设年龄阈值,若是,将对应用户年龄进行保存;若否,将对应用户年龄进行删除;
将保存下来的用户年龄进行平均值计算,得到对应驻留点的权重值。
需要说明的是,比如将预设第二时间周期设为7天,则获取7天内该访问类型的驻留点的用户年龄信息,比如通过访问登记方式获取对应用户年龄,将预设年龄阈值设为18岁,则剔除年龄低18岁的访问用户,所述驻留点的权重值由访问该类型的驻留点的用户年龄的平均值。
根据本发明实施例,还包括:
提取访问该类型的驻留点的用户年龄最小值和最大值;
将对应用户年龄最大值减去用户年龄最小值,得到第一年龄差值;
判断所述第一年龄差值是否大于预设年龄差阈值,若否,将对应类型的驻留点进行保存;
若是,将访问该类型的驻留点的任意两个用户年龄进行差值计算,得到第二年龄差值集;
将由相同用户年龄计算得到的第二年龄差值进行累加,得到对应用户年龄的第二年龄总差值;
将用户年龄的第二年龄总差值按照从大到小的顺序进行排序,得到用户年龄的第二年龄最大总差值;
将用户年龄的第二年龄最大总差值对应的用户年龄进行删除,并重新计算第一年龄差值。
需要说明的是,为防止偶然性,通过访问该类型的驻留点的用户年龄的差值对该驻留点的年龄特征进行判定,所述用户年龄的差值包括第一年龄差值和第二年龄差值,所述第二年龄差值集中包括多个第二年龄差值,比如a用户年龄和其他用户年龄的差值集为{2,2,5},则对应a用户年龄的第二年龄总差值为2+2+5=9,通过删除第二年龄最大总差值,提高对应类型的驻留点的权重值。
根据本发明实施例,所述驻留点的预设权重系数的获取步骤,具体包括:
获取用户在不同驻留点上停留的时间值;
将所述用户在不同驻留点上停留的时间值进行累加,得到总时间值;
将用户在驻留点上停留的时间值除以总时间值,得到该用户在对应驻留点的预设权重系数。
需要说明的是,所有驻留点的预设权重系数之和为1,每个人口信令轨迹中对应驻留点的预留权重系数均不同,且由对应用户在该驻留点上停留的时间值确定,所述用户在不同驻留点上停留的时间值为对应用户在不同驻留点上停留的时间长度。
根据本发明实施例,还包括:
将区域内的人口信令轨迹进行对比分析,得到相似值;
判断所述相似值是否大于预设相似阈值,若是,将对应人口信令轨迹的用户设为
同一用户;若否,将对应人口信令轨迹设的用户设为不同用户。
需要说明的是,所述区域内的人口信令轨迹包括用户的位置信息以及用户在对应位置的时间信息,当用户的位置相同,但是用户在对应位置的时间不相同时,设为不同的人口信令轨迹,比如预设相似阈值为95%,则将相似值大于95%的人口信令轨迹设为同一用户的人口信令轨迹,消除同一用户存在多个信令数据的影响。
根据本发明实施例,还包括:
获取区域内的人口信令轨迹在运动时的时间值;
将预设第一时间周期减去区域内的人口信令轨迹在运动时的时间值,得到第一时间差值;
判断所述第一时间差值是否小于预设时间差阈值,若是,将对应区域内的人口信令轨迹进行删除。
需要说明的是,比如将预设时间差阈值设为5小时,预设第一时间周期设为24小时,则当第一时间差值小于预设时间差阈值时,说明对应人口信令轨迹在运动时的时间值过长,因此将对应人口信令轨迹设为非正常用户的人口信令轨迹,比如为机械的信令轨迹,所述区域内的人口信令轨迹在运动时的时间值为对应人口信令轨迹在时刻变化的时间长度。
本发明公开的一种基于信令数据的区域人口年龄段识别方法及系统,本方法选择区域范围内的全部基站,通过基站获取的人口信令轨迹,分析其时空规律,锁定待统计人口,结合合适的参数阈值进行年龄段识别,最后统计,该方法相对传统的区域人口年龄端识别更加便捷,可以每日或实施获取,不受人口流动影响。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
Claims (5)
1.一种基于信令数据的区域人口年龄段识别方法,其特征在于,包括:
获取待统计人口的区域边界信息;
根据待统计人口的区域边界信息,得到对应区域边界范围内的基站信息;
基于预设第一时间周期,根据对应区域边界范围内的基站,获取经过或停留在区域内的人口信令轨迹信息;
根据人口信令轨迹信息,得到对应人口信令轨迹中的驻留点;
将驻留点进行分类,得到驻留点的类型,并根据驻留点的类型在预设权重值表中查询,得到对应驻留点的权重值;
将驻留点的权重值乘以对应驻留点的预设权重系数,得到第一数据;
将所述第一数据进行累加,得到对应人口信令轨迹的年龄预测值;
根据对应人口信令轨迹的年龄预测值,确定对应区域人口年龄段人数;
所述获取经过或停留在区域内的人口信令轨迹信息之后,还包括:
获取人口信令轨迹经过或停留在区域内的时间值;
判断人口信令轨迹经过或停留在区域内的时间值是否大于预设第一时间阈值,若是,将人口信令轨迹对应的用户设为该区域人口,将对应人口信令轨迹进行保存;
若否,将对应人口信令轨迹进行删除;
所述驻留点的权重值的获取步骤,具体包括:
基于预设第二时间周期,获取访问该类型的驻留点的用户年龄信息;
判断访问该类型的驻留点的用户年龄是否大于或等于预设年龄阈值,若是,将对应用户年龄进行保存;若否,将对应用户年龄进行删除;
将保存下来的用户年龄进行平均值计算,得到对应驻留点的权重值;
还包括:
提取访问该类型的驻留点的用户年龄最小值和最大值;
将对应用户年龄最大值减去用户年龄最小值,得到第一年龄差值;
判断所述第一年龄差值是否大于预设年龄差阈值,若否,将对应类型的驻留点进行保存;
若是,将访问该类型的驻留点的任意两个用户年龄进行差值计算,得到第二年龄差值集;
将由相同用户年龄计算得到的第二年龄差值进行累加,得到对应用户年龄的第二年龄总差值;
将用户年龄的第二年龄总差值按照从大到小的顺序进行排序,得到用户年龄的第二年龄最大总差值;
将用户年龄的第二年龄最大总差值对应的用户年龄进行删除,并重新计算第一年龄差值;
所述驻留点的预设权重系数的获取步骤,具体包括:
获取用户在不同驻留点上停留的时间值;
将所述用户在不同驻留点上停留的时间值进行累加,得到总时间值;
将用户在驻留点上停留的时间值除以总时间值,得到该用户在对应驻留点的预设权重系数。
2.根据权利要求1所述的一种基于信令数据的区域人口年龄段识别方法,其特征在于,所述得到对应人口信令轨迹中的驻留点之后,还包括:
获取用户在驻留点上停留的时间值;
判断所述用户在驻留点上停留的时间值是否大于预设第二时间阈值,若是,将对应驻留点进行保存;若否,将对应驻留点进行删除。
3.根据权利要求2所述的一种基于信令数据的区域人口年龄段识别方法,其特征在于,还包括:
获取保存下来的驻留点数量值;
判断所述保存下来的驻留数量值是否大于预设数量阈值,若是,触发计算第一数据信息,根据计算第一数据信息计算对应人口信令轨迹的第一数据;
若否,基于预设基数降低预设第二时间阈值以提高保存下来的驻留点数量值。
4.一种基于信令数据的区域人口年龄段识别系统,其特征在于,包括存储器和处理器,所述存储器中存储有一种基于信令数据的区域人口年龄段识别方法程序,所述一种基于信令数据的区域人口年龄段识别方法程序被所述处理器执行时实现如下步骤:
获取待统计人口的区域边界信息;
根据待统计人口的区域边界信息,得到对应区域边界范围内的基站信息;
基于预设第一时间周期,根据对应区域边界范围内的基站,获取经过或停留在区域内的人口信令轨迹信息;
根据人口信令轨迹信息,得到对应人口信令轨迹中的驻留点;
将驻留点进行分类,得到驻留点的类型,并根据驻留点的类型在预设权重值表中查询,得到对应驻留点的权重值;
将驻留点的权重值乘以对应驻留点的预设权重系数,得到第一数据;
将所述第一数据进行累加,得到对应人口信令轨迹的年龄预测值;
根据对应人口信令轨迹的年龄预测值,确定对应区域人口年龄段人数;
所述获取经过或停留在区域内的人口信令轨迹信息之后,还包括:
获取人口信令轨迹经过或停留在区域内的时间值;
判断人口信令轨迹经过或停留在区域内的时间值是否大于预设第一时间阈值,若是,将人口信令轨迹对应的用户设为该区域人口,将对应人口信令轨迹进行保存;
若否,将对应人口信令轨迹进行删除;
所述驻留点的权重值的获取步骤,具体包括:
基于预设第二时间周期,获取访问该类型的驻留点的用户年龄信息;
判断访问该类型的驻留点的用户年龄是否大于或等于预设年龄阈值,若是,将对应用户年龄进行保存;若否,将对应用户年龄进行删除;
将保存下来的用户年龄进行平均值计算,得到对应驻留点的权重值;
还包括:
提取访问该类型的驻留点的用户年龄最小值和最大值;
将对应用户年龄最大值减去用户年龄最小值,得到第一年龄差值;
判断所述第一年龄差值是否大于预设年龄差阈值,若否,将对应类型的驻留点进行保存;
若是,将访问该类型的驻留点的任意两个用户年龄进行差值计算,得到第二年龄差值集;
将由相同用户年龄计算得到的第二年龄差值进行累加,得到对应用户年龄的第二年龄总差值;
将用户年龄的第二年龄总差值按照从大到小的顺序进行排序,得到用户年龄的第二年龄最大总差值;
将用户年龄的第二年龄最大总差值对应的用户年龄进行删除,并重新计算第一年龄差值;
所述驻留点的预设权重系数的获取步骤,具体包括:
获取用户在不同驻留点上停留的时间值;
将所述用户在不同驻留点上停留的时间值进行累加,得到总时间值;
将用户在驻留点上停留的时间值除以总时间值,得到该用户在对应驻留点的预设权重系数。
5.根据权利要求4所述的一种基于信令数据的区域人口年龄段识别系统,其特征在
于,所述得到对应人口信令轨迹中的驻留点之后,还包括:
获取用户在驻留点上停留的时间值;
判断所述用户在驻留点上停留的时间值是否大于预设第二时间阈值,若是,将对应驻留点进行保存;若否,将对应驻留点进行删除。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311226951.6A CN116980833B (zh) | 2023-09-22 | 2023-09-22 | 一种基于信令数据的区域人口年龄段识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311226951.6A CN116980833B (zh) | 2023-09-22 | 2023-09-22 | 一种基于信令数据的区域人口年龄段识别方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116980833A CN116980833A (zh) | 2023-10-31 |
CN116980833B true CN116980833B (zh) | 2024-01-23 |
Family
ID=88477042
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311226951.6A Active CN116980833B (zh) | 2023-09-22 | 2023-09-22 | 一种基于信令数据的区域人口年龄段识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116980833B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105682025A (zh) * | 2016-01-05 | 2016-06-15 | 重庆邮电大学 | 基于移动信令数据的用户驻留地识别方法 |
CN109362041A (zh) * | 2018-12-18 | 2019-02-19 | 成都方未科技有限公司 | 一种基于大数据的人口时空分布分析方法 |
CN109495856A (zh) * | 2018-12-18 | 2019-03-19 | 成都方未科技有限公司 | 一种基于大数据的手机用户类型标记方法 |
CN109727076A (zh) * | 2019-01-04 | 2019-05-07 | 成都方未科技有限公司 | 一种基于人口时空分布的选址方法 |
KR20190104822A (ko) * | 2018-03-02 | 2019-09-11 | 주식회사 케이티 | 생활 인구 추정 시스템 및 방법 |
JP2020123011A (ja) * | 2019-01-29 | 2020-08-13 | Kddi株式会社 | 所定圏における滞在圏人口を推定するプログラム、装置及び方法 |
CN112085250A (zh) * | 2020-07-30 | 2020-12-15 | 中国科学院城市环境研究所 | 一种人口空间分布模拟方法、终端设备及存储介质 |
CN113935881A (zh) * | 2021-12-16 | 2022-01-14 | 北京融信数联科技有限公司 | 一种基于大数据的人口结构分析方法、系统及可读存储介质 |
-
2023
- 2023-09-22 CN CN202311226951.6A patent/CN116980833B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105682025A (zh) * | 2016-01-05 | 2016-06-15 | 重庆邮电大学 | 基于移动信令数据的用户驻留地识别方法 |
KR20190104822A (ko) * | 2018-03-02 | 2019-09-11 | 주식회사 케이티 | 생활 인구 추정 시스템 및 방법 |
CN109362041A (zh) * | 2018-12-18 | 2019-02-19 | 成都方未科技有限公司 | 一种基于大数据的人口时空分布分析方法 |
CN109495856A (zh) * | 2018-12-18 | 2019-03-19 | 成都方未科技有限公司 | 一种基于大数据的手机用户类型标记方法 |
CN109727076A (zh) * | 2019-01-04 | 2019-05-07 | 成都方未科技有限公司 | 一种基于人口时空分布的选址方法 |
JP2020123011A (ja) * | 2019-01-29 | 2020-08-13 | Kddi株式会社 | 所定圏における滞在圏人口を推定するプログラム、装置及び方法 |
CN112085250A (zh) * | 2020-07-30 | 2020-12-15 | 中国科学院城市环境研究所 | 一种人口空间分布模拟方法、终端设备及存储介质 |
CN113935881A (zh) * | 2021-12-16 | 2022-01-14 | 北京融信数联科技有限公司 | 一种基于大数据的人口结构分析方法、系统及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN116980833A (zh) | 2023-10-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106530188B (zh) | 在线叫车服务平台中司机的接单概率评价方法和装置 | |
CN106372674B (zh) | 在线叫车服务平台中的司机分类方法和装置 | |
CN107040894A (zh) | 一种基于手机信令数据的居民出行od获取方法 | |
CN111178179B (zh) | 一种基于像元尺度的城市功能区的识别方法及装置 | |
CN115086880A (zh) | 一种出行特征识别方法、装置、设备及存储介质 | |
CN109885643A (zh) | 一种基于语义轨迹的位置预测算法及存储介质 | |
CN115866547A (zh) | 基于信令数据的固定区域游客统计方法、系统和存储介质 | |
CN113282637A (zh) | 景区游客识别方法、装置、电子设备及存储介质 | |
CN111507240A (zh) | 人脸聚类方法、装置、电子设备和计算机可读存储介质 | |
CN116980833B (zh) | 一种基于信令数据的区域人口年龄段识别方法及系统 | |
CN111898559B (zh) | 一种提升人脸识别速度的方法、装置及电子设备 | |
CN111339333B (zh) | 基于历史乘坐记录的优先人脸数据库的构建方法及装置 | |
CN109961344B (zh) | 一种汽车服务选址方法和装置 | |
CN112966136B (zh) | 一种人脸分类方法及装置 | |
CN105868271B (zh) | 一种姓名统计方法及装置 | |
CN112070295B (zh) | 出行统计方法、装置、计算机设备和可读存储介质 | |
CN111797181A (zh) | 用户职住地的定位方法、装置、控制设备及存储介质 | |
CN117177177B (zh) | 一种基于信令数据的小区域职住人口统计方法及系统 | |
CN116861197B (zh) | 一种基于大数据的流动人口监测方法、系统和存储介质 | |
CN116304594B (zh) | 一种基于通信数据的用户区域识别方法、系统及介质 | |
CN117390245A (zh) | 候鸟游客的识别方法、装置及电子设备 | |
CN117596551B (zh) | 一种基于手机信令数据的绿道网用户行为还原方法及装置 | |
CN114637883A (zh) | 热点路线分析方法、装置、电子设备及存储介质 | |
CN117202106B (zh) | 基于信令数据的区域空间场所属性标注方法、系统和介质 | |
CN114386529A (zh) | 基于大数据的社区服务分析方法、系统和可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |