CN115879506A - 基于信令的人群迁徙预测方法、装置、设备和存储介质 - Google Patents
基于信令的人群迁徙预测方法、装置、设备和存储介质 Download PDFInfo
- Publication number
- CN115879506A CN115879506A CN202111146197.6A CN202111146197A CN115879506A CN 115879506 A CN115879506 A CN 115879506A CN 202111146197 A CN202111146197 A CN 202111146197A CN 115879506 A CN115879506 A CN 115879506A
- Authority
- CN
- China
- Prior art keywords
- migration
- user
- position data
- information
- data set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于信令的人群迁徙预测方法、装置、计算设备和存储介质。根据本发明提供的技术方案,获取用户身份信息、用户画像标签信息以及信令中的用户位置信息,构建用户位置数据集;从用户位置数据集中筛选符合特定迁徙场景的用户位置数据,得到迁徙人群的建模位置数据集;按照多个数据维度对迁徙人群的建模位置数据集进行划分,得到位置数据子集;利用位置数据子集进行模型训练,得到迁徙预测模型;依据所述迁徙预测模型,对所述迁徙人群的迁徙情况进行预测,得到所述迁徙人群的预测位置数据集。通过本发明利用已有的数据平台将客户的各类信息进行融合,降低了数据采集成本,并通过精细化划分,满足各种不同场景的人群迁徙预测需求。
Description
技术领域
本发明涉及移动通信领域,具体涉及一种基于信令的人群迁徙预测方法、装置、计算设备和计算机存储介质。
背景技术
人口迁徙研究对于城市规划、交通管制、疫情防控、人才引入、公共安全等领域均有重要作用,通过对于人口迁徙特点的深入分析,可以更好的了解区域中的人员流动,进而开展更具针对性的人流流量监管、疏导以及人群分类管理工作。而移动互联网的高速发展和智能终端的快速普及,使得通信运营商可以通过采集手机终端的手机信令数据,通过大数据处理技术分析用户的位置信息和上网信息。而现阶段,各个领域基于现实要求,对于人口迁徙研究的要求也逐渐上升为实现精细化人口管理和针对细分人群进行人口迁徙的精准预测。
而现有技术中,一般采用三种方式进行人口迁徙的预测。第一种是通过统计各区域随出行时长分布的人流量转移概率以及各时段人流量离去比例,根据目标区域的实时人流量,统计时刻进入目标区域的总用户数,根据目标区域实时人流量以及该区域时间段人流量离去概率,预计统计时刻前目标区域目前区域离开的用户数,从而预测统计时刻目标区域的人流量大小,判定预警等级,进行人流量预警。第二种是利用手机信令对用户的居住地进行识别,通过连续跟踪监控用户居住地的位置,记录用户迁入/迁出位置,进而确定出一定时间内人口的迁徙趋势。第三种是通过获取目标区域的人口数据,并预测该区域人口数据,再通过人工智能技术进行数据共享,得出优化后的预测该区域人口数据。但现有的几种方法均无法精确的确定出不同类别的细分人群的迁徙模式和特征;也没有解决自然人用户“一证多号”即一个身份证对应多个手机号码的问题,也就无法处理由此带来的数据错误;现有技术也无法灵活适配不同区域间的人口迁徙预测;此外,现有技术采集位置数据是从多个分散渠道获取的,数据规模巨大,需要消耗很多存储资源和网络资源。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的基于信令的人群迁徙预测方法和相应的基于信令的人群迁徙预测装置,计算设备以及计算机存储介质。
根据本发明的一个方面,提供了一种基于信令的人群迁徙预测方法,所述方法包括:
获取用户身份信息、用户画像标签信息以及信令中的用户位置信息,构建用户位置数据集;
从所述用户位置数据集中筛选符合特定迁徙场景的用户位置数据,得到迁徙人群的建模位置数据集;
按照多个数据维度对所述迁徙人群的建模位置数据集进行划分,得到位置数据子集;
利用位置数据子集进行模型训练,得到迁徙预测模型;
依据所述迁徙预测模型,对所述迁徙人群的迁徙情况进行预测,得到所述迁徙人群的预测位置数据集。
上述方案中,所述获取用户身份信息、用户画像标签信息以及信令中的用户位置信息,构建用户位置数据集进一步包括:
以手机号码为主键,将所述用户位置信息与所述用户身份信息进行关联,得到初步关联信息;
以身份标识号码为主键,将所述初步关联信息与所述用户画像标签信息进行关联,得到用户位置数据,并将所述用户位置数据添加至用户位置数据集中;其中,所述用户位置数据包含有对应用户的用户身份信息、用户位置信息以及用户画像标签信息。
上述方案中,所述以手机号码为主键,将所述用户位置信息与所述用户身份信息进行关联,得到初步关联信息进一步包括:
若同一用户身份信息存在多个相关联的手机号码,则对多个相关联的手机号码对应的用户位置信息进行去重和合并处理,得到该用户身份信息对应的初步关联信息。
上述方案中,所述数据维度包括:多个子维度;多个子维度包括:时间子维度、迁徙路线子维度以及用户画像维度。
上述方案中,所述利用位置数据子集进行模型训练,得到迁徙预测进一步包括:
按照时间先后顺序对所述位置数据子集中的用户位置数据进行排序,得到排序后的位置数据子集;
依据预设切分比例,将所述排序后的位置数据子集切分为训练集、验证集和测试集;
利用所述训练集中的用户位置数据对初始预测模型进行训练,得到经过训练的初始预测模型;
利用所述验证集中的用户位置数据对经过训练的初始预测模型进行评估,依据评估结果调整经过训练的初始预测模型的模型参数,得到多组模型参数;
利用所述测试集中的用户位置数据对多组模型参数对应的初始预测模型进行性能测试,选择测试结果最优的模型参数对应的初始预测模型作为迁徙预测模型。
上述方案中,在得到所述迁徙人群的预测位置数据集之后,所述方法还包括:
按照时间先后顺序,将所述迁徙人群的建模位置数据集和所述预测位置数据集进行拼接,得到迁徙人群的拼接位置数据;
采用可视化图标对所述迁徙人群的拼接位置数据进行呈现。
上述方案中,所述迁徙预测模型为长短期记忆网络模型。
根据本发明的另一方面,提供了一种基于信令的人群迁徙预测装置,包括:构建模块、筛选模块、划分模块、训练模块以及预测模块;其中,
所述构建模块,用于获取用户身份信息、用户画像标签信息以及信令中的用户位置信息,构建用户位置数据集;
所述筛选模块,用于从所述用户位置数据集中筛选符合特定迁徙场景的用户位置数据,得到迁徙人群的建模位置数据集;
所述划分模块,用于按照多个数据维度对所述迁徙人群的建模位置数据集进行划分,得到位置数据子集;
所述训练模块,用于利用位置数据子集进行模型训练,得到迁徙预测模型;
所述预测模块,用于依据所述迁徙预测模型,对所述迁徙人群的迁徙情况进行预测,得到所述迁徙人群的预测位置数据集。
根据本发明的又一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如上述的基于信令的人群迁徙预测方法对应的操作。
根据本发明的再一方面,提供了一种计算机存储介质,存储介质中存储有至少一可执行指令,可执行指令使处理器执行如上述的基于信令的人群迁徙预测方法对应的操作。
根据本发明提供的技术方案,获取用户身份信息、用户画像标签信息以及信令中的用户位置信息,构建用户位置数据集;从所述用户位置数据集中筛选符合特定迁徙场景的用户位置数据,得到迁徙人群的建模位置数据集;按照多个数据维度对所述迁徙人群的建模位置数据集进行划分,得到位置数据子集;利用位置数据子集进行模型训练,得到迁徙预测模型;依据所述迁徙预测模型,对所述迁徙人群的迁徙情况进行预测,得到所述迁徙人群的预测位置数据集。由此解决了现有技术中,由于未考虑自然人用户“一证多号”的情况所导致的位置信息不完整或者不准确的问题;同时,通过将用户身份信息、用户画像标签信息和用户位置信息进行统一关联,实现了对不同类别细分人群迁徙特征的预测;通过筛选特定迁徙场景的用户位置数据,实现了灵活适配不同区域的人口迁徙预测;此外,还利用已有的数据系统中的数据资源进行数据建模,以此减少了采集用户包括位置信令在内的各项原始数据所需的网络资源和存储资源,大大降低了数据采集成本。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的基于信令的人群迁徙预测方法的流程示意图;
图2示出了根据本发明一个实施例的基于用户身份信息及手机号码确定用户位置信息的流程示意图;
图3示出了根据本发明一个实施例的构建带有画像标签的迁徙人群的建模位置数据集的流程示意图;
图4示出了根据本发明一个实施例的构建迁徙预测模型的流程示意图;
图5示出了根据本发明一个实施例的基于信令的人群迁徙预测装置的结构框图;
图6示出了根据本发明实施例的一种计算设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的基于信令的人群迁徙预测方法的流程示意图,如图1所示,该方法包括如下步骤:
步骤S101,获取用户身份信息、用户画像标签信息以及信令中的用户位置信息,构建用户位置数据集。
具体的,以手机号码为主键,将所述用户位置信息与所述用户身份信息进行关联,得到初步关联信息;其中,
若同一用户身份信息存在多个相关联的手机号码,则对多个相关联的手机号码对应的用户位置信息进行去重和合并处理,得到该用户身份信息对应的初步关联信息。
以身份标识号码为主键,将所述初步关联信息与所述用户画像标签信息进行关联,得到用户位置数据,并将所述用户位置数据添加至用户位置数据集中;其中,所述用户位置数据包含有对应用户的用户身份信息、用户位置信息以及用户画像标签信息。
具体的,所述用户身份信息为经用户实名制认证后通信运营商所获取的实名制身份信息;所述用户位置信息基于通信运营商特有的、全时段、全网覆盖的位置信息,用户位置信息包括手机号码、位置信息等;所述身份标识号码具体可为用户的身份证号码等证件号码;基于通信运营商大数据平台中的用户位置模型,以手机号码为主键,关联回填通信运营商实名制系统中的用户身份信息,得到所有归属于具体身份证号码的手机号码的位置信息,即初步关联信息;对于一个身份证号码只对应一个手机号码的情况,直接获取其对应的用户位置信息;对于一个身份证号码对应多个手机号码的情况,最终的用户位置信息由多个手机号码对应的多个位置信息汇总得到,通过将用户的多个手机号码的位置信息进行整合处理,得到该用户最终的完整位置信息,如图2所示;图2示出了根据本发明一个实施例的基于用户身份信息及手机号码确定用户位置信息的流程示意图。
所述用户画像标签信息是以用户的身份证号码为主键,关联全网统一用户中心平台中的用户画像标签表得到的;通过将上述用户身份信息、用户位置信息以及用户画像标签信息相关联,得到覆盖全网的、全时段的、带有丰富画像标签信息的用户位置数据集。
优选的,所述用户位置数据集中还包括行政区域编码表和基站工参表;用户身份信息主要包括手机号码及其归属的身份标识号码;用户画像标签信息主要包括用户的基础画像标签、位置标签、价值标签和兴趣偏好标签等画像标签,如表1所示。
表1
步骤S102,从所述用户位置数据集中筛选符合特定迁徙场景的用户位置数据,得到迁徙人群的建模位置数据集。
具体的,根据具体的应用场景的业务需求,设定具体的时间范围、迁徙路线和/或画像标签等,提取出该特定迁徙场景下的所有带有画像标签的用户位置数据,得到迁徙人群的建模位置数据集,如图3所示。图3示出了根据本发明一个实施例的构建带有画像标签的迁徙人群的建模位置数据集的流程示意图。
优选的,所述迁徙人群的画像标签可以是一个具体的画像标签,如男性人群、高收入人群;也可以是多个画像标签的组合,如中年女性人群、本科以上学历的女性人群、通信行业高收入青年人群等。通过筛选多组具体的画像标签进行组合,可以聚焦于特定的用户群体,实现精细化的人群迁徙特征分析和迁徙规模预测。
步骤S103,按照多个数据维度对所述迁徙人群的建模位置数据集进行划分,得到位置数据子集。
具体的,所述多个数据维度包括:多个子维度;多个子维度包括:时间子维度、迁徙路线子维度以及用户画像子维度。
具体的,基于已经构建的带有画像标签的迁徙人群的建模位置数据集,按照设定的时间子维度、迁徙路线子维度以及用户画像子维度为联合主键,得到迁徙总人口数量组成的位置数据子集。
步骤S104,利用位置数据子集进行模型训练,得到迁徙预测模型。
具体的,利用所述位置数据子集对模型进行训练、验证和测试,最终得到所述迁徙预测模型;其中,所述迁徙预测模型为长短期记忆网络模型,即LSTM(Long Short-TermMemory)模型。
步骤S105,依据所述迁徙预测模型,对所述迁徙人群的迁徙情况进行预测,得到所述迁徙人群的预测位置数据集。
具体的,在得到所述迁徙人群的预测位置数据集之后,按照时间先后顺序,将所述迁徙人群的建模位置数据集和所述预测位置数据集进行拼接,得到迁徙人群的拼接位置数据;采用可视化图表对所述迁徙人群的拼接位置数据进行呈现。
优选的,将多组迁徙人口数据输入LSTM模型中,获取所述迁徙人群的预测位置数据集;其中,所述预测位置数据集可以选择单步预测(one-stepforecasting),即预测未来一天的迁徙人口规模,也可以是多步预测(multi-step forecasting),预测未来数天的迁徙人口规模;
优选的,可以采用条形图、折线图或者散点图将所述拼接位置数据转化为可视化图表,通过可视化图形的方式,清晰且直观的展示出所述拼接位置数据中单个数据序列的变化趋势,以及多组数据序列在时间维度的变化趋势的相互关系。
根据本实施例提供的基于信令的人群迁徙预测方法,获取用户身份信息、用户画像标签信息以及信令中的用户位置信息,构建用户位置数据集;从所述用户位置数据集中筛选符合特定迁徙场景的用户位置数据,得到迁徙人群的建模位置数据集;按照多个数据维度对所述迁徙人群的建模位置数据集进行划分,得到位置数据子集;利用位置数据子集进行模型训练,得到迁徙预测模型;依据所述迁徙预测模型,对所述迁徙人群的迁徙情况进行预测,得到所述迁徙人群的预测位置数据集。利用本发明提供的技术方案,能够基于可定制的迁徙路线和特定的自然人群体,构造多条迁徙路线、多组画像标签的细分人群迁徙规模的数据集,通过LSTM模型针对特定场景下的细分人群迁徙规模进行预测,解决了对于迁徙人群精细化划分和迁徙场景多样化适配的问题;同时,基于通信运营商已经建设成熟的位置数据平台、全网实名制数据系统、全网统一用户中心平台,将所述用户身份信息、用户手机号码、用户画像标签信息以及用户位置信息进行关联整合,消除了因未考虑自然人用户“一证多号”而导致的负面影响,保证了迁徙人口的位置信息和画像信息更加完整和准确,且减少了信令分析处理的过程,减小了数据采集对于网络资源和存储资源的占用,极大地降低了数据采集的成本,减少了资源浪费。
图4示出了根据本发明一个实施例的构建迁徙预测模型的流程示意图,如图4所示,该方法包括如下步骤:
步骤S401:按照时间先后顺序对所述位置数据子集中的用户位置数据进行排序,得到排序后的位置数据子集。
具体的,根据具体应用场景,按照不同的时间粒度要求,提取不同时间口径的所述位置数据子集,基于多条迁徙路线、多种画像标签或者标签组合得到排序后的位置数据子集;
所述排序后的位置数据子集作为所述迁徙预测模型的输入数据。数据维度可包括:多个子维度;多个子维度包括:时间子维度、迁徙路线子维度以及用户画像维度。
通过所述位置数据子集构建所述排序后的位置数据子集还需要对所述位置数据子集的数据格式进行处理,完成输入变量的格式处理和转换。
优选的,根据不同的时间粒度要求,可以依据小时粒度、天粒度、月粒度等不同时间口径对所述位置数据子集进行数据提取。
对所述位置数据子集中每一条迁徙路线、每一类人群进行数据清洗,提出其中无效或者不合法的数据,并重新进行填充;其中,可以使用插值法、最值法、中位数、分位数或者平均值等填充方法进行填充;
对不同迁徙路线、不同类别的人群的迁徙人数进行相关性分析,可以采用逐步回归、岭回归、主成分分析等技术方法,对存在多重线性问题的所述位置数据子集进行分析和处理,实现数据降维。
步骤S402:依据预设切分比例,将所述排序后的位置数据子集切分为训练集、验证集和测试集。
具体的,所述将所述排序后的位置数据子集切分为训练集、验证集和测试集是依据时间顺序进行切分的,用以保证数据可以分割成连续样本的窗口;
对切分后的所述训练集、验证集和测试集分别进行数据格式的标准化处理,消除数据中的量级差异,提升模型的执行效率。
优选的,对所述排序后的位置数据子集进行切分的切分比例通常取70%作为训练集、20%作为验证集、10%作为测试集;对于数据格式的标准化处理,通常使用正态标准化或者极大极小值标准化处理方法。标准化处理一方面可以消除各列数据的量级差异,另一方面可以提升模型的执行效率。
经过切分以及数据格式标准化处理后的所述训练集、验证集和测试集,可以如表2所示。
表2
步骤S403:利用所述训练集中的用户位置数据对初始预测模型进行训练,得到经过训练的初始预测模型。
具体的,构建LSTM模型;其中,所述LSTM模型包括若干个LSTM单元,将特定迁徙路线的某类人群的迁徙人口序列(对应表2中训练集中的列)分别输入到独立的LSTM单元中,将输出结果合并输出到模型的下一层。
优选的,根据不同应用场景的具体需要,可以设置不同的权值对各LSTM单元的结果进行加权合并。
具体的,利用所述训练集中的用户位置数据对所述初始预测模型进行训练,其中,LSTM模型需要配置的参数包括:数据向量的维数,即每一行输入元素的个数、隐藏层的单元个数、LSTM层数、窗宽和步长。
优选的,以表2为例,2组迁徙路线、4个画像标签,则数据向量的维数即为8;同样以表2为例,2组迁徙路线、4个画像标签,隐藏层的单元个数可以设置为2或4;LSTM层数可以选择默认值1;窗宽和步长表示在对所述初始预测模型进行训练时,一次输入多少个数据,以表2为例,当选择窗宽为6,移动步长为6时,表示将42行训练集中的数据分解为7组,每组6行、每行8列,用于预测各条迁徙路线中每一类人群未来6天的迁徙规模。
步骤S404:利用所述验证集中的用户位置数据对经过训练的初始预测模型进行评估,依据评估结果调整经过训练的初始预测模型的模型参数,得到多组模型参数。
具体的,所述利用所述验证集中的用户位置数据对经过训练的初始预测模型进行评估,依据评估结果调整经过训练的初始预测模型的模型参数,得到多组模型参数进一步包括:依据评估结果对所述经过训练的初始预测模型进行微调,并完成对于所述经过训练的初始预测模型的筛选。
步骤S405:利用所述测试集中的用户位置数据对多组模型参数对应的初始预测模型进行性能测试,选择测试结果最优的模型参数对应的初始预测模型作为迁徙预测模型。
具体的,所述利用所述测试集中的用户位置数据对多组模型参数对应的初始预测模型进行性能测试,选择测试结果最优的模型参数对应的初始预测模型作为迁徙预测模型进一步包括:根据测试结果,得到多组模型参数对应的初始预测模型的均方误差,并通过调整多组模型参数对所述多组模型参数对应的初始预测模型进行优化,从多组模型参数中选择最优的参数组合作为模型参数。
LSTM模型具有“记忆”功能,能够充分考虑按时间排列的排序后的位置数据子集中数据的前后关系,挖掘出内部的关键特征,同时还可以联系前后时刻的隐含信息,模型收敛速度快,且具备较高的准确度。优选的,通过Python即可完成LSTM模型的完整实现。
图5示出了根据本发明一个实施例的基于信令的人群迁徙预测装置的结构框图,如图5所示,该装置包括:构建模块501、筛选模块502、划分模块503、训练模块504以及预测模块505;其中,
所述构建模块501,用于获取用户身份信息、用户画像标签信息以及信令中的用户位置信息,构建用户位置数据集。
具体的,所述构建模块501进一步用于:以手机号码为主键,将所述用户位置信息与所述用户身份信息进行关联,得到初步关联信息;以身份标识号码为主键,将所述初步关联信息与所述用户画像标签信息进行关联,得到用户位置数据,并将所述用户位置数据添加至用户位置数据集中;其中,所述用户位置数据包含有对应用户的用户身份信息、用户位置信息以及用户画像标签信息。
具体的,所述构建模块501进一步用于:若同一用户身份信息存在多个相关联的手机号码,则对多个相关联的手机号码对应的用户位置信息进行去重和合并处理,得到该用户身份信息对应的初步关联信息。
所述筛选模块502,用于从所述用户位置数据集中筛选符合特定迁徙场景的用户位置数据,得到迁徙人群的建模位置数据集。
所述划分模块503,用于按照多个数据维度对所述迁徙人群的建模位置数据集进行划分,得到位置数据子集。
其中,所述数据维度包括:多个子维度;多个子维度包括:时间子维度、迁徙路线子维度以及用户画像维度。
所述训练模块504,用于利用位置数据子集进行模型训练,得到迁徙预测模型。
具体的,所述训练模块504进一步用于:按照时间先后顺序对所述位置数据子集中的用户位置数据进行排序,得到排序后的位置数据子集;依据预设切分比例,将所述排序后的位置数据子集切分为训练集、验证集和测试集;利用所述训练集中的用户位置数据对初始预测模型进行训练,得到经过训练的初始预测模型;利用所述验证集中的用户位置数据对经过训练的初始预测模型进行评估,依据评估结果调整经过训练的初始预测模型的模型参数,得到多组模型参数;利用所述测试集中的用户位置数据对多组模型参数对应的初始预测模型进行性能测试,选择测试结果最优的模型参数对应的初始预测模型作为迁徙预测模型。
所述预测模块505,用于依据所述迁徙预测模型,对所述迁徙人群的迁徙情况进行预测,得到所述迁徙人群的预测位置数据集。
具体的,在得到所述迁徙人群的预测位置数据集之后,所述预测模块505还用于:按照时间先后顺序,将所述迁徙人群的建模位置数据集和所述预测位置数据集进行拼接,得到迁徙人群的拼接位置数据;采用可视化图表对所述迁徙人群的拼接位置数据进行呈现。
根据本实施例提供的基于信令的人群迁徙预测装置,获取用户身份信息、用户画像标签信息以及信令中的用户位置信息,构建用户位置数据集;从所述用户位置数据集中筛选符合特定迁徙场景的用户位置数据,得到迁徙人群的建模位置数据集;按照多个数据维度对所述迁徙人群的建模位置数据集进行划分,得到位置数据子集;利用位置数据子集进行模型训练,得到迁徙预测模型;依据所述迁徙预测模型,对所述迁徙人群的迁徙情况进行预测,得到所述迁徙人群的预测位置数据集。利用本发明提供的技术方案,能够基于可定制的迁徙路线和特定的自然人群体,构造多条迁徙路线、多组画像标签的细分人群迁徙规模的数据集,通过LSTM模型针对特定场景下的细分人群迁徙规模进行预测,解决了对于迁徙人群精细化划分和迁徙场景多样化适配的问题;同时,基于通信运营商已经建设成熟的位置数据平台、全网实名制数据系统、全网统一用户中心平台,将所述用户身份信息、用户手机号码、用户画像标签信息以及用户位置信息进行关联整合,消除了因未考虑自然人用户“一证多号”而导致的负面影响,保证了迁徙人口的位置信息和画像信息更加完整和准确,且减少了信令分析处理的过程,减小了数据采集对于网络资源和存储资源的占用,极大地降低了数据采集的成本,减少了资源浪费。
本发明还提供了一种非易失性计算机存储介质,计算机存储介质存储有至少一可执行指令,可执行指令可执行上述任意方法实施例中的基于信令的人群迁徙预测方法。
图6示出了根据本发明实施例的一种计算设备的结构示意图,本发明具体实施例并不对计算设备的具体实现做限定。
如图6所示,该计算设备可以包括:处理器(processor)602、通信接口(Communications Interface)604、存储器(memory)606、以及通信总线608。
其中:
处理器602、通信接口604、以及存储器606通过通信总线608完成相互间的通信。
通信接口604,用于与其它设备比如客户端或其它服务器等的网元通信。
处理器602,用于执行程序610,具体可以执行上述基于信令的人群迁徙预测方法实施例中的相关步骤。
具体地,程序610可以包括程序代码,该程序代码包括计算机操作指令。
处理器602可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器606,用于存放程序610。存储器606可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序610具体可以用于使得处理器602执行上述任意方法实施例中的基于信令的人群迁徙预测方法。程序610中各步骤的具体实现可以参见上述基于信令的人群迁徙预测方法实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
Claims (10)
1.一种基于信令的人群迁徙预测方法,包括:
获取用户身份信息、用户画像标签信息以及信令中的用户位置信息,构建用户位置数据集;
从所述用户位置数据集中筛选符合特定迁徙场景的用户位置数据,得到迁徙人群的建模位置数据集;
按照多个数据维度对所述迁徙人群的建模位置数据集进行划分,得到位置数据子集;
利用位置数据子集进行模型训练,得到迁徙预测模型;
依据所述迁徙预测模型,对所述迁徙人群的迁徙情况进行预测,得到所述迁徙人群的预测位置数据集。
2.根据权利要求1所述的方法,其中,所述获取用户身份信息、用户画像标签信息以及信令中的用户位置信息,构建用户位置数据集进一步包括:
以手机号码为主键,将所述用户位置信息与所述用户身份信息进行关联,得到初步关联信息;
以身份标识号码为主键,将所述初步关联信息与所述用户画像标签信息进行关联,得到用户位置数据,并将所述用户位置数据添加至用户位置数据集中;其中,所述用户位置数据包含有对应用户的用户身份信息、用户位置信息以及用户画像标签信息。
3.根据权利要求2所述的方法,其中,所述以手机号码为主键,将所述用户位置信息与所述用户身份信息进行关联,得到初步关联信息进一步包括:
若同一用户身份信息存在多个相关联的手机号码,则对多个相关联的手机号码对应的用户位置信息进行去重和合并处理,得到该用户身份信息对应的初步关联信息。
4.根据权利要求1所述的方法,其中,所述数据维度包括:多个子维度;多个子维度包括:时间子维度、迁徙路线子维度以及用户画像维度。
5.根据权利要求1所述的方法,其中,所述利用位置数据子集进行模型训练,得到迁徙预测模型进一步包括:
按照时间先后顺序对所述位置数据子集中的用户位置数据进行排序,得到排序后的位置数据子集;
依据预设切分比例,将所述排序后的位置数据子集切分为训练集、验证集和测试集;
利用所述训练集中的用户位置数据对初始预测模型进行训练,得到经过训练的初始预测模型;
利用所述验证集中的用户位置数据对经过训练的初始预测模型进行评估,依据评估结果调整经过训练的初始预测模型的模型参数,得到多组模型参数;
利用所述测试集中的用户位置数据对多组模型参数对应的初始预测模型进行性能测试,选择测试结果最优的模型参数对应的初始预测模型作为迁徙预测模型。
6.根据权利要求1-5任一项所述的方法,其中,在得到所述迁徙人群的预测位置数据集之后,所述方法还包括:
按照时间先后顺序,将所述迁徙人群的建模位置数据集和所述预测位置数据集进行拼接,得到迁徙人群的拼接位置数据;
采用可视化图表对所述迁徙人群的拼接位置数据进行呈现。
7.根据权利要求1-5任一项所述的方法,其中,所述迁徙预测模型为长短期记忆网络模型。
8.一种基于信令的人群迁徙预测装置,包括:构建模块、筛选模块、划分模块、训练模块以及预测模块;其中,
所述构建模块,用于获取用户身份信息、用户画像标签信息以及信令中的用户位置信息,构建用户位置数据集;
所述筛选模块,用于从所述用户位置数据集中筛选符合特定迁徙场景的用户位置数据,得到迁徙人群的建模位置数据集;
所述划分模块,用于按照多个数据维度对所述迁徙人群的建模位置数据集进行划分,得到位置数据子集;
所述训练模块,用于利用位置数据子集进行模型训练,得到迁徙预测模型;
所述预测模块,用于依据所述迁徙预测模型,对所述迁徙人群的迁徙情况进行预测,得到所述迁徙人群的预测位置数据集。
9.一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-7中任一项所述的基于信令的人群迁徙预测方法对应的操作。
10.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-7中任一项所述的基于信令的人群迁徙预测方法对应的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111146197.6A CN115879506A (zh) | 2021-09-28 | 2021-09-28 | 基于信令的人群迁徙预测方法、装置、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111146197.6A CN115879506A (zh) | 2021-09-28 | 2021-09-28 | 基于信令的人群迁徙预测方法、装置、设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115879506A true CN115879506A (zh) | 2023-03-31 |
Family
ID=85755756
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111146197.6A Pending CN115879506A (zh) | 2021-09-28 | 2021-09-28 | 基于信令的人群迁徙预测方法、装置、设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115879506A (zh) |
-
2021
- 2021-09-28 CN CN202111146197.6A patent/CN115879506A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109241711A (zh) | 基于预测模型的用户行为识别方法及装置 | |
CN111028016A (zh) | 销量数据预测方法、装置以及相关设备 | |
CN113570867B (zh) | 一种城市交通状态预测方法、装置、设备及可读存储介质 | |
CN112560829B (zh) | 人群数量确定方法、装置、设备及存储介质 | |
CN111105628A (zh) | 一种停车场画像构建方法和装置 | |
CN110516748A (zh) | 业务处理方法、装置、介质及电子设备 | |
CN113505537A (zh) | 楼宇能耗检测方法、装置、计算机设备和存储介质 | |
CN112233428B (zh) | 车流量预测方法、装置、存储介质及设备 | |
CN113688490A (zh) | 网络共建共享处理方法、装置、设备及存储介质 | |
CN110598999A (zh) | 基于个体数据的交通出行分析方法、系统及存储介质 | |
CN114648680A (zh) | 图像识别模型的训练方法、装置、设备、介质及程序产品 | |
CN113781767A (zh) | 一种基于多源感知的交通数据融合方法及系统 | |
CN113610156A (zh) | 用于大数据分析的人工智能模型机器学习方法及服务器 | |
CN111476685A (zh) | 行为分析方法、装置及设备 | |
CN112580616B (zh) | 人群数量确定方法、装置、设备及存储介质 | |
CN112164223B (zh) | 基于云平台的智能交通信息处理方法及装置 | |
CN115439928A (zh) | 一种操作行为识别方法及装置 | |
CN115879506A (zh) | 基于信令的人群迁徙预测方法、装置、设备和存储介质 | |
CN113158084B (zh) | 移动轨迹数据处理的方法、装置、计算机设备及存储介质 | |
CN108629506A (zh) | 风控模型的建模方法、装置、计算机设备和存储介质 | |
CN113033314A (zh) | 一种旅游高峰部署的移动式景区智能服务系统及服务方法 | |
CN113569937A (zh) | 基于大数据的人工智能模型机器学习方法及服务器 | |
CN114095947B (zh) | 一种网络覆盖评估方法、装置、电子设备及存储介质 | |
CN110400160A (zh) | 识别竞品用户的方法、装置、电子设备和存储介质 | |
CN117114894A (zh) | 一种理赔结果预测方法、装置、设备及其存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |