CN112561121A - 基于手机信令数据的复工趋势预测方法及系统 - Google Patents

基于手机信令数据的复工趋势预测方法及系统 Download PDF

Info

Publication number
CN112561121A
CN112561121A CN202011260416.9A CN202011260416A CN112561121A CN 112561121 A CN112561121 A CN 112561121A CN 202011260416 A CN202011260416 A CN 202011260416A CN 112561121 A CN112561121 A CN 112561121A
Authority
CN
China
Prior art keywords
rework
mobile phone
signaling data
phone signaling
prediction model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011260416.9A
Other languages
English (en)
Other versions
CN112561121B (zh
Inventor
赵鹏军
胡昊宇
海晓东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Original Assignee
Peking University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University filed Critical Peking University
Priority to CN202011260416.9A priority Critical patent/CN112561121B/zh
Publication of CN112561121A publication Critical patent/CN112561121A/zh
Application granted granted Critical
Publication of CN112561121B publication Critical patent/CN112561121B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • G06Q50/265Personal security, identity or safety
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W8/00Network data management
    • H04W8/18Processing of user or subscriber data, e.g. subscribed services, user preferences or user profiles; Transfer of user or subscriber data
    • H04W8/183Processing at user equipment or user record carrier

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Evolutionary Computation (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • General Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Operations Research (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Security & Cryptography (AREA)
  • Educational Administration (AREA)
  • Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Primary Health Care (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Databases & Information Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明提供一种基于手机信令数据的复工趋势预测方法及系统,方法包括:将待测区域的手机信令数据以及训练标签输入至预设预测模型进行迭代训练,以确定预设预测模型的待估计参数;根据待估计参数以及预设预测模型,确定复工预测模型;将手机信令数据输入至复工预测模型进行训练,以预测待测区域复工趋势。所述系统用于执行上述方法。本发明提供的基于手机信令数据的复工趋势预测方法及系统,通过将待测区域的手机信令数据以及训练标签输入至预设预测模型进行训练,以确定复工预测模型,并通过复工预测模型实现了对待测区域的复工趋势的精准预测。

Description

基于手机信令数据的复工趋势预测方法及系统
技术领域
本发明涉及计算机技术领域,尤其涉及基于手机信令数据的复工趋势预测方法及系统。
背景技术
目前,常用的突发事件过后复工水平测量方法主要分为以下几类:第一类是采用人工与自动化相结合的POI围栏圈定策略,获取待测算样本区域内移动终端数量,并基于企业生产经营范围内的移动终端位置数量测算复工水平;第二类是基于动力学模型,将自然传播过程中的人群进行分类建立SEIR仓室模型,并利用往年正常情况下的互联网迁徙数据构建城市间人口流动网络对仓室模型进行拓展,通过此模型,基于各个城市的突发事件数据,从而得到不同时期城市控制再生数的估计值。
第一类方法只能用于复工现状的估计和判读,并未提出有效的预测手段,也没有考虑城市间人口流动等其他空间因素的影响,而无法对未来的复工趋势做出有效预测;第二类方法将人口统计数据和互联网迁徙数据分别作为人口基数和流动数据,存在口径不一致问题,且互联网迁徙数据中交通方式权重存在差异,用于表征流动规模会造成结果偏差;该技术的突发事件难以利用该模型来推测复工趋势,同样无法对未来的复工趋势做出有效预测。
目前尚难有一种有效方法,能够对复工趋势做出精准预测。
发明内容
本发明提供的基于手机信令数据的复工趋势预测方法及系统,用于克服现有技术中存在只能对复工现状进行判读与估计而无法对未来复工趋势进行预测的缺陷,能够实现对待测区域的复工趋势进行精准预测。
本发明提供一种基于手机信令数据的复工趋势预测方法,包括:
将待测区域的手机信令数据以及训练标签输入至预设预测模型进行迭代训练,以确定所述预设预测模型的待估计参数;
根据所述待估计参数以及所述预设预测模型,确定复工预测模型;
将所述手机信令数据输入至所述复工预测模型进行训练,以预测待测区域复工趋势;
其中,所述手机信令数据包括如下历史数据:所述待测区域的返程数据、所述待测区域的返岗数据、所述待测区域的累计返岗数据以及所述待测区域的OD数据;
所述训练标签为与所述待测区域的手机信令数据中的数据同时刻获取的待测区域复工趋势的实际观测值。
根据本发明提供的一种基于手机信令数据的复工趋势预测方法,所述将待测区域的手机信令数据以及训练标签输入至预设预测模型进行迭代训练,以确定所述预设预测模型的待估计参数,包括:
将所述手机信令数据以及所述训练标签输入至预设预测模型进行迭代训练,并在满足预设条件时停止训练,以确定所述待估计参数;
其中,所述预设条件包括:迭代次数达到预设值或所述预设预测模型的损失函数小于预设阈值。
根据本发明提供的一种基于手机信令数据的复工趋势预测方法,在所述将待测区域的手机信令数据以及训练标签输入至预设预测模型进行迭代训练之前,还包括:
获取原始手机信令数据,并对所述原始手机信令数据进行筛选和过滤,以确定有效手机信令数据;
根据区域以及预设时序将所述有效手机信令数据进行划分,以确定所述待测区域的手机信令数据。
根据本发明提供的一种基于手机信令数据的复工趋势预测方法,所述将所述手机信令数据输入至所述复工预测模型进行训练,以预测待测区域复工趋势,包括:
将所述手机信令数据输入至所述复工预测模型进行训练,以预测所述待测区域的累计返岗率以及所述待测区域的返岗率;
根据所述累计返岗率以及所述返岗率,预测所述待测区域复工趋势。
根据本发明提供的一种基于手机信令数据的复工趋势预测方法,所述将所述手机信令数据输入至所述复工预测模型进行训练,以预测所述待测区域的累计返岗率以及所述待测区域的返岗率,包括:
将所述手机信令数据输入至所述复工预测模型进行训练,以预测所述待测区域的累计返岗人数以及所述待测区域的累计应到岗人数;
将所述累计返岗人数以及所述累计应到岗人数输入至所述复工预测模型进行训练,以预测所述累计返岗率;
将所述累计返岗率以及预设哑变量输入至所述复工预测模型进行训练,以预测所述返岗率。
根据本发明提供的一种基于手机信令数据的复工趋势预测方法,所述将所述手机信令数据输入至所述复工预测模型进行训练,以预测所述待测区域的累计返岗人数以及所述待测区域的累计应到岗人数,包括:
将所述返程数据输入至所述复工预测模型进行训练,以预测所述新增返程人数;
将所述新增返程人数、所述返程数据、预设隔离时间以及所述预设哑变量输入至所述复工预测模型进行训练,以预测所述累计返岗人数;
将所述新增返程人数输入至所述复工预测模型进行训练,以预测所述累计应到岗人数。
根据本发明提供的基于手机信令数据的复工趋势预测方法,所述预设隔离时间,包括:
固定隔离时间或可变隔离时间。
本发明还提供一种基于手机信令数据的复工趋势预测系统,包括:
参数确定模块、模型确定模块以及预测模块;
所述参数确定模块,用于将待测区域的手机信令数据以及训练标签输入至预设预测模型进行迭代训练,以确定所述预设预测模型的待估计参数;
所述模型确定模块,用于根据所述待估计参数以及所述预设预测模型,确定复工预测模型;
所述预测模块,用于将所述手机信令数据输入至所述复工预测模型进行训练,以预测待测区域复工趋势;
其中,所述手机信令数据包括:如下历史数据:所述待测区域的返程数据、所述待测区域的返岗数据、所述待测区域的累计返岗数据以及所述待测区域的OD数据;
所述训练标签为与所述待测区域的手机信令数据中的数据同时刻获取的待测区域复工趋势的实际观测值。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述基于手机信令数据的复工趋势预测方法的步骤。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述基于手机信令数据的复工趋势预测方法的步骤。
本发明提供的基于手机信令数据的复工趋势预测方法及系统,通过将待测区域过去时刻的手机信令数据以及同时刻采集的待测区域的复工趋势实际观测值输入至预设预测模型进行迭代训练,确定预设预测模型的待估计参数,并基于待估计参数以及预设预测模型构建复工预测模型,通过将待测区域过去时刻的手机信令数据输入至复工预测模型,实现对待测区域未来时刻的返岗复工趋势进行预测,此外由于手机信令数据具有时效性强、覆盖范围广等特性,使得可以实现对返岗复工趋势的精准预测,此外本发明充分考虑了本地居民及春节返乡居民的差异性、不同城市的地域差异性、城市间人口流动等因素对城市返岗复工的影响,提出了对城市返岗复工的预测方法,弥补了现有技术仅能用于测算单一片区当前返岗复工水平的不足,拓展了手机信令数据对返岗复工的应用场景。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的基于手机信令数据的复工趋势预测方法的流程示意图;
图2是本发明提供的预设隔离时间设置为14天时对全国部分城市的返岗率预测结果;
图3是本发明提供的预设隔离时间设置为14天和0天时对北京市的返岗率预测结果;
图4是本发明提供的预设隔离时间设置为14天和0天时对上海市的返岗率预测结果;
图5是本发明提供的预设隔离时间设置为14天和0天时对深圳市的返岗率预测结果;
图6是本发明提供的对某日累计返岗率和返岗率的预测结果和真实值之一;
图7是本发明提供的对某日累计返岗率和返岗率的预测结果和真实值之二;
图8是本发明提供的对某日累计返岗率和返岗率的预测结果和真实值之三;
图9是本发明提供的对某日累计返岗率和返岗率的预测结果和真实值之四;
图10是本发明提供的基于手机信令数据的复工趋势预测系统的结构示意图;
图11是本发明提供的一种电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明提供的基于手机信令数据的复工趋势预测方法的流程示意图,如图1所示,方法包括:
S1、将待测区域的手机信令数据以及训练标签输入至预设预测模型进行迭代训练,以确定预设预测模型的待估计参数;
S2、根据待估计参数以及预设预测模型,确定复工预测模型;
S3、将手机信令数据输入至复工预测模型进行训练,以预测待测区域复工趋势;
其中,手机信令数据包括如下历史数据:待测区域的返程数据、待测区域的返岗数据、待测区域的累计返岗数据以及待测区域的OD数据;
训练标签为与待测区域的手机信令数据中的数据同时刻获取的待测区域复工趋势的实际观测值。
需要说明的是,上述方法的执行主体可以是电子设备、电子设备中的部件、集成电路、或芯片。该电子设备可以是移动电子设备,也可以为非移动电子设备。示例性的,移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本或者个人数字助理(personal digital assistant,PDA)等,非移动电子设备可以为服务器、网络附属存储器(Network Attached Storage,NAS)、个人计算机(personal computer,PC)、电视机(television,TV)、柜员机或者自助机等,本申请实施例不作具体限定。
具体地,基于过去若干连续时间段内的手机信令数据以及其对应的复工趋势的实际观测值,建立由多个含有时间交互项的多元回归预测模型构成的预设预测模型,并进行参数估计,确定预设预测模型的待估计参数;并基于待估计参数以及预设预测模型,确定复工预测模型;最后将过去若干连续时间段内的、包括待测区域的手机信令数据输入至复工预测模型进行训练,以预测待测区域的复工趋势。
需要说明的是,复工趋势可以由待测区域的新增返程人数、累计返岗人数、应到岗人数、累计返岗率以及返岗率确定。
需要说明的是,手机信令数据是由手机用户在发生通话、发短信或移动位置等事件时,被运营商的通信基站捕获并记录同一用户信令轨迹所产生的一种大数据,最后经过脱密、脱敏、扩样等处理后,可从中提取居民分布、出行行为等空间信息并用于进一步的分析研究。在用于研究应对各类突发性公共事件时,相较于传统调研数据,手机信令数据具有时效性强、覆盖范围广、获取成本低等诸多方面的显著优势。
需要说明的是,手机信令数据具有样本量大、时效性强、覆盖范围广、获取成本低的特征,能够弥补传统调研数据在样本量和时效性等方面的局限性。尤其在应对例如流行传染病等突发性公共安全事件时,手机信令数据作为大数据的优势显得尤为突出。随着移动终端设备的逐步普及和通信运营商基站的逐步覆盖,手机信令数据的时空精度得到了进一步提升,数据有效性的提高也使其获得了更广的应用前景。然而,当前基于手机信令数据的各类应用研究主要为揭示和描述现状,而缺乏对数据的进一步挖掘,更加缺乏利用手机信令数据对未来场景进行预测的技术手段。
需要说明的是,手机信令数据至少包括:待测区域的返程数据、待测区域的返岗数据、待测区域的累计返岗数据以及待测区域的用户流动规模OD数据。
返程数据包括每个地级行政区的已返程人数和应返程人数。应返程人数指的是根据去年非节假日时期的手机信令得出的常住于该地级行政区的用户规模,已返程人数指的是上述应返程用户中在当日位于该地级行政区的用户规模。
返岗数据包括每个地级行政区的当日返岗人数和应返岗人数。应返岗人数指的是根据去年非节假日时期的手机信令得出的就业地位于该地级行政区,且当日位于该地级行政区的用户规模。当日返岗人数指的是根据去年非节假日时期的手机信令得出的就业地位于该地级行政区,且当日已经返岗的用户规模。返岗的判读标准是当日工作时段内手机信令定位最频繁的定位位置位于其就业地,就业地的判读标准是去年非节假日时期的工作日工作时段内其手机信令定位最频繁的定位位置。
累计返岗数据包括每个地级行政区的累计返岗人数。累计返岗人数指的是是根据去年非节假日时期的手机信令得出的就业地位于该地级行政区,且从研究期首日起至当日为止中任意一日曾经有过返岗行为的用户规模。返岗及就业地的判读标准同上。
OD数据指的是每个地级行政区对之间的用户流动规模。每一条记录包含出发的地级行政区、到达的地级行政区、用户流动规模和日期。
本发明实施例提供的基于手机信令数据的复工趋势预测方法,通过将待测区域过去时刻的手机信令数据以及同时刻采集的待测区域的复工趋势实际观测值输入至预设预测模型进行迭代训练,确定预设预测模型的待估计参数,并基于待估计参数以及预设预测模型构建复工预测模型,通过将待测区域过去时刻的手机信令数据输入至复工预测模型,实现对待测区域未来时刻的返岗复工趋势进行预测,此外由于手机信令数据具有时效性强、覆盖范围广等特性,使得可以实现对返岗复工趋势的精准预测,此外本发明充分考虑了本地居民及节假日返乡居民的差异性、不同城市的地域差异性、城市间人口流动等因素对城市返岗复工的影响,提出了对城市返岗复工的预测方法,弥补了现有技术仅能用于测算单一片区当前返岗复工水平的不足,拓展了手机信令数据对返岗复工的应用场景。
进一步地,在一个实施例中,步骤S1包括:
S11、将手机信令数据以及训练标签输入至预设预测模型进行迭代训练,并在满足预设条件时停止训练,以确定待估计参数;
其中,预设条件包括:迭代次数达到预设值或预设预测模型的损失函数小于预设阈值。
例如,将手机信令数据以及训练标签输入至预设预测模型进行迭代训练,并设定迭代次数为m,迭代步幅设置为step,初始迭代次数为M=0,按照公式M=M+step对初始迭代次数M进行更新,其中m为正整数且m>step;
比较M和m大小,若M=m,则停止训练,获取此时的预设预测模型的待估计参数;
或,设定预设阈值为σ,若判定预设预测模型的损失函数小于预设阈值,则停止训练,获取此时的预设预测模型的待估计参数;
Figure BDA0002774468410000101
其中,loss代表损失函数,num代表待测区域的手机信令数据中用于训练的样本总数,yj代表待测区域的手机信令数据中用于训练的样本值,
Figure BDA0002774468410000102
代表待测区域的手机信令数据中的数据同时刻获取的待测区域复工趋势的中用于训练的实际观测值。
本发明实施例提供的基于手机信令数据的复工趋势预测方法,通过将待测区域过去时刻的手机信令数据以及同时刻采集的待测区域的复工趋势实际观测值输入至预设预测模型进行迭代训练,确定预设预测模型的待估计参数,并基于待估计参数以及预设预测模型构建复工预测模型,通过将待测区域过去时刻的手机信令数据输入至复工预测模型,实现对待测区域未来时刻的返岗复工趋势的精准预测。
进一步地,在一个实施例中,步骤S1之前还包括:
S0、获取原始手机信令数据,并对原始手机信令数据进行筛选和过滤,以确定有效手机信令数据;
根据区域以及预设时序将有效手机信令数据进行划分,以确定待测区域的手机信令数据。
需要说明的是,由于手机信令数据样本量大,在实际应用中,常常需要对原始手机信令数据进行筛选和过滤,以确定所需有效手机信令数据;又由于手机信令数据涵盖了各个区域各个时间段,因此,为了减少运算量,需要对有效的手机信令数据按照区域以及预设时序进行划分,以获得训练所用的待测区域的手机信令数据。
需要说明的是,本发明实施例中预设时序可以根据实际情况自由设置,可以是预设固定时序,也可以预设可变时序,本发明实施例对此不做具体限定。
本发明实施例提供的基于手机信令数据的复工趋势预测方法,通过对原始手机信令数据进行筛选和过滤处理,得到有效手机信令数据,并按照区域以及预设时序对有效手机信令数据进行划分,得到用于训练的待测区域的手机信令数据,并将待测区域的手机信令数据输入至复工预测模型进行训练,减少了模型的运算复杂度,提升了模型预测的效率,同时,实现了对待测区域未来时刻的返岗复工趋势的精准预测。
进一步地,在一个实施例中,步骤S3可以具体包括:
S31、将手机信令数据输入至复工预测模型进行训练,以预测待测区域的累计返岗率以及待测区域的返岗率;
S32、根据累计返岗率以及返岗率,预测待测区域复工趋势。需要说明的是,本发明实施例中累计返岗率以及返岗率可以分别由公式(2)和公式(3)确定:
Figure BDA0002774468410000111
RJCt=c0RJAt+c1w1RJAt+c2w2RJA+c3w3RJA+c4w4RJAt (3)
其中,t代当前的日期,RJAt表示当前日期的累计返岗率,RJCt表示当前日期的当日返岗率,c0、c1、c2、c3和c4为待估计参数,JAt代表累计返岗人数,JSt代表累计应到岗人数,w1、w2、w3和w4代表预设哑变量,分别表示标识星期一、星期二、星期三、星期四的哑变量。
本发明实施例提供的基于手机信令数据的复工趋势预测方法,通过将待测区域过去时刻的手机信令数据输入至复工预测模型,实现对待测区域未来时刻的累计返岗率以及返岗率的精准预测,进而实现对待测区域复工趋势的预测,克服了现有技术仅能用于测算单一片区当前返岗复工水平的不足,拓展了手机信令数据对返岗复工的应用场景。
进一步地,在一个实施例中,步骤S31可以具体包括:
S311、将手机信令数据输入至复工预测模型进行训练,以预测待测区域的累计返岗人数以及待测区域的累计应到岗人数;
S322、将累计返岗人数以及累计应到岗人数输入至复工预测模型进行训练,以预测累计返岗率;
S333、将累计返岗率以及预设哑变量输入至复工预测模型进行训练,以预测返岗率。
需要说明的是,本发明实施例中的累计返岗人数以及累计应到岗人数可分别由公式(4)和(5)计算获得,具体地:
Figure BDA0002774468410000121
其中,t0代表初始状态的日期,即训练数据的第一天,JCi代表对应日期的新增返岗人数,JAt0代表初始状态的累计返岗人数。
JSt=a0+a1lnt+a2RCt (5)
其中,RCt代表当前日期的新增返程人数,a0、a1和a2代表待估计参数。
需要说明的是,对应当前日期的新增返岗人数可以由公式(6)计算获得,具体地:
Figure BDA0002774468410000122
其中,T代表预设隔离时间,RAt0代表初始状态的已返程人数,b0、b1、b2、b3、b4、b5、b6和b7代表待估计参数。
本发明实施例提供的基于手机信令数据的复工趋势预测方法,通过将待测区域过去时刻的手机信令数据输入至复工预测模型,预测累计返岗人数以及待测区域的累计应到岗人数,并基于累计返岗人数以及累计应到岗人数,预测累计返岗率;基于将累计返岗率,预测返岗率,通过结合累计返岗率和返岗率,实现对待测区域复工趋势的预测,此外,本发明实施例中涉及的返程、返岗等人数指标具有口径的一致性,并建立了各指标的内在关系模型,使指标间可以相互进行验证,弥补了现有技术中数据源口径不一致的问题,进一步提高了复工趋势预测的准确性。
进一步地,在一个实施例中,步骤S311可以具体包括:
S3111、将返程数据输入至复工预测模型进行训练,以预测新增返程人数;
S3112、将新增返程人数、返程数据、预设隔离时间以及预设哑变量输入至复工预测模型进行训练,以预测累计返岗人数;
S3113、将新增返程人数输入至复工预测模型进行训练,以预测累计应到岗人数。
需要说明的是,本发明实施例中的新增返程人数可以由公式(7)计算获得,具体的:
RCt=RRt-1-RRt (7)
其中,RCt代表当前日期的新增返程人数,RRt代表当前日期的未返程人数,RRt-1代表当前日期前一天的未返程人数。
需要说明的是,本发明实施例中的当前日期的未返程人数可以由公式(8)计算获得,具体地:
Figure BDA0002774468410000132
其中,RS和RAt分别代表返程数据中的应返程人数和当前日期的已返程人数,RRt0代表初始状态的未返程人数,k1和k2代表待估计参数。
需要说明的是,本发明实施例中的初始状态的未返程人数可以由公式(9)计算获得,具体地:
Figure BDA0002774468410000131
其中,Oi表示从节假日开始至t0时从该地级行政区出发并抵达地级行政区i的流动规模,Di表示从节假日开始至t0时从地级行政区i出发并抵达该地级行政区的流动规模。
本发明实施例提供的基于手机信令数据的复工趋势预测方法,通过将待测区域过去时刻的手机信令数据的返程数据输入至复工预测模型,预测新增返程人数,并基于新增返程人数、返程数据、预设隔离时间以及预设哑变量,预测累计返岗人数;以及基于新增返程人数,预测累计应到岗人数,并为后续通过结合新增返程人数和累计应到岗人数,预测累计返岗率和返岗率,进而实现对待测区域复工趋势的预测提供了基础,此外,本发明实施例中涉及的返程、返岗等人数指标具有口径的一致性,并建立了各指标的内在关系模型,使指标间可以相互进行验证,弥补了现有技术中数据源口径不一致的问题,进一步提高了复工趋势预测的准确性。
进一步地,在一个实施例中,步骤S3112中预设隔离时间可以具体包括:固定隔离时间或可变隔离时间。
进一步地,在一个实施例中,方法还包括:对复工趋势预测结果的空间分布进行可视化展示。
具体地,本发明实施例中的预设隔离时间可以根据实际场景具体设置为固定值或可变值。例如设置为固定隔离时间为14天,或根据关于政策实时调整隔离时间。
需要说明的是,本发明实施例中通过利用GIS复工趋势预测结果的空间分布进行可视化展示。
本发明实施例提供的基于手机信令数据的区域复工趋势预测方法,通过将隔离时间作为可调整的参数,便于根据实际政策调整来实时调整复工预测模型,弥补了现有技术中对此问题的忽视,同时提高了对待测区域复工趋势预测的准确度,并对复工趋势预测结果进行实时可视化展示,便于实时观测复工趋势,为针对突发事件实施政策调整提供了依据。
下面结合实际场景对本发明实施例中的复工预测模型准确度进行验证,将待测区域2020年4月7日至4月10日全国各个省市采集的手机信令数据输入至复工预测模型,对比复工预测模型累计返岗率和返岗率的预测值以及实际观测值,校验复工预测模型对样本观测值的拟合程度,结果如表1和表2所示:
表1当日返岗率预测效果
Figure BDA0002774468410000151
表2累计返岗率预测效果
Figure BDA0002774468410000152
分析结果显示,当日返岗率预测结果的均方根误差RMSE控制在0.1以内,平均绝对百分比误差MAPE控制在0.2以内,拟合优度R方大致在0.7以上;累计返岗率预测结果的均方根误差RMSE控制在0.03以内,平均绝对百分比误差MAPE控制在0.03以内,拟合优度R方大致在0.9以上。
R方指拟合优度,检验模型预测值对样本观测值的拟合程度,R方越接近1,拟合效果越好。均方根误差RMSE是观测值与真值偏差的平方和与观测次数比值的平方根,用来衡量观测值同真值之间的偏差,RMSE值越小,说明预测值与实际值大小相当,反之,预测值与实际值存在着较大的差异。平均绝对百分比误差MAPE为预测值与实际值相对误差绝对值的平均值,MAPE值越小,说明预测值与原始值差别越小,也即预测效果越好。
以上结果说明,本预测技术方法的准确性较高,能够较为有效地预测待测区域未来的当日返岗率及累计返岗率。
以2020年突发事件后的返岗复工为例,将2月17日至4月3日手机信令数据作为复工预测模型训练数据,对4月全国返岗复工情况进行预测。结果如下:
图2是本发明提供的预设隔离时间设置为14天时对全国部分城市的返岗率预测结果。结果显示,各城市的当日返岗率和累计返岗率均大致呈现稳步上升,但不同城市的上升速度存在差异。其中,武汉市的累计返岗率和当日返岗率上升速度均快于其他主要城市,但其值在预测期内仍然低于其他城市。不同城市的当日返岗率上升幅度均比较小,并存在周期性波动。
图3是本发明提供的预设隔离时间设置为14天和0天时对北京市的返岗率预测结果;图4是本发明提供的预设隔离时间设置为14天和0天时对上海市的返岗率预测结果显示;图5是本发明提供的预设隔离时间设置为14天和0天时对深圳市的返岗率预测结果;如图3、图4和图5所示,三个城市的当日返岗率均呈波动上升趋势,累计返岗率则呈现稳步持续上升趋势。
图6是本发明提供的对某日累计返岗率和返岗率的预测结果和真实值之一;图7是本发明提供的对某日累计返岗率和返岗率的预测结果和真实值之二;图8是本发明提供的对某日累计返岗率和返岗率的预测结果和真实值之三;图9是本发明提供的对某日累计返岗率和返岗率的预测结果和真实值之四;如图6、图7、图8和图9所示,预测结果的准确性较高,其中累计返岗率的准确性高于当日返岗率,除了少数异常值外,大部分地级行政区的预测结果与真实值有很高的吻合度。
下面对本发明提供的基于手机信令数据的区域复工趋势预测系统进行描述,下文描述的基于手机信令数据的区域复工趋势预测系统与上文描述的基于手机信令数据的区域复工趋势预测方法可相互对应参照。
图10是本发明提供的基于手机信令数据的区域复工趋势预测系统的结构示意图,如图10所示,参数确定模块100、模型确定模块101以及预测模块102;
参数确定模块100,用于将待测区域的手机信令数据以及训练标签输入至预设预测模型进行迭代训练,以确定预设预测模型的待估计参数;
模型确定模块101,用于根据待估计参数以及预设预测模型,确定复工预测模型;
预测模块102,用于将手机信令数据输入至复工预测模型进行训练,以预测待测区域复工趋势;
其中,手机信令数据包括:如下历史数据:待测区域的返程数据、待测区域的返岗数据、待测区域的累计返岗数据以及待测区域的OD数据;
训练标签为与待测区域的手机信令数据中的数据同时刻获取的待测区域复工趋势的实际观测值。
本发明实施例提供的基于手机信令数据的复工趋势预测系统,通过参数确定模块100将待测区域过去时刻的手机信令数据以及同时刻采集的待测区域的复工趋势实际观测值输入至预设预测模型进行迭代训练,确定预设预测模型的待估计参数,并利用模型确定模块101基于待估计参数以及预设预测模型构建复工预测模型,结合预测模型102将待测区域过去时刻的手机信令数据输入至复工预测模型,实现对待测区域未来时刻的返岗复工趋势的预测,此外由于手机信令数据具有时效性强、覆盖范围广等特性,使得可以实现对返岗复工趋势的精准预测。
图11是本发明提供的一种电子设备的实体结构示意图,如图11所示,该电子设备可以包括:处理器(processor)110、通信接口(communication interface)111、存储器(memory)112和总线(bus)113,其中,处理器110,通信接口111,存储器112通过总线113完成相互间的通信。处理器110可以调用存储器112中的逻辑指令,以执行如下方法:
将待测区域的手机信令数据以及训练标签输入至预设预测模型进行迭代训练,以确定预设预测模型的待估计参数;
根据待估计参数以及预设预测模型,确定复工预测模型;
将手机信令数据输入至复工预测模型进行训练,以预测待测区域复工趋势。
此外,上述的存储器中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
进一步地,本发明实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:
将待测区域的手机信令数据以及训练标签输入至预设预测模型进行迭代训练,以确定预设预测模型的待估计参数;
根据待估计参数以及预设预测模型,确定复工预测模型;
将手机信令数据输入至复工预测模型进行训练,以预测待测区域复工趋势。
另一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的传输方法,例如包括:
将待测区域的手机信令数据以及训练标签输入至预设预测模型进行迭代训练,以确定预设预测模型的待估计参数;
根据待估计参数以及预设预测模型,确定复工预测模型;
将手机信令数据输入至复工预测模型进行训练,以预测待测区域复工趋势。
以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种基于手机信令数据的复工趋势预测方法,其特征在于,包括:
将待测区域的手机信令数据以及训练标签输入至预设预测模型进行迭代训练,以确定所述预设预测模型的待估计参数;
根据所述待估计参数以及所述预设预测模型,确定复工预测模型;
将所述手机信令数据输入至所述复工预测模型进行训练,以预测待测区域复工趋势;
其中,所述手机信令数据包括如下历史数据:所述待测区域的返程数据、所述待测区域的返岗数据、所述待测区域的累计返岗数据以及所述待测区域的OD数据;
所述训练标签为与所述待测区域的手机信令数据中的数据同时刻获取的待测区域复工趋势的实际观测值。
2.根据权利要求1所述的基于手机信令数据的复工趋势预测方法,其特征在于,所述将待测区域的手机信令数据以及训练标签输入至预设预测模型进行迭代训练,以确定所述预设预测模型的待估计参数,包括:
将所述手机信令数据以及所述训练标签输入至预设预测模型进行迭代训练,并在满足预设条件时停止训练,以确定所述待估计参数;
其中,所述预设条件包括:迭代次数达到预设值或所述预设预测模型的损失函数小于预设阈值。
3.根据权利要求1所述的基于手机信令数据的复工趋势预测方法,其特征在于,在所述将待测区域的手机信令数据以及训练标签输入至预设预测模型进行迭代训练之前,还包括:
获取原始手机信令数据,并对所述原始手机信令数据进行筛选和过滤,以确定有效手机信令数据;
根据区域以及预设时序将所述有效手机信令数据进行划分,以确定所述待测区域的手机信令数据。
4.根据权利要求1所述的基于手机信令数据的复工趋势预测方法,其特征在于,所述将所述手机信令数据输入至所述复工预测模型进行训练,以预测待测区域复工趋势,包括:
将所述手机信令数据输入至所述复工预测模型进行训练,以预测所述待测区域的累计返岗率以及所述待测区域的返岗率;
根据所述累计返岗率以及所述返岗率,预测所述待测区域复工趋势。
5.根据权利要求4所述的基于手机信令数据的复工趋势预测方法,其特征在于,所述将所述手机信令数据输入至所述复工预测模型进行训练,以预测所述待测区域的累计返岗率以及所述待测区域的返岗率,包括:
将所述手机信令数据输入至所述复工预测模型进行训练,以预测所述待测区域的累计返岗人数以及所述待测区域的累计应到岗人数;
将所述累计返岗人数以及所述累计应到岗人数输入至所述复工预测模型进行训练,以预测所述累计返岗率;
将所述累计返岗率以及预设哑变量输入至所述复工预测模型进行训练,以预测所述返岗率。
6.根据权利要求5所述的基于手机信令数据的复工趋势预测方法,其特征在于,所述将所述手机信令数据输入至所述复工预测模型进行训练,以预测所述待测区域的累计返岗人数以及所述待测区域的累计应到岗人数,包括:
将所述返程数据输入至所述复工预测模型进行训练,以预测所述新增返程人数;
将所述新增返程人数、所述返程数据、预设隔离时间以及所述预设哑变量输入至所述复工预测模型进行训练,以预测所述累计返岗人数;
将所述新增返程人数输入至所述复工预测模型进行训练,以预测所述累计应到岗人数。
7.根据权利要求6所述的基于手机信令数据的复工趋势预测方法,其特征在于,所述预设隔离时间,包括:
固定隔离时间或可变隔离时间。
8.一种基于手机信令数据的复工趋势预测系统,其特征在于,包括:参数确定模块、模型确定模块以及预测模块;
所述参数确定模块,用于将待测区域的手机信令数据以及训练标签输入至预设预测模型进行迭代训练,以确定所述预设预测模型的待估计参数;
所述模型确定模块,用于根据所述待估计参数以及所述预设预测模型,确定复工预测模型;
所述预测模块,用于将所述手机信令数据输入至所述复工预测模型进行训练,以预测待测区域复工趋势;
其中,所述手机信令数据包括:如下历史数据:所述待测区域的返程数据、所述待测区域的返岗数据、所述待测区域的累计返岗数据以及所述待测区域的OD数据;
所述训练标签为与所述待测区域的手机信令数据中的数据同时刻获取的待测区域复工趋势的实际观测值。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述的基于手机信令数据的复工趋势预测方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的基于手机信令数据的复工趋势预测方法的步骤。
CN202011260416.9A 2020-11-12 2020-11-12 基于手机信令数据的复工趋势预测方法及系统 Active CN112561121B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011260416.9A CN112561121B (zh) 2020-11-12 2020-11-12 基于手机信令数据的复工趋势预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011260416.9A CN112561121B (zh) 2020-11-12 2020-11-12 基于手机信令数据的复工趋势预测方法及系统

Publications (2)

Publication Number Publication Date
CN112561121A true CN112561121A (zh) 2021-03-26
CN112561121B CN112561121B (zh) 2021-07-20

Family

ID=75043030

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011260416.9A Active CN112561121B (zh) 2020-11-12 2020-11-12 基于手机信令数据的复工趋势预测方法及系统

Country Status (1)

Country Link
CN (1) CN112561121B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113065724A (zh) * 2021-06-02 2021-07-02 北京大学 基于信令数据的人员流量预测方法、装置、设备及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107357764A (zh) * 2017-06-23 2017-11-17 联想(北京)有限公司 数据分析方法、电子设备及计算机存储介质
CN110166945A (zh) * 2019-06-04 2019-08-23 中国民用航空总局第二研究所 航站楼旅客流量动态预测方法、装置、介质及设备
CN111883262A (zh) * 2020-09-28 2020-11-03 平安科技(深圳)有限公司 疫情趋势预测方法、装置、电子设备及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107357764A (zh) * 2017-06-23 2017-11-17 联想(北京)有限公司 数据分析方法、电子设备及计算机存储介质
CN110166945A (zh) * 2019-06-04 2019-08-23 中国民用航空总局第二研究所 航站楼旅客流量动态预测方法、装置、介质及设备
CN111883262A (zh) * 2020-09-28 2020-11-03 平安科技(深圳)有限公司 疫情趋势预测方法、装置、电子设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘超彪: "基于手机信令数据的交通路况预测的研究与实现", 《中国优秀硕士学位论文全文数据库(电子期刊)》 *
聂磊等: "基于移动终端位置数据的企业线下复工水平测算方法研究", 《数据分析与知识发现》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113065724A (zh) * 2021-06-02 2021-07-02 北京大学 基于信令数据的人员流量预测方法、装置、设备及介质
CN113065724B (zh) * 2021-06-02 2021-08-27 北京大学 基于信令数据的人员流量预测方法、装置、设备及介质

Also Published As

Publication number Publication date
CN112561121B (zh) 2021-07-20

Similar Documents

Publication Publication Date Title
CN111128399B (zh) 一种基于人流密度的流行病疫情风险等级评估方法
Calabrese et al. Estimating Origin-Destination flows using opportunistically collected mobile phone location data from one million users in Boston Metropolitan Area
Yu et al. Urban network-wide traffic speed estimation with massive ride-sourcing GPS traces
Gao et al. Discovering spatial interaction communities from mobile phone d ata
CN109241846B (zh) 遥感影像的时空变化估测方法、装置与存储介质
Vajakas et al. Trajectory reconstruction from mobile positioning data using cell-to-cell travel time information
CN108733774B (zh) 一种基于大数据的失业人口动态监测方法
CN111080501A (zh) 基于手机信令数据的真实人群密度时空分布估算方法
CN109472075A (zh) 一种基站性能分析方法及系统
CN112418696A (zh) 城市交通动态知识图谱的构建方法及装置
CN114611941A (zh) 一种考虑空间危险性的滑坡灾害评价方法及系统
CN108345662B (zh) 一种考虑用户分布区域差异的签到微博数据加权统计方法
CN111479321B (zh) 一种网格构建方法、装置、电子设备和存储介质
CN111159583B (zh) 用户行为分析方法、装置、设备及存储介质
CN112561121B (zh) 基于手机信令数据的复工趋势预测方法及系统
Smolak et al. The impact of human mobility data scales and processing on movement predictability
US10444062B2 (en) Measuring and diagnosing noise in an urban environment
CN110262863B (zh) 一种终端主界面的展示方法和装置
CN117076922A (zh) 城际出行od需求量预测模型训练方法、预测方法及系统
Zhong et al. COVID-19 lockdown introduces human mobility pattern changes for both Guangdong-Hong Kong-Macao greater bay area and the San Francisco bay area
Shen et al. Real-time road traffic fusion and prediction with GPS and fixed-sensor data
CN109461303A (zh) 一种交通拥堵状态获取方法和装置
CN116227929B (zh) 通信数据的分析方法、装置、设备及存储介质
CN111242723B (zh) 用户子女情况判断方法、服务器及计算机可读存储介质
CN113408867B (zh) 基于手机用户和poi数据的城市入室盗窃犯罪风险评估方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant