CN111444302A - 基于用户分类的移动性预测方法、系统、装置 - Google Patents
基于用户分类的移动性预测方法、系统、装置 Download PDFInfo
- Publication number
- CN111444302A CN111444302A CN202010306631.1A CN202010306631A CN111444302A CN 111444302 A CN111444302 A CN 111444302A CN 202010306631 A CN202010306631 A CN 202010306631A CN 111444302 A CN111444302 A CN 111444302A
- Authority
- CN
- China
- Prior art keywords
- user
- sequence
- predicted
- classification
- probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2477—Temporal data queries
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Remote Sensing (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于无线通信、数据挖掘领域,具体涉及一种基于用户分类的移动性预测方法、系统、装置,旨在解决现有的用户移动性检测方法预测准确性较差、精度较低的问题。本系统方法包括:构建待预测用户的历史移动轨迹序列作为第一序列;基于第一序列,获取设定时间段内的移动轨迹序列,作为第二序列,并通过预设的用户类型分类规则获取用户类型;基于用户类型,获取最大步长k,构建1至k步的马尔科夫状态转移概率矩阵;基于各矩阵获取第二序列中各位置转移到下一位置的预测准确度,并计算各步马尔科夫模型的权重;通过加权马尔科夫模型计算到达各选定候选位置的概率,将概率最大的候选位置作为下一预测位置。本发明提高了预测的准确性和精度。
Description
技术领域
本发明属于无线通信、数据挖掘领域,具体涉及一种基于用户分类的移动性预测方法、系统、装置。
背景技术
在海量的移动通信数据中,蕴藏着大量有价值的信息,根据这些信息,服务提供商可以设计更好的运营方案,并改善移动用户的体验。例如,利用移动通信数据中蕴藏着用户的位置信息和业务偏好信息,可以建立用户在时间和空间上的移动行为模型,进而对用户的行为模式进行预测。有效的轨迹预测使服务提供商能够提前预测用户的需求,从而优化网络资源,并减少网络拥堵。用户则可以更快获得所需信息,获得更好的服务。
除此之外,用户的轨迹预测结果可以应用于各个领域,如在城市交通规划中进行拥堵趋势预警和交通规划,避免发生人群聚集和交通拥堵现象;在广告推送中通过对大量用户移动数据进行挖掘,根据用户兴趣偏好,建立用户人群画像,可应用于个性化广告推送服务,以减少广告服务的消费,并且使用户避免接收到大量的不相关信息;另外,用户移动行为在预防流行病传播、智慧旅游等领域也有重要的研究意义。
在位置预测方面,常用的模型方法有基于频繁模式的轨迹预测的模型、基于马尔可夫链的模型和基于神经网络的模型。其中,基于频繁模式的轨迹预测的模型是基于用户行程的规律性和周期性,挖掘用户的关键停留点和经典路线,进而实现位置预测,例如专利(201710336188.0),基于频繁模式的方法对轨迹进行预测,它改进并提出带有离群点容忍性的停留点挖掘算法,对轨迹中的停留点进行有效挖掘;基于马尔可夫链的模型是利用之前的一个或者多个状态对下一时刻的状态进行预测,相关方法包括个性化马尔可夫链的因式分解、分层表示模型等,在位置和轨迹预测中得到了广泛的应用,例如专利(201610141578.8),是一种典型的基于马尔科夫模型的位置预测方法,它主要将时间因素考虑在内,对不同时间段训练不同的模型,从而提高预测准确度;基于神经网络模型是通过挖掘用户轨迹序列间的上下文相关性,对用户的下一个位置进行预测,例如专利(201910426029.9),是一种基于神经网络技术的移动轨迹预测方法,它提取分析历史轨迹序列中包含的各历史轨迹点对应的特征值,并利用循环神经网络模型进行预测轨迹。
然而这些方法对所有的用户或设备都是采用同样的模型去预测,但由于用户行为的多样性,不同用户习惯将会导致不同的移动模式,这样基于全体用户数据并采用同一模型进行预测将会影响预测的准确度。为了解决这个问题,本发明提出了基于用户分类的移动性预测方法,通过提取用户的历史轨迹特征将用户进行分类,根据分类结果对不同类用户的数据分别建立预测模型,从而取得更高的预测精度。
发明内容
为了解决现有技术中的上述问题,即为了解决现有的用户移动性检测方法由于没有考虑不同用户的移动模式导致预测准确性较差、精度较低的问题,本发明第一方面,提出了一种基于用户分类的移动性预测方法,该方法包括:
步骤S100,基于待预测用户移动通信数据的XDR记录,构建历史移动轨迹序列,作为第一序列;
步骤S200,基于所述第一序列,获取设定时间段内的移动轨迹序列,作为第二序列;基于所述第二序列,通过预设的用户类型分类规则获取所述待预测用户的用户类型;
步骤S300,根据预设用户类型与最大步长的对应关系,获取所述待预测用户对应的最大步长k,并结合所述第二序列,分别构建1至k步的马尔科夫状态转移概率矩阵;
步骤S400,通过1至k步的马尔科夫状态转移概率矩阵获取所述第二序列中各位置转移到下一位置的预测准确度,并通过预设的权重系数计算方法计算各步马尔科夫模型的权重;
步骤S500,基于所述待预测用户的当前位置及之前的k-1个位置,结合各权重,通过加权马尔科夫模型计算到达各选定候选位置的概率,将概率最大的候选位置作为所述待预测用户的下一预测位置。
在一些优选的实施方式中,所述移动轨迹序列由用户访问基站的位置以及访问基站的时间点构成;其中,所述用户访问基站的位置的获取方法为:
S=Lac×10000+Cell_ID
其中,S为用户访问基站的位置,Lac为XDR记录中基站的位置区号,Cell_ID为XDR记录中基站小区的识别号。
在一些优选的实施方式中,步骤S200中“通过预设的用户类型分类规则获取所述待预测用户的用户类型”,其方法为:
基于所述第二序列,结合预设的分类统计指标,通过KNN分类器获取所述待预测用户对应的统计数据;
基于预设的用户类型与统计数据的对应关系,得到所述待预测用户的用户类型;
所述分类统计指标包括用户访问基站的总个数、第一设定时间段内访问基站的个数、第二设定时间段内的驻留时长;所述驻留时长为各个单次驻留的时长之和,单次驻留为连续在一个基站不跳转超过设定时长。
在一些优选的实施方式中,所述最大步长,其获取方法为:
k=max(i),(i≤Lth)&(pi≥Pth)
其中,k表示当前用户类型对应的最大步长,pi为预测准确度,Lth为设定的步长阈值,Pth为设定的概率阈值,i为自然数,表示步长。
在一些优选的实施方式中,步骤400中“通过预设的权重系数计算方法计算各步马尔科夫模型的权重”,其方法为:
其中,ωi为第i步马尔科夫模型的权重,pm为预测准确度,m为自然数,表示下标。
在一些优选的实施方式中,步骤S500中“通过加权马尔科夫模型计算到达各选定候选位置的概率”,其方法为:
其中,S1表示待预测用户的当前位置,Sn表示待预测用户的下一个选定候选位置,表示由当前位置到达下一个选定候选位置的概率,ωj表示权重,表示待预测用户从位置Sj经过j步转移到Sn的转移概率,j为自然数。
本发明的第二方面,提出了一种基于用户分类的移动性预测系统,该系统包括第一序列构建模块、用户类型获取模块、概率矩阵构建模块、权重计算模块、位置预测模块;
所述第一序列构建模块,配置为基于待预测用户移动通信数据的XDR记录,构建历史移动轨迹序列,作为第一序列;
所述用户类型获取模块,配置为基于所述第一序列,获取设定时间段内的移动轨迹序列,作为第二序列;基于所述第二序列,通过预设的用户类型分类规则获取所述待预测用户的用户类型;
所述概率矩阵构建模块,配置为根据预设用户类型与最大步长的对应关系,获取所述待预测用户对应的最大步长k,并结合所述第二序列,分别构建1至k步的马尔科夫状态转移概率矩阵;
所述权重计算模块,配置为通过1至k步的马尔科夫状态转移概率矩阵获取所述第二序列中各位置转移到下一位置的预测准确度,并通过预设的权重系数计算方法计算各步马尔科夫模型的权重;
所述位置预测模块,配置为基于所述待预测用户的当前位置及之前的k-1个位置,结合各权重,通过加权马尔科夫模型计算到达各选定候选位置的概率,将概率最大的候选位置作为所述待预测用户的下一预测位置。
本发明的第三方面,提出了一种存储装置,其中存储有多条程序,所述程序应用由处理器加载并执行以实现上述的基于用户分类的移动性预测方法。
本发明的第四方面,提出了一种处理装置,包括处理器、存储装置;处理器,适用于执行各条程序;存储装置,适用于存储多条程序;所述程序适用于由处理器加载并执行以实现上述的基于用户分类的移动性预测方法。
本发明的有益效果:
本发明提高了预测的准确性和精度。本发明通过对真实移动通信数据的分析,提取用户的位置和轨迹信息,并基于不同的行为模式(或移动模式)建立用户分类模型,利用机器学习的方法将用户分为四种类型。然后通过分析不同类型用户的特征,确定针对每类用户对应的马尔科夫状态转移概率矩阵的最大步长k,根据最大步长构建一至多阶的状态转移概矩阵,计算用户位置移动的预测准确度并确定不同阶马尔科夫模型的权重系数。根据用户的当前位置及之前k-1个位置,结合权重系数,采用加权马尔科夫模型分别对不同类的用户轨迹进行预测,从而提高了用户轨迹预测的整体准确率和精度。
附图说明
通过阅读参照以下附图所做的对非限制性实施例所做的详细描述,本申请的其他特征、目的和优点将会变得更明显。
图1是本发明一种实施例的基于用户分类的移动性预测方法的流程示意图;
图2是本发明一种实施例的基于用户分类的移动性预测系统的框架示意图;
图3是本发明一种实施例的基于用户分类的移动性预测方法的训练过程的流程示意图;
图4是本发明一种实施例的不同马尔科夫模型预测准确度对比的效果示意图;
图5是适于用来实现本发明实施例的电子设备的计算机系统的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
本发明的基于用户分类的移动性预测方法,如图1所示,包括以下步骤:
步骤S100,基于待预测用户移动通信数据的XDR记录,构建历史移动轨迹序列,作为第一序列;
步骤S200,基于所述第一序列,获取设定时间段内的移动轨迹序列,作为第二序列;基于所述第二序列,通过预设的用户类型分类规则获取所述待预测用户的用户类型;
步骤S300,根据预设用户类型与最大步长的对应关系,获取所述待预测用户对应的最大步长k,并结合所述第二序列,分别构建1至k步的马尔科夫状态转移概率矩阵;
步骤S400,通过1至k步的马尔科夫状态转移概率矩阵获取所述第二序列中各位置转移到下一位置的预测准确度,并通过预设的权重系数计算方法计算各步马尔科夫模型的权重;
步骤S500,基于所述待预测用户的当前位置及之前的k-1个位置,结合各权重,通过加权马尔科夫模型计算到达各选定候选位置的概率,将概率最大的候选位置作为所述待预测用户的下一预测位置。
为了更清晰地对本发明基于用户分类的移动性预测方法进行说明,下面结合附图对本发明方法一种实施例中各步骤进行展开详述。
步骤S100,基于待预测用户移动通信数据的XDR记录,构建历史移动轨迹序列,作为第一序列。
在本实施例中,通过深度报文检测(Deep Packet Inspection,DPI)获取待预测用户的移动通信数据的XDR记录。深度报文检测(Deep Packet Inspection,DPI)是LTE核心网的主流信令采集接口,通过对流量和报文内容进行检测,根据相关规则对流量进行过滤,DPI设备可以完成所在链路的业务流量分析、业务流量占比统计、业务识别等功能。由DPI采集系统收集到的数据称为外部数据记录(XDR:eXternal Data Recording),XDR记录主要包括移动用户标识、记录时间,位置区号(Lac),小区识别号(Cell-ID),业务类型,上下行流量等字段。
XDR记录中,每个基站的具体位置用位置区号Lac和小区识别号Cell-ID共同表示,将两字段合并,定义为S,用来表示用户接入(或访问)的基站位置,具体如公式(1)所示:
S=Lac×10000+Cell_ID (1)
多个不同时间接入的基站位置连接起来,就构建出了用户移动轨迹,表示如公式(2),描述了用户在多个位置间移动和停留情况,即:
Trajd={(S1,t1),(S2,t2),(S3,t3),…,(Si,ti),…,(Sn-1,tn-1),(Sn,tn)} (2)
其中,Trajd表示某用户第d天的轨迹,(Si,ti)表示轨迹中时间ti的停留点为Si,n为自然数,表示第d天获取的用户移动轨迹的数量。
步骤S200,基于所述第一序列,获取设定时间段内的移动轨迹序列,作为第二序列;基于所述第二序列,通过预设的用户类型分类规则获取所述待预测用户的用户类型。
在本实施例中,对用户进行轨迹预测前先对用户的历史移动轨迹进行划分,并根据用户的活动规律定义分类标准,制定相应的分类统计指标,统计用户对应的统计数据进行分类,如图3所示,图3其余步骤在下文中描述。本发明将用户分为4类,用户类型及其特征描述如表1所示:
表1
在其他实施例中,可以根据实际需要对用户的历史移动轨迹进行划分,并选取感兴趣的移动轨迹并对用户进行分类,以便于提高预测的准确度和精度。
本实施例中主要通过用户的基站使用个数和驻留时间来确定用户类型。基站使用个数,在一定程度上反映了用户的活动范围。比如:如果一个用户是规律上班族,那么他在工作时间应该在固定的地点办公,因此在工作时间使用的基站个数应该较少。因为不同用户的行为习惯不同,用户在不同时段的基站使用个数也不同。驻留时长的长短代表了用户移动性的强弱。驻留时长的计算方法为:连续在一个基站不跳转超过1小时记为一次驻留,驻留时长为各个单次驻留的时长之和。
在提取用户位置上下文信息时,本发明首先将轨迹记录按天划分,取工作日的记录;其次将一天24小时划分为早高峰(7:00-10:00)、工作时间(10:00-17:00)、晚高峰(17:00-21:00)、晚间活动时间(21:00-23:00)、夜间(23:00-7:00)5个时间段,提取每个时间段的基站使用个数和驻留时间,取每天每个时段的平均数作为该用户上下文特征的最终数值。如表2所示:
表2
根据上面的上下文特征统计,就可以给不同类的用户进行特征描述(即根据统计数据,获取用户类型)。表3给出了不同类型的用户分别对应的上下文特征描述。
表3
在本实施例中,使用scikit-learn工具包中的朴素贝叶斯、决策树和KNN作为机器学习分类器,并分别对各模型结果进行了精度(Precision)、召回率(Recall)和F1分数(F1-score)计算。实验结果如表4所示:
表4
从表4中的结果可以看出,基于KNN的分类模型具有极高的分类准确率,其整体准确率高达95%。因此,本发明优选采用KNN的分类模型对用户进行分类,在其他实施例中可以根据实际需要选取分类器。
步骤S300,根据预设用户类型与最大步长的对应关系,获取所述待预测用户对应的最大步长k,并结合所述第二序列,分别构建1至k步的马尔科夫状态转移概率矩阵。
在本实施例中,分析不同类型用户的特征,通过不同步长的马尔科夫模型进行预测。其中,马尔科夫模型对应的最大步长的确定方法为:
由用户历史轨迹序列(第二序列)建立1步马尔科夫状态转移概率矩阵P,并由P构建k步的转移概率矩阵P(2),...,P(k),如公式(3)所示:
P(k)=Pk (3)
用上面得到的k个转移概率矩阵P,P(2),...,P(k)分别对用户的下一位置进行预测,得到从前面的第i-1个位置,经过i步到达所有可能下一位置的预测准确度pi,1≤i≤k。例如,使用2步转移概率矩阵P(2)时,i=2,那么就用P(2)计算当前位置之前的那个位置经过2步到达下一位置的预测准确度p2。
其中,这里的下一位置为基于用户的历史移动轨迹序列(可以为第一序列,也可以为第二序列)选定的候选位置,在其他实施例中可以根据实际情况进行选取。
由于马尔科夫模型综合考虑了各历史位置的影响,因此最大步长k的确定决定了预测的准确度。k值太小,则忽略了某些过去位置的影响,失去加权意义。k值太大,有些较远的过去位置对当前位置的影响却很小,这就增加了计算的复杂度,造成浪费资源。
对于不同类型的用户,不同的历史位置对下一位置的影响程度不同,本发明定义了概率阈值Pth和步长阈值Lth来共同确定k值。概率阈值Pth用来滤除预测概率较低的高阶马尔科夫模型对位置预测的影响。随着k的增大,k步预测准确度逐渐减小。当k步预测准确度小于Pth时,则不再增加k。步长阈值Lth用于消除较高步长对预测的影响。在加权模型中,最多考虑Lth步,不再考虑更高的步长。用于实际加权模型中的最大步长i应小于等于步长阈值Lth,且i步的预测准确度pi大于等于概率阈值Pth。k取i的最大值。如公式(4)所示:
k=max(i),(i≤Lth)&(pi≥Pth) (4)
概率阈值Pth和步长阈值Lth的数值,可根据实际需要进行设定。
确定完不同类型用户对应的最大步长,在实际的运用过程中可以直接根据用户类型,获取最大步长k,构建1至k步的马尔科夫状态转移概率矩阵;通过各矩阵获取所述待预测用户从一个位置到达下一位置的预测准确度。
步骤S400,通过1至k步的马尔科夫状态转移概率矩阵获取所述第二序列中各位置转移到下一位置的预测准确度,并通过预设的权重系数计算方法计算各步马尔科夫模型的权重。
k确定以后,不同阶(步)马尔科夫模型的权重(即权重系数)由对应步长的预测准确度来确定。预测准确度越高,权重越大。权重的计算如公式(5)所示:
其中,ωi为第i步马尔科夫模型的权重,pm为预测准确度,i、m为自然数,表示下标。
步骤S500,基于所述待预测用户的当前位置及之前的k-1个位置,结合各权重,通过加权马尔科夫模型计算到达各选定候选位置的概率,将概率最大的候选位置作为所述待预测用户的下一预测位置。
其中,表示用户从位置Sj经过j步转移到Sn的转移概率。ω1,ω2,…,ωk为计算出的各步的权重。比较所有可能的Sn(同样这里的Sn是在用户历史移动轨迹序列中选定的候选位置)的概率概率最大值对应的Sn即为用户下一个预测位置。
另外,为了证明本发明方法的有效性,将本发明提出的基于不同用户类型的加权马尔可夫模型与传统加权马尔可夫模型、一阶马尔可夫、二阶马尔可夫预测模型的预测准确度(即准确率)进行对比,如图4所示。其中,传统加权马尔可夫模型(即图4中的传统加权模型)对所有用户不进行分类处理,均采用k值为4,权重系数按比例递减的方式进行预测。
从图4可以看出,本发明提出的用户分类加权模型的预测准确度最高,平均准确率达到了70.4%。其中,一阶马尔可夫模型的预测准确度最低,平均只有52.7%,说明在下一位置预测时,只考虑当前位置是不够的,还需要考虑用户的历史位置。传统加权模型准确率大于二阶马尔可夫预测模型,说明充分考虑过去的k个位置,对预测有利。传统加权模型准确率略低于本发明提出的用户分类加权模型,而且由于对全体用户均使用同一k值进行预测,浪费了运算资源。说明考虑到用户之间的行为差异,对预测性能的提升有利。
本发明第二实施例的一种基于用户分类的移动性预测系统,如图2所示,包括:第一序列构建模块100、用户类型获取模块200、概率矩阵构建模块300、权重计算模块400、位置预测模块500;
所述第一序列构建模块100,配置为基于待预测用户移动通信数据的XDR记录,构建历史移动轨迹序列,作为第一序列;
所述用户类型获取模块200,配置为基于所述第一序列,获取设定时间段内的移动轨迹序列,作为第二序列;基于所述第二序列,通过预设的用户类型分类规则获取所述待预测用户的用户类型;
所述概率矩阵构建模块300,配置为根据预设用户类型与最大步长的对应关系,获取所述待预测用户对应的最大步长k,并结合所述第二序列,分别构建1至k步的马尔科夫状态转移概率矩阵;
所述权重计算模块400,配置为通过1至k步的马尔科夫状态转移概率矩阵获取所述第二序列中各位置转移到下一位置的预测准确度,并通过预设的权重系数计算方法计算各步马尔科夫模型的权重;
所述位置预测模块500,配置为基于所述待预测用户的当前位置及之前的k-1个位置,结合各权重,通过加权马尔科夫模型计算到达各选定候选位置的概率,将概率最大的候选位置作为所述待预测用户的下一预测位置。
所述技术领域的技术人员可以清楚的了解到,为描述的方便和简洁,上述描述的系统的具体的工作过程及有关说明,可以参考前述方法实施例中的对应过程,在此不再赘述。
需要说明的是,上述实施例提供的基于用户分类的移动性预测系统,仅以上述各功能模块的划分进行举例说明,在实际应用中,可以根据需要而将上述功能分配由不同的功能模块来完成,即将本发明实施例中的模块或者步骤再分解或者组合,例如,上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块,以完成以上描述的全部或者部分功能。对于本发明实施例中涉及的模块、步骤的名称,仅仅是为了区分各个模块或者步骤,不视为对本发明的不当限定。
本发明第三实施例的一种存储装置,其中存储有多条程序,所述程序适用于由处理器加载并实现上述的基于用户分类的移动性预测方法。
本发明第四实施例的一种处理装置,包括处理器、存储装置;处理器,适于执行各条程序;存储装置,适于存储多条程序;所述程序适于由处理器加载并执行以实现上述的基于用户分类的移动性预测方法。
所述技术领域的技术人员可以清楚的了解到,为描述的方便和简洁,上述描述的存储装置、处理装置的具体工作过程及有关说明,可以参考前述方法实例中的对应过程,在此不再赘述。
下面参考图5,其示出了适于用来实现本申请方法、系统、装置实施例的服务器的计算机系统的结构示意图。图5示出的服务器仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图5所示,计算机系统包括中央处理单元(CPU,Central Processing Unit)501,其可以根据存储在只读存储器(ROM,Read Only Memory)502中的程序或者从存储部分508加载到随机访问存储器(RAM,Random Access Memory)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有系统操作所需的各种程序和数据。CPU 501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O,Input/Output)接口505也连接至总线504。
以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT,Cathode Ray Tube)、液晶显示器(LCD,Liquid Crystal Display)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN(局域网,Local AreaNetwork)卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。在该计算机程序被中央处理单元(CPU)501执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
术语“第一”、“第二”等是用于区别类似的对象,而不是用于描述或表示特定的顺序或先后次序。
术语“包括”或者任何其它类似用语旨在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备/装置不仅包括那些要素,而且还包括没有明确列出的其它要素,或者还包括这些过程、方法、物品或者设备/装置所固有的要素。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征作出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
Claims (9)
1.一种基于用户分类的移动性预测方法,其特征在于,该方法包括:
步骤S100,基于待预测用户移动通信数据的XDR记录,构建历史移动轨迹序列,作为第一序列;
步骤S200,基于所述第一序列,获取设定时间段内的移动轨迹序列,作为第二序列;基于所述第二序列,通过预设的用户类型分类规则获取所述待预测用户的用户类型;
步骤S300,根据预设用户类型与最大步长的对应关系,获取所述待预测用户对应的最大步长k,并结合所述第二序列,分别构建1至k步的马尔科夫状态转移概率矩阵;
步骤S400,通过1至k步的马尔科夫状态转移概率矩阵获取所述第二序列中各位置转移到下一位置的预测准确度,并通过预设的权重系数计算方法计算各步马尔科夫模型的权重;
步骤S500,基于所述待预测用户的当前位置及之前的k-1个位置,结合各权重,通过加权马尔科夫模型计算到达各选定候选位置的概率,将概率最大的候选位置作为所述待预测用户的下一预测位置。
2.根据权利要求1所述的基于用户分类的移动性预测方法,其特征在于,所述移动轨迹序列由用户访问基站的位置以及访问基站的时间点构成;其中,所述用户访问基站的位置的获取方法为:
S=Lac×10000+Cell_ID
其中,S为用户访问基站的位置,Lac为XDR记录中基站的位置区号,Cell_ID为XDR记录中基站小区的识别号。
3.根据权利要求2所述的基于用户分类的移动性预测方法,其特征在于,步骤S200中“通过预设的用户类型分类规则获取所述待预测用户的用户类型”,其方法为:
基于所述第二序列,结合预设的分类统计指标,通过KNN分类器获取所述待预测用户对应的统计数据;
基于预设的用户类型与统计数据的对应关系,得到所述待预测用户的用户类型;
所述分类统计指标包括用户访问基站的总个数、第一设定时间段内访问基站的个数、第二设定时间段内的驻留时长;所述驻留时长为各个单次驻留的时长之和,单次驻留为连续在一个基站不跳转超过设定时长。
4.根据权利要求3所述的基于用户分类的移动性预测方法,其特征在于,所述最大步长,其获取方法为:
k=max(i),(i≤Lth)&(pi≥Pth)
其中,k表示当前用户类型对应的最大步长,pi为预测准确度,Lth为设定的步长阈值,Pth为设定的概率阈值,i为自然数,表示步长。
7.一种基于用户分类的移动性预测系统,其特征在于,该系统包括:第一序列构建模块、用户类型获取模块、概率矩阵构建模块、权重计算模块、位置预测模块;
所述第一序列构建模块,配置为基于待预测用户移动通信数据的XDR记录,构建历史移动轨迹序列,作为第一序列;
所述用户类型获取模块,配置为基于所述第一序列,获取设定时间段内的移动轨迹序列,作为第二序列;基于所述第二序列,通过预设的用户类型分类规则获取所述待预测用户的用户类型;
所述概率矩阵构建模块,配置为根据预设用户类型与最大步长的对应关系,获取所述待预测用户对应的最大步长k,并结合所述第二序列,分别构建1至k步的马尔科夫状态转移概率矩阵;
所述权重计算模块,配置为通过1至k步的马尔科夫状态转移概率矩阵获取所述第二序列中各位置转移到下一位置的预测准确度,并通过预设的权重系数计算方法计算各步马尔科夫模型的权重;
所述位置预测模块,配置为基于所述待预测用户的当前位置及之前的k-1个位置,结合各权重,通过加权马尔科夫模型计算到达各选定候选位置的概率,将概率最大的候选位置作为所述待预测用户的下一预测位置。
8.一种存储装置,其中存储有多条程序,其特征在于,所述程序应用由处理器加载并执行以实现权利要求1-6任一项所述的基于用户分类的移动性预测方法。
9.一种处理装置,包括处理器、存储装置;处理器,适用于执行各条程序;存储装置,适用于存储多条程序;其特征在于,所述程序适用于由处理器加载并执行以实现权利要求1-6任一项所述的基于用户分类的移动性预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010306631.1A CN111444302B (zh) | 2020-04-17 | 2020-04-17 | 基于用户分类的移动性预测方法、系统、装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010306631.1A CN111444302B (zh) | 2020-04-17 | 2020-04-17 | 基于用户分类的移动性预测方法、系统、装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111444302A true CN111444302A (zh) | 2020-07-24 |
CN111444302B CN111444302B (zh) | 2020-12-18 |
Family
ID=71650203
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010306631.1A Active CN111444302B (zh) | 2020-04-17 | 2020-04-17 | 基于用户分类的移动性预测方法、系统、装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111444302B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111915104A (zh) * | 2020-08-28 | 2020-11-10 | 山东省国土测绘院 | 一种预测出行位置的方法及装置 |
CN112508295A (zh) * | 2020-12-16 | 2021-03-16 | 国家电网有限公司客户服务中心 | 基于业务图谱和马尔可夫模型的来电业务预测方法及系统 |
CN113312531A (zh) * | 2021-04-22 | 2021-08-27 | 广州丰石科技有限公司 | 一种基于dpi解析与决策树模型的用户画像识别方法 |
CN116933608A (zh) * | 2023-09-15 | 2023-10-24 | 深圳市正和兴电子有限公司 | 一种存储类芯片的管理方法、系统及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101547445A (zh) * | 2008-03-25 | 2009-09-30 | 上海摩波彼克半导体有限公司 | 移动通信网络中基于移动性进行入侵异常检测的系统和方法 |
CN103413443A (zh) * | 2013-07-03 | 2013-11-27 | 太原理工大学 | 基于隐马尔科夫模型的短时交通流状态预测方法 |
CN104838708A (zh) * | 2012-12-14 | 2015-08-12 | 华为技术有限公司 | 用于用户设备移动性预测的系统和方法 |
CN106055661A (zh) * | 2016-06-02 | 2016-10-26 | 福州大学 | 基于多Markov链模型的多兴趣资源推荐方法 |
CN109409612A (zh) * | 2018-11-12 | 2019-03-01 | 平安科技(深圳)有限公司 | 一种路径规划方法、服务器及计算机存储介质 |
CN110097121A (zh) * | 2019-04-30 | 2019-08-06 | 北京百度网讯科技有限公司 | 一种行驶轨迹的分类方法、装置、电子设备及存储介质 |
EP3614308A1 (en) * | 2018-08-24 | 2020-02-26 | Ordnance Survey Limited | Joint deep learning for land cover and land use classification |
-
2020
- 2020-04-17 CN CN202010306631.1A patent/CN111444302B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101547445A (zh) * | 2008-03-25 | 2009-09-30 | 上海摩波彼克半导体有限公司 | 移动通信网络中基于移动性进行入侵异常检测的系统和方法 |
CN104838708A (zh) * | 2012-12-14 | 2015-08-12 | 华为技术有限公司 | 用于用户设备移动性预测的系统和方法 |
CN103413443A (zh) * | 2013-07-03 | 2013-11-27 | 太原理工大学 | 基于隐马尔科夫模型的短时交通流状态预测方法 |
CN106055661A (zh) * | 2016-06-02 | 2016-10-26 | 福州大学 | 基于多Markov链模型的多兴趣资源推荐方法 |
EP3614308A1 (en) * | 2018-08-24 | 2020-02-26 | Ordnance Survey Limited | Joint deep learning for land cover and land use classification |
CN109409612A (zh) * | 2018-11-12 | 2019-03-01 | 平安科技(深圳)有限公司 | 一种路径规划方法、服务器及计算机存储介质 |
CN110097121A (zh) * | 2019-04-30 | 2019-08-06 | 北京百度网讯科技有限公司 | 一种行驶轨迹的分类方法、装置、电子设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
陈子军等: "基于动态分类的Markov用户浏览预测模型 ", 《计算机工程》 * |
陈铁军等: "用户浏览页面预测的多阶HMM模型融合 ", 《微电子学与计算机》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111915104A (zh) * | 2020-08-28 | 2020-11-10 | 山东省国土测绘院 | 一种预测出行位置的方法及装置 |
CN112508295A (zh) * | 2020-12-16 | 2021-03-16 | 国家电网有限公司客户服务中心 | 基于业务图谱和马尔可夫模型的来电业务预测方法及系统 |
CN113312531A (zh) * | 2021-04-22 | 2021-08-27 | 广州丰石科技有限公司 | 一种基于dpi解析与决策树模型的用户画像识别方法 |
CN116933608A (zh) * | 2023-09-15 | 2023-10-24 | 深圳市正和兴电子有限公司 | 一种存储类芯片的管理方法、系统及存储介质 |
CN116933608B (zh) * | 2023-09-15 | 2023-12-22 | 深圳市正和兴电子有限公司 | 一种存储类芯片的管理方法、系统及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111444302B (zh) | 2020-12-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111444302B (zh) | 基于用户分类的移动性预测方法、系统、装置 | |
Tekouabou et al. | Improving parking availability prediction in smart cities with IoT and ensemble-based model | |
CN110210604B (zh) | 一种终端设备移动轨迹预测方法及装置 | |
CN110910659B (zh) | 一种交通流量预测方法、装置、设备以及存储介质 | |
WO2018207878A1 (ja) | 需要予測装置 | |
CN109376906B (zh) | 基于多维度轨迹的出行时间预测方法、系统及电子设备 | |
CN112949784B (zh) | 一种居民出行链模型构建方法及居民出行链获取方法 | |
WO2023207411A1 (zh) | 一种基于时空数据的流量确定方法、装置、设备和介质 | |
CN108182240B (zh) | 兴趣点新增率预测模型训练及预测方法、装置及存储介质 | |
CN110598917B (zh) | 一种基于路径轨迹的目的地预测方法、系统及存储介质 | |
CN111815098A (zh) | 基于极端天气的交通信息处理方法、装置、存储介质和电子设备 | |
Ma et al. | Public transportation big data mining and analysis | |
CN116684330A (zh) | 基于人工智能的流量预测方法、装置、设备及存储介质 | |
CN113672643B (zh) | 一种业务数字化的分析方法、装置、存储介质及终端 | |
Zhao et al. | Highway traffic crash risk prediction method considering temporal correlation characteristics | |
CN113837383A (zh) | 模型训练方法、装置、电子设备及存储介质 | |
Liao et al. | Location prediction through activity purpose: integrating temporal and sequential models | |
Dao et al. | Insights for urban road safety: A new fusion-3dcnn-pfp model to anticipate future congestion from urban sensing data | |
EP1221666A1 (en) | Method of evaluating behaviour | |
Yuan et al. | A novel learning approach for citywide crowd flow prediction | |
Elnekave et al. | Predicting future locations using clusters' centroids | |
JP6777592B2 (ja) | データ数決定装置、データ数決定方法及びデータ数決定プログラム | |
CN111506510B (zh) | 一种软件质量确定方法和相关装置 | |
Wang et al. | A Real-Time Driving Destination Prediction Model Based on Historical Travel Patterns and Current Driving Status | |
JP6849542B2 (ja) | クラス決定装置、クラス決定方法及びクラス決定プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |