CN111125551B - 一种基于选择记忆的马尔可夫模型的用户位置预测方法 - Google Patents

一种基于选择记忆的马尔可夫模型的用户位置预测方法 Download PDF

Info

Publication number
CN111125551B
CN111125551B CN201911097403.1A CN201911097403A CN111125551B CN 111125551 B CN111125551 B CN 111125551B CN 201911097403 A CN201911097403 A CN 201911097403A CN 111125551 B CN111125551 B CN 111125551B
Authority
CN
China
Prior art keywords
user
time
information
model
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911097403.1A
Other languages
English (en)
Other versions
CN111125551A (zh
Inventor
颜成钢
李文超
孙垚棋
张继勇
张勇东
沈韬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN201911097403.1A priority Critical patent/CN111125551B/zh
Publication of CN111125551A publication Critical patent/CN111125551A/zh
Application granted granted Critical
Publication of CN111125551B publication Critical patent/CN111125551B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Human Resources & Organizations (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • Evolutionary Biology (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Health & Medical Sciences (AREA)
  • Algebra (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于选择记忆的马尔可夫模型的用户位置预测方法。本发明基于传统马尔可夫模型,汲取循环神经网络模型的思想,在保留马尔可夫模型优点的前提下,增加选择记忆单元,解决马尔可夫模型本身的缺陷,即假设未来状态只与当前状态相关,与其他历史状态相互独立。本发明方法保留了传统马尔可夫模型运算简单,速度快的优势的基础上,通过选择记忆单元大幅度提升了预测的精度,在速度远快于RNN预测模型的前提下,可以取的与一般RNN预测模型近似的预测精度。

Description

一种基于选择记忆的马尔可夫模型的用户位置预测方法
技术领域
本发明针对位置预测方法,具体涉及一种基于选择记忆的马尔可夫模型的用户位置预测方法。
背景技术
近年来随着移动终端的普及,基于位置的社交网络(如四方、新浪、微信、脸谱、推特等)得到了空前的发展,用户的打卡行为逐渐成为一种潮流,甚至是一种习惯。用户位置预测算法在基于位置的各类应用中蕴藏了巨大的可供挖掘的价值。比如,对于当下城市中流行的商业综合体,其运维管体系统可以根据用户当前的位置信息以及其历史打卡的位置信息推测其心怡的下一位置,基于该推测结果做出更精准的娱乐消费场所的推荐,从而可以大大提升成功推荐的概率。这不仅提高了当下的商业收益,而且提升了用户对该商业体的满意度,为商业体的长期繁荣发展奠定了基础。对于政府而言,交通管理部门可以根据用户位置流动状况,推测交通分布变化状况,提前做好干预引导工作,从而可以减轻交通阻塞问题,确保交通体系安全流畅的运行。
现有的用户位置预测算法既有基于传统马尔可夫模型的预测方法也有基于当前被广泛关注的循环神经网络(RNN)模型的方法。以上两类方法均有较为明显的优点与缺点,前者运算速度快,运算成本低,但是其精度相对较低,后者的预测精度更高,但是其算力消耗大,对于训练数据的需求量大。
发明内容
针对现有技术中存在的问题,本发明提供一种基于选择记忆的马尔可夫模型的用户位置预测方法。
本发明基于传统马尔可夫模型,汲取循环神经网络模型的思想,在保留马尔可夫模型优点的前提下,增加选择记忆单元,解决马尔可夫模型本身的缺陷,即假设未来状态只与当前状态相关,与其他历史状态相互独立。
一种基于选择记忆的马尔可夫模型的用户位置预测方法,步骤如下:
步骤(1)、确定用户位置预测的基本数学模型:
社交媒体中的用户信息基本包含了用户身份信息U,用户位置信息L,打卡的时间信息T,社交关系信息E。用户身份信息U=(u1,u2,u3,…,un),由社交媒体平台的用户ID信息组成,用户位置信息
Figure BDA0002268755400000021
其中
Figure BDA0002268755400000022
l=(lon,lat),lon表示用户位置的经度坐标信息,lat表示用户位置的纬度坐标信息。打卡时间信息
Figure BDA0002268755400000023
其中ti表示打卡的时间戳。
用户位置预测即通过用户的当前位置信息及历史位置信息预测用户下一步的位置,计算公式如下式所示:
Figure BDA0002268755400000024
上式中i=1,2,3…n,M为需要求解的预测模型。
设置固定的时间变化,仅考虑位置的变迁,则用户位置预测方法的公式可简化为:
Figure BDA0002268755400000025
步骤(2)、确定基本的马尔可夫预测模型的数学模型
有限状态空间上的马尔可夫链是指在可数状态集S上的离散随机过程,且满足马尔可夫特性(无记忆特性);
Figure BDA0002268755400000026
式中,in,in-1,…,i0∈s,n∈N。
引入转移概率pij(n),公式如下;
pij(n)=P(X(n+1)=j|X(n)=i),i,j∈S (4)
考虑时间同质马尔可夫链,将转移概率简化为pij,不再依赖时间索引n∈N;
pij=P(X(n+1)=j|X(n)=i),i,j∈S (5)
记P为状态转移矩阵,
Figure BDA0002268755400000031
状态转移矩阵P满足以下性质,
Figure BDA0002268755400000032
步骤3构建选择记忆单元的数学模型:
在用户位置预测中,用户访问的位置点定义为状态,通过社交媒体上的历史记录数据可以求取相应的状态转移矩阵。
马尔可夫特性简化了计算,但丢失了大量有用信息,本发明引入了选择记忆功能,定义记忆单元转换矩阵为:
H=(H2,H3,…,Hh) (8)
式中,h表示最长记忆时间距离。
Figure BDA0002268755400000033
在实际的用户位置变迁过程中,下一步的可能目的地不仅与当前位置有关,还受到过去到达过的位置的影响,同时吸取马尔可夫特性简化计算的优势,对于前k步的记忆,忽略k+1步影响,定义记忆单元中:
Figure BDA0002268755400000041
步骤(4)、构建选择记忆的马尔可夫模型M:
M=[P,H2,H3,…,Hh]W (11)
式中,W∈Rh×1表示选择记忆权重向量,人类越临近的行为对未来行为影响作用越大,基于该人类行为的基本规律,对于选择记忆权重向量W中各个元素wk的取值原则为,k(定义当前步k=1)值越小,则相应的权重值wk越大。为降低运算复杂度,将W定义为One-hot向量,公式如下:
Figure BDA0002268755400000042
步骤(5)、预处理真实的原生用户打卡数据。
原生用户打卡数据稀疏性较强,在不影响模型预测精度的情况下,为提升计算效率,将用户中打卡总数少于阈值θ1的用户剔除,将被打卡地点中打卡次数少于阈值θ2的地点剔除。根据用户打卡行为的统计规律,将每连续Γ时长内的打卡行为记录划分为一个时间窗口,考虑到打卡数据本身潜在的周期性与序列性,确定了用户时间窗口数阈值θ3和单个时间窗口内打卡次数阈值θ4,将用户时间窗口总数少于阈值θ3的用户剔除,将单个时间窗口内打卡次数小于阈值θ4的窗口剔除。
步骤(6)、训练选择记忆的马尔可夫模型
将预处理后的数据输入提出的选择记忆的马尔可夫模型M,模型训练的程序通过python语言编写。最后通过训练后的选择记忆的马尔可夫模型M进行用户位置预测。
本发明有益结果如下:
1、随着5G技术的入市,基于位置的社交网络将迎来一轮迅猛的发展,因此对于高质量位置预测算法的需求会进一步提升。因此该专利中的算法的出现将为5G技术的推广普及奠定坚实的基础。
2、选择记忆的马尔可夫模型保留了传统马尔可夫模型运算简单,速度快的优势的基础上,通过选择记忆单元大幅度提升了预测的精度,在速度远快于RNN预测模型的前提下,可以取的与一般RNN预测模型近似的预测精度。
附图说明
图1为本发明方法整体流程图;
图2为本发明方法预测模型训练流程图;
图3为本发明方法在纽约与东京两地的数据集上三种预测模型的预测精度直方图。
具体实施方式
以下结合附图对本发明方法进行进一步描述。
如图1所示,本发明的用户位置预测方法,步骤如下:
步骤(1)、确定用户位置预测的基本数学模型:
社交媒体中的用户信息基本包含了用户身份信息U,用户位置信息L,打卡的时间信息T,社交关系信息E。用户身份信息U=(u1,u2,u3,…,un),由社交媒体平台的用户ID信息组成,用户位置信息
Figure BDA0002268755400000051
其中
Figure BDA0002268755400000052
l=(lon,lat),lon表示用户位置的经度坐标信息,lat表示用户位置的纬度坐标信息。打卡时间信息
Figure BDA0002268755400000053
其中ti表示打卡的时间戳。
用户位置预测即通过用户的当前位置信息及历史位置信息预测用户下一步的位置,计算公式如下式所示:
Figure BDA0002268755400000054
上式中i=1,2,3…n,M为需要求解的预测模型。
设置固定的时间变化,仅考虑位置的变迁,则用户位置预测方法的公式可简化为:
Figure BDA0002268755400000061
步骤(2)、确定基本的马尔可夫预测模型的数学模型
有限状态空间上的马尔可夫链是指在可数状态集S上的离散随机过程,且满足马尔可夫特性(无记忆特性);
Figure BDA0002268755400000064
式中,in,in-1,…,i0∈s,n∈N。
引入转移概率pij(n),公式如下;
pij(n)=P(X(n+1)=j|X(n)=i),i,j∈S (4)
考虑时间同质马尔可夫链,将转移概率简化为pij,不再依赖时间索引n∈N;
pij=P(X(n+1)=j|X(n)=i),i,j∈S (5)
记P为状态转移矩阵,
Figure BDA0002268755400000062
状态转移矩阵P满足以下性质,
Figure BDA0002268755400000063
步骤3构建选择记忆单元的数学模型:
在用户位置预测中,用户访问的位置点定义为状态,通过社交媒体上的历史记录数据可以求取相应的状态转移矩阵。
马尔可夫特性简化了计算,但丢失了大量有用信息,本发明引入了选择记忆功能,定义记忆单元转换矩阵为:
H=(H2,H3,…,Hh) (8)
式中,h表示最长记忆时间距离。
Figure BDA0002268755400000071
在实际的用户位置变迁过程中,下一步的可能目的地不仅与当前位置有关,还受到过去到达过的位置的影响,同时吸取马尔可夫特性简化计算的优势,对于前k步的记忆,忽略k+1步影响,定义记忆单元中:
Figure BDA0002268755400000072
步骤(4)、构建选择记忆的马尔可夫模型M:
M=[P,H2,H3,…,Hh]W (11)
式中,W∈Rh×1表示选择记忆权重向量,人类越临近的行为对未来行为影响作用越大,基于该人类行为的基本规律,对于选择记忆权重向量W中各个元素wk的取值原则为,k(定义当前步k=1)值越小,则相应的权重值wk越大。为降低运算复杂度,将W定义为One-hot向量,公式如下:
Figure BDA0002268755400000073
步骤(5)、预处理真实的原生用户打卡数据。
原生用户打卡数据稀疏性较强,在不影响模型预测精度的情况下,为提升计算效率,将用户中打卡总数少于阈值θ1的用户剔除,将被打卡地点中打卡次数少于阈值θ2的地点剔除。根据用户打卡行为的统计规律,将每连续Γ时长内的打卡行为记录划分为一个时间窗口,考虑到打卡数据本身潜在的周期性与序列性,确定了用户时间窗口数阈值θ3和单个时间窗口内打卡次数阈值θ4,将用户时间窗口总数少于阈值θ3的用户剔除,将单个时间窗口内打卡次数小于阈值θ4的窗口剔除。
步骤(6)、训练选择记忆的马尔可夫模型
如图2所示,将预处理后的数据输入提出的选择记忆的马尔可夫模型M,模型训练的程序通过python语言编写。最后通过训练后的选择记忆的马尔可夫模型M进行用户位置预测。
步骤(7)、验证选择记忆的马尔可夫模型的性能
与传统马尔可夫预测模型、RNN模型的预测结果对比
图3为本发明方法在纽约与东京两地的数据集上三种预测模型的预测精度直方图。

Claims (1)

1.一种基于选择记忆的马尔可夫模型的用户位置预测方法,其特征在于,具体步骤如下:
步骤(1)、确定用户位置预测的基本数学模型:
社交媒体中的用户信息基本包含了用户身份信息U,用户位置信息L,打卡的时间信息T,社交关系信息E;用户身份信息U=(u1,u2,u3,…,ux),由社交媒体平台的用户ID信息组成,用户位置信息
Figure FDA0002884008100000011
其中
Figure FDA0002884008100000012
l=(lon,lat),lon表示用户位置的经度坐标信息,lat表示用户位置的纬度坐标信息;打卡时间信息
Figure FDA0002884008100000013
其中t表示打卡的时间戳;
用户位置预测即通过用户的当前位置信息及历史位置信息预测用户下一步的位置,计算公式如下式所示:
Figure FDA0002884008100000014
上式中v=1,2,3…x',M为需要求解的预测模型;
设置固定的时间变化,仅考虑位置的变迁,则用户位置预测方法的公式可简化为:
Figure FDA0002884008100000015
步骤(2)、确定基本的马尔可夫预测模型的数学模型
有限状态空间上的马尔可夫链是指在可数状态集S上的离散随机过程,且满足马尔可夫特性,即无记忆特性;
Figure FDA0002884008100000016
式中,in,in-1,…,i0∈S,n∈N;
引入转移概率pij(n),公式如下;
pij(n)=P(X(n+1)=j|X(n)=i),i,j∈S (4)
考虑时间同质马尔可夫链,将转移概率简化为pij,不再依赖时间索引n∈N;
pij=P(X(n+1)=j|X(n)=i),i,j∈S (5)
记P为状态转移矩阵,
Figure FDA0002884008100000021
状态转移矩阵P满足以下性质,
Figure FDA0002884008100000022
步骤(3)、构建选择记忆单元的数学模型:
在用户位置预测中,用户访问的位置点定义为状态,通过社交媒体上的历史记录数据可以求取相应的状态转移矩阵;
马尔可夫特性简化了计算,但丢失了大量有用信息,本发明引入了选择记忆功能,定义记忆单元转换矩阵为:
H=(H2,H3,…,Hh) (8)
式中,h表示最长记忆时间距离;
Figure FDA0002884008100000023
在实际的用户位置变迁过程中,下一步的可能目的地不仅与当前位置有关,还受到过去到达过的位置的影响,同时吸取马尔可夫特性简化计算的优势,对于前k步的记忆,忽略k+1步影响,定义记忆单元中:
Figure FDA0002884008100000031
步骤(4)、构建选择记忆的马尔可夫模型M:
M=[P,H2,H3,…,Hh]W (11)
式中,W∈Rh×1表示选择记忆权重向量,人类越临近的行为对未来行为影响作用越大,基于该人类行为的基本规律,对于选择记忆权重向量W中各个元素wk的取值原则为,k值越小,则相应的权重值wk越大,定义当前步k=1;为降低运算复杂度,将W定义为One-hot向量,公式如下:
Figure FDA0002884008100000032
步骤(5)、预处理真实的原生用户打卡数据;
原生用户打卡数据稀疏性较强,在不影响模型预测精度的情况下,为提升计算效率,将用户中打卡总数少于阈值θ1的用户剔除,将被打卡地点中打卡次数少于阈值θ2的地点剔除;根据用户打卡行为的统计规律,将每连续Γ时长内的打卡行为记录划分为一个时间窗口,考虑到打卡数据本身潜在的周期性与序列性,确定了用户时间窗口数阈值θ3和单个时间窗口内打卡次数阈值θ4,将用户时间窗口总数少于阈值θ3的用户剔除,将单个时间窗口内打卡次数小于阈值θ4的窗口剔除;
步骤(6)、训练选择记忆的马尔可夫模型
将预处理后的数据输入提出的选择记忆的马尔可夫模型M,模型训练的程序通过python语言编写;最后通过训练后的选择记忆的马尔可夫模型M进行用户位置预测。
CN201911097403.1A 2019-11-12 2019-11-12 一种基于选择记忆的马尔可夫模型的用户位置预测方法 Active CN111125551B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911097403.1A CN111125551B (zh) 2019-11-12 2019-11-12 一种基于选择记忆的马尔可夫模型的用户位置预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911097403.1A CN111125551B (zh) 2019-11-12 2019-11-12 一种基于选择记忆的马尔可夫模型的用户位置预测方法

Publications (2)

Publication Number Publication Date
CN111125551A CN111125551A (zh) 2020-05-08
CN111125551B true CN111125551B (zh) 2021-04-06

Family

ID=70495208

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911097403.1A Active CN111125551B (zh) 2019-11-12 2019-11-12 一种基于选择记忆的马尔可夫模型的用户位置预测方法

Country Status (1)

Country Link
CN (1) CN111125551B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111667106B (zh) * 2020-05-29 2023-07-14 苏州唯智互动传媒有限公司 一种基于社交网络的用户数据预测方法
CN111915104A (zh) * 2020-08-28 2020-11-10 山东省国土测绘院 一种预测出行位置的方法及装置
CN112183755A (zh) * 2020-10-21 2021-01-05 中国核动力研究设计院 一种应用于复杂系统的马尔可夫模型构建简化方法及系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6276722B2 (ja) * 2015-02-17 2018-02-07 日本電信電話株式会社 行動予測装置、行動予測方法及び行動予測プログラム
CN105512727B (zh) * 2015-11-27 2018-02-13 浙江理工大学 一种基于Markov的个人路径预测方法
CN107018493B (zh) * 2017-04-20 2020-03-27 北京工业大学 一种基于连续时序马尔科夫模型的地理位置预测方法
CN108650614B (zh) * 2018-03-19 2020-07-28 复旦大学 一种自动推断社会关系的移动用户位置预测方法与装置

Also Published As

Publication number Publication date
CN111125551A (zh) 2020-05-08

Similar Documents

Publication Publication Date Title
CN111125551B (zh) 一种基于选择记忆的马尔可夫模型的用户位置预测方法
CN110598206B (zh) 文本语义识别方法、装置、计算机设备和存储介质
CN109947029B (zh) 智能家居设备的控制方法、装置及设备
CN111382361B (zh) 信息推送方法、装置、存储介质和计算机设备
CN108764460A (zh) 一种基于时间卷积和lstm的时间序列预测方法
CN110543543A (zh) 一种基于多粒度神经网络的用户移动行为预测方法及装置
CN108510280A (zh) 一种基于移动设备行为数据的金融欺诈行为预测方法
CN113852432B (zh) 基于rcs-gru模型的频谱预测感知方法
CN110648014A (zh) 一种基于时空分位数回归的区域风电预测方法及系统
CN111259738A (zh) 人脸识别模型构建方法、人脸识别方法及相关装置
CN111352965A (zh) 序列挖掘模型的训练方法、序列数据的处理方法及设备
WO2023207411A1 (zh) 一种基于时空数据的流量确定方法、装置、设备和介质
CN110689359A (zh) 对模型进行动态更新的方法及装置
CN111191722A (zh) 通过计算机训练预测模型的方法及装置
CN115730125A (zh) 对象识别方法、装置、计算机设备和存储介质
CN110944295B (zh) 位置预测方法、装置、存储介质及终端
CN112200665A (zh) 一种授信额度的确定方法及装置
CN112905787A (zh) 文本信息处理方法、短信处理方法、电子设备及可读介质
CN115762147A (zh) 一种基于自适应图注意神经网络的交通流量预测方法
CN115953245A (zh) 基于序列到图的股票趋势预测方法和装置
US20210312265A1 (en) Response Generation using Memory Augmented Deep Neural Networks
CN112529637B (zh) 基于情景感知的服务需求动态预测方法及系统
Jaiswal et al. A Comparative Analysis on Stock Price Prediction Model using DEEP LEARNING Technology
CN113688204A (zh) 一种利用相似场景及混合注意力的多人会话情感预测方法
CN113822291A (zh) 一种图像处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant