CN109685109B - 一种基于孪生神经网络的基站标号轨迹分类方法 - Google Patents

一种基于孪生神经网络的基站标号轨迹分类方法 Download PDF

Info

Publication number
CN109685109B
CN109685109B CN201811414586.0A CN201811414586A CN109685109B CN 109685109 B CN109685109 B CN 109685109B CN 201811414586 A CN201811414586 A CN 201811414586A CN 109685109 B CN109685109 B CN 109685109B
Authority
CN
China
Prior art keywords
base station
station label
track
label
label track
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811414586.0A
Other languages
English (en)
Other versions
CN109685109A (zh
Inventor
吕明琪
曾大建
张�浩
陈铁明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201811414586.0A priority Critical patent/CN109685109B/zh
Publication of CN109685109A publication Critical patent/CN109685109A/zh
Application granted granted Critical
Publication of CN109685109B publication Critical patent/CN109685109B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

一种基于孪生神经网络的基站标号轨迹分类方法,包括如下步骤:(1)对智能手机所连接基站的标号发生切换时进行数据采集,形成历史基站标号轨迹数据集;(2)基于word2vec算法将离散的基站标号转化为具有语义的向量;(3)基于孪生神经网络训练基站标号轨迹相似度模型,用以估计任意两条基站标号轨迹的相似度;(4)基于基站标号轨迹相似度模型对基站标号轨迹进行在线分类。该方法可运行在智能手机上,其优势在于:(1)无需使用GPS、WiFi等定位手段,避免了智能手机定位方式的局限性问题;(2)基于深度学习端到端的方式自动发现基站标号轨迹间的关联,解决了现有方法过于依赖领域知识的不足。

Description

一种基于孪生神经网络的基站标号轨迹分类方法
技术领域
本发明涉及移动计算和数据挖掘技术,具体涉及一种基站标号轨迹分类方法。
背景技术
轨迹挖掘即从运动物体(如车辆、行人)的历史轨迹数据中挖掘出规律和模式。目前的轨迹挖掘方法大多要求历史轨迹数据包含明确的位置信息。例如,Y.Zheng在“Trajectory data mining:An overview”(ACM Transactions on Intelligent Systemsand Technology 6(2015))中,以及M.Lin和W.J.Hsu在“Mining GPS data for mobilitypatterns:A survey”(Pervasive and Mobile Computing 12(2014))中对轨迹挖掘的各种主题、方法和应用进行了综述,其中涉及的所有方法均要求轨迹数据包含明确的位置信息(主要为GPS定位信息)。然而,智能手机的定位方式具有很大的局限性,阻碍了这些方法在智能手机上的广泛应用:
(1)智能手机可通过GPS设备进行定位,其局限性在于:GPS定位能耗过大,持续使用GPS设备将会快速消耗智能手机的电池容量。
(2)智能手机可通过无线信号源(如基站、WiFi)进行定位,其局限性在于:需要频繁的通过网络查询无线信号源的实际位置(由于只有特定的运营商才拥有这些信息),持续使用无线信号源定位将会极大的增加网络流量。
针对这些问题,目前出现了少量基站标号轨迹挖掘的工作,这些工作只考虑基站标号,不需要基站标号对应的实际位置。例如,M.Bayir、M.Demirbas和N.Eagle在“Mobilityprofiler:A framework for discovering mobility profiles of cell phone users”(Pervasive and Mobile Computing 6(2010))中提出了一种基于基站振荡图的轨迹模式挖掘算法,M.Lv、L.Chen、Y.Shen等人在“Measuring cell-id trajectory similarity formobile phone route classification”(Knowledge-Based Systems 89(2015))中考虑基站间相似度对基站标号轨迹进行分析从而实现基站标号轨迹分类。然而,这些工作均过于依赖领域知识(如定义基站振荡模式、定义基站相似度公式等),当领域知识不准确或不适应新环境的情况下难以保证方法的可靠性。
发明内容
针对现有方法的不足,本发明提出了一种基于孪生神经网络的基站标号轨迹分类方法,无需明确的位置信息,避免了智能手机定位方式的局限性问题;基于word2vec算法自动发现基站标号间的潜在关联,提高了基站标号轨迹相似度的计算准确度;基于深度学习端到端的方式训练基站标号轨迹相似度模型,解决了现有方法过于依赖领域知识的不足。
为了解决上述技术问题本发明提供如下的技术方案:
一种基于孪生神经网络的基站标号轨迹分类方法,包括如下步骤:
(1)历史基站标号轨迹数据集采集:首先对用户智能手机所连接基站的标号发生切换时进行数据采集,然后对采集到的数据进行轨迹分割得到大量基站标号轨迹,以形成历史基站标号轨迹数据集;
(2)基站标号向量化:基于word2vec算法对历史基站标号轨迹数据集进行分析,在此基础上为其中包含的每个基站标号生成一个具有语义的向量;
(3)基站标号轨迹相似度模型训练:基于孪生神经网络训练基站标号轨迹相似度模型,用以估计任意两条基站标号轨迹的相似度;
(4)在线基站标号轨迹分类:给定一条新的基站标号轨迹,将其分类为历史基站标号轨迹类型的一种,或认定其为新的基站标号轨迹类型。
进一步,所述步骤(2)中,基站标号向量化的过程如下:
(2-1)基站标号轨迹“文档”化:将一条基站标号轨迹看作一个“文档”,将其中包含的每个基站标号看作一个“词”,则历史基站标号轨迹数据集可看作一个“语料库”;
(2-2)基站标号向量生成:基于word2vec算法对看作“语料库”的历史基站标号轨迹数据集进行分析,得到其中包含的每个看作“词”的基站标号对应的向量。
再进一步,所述步骤(3)中,基站标号轨迹相似度模型训练的过程如下:
(3-1)历史基站标号轨迹数据集标注:根据用户的运动路径人工将历史基站标号轨迹分成不同类型,则任意两条基站标号轨迹的关系为1或0,1表示相同类型,0表示不同类型;
(3-2)相似度模型训练:采用孪生神经网络训练相似度模型,对网络结构的解释如下:
输入层:网络的输入为两条基站标号轨迹,记为TA和TB,首先将TA和TB中所有的基站标号替换为其对应的向量,得到两条向量序列vTA和vTB;然后通过尾部截断或尾部填充全0向量的方式将vTA和vTB处理成固定相同的长度;
循环层:循环层用两个参数完全共享的GRU网络,记为GRUA和GRUB,分别处理输入的vTA和vTB,循环层的输出为GRUA的最后一个隐状态向量
Figure BDA0001879165280000031
和GRUB的最后一个隐状态向量
Figure BDA0001879165280000032
交互层:交互层基于余弦相似度计算
Figure BDA0001879165280000033
Figure BDA0001879165280000034
的相似度;
输出层:输出层的输出为TA和TB的预测相似度值,模型采用对比损失函数作为训练的损失函数。
更进一步,所述步骤(4)中,在线基站标号轨迹分类的过程如下:
(4-1)历史类型中心基站标号轨迹生成:对用户标注的每一个历史基站标号轨迹类型Ci,在其包含的基站标号轨迹集中找到一条中心基站标号轨迹cTi
(4-2)当前基站标号轨迹分类:给定一条新的基站标号轨迹nT,基于训练好的基站标号轨迹相似度模型计算nT与每个历史基站标号轨迹类型Ci的中心基站标号轨迹cTi的相似度值si,若其中最大的相似度值si小于指定阈值sThres,或nT中包含的无对应向量的基站标号数量大于指定阈值nThres,则输出一种新的基站标号轨迹类型nC;反之,则输出历史基站标号轨迹类型Ci
(4-3)历史基站标号轨迹数据集扩充:若nT的分类结果为Ci,则将nT加入Ci对应的基站标号轨迹集,并重新生成Ci的中心基站标号轨迹;若nT的分类结果为nC,则将nC加入历史基站标号轨迹类型集,并将nT作为nC的中心基站标号轨迹。
本发明的有益效果主要表现在:(1)仅基于基站标号轨迹数据,无需明确的位置信息,避免了智能手机定位方式的局限性问题;(2)基于word2vec算法自动发现基站标号间的潜在关联,提高了基站标号轨迹相似度的计算准确度;(3)基于深度学习端到端的方式训练基站标号轨迹相似度模型,解决了现有方法过于依赖领域知识的不足。
附图说明
图1为基于孪生神经网络的基站标号轨迹分类方法流程图;
图2为基站标号轨迹相似度模型网络结构图;
图3为在线基站标号轨迹分类流程图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1~图3,一种基于孪生神经网络的基站标号轨迹分类方法,包括如下步骤:
(1)历史基站标号轨迹数据集采集:首先对用户智能手机所连接基站的标号发生切换时进行数据采集,然后对采集到的数据进行轨迹分割得到大量基站标号轨迹,以形成历史基站标号轨迹数据集;
(2)基站标号向量化:基于word2vec算法对历史基站标号轨迹数据集进行分析,在此基础上为其中包含的每个基站标号生成一个具有语义的向量;
(3)基站标号轨迹相似度模型训练:基于孪生神经网络训练基站标号轨迹相似度模型,用以估计任意两条基站标号轨迹的相似度;
(4)在线基站标号轨迹分类:给定一条新的基站标号轨迹,将其分类为历史基站标号轨迹类型的一种,或认定其为新的基站标号轨迹类型。
进一步,所述步骤(2)中,基站标号向量化的过程如下:
(2-1)基站标号轨迹“文档”化:将一条基站标号轨迹看作一个“文档”,将其中包含的每个基站标号看作一个“词”,则历史基站标号轨迹数据集可看作一个“语料库”;
(2-2)基站标号向量生成:基于word2vec算法对看作“语料库”的历史基站标号轨迹数据集进行分析,得到其中包含的每个看作“词”的基站标号对应的向量。
再进一步,所述步骤(3)中,基站标号轨迹相似度模型训练的过程如下:
(3-1)历史基站标号轨迹数据集标注:根据用户的运动路径人工将历史基站标号轨迹分成不同类型,则任意两条基站标号轨迹的关系为1或0,1表示相同类型,0表示不同类型;
(3-2)相似度模型训练:采用孪生神经网络训练相似度模型,其网络结构如图2所示,对网络结构的解释如下:
输入层:网络的输入为两条基站标号轨迹,记为TA和TB,首先将TA和TB中所有的基站标号替换为其对应的向量,得到两条向量序列vTA和vTB;然后通过尾部截断或尾部填充全0向量的方式将vTA和vTB处理成固定相同的长度;
循环层:循环层用两个参数完全共享的GRU网络,记为GRUA和GRUB,分别处理输入的vTA和vTB,循环层的输出为GRUA的最后一个隐状态向量
Figure BDA0001879165280000051
和GRUB的最后一个隐状态向量
Figure BDA0001879165280000052
交互层:交互层基于余弦相似度计算
Figure BDA0001879165280000053
Figure BDA0001879165280000054
的相似度;
输出层:输出层的输出为TA和TB的预测相似度值,模型采用对比损失函数作为训练的损失函数。
参照图3,所述步骤(4)中,在线基站标号轨迹分类的过程如下:
(4-1)历史类型中心基站标号轨迹生成:对用户标注的每一个历史基站标号轨迹类型Ci,在其包含的基站标号轨迹集中找到一条中心基站标号轨迹cTi
(4-2)当前基站标号轨迹分类:给定一条新的基站标号轨迹nT,基于训练好的基站标号轨迹相似度模型计算nT与每个历史基站标号轨迹类型Ci的中心基站标号轨迹cTi的相似度值si,若其中最大的相似度值si小于指定阈值sThres,或nT中包含的无对应向量的基站标号数量大于指定阈值nThres,则输出一种新的基站标号轨迹类型nC;反之,则输出历史基站标号轨迹类型Ci
(4-3)历史基站标号轨迹数据集扩充:若nT的分类结果为Ci,则将nT加入Ci对应的基站标号轨迹集,并重新生成Ci的中心基站标号轨迹;若nT的分类结果为nC,则将nC加入历史基站标号轨迹类型集,并将nT作为nC的中心基站标号轨迹。

Claims (4)

1.一种基于孪生神经网络的基站标号轨迹分类方法,其特征在于,所述方法包括如下步骤:
(1)历史基站标号轨迹数据集采集:首先对用户智能手机所连接基站的标号发生切换时进行数据采集,然后对采集到的数据进行轨迹分割得到大量基站标号轨迹,以形成历史基站标号轨迹数据集;
(2)基站标号向量化:基于word2vec算法对历史基站标号轨迹数据集进行分析,在此基础上为其中包含的每个基站标号生成一个具有语义的向量;
(3)基站标号轨迹相似度模型训练:基于孪生神经网络训练基站标号轨迹相似度模型,用以估计任意两条基站标号轨迹的相似度;
(4)在线基站标号轨迹分类:给定一条新的基站标号轨迹,利用基站标号轨迹相似度模型将其分类为历史基站标号轨迹类型的一种,或认定其为新的基站标号轨迹类型。
2.如权利要求1所述的一种基于孪生神经网络的基站标号轨迹分类方法,其特征在于,所述步骤(2)中,基站标号向量化的过程如下:
(2-1)基站标号轨迹“文档”化:将一条基站标号轨迹看作一个“文档”,将其中包含的每个基站标号看作一个“词”,则历史基站标号轨迹数据集可看作一个“语料库”;
(2-2)基站标号向量生成:基于word2vec算法对看作“语料库”的历史基站标号轨迹数据集进行分析,得到其中包含的每个看作“词”的基站标号对应的向量。
3.如权利要求1或2所述的一种基于孪生神经网络的基站标号轨迹分类方法,其特征在于,所述步骤(3)中,基站标号轨迹相似度模型训练的过程如下:
(3-1)历史基站标号轨迹数据集标注:根据用户的运动路径人工将历史基站标号轨迹分成不同类型,则任意两条基站标号轨迹的关系为1或0,1表示相同类型,0表示不同类型;
(3-2)相似度模型训练:采用孪生神经网络训练相似度模型,对网络结构的解释如下:
输入层:网络的输入为两条基站标号轨迹,记为TA和TB,首先将TA和TB中所有的基站标号替换为其对应的向量,得到两条向量序列vTA和vTB;然后通过尾部截断或尾部填充全0向量的方式将vTA和vTB处理成固定相同的长度;
循环层:循环层用两个参数完全共享的GRU网络,记为GRUA和GRUB,分别处理输入的vTA和vTB,循环层的输出为GRUA的最后一个隐状态向量
Figure FDA0002483459630000021
和GRUB的最后一个隐状态向量
Figure FDA0002483459630000022
交互层:交互层基于余弦相似度计算
Figure FDA0002483459630000023
Figure FDA0002483459630000024
的相似度;
输出层:输出层的输出为TA和TB的预测相似度值,模型采用对比损失函数作为训练的损失函数。
4.如权利要求1或2所述的一种基于孪生神经网络的基站标号轨迹分类方法,其特征在于,所述步骤(4)中,在线基站标号轨迹分类的过程如下:
(4-1)历史类型中心基站标号轨迹生成:对用户标注的每一个历史基站标号轨迹类型Ci,在其包含的基站标号轨迹集中找到一条中心基站标号轨迹cTi
(4-2)当前基站标号轨迹分类:给定一条新的基站标号轨迹nT,基于训练好的基站标号轨迹相似度模型计算nT与每个历史基站标号轨迹类型Ci的中心基站标号轨迹cTi的相似度值si,若其中最大的相似度值si小于指定阈值sThres,或nT中包含的无对应向量的基站标号数量大于指定阈值nThres,则输出一种新的基站标号轨迹类型nC;反之,则输出历史基站标号轨迹类型Ci
(4-3)历史基站标号轨迹数据集扩充:若nT的分类结果为Ci,则将nT加入Ci对应的基站标号轨迹集,并重新生成Ci的中心基站标号轨迹;若nT的分类结果为nC,则将nC加入历史基站标号轨迹类型集,并将nT作为nC的中心基站标号轨迹。
CN201811414586.0A 2018-11-26 2018-11-26 一种基于孪生神经网络的基站标号轨迹分类方法 Active CN109685109B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811414586.0A CN109685109B (zh) 2018-11-26 2018-11-26 一种基于孪生神经网络的基站标号轨迹分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811414586.0A CN109685109B (zh) 2018-11-26 2018-11-26 一种基于孪生神经网络的基站标号轨迹分类方法

Publications (2)

Publication Number Publication Date
CN109685109A CN109685109A (zh) 2019-04-26
CN109685109B true CN109685109B (zh) 2020-10-30

Family

ID=66185576

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811414586.0A Active CN109685109B (zh) 2018-11-26 2018-11-26 一种基于孪生神经网络的基站标号轨迹分类方法

Country Status (1)

Country Link
CN (1) CN109685109B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110290582B (zh) * 2019-05-22 2020-10-30 浙江工业大学 一种基于seq2seq框架的基站标号轨迹预测方法
CN110895879A (zh) * 2019-11-26 2020-03-20 浙江大华技术股份有限公司 同行车的检测方法及装置、存储介质、电子装置
CN110933628B (zh) * 2019-11-26 2020-12-08 西安电子科技大学 基于孪生网络的指纹室内定位方法
CN112148825B (zh) * 2020-09-24 2022-03-11 腾讯科技(深圳)有限公司 用户轨迹数据的处理方法、装置、电子设备及存储介质
CN113948189B (zh) * 2021-12-22 2022-03-15 北京航空航天大学杭州创新研究院 基于gru神经网络的meg源定位方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107168945A (zh) * 2017-04-13 2017-09-15 广东工业大学 一种融合多特征的双向循环神经网络细粒度意见挖掘方法
CN108198200A (zh) * 2018-01-26 2018-06-22 福州大学 跨摄像头场景下指定行人在线跟踪方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102202259B (zh) * 2011-05-30 2013-07-24 南京航空航天大学 神经网络路径匹配实现gps轨迹交友的方法
CN105678246B (zh) * 2015-12-31 2018-09-18 浙江工业大学 一种基于基站标号轨迹的运动模式挖掘方法
CN107609121B (zh) * 2017-09-14 2021-03-30 暨南大学 基于LDA和word2vec算法的新闻文本分类方法
CN108388888B (zh) * 2018-03-23 2022-04-05 腾讯科技(深圳)有限公司 一种车辆识别方法、装置和存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107168945A (zh) * 2017-04-13 2017-09-15 广东工业大学 一种融合多特征的双向循环神经网络细粒度意见挖掘方法
CN108198200A (zh) * 2018-01-26 2018-06-22 福州大学 跨摄像头场景下指定行人在线跟踪方法

Also Published As

Publication number Publication date
CN109685109A (zh) 2019-04-26

Similar Documents

Publication Publication Date Title
CN109685109B (zh) 一种基于孪生神经网络的基站标号轨迹分类方法
Gao et al. Identifying Human Mobility via Trajectory Embeddings.
Karatzoglou et al. A Seq2Seq learning approach for modeling semantic trajectories and predicting the next location
CN104699763B (zh) 多特征融合的文本相似性度量系统
CN104462190A (zh) 一种基于海量空间轨迹挖掘的在线的位置预测方法
CN110610166A (zh) 文本区域检测模型训练方法、装置、电子设备和存储介质
CN109272032A (zh) 出行方式识别方法、装置、计算机设备和存储介质
CN113486726A (zh) 一种基于改进卷积神经网络的轨道交通障碍物检测方法
CN105912683B (zh) 一种基于时间顺序的轨迹匹配方法
CN103533501A (zh) 一种地理围栏生成方法
CN104952073A (zh) 基于深度学习的镜头边缘检测方法
Mohan et al. Environment selection and hierarchical place recognition
Tsintotas et al. Appearance-based loop closure detection with scale-restrictive visual features
CN110598917B (zh) 一种基于路径轨迹的目的地预测方法、系统及存储介质
CN111931077B (zh) 数据处理方法、装置、电子设备及存储介质
CN110895879A (zh) 同行车的检测方法及装置、存储介质、电子装置
Doulamis Coupled multi-object tracking and labeling for vehicle trajectory estimation and matching
CN109858951A (zh) 新能源汽车加电或换电需求的预测
Liu et al. Analysis of anchor-based and anchor-free object detection methods based on deep learning
CN110290582B (zh) 一种基于seq2seq框架的基站标号轨迹预测方法
CN105678246A (zh) 一种基于基站标号轨迹的运动模式挖掘方法
Liu et al. Adaptive density trajectory cluster based on time and space distance
Liu et al. A novel compression approach for truck GPS trajectory data
Wang et al. Application of A* algorithm in intelligent vehicle path planning
Dornaika et al. A comparative study of image segmentation algorithms and descriptors for building detection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant