CN111078754B - 基于海量时空数据的频繁轨迹提取方法及其挖掘系统 - Google Patents

基于海量时空数据的频繁轨迹提取方法及其挖掘系统 Download PDF

Info

Publication number
CN111078754B
CN111078754B CN201911314539.3A CN201911314539A CN111078754B CN 111078754 B CN111078754 B CN 111078754B CN 201911314539 A CN201911314539 A CN 201911314539A CN 111078754 B CN111078754 B CN 111078754B
Authority
CN
China
Prior art keywords
frequent
track
data
mining
prefix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911314539.3A
Other languages
English (en)
Other versions
CN111078754A (zh
Inventor
吴善新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Baiyue Software Co ltd
Original Assignee
Nanjing Baiyue Software Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Baiyue Software Co ltd filed Critical Nanjing Baiyue Software Co ltd
Priority to CN201911314539.3A priority Critical patent/CN111078754B/zh
Publication of CN111078754A publication Critical patent/CN111078754A/zh
Application granted granted Critical
Publication of CN111078754B publication Critical patent/CN111078754B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Remote Sensing (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种从历史时空数据提取出带时间约束的频繁轨迹的方法,属于大数据挖掘领域。该方法包括连续轨迹切分;对连续轨迹站点去重等数据清洗;1‑频繁轨迹集合生成;支持度阈值α过滤;k+1序列生成;k+1序列的支持度阈值α过滤。反复执行上述由低阶频繁轨迹生成高阶候选轨迹、筛选得到频繁轨迹的步骤,完成对时空数据的所有频繁轨迹的挖掘。在挖掘频繁轨迹的过程中加入了时间间隔约束,使得本发明更具有实际的参考价值和应用性。本发明对海量的历史轨迹数据进行挖掘,通过轨迹划分和子轨迹归纳,最终输出目标的频繁轨迹,对于用户有效处理轨迹数据、滤除冗余信息、研究轨迹间的前后关联等都有重要的意义。

Description

基于海量时空数据的频繁轨迹提取方法及其挖掘系统
技术领域
本发明涉及大数据挖掘领域,是一种基于海量时空数据的轨迹特征提取方法及其系统。
背景技术
由位置和时间戳顺序形成的原始轨迹对于人们来说是没有意义的,不能直观地得到有效信息,需要对海量时空数据进行深度挖掘,找出目标的活动规律。为了解决这一难题,可以通过轨迹划分和轨迹归纳,将满足支持度阈值的频繁轨迹展示给用户。将每一天的轨迹视为一项独立的事务,本问题即可转化为频繁序列挖掘的问题,即将每一个由站点组合形成的路径视为一个频繁序列,我们找出出现次数最多的序列。目前此类算法模型已经有经典的PrefixSpan算法等。PrefixSpan是一种基于序列数据集和支持度阈值α,挖掘数据集中频繁序列的算法。该方法存在明显的不足之处:在挖掘频繁轨迹时,可能会遇到需要对序列的时间进行约束的情形,比如已知两条轨迹<(time1,site1),(time2,site2)>和<(time3,site1),(time4,site2)>,如果time3-time1>Δt,则被视为意义不同的序列,此时经典的PrefixPan算法则无法满足这种带时间约束的频繁序列挖掘需求。
本发明申请主要解决的就是由复杂的目标轨迹数据,提取出其频繁路径的问题。
发明内容
本发明主要解决在海量时空数据时,由复杂的目标轨迹数据提取出其频繁路径的问题。
为了实现上述目的,本发明的技术方案如下:
一种基于海量时空数据的特征轨迹提取方法,包括以下步骤:
S1:时空数据的切分,将原始的时空数据的采集时间向前推N个小时,采集数据按照其前推后的归属日期切分成多条轨迹,形成序列数据集D;
S2:获取序列数据集D、支持度阈值α、去重时间间隔阈值ΔT、相同轨迹点时间间隔阈值Δt;
S3:序列数据集D中的每一个子轨迹去重,在同一站点被连续采集两次或两次以上,且距离第一次记录时间差小于设定阈值ΔT时,只保留第一次采集记录;
S4:将k初始化为1,找出所有长度为k的前缀和对应的投影数据库S;
S5:对长度为1的前缀进行计数,站点相同、时间差在Δt以内的轨迹点视为同一种前缀,将支持度低于阈值α的前缀对应的项从数据集S删除,同时得到所有的频繁1项序列;
S6:判断S5所得频繁序列是否为空集,若是,则执行步骤S8,否则执行步骤S7;
S7:对于每个长度为k+1满足支持度要求的前缀进行递归挖掘;
S8:将所有的频繁序列集合输出到磁盘;
所述的步骤S5具体包括:
S5a:将站点相同的前缀对应的时间组成一个一维张量M,若有n个站点,则M中有n个元素;
S5b:初始化i=1,开始处理张量中的第一个元素L;
S5c:找出L内时间差最小的两个元素Time1、Time2,若abs(Time1-Time2)<Δt,将Time1和Time2合并为一组,并用均值代替原Time1和Time2,进入步骤S5d,否则,退出步骤S5;
S5d:找出L内时间差最小的两个元素Time3、Time4,Time3和Time4的原所在组为List3和List4,若abs(max(List3)-min(List4))<Δt且abs(max(List3)-min(List4))<Δt,将Time3和Time4合并为一组,用均值代替原Time3和Time4,重复S5c,否则,退出S5d执行S5e;
S5e:删除所有低于支持度阈值α的候选集,获得候选前缀集合;
S5f:i=i+1,如果i小于张量M的长度,开始处理张量中的第i个元素L,执行步骤S5c,否则执行步骤S5g;
S5g:合并所有站点的候选前缀集合,以前缀为键、前缀出现的次数为值,构建键值对集合;
S5h:将支持度低于阈值α的前缀对应的项从集合删除,得到所有的频繁1项序列。
优选的,所述的步骤S4具体包括:
S4a:初始化i=1;
S4b:处理数据集D中的第i条轨迹;初始化k=1,将序列D(i)中的第一个位置点作为第一个前缀,前缀向后的子序列即为对应的前缀投影;
S4c:k=k+1,如果k小于序列长度,将序列中的k位置点作为第一个前缀,前缀向后的子序列即为对应的前缀投影,否则执行S4d;
S4d:i=i+1,如果i小于D的长度,执行S4b,否则,执行S4e;
S4e:输出所有的长度为1的前缀,及其对应的前缀投影。
优选的,所述的步骤S7具体包括:
S7a:将长度为k的频繁轨迹初始化为k+1项频繁的前缀;
S7b:初始化i=1;
S7c:判断第i个k-频繁轨迹在所有轨迹中出现的位置,并构建k+1项频繁轨迹;
S7d:i=i+1;如果i小于k-频繁轨迹项集的数目,执行S7c步骤,否则,执行S7d;
S7e:统计k+1项频繁轨迹出现的次数;
S7f:删除所有低于支持度阈值α的候选集,获得候选前缀集合。
本发明同时提供一种基于海量时空数据的特征轨迹提取方法的挖掘系统,包括数据预处理模块、1阶频繁轨迹挖掘模块以及k阶频繁轨迹挖掘模块;
所述数据预处理模块用于将数据切分为多个互相独立的序列,并将序列代表的轨迹进行时间差阈值为Δt的去重;
所述的1阶频繁轨迹挖掘模块用于挖掘长度为1的频繁轨迹,包含同一站点内轨迹合并模块和支持度阈值α过滤模块;
所述的k阶频繁轨迹挖掘模块于挖掘长度为k的频繁轨迹,只在k阶频繁轨迹挖掘模块返回值不为空时生效,同样包含了同一站点内轨迹合并模块和支持度阈值α过滤模块。
优选地,客户在输入目标身份的时空数据后,可以输出目标在数据时段内所有的支持度大于阈值α的频繁轨迹。
总体而言,通过本发明的技术方案,可以实现的有益效果为:
本发明针对海量时空数据提出了一种有效的频繁轨迹提取方法,在输入目标身份的时空数据后,可以输出目标在数据时段内的支持度大于阈值的频繁轨迹,克服了目前频繁序列挖掘算法不具有时间约束项的局限性,使得本发明解决了经典的频繁序列挖掘用于挖掘频繁轨迹时应用性较低的问题。
附图说明
图1为本发明方法流程图。
图2为长度为1的轨迹合并算法伪代码图。
具体实施方式
为了能够更清晰的表述本发明的技术手段、创作特征和有效功效,下面将结合具体的实施例阐述本发明。此处描述的具体实施案例仅仅用于解释本发明,并不用于限定本发明。
实施例1
图1示出了本发明所述的基于海量时空数据的频繁轨迹挖掘方法,包括以下几个步骤:
S1:时空数据的切分。将原始的采集数据,按照日期切分成多条轨迹,形成序列数据集D。原始采集时间向前推N个小时(比如前推4小时),采集数据按照其前推后的归属日期作为其划分日期。当N=4时,即每一天从当天凌晨4点开始至次日凌晨4点。每一天的轨迹相互独立,每一天的轨迹称为一个事务。
S2:获取序列数据集D、支持度阈值α、去重时间间隔阈值ΔT、相同轨迹点时间间隔阈值Δt。
S3:序列数据集D中的每一个子轨迹进行去重。在同一站点被连续采集两次或两次以上,且记录时间差小于设定阈值ΔT,只保留第一次采集记录。比如某一天的轨迹为<(time1,site1),(time2,site2),(time3,site3),(time4,site3),(time5,site4)>,如果time4-time3<Δt,去重后的轨迹为<(time1,site1),(time2,site2),(time3,site3),(time5,site4)>。
S4:将k初始化为1,找出所有长度为k的前缀和对应的投影数据库S。前缀通俗意义讲就是序列数据前面部分的子序列,长度为k的前缀就是长度为k的子序列。完整序列中前缀后面的子序列就是前缀对应的投影数据。
S5:对长度为k的前缀进行计数,站点相同且时间差在Δt以内的轨迹点视为同一种前缀。将支持度低于阈值α的前缀对应的项从数据集S删除,同时得到所有的频繁1项序列。
S6:判断S5所得频繁序列是否为空集,若是,则执行步骤S8,否则执行步骤S7。
S7:对于每个长度为k+1满足支持度要求的前缀进行递归挖掘
S8:将所有的频繁序列集合输出到磁盘。
优选地,所述的步骤S4具体包括:
S4a:初始化i=1,处理数据集D中的第i条轨迹。初始化j=1,将序列D(i)中的第一个位置点作为第一个前缀,前缀向后的子序列即为对应的前缀投影。
S4b:j=j+1,如果j小于序列长度,将序列中的j位置点作为第一个前缀,前缀向后的子序列即为对应的前缀投影,否则执行S4c。
S4c:i=i+1,对D中的每一条轨迹执行上述操作。
S4d:输出所有的长度为1的前缀,及其对应的前缀投影。
优选地,所述的步骤S5具体包括:
S5a:将站点相同的前缀对应的时间组成一个一维张量M,若有有n个站点,则M中有n个元素。
S5b:初始化i=1,开始处理张量中的第一个元素L。
S5c:找出L内时间差最小的两个元素Time1、Time2,若abs(Time1-Time2)<Δt,将Time1和Time2合并为一组,并用均值代替原Time1和Time2,进入步骤S5d,否则,退出步骤S5
S5d:找出L内时间差最小的两个元素Time3、Time4,Time3和time4的原所在组为List3和List4,若abs(max(List3)-min(List4))<Δt且abs(max(List3)-min(List4))<Δt,将Time3和Time4合并为一组,用均值代替原Time3和Time4,重复S5c,否则,退出S5d执行S5e。
S5e:删除所有低于支持度阈值α的候选集,获得候选前缀集合。
S5f:i=i+1,循环对张量中的每一个元素执行上述操作。
S5g:合并所有站点的候选前缀集合,以前缀为键、前缀出现的次数为值,构建键值对集合。
S5h:将支持度低于阈值α的前缀对应的项从集合删除,得到所有的频繁1项序列。
优选地,所述的步骤S7具体包括:
S7a:将长度为k的频繁轨迹初始化为k+1项频繁的前缀。
S7b:初始化i=1,判断第i个k-频繁轨迹在所有轨迹中出现的位置,并构建k+1项频繁轨迹。
S7c:i=i+1;如果i小于k-频繁轨迹项集的数目,执行S7b步骤,否则,执行S7d。
S7d:应用S5c所述的方法合并、统计k+1项频繁轨迹出现的次数。
S7e:删除所有低于支持度阈值α的候选集,获得候选前缀集合。
实施例2
图2示出了根据实施例1中所述方法进行海量时空数据的频繁轨迹挖掘系统,包括数据预处理模块、1阶频繁轨迹挖掘模块、k阶频繁轨迹挖掘模块。
所述数据预处理模块用于将数据切分为多个互相独立的事务,并将事务内的轨迹进行时间差阈值为Δt的去重。
所述的1阶频繁轨迹挖掘模块用于挖掘长度为1的频繁轨迹,包含同一站点内轨迹合并模块和支持度阈值α过滤模块。
所述的k阶频繁轨迹挖掘模块于挖掘长度为k的频繁轨迹,只在k阶频繁轨迹挖掘模块返回值不为空时生效,同样包含了同一站点内轨迹合并模块和支持度阈值α过滤模块。
综上所述,本发明提供一种从历史时空数据提取出目标身份频繁轨迹的方法,属于大数据挖掘领域。该方法包括连续轨迹按天进行切割;对轨迹进行去重等数据清洗;找出所有事务中的所有长度为1的轨迹,并判断每一种轨迹的出现次数;次数大于设定阈值的次数最多的轨迹即为1项频繁轨迹;同理可以得到目标身份的N项频繁轨迹。本发明对海量的历史轨迹数据进行挖掘,通过轨迹划分和子轨迹归纳,最终将满足支持度阈值的目标频繁轨迹展示给用户,解决了当前频繁序列挖掘算在应用在轨迹挖掘时不能设置时间约束的问题。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种基于海量时空数据的特征轨迹提取方法,其特征在于,包括以下步骤:
S1:时空数据的切分,将原始的时空数据的采集时间向前推N个小时,采集数据按照其前推后的归属日期切分成多条轨迹,形成序列数据集D;
S2:获取序列数据集D、支持度阈值α、去重时间间隔阈值ΔT、相同轨迹点时间间隔阈值Δt;
S3:序列数据集D中的每一个子轨迹去重,在同一站点被连续采集两次或两次以上,且距离第一次记录时间差小于设定阈值ΔT时,只保留第一次采集记录;
S4:将k初始化为1,找出所有长度为k的前缀和对应的投影数据库S;
S5:对长度为1的前缀进行计数,站点相同、时间差在Δt以内的轨迹点视为同一种前缀,将支持度低于阈值α的前缀对应的项从数据集S删除,同时得到所有的频繁1项序列;
S6:判断S5所得频繁序列是否为空集,若是,则执行步骤S8,否则执行步骤S7;
S7:对于每个长度为k+1满足支持度要求的前缀进行递归挖掘;
S8:将所有的频繁序列集合输出到磁盘;
所述的步骤S5具体包括:
S5a:将站点相同的前缀对应的时间组成一个一维张量M,若有n个站点,则M中有n个元素;
S5b:初始化i=1,开始处理张量中的第一个元素L;
S5c:找出L内时间差最小的两个元素Time1、Time2,若abs(Time1-Time2)<Δt,将Time1和Time2合并为一组,并用均值代替原Time1和Time2,进入步骤S5d,否则,退出步骤S5;
S5d:找出L内时间差最小的两个元素Time3、Time4,Time3和Time4的原所在组为List3和List4,若abs(max(List3)-min(List4))<Δt且abs(max(List3)-min(List4))<Δt,将Time3和Time4合并为一组,用均值代替原Time3和Time4,重复S5c,否则,退出S5d执行S5e;
S5e:删除所有低于支持度阈值α的候选集,获得候选前缀集合;
S5f:i=i+1,如果i小于张量M的长度,开始处理张量中的第i个元素L,执行步骤S5c,否则执行步骤S5g;
S5g:合并所有站点的候选前缀集合,以前缀为键、前缀出现的次数为值,构建键值对集合;
S5h:将支持度低于阈值α的前缀对应的项从集合删除,得到所有的频繁1项序列。
2.根据权利要求1所述的基于海量时空数据的特征轨迹提取方法,其特征在于,所述的步骤S4具体包括:
S4a:初始化i=1;
S4b:处理数据集D中的第i条轨迹;初始化k=1,将序列D(i)中的第一个位置点作为第一个前缀,前缀向后的子序列即为对应的前缀投影;
S4c:k=k+1,如果k小于序列长度,将序列中的k位置点作为第一个前缀,前缀向后的子序列即为对应的前缀投影,否则执行S4d;
S4d:i=i+1,如果i小于D的长度,执行S4b,否则,执行S4e;
S4e:输出所有的长度为1的前缀,及其对应的前缀投影。
3.根据权利要求1所述的基于海量时空数据的特征轨迹提取方法,其特征在于,所述的步骤S7具体包括:
S7a:将长度为k的频繁轨迹初始化为k+1项频繁的前缀;
S7b:初始化i=1;
S7c:判断第i个k-频繁轨迹在所有轨迹中出现的位置,并构建k+1项频繁轨迹;
S7d:i=i+1;如果i小于k-频繁轨迹项集的数目,执行S7c步骤,否则,执行S7d;
S7e:统计k+1项频繁轨迹出现的次数;
S7f:删除所有低于支持度阈值α的候选集,获得候选前缀集合。
4.一种用于实现权利要求1所述的基于海量时空数据的特征轨迹提取方法的挖掘系统,其特征在于,包括数据预处理模块、1阶频繁轨迹挖掘模块以及k阶频繁轨迹挖掘模块;
所述数据预处理模块用于将数据切分为多个互相独立的序列,并将序列代表的轨迹进行时间差阈值为Δt的去重;
所述的1阶频繁轨迹挖掘模块用于挖掘长度为1的频繁轨迹,包含同一站点内轨迹合并模块和支持度阈值α过滤模块;
所述的k阶频繁轨迹挖掘模块于挖掘长度为k的频繁轨迹,只在k阶频繁轨迹挖掘模块返回值不为空时生效,同样包含了同一站点内轨迹合并模块和支持度阈值α过滤模块。
5.根据权利要求4所述的挖掘系统,其特征在于,客户在输入目标身份的时空数据后,输出目标在数据时段内所有的支持度大于阈值α的频繁轨迹。
CN201911314539.3A 2019-12-19 2019-12-19 基于海量时空数据的频繁轨迹提取方法及其挖掘系统 Active CN111078754B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911314539.3A CN111078754B (zh) 2019-12-19 2019-12-19 基于海量时空数据的频繁轨迹提取方法及其挖掘系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911314539.3A CN111078754B (zh) 2019-12-19 2019-12-19 基于海量时空数据的频繁轨迹提取方法及其挖掘系统

Publications (2)

Publication Number Publication Date
CN111078754A CN111078754A (zh) 2020-04-28
CN111078754B true CN111078754B (zh) 2020-08-25

Family

ID=70315530

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911314539.3A Active CN111078754B (zh) 2019-12-19 2019-12-19 基于海量时空数据的频繁轨迹提取方法及其挖掘系统

Country Status (1)

Country Link
CN (1) CN111078754B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112085048B (zh) * 2020-07-20 2024-10-15 南斗六星系统集成有限公司 一种基于lstm自编码的车辆频繁轨迹识别方法及装置
CN112507802A (zh) * 2020-11-16 2021-03-16 鹏城实验室 基于深度时空推理网络的人体行为识别方法及电子设备
CN115311842B (zh) * 2021-05-07 2024-07-02 杭州海康威视数字技术股份有限公司 车流量预测模型训练和车流量预测方法、装置及电子设备
CN113329398B (zh) * 2021-05-28 2022-08-02 南京邮电大学 一种基于整数规划的敏感上下车模式的隐藏方法
CN113553516A (zh) * 2021-09-18 2021-10-26 南京森根科技股份有限公司 一种基于模糊路径的频繁轨迹挖掘方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102509170A (zh) * 2011-10-10 2012-06-20 浙江鸿程计算机系统有限公司 一种基于历史轨迹数据挖掘的位置预测系统及方法
CN105404648A (zh) * 2015-10-29 2016-03-16 东北大学 一种基于密度与紧密度聚类的用户移动行为确定方法
CN106790468A (zh) * 2016-12-10 2017-05-31 武汉白虹软件科技有限公司 一种分析用户WiFi活动轨迹规律的分布式实现方法
CN107016126A (zh) * 2017-05-12 2017-08-04 西南交通大学 一种基于序列模式挖掘的多用户模型移动轨迹预测方法
CN108073575A (zh) * 2016-06-14 2018-05-25 电子科技大学 一种基于改进Prefixspan算法的雷达数据频繁模式挖掘方法
CN108170799A (zh) * 2017-12-28 2018-06-15 江苏名通信息科技有限公司 一种海量数据的频繁序列挖掘方法
CN108765922A (zh) * 2018-04-18 2018-11-06 上海城市交通设计院有限公司 一种公交车辆行驶轨迹的分段方法
CN109040989A (zh) * 2018-07-19 2018-12-18 中山大学 一种手机信令数据清洗方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102629297B (zh) * 2012-03-06 2016-01-06 北京建筑工程学院 一种基于行程识别的出行者活动规律分析方法
CN104239556B (zh) * 2014-09-25 2017-07-28 西安理工大学 基于密度聚类的自适应轨迹预测方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102509170A (zh) * 2011-10-10 2012-06-20 浙江鸿程计算机系统有限公司 一种基于历史轨迹数据挖掘的位置预测系统及方法
CN105404648A (zh) * 2015-10-29 2016-03-16 东北大学 一种基于密度与紧密度聚类的用户移动行为确定方法
CN108073575A (zh) * 2016-06-14 2018-05-25 电子科技大学 一种基于改进Prefixspan算法的雷达数据频繁模式挖掘方法
CN106790468A (zh) * 2016-12-10 2017-05-31 武汉白虹软件科技有限公司 一种分析用户WiFi活动轨迹规律的分布式实现方法
CN107016126A (zh) * 2017-05-12 2017-08-04 西南交通大学 一种基于序列模式挖掘的多用户模型移动轨迹预测方法
CN108170799A (zh) * 2017-12-28 2018-06-15 江苏名通信息科技有限公司 一种海量数据的频繁序列挖掘方法
CN108765922A (zh) * 2018-04-18 2018-11-06 上海城市交通设计院有限公司 一种公交车辆行驶轨迹的分段方法
CN109040989A (zh) * 2018-07-19 2018-12-18 中山大学 一种手机信令数据清洗方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Prefixspan,: Mining Sequential Patterns Efficiently by Prefix-Projected Pattern Growth;Jian Pei 等;《Proceedings 17th International Conference on Data Engineering》;20010406;215-224 *
PrefixSpan算法原理总结;刘建平Pinard;《https://www.cnblogs.com/pinard/p/6323182.html》;20170121;第1-3页 *
大数据集序列模式挖掘算法研究;梁栋;《中国优秀硕士学位论文全文数据库 信息科技辑》;20150915(第09期);I138-1253 *

Also Published As

Publication number Publication date
CN111078754A (zh) 2020-04-28

Similar Documents

Publication Publication Date Title
CN111078754B (zh) 基于海量时空数据的频繁轨迹提取方法及其挖掘系统
WO2016015683A1 (zh) 交通数据流的聚集查询方法及系统
US20060100969A1 (en) Learning-based method for estimating cost and statistics of complex operators in continuous queries
CN111310833B (zh) 一种基于贝叶斯神经网络的出行方式识别方法
CN105827422A (zh) 一种确定网元告警关联关系的方法及装置
CN102799616B (zh) 大规模社会网络中的离群点检测方法
CN104765852A (zh) 大数据背景下基于模糊算法的数据挖掘方法
CN113364813A (zh) 一种轨道交通能量回馈数据的压缩传输方法及系统
CN113902220B (zh) 一种基于自适应密度聚类算法车辆轨迹预测方法
Abbasghorbani et al. Survey on sequential pattern mining algorithms
CN103336800B (zh) 基于行为分析的指纹存储比对的方法
Li et al. Coverless Video Steganography Based on Frame Sequence Perceptual Distance Mapping.
Runkler et al. Sequential possibilistic one-means clustering
CN103984723A (zh) 一种针对增量数据对频繁项进行更新数据挖掘方法
CN113902003A (zh) 一种基于MITree的多维时间序列在线模体发现方法
CN105653567A (zh) 一种文本序列数据中快速查找特征字符串的方法
CN102262679A (zh) 一种水文时间序列模体挖掘方法
CN110569286A (zh) 基于本地差分隐私的活动时序轨迹挖掘的方法
Bertsimas et al. Rejoinder: Sparse regression: scalable algorithms and empirical performance
Egho et al. Healthcare trajectory mining by combining multidimensional component and itemsets
Ai et al. Unsupervised video summarization based on consistent clip generation
CN105138445A (zh) 基于概率行为关系挖掘业务流程中不可见任务的新方法
CN111107493A (zh) 一种移动用户位置预测方法与系统
CN113553516A (zh) 一种基于模糊路径的频繁轨迹挖掘方法
Umarani et al. Developing novel and effective approach for association rule mining using progressive sampling

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant