CN105224688B - 一种适用于挖掘移动节点移动轨迹关联规则的Apriori方法 - Google Patents

一种适用于挖掘移动节点移动轨迹关联规则的Apriori方法 Download PDF

Info

Publication number
CN105224688B
CN105224688B CN201510726496.5A CN201510726496A CN105224688B CN 105224688 B CN105224688 B CN 105224688B CN 201510726496 A CN201510726496 A CN 201510726496A CN 105224688 B CN105224688 B CN 105224688B
Authority
CN
China
Prior art keywords
date
movement rule
mobile node
motion track
rule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510726496.5A
Other languages
English (en)
Other versions
CN105224688A (zh
Inventor
郑紫微
金涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huzhou Lingchuang Technology Co ltd
Original Assignee
Ningbo University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ningbo University filed Critical Ningbo University
Priority to CN201510726496.5A priority Critical patent/CN105224688B/zh
Publication of CN105224688A publication Critical patent/CN105224688A/zh
Application granted granted Critical
Publication of CN105224688B publication Critical patent/CN105224688B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90324Query formulation using system suggestions
    • G06F16/90328Query formulation using system suggestions using search space presentation or visualization, e.g. category or range presentation and selection

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及适用于挖掘移动节点移动轨迹关联规则的Apriori方法,使用迭代方法挖掘对象数据集中所有频繁项集,并记录每个频繁项集的日期,计算每个频繁项集的支持度;利用得出的频繁项集,生成移动节点所有可能的关联移动规则,并计算每条移动规则的置信度和移动节点每条关联移动规则的日期,同时,计算每条关联移动规则的日期加权值;根据移动节点当前轨迹及步骤二生成的关联移动规则,预测移动节点下一个移动轨迹。通过将移动节点移动轨迹的时间属性与空间属性一同作为挖掘对象数据,充分考虑移动轨迹的时间和空间双重属性。相较于传统Apriori方法,本发明提供的Apriori方法适用用于挖掘移动节点移动轨迹关联规则。

Description

一种适用于挖掘移动节点移动轨迹关联规则的Apriori方法
技术领域
本发明涉及一种适用于挖掘移动节点移动轨迹关联规则的Apriori方法。
背景技术
如何在海量的数据中,挖掘其中隐藏的、人们感兴趣的知识,已经成为了一个研究的热点。Agrawal等在1994年提出使用Apriori方法对顾客交易的数据库项之间的关联规则进行挖掘,这种方法分成以下两部分来完成:首先,找出数据库中所有出现频率比最小支持度大或者相等的频繁项集;然后,根据所得到的频繁项集来制定强关联规则,同时这些强关联规则必须要满足最小可信度以及最小支持度这两个基本的条件。
从上面方法实现的两个部分可以看出,Apriori方法的实现分成以下两个步骤:1、首先使用迭代方法对数据集中的所有项集进行扫描,并且设定一个支持度阈值,筛选出数据集中的所有频繁项集,即将支持度低于阈值的项集全部淘汰掉,而将支持度高于这个阈值的项集认为是频繁项集;2、得到所有的频繁项集之后,就可以利用它挖掘出强关联规则,对于每个频繁项集l产生强关联规则的基本步骤可以总结为以下两步:a、生成l所有的非空真子集;b、对于l的每个非空真子集lz,如果l的支持度除以lz的支持度大于或等于min_conf,则输出强关联规则lz→(l-lz)。
传统Apriori方法其挖掘对象的事务数据库中,内部的事务条目只具有空间属性,不适用于挖掘移动节点移动轨迹关联规则。
发明内容
本发明所要解决的技术问题是针对上述现有技术提供一种适用于挖掘移动节点移动轨迹关联规则的Apriori方法。
本发明解决上述技术问题所采用的技术方案为:一种适用于挖掘移动节点移动轨迹关联规则的Apriori方法,用于对移动节点移动轨迹的关联移动规则进行挖掘,其特征在于:包含如下步骤:
步骤一、使用迭代方法挖掘移动轨迹数据集中所有频繁项集,并记录每个频繁项集的日期,计算每个频繁项集的支持度;
步骤二、利用步骤一得出的频繁项集,生成移动节点所有可能的关联移动规则,并计算每条关联移动规则的置信度;
其中,步骤一中,将移动节点移动轨迹的时间属性与空间属性一同作为挖掘对象数据,用事务数据库D表示移动轨迹数据集,每条事务条目用p1,p2,…pz-2,pz-1,pz表示,其中pz={(cz,tz)|cz∈C,tz∈T},代表移动节点在时间点tz接入了路由器cz,集合C代表移动节点日常经过的所有接入路由器,T代表每天划分的X个时间段集合,X=12或24或48或72。
考虑到移动节点每条生活存在一定的规律,比如上班族,每天上下班的线路和时间都相对固定,而对学生而言,会根据每周课程安排,重复地在某个时间点到达固定的教室上课。因此移动节点的移动轨迹数据的时间属性与空间属性之间有着紧密的联系,在挖掘移动节点的关联移动规则时,充分考虑移动轨迹的时间属性和空间属性,因此挖掘的对象数据是具有时间和空间双重属性的移动轨迹数据,而pn则能同时表示移动节点的位置与时间属性。
在大型交互数据库应用中,每条记录的日期字段往往是非常重要的,对于移动轨迹数据集而言,日期较近的移动轨迹记录重要性应该高于日期较远的,作为改进,在所述步骤二中,记录移动节点每条关联移动规则的日期以及计算每条关联移动规则日期的远近变动因子;同时,根据记录的日期和计算的日期远近变动因子,计算每条关联移动规则的日期加权值TWeight(R),从而得到强关联性移动规则,其中,每条关联移动规则日期对应的远变动因子m和近变动因子n计算公式如下:
每条关联移动规则的日期加权值TWeight(R)计算公式如下:
其中,RuleDate、MaxDate以及MinData分别表示关联移动规则的日期、移动轨迹数据集中最近的记录日期与最远的记录日期;n为移动轨迹数据集中的最近记录日期MaxDate的变动因子,即近变动因子;m为移动轨迹数据集中的最远记录日期MinData的变动因子,即远变动因子;K为该关联移动规则日期RuleDate所在月的总天数,RuleDatek表示该月中第k天的日期值。
再改进,本发明提供的Apriori方法,还包括如下步骤:
步骤三、根据移动节点当前轨迹及步骤二生成的关联移动规则,预测移动节点下一个移动轨迹:
假定当前移动节点的移动轨迹为T:(cn,tn)→(cm,tm),遍历所有关联移动规则,如果关联移动规则R包含移动轨迹T则说明关联移动规则R是匹配的关联移动规则,然后根据下式计算关联移动规则R的匹配度,匹配度越高则越有可能是移动节点下一个移动轨迹:
Score(R)=Confidence(R)+TWeight(R)
其中,Score(R)为关联移动规则R的匹配度,Confidence(R)为关联移动规则R的置信度,TWeight(R)为关联移动规则R的日期加权值
与现有技术相比,本发明的优点在于:将移动节点移动轨迹的时间属性与空间属性一同作为挖掘对象数据,充分考虑了移动轨迹的时间和空间双重属性,相较于传统Apriori方法,本发明提供的Apriori方法适用用于挖掘移动节点移动轨迹关联规则。
附图说明
图1为本发明实施例中挖掘移动节点移动轨迹关联规则的Apriori方法流程图。
具体实施方式
以下结合附图实施例对本发明作进一步详细描述。
如图1所示的挖掘移动节点移动轨迹关联规则的Apriori方法,用于对移动节点移动轨迹的关联移动规则进行挖掘,其包含如下步骤:
步骤一、使用迭代方法挖掘移动轨迹数据集中所有频繁项集,并记录每个频繁项集的日期,计算每个频繁项集的支持度;该步骤中,将移动节点移动轨迹的时间属性与空间属性一同作为挖掘对象数据,用事务数据库D表示移动轨迹数据集,每条事务条目用p1,p2,…pz-2,pz-1,pz表示,其中pz={(cz,tz)|cz∈C,tz∈T},代表移动节点在时间点tz接入了路由器cz,集合C代表移动节点日常经过的所有接入路由器,T代表每天划分的X个时间段集合,X=12或24或48或72;使用迭代方法挖掘移动轨迹数据集中所有频繁项集的过程与传统Apriori方法相同,即为现有常规技术,此处不再详细描述;
步骤二、利用步骤一得出的频繁项集,生成移动节点所有可能的关联移动规则,并计算每条关联移动规则的置信度;该步骤中生成移动节点所有可能的关联移动规则过程与传统Apriori方法相同,计算每条移动规则的置信度的方法也与传统Apriori方法相同,即为现有常规技术,此处不再详细描述现有常规技术;
而该步骤中,同时记录移动节点每条关联移动规则的日期以及计算每条关联移动规则日期的远近变动因子;同时,根据记录的日期和计算的日期远近变动因子,计算每条关联移动规则的日期加权值TWeight(R),从而得到强关联性移动规则,其中,每条关联移动规则日期对应的远变动因子m和近变动因子n计算公式如下:
每条关联移动规则的日期加权值TWeight(R)计算公式如下:
其中,RuleDate、MaxDate以及MinData分别表示关联移动规则的日期、移动轨迹数据集中最近的记录日期与最远的记录日期;n为移动轨迹数据集中的最近记录日期MaxDate的变动因子,即近变动因子;m为移动轨迹数据集中的最远记录日期MinData的变动因子,即远变动因子;K为该关联移动规则日期RuleDate所在月的总天数,RuleDatek表示该月中第k天的日期值;例如,该移动规则日期RuleDate为2月27日,则K=28;RuleDate25=25;又如,该移动规则日期RuleDate为3月1日,则K=31,RuleDate26=26;通过引入每条关联移动规则日期对应的远变动因子m和近变动因子n,可以对每条关联移动规则所在日期做出准确定位,以消除日期变动对后续计算日期加权值带来的波动影响,提高日期加权值的计算精确度;
步骤三、根据移动节点当前轨迹及步骤二生成的关联移动规则,预测移动节点下一个移动轨迹:
假定当前移动节点的移动轨迹为T:(cx,tx)→(cy,ty),遍历所有关联移动规则,如果关联移动规则R包含移动轨迹T则说明关联移动规则R是匹配的关联移动规则,然后根据下式计算关联移动规则R的匹配度,匹配度越高则越有可能是移动节点下一个移动轨迹:
Score(R)=Confidence(R)+TWeight(R)
其中,Score(R)为关联移动规则R的匹配度,Confidence(R)为关联移动规则R的置信度,TWeight(R)为关联移动规则R的日期加权值。
下面举一个具体的实例,对本发明做详细的描述,下表是一个具体的事务数据库D,X=48:
日期 事务条目
2.28 (0,t3),(2,t4),(8,t18),(4,t24)
3.1 (2,t4),(8,t18),(4,t24),(5,t27)
3.2 (2,t4),(8,t18),(3,t21),(4,t24)
3.3 (2,t4),(8,t21),(4,t24),(5,t27)
daten ...pn-2,pn-1,pn
使用迭代方法挖掘事务数据库D中的所有频繁项集,结果如下表所示:
频繁项集 支持度 日期
(2,t4),(8,t18) x 2.28
(2,t4),(4,t24) y 3.1
(2,t4),(8,t18),(4,t24) z 3.2
(8,t18),(4,t24) w 3.3
…… …… ……
...Pn-2,Pn-1,Pn >min_supp date
利用频繁项集生成移动节点所有可能的关联移动规则,并计算每条移动规则的置信度,结果如下表所示:
日期 关联移动规则 置信度
2.28 (2,t4)→(8,t18) 95%
3.1 (2,t4)→(4,t24) 91%
3.2 (2,t4),(8,t18)→(4,t24) 87%
3.3 (8,t18)→(4,t24) 90%
…… …… ……
date rn-1→rn >min_conf
记录移动节点每条关联移动规则的日期以及计算每条关联移动规则日期的远近变动因子;同时,根据记录的日期和计算的日期远近变动因子,计算每条关联移动规则的日期加权值TWeight(R),从而得到强关联性移动规则,其中,每条关联移动规则日期对应的远变动因子m和近变动因子n计算公式如下:
每条关联移动规则的日期加权值TWeight(R)计算公式如下:
其中,RuleDate、MaxDate以及MinData分别表示关联移动规则的日期、移动轨迹数据集中最近的记录日期与最远的记录日期;n为移动轨迹数据集中的最近记录日期MaxDate的变动因子,即近变动因子;m为移动轨迹数据集中的最远记录日期MinData的变动因子,即远变动因子;K为该移动规则日期RuleDate所在月的总天数,RuleDatek表示该月中第k天的日期值;结果如下表所示:
日期 关联移动规则 置信度 日期权值
2.28 (2,t4)→(8,t18) 95% w1
3.1 (2,t4)→(4,t24) 91% w2
3.2 (2,t4),(8,t18)→(4,t24) 87% w3
3.3 (8,t18)→(4,t24) 90% w4
…… …… …… ……
date rn-1→rn >min_conf wn
根据移动节点当前轨迹及关联移动规则,预测移动节点下一个移动轨迹:
假定当前移动节点的移动轨迹为T:(2,t4)→(8,t18),遍历所有关联移动规则,如果关联移动规则R包含移动轨迹T则说明关联移动规则R是匹配的关联移动规则,然后根据下式计算关联移动规则R的匹配度,匹配度越高则越有可能是移动节点下一个移动轨迹:
Score(R)=Confidence(R)+TWeight(R)
其中,Score(R)为关联移动规则R的匹配度,Confidence(R)为关联移动规则R的置信度,TWeight(R)为关联移动规则R的日期加权值;
结果如下表所示:
预测输出 匹配度
(2,t4),(8,t18)→(4,t24) ……
…… ……
最后预测输出(4,t24),即移动节点最有可能在时间点t24接入了4号路由器。

Claims (1)

1.一种适用于挖掘移动节点移动轨迹关联规则的Apriori方法,用于对移动节点移动轨迹的关联移动规则进行挖掘,其特征在于:包含如下步骤:
步骤一、使用迭代方法挖掘移动轨迹数据集中所有频繁项集,并记录每个频繁项集的日期,计算每个频繁项集的支持度;
步骤二、利用步骤一得出的频繁项集,生成移动节点所有可能的关联移动规则,并计算每条关联移动规则的置信度和移动节点每条关联移动规则的日期以及计算每条关联移动规则日期的远近变动因子;同时,根据记录的日期和计算的日期远近变动因子,计算每条关联移动规则的日期加权值TWeight(R),从而得到强关联性移动规则,其中,每条关联移动规则日期对应的远变动因子m和近变动因子n计算公式如下:
每条关联移动规则的日期加权值TWeight(R)计算公式如下:
其中,RuleDate、MaxDate以及MinData分别表示关联移动规则的日期、移动轨迹数据集中最近的记录日期与最远的记录日期;n为移动轨迹数据集中的最近记录日期MaxDate的变动因子,即近变动因子;m为移动轨迹数据集中的最远记录日期MinData的变动因子,即远变动因子;K为该关联移动规则日期RuleDate所在月的总天数,RuleDatek表示该月中第k天的日期值;
步骤三、根据移动节点当前轨迹及步骤二生成的关联移动规则,预测移动节点下一个移动轨迹:
假定当前移动节点的移动轨迹为T:(cn,tn)→(cm,tm),遍历所有关联移动规则,如果关联移动规则R包含移动轨迹T则说明关联移动规则R是匹配的关联移动规则,然后根据下式计算关联移动规则R的匹配度,匹配度越高则越有可能是移动节点下一个移动轨迹:
Score(R)=Confidence(R)+TWeight(R)
其中,Score(R)为关联移动规则R的匹配度,Confidence(R)为关联移动规则R的置信度,TWeight(R)为关联移动规则R的日期加权值;
在步骤一中,将智能移动终端的移动轨迹的时间属性与空间属性一同作为挖掘对象数据,用事务数据库D表示智能移动终端的移动轨迹数据集,每条事务条目用移动轨迹记录表示,每条移动轨迹记录则用多个轨迹数据组成,轨迹数据用p1,p2,…pz-2,pz-1,pz表示,其中pz={(cz,tz)|cz∈C,tz∈T},代表智能移动终端在时间点tz接入了路由器cz,集合C代表智能移动终端日常经过的所有接入路由器,T代表每天划分的X个时间段集合,X=12或24或48或72。
CN201510726496.5A 2015-10-30 2015-10-30 一种适用于挖掘移动节点移动轨迹关联规则的Apriori方法 Active CN105224688B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510726496.5A CN105224688B (zh) 2015-10-30 2015-10-30 一种适用于挖掘移动节点移动轨迹关联规则的Apriori方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510726496.5A CN105224688B (zh) 2015-10-30 2015-10-30 一种适用于挖掘移动节点移动轨迹关联规则的Apriori方法

Publications (2)

Publication Number Publication Date
CN105224688A CN105224688A (zh) 2016-01-06
CN105224688B true CN105224688B (zh) 2018-10-19

Family

ID=54993656

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510726496.5A Active CN105224688B (zh) 2015-10-30 2015-10-30 一种适用于挖掘移动节点移动轨迹关联规则的Apriori方法

Country Status (1)

Country Link
CN (1) CN105224688B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110222277B (zh) * 2019-05-06 2020-04-24 特斯联(北京)科技有限公司 一种基于大数据分析的旅游信息推荐方法及装置
CN113342855B (zh) * 2021-06-24 2022-03-01 汇付天下有限公司 一种基于大数据的数据匹配方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103366566A (zh) * 2013-06-25 2013-10-23 中国科学院信息工程研究所 一种针对特定车辆潜在群体的行驶轨迹预测方法
CN103914563A (zh) * 2014-04-18 2014-07-09 中国科学院上海微系统与信息技术研究所 一种时空轨迹的模式挖掘方法
CN104462190A (zh) * 2014-10-24 2015-03-25 中国电子科技集团公司第二十八研究所 一种基于海量空间轨迹挖掘的在线的位置预测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103366566A (zh) * 2013-06-25 2013-10-23 中国科学院信息工程研究所 一种针对特定车辆潜在群体的行驶轨迹预测方法
CN103914563A (zh) * 2014-04-18 2014-07-09 中国科学院上海微系统与信息技术研究所 一种时空轨迹的模式挖掘方法
CN104462190A (zh) * 2014-10-24 2015-03-25 中国电子科技集团公司第二十八研究所 一种基于海量空间轨迹挖掘的在线的位置预测方法

Also Published As

Publication number Publication date
CN105224688A (zh) 2016-01-06

Similar Documents

Publication Publication Date Title
CN101320375B (zh) 基于用户点击行为的数字图书搜索方法
CN104750856B (zh) 一种多维协同推荐的系统与方法
CN103514255B (zh) 一种基于项目层次类别的协同过滤推荐方法
CN102708100B (zh) 挖掘相关实体词的关系关键词的方法和装置及其应用
CN105095433A (zh) 实体推荐方法及装置
CN107220365A (zh) 基于协同过滤与关联规则并行处理的精准推荐系统及方法
CN106874378A (zh) 基于规则模型的实体抽取与关系挖掘构建知识图谱的方法
CN102521321B (zh) 基于检索词歧义性和用户偏好的视频搜索方法
CN109783628B (zh) 结合时间窗口和关联规则挖掘的关键词搜索ksaarm方法
CN103365839A (zh) 一种搜索引擎的推荐搜索方法和装置
CN100354865C (zh) 仿人工细粒度网页信息采集方法
CN104462383A (zh) 一种基于用户多种行为反馈的电影推荐方法
CN108229578B (zh) 基于数据、信息和知识三层图谱架构的图像数据目标识别方法
CN107193882A (zh) RDF数据上基于图匹配的why‑not查询回答方法
CN107545471A (zh) 一种基于高斯混合的大数据智能推荐方法
CN109828997A (zh) 一种大学生行为数据分析及学业预警方法
CN105224688B (zh) 一种适用于挖掘移动节点移动轨迹关联规则的Apriori方法
US10409866B1 (en) Systems and methods for occupation normalization at a job aggregator
CN114036376A (zh) 一种基于k均值聚类的时间感知自适应兴趣点推荐方法
CN116166878A (zh) 一种基于k均值聚类的时间感知自适应兴趣点推荐方法
Chen et al. Improved course recommendation algorithm based on collaborative filtering
CN105930400A (zh) 一种基于马尔科夫决策过程模型的会话搜索方法
CN105512224A (zh) 基于光标位置序列的搜索引擎用户满意度自动评估方法
CN103324707A (zh) 一种基于半监督聚类的查询扩展方法
CN103136256B (zh) 一种在网络中实现信息检索的方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20210426

Address after: Room 406, 3020 Huling Road, Linghu Town, Nanxun District, Huzhou City, Zhejiang Province, 313009

Patentee after: Huzhou lingchuang Technology Co.,Ltd.

Address before: 315211 Zhejiang Province, Ningbo Jiangbei District Fenghua Road No. 818

Patentee before: Ningbo University

TR01 Transfer of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: An Apriori Method Applicable to Mining Association Rules of Mobile Node Movement Trajectories

Effective date of registration: 20220907

Granted publication date: 20181019

Pledgee: Zhejiang Tailong Commercial Bank Co.,Ltd. Huzhou Linghu Small and Micro Enterprise Sub branch

Pledgor: Huzhou lingchuang Technology Co.,Ltd.

Registration number: Y2022330002151

PE01 Entry into force of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20230906

Granted publication date: 20181019

Pledgee: Zhejiang Tailong Commercial Bank Co.,Ltd. Huzhou Linghu Small and Micro Enterprise Sub branch

Pledgor: Huzhou lingchuang Technology Co.,Ltd.

Registration number: Y2022330002151

PC01 Cancellation of the registration of the contract for pledge of patent right