CN112632151A - 一种基于二分过滤的移动对象传染行为挖掘方法 - Google Patents

一种基于二分过滤的移动对象传染行为挖掘方法 Download PDF

Info

Publication number
CN112632151A
CN112632151A CN202011566396.8A CN202011566396A CN112632151A CN 112632151 A CN112632151 A CN 112632151A CN 202011566396 A CN202011566396 A CN 202011566396A CN 112632151 A CN112632151 A CN 112632151A
Authority
CN
China
Prior art keywords
infection
result
behavior
time
monitoring point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011566396.8A
Other languages
English (en)
Other versions
CN112632151B (zh
Inventor
戴华
陈玉
李佳玮
周倩
杨庚
黄海平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Posts and Telecommunications filed Critical Nanjing University of Posts and Telecommunications
Priority to CN202011566396.8A priority Critical patent/CN112632151B/zh
Publication of CN112632151A publication Critical patent/CN112632151A/zh
Application granted granted Critical
Publication of CN112632151B publication Critical patent/CN112632151B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2477Temporal data queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Fuzzy Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Radar Systems Or Details Thereof (AREA)

Abstract

本发明公开了一种基于二分过滤的移动对象传染行为挖掘方法,首先根据时间窗口阈值和移动对象的轨迹,生成二分监测点集合HT;并将初始传染源对象以传染行为三元组b=(from,to,ts)的形式添加到集合Vresult,并将每一个初始传染源加入传染源集合W,若from不存在,则to为初始传染源对象,以HT中的第一个二分监测点为活动监测点,对移动对象轨迹集合O中尚未被感染的每一个对象oi进行分析,将W中可能传染oi的对象加入集合Pi,利用Pi中最早传染oi的传染对象s及传染时间t构造新的三元组(s,oi,t),并加入Vresult,将oi加入W,第一个二分监测点处理结束依次处理每一个二分监测点。最终,Vresult即为确定的传染行为挖掘结果。采用本发明可以实现高效、准确的传染行为挖掘。

Description

一种基于二分过滤的移动对象传染行为挖掘方法
技术领域
本发明属于轨迹数据挖掘领域,具体涉及一种基于二分过滤的移动对象传染行为挖掘方法。
背景技术
随着无线通信和移动计算技术以及全球定位和导航系统的快速发展,来自移动对象的轨迹数据不断增多。通过挖掘这些轨迹数据可以获得应用于动物研究、城市道路规划、军事监测等方面的有用知识。
目前,通过轨迹数据发现病毒在移动对象之间传染路径正受到研究者们的关注。一方面,需要定义合适的模型来描述病毒的传染行为;另一方面,如何高效地挖掘传染行为也是需要解决的问题。
发明内容
为了解决上述问题,本发明提供了一种能够从轨迹数据中挖掘出病毒在移动对象之间的传播情况的基于二分过滤的移动对象传染行为挖掘方法。
为了达到上述目的,本发明是通过以下技术方案来实现的:
本发明是一种基于二分过滤的移动对象传染行为挖掘方法,令传染行为挖掘结果以传染行为三元组b=(from,to,ts)表示,其中from表示传染源对象,to表示被from传染的对象,time表示to被from传染的时间,若from不存在,则to为初始传染源对象,Vresult为已确定的传染行为集合,W为传染源集合,具体步骤如下:
(1a)根据时间窗口阈值和移动对象的轨迹计算得到二分监测点集合HT
(1b)将初始传染源对象以传染行为三元组形式加入集合Vresult,并将每一个初始传染源加入集合W,并选择HT中的第一个二分监测点作为活动监测点;
(1c)在当前活动监测点hk时刻,对移动对象轨迹集合O中尚未感染的每一个对象oi进行分析,将W中可能传染oi的传染源对象添加到集合Pi中;
(1d)判断Pi是否为空,若不为空,则利用Pi中最早传染oi的传染对象s及传染时间t构造新的传染行为三元组(s,oi,t),并将该三元组加入Vresult,将oi加入W;否则,当前活动监测点处理完毕;
(1e)判断二分监测点是否全部处理完,若没处理完,则取下一个二分监测点为活动监测点,并转步骤(1c);若处理完,则表明传染行为挖掘结束,Vresult即为最终确定的传染行为挖掘结果集。
本发明的进一步改进在于:所述步骤(1a)中计算得到二分监测点集合的过程如下:令|U|为时间窗口阈值,L为移动对象轨迹的长度,则二分监测点集合
Figure BDA0002860792360000021
Figure BDA0002860792360000022
本发明的进一步改进在于:所述步骤(1c)包括以下步骤:令d为对象传染的距离阈值,
Figure BDA0002860792360000023
为对象oi与sj的状态量,初始值设置为0,在当前活动监测点hk时刻,对传染源集合W中的每一个传染源对象sj,执行如下操作:
(1c1)计算oi与sj在hk时刻的欧氏距离Dist(oi,sj,hk),若Dist(oi,sj,hk)≤d成立,则令
Figure BDA0002860792360000024
若Dist(oi,sj,hk)>d且
Figure BDA0002860792360000025
成立,则令
Figure BDA0002860792360000026
若Dist(oi,sj,t)>d成立且t>hk成立,则
Figure BDA0002860792360000027
(1c2)判断当前
Figure BDA0002860792360000028
的状态,若
Figure BDA0002860792360000029
成立,则计算oi与sj在hk-1与hk之间每个时刻t的距离Dist(oi,sj,t),仅当所有时刻的距离均小于等于d时,将sj添加到集合Pi;否则令
Figure BDA00028607923600000210
本发明的进一步改进在于:所述步骤(1d)包括以下步骤:令
Figure BDA00028607923600000211
表示oi与sj距离小于等于d的时长;在hk-2与hk-1之间以及hk与hk+1之间,按照时间先后顺序考察每一个时间点t,并对集合Pi中每一个可能传染oi的传染源对象sj,执行以下操作:
(1d1)计算oi与sj在t时刻的距离Dist(oi,sj,t),若Dist(oi,sj,t)≤d成立,则令
Figure BDA00028607923600000212
否则
Figure BDA00028607923600000213
(1d2)根据当前
Figure BDA00028607923600000214
|U|、t和hk的情况,对应执行如下操作:
情况1:若|U|为奇数和
Figure BDA00028607923600000215
同时成立,则将传染行为三元组b=(sj,oi,t)添加到Vresult中,并将oi添加到W中,步骤(1d)全部结束;
情况2:若|U|为偶数、
Figure BDA00028607923600000216
和t>hk同时成立,则将传染行为三元组b=(sj,oi,t)添加到Vresult中,并将oi添加到W中,步骤(1d)全部结束;
情况3:若|U|为偶数、
Figure BDA0002860792360000031
和t<hk同时成立,则将传染行为三元组b=(sj,oi,hk)添加到Vresult中,并将oi添加到W中,步骤(1d)全部结束。
本发明的有益效果是:与现有技术相比,本发明的优点在于:1、本发明在进行传染行为挖掘时,首先找到了未感染对象o的所有可能传染源并添加到集合P中,然后再对P中的对象进行分析,以确保最早发生的传染行为的时间,因此可以保证未感染对象被感染且成为传染源时间的准确性,不会出现漏解。2、通过只在二分监测点进行传染源与所有未感染对象的距离计算,使得在其他时间点进行距离计算时过滤掉了所有不可能被感染的对象,从而实现了高效的传染行为挖掘。
附图说明
图1是本发明的流程图。
图2是基于二分过滤的移动对象传染行为挖掘示意图。
其中:图2中曲线1表示传染源对象from的移动轨迹,曲线2代表被传染对象to的移动轨迹,矩形方框则表示时间窗口U,并给出了窗口阈值|U|=8时的二分监测点{h0,h1,h2,h3}。
具体实施方式
为了加强对本发明的理解,下面将结合附图和实施例对本发明作进一步的详细描述,该实施例仅用于解释本发明,并不对本发明的保护范围构成限定。
如图1-2所示,本发明是一种基于二分过滤的移动对象传染行为挖掘方法,令传染行为挖掘结果以传染行为三元组b=(from,to,ts)表示,其中from表示传染源对象,to表示被from传染的对象,time表示to被from传染的时间,若from不存在,则to为初始传染源对象,Vresult为已确定的传染行为集合,W为传染源集合,具体步骤如下:
(1a)根据时间窗口阈值和移动对象的轨迹计算得到二分监测点集合HT
其中:二分监测点集合的计算过程如下:令|U|为时间窗口阈值,L为移动对象轨迹的长度,则二分监测点集合
Figure BDA0002860792360000032
(1b)将初始传染源对象以传染行为三元组形式加入集合Vresult,并将每一个初始传染源加入集合W,并选择HT中的第一个二分监测点作为活动监测点;
(1c)在当前活动监测点hk时刻,对移动对象轨迹集合O中尚未感染的每一个对象oi进行分析,将W中可能传染oi的传染源对象添加到集合Pi中;
所述步骤(1c)包括以下步骤:令d为对象传染的距离阈值,
Figure BDA0002860792360000041
为对象oi与sj的状态量,初始值设置为0,在当前活动监测点hk时刻,对传染源集合W中的每一个传染源对象sj,执行如下操作:
(1c1)计算oi与sj在hk时刻的欧氏距离Dist(oi,sj,hk),若Dist(oi,sj,hk)≤d成立,则令
Figure BDA0002860792360000042
若Dist(oi,sj,hk)>d且
Figure BDA0002860792360000043
成立,则令
Figure BDA0002860792360000044
若Dist(oi,sj,t)>d成立且t>hk成立,则
Figure BDA0002860792360000045
(1c2)判断当前
Figure BDA0002860792360000046
的状态,若
Figure BDA0002860792360000047
成立,则计算oi与sj在hk-1与hk之间每个时刻t的距离Dist(oi,sj,t),仅当所有时刻的距离均小于等于d时,将sj添加到集合Pi;否则令
Figure BDA0002860792360000048
(1d)判断Pi是否为空,若不为空,则利用Pi中最早传染oi的传染对象s及传染时间t构造新的传染行为三元组(s,oi,t),并将该三元组加入Vresult,将oi加入W;否则,当前活动监测点处理完毕;
所述步骤(1d)包括以下步骤:令
Figure BDA0002860792360000049
表示oi与sj距离小于等于d的时长,在hk-2与hk-1之间以及hk与hk+1之间,按照时间先后顺序考察每一个时间点t,并对集合Pi中每一个可能传染oi的传染源对象sj,执行以下操作:
(1d1)计算oi与sj在t时刻的距离Dist(oi,sj,t),若Dist(oi,sj,t)≤d成立,则令
Figure BDA00028607923600000410
否则
Figure BDA00028607923600000411
(1d2)根据当前
Figure BDA00028607923600000412
|U|、t和hk的情况,对应执行如下操作:
若|U|为奇数、
Figure BDA00028607923600000413
同时成立,则将传染行为三元组b=(sj,oi,t)添加到Vresult中,并将oi添加到W中,步骤(1d)全部结束;
若|U|为偶数、
Figure BDA00028607923600000414
和t>hk同时成立,则将传染行为三元组b=(sj,oi,t)添加到Vresult中,并将oi添加到W中,步骤(1d)全部结束;
若|U|为偶数、
Figure BDA00028607923600000415
和t<hk同时成立,则将传染行为三元组b=(sj,oi,hk)添加到Vresult中,并将oi添加到W中,步骤(1d)全部结束;
(1e)判断二分监测点是否全部处理完,若没处理完,则取下一个二分监测点为活动监测点,并转步骤(1c);若处理完,则表明传染行为挖掘结束,Vresult即为最终确定的传染行为挖掘结果集。
本发明方法简单,可以保证未感染对象被感染且成为传染源时间的准确性,不会出现漏解,通过本方法可以实现高效的传染行为挖掘。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (4)

1.一种基于二分过滤的移动对象传染行为挖掘方法,其特征在于:令传染行为挖掘结果以传染行为三元组b=(from,to,ts)表示,其中from表示传染源对象,to表示被from传染的对象,time表示to被from传染的时间,若from不存在,则to为初始传染源对象,Vresult为已确定的传染行为集合,W为传染源集合,具体步骤如下:
(1a)根据时间窗口阈值和移动对象的轨迹计算得到二分监测点集合HT
(1b)将初始传染源对象以传染行为三元组形式加入集合Vresult,并将每一个初始传染源加入集合W,并选择HT中的第一个二分监测点作为活动监测点;
(1c)在当前活动监测点hk时刻,对移动对象轨迹集合O中尚未感染的每一个对象oi进行分析,将W中可能传染oi的传染源对象添加到集合Pi中;
(1d)判断Pi是否为空,若不为空,则利用Pi中最早传染oi的传染对象s及传染时间t构造新的传染行为三元组(s,oi,t),并将该三元组加入Vresult,将oi加入W;否则,当前活动监测点处理完毕;
(1e)判断二分监测点是否全部处理完,若没处理完,则取下一个二分监测点为活动监测点,并转步骤(1c);若处理完,则表明传染行为挖掘结束,Vresult即为最终确定的传染行为挖掘结果集。
2.根据权利要求1所述一种基于二分过滤的移动对象传染行为挖掘方法方法,其特征在于:所述步骤(1a)中计算得到二分监测点集合的过程如下:令|U|为时间窗口阈值,L为移动对象轨迹的长度,则二分监测点集合
Figure FDA0002860792350000011
Figure FDA0002860792350000012
3.根据权利要求2所述一种基于二分过滤的移动对象传染行为挖掘方法,其特征在于:所述步骤(1c)包括以下步骤:令d为对象传染的距离阈值,
Figure FDA0002860792350000013
为对象oi与sj的状态量,初始值设置为0,在当前活动监测点hk时刻,对传染源集合W中的每一个传染源对象sj,执行如下操作:
(1c1)计算oi与sj在hk时刻的欧氏距离Dist(oi,sj,hk),若Dist(oi,sj,hk)≤d成立,则令
Figure FDA0002860792350000014
若Dist(oi,sj,hk)>d且
Figure FDA0002860792350000015
成立,则令
Figure FDA0002860792350000016
若Dist(oi,sj,t)>d成立且t>hk成立,则
Figure FDA0002860792350000017
(1c2)判断当前
Figure FDA0002860792350000021
的状态,若
Figure FDA0002860792350000022
成立,则计算oi与sj在hk-1与hk之间每个时刻t的距离Dist(oi,sj,t),仅当所有时刻的距离均小于等于d时,将sj添加到集合Pi;否则令
Figure FDA0002860792350000023
4.根据权利要求3所述一种基于二分过滤的移动对象传染行为挖掘方法,其特征在于:所述步骤(1d)包括以下步骤:令
Figure FDA0002860792350000024
表示oi与sj距离小于等于d的时长,在hk-2与hk-1之间以及hk与hk+1之间,按照时间先后顺序考察每一个时间点t,并对集合Pi中每一个可能传染oi的传染源对象sj,执行以下操作:
(1d1)计算oi与sj在t时刻的距离Dist(oi,sj,t),若Dist(oi,sj,t)≤d成立,则令
Figure FDA0002860792350000025
否则
Figure FDA0002860792350000026
(1d2)根据当前
Figure FDA0002860792350000027
|U|、t和hk的情况,对应执行如下操作:
若|U|为奇数和
Figure FDA0002860792350000028
同时成立,则将传染行为三元组b=(sj,oi,t)添加到Vresult中,并将oi添加到W中,步骤(1d)全部结束;
若|U|为偶数、
Figure FDA0002860792350000029
和t>hk同时成立,则将传染行为三元组b=(sj,oi,t)添加到Vresult中,并将oi添加到W中,步骤(1d)全部结束;
若|U|为偶数、
Figure FDA00028607923500000210
和t<hk同时成立,则将传染行为三元组b=(sj,oi,hk)添加到Vresult中,并将oi添加到W中,步骤(1d)全部结束。
CN202011566396.8A 2020-12-25 2020-12-25 一种基于二分过滤的移动对象传染行为挖掘方法 Active CN112632151B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011566396.8A CN112632151B (zh) 2020-12-25 2020-12-25 一种基于二分过滤的移动对象传染行为挖掘方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011566396.8A CN112632151B (zh) 2020-12-25 2020-12-25 一种基于二分过滤的移动对象传染行为挖掘方法

Publications (2)

Publication Number Publication Date
CN112632151A true CN112632151A (zh) 2021-04-09
CN112632151B CN112632151B (zh) 2023-02-10

Family

ID=75325051

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011566396.8A Active CN112632151B (zh) 2020-12-25 2020-12-25 一种基于二分过滤的移动对象传染行为挖掘方法

Country Status (1)

Country Link
CN (1) CN112632151B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107076746A (zh) * 2014-08-14 2017-08-18 米密德诊断学有限公司 使用流形和超平面进行生物学数据的计算机分析
CN109241126A (zh) * 2018-06-29 2019-01-18 武汉理工大学 一种基于r*树索引的时空轨迹聚集模式挖掘算法
US20190149438A1 (en) * 2016-07-12 2019-05-16 Huawei Technologies Co., Ltd. Data Processing Method and Apparatus
CN110018670A (zh) * 2019-03-28 2019-07-16 浙江大学 一种基于动态关联规则挖掘的工业过程异常工况预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107076746A (zh) * 2014-08-14 2017-08-18 米密德诊断学有限公司 使用流形和超平面进行生物学数据的计算机分析
US20190149438A1 (en) * 2016-07-12 2019-05-16 Huawei Technologies Co., Ltd. Data Processing Method and Apparatus
CN109241126A (zh) * 2018-06-29 2019-01-18 武汉理工大学 一种基于r*树索引的时空轨迹聚集模式挖掘算法
CN110018670A (zh) * 2019-03-28 2019-07-16 浙江大学 一种基于动态关联规则挖掘的工业过程异常工况预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
郝世选: "复杂软件程序运行异常源点准确定位仿真分析", 《计算机仿真》 *

Also Published As

Publication number Publication date
CN112632151B (zh) 2023-02-10

Similar Documents

Publication Publication Date Title
Sheng et al. Iterative multiple hypothesis tracking with tracklet-level association
Au et al. Improving PacBio long read accuracy by short read alignment
EP3674914A1 (en) Multi-party data joint query method, device, server and storage medium
JP2019200766A (ja) 勘定ノード(節点)の知的選択方法
CN109902203B (zh) 基于边的随机游走的网络表示学习方法和装置
WU Entire solutions for a two-component competition system in a lattice
CN114238958B (zh) 一种基于溯源聚类及图序列化的入侵检测方法及系统
CN111292356B (zh) 运动轨迹与道路的匹配方法及装置
CN106384050A (zh) 一种基于最大频繁子图挖掘的动态污点分析方法
CN111858801A (zh) 道路信息的挖掘方法、装置、电子设备及存储介质
Jin et al. Ergodicity and long-time behavior of the Random Batch Method for interacting particle systems
CN110019845B (zh) 一种基于知识图谱的社区演化分析方法及装置
CN112632151B (zh) 一种基于二分过滤的移动对象传染行为挖掘方法
CN114020593B (zh) 一种基于轨迹聚类的异质流程日志采样方法与系统
Warren et al. Genome halving with double cut and join
WO2018053761A1 (zh) 一种数据处理方法、装置及计算节点
CN107480804B (zh) 一种基于线面空间关系的迷宫求解方法
CN105631210A (zh) 一种基于MapReduce的有向图强连通分量分析方法
CN105138445A (zh) 基于概率行为关系挖掘业务流程中不可见任务的新方法
Xia et al. A median solver and phylogenetic inference based on double-cut-and-join sorting
CN108111968A (zh) 一种基于泛化的位置隐私保护方法
CN112084238B (zh) 一种基于轨迹数据的传染模式挖掘方法
CN114186008A (zh) 一种无人作业的料堆挖掘方法、装置、设备及存储介质
Lengler et al. Analysing equilibrium states for population diversity
Emek et al. On the power of graphical reconfigurable circuits

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant