CN116610849A - 获取轨迹相似的移动对象的方法、装置、设备及存储介质 - Google Patents
获取轨迹相似的移动对象的方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN116610849A CN116610849A CN202310420801.2A CN202310420801A CN116610849A CN 116610849 A CN116610849 A CN 116610849A CN 202310420801 A CN202310420801 A CN 202310420801A CN 116610849 A CN116610849 A CN 116610849A
- Authority
- CN
- China
- Prior art keywords
- moving object
- track
- similarity
- target
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000004364 calculation method Methods 0.000 claims abstract description 47
- 238000012216 screening Methods 0.000 claims abstract description 25
- 230000015654 memory Effects 0.000 claims description 23
- 230000003321 amplification Effects 0.000 claims description 8
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 8
- 239000002609 medium Substances 0.000 description 14
- 238000012545 processing Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 231100001263 laboratory chemical safety summary Toxicity 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010921 in-depth analysis Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000012120 mounting media Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/907—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/909—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Library & Information Science (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Image Analysis (AREA)
Abstract
本申请实施例公开了一种获取轨迹相似的移动对象的方法、装置、设备及存储介质。本申请实施例提供的技术方案,通过获取满足时空相似度要求的第一类移动对象;根据预设相似度公式和第一目标移动对象的轨迹,对所述第一类移动对象的轨迹进行相似度计算,得到轨迹相似度值;根据所述轨迹相似度值筛选出满足预设要求的第二目标移动对象,所述第二目标移动对象与第一目标移动对象的轨迹相似,能够解决轨迹相似度计算精确度低的问题,提升轨迹相似度计算精确度,提高获取轨迹相似的移动对象的准确性。
Description
技术领域
本申请实施例涉及数据挖掘技术领域,尤其涉及一种获取轨迹相似的移动对象的方法、装置、设备及存储介质。
背景技术
近年来,随着RFID和GPS等无线通信技术的不断发展和广泛应用,全球范围内的各种移动对象都可以得到有效的定位和跟踪,由此产生了海量的移动对象轨迹数据,而这些数据中蕴含着丰富的信息。移动对象的时空轨迹是记录移动对象位置、属性和时间的序列。时间、空间和属性是地理现象的三个基本特征,也是GIS数据库的三种基本组成数据。
目前大部分应用只对移动对象的原始轨迹进行了简单的利用,并没有进行更加深入的分析。移动对象轨迹相似度度量在轨迹挖掘领域和基于位置的服务等领域具有广阔的应用前景。此外,移动对象轨迹相似度度量还可以用于公共安全、交通调度、城市规划、推荐系统、广告系统、隐私保护以及异常检测等领域中。
目前对于移动对象的轨迹相似度计算大多集中于时间相似度方面,计算得到的轨迹相似度维度单一,导致精确度较低。
发明内容
本申请实施例提供一种获取轨迹相似的移动对象的方法、装置、设备及存储介质,能够解决轨迹相似度计算精确度低的问题,提升轨迹相似度计算精确度,提高获取轨迹相似的移动对象的准确性。
在第一方面,本申请实施例提供了一种获取轨迹相似的移动对象的方法,包括:
获取满足时空相似度要求的第一类移动对象;
根据预设相似度公式和第一目标移动对象的轨迹,对所述第一类移动对象的轨迹进行相似度计算,得到轨迹相似度值;
根据所述轨迹相似度值筛选出满足预设要求的第二目标移动对象,所述第二目标移动对象与第一目标移动对象的轨迹相似。
进一步的,所述获取满足时空相似度要求的第一类移动对象,包括:
获取所述第一目标移动对象经过的目标卡口和对应过卡时间;
筛选出满足时空相似度要求的第一类移动对象,所述时空相似度要求包括移动对象经过目标卡口的过卡时间和所述第一目标移动对象经过目标卡口的过卡时间的偏差不超过第一阈值。
进一步的,所述获取满足时空相似度要求的第一类移动对象之后,包括:
获取所述第一目标移动对象经过的所有卡口的序列,得到目标卡口序列;
获取所述第一类移动对象经过的所有卡口的序列,得到待比对卡口序列;
将所述待比对卡口序列和所述目标卡口序列进行比较处理,得到最长公共子序列。
进一步的,所述根据预设相似度公式和第一目标移动对象的轨迹,对所述第一类移动对象的轨迹进行相似度计算,得到轨迹相似度值,包括:
根据所述第一目标移动对象和所述第一类移动对象中对应的移动对象经过卡口的时间差值以及所述最长公共子序列进行计算处理,得到对应的两条轨迹经过所有相同卡口的时间差的绝对值的期望值;
根据所述两条轨迹经过所有相同卡口的时间差的绝对值的期望值、所述最长公共子序列、所述第一目标移动对象轨迹中经过的卡口数量、放大因子和时间偏差容忍度进行计算处理,得到所述第一类移动对象中每一移动对象的轨迹相似度值。
进一步的,所述根据所述第一目标移动对象和所述第一类移动对象中对应的移动对象经过卡口的时间差值以及所述最长公共子序列进行计算处理,得到对应的两条轨迹经过所有相同卡口的时间差的绝对值的期望值,包括:
根据公式计算得到对应的两条轨迹经过所有相同卡口的时间差的绝对值的期望值,其中E(ΔT)代表两条轨迹经过所有相同卡口的时间差的绝对值的期望值,p代表最长公共子序列,Δti代表所述第一目标移动对象和所述第一类移动对象中对应的移动对象经过对应卡口的时间差值。
进一步的,所述根据所述两条轨迹经过所有相同卡口的时间差的绝对值的期望值、所述最长公共子序列、所述第一目标移动对象轨迹中经过的卡口数量、放大因子和时间偏差容忍度进行计算处理,得到所述第一类移动对象中每一移动对象的轨迹相似度值,包括:
根据公式
计算得到所述第一类移动对象中每一移动对象的轨迹相似度值,其中sim代表每一移动对象的轨迹相似度值,E(ΔT)代表两条轨迹经过所有相同卡口的时间差的绝对值的期望值,p代表最长公共子序列,p0代表第一目标移动对象轨迹中经过的卡口数量,Mf代表放大因子,tt代表时间偏差容忍度。
进一步的,所述根据所述轨迹相似度值筛选出满足预设要求的第二目标移动对象,包括:
根据所述轨迹相似度值,筛选出轨迹相似度值最高的移动对象为所述第二目标移动对象;
或,根据所述轨迹相似度值,筛选出轨迹相似度值超过第二阈值的移动对象为所述第二目标移动对象。
在第二方面,本申请实施例提供了一种获取轨迹相似的移动对象的装置,包括:
第一类移动对象确定单元,用于获取满足时空相似度要求的第一类移动对象;
轨迹相似度计算单元,用于根据预设相似度公式和第一目标移动对象的轨迹,对所述第一类移动对象的轨迹进行相似度计算,得到轨迹相似度值;
第二目标移动对象获取单元,用于根据所述轨迹相似度值筛选出满足预设要求的第二目标移动对象,所述第二目标移动对象与第一目标移动对象的轨迹相似。
进一步的,所述第一类移动对象确定单元,还用于获取所述第一目标移动对象经过的目标卡口和对应过卡时间;
筛选出满足时空相似度要求的第一类移动对象,所述时空相似度要求包括移动对象经过目标卡口的过卡时间和所述第一目标移动对象经过目标卡口的过卡时间的偏差不超过第一阈值。
进一步的,所述轨迹相似度计算单元,还用于获取所述第一目标移动对象经过的所有卡口的序列,得到目标卡口序列;
获取所述第一类移动对象经过的所有卡口的序列,得到待比对卡口序列;
将所述待比对卡口序列和所述目标卡口序列进行比较处理,得到最长公共子序列。
进一步的,所述轨迹相似度计算单元,还用于根据所述第一目标移动对象和所述第一类移动对象中对应的移动对象经过卡口的时间差值以及所述最长公共子序列进行计算处理,得到对应的两条轨迹经过所有相同卡口的时间差的绝对值的期望值;
根据所述两条轨迹经过所有相同卡口的时间差的绝对值的期望值、所述最长公共子序列、所述第一目标移动对象轨迹中经过的卡口数量、放大因子和时间偏差容忍度进行计算处理,得到所述第一类移动对象中每一移动对象的轨迹相似度值。
进一步的,所述轨迹相似度计算单元,还用于根据公式
计算得到对应的两条轨迹经过所有相同卡口的时间差的绝对值的期望值,其中E(ΔT)代表两条轨迹经过所有相同卡口的时间差的绝对值的期望值,p代表最长公共子序列,Δti代表所述第一目标移动对象和所述第一类移动对象中对应的移动对象经过对应卡口的时间差值。
进一步的,所述轨迹相似度计算单元,还用于根据公式
计算得到所述第一类移动对象中每一移动对象的轨迹相似度值,其中sim代表每一移动对象的轨迹相似度值,E(ΔT)代表两条轨迹经过所有相同卡口的时间差的绝对值的期望值,p代表最长公共子序列,p0代表第一目标移动对象轨迹中经过的卡口数量,Mf代表放大因子,tt代表时间偏差容忍度。
进一步的,所述第二目标移动对象获取单元,用于根据所述轨迹相似度值,筛选出轨迹相似度值最高的移动对象为所述第二目标移动对象;
或,根据所述轨迹相似度值,筛选出轨迹相似度值超过第二阈值的移动对象为所述第二目标移动对象。
在第三方面,本申请实施例提供了一种获取轨迹相似的移动对象的设备,包括:
存储器以及一个或多个处理器;
所述存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的获取轨迹相似的移动对象的方法。
在第四方面,本申请实施例提供了一种存储计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如第一方面所述的获取轨迹相似的移动对象的方法。
本申请实施例通过获取满足时空相似度要求的第一类移动对象,根据预设相似度公式和第一目标移动对象的轨迹,对第一类移动对象的轨迹进行相似度计算,得到轨迹相似度值,根据轨迹相似度值筛选出满足预设要求的第二目标移动对象,第二目标移动对象与第一目标移动对象的轨迹相似。采用上述技术手段,可以通过满足时空相似度要求后再通过预设相似度公式进行轨迹相似度值的计算,以此可避免轨迹相似度计算精确度低的问题,提升轨迹相似度计算精确度。此外,通过计算得到的轨迹相似度值筛选出满足预设要求的与第一目标移动对象轨迹相似的第二目标移动对象,可以在轨迹相似度值的前提下进一步地筛选出轨迹相似的移动对象,提高获取轨迹相似的移动对象的准确性。
附图说明
图1是本申请实施例提供的一种获取轨迹相似的移动对象的方法的流程图;
图2是本申请实施例提供的一种轨迹对比示意图;
图3是本申请实施例提供的另一种获取轨迹相似的移动对象的方法的流程图;
图4是本申请实施例提供的一种获取轨迹相似的移动对象的装置的结构示意图;
图5是本申请实施例提供的一种获取轨迹相似的移动对象的设备的结构示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面结合附图对本申请具体实施例作进一步的详细描述。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
本申请提供的获取轨迹相似的移动对象的方法、装置、设备及存储介质,旨在获取轨迹相似的移动对象时,通过满足时空相似度要求后再通过预设相似度公式进行轨迹相似度值的计算,以此提升轨迹相似度计算精确度。此外,通过计算得到的轨迹相似度值筛选出满足预设要求的与第一目标移动对象轨迹相似的第二目标移动对象,以在轨迹相似度值的前提下进一步地筛选出轨迹相似的移动对象,提高获取轨迹相似的移动对象的准确性。相对于传统的轨迹相似度计算方式,其通常集中于时间相似度方面,计算得到的轨迹相似度维度单一,导致精确度较低。基于此,提供本申请实施例的获取轨迹相似的移动对象的方法,以解决现有轨迹相似度计算精确度低的问题。
图1给出了本申请实施例提供的一种获取轨迹相似的移动对象的方法的流程图,本实施例中提供的获取轨迹相似的移动对象的方法可以由获取轨迹相似的移动对象的设备执行,该获取轨迹相似的移动对象的设备可以通过软件和/或硬件的方式实现,该获取轨迹相似的移动对象的设备可以是两个或多个物理实体构成,也可以是一个物理实体构成。一般而言,该获取轨迹相似的移动对象的设备可以是终端设备,如计算机设备等。
下述以计算机设备为执行获取轨迹相似的移动对象的方法的主体为例,进行描述。参照图1,该获取轨迹相似的移动对象的方法具体包括:
S101、获取满足时空相似度要求的第一类移动对象。
移动对象可以理解为抓拍得到的车辆或人员等。随着RFID和GPS等无线通信技术的不断发展和广泛应用,全球范围内的各种移动对象都可以得到有效的定位和跟踪,由此产生了海量的移动对象轨迹数据,而这些数据中蕴含着丰富的信息。移动对象的时空轨迹是记录移动对象位置、属性和时间的序列。
在进行获取轨迹相似移动对象之前,需要确定第一目标移动对象,确定第一目标移动对象之后,则可以根据第一目标移动对象的轨迹寻找轨迹相似的第二目标移动对象。基于存在海量的移动对象的轨迹数据,因此需要层层筛选才能得到最终的相似轨迹。首先,筛选出满足时空相似度要求的第一类移动对象。通过获取第一目标移动对象经过的目标卡口和对应过卡时间,筛选出满足时空相似度要求的第一类移动对象,时空相似度要求包括移动对象经过目标卡口的过卡时间和第一目标移动对象经过目标卡口的过卡时间的偏差不超过第一阈值。
示例性的,计算相似度之前,对于轨迹数据按照时间进行筛选,保证时间跨度上的接近。图2是本申请实施例提供的一种轨迹对比示意图,参照图2,假设第一阈值为1分钟,第一目标移动对象经过目标卡口A的过卡时间为8:00,经过目标卡口B的时间为9:00,对应的某个移动对象a在相同日期经过目标卡口A的过卡时间为8:01,经过目标卡口B的时间为9:01,则认为该移动对象A与第一目标移动对象符合时空相似度要求,该移动对象A属于第一类移动对象。通过上述方式可以找到多个符合时空相似度要求的第一类移动对象。
需要说明的是,在判断是否满足时空相似度时,对经过的每个卡口的过卡时间的偏差均值纳入考虑的范围。
S102、根据预设相似度公式和第一目标移动对象的轨迹,对所述第一类移动对象的轨迹进行相似度计算,得到轨迹相似度值。
获取满足时空相似度要求的第一类移动对象之后,获取第一目标移动对象经过的所有卡口的序列,得到目标卡口序列。获取第一类移动对象经过的所有卡口的序列,得到待比对卡口序列。将待比对卡口序列和目标卡口序列进行比较处理,得到最长公共子序列。
示例性的,轨迹中的空间维度对应的就是卡口序列。通过时间排序后的目标卡口序列和待比对卡口序列,看作是两条对象序列,每个对象元素就是一个卡口号字符串。在空间相似度上,通过LCSS(Longest Common Subsquence最长公共子序列)算法进行处理,例如字符串的LCSS算法,比较的最小单元是每个卡口号字符串,而不是单个字符串。通过对两条对象序列进行LCSS算法处理,求出最长公共子序列。最长公共子序列指满足指定时间差内经过同一卡口条件的卡口数量。最长公共子序列作为后续计算轨迹相似度的主体轨迹序列。
根据第一目标移动对象和第一类移动对象中对应的移动对象经过卡口的时间差值以及最长公共子序列进行计算处理,得到对应的两条轨迹经过所有相同卡口的时间差的绝对值的期望值。
在一实施例中,根据公式
计算得到对应的两条轨迹经过所有相同卡口的时间差的绝对值的期望值,其中E(ΔT)代表两条轨迹经过所有相同卡口的时间差的绝对值的期望值,p代表最长公共子序列,Δti代表第一目标移动对象和第一类移动对象中对应的移动对象经过对应卡口的时间差值。
计算得到两条轨迹经过所有相同卡口的时间差的绝对值的期望值后,根据两条轨迹经过所有相同卡口的时间差的绝对值的期望值、最长公共子序列、第一目标移动对象轨迹中经过的卡口数量、放大因子和时间偏差容忍度进行计算处理,得到第一类移动对象中每一移动对象的轨迹相似度值。
在一实施例中,根据公式
计算得到所述第一类移动对象中每一移动对象的轨迹相似度值,其中sim代表每一移动对象的轨迹相似度值,E(ΔT)代表两条轨迹经过所有相同卡口的时间差的绝对值的期望值,p代表最长公共子序列,p0代表第一目标移动对象轨迹中经过的卡口数量,Mf代表放大因子,tt代表时间偏差容忍度。
在一实施例中,假设需要计算第一类移动对象中的某个移动对象a与第一目标移动对象的轨迹相似度值,则通过公式
计算得到移动对象a的轨迹和第一目标移动对象的轨迹经过所有卡口的时间差的绝对值的期望值E(ΔT),其中p是移动对象a的轨迹和第一目标移动对象的轨迹的最长公共子序列,p是按时间顺序排序的两条轨迹的卡口序列的最长公共字符串长度,即给定时间差内(例如2min以内)两个移动对象(例如两辆车)经过相同卡口的数量。Δti代表第一目标移动对象和移动对象a经过对应卡口的时间差值。计算得到移动对象a的轨迹和第一目标移动对象的轨迹经过所有卡口的时间差的绝对值的期望值E(ΔT)之后,根据下述公式计算轨迹相似度值,
其中,sim代表移动对象a与第一目标移动对象的轨迹相似度值,p0代表第一目标移动对象(例如指定车辆)轨迹中经过的卡口数量,Mf代表相似度计算结果的放大因子,tt代表时间偏差容忍度。如果Mf=1,则计算的轨迹相似度值在[0,1]之间。tt是时间偏差容忍度,不能为零,即两个移动对象(例如两辆车)经过同一卡口时可接受的最大时间偏差(例如2min)。
上述,通过筛选出符合时空相似度要求的第一类移动对象后,再对第一类移动对象中的每一移动对象进行轨迹相似度值计算,计算得到每一移动对象与第一目标移动对象的轨迹相似度值,提高了轨迹相似度计算的精确度,有助于提高后续的获取轨迹相似的第二目标移动对象的精确度。
S103、根据所述轨迹相似度值筛选出满足预设要求的第二目标移动对象,所述第二目标移动对象与第一目标移动对象的轨迹相似。
计算得到第一类移动对象中每一移动对象与第一目标移动对象的轨迹相似度值后,根据轨迹相似度值筛选出满足预设要求的第二目标移动对象。预设要求可以是轨迹相似度值最高的或者轨迹相似度值超过第二阈值的。根据计算得到的每一移动对象与第一目标移动对象的轨迹相似度值,筛选出轨迹相似度值最高的一个移动对象作为第二目标移动对象。或者根据计算得到的每一移动对象与第一目标移动对象的轨迹相似度值,筛选出轨迹相似度值超过第二阈值的移动对象为第二目标移动对象。
上述,根据轨迹相似度值筛选出满足预设要求的第二目标移动对象,即可以得到与第一目标移动对象轨迹相似的第二目标移动对象。例如,在追踪行动中,通过对其中一个成员(第一目标移动对象)轨迹查询出具有相似活动的人(第二目标移动对象),从而可以找到其他成员。
图3是本申请实施例提供的另一种获取轨迹相似的移动对象的方法的流程图,参照图3,该获取轨迹相似的移动对象的方法,包括:
S201、抓拍移动对象。
通过加强型WIFI或抓拍的方式,抓拍得到对应的移动对象的原始轨迹数据。通过抓拍的形式还可以确定对应的待分析的第一目标移动对象。
S202、数据处理。
抽取上述抓拍得到的移动对象的原始轨迹数据进行数据处理,得到对应的关联统计分布结果表和关联明细表。例如,抽取每小时数据进行数据处理,得到对应的关联统计分布结果表和关联明细表。
S203、关联统计分布结果表。
抽取上述抓拍得到的移动对象的原始轨迹数据进行数据处理,得到对应的关联统计分布结果表。
S204、关联明细表。
抽取上述抓拍得到的移动对象的原始轨迹数据进行数据处理,得到对应的关联明细表。
S205、LCSS计算。
根据数据处理得到的关联明细表中的轨迹数据进行LCSS计算处理,得到对应两条轨迹的最长公共子序列。其中一条轨迹是第一目标移动对象的轨迹,另一条为待计算轨迹相似度的移动对象轨迹。
S206、同行结果日表。
通过LCSS计算处理,得到对应两条轨迹的最长公共子序列,并生成对应的同行结果日表,以供后续进行轨迹相似度计算所用。
S207、相似度计算。
抓取同行结果日表中数据,根据同行结果日表中数据和预设相似度公式进行相似度计算处理,可以得到每一移动对象的轨迹与第一目标移动对象轨迹的轨迹相似度值。
S208、同行结果表。
根据计算得到的每一移动对象的轨迹与第一目标移动对象轨迹的轨迹相似度值,生成同行结果表,并输出值对应的客户端,以供用户查看。在进行轨迹相似度计算时,可以从历史同行结果表中抓取对应的历史结果,以供参考。在对应的同行结果表中,认为轨迹相似度值最高的移动对象为第二目标移动对象,或,认为出轨迹相似度值超过第二阈值的移动对象为第二目标移动对象。第二目标移动对象可以理解为与第一目标移动对象轨迹相似度最高的移动对象。
上述,依据车辆或人员的轨迹相似度在时间和空间维度上的约束,引入LCSS算法,遵循最长公共子序列的原理,抽象出轨迹中的卡口序列(例如设备号序列),进行两个移动对象(例如车辆或人员)的两条轨迹相似度的计算,并结合Spark并行计算和Hive数据仓库存储等,搭建数据分析平台,实现轨迹相似的移动对象的获取。上述实施方式,可以满足实际车辆或人员的轨迹在时间和空间上的相似性,数据分析计算在性能上可以满足前台业务的搜索。
上述,通过获取满足时空相似度要求的第一类移动对象,根据预设相似度公式和第一目标移动对象的轨迹,对第一类移动对象的轨迹进行相似度计算,得到轨迹相似度值,根据轨迹相似度值筛选出满足预设要求的第二目标移动对象,第二目标移动对象与第一目标移动对象的轨迹相似。采用上述技术手段,可以通过满足时空相似度要求后再通过预设相似度公式进行轨迹相似度值的计算,提升轨迹相似度计算精确度。此外,通过计算得到的轨迹相似度值筛选出满足预设要求的与第一目标移动对象轨迹相似的第二目标移动对象,可以在轨迹相似度值的前提下进一步地筛选出轨迹相似的移动对象,提高获取轨迹相似的移动对象的准确性。
在上述实施例的基础上,图4为本申请实施例提供的一种获取轨迹相似的移动对象的装置的结构示意图。参考图4,本实施例提供的获取轨迹相似的移动对象的装置具体包括:第一类移动对象确定单元21、轨迹相似度计算单元22和第二目标移动对象获取单元23。
其中,第一类移动对象确定单元21,用于获取满足时空相似度要求的第一类移动对象;
轨迹相似度计算单元22,用于根据预设相似度公式和第一目标移动对象的轨迹,对所述第一类移动对象的轨迹进行相似度计算,得到轨迹相似度值;
第二目标移动对象获取单元23,用于根据所述轨迹相似度值筛选出满足预设要求的第二目标移动对象,所述第二目标移动对象与第一目标移动对象的轨迹相似。
进一步的,所述第一类移动对象确定单元21,还用于获取所述第一目标移动对象经过的目标卡口和对应过卡时间;
筛选出满足时空相似度要求的第一类移动对象,所述时空相似度要求包括移动对象经过目标卡口的过卡时间和所述第一目标移动对象经过目标卡口的过卡时间的偏差不超过第一阈值。
进一步的,所述轨迹相似度计算单元22,还用于获取所述第一目标移动对象经过的所有卡口的序列,得到目标卡口序列;
获取所述第一类移动对象经过的所有卡口的序列,得到待比对卡口序列;
将所述待比对卡口序列和所述目标卡口序列进行比较处理,得到最长公共子序列。
进一步的,所述轨迹相似度计算单元22,还用于根据所述第一目标移动对象和所述第一类移动对象中对应的移动对象经过卡口的时间差值以及所述最长公共子序列进行计算处理,得到对应的两条轨迹经过所有相同卡口的时间差的绝对值的期望值;
根据所述两条轨迹经过所有相同卡口的时间差的绝对值的期望值、所述最长公共子序列、所述第一目标移动对象轨迹中经过的卡口数量、放大因子和时间偏差容忍度进行计算处理,得到所述第一类移动对象中每一移动对象的轨迹相似度值。
进一步的,所述轨迹相似度计算单元22,还用于根据公式
计算得到对应的两条轨迹经过所有相同卡口的时间差的绝对值的期望值,其中E(ΔT)代表两条轨迹经过所有相同卡口的时间差的绝对值的期望值,p代表最长公共子序列,Δti代表所述第一目标移动对象和所述第一类移动对象中对应的移动对象经过对应卡口的时间差值。
进一步的,所述轨迹相似度计算单元22,还用于根据公式
计算得到所述第一类移动对象中每一移动对象的轨迹相似度值,其中sim代表每一移动对象的轨迹相似度值,E(ΔT)代表两条轨迹经过所有相同卡口的时间差的绝对值的期望值,p代表最长公共子序列,p0代表第一目标移动对象轨迹中经过的卡口数量,Mf代表放大因子,tt代表时间偏差容忍度。
进一步的,所述第二目标移动对象获取单元23,用于根据所述轨迹相似度值,筛选出轨迹相似度值最高的移动对象为所述第二目标移动对象;
或,根据所述轨迹相似度值,筛选出轨迹相似度值超过第二阈值的移动对象为所述第二目标移动对象。
上述,通过获取满足时空相似度要求的第一类移动对象,根据预设相似度公式和第一目标移动对象的轨迹,对第一类移动对象的轨迹进行相似度计算,得到轨迹相似度值,根据轨迹相似度值筛选出满足预设要求的第二目标移动对象,第二目标移动对象与第一目标移动对象的轨迹相似。采用上述技术手段,可以通过满足时空相似度要求后再通过预设相似度公式进行轨迹相似度值的计算,提升轨迹相似度计算精确度。此外,通过计算得到的轨迹相似度值筛选出满足预设要求的与第一目标移动对象轨迹相似的第二目标移动对象,可以在轨迹相似度值的前提下进一步地筛选出轨迹相似的移动对象,提高获取轨迹相似的移动对象的准确性。
本申请实施例提供的获取轨迹相似的移动对象的装置可以用于执行上述实施例提供的获取轨迹相似的移动对象的方法,具备相应的功能和有益效果。
本申请实施例提供了一种获取轨迹相似的移动对象的设备,参照图5,该获取轨迹相似的移动对象的设备包括:处理器31、存储器32、通信模块33、输入装置34及输出装置35。该获取轨迹相似的移动对象的设备中处理器的数量可以是一个或者多个,该获取轨迹相似的移动对象的设备中的存储器的数量可以是一个或者多个。该获取轨迹相似的移动对象的设备的处理器、存储器、通信模块、输入装置及输出装置可以通过总线或者其他方式连接。
存储器32作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本申请任意实施例所述的获取轨迹相似的移动对象的方法对应的程序指令/模块(例如,获取轨迹相似的移动对象的装置中的第一类移动对象确定单元、轨迹相似度计算单元和第二目标移动对象获取单元)。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据设备的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件或其他非易失性固态存储器件。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
通信模块33用于进行数据传输。
处理器31通过运行存储在存储器中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的获取轨迹相似的移动对象的方法。
输入装置34可用于接收输入的数字或字符信息,以及产生与设备的用户设置以及功能控制有关的键信号输入。输出装置35可包括显示屏等显示设备。
上述提供的获取轨迹相似的移动对象的设备可用于执行上述实施例提供的获取轨迹相似的移动对象的方法,具备相应的功能和有益效果。
本申请实施例还提供一种存储计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种获取轨迹相似的移动对象的方法,该获取轨迹相似的移动对象的方法包括:获取满足时空相似度要求的第一类移动对象;根据预设相似度公式和第一目标移动对象的轨迹,对所述第一类移动对象的轨迹进行相似度计算,得到轨迹相似度值;根据所述轨迹相似度值筛选出满足预设要求的第二目标移动对象,所述第二目标移动对象与第一目标移动对象的轨迹相似。
存储介质——任何的各种类型的存储器设备或存储设备。术语“存储介质”旨在包括:安装介质,例如CD-ROM、软盘或磁带装置;计算机系统存储器或随机存取存储器,诸如DRAM、DDR RAM、SRAM、EDO RAM,兰巴斯(Rambus)RAM等;非易失性存储器,诸如闪存、磁介质(例如硬盘或光存储);寄存器或其它相似类型的存储器元件等。存储介质可以还包括其它类型的存储器或其组合。另外,存储介质可以位于程序在其中被执行的第一计算机系统中,或者可以位于不同的第二计算机系统中,第二计算机系统通过网络(诸如因特网)连接到第一计算机系统。第二计算机系统可以提供程序指令给第一计算机用于执行。术语“存储介质”可以包括驻留在不同位置中(例如在通过网络连接的不同计算机系统中)的两个或更多存储介质。存储介质可以存储可由一个或多个处理器执行的程序指令(例如具体实现为计算机程序)。
当然,本申请实施例所提供的一种存储计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的获取轨迹相似的移动对象的方法,还可以执行本申请任意实施例所提供的获取轨迹相似的移动对象的方法中的相关操作。
上述实施例中提供的获取轨迹相似的移动对象的装置、存储介质及获取轨迹相似的移动对象的设备可执行本申请任意实施例所提供的获取轨迹相似的移动对象的方法,未在上述实施例中详尽描述的技术细节,可参见本申请任意实施例所提供的获取轨迹相似的移动对象的方法。
上述仅为本申请的较佳实施例及所运用的技术原理。本申请不限于这里所述的特定实施例,对本领域技术人员来说能够进行的各种明显变化、重新调整及替代均不会脱离本申请的保护范围。因此,虽然通过以上实施例对本申请进行了较为详细的说明,但是本申请不仅仅限于以上实施例,在不脱离本申请构思的情况下,还可以包括更多其他等效实施例,而本申请的范围由权利要求的范围决定。
Claims (10)
1.一种获取轨迹相似的移动对象的方法,其特征在于,包括:
获取满足时空相似度要求的第一类移动对象;
根据预设相似度公式和第一目标移动对象的轨迹,对所述第一类移动对象的轨迹进行相似度计算,得到轨迹相似度值;
根据所述轨迹相似度值筛选出满足预设要求的第二目标移动对象,所述第二目标移动对象与第一目标移动对象的轨迹相似。
2.根据权利要求1所述的方法,其特征在于,所述获取满足时空相似度要求的第一类移动对象,包括:
获取所述第一目标移动对象经过的目标卡口和对应过卡时间;
筛选出满足时空相似度要求的第一类移动对象,所述时空相似度要求包括移动对象经过目标卡口的过卡时间和所述第一目标移动对象经过目标卡口的过卡时间的偏差不超过第一阈值。
3.根据权利要求2所述的方法,其特征在于,所述获取满足时空相似度要求的第一类移动对象之后,包括:
获取所述第一目标移动对象经过的所有卡口的序列,得到目标卡口序列;
获取所述第一类移动对象经过的所有卡口的序列,得到待比对卡口序列;
将所述待比对卡口序列和所述目标卡口序列进行比较处理,得到最长公共子序列。
4.根据权利要求3所述的方法,其特征在于,所述根据预设相似度公式和第一目标移动对象的轨迹,对所述第一类移动对象的轨迹进行相似度计算,得到轨迹相似度值,包括:
根据所述第一目标移动对象和所述第一类移动对象中对应的移动对象经过卡口的时间差值以及所述最长公共子序列进行计算处理,得到对应的两条轨迹经过所有相同卡口的时间差的绝对值的期望值;
根据所述两条轨迹经过所有相同卡口的时间差的绝对值的期望值、所述最长公共子序列、所述第一目标移动对象轨迹中经过的卡口数量、放大因子和时间偏差容忍度进行计算处理,得到所述第一类移动对象中每一移动对象的轨迹相似度值。
5.根据权利要求4所述的方法,其特征在于,所述根据所述第一目标移动对象和所述第一类移动对象中对应的移动对象经过卡口的时间差值以及所述最长公共子序列进行计算处理,得到对应的两条轨迹经过所有相同卡口的时间差的绝对值的期望值,包括:
根据公式
计算得到对应的两条轨迹经过所有相同卡口的时间差的绝对值的期望值,其中E(ΔT)代表两条轨迹经过所有相同卡口的时间差的绝对值的期望值,p代表最长公共子序列,Δti代表所述第一目标移动对象和所述第一类移动对象中对应的移动对象经过对应卡口的时间差值。
6.根据权利要求4所述的方法,其特征在于,所述根据所述两条轨迹经过所有相同卡口的时间差的绝对值的期望值、所述最长公共子序列、所述第一目标移动对象轨迹中经过的卡口数量、放大因子和时间偏差容忍度进行计算处理,得到所述第一类移动对象中每一移动对象的轨迹相似度值,包括:
根据公式
计算得到所述第一类移动对象中每一移动对象的轨迹相似度值,其中sim代表每一移动对象的轨迹相似度值,E(ΔT)代表两条轨迹经过所有相同卡口的时间差的绝对值的期望值,p代表最长公共子序列,p0代表第一目标移动对象轨迹中经过的卡口数量,Mf代表放大因子,tt代表时间偏差容忍度。
7.根据权利要求1所述的方法,其特征在于,所述根据所述轨迹相似度值筛选出满足预设要求的第二目标移动对象,包括:
根据所述轨迹相似度值,筛选出轨迹相似度值最高的移动对象为所述第二目标移动对象;
或,根据所述轨迹相似度值,筛选出轨迹相似度值超过第二阈值的移动对象为所述第二目标移动对象。
8.一种获取轨迹相似的移动对象的装置,其特征在于,包括:
第一类移动对象确定单元,用于获取满足时空相似度要求的第一类移动对象;
轨迹相似度计算单元,用于根据预设相似度公式和第一目标移动对象的轨迹,对所述第一类移动对象的轨迹进行相似度计算,得到轨迹相似度值;
第二目标移动对象获取单元,用于根据所述轨迹相似度值筛选出满足预设要求的第二目标移动对象,所述第二目标移动对象与第一目标移动对象的轨迹相似。
9.一种获取轨迹相似的移动对象的设备,其特征在于,包括:
存储器以及一个或多个处理器;
所述存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7任一所述的方法。
10.一种存储计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由处理器执行时用于执行如权利要求1-7任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310420801.2A CN116610849A (zh) | 2023-04-18 | 2023-04-18 | 获取轨迹相似的移动对象的方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310420801.2A CN116610849A (zh) | 2023-04-18 | 2023-04-18 | 获取轨迹相似的移动对象的方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116610849A true CN116610849A (zh) | 2023-08-18 |
Family
ID=87684439
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310420801.2A Pending CN116610849A (zh) | 2023-04-18 | 2023-04-18 | 获取轨迹相似的移动对象的方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116610849A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116887257A (zh) * | 2023-08-29 | 2023-10-13 | 北京友坤科技有限责任公司 | 车联网卡的滥用识别方法、装置、电子设备和存储介质 |
-
2023
- 2023-04-18 CN CN202310420801.2A patent/CN116610849A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116887257A (zh) * | 2023-08-29 | 2023-10-13 | 北京友坤科技有限责任公司 | 车联网卡的滥用识别方法、装置、电子设备和存储介质 |
CN116887257B (zh) * | 2023-08-29 | 2023-11-28 | 北京友坤科技有限责任公司 | 车联网卡的滥用识别方法、装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110826594B (zh) | 一种轨迹聚类的方法、设备及存储介质 | |
CN112114533B (zh) | 物联网数据处理方法、装置、计算机设备和存储介质 | |
CN109916413B (zh) | 基于网格划分的道路匹配方法、系统、装置和存储介质 | |
Domínguez et al. | Sensing the city with Instagram: Clustering geolocated data for outlier detection | |
WO2012096175A1 (ja) | 行動パタン解析装置、行動パタン解析方法および行動パタン解析プログラム | |
Wang et al. | Early warning of burst passenger flow in public transportation system | |
CN111383005B (zh) | 数字货币流向追踪方法及装置 | |
CN111178932A (zh) | 用户地理画像生成方法、装置、计算机设备和存储介质 | |
JPWO2017168651A1 (ja) | 人口推定装置、プログラム及び人口推定方法 | |
CN111767432B (zh) | 共现对象的查找方法和装置 | |
CN115203354B (zh) | 一种车码轨迹预关联方法、装置、计算机设备及存储介质 | |
CN116610849A (zh) | 获取轨迹相似的移动对象的方法、装置、设备及存储介质 | |
CN112770265A (zh) | 一种行人身份信息获取方法、系统、服务器和存储介质 | |
US8688614B2 (en) | Information processing system | |
Huang et al. | Cloud computing-based map-matching for transportation data center | |
CN104075709B (zh) | 基于稀疏轨迹点数据的移动轨迹确定方法及设备 | |
Jiang | TaxiBJ21: An open crowd flow dataset based on Beijing taxi GPS trajectories | |
CN112699196B (zh) | 轨迹生成方法、装置、终端设备及存储介质 | |
Jiang et al. | VLUC: An empirical benchmark for video-like urban computing on citywide crowd and traffic prediction | |
Bakkal et al. | Modeling and querying trajectories using Neo4j spatial and TimeTree for carpool matching | |
Zhang et al. | An Algorithm for Mining Gradual Moving Object Clusters Pattern From Trajectory Streams. | |
Bashir et al. | An intelligent linear time trajectory data compression framework for smart planning of sustainable metropolitan cities | |
Cao et al. | A grid-based clustering method for mining frequent trips from large-scale, event-based telematics datasets | |
Yumaganov et al. | Map matching algorithm based on dynamic programming approach | |
Lee et al. | Estimation of travel time from taxi gps data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |