CN113312360B - 索引建立方法、装置、设备、存储介质及计算机程序产品 - Google Patents

索引建立方法、装置、设备、存储介质及计算机程序产品 Download PDF

Info

Publication number
CN113312360B
CN113312360B CN202110858068.3A CN202110858068A CN113312360B CN 113312360 B CN113312360 B CN 113312360B CN 202110858068 A CN202110858068 A CN 202110858068A CN 113312360 B CN113312360 B CN 113312360B
Authority
CN
China
Prior art keywords
track
frame
bounding box
node
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110858068.3A
Other languages
English (en)
Other versions
CN113312360A (zh
Inventor
刘音沛
李飞飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Cloud Computing Ltd
Original Assignee
Alibaba Cloud Computing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Cloud Computing Ltd filed Critical Alibaba Cloud Computing Ltd
Priority to CN202110858068.3A priority Critical patent/CN113312360B/zh
Publication of CN113312360A publication Critical patent/CN113312360A/zh
Application granted granted Critical
Publication of CN113312360B publication Critical patent/CN113312360B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases

Abstract

本申请实施例提供了一种索引建立方法、装置、设备、存储介质及计算机程序产品。方法包括:获取数据集,数据集中包括多条轨迹;确定数据集中包括的轨迹数量、数据集中轨迹所对应的轨迹属性以及与数据集相对应的集合属性;基于轨迹数量、轨迹属性和集合属性,建立索引信息。本申请所提供的技术方案,通过获取数据集,而后对数据集进行分析处理,确定数据集中包括的轨迹数量、轨迹所对应的轨迹属性以及与数据集相对应的集合属性,而后基于轨迹数量、轨迹属性和集合属性来建立索引信息,有效地实现了在构建索引信息时,充分考虑了移动轨迹的特有属性,从而使得所建立的索引信息中叶子节点的总体积尽量小,这样有效地提高了数据查询的质量和效率。

Description

索引建立方法、装置、设备、存储介质及计算机程序产品
技术领域
本申请涉及互联网数据处理领域,尤其涉及一种索引建立方法、装置、设备、存储介质及计算机程序产品。
背景技术
移动对象的轨迹作为一类时空对象,由于其结构比较复杂,在进行轨迹查询操作时,通常不能直接采用顺序扫描的方式,而是需要创建索引,并使用索引加速扫描。在创建索引时,使用轨迹的外包框对其进行表示,之后,可以基于所创建的索引进行轨迹查询操作;由于在创建索引时并没有考虑到移动对象的特有属性,因此基于所建立的索引信息进行轨迹查询操作时,不利于提高数据查询的效率。
发明内容
本申请实施例提供一种索引建立方法、装置、设备、存储介质及计算机程序产品,能够充分考虑移动轨迹的特有属性构建索引,使得所建立的索引中叶子节点的总体积尽量小,这样有效地提高了数据查询的质量和效率。
第一方面,本申请实施例提供了一种索引建立方法,包括:
获取数据集,所述数据集中包括多条轨迹;
确定所述数据集中包括的轨迹数量、所述数据集中轨迹所对应的轨迹属性以及与所述数据集相对应的集合属性;
基于所述轨迹数量、轨迹属性和集合属性,建立索引信息。
第二方面,本申请实施例提供了一种索引建立装置,包括:
第一获取模块,用于获取数据集,所述数据集中包括多条轨迹;
第一确定模块,用于确定所述数据集中包括的轨迹数量、所述数据集中轨迹所对应的轨迹属性以及与所述数据集相对应的集合属性;
第一处理模块,用于基于所述轨迹数量、轨迹属性和集合属性,建立索引信息。
第三方面,本申请实施例提供了一种电子设备,包括:存储器、处理器;其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现上述第一方面所示的索引建立方法。
第四方面,本发明实施例提供了一种计算机存储介质,用于储存计算机程序,所述计算机程序使计算机执行时实现上述第一方面所示的索引建立方法。
第五方面,本发明实施例提供了一种计算机程序产品,包括:存储有计算机指令的计算机可读存储介质,当所述计算机指令被一个或多个处理器执行时,致使所述一个或多个处理器执行上述第一方面所示的索引建立方法中的步骤。
第六方面,本发明实施例提供了一种索引建立方法,包括:
获取原始索引信息和待插入轨迹;
确定所述待插入轨迹所对应的轨迹外包框和所述原始索引信息中叶子节点所对应的节点外包框;
在外包框面积和外包框形状的维度,确定与所述轨迹外包框和节点外包框相对应的外包框影响参数;
基于所述外包框影响参数将所述轨迹外包框插入至所述原始索引信息中,生成目标索引信息。
第七方面,本发明实施例提供了一种索引建立装置,包括:
第二获取模块,用于获取原始索引信息和待插入轨迹;
第二确定模块,用于确定所述待插入轨迹所对应的轨迹外包框和所述原始索引信息中叶子节点所对应的节点外包框;
所述第二确定模块,用于在外包框面积和外包框形状的维度,确定与所述轨迹外包框和节点外包框相对应的外包框影响参数;
第二处理模块,用于基于所述外包框影响参数将所述轨迹外包框插入至所述原始索引信息中,生成目标索引信息。
第八方面,本申请实施例提供了一种电子设备,包括:存储器、处理器;其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现上述第六方面所示的索引建立方法。
第九方面,本发明实施例提供了一种计算机存储介质,用于储存计算机程序,所述计算机程序使计算机执行时实现上述第六方面所示的索引建立方法。
第十方面,本发明实施例提供了一种计算机程序产品,包括:存储有计算机指令的计算机可读存储介质,当所述计算机指令被一个或多个处理器执行时,致使所述一个或多个处理器执行上述第六方面所示的索引建立方法中的步骤。
本申请实施例提供的技术方案,通过获取数据集,而后对数据集进行分析处理,确定所述数据集中包括的轨迹数量、轨迹所对应的轨迹属性以及与所述数据集相对应的集合属性,而后基于所述轨迹数量、轨迹属性和集合属性来建立索引信息,从而实现了在构建索引信息时,充分考虑了移动对象所在移动轨迹的特有属性,使得所建立的索引中叶子节点的总体积尽量小,这样有效地提高了数据查询的质量和效率,保证了该方法的实用性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种索引建立方法的场景示意图;
图2为本申请实施例提供的一种索引建立方法的流程示意图;
图3为本申请实施例提供的基于所述轨迹数量、轨迹属性和集合属性,确定用于建立索引信息的区域划分参数的流程示意图;
图4为本申请实施例提供的又一种索引建立方法的流程示意图;
图5为本申请实施例提供的基于所述融合后外包框和所述目标外包框,确定用于标识所述融合后外包框的区域特征以及所述融合后外包框与目标外包框之间的形状相似度的第一参数的流程示意图;
图6为本申请实施例提供的基于所述第一比例信息和所述第二比例信息,确定所述融合后外包框与目标外包框之间的第一形状相似度的流程示意图;
图7为本申请实施例提供的基于所述节点外包框和所述目标外包框,确定用于标识所述节点外包框的区域特征以及所述节点外包框与目标外包框之间的形状相似度的第二参数的流程示意图;
图8为本申请实施例提供的基于所述第二比例信息和所述第三比例信息,确定所述节点外包框与所述目标外包框之间的第二形状相似度的流程示意图;
图9为本申请应用实施例提供的索引建立方法的流程示意图;
图10为本申请实施例提供的一种索引建立装置的结构示意图;
图11为图10所示的索引建立装置所对应的电子设备的结构示意图;
图12为本申请实施例提供的另一种索引建立装置的结构示意图;
图13为图12所示的索引建立装置所对应的电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本申请实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义,“多种”一般包含至少两种,但是不排除包含至少一种的情况。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者系统中还存在另外的相同要素。
另外,下述各方法实施例中的步骤时序仅为一种举例,而非严格限定。
为了方便本领域技术人员理解本申请实施例提供的技术方案,下面对相关技术进行说明:
移动对象的轨迹作为一类时空对象,由于其结构比较复杂,在进行轨迹查询操作时,通常不能直接采用顺序扫描的方式,而是需要创建索引,并使用索引加速扫描。在创建索引时,使用轨迹的外包框对其进行表示,之后,可以基于所创建的索引进行轨迹查询操作;由于在创建索引时并没有考虑到移动对象的特有属性,因此基于所建立的索引信息进行轨迹查询操作时,不利于提高数据查询的效率。
举例来说,在以批量加载(Bulkload)方式建立索引信息时,假设需要索引N个外包框,且每个索引页可以存储扇出值f(为已知值或者估计值)个外包框,其中,扇出值f可以通过系统配置信息、页面大小、数据库类型、外包框的维度和大小、管理信息的开销进行估算获得。在获取到扇出值和索引外包框的数量参数之后,则可以确定一R树中需要创建P=Ceil(N/f)个叶子节点(Ceil为向上取整函数)。
在已有的批量加载算法如排序平铺递归(Sort-Tile-Recursive,简称STR)和希尔伯特R树(Hilbert R-Tree)中,在构建R树时,并不会考虑时空物体的形状因素,而是对各个方向进行相同的处理。其基本思路是:将所有轨迹的外包框表示为其中心点,统计中心点的个数N,求得叶子节点个数P,然后将其开三次方得到每个维度所需的划分数n=
Figure DEST_PATH_IMAGE002
。之后,先按维度1将空间分为点数相同的n份,再按维度2分为点数相同的n份,最后按维度3分为点数相同的n份,则最后每份内点数小于f,而后可以将每份作为一个叶子节点。
然而,基于上述方式所建立的索引信息中并没有考虑到移动对象的特有属性,例如,所建立的索引信息并没有考虑到移动轨迹的移动速度和移动时长,因此,在基于上述所建立的索引信息进行轨迹查询操作时,容易导致数据查询的效率较低。举例来说,现有两个数据集,一个记录了北京市(视为经纬度2*2)1天的出租车轨迹10万条,另一个记录了北京市1年的出租车轨迹3000万条,每条时长一小时左右。在已有的批量加载算法中,由于对经纬度和时间维度不做区分,假设叶子节点的扇出值f为100,则第一个数据集表示为P=1000个叶子节点,时间、经度、纬度各分成10份,每个叶子节点包含的中心时空跨度约为0.2*0.2*2.4小时。对第二个数据集,需要30万个叶子节点,时间、经度、纬度各分成70份,叶子节点包含的中心时空跨度约为0.03*0.03*5天。
通过批量加载方式构建R树的目标是叶子节点的体积最小,但由于索引的是轨迹对象的外包框,所以每个叶子节点的体积实际比叶子节点中包含的外包框中心的时间跨度大。假设单条轨迹的平均外包框大小为0.1*0.1*2小时,则第一个数据集里的叶子节点的平均体积约为(0.2+0.1)*(0.2+0.1)*(2+2.4),但第二个数据集里的叶子节点的平均体积为(0.03+0.1)*(0.03+0.1)*(120+2),可以看到第一个比第二个体积少很多,从而在查询(如相交查询)中效率要高。
通过比较可知,对于时间维度比较长的数据集而言,在建立索引信息时,叶子节点的节点外包框体积比较大,因此,由于在创建索引时并没有考虑到移动对象的特有属性,在基于上述所建立的索引信息进行轨迹查询操作时,通过叶子节点的节点外包框所能够过滤掉的数据有限,从而导致进行精确匹配的数据量会比较大,降低了数据查询操作的质量和效率。
为了解决上述技术问题,本实施例提供了一种索引建立方法、装置及设备,该方法的执行主体可以为索引建立装置,索引建立装置可以通信连接有客户端,参考附图1所示:
其中,客户端可以是任何具有一定数据传输能力的计算设备,此外,客户端的基本结构可以包括:至少一个处理器。处理器的数量取决于客户端的配置和类型。客户端也可以包括存储器,该存储器可以为易失性的,例如RAM,也可以为非易失性的,例如只读存储器(Read-Only Memory,简称ROM)、闪存等,或者也可以同时包括两种类型。存储器内通常存储有操作系统(Operating System,简称OS)、一个或多个应用程序,也可以存储有程序数据等。除了处理单元和存储器之外,客户端还包括一些基本配置,例如网卡芯片、IO总线、显示组件以及一些外围设备等。可选地,一些外围设备可以包括,例如键盘、鼠标、输入笔、打印机等。其它外围设备在本领域中是众所周知的,在此不做赘述。可选地,客户端可以为PC(personal computer)终端、手持终端(例如:智能手机、平板电脑)等。
索引建立装置是指可以在网络虚拟环境中提供索引建立服务的设备,通常是指利用网络进行信息规划、索引建立操作的装置。在物理实现上,索引建立装置可以是任何能够提供计算服务,响应服务请求,并进行处理的设备,例如:可以是集群服务器、常规服务器、云服务器、云主机、虚拟中心等。索引建立装置的构成主要包括处理器、硬盘、内存、系统总线等,和通用的计算机架构类似。
在上述本实施例中,客户端可以与索引建立装置进行网络连接,该网络连接可以是无线或有线网络连接。若客户端与索引建立装置是通信连接,该移动网络的网络制式可以为2G(GSM)、2.5G(GPRS)、3G(WCDMA、TD-SCDMA、CDMA2000、UTMS)、4G(LTE)、4G+(LTE+)、WiMax、5G等中的任意一种。
在本申请实施例中,客户端可以生成或者获取索引建立请求,具体的,本实施例对于客户端生成或者获取索引建立请求的具体实现方式不做限定,例如:客户端上设置有交互界面,通过交互界面获取用户输入的执行操作,通过执行操作来生成索引建立请求;或者,客户端上可以设置有特定接口,通过特定接口可以获取到索引建立请求,使得客户端可以稳定地生成或者获取索引建立请求。在生成或者获取到索引建立请求之后,可以将索引建立请求上传至索引建立装置,以使得索引建立装置可以对所上传的索引建立请求进行索引信息的建立操作。
索引建立装置,用于接收客户端传输的索引建立请求,而后可以基于索引建立请求进行索引信息的建立操作,具体的,可以先基于索引建立请求获取数据集,该数据集中可以包括多条轨迹,上述所包括的多条轨迹用于建立索引信息。在获取到数据集之后,可以对数据集进行分析处理,以确定数据集中包括的轨迹数量、轨迹所对应的轨迹属性以及与数据集相对应的集合属性,其中,轨迹属性可以包括轨迹时长和轨迹移动速度,集合属性可以包括时间跨度信息和空间范围信息等等。
在确定数据集中包括的轨迹数量、轨迹所对应的轨迹属性以及与数据集相对应的集合属性之后,可以基于轨迹数量、轨迹属性和集合属性来进行索引信息的建立操作,进而可以生成与索引建立请求相对应的索引信息,有效地实现了索引信息的建立操作。
本实施例提供的技术方案,通过获取数据集,而后对数据集进行分析处理,确定所述数据集中包括的轨迹数量、轨迹所对应的轨迹属性以及与所述数据集相对应的集合属性,而后基于所述轨迹数量、轨迹属性和集合属性来建立索引信息,从而实现了在构建索引信息时,充分考虑了移动对象所在移动轨迹的特有属性,使得所建立的索引中叶子节点的总体积尽量小,这样在基于索引信息进行轨迹查询操作时,可以过滤掉大部分数据,使得进行精确匹配的数据量比较小,进而有效地提高了数据查询的质量和效率,保证了该方法的实用性。
下面通过一个示例性的应用场景具体说明本申请各个实施例提供的索引建立方法、装置及设备。
图2为本申请实施例提供的一种索引建立方法的流程示意图;参考附图2所示,本实施例提供了一种索引建立方法,该方法的执行主体可以为索引建立装置,可以理解的是,该索引建立装置可以实现为软件、或者软件和硬件的组合。具体的,该索引建立方法可以包括:
步骤S201:获取数据集,数据集中包括多条轨迹。
步骤S202:确定数据集中包括的轨迹数量、数据集中轨迹所对应的轨迹属性以及与数据集相对应的集合属性。
步骤S203:基于轨迹数量、轨迹属性和集合属性,建立索引信息。
下面对上述各个步骤进行详细说明:
步骤S201:获取数据集,数据集中包括多条轨迹。
当存在索引建立需求时,可以基于索引建立需求获取数据集,其中,索引建立需求可以基于定期或者不定期的触发操作而产生,当索引建立需求是基于定期的触发操作所产生时,则索引建立操作可以是周期性的重复性操作;当索引建立需求可以是基于不定期的触发操作所产生的时,则索引建立操作是基于用户需求所触发的一个操作。
为了能够实现索引信息的建立操作,可以获取包括有多条轨迹的数据集,其中,对于数据集而言,数据集中所包括的轨迹信息可以随着时间进行不断的更新,不同时刻的数据集可以对应有不同数量的轨迹信息。本实施例对于获取数据集的具体实现方式不做限定,本领域技术人员可以根据具体的应用场景或者应用需求进行设置,在一些实例中,在数据集存储在预设区域时,通过访问预设区域即可获取数据集。在另一些实例中,在数据集存储在第三设备时,通过与第三设备建立通信链路,而后基于所建立的通信链路获取到存储在第三设备中的数据集,从而有效地保证了对数据集进行获取的准确可靠性。
当然的,数据集的获取方式并不限于上述所描述的实现方式,本领域技术人员也可以采用其他的方式来获取数据集,只要能够保证对数据集进行获取的准确可靠性即可,在此不再赘述。
步骤S202:确定数据集中包括的轨迹数量、数据集中轨迹所对应的轨迹属性以及与数据集相对应的集合属性。
在获取到数据集之后,可以对数据集进行分析处理,以确定数据集中包括的轨迹数量,数据集中轨迹所对应的轨迹属性以及数据集所对应的集合属性。其中,轨迹所对应的轨迹属性可以为数据集中每条轨迹所对应的轨迹属性,此时,轨迹属性的数量与数据集中所包括的轨迹数量相同,即每条轨迹对应有轨迹属性。或者,轨迹所对应的轨迹属性用于标识数据集中所有轨迹的属性信息,此时,轨迹属性的数量为一个,其可以是对数据集中的所有轨迹的轨迹属性进行综合处理所获得的与数据集中所有轨迹相对应的代表轨迹属性。具体的,轨迹属性可以包括:轨迹时长、轨迹移动速度。轨迹时长可以为轨迹平均时长或者轨迹中位时长,轨迹移动速度可以为平均移动速度或者中位移动速度。
在轨迹属性为用于标识数据集中的所有轨迹的代表轨迹属性时,由于数据集中包括多条轨迹,而不同的轨迹可以对应有不同的轨迹时长和轨迹移动速度,因此,为了能够准确地找到能够标识整个数据集中轨迹的代表轨迹属性,则可以对所有轨迹的轨迹时长和轨迹移动速度进行平均处理或者中值处理,从而可以获得平均时长和平均移动速度或者中位时长和中位移动速度,有效地保证了对轨迹属性进行确定的准确可靠性。
另外,与数据集相对应的集合属性可以包括:时间跨度信息、空间范围信息,其中,时间跨度信息是指数据集中全部轨迹所对应的时间跨度,即由最早的一条轨迹和最晚的一条轨迹所确定的时间跨度T。空间范围信息可以是指由数据集中轨迹所对应的区域范围,可以理解的是,在轨迹信息为二维信息时,例如:轨迹信息包括经度信息和纬度信息时,所确定的空间范围信息即是由上述经度信息和纬度信息所确定的区域信息;在轨迹信息为三维信息时,例如:轨迹信息包括经度信息、纬度信息和高度信息时,则所确定的空间范围信息即是由上述经度信息、经度信息和高度信息所确定的区域信息。
可以理解的是,轨迹属性和集合属性所包括的内容并不限于上述所描述的信息,本领域技术人员还可以根据具体的应用场景或者应用需求对轨迹属性和集合属性所包括的信息进行配置,例如,轨迹属性还可以包括加速度信息、方向信息等等,集合属性还可以包括:与数据集相对应的对象属性等等,在此不再赘述。
步骤S203:基于轨迹数量、轨迹属性和集合属性,建立索引信息。
在获取到轨迹数量、轨迹属性和集合属性之后,可以基于轨迹数量、轨迹属性和集合属性进行索引建立操作,从而可以生成索引信息。在一些实例中,轨迹数量、轨迹属性和集合属性,建立索引信息可以包括:基于轨迹数量、轨迹属性和集合属性,确定用于建立索引信息的区域划分参数;基于区域划分参数和数据集,建立索引信息。
其中,在获取到轨迹数量、轨迹属性和集合属性之后,可以对轨迹数量、轨迹属性和集合属性进行分析处理,具体的,预先设置有用于对轨迹数量、轨迹属性和集合属性进行分析处理的设定规则,基于设定规则对轨迹数量、轨迹属性和集合属性进行分析处理,以确定用于建立索引信息的区域划分参数,从而有效地保证了对区域划分参数进行确定的准确可靠性。或者,与预先训练有用于确定用于建立索引信息的区域划分参数的机器学习模型,在获取到轨迹数量、轨迹属性和集合属性之后,可以将轨迹数量、轨迹属性和集合属性输入至机器学习模型,从而可以获得用于建立索引信息的区域划分参数。在一些实例中,区域划分参数可以包括以下至少之二:与时间维度相对应的时间划分参数、与经度维度相对应的经度划分参数、与纬度维度相对应的纬度划分参数、与高度维度相对应的高度划分参数。
在获取到区域划分参数之后,可以基于区域划分参数和数据集进行索引信息的建立操作,从而可以获得与数据集相对应的索引信息。可以理解的是,不同数量的区域划分参数用于建立不同维度的索引信息,例如:在区域划分参数的数量为两个(经度划分参数、纬度划分参数)时,所建立的索引信息可以为二维;在区域划分参数的数量为三个(经度划分参数、纬度划分参数、时间划分参数)时,所建立的索引信息可以为三维;在区域划分参数的数量为四个(经度划分参数、纬度划分参数、时间划分参数、高度划分参数)时,所建立的索引信息可以为四维。
在一些实例中,基于区域划分参数和数据集,建立索引信息可以包括:基于区域划分参数对数据集所对应的区域进行划分操作,获得多个叶子节点相对应的节点外包框;基于所有叶子节点相对应的节点外包框,建立索引信息。
在获取到区域划分参数之后,可以基于区域划分参数对数据集所对应的区域进行划分操作,从而可以获得多个叶子节点相对应的节点外包框,节点外包框可以为二维外包框、三维外包框或者四维外包框等等。在获取到各个叶子节点相对应的节点外包框之后,可以对所有叶子节点相对应的节点外包框进行统计,而后基于所有叶子节点相对应的节点外包框建立索引信息,从而有效地保证了对索引信息进行建立的稳定可靠性。
需要说明的是,建立索引信息的实现方式并不限于上述所描述的实现方式,本领域技术人员也可以采用其他的方式来建立索引信息,只要能够保证对索引信息进行建立的准确可靠性即可,在此不再赘述。
本实施例提供的索引建立方法,通过获取数据集,而后对数据集进行分析处理,确定所述数据集中包括的轨迹数量、轨迹所对应的轨迹属性以及与所述数据集相对应的集合属性,而后基于所述轨迹数量、轨迹属性和集合属性来建立索引信息,从而实现了在构建索引信息时,充分考虑了移动对象所在移动轨迹的特有属性,使得所建立的索引中叶子节点的总体积尽量小,这样在基于索引信息进行轨迹查询操作时,可以过滤掉大部分数据,使得进行精确匹配的数据量比较小,进而有效地提高了数据查询的质量和效率,保证了该方法的实用性。
图3为本申请实施例提供的基于轨迹数量、轨迹属性和集合属性,确定用于建立索引信息的区域划分参数的流程示意图;参考附图3所示,在建立索引信息的过程中,本实施例提供了一种确定用于建立索引信息的区域划分参数的实现方式,具体的,本实施例中的基于轨迹数量、轨迹属性和集合属性,确定用于建立索引信息的区域划分参数可以包括:
步骤S301:获取用于建立索引信息的扇出值。
为了能够准确地确定区域划分参数,可以先获取用于建立索引信息的扇出值,其中,扇出值可以通过设定参数进行估算获得,具体的,设定参数可以包括:系统配置信息、页面大小(4KB、8KB等等)、数据库类型(MySQL数据库等等)、外包框大小和管理信息的开销信息;在获取系统配置信息、页面大小、数据库类型、外包框大小和管理信息的开销信息之后,可以基于设定规则对系统配置信息、页面大小、数据库类型、外包框大小和管理信息的开销信息进行扇出值的估算操作,从而可以估算出扇出值。
可以理解的是,扇出值的获取方式并不限于上述所描述的实现方式,本领域技术人员可以根据具体的应用场景或者应用需求采用其他的方式来获取扇出值,例如:扇出值可以是基于索引建立装置的配置参数预先配置好的,此时,预先配置好的扇出值可以存储在预设区域中,通过访问预设区域即可获取到用于建立索引信息的扇出值,只要能够保证对扇出值进行获取的准确可靠性即可,在此不再赘述。
步骤S302:基于扇出值和轨迹数量,确定索引信息中所包括的叶子节点的数量。
在获取到扇出值之后,可以对扇出值和轨迹数量进行分析处理,以确定索引信息中所包括的叶子节点的数量。在一些实例中,基于扇出值和轨迹数量,确定索引信息中所包括的叶子节点的数量可以包括:将轨迹数量与扇出值的比值,确定为叶子节点的数量。具体的,扇出值为f,轨迹数量为N,而后可以将N/f确定为叶子节点的数量,可以理解的是,叶子节点的数量与用于建立索引信息的区域划分参数相关。
举例来说,在区域划分参数包括经度划分参数nx和时间划分参数nt时,则叶子节点的数量可以为nx*nt;在区域划分参数包括经度划分参数nx、纬度划分参数ny和时间划分参数nt时,则叶子节点的数量可以为nx*ny*nt;在经度划分参数nx与纬度划分参数ny相同时,叶子节点的数量可以为
Figure DEST_PATH_IMAGE004
*nt。在区域划分参数包括经度划分参数nx、纬度划分参数ny、高度划分参数nz和时间划分参数nt时,则叶子节点的数量可以为nx*ny*nz*nt;在经度划分参数nx、纬度划分参数ny和高度划分参数nz相同时,叶子节点的数量可以为
Figure DEST_PATH_IMAGE006
*nt。
步骤S303:基于叶子节点的数量、轨迹属性和集合属性,确定用于建立索引信息的区域划分参数。
在获取到叶子节点的数量、轨迹属性和集合属性之后,可以对叶子节点的数量、轨迹属性和集合属性进行分析处理,以确定用于建立索引信息的区域划分参数。在一些实例中,基于叶子节点的数量、轨迹属性和集合属性,确定用于建立索引信息的区域划分参数可以包括:基于轨迹属性和集合属性,获取节点外包框的外包框体积;利用均值不等式对外包框体积进行分析处理,确定满足叶子节点的数量、且外包框体积最小的区域划分参数。
在获取到轨迹属性和集合属性之后,可以对轨迹属性和集合属性进行分析处理,以获取节点外包框的外包框体积,其中,所获得的外包框体积分别与轨迹属性、集合属性呈正相关。
举例来说,在轨迹属性包括轨迹时长b和轨迹移动速度v、集合属性包括时间跨度信息T和空间范围信息R*R时,以所要确定的区域划分参数包括三个为例,分别包括经度划分参数nx、纬度划分参数ny和时间划分参数nt,此时,外包框体积可以表达为:
Figure DEST_PATH_IMAGE008
,从而有效地实现了对外包框体积进行获取的准确可靠性。
为了方便理解,以经度划分参数nx与纬度划分参数ny相同为例进行说明,此时,外包框体积可以表达为:
Figure DEST_PATH_IMAGE010
,从而有效地实现了对外包框体积进行获取的准确可靠性。
在获取到外包框体积之后,可以利用均值不等式对外包框体积进行分析处理,以确定满足叶子节点的数量且外包框体积最小的区域划分参数,具体的,可以基于外包框体积的表达信息获取区域划分参数的表达信息,具体的,在外包框体积表达为
Figure 904003DEST_PATH_IMAGE010
时,则可以获取区域划分参数的表达方式为:
Figure DEST_PATH_IMAGE012
Figure DEST_PATH_IMAGE014
;而后可以利用均值不等式和上述区域划分参数的表达方式来确定满足叶子节点的数量、且外包框体积最小的区域划分参数,在一些实例中,区域划分参数包括以下至少之二:与时间维度相对应的时间划分参数;与经度维度相对应的经度划分参数;与纬度维度相对应的纬度划分参数;与高度维度相对应的高度划分参数;从而有效地保证了对区域划分参数进行确定的准确可靠性,
本实施例中,通过获取用于建立索引信息的扇出值,基于扇出值和轨迹数量来确定索引信息中所包括的叶子节点的数量,并基于叶子节点的数量、轨迹属性和集合属性确定用于建立索引信息的区域划分参数,有效地保证了对区域划分参数进行确定的准确可靠性,进一步提高了基于区域划分参数建立索引信息的精确程度。
图4为本申请实施例提供的又一种索引建立方法的流程示意图;参考附图4所示,本实施例提供了又一种索引建立方法,该方法的执行主体可以为索引建立装置,可以理解的是,索引建立装置可以实现为软件、或者软件和硬件的组合。具体的,该索引建立方法可以包括:
步骤S401:获取原始索引信息和待插入轨迹。
步骤S402:确定待插入轨迹所对应的轨迹外包框和原始索引信息中叶子节点所对应的节点外包框。
步骤S403:在外包框面积和外包框形状的维度,确定与轨迹外包框和节点外包框相对应的外包框影响参数。
步骤S404:基于外包框影响参数将轨迹外包框插入至原始索引信息中,生成目标索引信息。
下面对上述各个步骤进行详细说明:
步骤S401:获取原始索引信息和待插入轨迹。
其中,在建立原始索引信息之后,可以基于原始索引信息进行轨迹查询操作。可以理解的是,随着原始索引信息建立时间的不断增加,可能会出现新的轨迹信息并不包含在原始索引信息中,此时,为了能够提高轨迹查询的质量和效率,则需要基于新的轨迹信息对原始索引信息进行更新操作。
为了能够实现索引信息的更新操作,则可以获取原始索引信息和待插入轨迹,其中,原始索引信息可以存储在预设区域中,通过访问预设区域即可获取原始索引信息;待插入轨迹是指需要添加至原始索引信息中的轨迹信息,该待插入轨迹可以是用户输入至索引建立装置中的,具体的,索引建立装置上可以设置有交互界面,通过在交互界面上输入执行操作,通过执行操作可以生成待插入轨迹;或者,待插入轨迹可以存储在第三设备中,通过与第三设备建立通信连接,则可以获取到存储在第三设备中的待插入轨迹。
当然的,原始索引信息和待插入轨迹的获取方式并不限于上述所描述的实现方式,本领域技术人员也可以采用其他的方式来获取原始索引信息和待插入轨迹,只要能够保证对原始索引信息和待插入轨迹进行获取的准确可靠性即可,在此不再赘述。
步骤S402:确定待插入轨迹所对应的轨迹外包框和原始索引信息中叶子节点所对应的节点外包框。
其中,原始索引信息中包括根节点、根节点中所包括的多个中间节点、中间节点中所包括的多个叶子节点,上述的根节点对应有根节点外包框,中间节点对应有中间节点外包框,叶子节点对应有节点外包框。因此,为了能够实现索引信息的更新操作,即需要将待插入轨迹插入到某一个叶子节点所对应的节点外包框中,则可以对原始索引信息进行分析处理,以获取原始索引信息中叶子节点,并确定叶子节点所对应的节点外包框。
相类似的,为了能够实现对原始索引信息进行更新操作,在获取到待插入轨迹之后,可以对待插入轨迹进行分析处理,以确定待插入轨迹所对应的轨迹外包框。在一些实例中,确定待插入轨迹所对应的轨迹外包框可以包括:获取待插入轨迹所对应的轨迹属性,轨迹属性可以包括:轨迹长度、轨迹时长和轨迹移动速度,而后可以基于轨迹属性中的轨迹中点、轨迹平均时长和轨迹平均移动速度来确定待插入轨迹所对应的轨迹外包框。当然的,本领域技术人员也可以采用其他的方式来获取待插入轨迹所对应的轨迹外包框,只要能够保证对轨迹外包框进行获取的准确可靠性即可,在此不再赘述。
步骤S403:在外包框面积和外包框形状的维度,确定与轨迹外包框和节点外包框相对应的外包框影响参数。
在确定待插入轨迹所对应的轨迹外包框和原始索引信息中叶子节点所对应的节点外包框之后,可以对轨迹外包框和节点外包框进行分析处理,以在外包框面积和外包框形状的维度确定与轨迹外包框和节点外包框相对应的外包框影响参数。在一些实例中,在外包框面积和外包框形状的维度,确定与轨迹外包框和节点外包框相对应的外包框影响参数可以包括:将轨迹外包框与节点外包框进行融合,获得融合后外包框;获取用于限定融合后外包框形状和节点外包框形状的目标外包框;基于融合后外包框、目标外包框和节点外包框,确定与轨迹外包框和节点外包框相对应的外包框影响参数。
具体的,由于在基于轨迹外包框对原始索引信息进行更新操作时,最终目标在于如何查找到与轨迹外包框形状最接近、且在将轨迹外包框融合在节点外包框时增加的面积最小的节点外包框。因此,在获取到轨迹外包框和节点外包框之后,可以将轨迹外包框与节点外包框进行融合处理,获得融合后外包框。
另外,为了能够保证对原始索引信息的更新操作,则对于融合后外包框的形状和节点外包框的形状进行限定的目标外包框,目标外包框可以为二维外包框、三维外包框、四维外包框,目标外包框的形状可以基于不同的应用场景或者应用需求进行设置,例如:在目标外包框为三维外包框时,目标外包框的形状可以为v*v*1,其中,v可以为轨迹移动速度。
在获取到融合后外包框和目标外包框之后,可以对融合后外包框、目标外包框和节点外包框进行分析处理,以确定与轨迹外包框和节点外包框相对应的外包框影响参数。在一些实例中,基于融合后外包框、目标外包框和节点外包框,确定与轨迹外包框和节点外包框相对应的外包框影响参数可以包括:基于融合后外包框和目标外包框,确定用于标识融合后外包框的区域特征以及融合后外包框与目标外包框之间的形状相似度的第一参数;基于节点外包框和目标外包框,确定用于标识节点外包框的区域特征以及节点外包框与目标外包框之间的形状相似度的第二参数;基于第一参数和第二参数,确定与轨迹外包框和节点外包框相对应的外包框影响参数。
具体的,在获取到融合后外包框、节点外包框和目标外包框之后,可以利用预设规则对融合后外包框和目标外包框进行分析处理,以确定用于标识融合后外包框的区域特征、以及融合后外包框与目标外包框之间的形状相似度的第一参数;相类似的,还可以利用预设规则对节点外包框和目标外包框进行分析处理,以确定用于标识节点外包框的区域特征以及节点外包框与目标外包框之间的形状相似度的第二参数;在获取到第一参数和第二参数之后,可以对第一参数和第二参数进行分析处理,以确定与轨迹外包框和节点外包框相对应的外包框影响参数。在一些实例中,可以确定与第一参数和第二参数分别对应的权重系数,基于第一参数、第二参数、与第一参数和第二参数分别对应的权重系数进行加权求和处理,从而可以获得外包框影响参数,进而有效地保证了对外包框影响参数进行确定的准确可靠性。
当然的,外包框影响参数的具体获取方式并不限于上述所描述的实现方式,本领域技术人员也可以采用其他的方式来获取外包框影响参数,只要能够保证对外包框影响参数进行获取的准确可靠性即可,在此不再赘述。
步骤S404:基于外包框影响参数将轨迹外包框插入至原始索引信息中,生成目标索引信息。
在获取到外包框影响参数之后,可以基于外包框影响参数将轨迹外包框插入至原始索引信息中,从而可以生成目标索引信息。在一些实例中,基于外包框影响参数将轨迹外包框插入至原始索引信息中,生成目标索引信息可以包括:基于外包框影响参数,确定与轨迹外包框相对应的目标节点外包框,目标节点外包框所对应的外包框影响参数小于其他节点外包框所对应的外包框影响参数;将轨迹外包框插入至目标节点外包框中,生成目标索引信息。
具体的,在获取到外包框影响参数之后,可以基于外包框影响参数来确定与轨迹外包框相对应的目标节点外包框,所确定的目标节点外包框所对应的外包框影响参数小于其他节点外包框所对应的外包框影响参数,即说明目标节点外包框的形状与轨迹外包框的形状比较相似,并且,在轨迹外包框融合在目标节点外包框中时,目标节点外包框所增加的外包框面积比较小。在确定目标节点外包框之后,可以将轨迹外包框插入至目标节点外包框中,从而可以生成目标索引信息,实现了对原始索引信息的更新和建立操作,保证了对目标索引信息进行建立的准确可靠性。
本实施例提供的索引建立方法,通过获取原始索引信息和待插入轨迹,确定待插入轨迹所对应的轨迹外包框和原始索引信息中叶子节点所对应的节点外包框,而后在外包框面积和外包框形状的维度,确定与轨迹外包框和节点外包框相对应的外包框影响参数,并基于外包框影响参数将轨迹外包框插入至原始索引信息中生成目标索引信息,从而有效地实现了在构建索引信息时,充分考虑到轨迹外包框在外包框面积和外包框形状维度对原始索引信息所构成的影响程度,使得所建立或者所更新的原始索引信息中的叶子节点的总体积可以尽量小,这样有效地保证了在进行数据查询操作时,可以过滤掉大部分的数据,使得需要进行精确匹配的数据量较小,进而保证了数据查询的质量和效率,进一步提高了索引建立方法的实用性。
图5为本申请实施例提供的基于融合后外包框和目标外包框,确定用于标识融合后外包框的区域特征以及融合后外包框与目标外包框之间的形状相似度的第一参数的流程示意图;在上述实施例的基础上,参考附图5所示,本实施例提供提供了一种确定用于标识融合后外包框的区域特征以及融合后外包框与目标外包框之间的形状相似度的第一参数的实现方式,具体的,本实施例中的基于融合后外包框和目标外包框,确定用于标识融合后外包框的区域特征以及融合后外包框与目标外包框之间的形状相似度的第一参数可以包括:
步骤S501:确定融合后外包框与目标外包框之间的第一形状相似度、以及融合后外包框所对应的第一区域大小。
在获取到融合后外包框之后,可以利用区域扫描算法对融合后外包框进行扫描操作,获得融合后外包框所对应的第一区域大小。另外,在获取到融合后外包框和目标外包框之后,可以对融合后外包框和目标外包框进行分析处理,以确定融合后外包框与目标外包框之间的第一形状相似度。在一些实例中,确定融合后外包框与目标外包框之间的第一形状相似度可以包括:基于融合后外包框,确定用于标识融合后外包框形状特征的第一比例信息;基于目标外包框,确定用于标识目标外包框形状特征的第二比例信息;基于第一比例信息和第二比例信息,确定融合后外包框与目标外包框之间的第一形状相似度。
具体的,在获取到融合后外包框之后,可以对融合后外包框进行分析处理,以确定用于标识融合后外包框形状特征的第一比例信息,其中,融合后外包框可以为二维外包框或者三维外包框,而不同维度的融合后外包框可以对应有不同的用于标识融合后外包框形状特征的第一比例信息。例如:在融合后外包框为二维外包框时,第一比例信息可以为长度信息与时间信息之间的比例信息,或者边长信息与时间信息之间的比例信息;在融合后外包框为三维外包框时,第一比例信息可以为长度信息与时间信息之间的比例信息,或者宽度信息与时间信息之间的比例信息。
相类似的,在获取到目标外包框之后,可以对目标外包框进行分析处理,以确定用于标识目标外包框形状特征的第二比例信息,其中,目标外包框可以为二维外包框或者三维外包框,而不同维度的目标外包框可以对应有不同的用于标识目标外包框形状特征的第二比例信息。例如:在目标外包框为二维外包框时,第二比例信息可以为长度信息与时间信息之间的比例信息;在目标外包框为三维外包框时,第二比例信息可以为长度信息与时间信息之间的比例信息,或者宽度信息与时间信息之间的比例信息。
在获取到第一比例信息和第二比例信息之后,可以对第一比例信息和第二比例信息进行分析处理,以确定融合后外包框与目标外包框之间的第一形状相似度。其中,本实施例对于确定融合后外包框与目标外包框之间的第一形状相似度的实现方式不做限定,本领域技术人员可以根据具体的应用场景或者应用需求进行配置,例如:第一形状相似度可以为融合后外包框所对应的第一比例信息与目标外包框所对应的第二比例信息的比值,只要能够保证对融合后外包框与目标外包框之间的第一形状相似度进行确定的准确可靠性。
步骤S502:将第一区域大小与第一形状相似度之间的乘积值,确定为第一参数。
其中,在获取到第一区域大小和第一形状相似度之后,可以将第一区域大小与第一形状相似度之间的乘积值确定为第一参数,从而有效地实现了综合考虑融合后外包框的区域特征以及融合后外包框与目标外包框之间的形状相似度来确定第一参数,有效地保证了对第一参数进行确定的准确可靠性。
图6为本申请实施例提供的基于第一比例信息和第二比例信息,确定融合后外包框与目标外包框之间的第一形状相似度的流程示意图;参考附图6所示,本实施例提供了一种确定融合后外包框与目标外包框之间的第一形状相似度的实现方式,本实施例中的基于第一比例信息和第二比例信息,确定融合后外包框与目标外包框之间的第一形状相似度可以包括:
步骤S601:获取第一比例信息与第二比例信息之间的偏移量。
步骤S602:确定偏移量与第二比例信息之间的第一比值。
步骤S603:基于第一比值,确定融合后外包框与目标外包框之间的第一形状相似度。
其中,在获取到第一比例信息和第二比例信息之后,可以获取第一比例信息与第二比例信息之间的偏移量,该偏移量可以为第一比例信息-第二比例信息,或者,偏移量可以为第二比例信息-第一比例信息。在获取到第一比例信息与第二比例信息之间的偏移量之后,可以确定偏移量与第二比例信息之间的第一比值,而后可以对第一比值进行分析处理,以确定融合后外包框与目标外包框之间的第一形状相似度。
在一些实例中,基于第一比值,确定融合后外包框与目标外包框之间的第一形状相似度可以包括:获取第一比值与设定参数之间的乘积值;将1与乘积值之间的差值,确定为融合后外包框与目标外包框之间的第一形状相似度。
具体的,预先设置用于生成第一形状相似度的设定参数,设定参数可以存储在预设区域中,在需要确定第一形状相似度时,通过访问预设区域即可获取设定参数,该设定参数的数值范围比较小,一般情况下,该设定参数可以小于0.1。在获取到第一比值和设定参数之后,可以获取第一比值与设定参数之间的乘积值,而后将1与乘积值之间的差值确定为融合后外包框与目标外包框之间的第一形状相似度,从而有效地保证了对第一形状相似度进行确定的准确可靠性。
本实施例中,通过获取第一比例信息与第二比例信息之间的偏移量,而后确定偏移量与第二比例信息之间的第一比值,并基于第一比值来确定融合后外包框与目标外包框之间的第一形状相似度,从而有效地保证了对第一形状相似度进行确定的准确可靠性,进而提高了基于第一形状相似度建立索引信息的准确可靠性。
图7为本申请实施例提供的基于节点外包框和目标外包框,确定用于标识节点外包框的区域特征以及节点外包框与目标外包框之间的形状相似度的第二参数的流程示意图;参考附图7所示,本实施例提供了一种确定用于标识节点外包框的区域特征以及节点外包框与目标外包框之间的形状相似度的第二参数的实现方式,具体的,本实施例中的基于节点外包框和目标外包框,确定用于标识节点外包框的区域特征以及节点外包框与目标外包框之间的形状相似度的第二参数可以包括:
步骤S701:确定节点外包框与目标外包框之间的第二形状相似度、以及节点外包框所对应的第二区域大小。
在获取到节点外包框之后,可以利用区域扫描算法对节点外包框进行扫描操作,获得节点外包框所对应的第二区域大小。另外,在获取到节点外包框和目标外包框之后,可以对节点外包框和目标外包框进行分析处理,以确定节点外包框与目标外包框之间的第二形状相似度。在一些实例中,确定节点外包框与目标外包框之间的第二形状相似度可以包括:基于目标外包框,确定用于标识目标外包框形状特征的第二比例信息;基于节点外包框,确定用于标识节点外包框形状特征的第三比例信息;基于第二比例信息和第三比例信息,确定节点外包框与目标外包框之间的第二形状相似度。
具体的,在获取到目标外包框之后,可以对目标外包框进行分析处理,以确定用于标识目标外包框形状特征的第二比例信息,其中,目标外包框可以为二维外包框或者三维外包框,而不同维度的目标外包框可以对应有不同的用于标识目标外包框形状特征的第二比例信息。例如:在目标外包框为二维外包框时,第二比例信息可以为长度信息与时间信息之间的比例信息,或者边长信息(可以为长度信息、宽度信息、或者基于长度信息和宽度信息所确定的边长信息)与时间信息之间的比例信息;在目标外包框为三维外包框时,第二比例信息可以为长度信息与时间信息之间的比例信息,或者宽度信息与时间信息之间的比例信息。
相类似的,在获取到节点外包框之后,可以对节点外包框进行分析处理,以确定用于标识节点外包框形状特征的第三比例信息,其中,节点外包框可以为二维外包框或者三维外包框,而不同维度的节点外包框可以对应有不同的用于标识节点外包框形状特征的第三比例信息。例如:在节点外包框为二维外包框时,第三比例信息可以为长度信息与时间信息之间的比例信息;在节点外包框为三维外包框时,第三比例信息可以为长度信息与时间信息之间的比例信息,或者宽度信息与时间信息之间的比例信息。
在获取到第二比例信息和第三比例信息之后,可以对第二比例信息和第三比例信息进行分析处理,以确定节点外包框与目标外包框之间的第二形状相似度。其中,本实施例对于确定节点外包框与目标外包框之间的第二形状相似度的实现方式不做限定,本领域技术人员可以根据具体的应用场景或者应用需求进行配置,例如:第二形状相似度可以为融合后外包框所对应的第二比例信息与目标外包框所对应的第三比例信息的比值,只要能够保证对节点外包框与目标外包框之间的第二形状相似度进行确定的准确可靠性。
步骤S702:第二区域大小与第二形状相似度之间的乘积值,确定为第二参数。
其中,在获取到第二区域大小和第二形状相似度之后,可以将第二区域大小与第二形状相似度之间的乘积值确定为第二参数,从而有效地保证了对第二参数进行确定的准确可靠性。
图8为本申请实施例提供的基于第二比例信息和第三比例信息,确定节点外包框与目标外包框之间的第二形状相似度的流程示意图;参考附图8所示,本实施例提供了一种确定节点外包框与目标外包框之间的第二形状相似度的实现方式,具体的,本实施例中的基于第二比例信息和第三比例信息,确定节点外包框与目标外包框之间的第二形状相似度可以包括:
步骤S801:获取第三比例信息与第二比例信息之间的偏移量。
步骤S802:确定偏移量与第二比例信息之间的第二比值。
步骤S803:基于第二比值,确定节点外包框与目标外包框之间的第二形状相似度。
其中,在获取到第二比例信息和第三比例信息之后,可以获取第三比例信息与第二比例信息之间的偏移量,该偏移量可以为第三比例信息-第二比例信息,或者,偏移量可以为第二比例信息-第三比例信息。在获取到第三比例信息与第二比例信息之间的偏移量之后,可以确定偏移量与第二比例信息之间的第二比值,而后可以对第二比值进行分析处理,以确定节点外包框与目标外包框之间的第二形状相似度。
在一些实例中,基于第二比值,确定节点外包框与目标外包框之间的第二形状相似度可以包括:获取第二比值与设定参数之间的乘积值;将1与乘积值之间的差值,确定为节点外包框与目标外包框之间的第二形状相似度。
具体的,预先设置用于生成第二形状相似度的设定参数,设定参数可以存储在预设区域中,在需要确定第二形状相似度时,通过访问预设区域即可获取设定参数,该设定参数的数值范围比较小,一般情况下,该设定参数可以小于0.1。在获取到第二比值和设定参数之后,可以获取第二比值与设定参数之间的乘积值,而后将1与乘积值之间的差值确定为节点外包框与目标外包框之间的第二形状相似度,从而有效地保证了对第二形状相似度进行确定的准确可靠性。
本实施例中,通过获取第三比例信息与第二比例信息之间的偏移量,确定偏移量与第二比例信息之间的第二比值,并基于第二比值确定节点外包框与目标外包框之间的第二形状相似度,从而有效地保证了对第二形状相似度进行确定的准确可靠性,进而提高了基于第二形状相似度建立索引信息的准确可靠性。
具体应用时,参考附图9所示,本应用实施例提供了一种结合移动对象的时空信息的索引建立方法,该索引建立方法包括两种实现方式,一种是以批量加载方式的索引建立方法,另一种是以逐条插入方式的索引建立方法。具体的,在基于批量加载的方式来建立索引信息时,本实施例中的索引建立方法可以包括以下步骤:
步骤1:获取索引建立请求和数据集,其中,数据集中包括多条轨迹。
步骤2:确定数据集中包括的轨迹数量、数据集中轨迹所对应的轨迹属性以及与数据集相对应的集合属性。
其中,轨迹属性可以包括平均时长信息b和平均移动速度v,对于一个数据集而言,如果数据集中包括的轨迹数量为N,每条轨迹对应有各自的时长信息和移动速度,而后可以确定数据集中轨迹所对应的平均时长信息和平均移动速度,假设轨迹的平均时长信息为b,平均移动速度为v,总数为N,数据集中全部数据的时间跨度为T,空间(经纬度)范围为R*R。
步骤3:获取用于建立索引信息的扇出值,将轨迹数量与扇出值的比值,确定为叶子节点的数量。
在以批量加载的方式建立索引信息时,以索引信息为三维为例,此时,区域划分参数可以包括时间维度参数、经度维度参数和纬度维度参数,以时间维度参数为nt份,将空间维度划分为nx份(即经度维度参数和纬度维度参数均为nx份),假设在空间的各个维度的划分参数相同,此时,用于建立索引信息的各个维度划分参数要满足叶子节点的数量,即
Figure DEST_PATH_IMAGE016
,其中,f为扇出值,总数与扇出值的比值即为叶子节点的数量,此时叶子节点的数量可以等于所划分的各个维度参数的乘积值。
步骤4:在获取到轨迹属性和集合属性之后,基于轨迹属性和集合属性获取节点外包框的外包框体积。
在轨迹属性包括数据集中每条轨迹的平均时长信息b、平均移动速度v,集合属性包括数据集中全部轨迹所对应的时间跨度T、空间范围R*R,数据集中包括的轨迹数量为N时,则可以基于上述的轨迹属性和集合属性,获取到节点外包框的外包框体积可以表达为:
Figure 227668DEST_PATH_IMAGE010
步骤5:在获取到外包框体积和叶子节点的数量,根据均值不等式对外包框体积进行分析处理,确定满足叶子节点的数量、且外包框体积最小的区域划分参数。
根据均值不等式对外包框体积进行分析处理,获得索引信息所对应的划分参数的表达式:
Figure DEST_PATH_IMAGE018
Figure DEST_PATH_IMAGE020
步骤6:基于区域划分参数建立索引信息。
其中,区域划分参数包括时间维度参数、经度维度参数和纬度维度参数时,可以依次按照上述的区域划分参数对数据集所对应的区域进行划分操作,例如:可以先将时间维度划分为nt份点数相同的区域,再将经度维度划分为nx份点数相同的区域,最后将纬度维度为nx份点数相同的区域,从而可以建立索引信息。需要注意的是,基于区域划分参数进行区域划分的顺序并不限于上述所描述的顺序,本领域技术人员也可以采用其他的顺序进行区域划分参数,例如:先将经度维度划分为nx份点数相同的区域,再将纬度维度为nx份点数相同的区域,最后将时间维度划分为nt份点数相同的区域,从而可以建立索引信息。
在建立完索引信息之后,当存在新的轨迹信息时,则需要基于新的轨迹信息对索引信息,以实现索引信息的更新操作,此时,本实施例中的方法包括:
步骤11:获取索引信息和待插入轨迹。
步骤12:确定待插入轨迹所对应的轨迹外包框和原始索引信息中叶子节点所对应的节点外包框。
步骤13:将轨迹外包框与节点外包框进行融合,获得融合后外包框。
假设轨迹外包框为B,节点外包框为N,从而可以获得融合后外包框为Union(N,B)。
步骤14:确定用于限定融合后外包框形状和节点外包框形状的目标外包框;
为了能够提高索引信息的更新质量和效率,对于节点外包框的形状和融合后外包框的形状而言,预先设置有期望产生的节点外包框的形状,即为目标外包框,该目标外包框的形状可以为v*v*1,即在建立索引信息时,期望所生成的节点外包框的形状以及融合后外包框的形状可以更加近似v*v*1。
步骤15:基于融合后外包框和目标外包框,确定用于标识融合后外包框的区域特征以及融合后外包框与目标外包框之间的形状相似度的第一参数。
考虑到待插入轨迹的插入轨迹外包框对原先的节点外包框的影响程度,在实际操作时,不仅需要考虑增加的体积大小,还要考虑增加轨迹外包框之后的节点外包框的形状应该更加近似v*v*1。因此,在获取到融合后外包框和目标外包框之后,可以先获取用于标识融合后外包框的区域特征以及融合后外包框与目标外包框之间的形状相似度的第一参数。具体的,可以先基于融合后外包框确定用于标识融合后外包框形状特征的第一比例信息,例如,在X.x、X.y和X.t是融合后外包框在三个维度(经度维度、纬度维度和时间维度)上的长度,第一比例信息可以表示为(X.x+X.y)/2/X.t。相类似的,在获取到目标外包框之后,可以确定用于标识目标外包框形状特征的第二比例信息,该第二比例信息可以为v。
在获取到第一比例信息和第二比例信息之后,可以确定第一比例信息与第二比例信息之间的偏移量,该偏移量可以表示为(|(X.x+X.y)/2/X.t-v|,确定偏移量与第二比例信息之间的第一比值,该第一比值可以表示为: ShapeDiff(Union(N,B),v)=(|(X.x+X.y)/2/X.t-v|)/v。
之后可以获取设定参数,该设定参数ε为一个比较小的值,该值一般可以设置为0.1。之后确定第一比值与设定参数之间的乘积值,即ε*ShapeDiff(Union(N,B),v)。在获取到乘积值之后,可以将1与乘积值之间的差值,确定为融合后外包框与目标外包框之间的第一形状相似度,即第一形状相似度可以表示为:(1–ε*ShapeDiff(Union(N,B),v))。
在获取到第一形状相似度之后,确定融合后外包框所对应的第一区域大小,该第一区域大小可以表示为Volumn(Union(N,B)),其中,Volumn即为面积确定函数,例如,对于某一X区域而言,X区域的边长分别为X.x、X.y和X.t时,则Volumn(X)=X.x*X.y*X.t。
在获取第一区域大小和第一形状相似度之后,可以将第一区域大小与第一形状相似度之间的乘积值确定为第一参数,此时,第一参数可以表示为:Volumn(Union(N,B))*(1–ε*ShapeDiff(Union(N,B),v))。
步骤16:基于节点外包框和目标外包框,确定用于标识节点外包框的区域特征以及节点外包框与目标外包框之间的形状相似度的第二参数。
具体的,可以先基于节点外包框确定用于标识节点外包框形状特征的第三比例信息,其中,在X.x`、X.y`和X.t`是节点外包框在三个维度(经度维度、纬度维度和时间维度)上的长度,第三比例信息可以表示为(X.x+X.y)/2/X.t。相类似的,在获取到目标外包框之后,可以确定用于标识目标外包框形状特征的第二比例信息,该第二比例信息可以为v。
在获取到第三比例信息和第二比例信息之后,可以确定第三比例信息与第二比例信息之间的偏移量,该偏移量可以表示为(|(X.x`+X.y`)/2/X.t`-v|,确定偏移量与第二比例信息之间的第二比值,该第二比值可以表示为: ShapeDiff(Union(N,v)=(|(X.x`+X.y`)/2/X.t`-v|)/v。
而后获取设定参数,该设定参数ε可以为一个比较小的值,该值一般可以设置为0.1。之后确定第三比值与设定参数之间的乘积值,即ε*ShapeDiff(Union(N,v)。而后将1与乘积值之间的差值,确定为融合后外包框与目标外包框之间的第二形状相似度,即第二形状相似度可以表示为:(1–ε*ShapeDiff(Union(N,v))。
在获取到第二形状相似度之后,确定节点外包框所对应的第二区域大小,该第二区域大小可以表示为Volumn(N),其中,Volumn即为面积确定函数。在获取第二区域大小和第二形状相似度之后,可以将第二区域大小与第二形状相似度之间的乘积值确定为第二参数,此时,第二参数可以表示为:Volumn(N)*(1–ε*ShapeDiff(Union(N,v))。
步骤17:基于第一参数和第二参数,确定与轨迹外包框和节点外包框相对应的外包框影响参数。
将第一参数与第二参数之间的差值,确定为与轨迹外包框和节点外包框相对应的外包框影响参数,该外包框影响参数可以表示为:Volumn(Union(N,B))*(1–ε*ShapeDiff(Union(N,B),v))-Volumn(N)*(1–ε*ShapeDiff(N,v))。
步骤18:基于外包框影响参数,确定与轨迹外包框相对应的目标节点外包框,目标节点外包框所对应的外包框影响参数小于其他节点外包框所对应的外包框影响参数;将轨迹外包框插入至目标节点外包框中,生成目标索引信息。
本应用实施例提供的针对移动对象的R树索引建立方法,实现了对批量加载方式来构建索引信息和对逐条插入方式来构建索引信息的实现方式进行了优化,使得构建出来的R树索引信息的结构更优;具体的,在构建索引信息时,由于移动轨迹的大致形状受到其轨迹平均长度和轨迹平均速度的影响,并且,构建索引信息时期望叶子节点的总体积可以尽量小,因此,可以利用轨迹外包框的形状信息以及轨迹分布的信息来获得区域划分参数,而后基于区域划分参数来控制叶子节点的平均形状,从而可以使得构建出现的索引信息中叶子节点的总体积可以尽量小,保证了索引信息建立的质量和效率,这样在基于索引信息进行查询操作时,可以过滤掉大部分数据,进而有效地提高数据查询的质量和效率,进一步保证了该索引建立方法的实用性。
图10为本申请实施例提供的一种索引建立装置的结构示意图;参考附图10所示,本实施例提供了一种索引建立装置,该索引建立装置可以执行上述图2所示的索引建立方法,具体的,该索引建立装置可以包括第一获取模块11、第一确定模块12和第一处理模块13:
第一获取模块11,用于获取数据集,数据集中包括多条轨迹;
第一确定模块12,用于确定数据集中包括的轨迹数量、数据集中轨迹所对应的轨迹属性以及与数据集相对应的集合属性;
第一处理模块13,用于基于轨迹数量、轨迹属性和集合属性,建立索引信息。
在一些实例中,轨迹属性包括:轨迹时长、轨迹移动速度。
在一些实例中,集合属性包括:时间跨度信息、空间范围信息。
在一些实例中,在第一处理模块13基于轨迹数量、轨迹属性和集合属性,建立索引信息时,该第一处理模块13用于:基于轨迹数量、轨迹属性和集合属性,确定用于建立索引信息的区域划分参数;基于区域划分参数和数据集,建立索引信息。
在一些实例中,在第一处理模块13基于区域划分参数和数据集,建立索引信息时,该第一处理模块13用于:基于区域划分参数对数据集所对应的区域进行划分操作,获得多个叶子节点相对应的节点外包框;基于所有叶子节点相对应的节点外包框,建立索引信息。
在一些实例中,在第一处理模块13基于轨迹数量、轨迹属性和集合属性,确定用于建立索引信息的区域划分参数时,该第一处理模块13用于:获取用于建立索引信息的扇出值;基于扇出值和轨迹数量,确定索引信息中所包括的叶子节点的数量;基于叶子节点的数量、轨迹属性和集合属性,确定用于建立索引信息的区域划分参数。
在一些实例中,在第一处理模块13基于扇出值和轨迹数量,确定索引信息中所包括的叶子节点的数量时,该第一处理模块13用于:将轨迹数量与扇出值的比值,确定为叶子节点的数量。
在一些实例中,在第一处理模块13基于叶子节点的数量、轨迹属性和集合属性,确定用于建立索引信息的区域划分参数时,该第一处理模块13用于:基于轨迹属性和集合属性,获取节点外包框的外包框体积;利用均值不等式对外包框体积进行分析处理,确定满足叶子节点的数量、且外包框体积最小的区域划分参数。
在一些实例中,区域划分参数包括以下至少之二:与时间维度相对应的时间划分参数;与经度维度相对应的经度划分参数;与纬度维度相对应的纬度划分参数;与高度维度相对应的高度划分参数。
在一些实例中,外包框体积分别与轨迹属性、集合属性呈正相关。
图10所示装置可以执行图1-图3、图9所示实施例的方法,本实施例未详细描述的部分,可参考对图1-图3、图9所示实施例的相关说明。该技术方案的执行过程和技术效果参见图1-图3、图9所示实施例中的描述,在此不再赘述。
在一个可能的设计中,图10所示索引建立装置的结构可实现为一电子设备,该电子设备可以是手机、平板电脑、服务器等各种设备。如图11所示,该电子设备可以包括:第一处理器21和第一存储器22。其中,第一存储器22用于存储相对应电子设备执行上述图1-图3、图9所示实施例中提供的索引建立方法的程序,第一处理器21被配置为用于执行第一存储器22中存储的程序。
程序包括一条或多条计算机指令,其中,一条或多条计算机指令被第一处理器21执行时能够实现如下步骤:
获取数据集,数据集中包括多条轨迹;
确定数据集中包括的轨迹数量、数据集中轨迹所对应的轨迹属性以及与数据集相对应的集合属性;
基于轨迹数量、轨迹属性和集合属性,建立索引信息。
进一步的,第一处理器21还用于执行前述图1-图3、图9所示实施例中的全部或部分步骤。
其中,电子设备的结构中还可以包括第一通信接口23,用于电子设备与其他设备或通信网络通信。
另外,本发明实施例提供了一种计算机存储介质,用于储存电子设备所用的计算机软件指令,其包含用于执行上述图1-图3、图9所示方法实施例中索引建立方法所涉及的程序。
此外,本发明实施例提供了一种计算机程序产品,包括:存储有计算机指令的计算机可读存储介质,当所述计算机指令被一个或多个处理器执行时,致使所述一个或多个处理器执行上述图1-图3、图9所示的索引建立方法中的步骤。
图12为本申请实施例提供的另一种索引建立装置的结构示意图;参考附图12所示,本实施例提供了另一种索引建立装置,该索引建立装置用于执行上述图4所示的索引建立方法,该索引建立装置可以包括:第二获取模块31、第二确定模块32和第二处理模块33:
第二获取模块31,用于获取原始索引信息和待插入轨迹;
第二确定模块32,用于确定待插入轨迹所对应的轨迹外包框和原始索引信息中叶子节点所对应的节点外包框;
第二确定模块32,用于在外包框面积和外包框形状的维度,确定与轨迹外包框和节点外包框相对应的外包框影响参数;
第二处理模块33,用于基于外包框影响参数将轨迹外包框插入至原始索引信息中,生成目标索引信息。
在一些实例中,在第二确定模块32在外包框面积和外包框形状的维度,确定与轨迹外包框和节点外包框相对应的外包框影响参数时,第二确定模块32用于执行:将轨迹外包框与节点外包框进行融合,获得融合后外包框;获取用于限定融合后外包框形状和节点外包框形状的目标外包框;基于融合后外包框、目标外包框和节点外包框,确定与轨迹外包框和节点外包框相对应的外包框影响参数。
在一些实例中,在第二确定模块32基于融合后外包框、目标外包框和节点外包框,确定与轨迹外包框和节点外包框相对应的外包框影响参数时,第二确定模块32用于执行:基于融合后外包框和目标外包框,确定用于标识融合后外包框的区域特征以及融合后外包框与目标外包框之间的形状相似度的第一参数;基于节点外包框和目标外包框,确定用于标识节点外包框的区域特征以及节点外包框与目标外包框之间的形状相似度的第二参数;基于第一参数和第二参数,确定与轨迹外包框和节点外包框相对应的外包框影响参数。
在一些实例中,在第二确定模块32基于融合后外包框和目标外包框,确定用于标识融合后外包框的区域特征以及融合后外包框与目标外包框之间的形状相似度的第一参数时,第二确定模块32用于执行:确定融合后外包框与目标外包框之间的第一形状相似度、以及融合后外包框所对应的第一区域大小;将第一区域大小与第一形状相似度之间的乘积值,确定为第一参数。
在一些实例中,在第二确定模块32确定融合后外包框与目标外包框之间的第一形状相似度时,第二确定模块32用于执行:基于融合后外包框,确定用于标识融合后外包框形状特征的第一比例信息;基于目标外包框,确定用于标识目标外包框形状特征的第二比例信息;基于第一比例信息和第二比例信息,确定融合后外包框与目标外包框之间的第一形状相似度。
在一些实例中,在第二确定模块32基于第一比例信息和第二比例信息,确定融合后外包框与目标外包框之间的第一形状相似度时,第二确定模块32用于执行:获取第一比例信息与第二比例信息之间的偏移量;确定偏移量与第二比例信息之间的第一比值;基于第一比值,确定融合后外包框与目标外包框之间的第一形状相似度。
在一些实例中,在第二确定模块32基于第一比值,确定融合后外包框与目标外包框之间的第一形状相似度时,第二确定模块32用于执行:获取第一比值与设定参数之间的乘积值;将1与乘积值之间的差值,确定为融合后外包框与目标外包框之间的第一形状相似度。
在一些实例中,在第二确定模块32基于节点外包框和目标外包框,确定用于标识节点外包框的区域特征以及节点外包框与目标外包框之间的形状相似度的第二参数时,第二确定模块32用于执行:确定节点外包框与目标外包框之间的第二形状相似度、以及节点外包框所对应的第二区域大小;将第二区域大小与第二形状相似度之间的乘积值,确定为第二参数。
在一些实例中,在第二确定模块32确定节点外包框与目标外包框之间的第二形状相似度时,第二确定模块32用于执行:基于目标外包框,确定用于标识目标外包框形状特征的第二比例信息;基于节点外包框,确定用于标识节点外包框形状特征的第三比例信息;基于第二比例信息和第三比例信息,确定节点外包框与目标外包框之间的第二形状相似度。
在一些实例中,在第二确定模块32基于第二比例信息和第三比例信息,确定节点外包框与目标外包框之间的第二形状相似度时,第二确定模块32用于执行:获取第三比例信息与第二比例信息之间的偏移量;确定偏移量与第二比例信息之间的第二比值;基于第二比值,确定节点外包框与目标外包框之间的第二形状相似度。
在一些实例中,在第二确定模块32基于第二比值,确定节点外包框与目标外包框之间的第二形状相似度时,第二确定模块32用于执行:获取第二比值与设定参数之间的乘积值;将1与乘积值之间的差值,确定为节点外包框与目标外包框之间的第二形状相似度。
在一些实例中,在第二处理模块33基于外包框影响参数将轨迹外包框插入至原始索引信息中,生成目标索引信息时,该第二处理模块33用于执行:基于外包框影响参数,确定与轨迹外包框相对应的目标节点外包框,目标节点外包框所对应的外包框影响参数小于其他节点外包框所对应的外包框影响参数;将轨迹外包框插入至目标节点外包框中,生成目标索引信息。
图12所示装置可以执行图4-图9所示实施例的方法,本实施例未详细描述的部分,可参考对图4-图9所示实施例的相关说明。该技术方案的执行过程和技术效果参见图4-图9所示实施例中的描述,在此不再赘述。
在一个可能的设计中,图12所示索引建立装置的结构可实现为一电子设备,该电子设备可以是手机、平板电脑、服务器等各种设备。如图13所示,该电子设备可以包括:第二处理器41和第二存储器42。其中,第二存储器42用于存储相对应电子设备执行上述图4-图9所示实施例中提供的索引建立方法的程序,第二处理器41被配置为用于执行第二存储器42中存储的程序。
程序包括一条或多条计算机指令,其中,一条或多条计算机指令被第二处理器41执行时能够实现如下步骤:
获取原始索引信息和待插入轨迹;
确定待插入轨迹所对应的轨迹外包框和原始索引信息中叶子节点所对应的节点外包框;
在外包框面积和外包框形状的维度,确定与轨迹外包框和节点外包框相对应的外包框影响参数;
基于外包框影响参数将轨迹外包框插入至原始索引信息中,生成目标索引信息。
进一步的,第二处理器41还用于执行前述图4-图9所示实施例中的全部或部分步骤。
其中,电子设备的结构中还可以包括第二通信接口43,用于电子设备与其他设备或通信网络通信。
另外,本发明实施例提供了一种计算机存储介质,用于储存电子设备所用的计算机软件指令,其包含用于执行上述图4-图9所示方法实施例中索引建立方法所涉及的程序。
此外,本发明实施例提供了一种计算机程序产品,包括:存储有计算机指令的计算机可读存储介质,当所述计算机指令被一个或多个处理器执行时,致使所述一个或多个处理器执行上述图4-图9所示的索引建立方法中的步骤。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助加必需的通用硬件平台的方式来实现,当然也可以通过硬件和软件结合的方式来实现。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以计算机产品的形式体现出来,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程设备的处理器以产生一个机器,使得通过计算机或其他可编程设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器 (CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器 (RAM) 和/或非易失性内存等形式,如只读存储器 (ROM) 或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存 (PRAM)、静态随机存取存储器 (SRAM)、动态随机存取存储器 (DRAM)、其他类型的随机存取存储器 (RAM)、只读存储器 (ROM)、电可擦除可编程只读存储器 (EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘 (DVD) 或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体 (transitory media),如调制的数据信号和载波。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims (12)

1.一种索引建立方法,包括:
获取数据集,所述数据集中包括多条轨迹;
确定所述数据集中包括的轨迹数量、所述数据集中轨迹所对应的轨迹属性以及与所述数据集相对应的集合属性;
基于所述轨迹数量、轨迹属性和集合属性,建立索引信息;
基于所述轨迹数量、轨迹属性和集合属性,建立索引信息,包括:
基于所述轨迹数量、轨迹属性和集合属性,确定用于建立索引信息的区域划分参数;
基于所述区域划分参数和所述数据集,建立所述索引信息。
2.根据权利要求1所述的方法,基于所述区域划分参数和所述数据集,建立所述索引信息,包括:
基于所述区域划分参数对所述数据集所对应的区域进行划分操作,获得多个叶子节点相对应的节点外包框;
基于所有叶子节点相对应的节点外包框,建立所述索引信息。
3.根据权利要求2所述的方法,基于所述轨迹数量、轨迹属性和集合属性,确定用于建立索引信息的区域划分参数,包括:
获取用于建立索引信息的扇出值;
基于所述扇出值和轨迹数量,确定所述索引信息中所包括的叶子节点的数量;
基于所述叶子节点的数量、轨迹属性和集合属性,确定用于建立索引信息的区域划分参数。
4.根据权利要求3所述的方法,基于所述叶子节点的数量、轨迹属性和集合属性,确定用于建立索引信息的区域划分参数,包括:
基于所述轨迹属性和集合属性,获取所述节点外包框的外包框体积;
利用均值不等式对所述外包框体积进行分析处理,确定满足所述叶子节点的数量、且外包框体积最小的区域划分参数。
5.一种索引建立方法,包括:
获取原始索引信息和待插入轨迹,所述原始索引信息是基于区域划分参数和数据集建立的,所述区域划分参数是通过所述数据集中包括的轨迹数量、所述数据集中轨迹所对应的轨迹属性以及与所述数据集相对应的集合属性所确定的,所述数据集中包括多条轨迹;
确定所述待插入轨迹所对应的轨迹外包框和所述原始索引信息中叶子节点所对应的节点外包框;
在外包框面积和外包框形状的维度,确定与所述轨迹外包框和节点外包框相对应的外包框影响参数;
基于所述外包框影响参数将所述轨迹外包框插入至所述原始索引信息中,生成目标索引信息。
6.根据权利要求5所述的方法,在外包框面积和外包框形状的维度,确定与所述轨迹外包框和节点外包框相对应的外包框影响参数,包括:
将所述轨迹外包框与所述节点外包框进行融合,获得融合后外包框;
获取用于限定融合后外包框形状和节点外包框形状的目标外包框;
基于所述融合后外包框、目标外包框和所述节点外包框,确定与所述轨迹外包框和节点外包框相对应的外包框影响参数。
7.根据权利要求6所述的方法,基于所述融合后外包框、目标外包框和所述节点外包框,确定与所述轨迹外包框和节点外包框相对应的外包框影响参数,包括:
基于所述融合后外包框和所述目标外包框,确定用于标识所述融合后外包框的区域特征以及所述融合后外包框与目标外包框之间的形状相似度的第一参数;
基于所述节点外包框和所述目标外包框,确定用于标识所述节点外包框的区域特征以及所述节点外包框与目标外包框之间的形状相似度的第二参数;
基于所述第一参数和所述第二参数,确定与所述轨迹外包框和节点外包框相对应的外包框影响参数。
8.根据权利要求7所述的方法,基于所述融合后外包框和所述目标外包框,确定用于标识所述融合后外包框的区域特征以及所述融合后外包框与目标外包框之间的形状相似度的第一参数,包括:
确定所述融合后外包框与所述目标外包框之间的第一形状相似度、以及所述融合后外包框所对应的第一区域大小;
将所述第一区域大小与所述第一形状相似度之间的乘积值,确定为所述第一参数。
9.根据权利要求8所述的方法,确定所述融合后外包框与所述目标外包框之间的第一形状相似度,包括:
基于所述融合后外包框,确定用于标识融合后外包框形状特征的第一比例信息;
基于所述目标外包框,确定用于标识目标外包框形状特征的第二比例信息;
基于所述第一比例信息和所述第二比例信息,确定所述融合后外包框与目标外包框之间的第一形状相似度。
10.根据权利要求7所述的方法,基于所述节点外包框和所述目标外包框,确定用于标识所述节点外包框的区域特征以及所述节点外包框与目标外包框之间的形状相似度的第二参数,包括:
确定所述节点外包框与所述目标外包框之间的第二形状相似度、以及所述节点外包框所对应的第二区域大小;
将所述第二区域大小与所述第二形状相似度之间的乘积值,确定为所述第二参数。
11.一种电子设备,包括:存储器、处理器;其中,所述存储器用于存储一条或多条计算机指令,所述一条或多条计算机指令被所述处理器执行时实现如权利要求1-4中任意一项所述的索引建立方法。
12.一种计算机存储介质,用于储存计算机程序,所述计算机程序使计算机执行时实现如权利要求1-4中任意一项所述的索引建立方法。
CN202110858068.3A 2021-07-28 2021-07-28 索引建立方法、装置、设备、存储介质及计算机程序产品 Active CN113312360B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110858068.3A CN113312360B (zh) 2021-07-28 2021-07-28 索引建立方法、装置、设备、存储介质及计算机程序产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110858068.3A CN113312360B (zh) 2021-07-28 2021-07-28 索引建立方法、装置、设备、存储介质及计算机程序产品

Publications (2)

Publication Number Publication Date
CN113312360A CN113312360A (zh) 2021-08-27
CN113312360B true CN113312360B (zh) 2022-01-04

Family

ID=77381859

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110858068.3A Active CN113312360B (zh) 2021-07-28 2021-07-28 索引建立方法、装置、设备、存储介质及计算机程序产品

Country Status (1)

Country Link
CN (1) CN113312360B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103294790A (zh) * 2013-05-22 2013-09-11 西北工业大学 一种面向gps轨迹数据的时空语义索引与检索方法
CN103593430A (zh) * 2013-11-11 2014-02-19 胡宝清 一种基于移动对象时空信息轨迹分段聚类的方法
CN105512317A (zh) * 2015-12-17 2016-04-20 南京航空航天大学 一种基于群组划分的不确定移动对象索引方法
CN109241126A (zh) * 2018-06-29 2019-01-18 武汉理工大学 一种基于r*树索引的时空轨迹聚集模式挖掘算法
CN112131325A (zh) * 2019-06-25 2020-12-25 杭州海康威视数字技术股份有限公司 轨迹确定方法、装置及设备、存储介质
CN112347109A (zh) * 2020-12-25 2021-02-09 冯凌峰 一种基于Google S2 空间索引组织的海量轨迹数据区域查询方法
CN112579921A (zh) * 2020-12-16 2021-03-30 长安大学 基于倒排序索引及前缀树的轨迹索引和查询方法及系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104376020B (zh) * 2013-08-16 2019-01-29 腾讯科技(深圳)有限公司 多维数据的处理方法及装置
CN107133269B (zh) * 2017-04-01 2021-06-18 中国人民解放军国防科技大学 基于移动目标的频繁位置轨迹生成方法及装置
CN112632058A (zh) * 2019-09-24 2021-04-09 杭州海康威视数字技术股份有限公司 轨迹确定方法、装置及设备、存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103294790A (zh) * 2013-05-22 2013-09-11 西北工业大学 一种面向gps轨迹数据的时空语义索引与检索方法
CN103593430A (zh) * 2013-11-11 2014-02-19 胡宝清 一种基于移动对象时空信息轨迹分段聚类的方法
CN105512317A (zh) * 2015-12-17 2016-04-20 南京航空航天大学 一种基于群组划分的不确定移动对象索引方法
CN109241126A (zh) * 2018-06-29 2019-01-18 武汉理工大学 一种基于r*树索引的时空轨迹聚集模式挖掘算法
CN112131325A (zh) * 2019-06-25 2020-12-25 杭州海康威视数字技术股份有限公司 轨迹确定方法、装置及设备、存储介质
CN112579921A (zh) * 2020-12-16 2021-03-30 长安大学 基于倒排序索引及前缀树的轨迹索引和查询方法及系统
CN112347109A (zh) * 2020-12-25 2021-02-09 冯凌峰 一种基于Google S2 空间索引组织的海量轨迹数据区域查询方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"显示导向型的大规模地理矢量实时可视化技术";马梦宇 等;《计算机科学》;20200930;第117-120页 *

Also Published As

Publication number Publication date
CN113312360A (zh) 2021-08-27

Similar Documents

Publication Publication Date Title
US11061984B2 (en) Grid-based geofence data indexing
US11042569B2 (en) System and method for load, aggregate and batch calculation in one scan in a multidimensional database environment
CN110442444B (zh) 一种面向海量遥感影像的并行数据访问方法与系统
US10366113B2 (en) Method and system for generating a geocode trie and facilitating reverse geocode lookups
CN113312361B (zh) 轨迹查询方法、装置、设备、存储介质及计算机程序产品
US8819078B2 (en) Event processing for graph-structured data
CN111052105A (zh) 可缩放的空间-时间密度数据融合
CN111742308A (zh) 一种用于数据存储和查询的系统和方法
Pajić et al. Model of point cloud data management system in big data paradigm
CN107564077B (zh) 一种绘制道路网的方法及装置
US11429581B2 (en) Spatial-temporal query for cognitive IoT contexts
Fang et al. Meteorological data analysis using MapReduce
US8495018B2 (en) Transitioning application replication configurations in a networked computing environment
CN108875032B (zh) 区域类型确定方法及装置
US20190197029A1 (en) Methods, systems and apparatus to improve spatial-temporal data management
CN109978211B (zh) 航班进离港率的预测方法和装置
CN113312360B (zh) 索引建立方法、装置、设备、存储介质及计算机程序产品
CN113285960A (zh) 一种服务数据共享云平台的数据加密方法及系统
CN112991547A (zh) 模型简化处理方法、装置以及电子设备、介质
CN112765127A (zh) 一种交通数据仓库的构建方法、装置、存储介质及终端
CN113312346A (zh) 索引构建方法、轨迹查询方法、装置、设备及可读介质
CN117763024A (zh) 一种数据分片抽取方法及装置
CN115269600A (zh) 一种飞机数据的管理方法、装置、电子设备及存储介质
CN103365948A (zh) 数据管理设备和数据管理方法
CN111460325B (zh) Poi搜索方法、装置与设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant