CN113626493B - 一种时空数据多维查询方法及系统 - Google Patents
一种时空数据多维查询方法及系统 Download PDFInfo
- Publication number
- CN113626493B CN113626493B CN202110832323.7A CN202110832323A CN113626493B CN 113626493 B CN113626493 B CN 113626493B CN 202110832323 A CN202110832323 A CN 202110832323A CN 113626493 B CN113626493 B CN 113626493B
- Authority
- CN
- China
- Prior art keywords
- data
- time
- information
- spatio
- space
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/283—Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Fuzzy Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种时空数据多维查询方法及系统,包括:对时空数据进行检索,获得时空数据的第一数据集;将第一数据集中的数据按照时间维度、位置维度和查询对象自身信息维度进行划分,并将划分后的时空数据进行相对应;以检索时空数据的时间为基准,将每一个时间点作为一个数据单元,并对每一个数据单元中的数据进行监测;若数据单元中存在时空数据不对应时,基于数据单元对时空数据再次进行检索,并将获取的新数据添加至所述第一数据集。通过检索时空数据,得到需要的时空数据集,并将时空数据从多个维度进行划分,且在划分后对不同维度的时空数据之间的对应关系进行监测,根据监测结果完善时空数据信息,提高了时空数据查询的效率及准确度。
Description
技术领域
本发明涉及数据处理技术领域,特别涉及一种时空数据多维查询方法及系统。
背景技术
时空数据(Spatial-Temporal Data)是指具有空间和时间维度的一类数据,它通常用来描述某一对象的空间信息随时间的变化状态。随着通信技术的进步,物联网已经开始遍布生活中的角落,并且日益扩大影响。现如今,汽车的导航数据被各导航设备厂商上报留存,人们出门购物所使用的网络支付也支撑起消费地点及时间的数据搜集,疫情下人们的出行健康码登记也是物联网的体现。个体身份属性信息和时间及空间叠加,对数据分析的视角起到了革命性的推进。但是,数据量的爆炸带来的是对数据存储和查询使用的挑战,如何将新时代的时空数据和实体属性数据一体化查询是未来所面临的问题。高效科学的数据的组织管理,满足物联网时代的数据时空一体化快速应用查询对社会都是具有相当大的推进作用。
因此,本发明提供了一种时空数据多维查询方法及系统,通过将时空数据从多个维度进行划分,并在划分后对不同维度的时空数据之间的对应关系进行监测,并根据监测结果完善时空数据信息。
发明内容
本发明提供一种时空数据多维查询方法及系统,用以通过将时空数据从多个维度进行划分,并在划分后对不同维度的时空数据之间的对应关系进行监测,并根据监测结果完善时空数据信息。
本发明提供了一种时空数据多维查询方法,包括:
步骤1:对时空数据进行检索,获得所述时空数据的第一数据集;
步骤2:将所述第一数据集中的数据按照时间维度、位置维度和查询对象自身信息维度进行划分,并将划分后的时空数据的时间信息、位置信息、自身内容信息相对应;
步骤3:以检索所述时空数据的时间为基准,将每一个时间点作为一个数据单元,并对每个数据单元中的划分数据进行监测;
步骤4:若存在所述数据单元中的划分数据不对应时,按照所述数据单元的划分数据从时空数据进行再次检索,并将获取的新数据添加至所述第一数据集。
优选的,一种时空数据多维查询方法,步骤1中,对时空数据进行检索,获得所述时空数据的第一数据集,包括:
获取检索关键词以及预设时空数据库,其中,所述预设时空数据库中包含多级时空数据;
建立多级索引,并从上一级索引的节点链接至下一级索引的节点,直至链接所述预设时空数据库中的全部多级时空数据;
基于所述多级索引,根据所述检索关键词执行检索任务请求,其中,所述检索任务请求包括所述预设时空数据库内检索起始地址以及检索结束地址;
基于所述检索起始地址以及检索结束地址读取所述预设时空数据库中的目标时空数据,得到所述时空数据的第一数据集。
优选的,一种时空数据多维查询方法,步骤2中,将所述第一数据集中的数据按照时间维度、位置维度和查询对象自身信息维度进行划分,并将划分后的时空数据的时间信息、位置信息、自身内容信息相对应,包括:
获取所述第一数据集中的时空数据,并将所述时空数据进行格式化处理;
将格式化处理后的所述时空数据进行拆分,得到M个数据块,提取所述M个数据块的标签信息,且基于所述标签信息从预设的属性表中确定所述M个数据块的属性标识信息;
基于所述属性标识信息,确定所述M个数据块对应的候选属性集合;
基于所述候选属性集合,确定所述M个数据块内容对应的属性,并根据所述M个数据块内容对应的属性确定M个数据块的置信度;
根据所述置信度,确定所述M个数据块的属性;
基于所述M个数据块的属性,确定所述时空数据的划分方案,其中划分方案包括从时间维度、位置维度和查询对象自身信息维度进行划分;
基于所述划分方案,创建用于划分所述时空数据的候选划分平面,并通过所述候选划分平面预划分所述时空数据;
基于预设划分评价模型,对预划分结果进行评价,并得到对应的评价值;
选取所述评价值大于或等于预设评价值对应的候选划分平面作为目标划分平面,并基于所述目标划分平面完成对所述时空数据的划分;
其中,划分结果包括所述时空数据的时间信息、位置信息以及时空数据的自身内容信息;
获取匹配条件,其中匹配条件包括将所述时空数据的时间信息、位置信息、自身内容信息进行匹配;
基于所述匹配条件,构建匹配树,其中,所述匹配树中记录所述时空数据的匹配属性值以及所述时空数据的时间信息、位置信息、自身内容信息之间的关联度;
基于所述匹配树,确定所述时空数据的时间信息、位置信息分别和时空数据的自身内容信息的对应关系。
优选的,一种时空数据多维查询方法,确定所述时空数据的时间信息、位置信息、自身内容信息的对应关系,还包括:
获取所述时空数据的时间信息、位置信息、自身内容信息的对应关系,并调用预设的检查类,其中,所述检查类至少为一个;
基于所述预设的检查类依次对所述时空数据的时间信息、位置信息、自身内容信息的对应关系进行校验;
若对应关系通过所述预设的检查类的检查,判定所述时空数据的时间信息、位置信息、自身内容信息的对应关系无误;
否则,判定对应关系错误,并重新将所述时空数据的时间信息、位置信息分别与所述时空数据的自身内容信息进行匹配,直至对应关系通过所述预设的检查类的检查。
优选的,一种时空数据多维查询方法,步骤3中,对每个数据单元中的划分数据进行监测,包括:
获取时空数据的时间信息、位置信息、自身内容信息相对应的对应关系;
提取所述对应关系中至少一个数据字段的对应标识,并基于所述对应标识查询已存储对应关系中所有数据字段对应的监测属性信息;
基于所述监测属性信息,调用预设监测规则对所述时空数据的时间信息、位置信息、自身内容信息相对应的对应关系进行实时监测,得到监测结果,并将所述监测结果,以时间为基准,生成监测数据表。
优选的,一种时空数据多维查询方法,步骤4中,若存在所述数据单元中的划分数据不对应,包括:
获取对每一个数据单元中数据的监测结果以及划分后的时空数据的时间信息、位置信息、自身内容信息相对应的对应关系;
将所述监测结果与所述对应关系进行比较;
若所述监测结果与所述对应关系不相同,判定至少一个数据单元中存在时空数据不对应,并进行声光报警提醒;
其中,所述监测结果与所述对应关系不相同为所述时空数据的时间信息、位置信息不对应;
否则,判定数据单元中的数据无异常。
优选的,一种时空数据多维查询方法,步骤4中,将获取的新数据添加至所述第一数据集,包括:
获取基于所述数据单元对时空数据再次进行检索得到的新数据,并将所述新数据与所述第一数据集中已存储的数据进行比对;
基于比对结果,确定所述新数据中的新增上线数据以及第一数据集中已存储数据的存量下线数据;
获取所述新数据中的新增上线数据的目标区块标识以及第一数据集中待更新页面的页面标识;
基于所述目标区块标识及待更新页面的页面标识,根据预设规则将所述新增上线数据在所述待更新页面中的目标区域进行更新;
同时,将目标区域中的存量下线数据进行下线,完成将获取的新数据添加至所述第一数据集。
优选的,一种时空数据多维查询方法,步骤2中,将所述第一数据集中的数据按照时间维度、位置维度和查询对象自身信息维度进行划分,并将划分后的时空数据的时间信息、位置信息、自身内容信息相对应,还包括:
获取所述第一数据集中的数据按照时间维度、位置维度和查询对象自身信息维度进行划分的划分结果;
其中,划分结果包括时空数据的时间信息、位置信息和自身内容信息;
基于所述划分结果,计算在对所述第一数据集中的数据划分时的划分系数,并根据所述划分系数计算时空数据的时间信息、位置信息和自身内容信息匹配时的实际匹配准确率,具体步骤包括:
根据如下公式计算对所述第一数据集中的数据划分时的划分系数:
其中,α表示对所述第一数据集中的数据划分时的划分系数;γ表示划分误差因子,且取值范围为(0.1,0.2);i表示对所述第一数据集中的数据划分后的当前数据块的个数;n表示对所述第一数据集中的数据划分后的数据块的总个数;δi表示第i个数据块中所包含的数据量;θ表示所述第一数据集中包含的数据总量;
根据如下公式计算时空数据的时间信息、位置信息和自身内容信息匹配时的实际匹配准确率:
其中,β表示时空数据的时间信息、位置信息和自身内容信息匹配时的实际匹配准确率,且取值范围为(0,1);α表示对所述第一数据集中的数据划分时的划分系数;μ表示匹配系数,且取值范围为(0.6,0.8);ρ表示时空数据的时间信息、位置信息和自身内容信息匹配时的实际匹配度;表示时空数据的时间信息、位置信息和自身内容信息匹配时的理想匹配度;ω表示匹配误差系数,且取值范围为(0.15,0.2);
将计算得到的实际匹配准确率与预设匹配准确率进行比较;
若计算得到的实际匹配准确率小于所述预设匹配准确率,判定时空数据的时间信息、位置信息和自身内容信息匹配不合格,并重新对所述第一数据集中的数据按照时间维度、位置维度和查询对象自身信息维度进行划分,直至所述计算得到的实际匹配准确率大于或等于所述预设匹配准确率;
否则,判定时空数据的时间信息、位置信息和自身内容信息匹配合格,完成信息匹配,并基于预设监测规则对匹配后的数据进行实时监测。
优选的,一种时空数据多维查询系统,包括:
数据获取模块,用于对时空数据进行检索,获得所述时空数据的第一数据集;
数据划分模块,用于将所述第一数据集中的数据按照时间维度、位置维度和查询对象自身信息维度进行划分,并将划分后的时空数据的时间信息、位置信息、自身内容信息相对应;
数据监测模块,用于以检索所述时空数据的时间为基准,将每一个时间点作为一个数据单元,并对每个数据单元中的划分数据进行监测;
数据更新模块,用于若存在所述数据单元中的划分数据不对应时,按照所述数据单元的划分数据从时空数据进行再次检索,并将获取的新数据添加至所述第一数据集。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中一种时空数据多维查询方法的流程图;
图2为本发明实施例中一种时空数据多维查询系统的结构图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
实施例1:
本实施例提供了一种时空数据多维查询方法,如图1所示,包括:
步骤1:对时空数据进行检索,获得所述时空数据的第一数据集;
步骤2:将所述第一数据集中的数据按照时间维度、位置维度和查询对象自身信息维度进行划分,并将划分后的时空数据的时间信息、位置信息、自身内容信息相对应;
步骤3:以检索所述时空数据的时间为基准,将每一个时间点作为一个数据单元,并对每个数据单元中的划分数据进行监测;
步骤4:存在所述数据单元中的划分数据不对应时,按照所述数据单元的划分数据从时空数据进行再次检索,并将获取的新数据添加至所述第一数据集。
该实施例中,第一数据集指的是从众多的时空数据中挑选出需要的时空数据,并将挑选出的时空数据组成一个数据集,即为第一数据集。
该实施例中,若至少一个数据单元中存在时空数据不正确时指的是时空数据的时间信息、位置信息不对应,即判定时空数据不正确。
该实施例中,新数据指的是再对时空数据进行二次检索后得到的新的时空数据,此数据中,时空数据的时间信息、位置信息、自身内容信息相对应。
上述技术方案的有益效果是:通过检索时空数据,得到需要的时空数据集,并将时空数据从多个维度进行划分,且在划分后对不同维度的时空数据之间的对应关系进行监测,根据监测结果完善时空数据信息,提高了时空数据查询的效率及准确度。
实施例2:
在上述实施例1的基础上,本实施例提供了一种时空数据多维查询方法,步骤1中,对时空数据进行检索,获得所述时空数据的第一数据集,包括:
获取检索关键词以及预设时空数据库,其中,所述预设时空数据库中包含多级时空数据;
建立多级索引,并从上一级索引的节点链接至下一级索引的节点,直至链接所述预设时空数据库中的全部多级时空数据;
基于所述多级索引,根据所述检索关键词执行检索任务请求,其中,所述检索任务请求包括所述预设时空数据库内检索起始地址以及检索结束地址;
基于所述检索起始地址以及检索结束地址读取所述预设时空数据库中的目标时空数据,得到所述时空数据的第一数据集。
该实施例中,检索关键词是事先设定好的,用来从预设时空数据库中挑选出和关键词相匹配的时空数据。
该实施例中,预设时空数据库是提前设定好的,内部存储有多个时空数据。
该实施例中,多级时空数据指的是预设时空数据库中的数据存在级别区分,且内部还有多个级别的时空数据,故定义为多级时空数据。
该实施例中,检索任务请求指的是根据检索关键词执行对预设时空数据库中的数据进行检索。
该实施例中,目标时空数据指的是预设时空数据库中需要得到的时空数据,是预设时空数据库中的一部分,定义为目标时空数据。
上述技术方案的有益效果是:通过确定检索关键词,从预设时空数据库中检索需要的时空数据,提高了时空数据查询的准确度,便于确定时空数据中时间、位置和自身内容信息之间的对应关系,从而提高了完善时空数据的效率。
实施例3:
在上述实施例1的基础上,本实施例提供了一种时空数据多维查询方法,步骤2中,将所述第一数据集中的数据按照时间维度、位置维度和查询对象自身信息维度进行划分,并将划分后的时空数据的时间信息、位置信息、自身内容信息相对应,包括:
获取所述第一数据集中的时空数据,并将所述时空数据进行格式化处理;
将格式化处理后的所述时空数据进行拆分,得到M个数据块,提取所述M个数据块的标签信息,且基于所述标签信息从预设的属性表中确定所述M个数据块的属性标识信息;
基于所述属性标识信息,确定所述M个数据块对应的候选属性集合;
基于所述候选属性集合,确定所述M个数据块内容对应的属性,并根据所述M个数据块内容对应的属性确定M个数据块的置信度;
根据所述置信度,确定所述M个数据块的属性;
基于所述M个数据块的属性,确定所述时空数据的划分方案,其中划分方案包括从时间维度、位置维度和查询对象自身信息维度进行划分;
基于所述划分方案,创建用于划分所述时空数据的候选划分平面,并通过所述候选划分平面预划分所述时空数据;
基于预设划分评价模型,对预划分结果进行评价,并得到对应的评价值;
选取所述评价值大于或等于预设评价值对应的候选划分平面作为目标划分平面,并基于所述目标划分平面完成对所述时空数据的划分;
其中,划分结果包括所述时空数据的时间信息、位置信息以及时空数据的自身内容信息;
获取匹配条件,其中匹配条件包括将所述时空数据的时间信息、位置信息、自身内容信息进行匹配;
基于所述匹配条件,构建匹配树,其中,所述匹配树中记录所述时空数据的匹配属性值以及所述时空数据的时间信息、位置信息、自身内容信息之间的关联度;
基于所述匹配树,确定所述时空数据的时间信息、位置信息分别和时空数据的自身内容信息的对应关系。
该实施例中,格式化处理是为了将第一数据集中的数据格式进行统一化,便于对第一数据集中的数据进行处理。
该实施例中,标签信息用来标识数据块的一种标签,可根据标签信息快速确定数据快中数据的类型、属性等信息。
该实施例中,预设的属性表是提前设定好的,内部存储有多种数据对应的属性信息,是经过多次训练得到的。
该实施例中,属性标识信息指的是对数据块的属性进行标识,可根据此标识准确快速的确定数据块的属性值等。
该实施例中,候选属性集合中包含多种备选属性,是与M个数据块的属性相对应的。
该实施例中,置信度是用来判断数据块的属性信息是否正确,是用来判断数据块属性的一个标准。
该实施例中,候选划分平面中包含多个划分平面,划分平面是用来对时空数据从多个维度进行划分。
该实施例中,预设评价值是经过多次训练得到的,是用来衡量划分结果的一个指标。
该实施例中,匹配属性值指的是时空数据的时间信息、位置信息、自身内容信息之间的匹配程度值。
该实施例中,关联度指的是时空数据的时间信息、位置信息、自身内容信息两两之间的对应程度,便于根据对应程度确定三者之间的对应关系。
上述技术方案的有益效果是:通过确定时空数据的属性,并根据时空数据的属性确定将时空数据进行划分的划分面,便于对时空数据进行准确的划分,且在划分结束后,将时空数据的时间、位置分别与时空数据自身内容信息进行对应,为对时空数据进行监测提供了便利,提高了发现时空数据不正确的效率,从而完成对时空数据的查询完善,提高了时空数据查询的效率和准确度。
实施例4:
在上述实施例3的基础上,本实施例提供了一种时空数据多维查询方法,确定所述时空数据的时间信息、位置信息、自身内容信息的对应关系,还包括:
获取所述时空数据的时间信息、位置信息分别和时空数据的自身内容信息的对应关系,并调用预设的检查类,其中,所述检查类至少为一个;
基于所述预设的检查类依次对所述时空数据的时间信息、位置信息、自身内容信息的对应关系进行校验;
若对应关系通过所述预设的检查类的检查,判定所述时空数据的时间信息、位置信息、自身内容信息的对应关系无误;
否则,判定对应关系错误,并重新将所述时空数据的时间信息、位置信息、自身内容信息进行匹配,直至对应关系通过所述预设的检查类的检查。
该实施例中,预设的检查类是提前设定好的,内部包含多个检查项,例如:数据类型检查、数据值检查、数据字段对应关系检查等。
上述技术方案的有益效果是:通过对时空数据的时间、位置分别与时空数据的自身内容信息的对应关系进行校验,确保分割后的时空多维数据能够一一对应,便于实时观察时空数据的对应关系,从而提高了时空数据查询及完善的效率。
实施例5:
在上述实施例1的基础上,本实施例提供了一种时空数据多维查询方法,步骤3中,对每个数据单元中的划分数据进行监测,包括:
获取时空数据的时间信息、位置信息、自身内容信息相对应的对应关系;
提取所述对应关系中至少一个数据字段的对应标识,并基于所述对应标识查询已存储对应关系中所有数据字段对应的监测属性信息;
基于所述监测属性信息,调用预设监测规则对所述时空数据的时间信息、位置信息、自身内容信息相对应的对应关系进行实时监测,得到监测结果,并将所述监测结果,以时间为基准,生成监测数据表。
该实施例中,数据字段的对应标识是用来标记数据字段之间对应关系的一种标记,可根据此标识快速确定数据字段之间的对应属性。
该实施例中,监测属性信息指的是数据字段对应关系中需要进行监测的部分,监测该属性信息可准确判断时空数据是否正确。
该实施例中,预设监测规则是提前设定好的,例如按优先级进行监测、同步进行监测等。
上述技术方案的有益效果是:通过确定时空数据中需要监测的数据,并实时对监测数据进行监测,便于及时发现不正确的时空数据,从而提高了对时空数据进行查询及完善的效率,同时为确保了查询到的时空数据的准确性。
实施例6:
在上述实施例1的基础上,本实施例提供了一种时空数据多维查询方法,步骤4中,若存在所述数据单元中的划分数据不对应,包括:
获取对每一个数据单元中数据的监测结果以及划分后的时空数据的时间信息、位置信息、自身内容信息相对应的对应关系;
将所述监测结果与所述对应关系进行比较;
若所述监测结果与所述对应关系不相同,判定至少一个数据单元中存在时空数据不对应,并进行声光报警提醒;
其中,所述监测结果与所述对应关系不相同为所述时空数据的时间信息、位置信息不对应;
否则,判定数据单元中的数据无异常。
上述技术方案的有益效果是:通过将监测结果与对应关系进行比较,确保能够及时发现时空数据的错误,并且在发现错误时进行报警提醒,便于及时了解当前时空数据的状态,同时也便于及时对当前的时空数据进行再次查询,提高了时空数据查询的效率及准确度。
实施例7:
在上述实施例1的基础上,本实施例提供了一种时空数据多维查询方法,步骤4中,将获取的新数据添加至所述第一数据集,包括:
获取基于所述数据单元对时空数据再次进行检索得到的新数据,并将所述新数据与所述第一数据集中已存储的数据进行比对;
基于比对结果,确定所述新数据中的新增上线数据以及第一数据集中已存储数据的存量下线数据;
获取所述新数据中的新增上线数据的目标区块标识以及第一数据集中待更新页面的页面标识;
基于所述目标区块标识及待更新页面的页面标识,根据预设规则将所述新增上线数据在所述待更新页面中的目标区域进行更新;
同时,将目标区域中的存量下线数据进行下线,完成将获取的新数据添加至所述第一数据集。
该实施例中,新增上线数据指的是对时空数据进行再次检索后,需要添加至第一数据集中的部分时空数据。
该实施例中,存量下线数据指的是第一数据集中出现错误的时空数据,需要从第一数据集中剔除的。
该实施例中,目标区块标识指的是新数据需要在第一数据集中更新的区域,标识是用来标记此区域快,便于将新数据顺利在目标区域进行更新。
该实施例中,页面标识指的是第一数据中存在多个数据存储页面,用标识标记需要进行数据更新的数据页面,便于快速准确的从多个存储页面中确定需要进行数据更新的页面。
上述技术方案的有益效果是:通过比对结果确定需要进行更新的数据和需要进行下线的数据,同时在第一数据集中确定待更新页面及待更新页面中的数据更新区域,便于将再次查询到的数据顺利准确的更新至第一数据集中,提高了时空数据更新完善的效率,同时也提高了时空数据查询的准确度。
实施例8:
在上述实施例1的基础上,本实施例提供了一种时空数据多维查询方法,步骤2中,将所述第一数据集中的数据按照时间维度、位置维度和查询对象自身信息维度进行划分,并将划分后的时空数据的时间信息、位置信息、自身内容信息相对应,还包括:
获取所述第一数据集中的数据按照时间维度、位置维度和查询对象自身信息维度进行划分的划分结果;
其中,划分结果包括时空数据的时间信息、位置信息和自身内容信息;
基于所述划分结果,计算在对所述第一数据集中的数据划分时的划分系数,并根据所述划分系数计算时空数据的时间信息、位置信息和自身内容信息匹配时的实际匹配准确率,具体步骤包括:
根据如下公式计算对所述第一数据集中的数据划分时的划分系数:
其中,α表示对所述第一数据集中的数据划分时的划分系数;γ表示划分误差因子,且取值范围为(0.1,0.2);i表示对所述第一数据集中的数据划分后的当前数据块的个数;n表示对所述第一数据集中的数据划分后的数据块的总个数;δi表示第i个数据块中所包含的数据量;θ表示所述第一数据集中包含的数据总量;
根据如下公式计算时空数据的时间信息、位置信息和自身内容信息匹配时的实际匹配准确率:
其中,β表示时空数据的时间信息、位置信息和自身内容信息匹配时的实际匹配准确率,且取值范围为(0,1);α表示对所述第一数据集中的数据划分时的划分系数;ρ表示时空数据的时间信息、位置信息和自身内容信息匹配时的实际匹配度;表示时空数据的时间信息、位置信息和自身内容信息匹配时的理想匹配度;ω表示匹配误差系数,且取值范围为(0.15,0.2);
将计算得到的实际匹配准确率与预设匹配准确率进行比较;
若计算得到的实际匹配准确率小于所述预设匹配准确率,判定时空数据的时间信息、位置信息和自身内容信息匹配不合格,并重新对所述第一数据集中的数据按照时间维度、位置维度和查询对象自身信息维度进行划分,直至所述计算得到的实际匹配准确率大于或等于所述预设匹配准确率;
否则,判定时空数据的时间信息、位置信息和自身内容信息匹配合格,完成信息匹配,并基于预设监测规则对匹配后的数据进行实时监测。
该实施例中,划分系数指的是在对第一数据集中的数据进行划分时的参考标准,可根据划分系数对第一数据集中的数据按照划分要求进行准确划分。
该实施例中,划分误差因子指的是在计算划分系数时,因人为原因或外界不可抗因素造成的误差,表示对划分系数计算的影响。
该实施例中,匹配误差系数指的是在对数据进行匹配时,因匹配过程中受外界影响,造成匹配率降低的影响因素,表示对实际匹配准确率的影响程度。
该实施例中,预设匹配准确率是提前设定好的,用来衡量时空数据的时间信息、位置信息和时空数据的自身内容信息匹配的准确率,衡量实际匹配准确率的一个标准。
该实施例中,数据块的总个数为采用时间维度、位置维度和查询对象自身信息维度三个维度对第一数据集进行划分后得到的数据块的个数。
该实施例中,数据总量指的是第一数据集中的时空数据在被划分前所包含的信息量。
该实施例中,理想匹配度是提前已知的,是期望达到的匹配度。
该实施例中,实际匹配准确率指的是理论匹配准确率在误差因子以及划分系数的影响下对时空数据的时间信息、位置信息和自身内容信息匹配率计算结果,是小于理论匹配准确率的。
上述技术方案的有益效果是:通过计算在对第一数据集中的数据划分时的划分系数,并根据划分系数计算时空数据的时间信息、位置信息和时空数据的自身内容信息匹配时的实际匹配准确率,在计算划分系数时,涉及划分后每一数据块所包含的数据量与总数据量之比、划分误差因子等,确保根据划分要求准确计算出影响划分的划分系数,在计算实际匹配准确率时,涉及施例匹配度与理想匹配度的比值,同时涉及匹配系数,误差系数等,确保计算结果准确可靠,此方案确保了将时空数据中的时间信息、位置信息与时空数据的自身内容信息进行准确匹配,便于及时发现出错的时空数据,从而提高了对时空数据的完善及查询效率。
实施例9:
本实施例提供了一种时空数据多维查询系统,如图2所示,包括:
数据获取模块,用于对时空数据进行检索,获得所述时空数据的第一数据集;
数据划分模块,用于将所述第一数据集中的数据按照时间维度、位置维度和查询对象自身信息维度进行划分,并将划分后的时空数据的时间信息、位置信息、自身内容信息相对应;
数据监测模块,用于以检索所述时空数据的时间为基准,将每一个时间点作为一个数据单元,并对每个数据单元中的划分数据进行监测;
数据更新模块,用于若存在所述数据单元中的划分数据不对应时,按照所述数据单元的划分数据从时空数据进行再次检索,并将获取的新数据添加至所述第一数据集。
上述技术方案的有益效果是:通过检索时空数据,得到需要的时空数据集,并将时空数据从多个维度进行划分,且在划分后对不同维度的时空数据之间的对应关系进行监测,根据监测结果完善时空数据信息,提高了时空数据查询的效率及准确度。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (8)
1.一种时空数据多维查询方法,其特征在于,包括:
步骤1:对时空数据进行检索,获得所述时空数据的第一数据集;
步骤2:将所述第一数据集中的数据按照时间维度、位置维度和查询对象自身信息维度进行划分,并将划分后的时空数据的时间信息、位置信息、自身内容信息相对应;
步骤3:以检索所述时空数据的时间为基准,将每一个时间点作为一个数据单元,并对每个数据单元中的划分数据进行监测;
步骤4:若存在所述数据单元中的划分数据不对应时,按照所述数据单元的划分数据从时空数据进行再次检索,并将获取的新数据添加至所述第一数据集;
获取基于所述数据单元对时空数据再次进行检索得到的新数据,并将所述新数据与所述第一数据集中已存储的数据进行比对;
基于比对结果,确定所述新数据中的新增上线数据以及第一数据集中已存储数据的存量下线数据;
获取所述新数据中的新增上线数据的目标区块标识以及第一数据集中待更新页面的页面标识;
基于所述目标区块标识及待更新页面的页面标识,根据预设规则将所述新增上线数据在所述待更新页面中的目标区域进行更新;
同时,将目标区域中的存量下线数据进行下线,完成将获取的新数据添加至所述第一数据集。
2.根据权利要求1所述的一种时空数据多维查询方法,其特征在于,步骤1中,对时空数据进行检索,获得所述时空数据的第一数据集,包括:
获取检索关键词以及预设时空数据库,其中,所述预设时空数据库中包含多级时空数据;
建立多级索引,并从上一级索引的节点链接至下一级索引的节点,直至链接所述预设时空数据库中的全部多级时空数据;
基于所述多级索引,根据所述检索关键词执行检索任务请求,其中,所述检索任务请求包括所述预设时空数据库内检索起始地址以及检索结束地址;
基于所述检索起始地址以及检索结束地址读取所述预设时空数据库中的目标时空数据,得到所述时空数据的第一数据集。
3.根据权利要求1所述的一种时空数据多维查询方法,其特征在于,步骤2中,将所述第一数据集中的数据按照时间维度、位置维度和查询对象自身信息维度进行划分,并将划分后的时空数据的时间信息、位置信息、自身内容信息相对应,包括:
获取所述第一数据集中的时空数据,并将所述时空数据进行格式化处理;
将格式化处理后的所述时空数据进行拆分,得到M个数据块,提取所述M个数据块的标签信息,且基于所述标签信息从预设的属性表中确定所述M个数据块的属性标识信息;
基于所述属性标识信息,确定所述M个数据块对应的候选属性集合;
基于所述候选属性集合,确定所述M个数据块内容对应的属性,并根据所述M个数据块内容对应的属性确定M个数据块的置信度;
根据所述置信度,确定所述M个数据块的属性;
基于所述M个数据块的属性,确定所述时空数据的划分方案,其中划分方案包括从时间维度、位置维度和查询对象自身信息维度进行划分;
基于所述划分方案,创建用于划分所述时空数据的候选划分平面,并通过所述候选划分平面预划分所述时空数据;
基于预设划分评价模型,对预划分结果进行评价,并得到对应的评价值;
选取所述评价值大于或等于预设评价值对应的候选划分平面作为目标划分平面,并基于所述目标划分平面完成对所述时空数据的划分;
其中,划分结果包括所述时空数据的时间信息、位置信息以及自身内容信息;
获取匹配条件,其中匹配条件包括将所述时空数据的时间信息、位置信息、自身内容信息进行匹配;
基于所述匹配条件,构建匹配树,其中,所述匹配树中记录所述时空数据的匹配属性值以及所述时空数据的时间信息、位置信息、自身内容信息之间的关联度;
基于所述匹配树,确定所述时空数据的时间信息、位置信息和自身内容信息的对应关系。
4.根据权利要求3所述的一种时空数据多维查询方法,其特征在于,确定所述时空数据的时间信息、位置信息、自身内容信息的对应关系,还包括:
获取所述时空数据的时间信息、位置信息、自身内容信息的对应关系,并调用预设的检查类,其中,所述检查类至少为一个;
基于所述预设的检查类依次对所述时空数据的时间信息、位置信息、自身内容信息的对应关系进行校验;
若对应关系通过所述预设的检查类的检查,判定所述时空数据的时间信息、位置信息、自身内容信息的对应关系无误;
否则,判定对应关系错误,并重新将所述时空数据的时间信息、位置信息、自身内容信息进行匹配,直至对应关系通过所述预设的检查类的检查。
5.根据权利要求1所述的一种时空数据多维查询方法,其特征在于,步骤3中,对每个数据单元中的划分数据进行监测,包括:
获取时空数据的时间信息、位置信息、自身内容信息相对应的对应关系;
提取所述对应关系中至少一个数据字段的对应标识,并基于所述对应标识查询已存储对应关系中所有数据字段对应的监测属性信息;
基于所述监测属性信息,调用预设监测规则对所述时空数据的时间信息、位置信息、自身内容信息相对应的对应关系进行实时监测,得到监测结果,并将所述监测结果,以时间为基准,生成监测数据表。
6.根据权利要求1所述的一种时空数据多维查询方法,其特征在于,步骤4中,若存在所述数据单元中的划分数据不对应,包括:
获取对每一个数据单元中数据的监测结果以及划分后的时空数据的时间信息、位置信息、自身内容信息相对应的对应关系;
将所述监测结果与所述对应关系进行比较;
若所述监测结果与所述对应关系不相同,判定至少一个数据单元中存在时空数据不对应,并进行声光报警提醒;
其中,所述监测结果与所述对应关系不相同为所述时空数据的时间信息、位置信息不对应;
否则,判定数据单元中的数据无异常。
7.根据权利要求1所述的一种时空数据多维查询方法,其特征在于,步骤2中,将所述第一数据集中的数据按照时间维度、位置维度和查询对象自身信息维度进行划分,并将划分后的时空数据的时间信息、位置信息、自身内容信息相对应,还包括:
获取所述第一数据集中的数据按照时间维度、位置维度和查询对象自身信息维度进行划分的划分结果;
其中,划分结果包括时空数据的时间信息、位置信息和自身内容信息;
基于所述划分结果,计算在对所述第一数据集中的数据划分时的划分系数,并根据所述划分系数计算时空数据的时间信息、位置信息和自身内容信息匹配时的实际匹配准确率,具体步骤包括:
根据如下公式计算对所述第一数据集中的数据划分时的划分系数:
其中,表示对所述第一数据集中的数据划分时的划分系数;表示划分误差因子,且取值范围为(0.1,0.2);表示对所述第一数据集中的数据划分后的当前数据块的个数;表示对所述第一数据集中的数据划分后的数据块的总个数;表示第个数据块中所包含的数据量;表示所述第一数据集中包含的数据总量;
根据如下公式计算时空数据的时间信息、位置信息和自身内容信息匹配时的实际匹配准确率:
其中,表示时空数据的时间信息、位置信息和自身内容信息匹配时的实际匹配准确率,且取值范围为(0,1);表示对所述第一数据集中的数据划分时的划分系数;表示时空数据的时间信息、位置信息和自身内容信息匹配时的实际匹配度;表示时空数据的时间信息、位置信息和自身内容信息匹配时的理想匹配度;表示匹配误差系数,且取值范围为(0.15,0.2);
将计算得到的实际匹配准确率与预设匹配准确率进行比较;
若计算得到的实际匹配准确率小于所述预设匹配准确率,判定时空数据的时间信息、位置信息和自身内容信息匹配不合格,并重新对所述第一数据集中的数据按照时间维度、位置维度和查询对象自身信息维度进行划分,直至所述计算得到的实际匹配准确率大于或等于所述预设匹配准确率;
否则,判定时空数据的时间信息、位置信息和自身内容信息匹配合格,完成信息匹配,并基于预设监测规则对匹配后的数据进行实时监测。
8.一种时空数据多维查询系统,其特征在于,包括:
数据获取模块,用于对时空数据进行检索,获得所述时空数据的第一数据集;
数据划分模块,用于将所述第一数据集中的数据按照时间维度、位置维度和查询对象自身信息维度进行划分,并将划分后的时空数据的时间信息、位置信息、自身内容信息相对应;
数据监测模块,用于以检索所述时空数据的时间为基准,将每一个时间点作为一个数据单元,并对每个数据单元中的划分数据进行监测;
数据更新模块,用于若存在所述数据单元中的划分数据不对应时,按照所述数据单元的划分数据从时空数据进行再次检索,并将获取的新数据添加至所述第一数据集;
获取基于所述数据单元对时空数据再次进行检索得到的新数据,并将所述新数据与所述第一数据集中已存储的数据进行比对;
基于比对结果,确定所述新数据中的新增上线数据以及第一数据集中已存储数据的存量下线数据;
获取所述新数据中的新增上线数据的目标区块标识以及第一数据集中待更新页面的页面标识;
基于所述目标区块标识及待更新页面的页面标识,根据预设规则将所述新增上线数据在所述待更新页面中的目标区域进行更新;
同时,将目标区域中的存量下线数据进行下线,完成将获取的新数据添加至所述第一数据集。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110832323.7A CN113626493B (zh) | 2021-07-22 | 2021-07-22 | 一种时空数据多维查询方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110832323.7A CN113626493B (zh) | 2021-07-22 | 2021-07-22 | 一种时空数据多维查询方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113626493A CN113626493A (zh) | 2021-11-09 |
CN113626493B true CN113626493B (zh) | 2022-03-15 |
Family
ID=78380570
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110832323.7A Active CN113626493B (zh) | 2021-07-22 | 2021-07-22 | 一种时空数据多维查询方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113626493B (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103294790A (zh) * | 2013-05-22 | 2013-09-11 | 西北工业大学 | 一种面向gps轨迹数据的时空语义索引与检索方法 |
CN104850970A (zh) * | 2015-06-16 | 2015-08-19 | 广东航宇卫星科技有限公司 | 时空数据应急联动的三维可视化运营管理平台 |
CN105159895A (zh) * | 2014-05-28 | 2015-12-16 | 国际商业机器公司 | 用于存储和查询数据的方法和系统 |
CN106446278A (zh) * | 2016-10-24 | 2017-02-22 | 北京亚控科技发展有限公司 | 一种基于时空数据库的对数据对象的检索方法 |
KR20170089163A (ko) * | 2016-01-26 | 2017-08-03 | 서강대학교산학협력단 | 시공간 정보 저장장치 검색용 유사의미 정보 색인 방법 |
CN109117087A (zh) * | 2018-07-19 | 2019-01-01 | 北京蜂盒科技有限公司 | 采集监控数据的方法、装置、存储介质及电子设备 |
CN110399446A (zh) * | 2019-07-26 | 2019-11-01 | 广州市城市规划勘测设计研究院 | 大规模时空数据的可视化方法、装置、设备及存储介质 |
CN110532341A (zh) * | 2019-09-03 | 2019-12-03 | 华东师范大学 | 空间信息时空大数据约束表达方法 |
CN110647662A (zh) * | 2019-08-03 | 2020-01-03 | 电子科技大学 | 一种基于语义的多模态时空数据关联方法 |
CN111831870A (zh) * | 2020-06-12 | 2020-10-27 | 北京百度网讯科技有限公司 | 时空数据的异常检测方法、装置、电子设备和存储介质 |
CN112800056A (zh) * | 2021-01-21 | 2021-05-14 | 北京博阳世通信息技术有限公司 | 基于多粒度时空数据的多层索引构建方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040220965A1 (en) * | 2003-04-30 | 2004-11-04 | Michael Harville | Indexed database structures and methods for searching path-enhanced multimedia |
CN103905441B (zh) * | 2014-03-28 | 2017-08-25 | 广州华多网络科技有限公司 | 数据获取方法及装置 |
CN110532255A (zh) * | 2019-05-20 | 2019-12-03 | 南京大学 | 一种基于三维r树的时空数据的存储及检索和更新方法 |
CN111026710A (zh) * | 2019-12-11 | 2020-04-17 | 华南师范大学 | 一种数据集的检索方法及系统 |
-
2021
- 2021-07-22 CN CN202110832323.7A patent/CN113626493B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103294790A (zh) * | 2013-05-22 | 2013-09-11 | 西北工业大学 | 一种面向gps轨迹数据的时空语义索引与检索方法 |
CN105159895A (zh) * | 2014-05-28 | 2015-12-16 | 国际商业机器公司 | 用于存储和查询数据的方法和系统 |
CN104850970A (zh) * | 2015-06-16 | 2015-08-19 | 广东航宇卫星科技有限公司 | 时空数据应急联动的三维可视化运营管理平台 |
KR20170089163A (ko) * | 2016-01-26 | 2017-08-03 | 서강대학교산학협력단 | 시공간 정보 저장장치 검색용 유사의미 정보 색인 방법 |
CN106446278A (zh) * | 2016-10-24 | 2017-02-22 | 北京亚控科技发展有限公司 | 一种基于时空数据库的对数据对象的检索方法 |
CN109117087A (zh) * | 2018-07-19 | 2019-01-01 | 北京蜂盒科技有限公司 | 采集监控数据的方法、装置、存储介质及电子设备 |
CN110399446A (zh) * | 2019-07-26 | 2019-11-01 | 广州市城市规划勘测设计研究院 | 大规模时空数据的可视化方法、装置、设备及存储介质 |
CN110647662A (zh) * | 2019-08-03 | 2020-01-03 | 电子科技大学 | 一种基于语义的多模态时空数据关联方法 |
CN110532341A (zh) * | 2019-09-03 | 2019-12-03 | 华东师范大学 | 空间信息时空大数据约束表达方法 |
CN111831870A (zh) * | 2020-06-12 | 2020-10-27 | 北京百度网讯科技有限公司 | 时空数据的异常检测方法、装置、电子设备和存储介质 |
CN112800056A (zh) * | 2021-01-21 | 2021-05-14 | 北京博阳世通信息技术有限公司 | 基于多粒度时空数据的多层索引构建方法 |
Non-Patent Citations (4)
Title |
---|
A spatio-temporal clustering and diagnosis method for concrete arch dams using deformation monitoring data;Chen B 等;《Structural Health Monitoring》;20180926;第18卷(第5-6期);第1355-1371页 * |
一种基于位置对象和时间的时空数据模型;张保钢 等;《测绘通报》;20070326(第1期);第40-42页 * |
智能交通系统中的时空数据分析关键技术研究;夏英;《中国优秀博硕士学位论文全文数据库(博士)工程科技Ⅱ辑》;20130315(第3期);第C034-13页 * |
面向公共安全监测的跨模态检索技术;杨清清;《中国优秀博硕士学位论文全文数据库(硕士)社会科学Ⅰ辑》;20200715(第7期);第G110-8页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113626493A (zh) | 2021-11-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106462583B (zh) | 用于快速数据分析的系统和方法 | |
KR101945749B1 (ko) | 데이터베이스 검색방법, 네비게이션 장치 및 인덱스 구조 생성 방법 | |
US20060245572A1 (en) | Geocoding method using multidimensional vector spaces | |
US5666442A (en) | Comparison system for identifying the degree of similarity between objects by rendering a numeric measure of closeness, the system including all available information complete with errors and inaccuracies | |
CN104756107A (zh) | 采用位置信息剖析数据 | |
CN110659282B (zh) | 数据路由的构建方法、装置、计算机设备和存储介质 | |
CN108345601B (zh) | 搜索结果排序方法及装置 | |
CN111190792B (zh) | 一种日志存储的方法、装置、电子设备及可读存储介质 | |
CN110716539B (zh) | 一种故障诊断分析方法和装置 | |
CN111078512B (zh) | 告警记录生成方法、装置、告警设备及存储介质 | |
CN112269883A (zh) | 人员信息的查询方法、装置、电子设备及存储介质 | |
CN115422479A (zh) | 轨迹关联方法、装置、电子设备及机器可读存储介质 | |
CN110737779B (zh) | 知识图谱的构建方法、装置、存储介质和电子设备 | |
CN114116829A (zh) | 异常数据分析方法、异常数据分析系统和存储介质 | |
CN113626493B (zh) | 一种时空数据多维查询方法及系统 | |
CN114781688A (zh) | 业扩项目的异常数据的识别方法、装置、设备及存储介质 | |
CN112882956B (zh) | 一种通过数据组合计算自动生成全场景自动化测试案例的方法、装置、存储介质及电子设备 | |
CN112817984B (zh) | 数据处理方法及装置、数据来源获取方法及装置 | |
CN111611343B (zh) | 基于知识图谱最短路径查询的搜索系统、方法及设备 | |
Ban et al. | Time parameterized interval R-tree for tracing tags in RFID systems | |
CN109144999B (zh) | 一种数据定位方法、装置及存储介质、程序产品 | |
Li et al. | A novel approach to remote sensing image retrieval with multi-feature VP-tree indexing and online feature selection | |
CN114048825A (zh) | 基于对比学习的聚类方法、系统、设备及存储介质 | |
CN113177023B (zh) | 一种日志检索方法、装置及电子设备 | |
CN117931738B (zh) | 一种基于路网可达性的人像档案轨迹治理方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |