CN111367958A - 一种数据分析方法、装置、电子设备及存储介质 - Google Patents
一种数据分析方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN111367958A CN111367958A CN201911135297.1A CN201911135297A CN111367958A CN 111367958 A CN111367958 A CN 111367958A CN 201911135297 A CN201911135297 A CN 201911135297A CN 111367958 A CN111367958 A CN 111367958A
- Authority
- CN
- China
- Prior art keywords
- data
- area
- queried
- analyzed
- acquisition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000007405 data analysis Methods 0.000 title claims abstract description 84
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000004458 analytical method Methods 0.000 claims abstract description 30
- 238000004891 communication Methods 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 13
- 238000012545 processing Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 230000009471 action Effects 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2477—Temporal data queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Probability & Statistics with Applications (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Fuzzy Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供了一种数据分析方法、装置、电子设备及存储介质,接收各个待查询区域以及各个待查询区域各自对应的查询时间区间;获取各个待查询区域内、各自对应的查询时间区间范围内的待分析数据,每条待分析数据包括产生该条待分析数据的主体的主体标识、该条待分析数据的采集时间及采集位置;根据采集位置,确定同一主体标识的所有待分析数据中包含的不同待查询区域的第一数量;在第一数量符合区域数量设定条件时,确定主体标识为目标标识,作为数据分析结果。这样,不依赖于人工对待分析数据的区域碰撞分析,即使在待分析数据的的数据量较大的情况下,也可以快速得到数据分析结果,从而实现一种时效性较高的数据区域碰撞分析方法。
Description
技术领域
本发明涉及数据处理技术领域,特别是涉及一种数据分析方法、装置、电子设备及存储介质。
背景技术
一些场景中,需要对数据进行区域碰撞分析,从中得到所需要的信息。
举例而言,在交通行业中,可以通过对车辆行驶数据进行区域碰撞分析,确定车辆的活动范围及车辆在各个区域的出现频率等信息。相关技术中,对车辆行驶数据进行区域碰撞分析,需要由管理人员对车辆行驶数据进行人工统计分析。但是,在车辆行驶数据的数据量较大的情况下,由于管理人员对车辆行驶数据进行人工统计分析的能力有限,因此,得到数据分析结果的时效性较差。这样,当道路中发生事故时,难以快速得到所需要的数据分析结果,从而延误事故的处理时机。
因此,目前,缺少一种时效性较高的数据区域碰撞分析的方法。
发明内容
本发明实施例的目的在于提供一种数据处理方法、装置、电子设备及存储介质,以实现一种时效性较高的数据区域碰撞分析方法。具体技术方案如下:
本发明实施例提供了一种数据分析方法,所述方法包括:
接收各个待查询区域、以及所述各个待查询区域各自对应的查询时间区间;
获取所述各个待查询区域内、各自对应的查询时间区间范围内的待分析数据,每条待分析数据包括产生该条待分析数据的主体的主体标识及该条待分析数据的采集位置;
根据所述采集位置,确定同一所述主体标识的待分析数据中包含的不同待查询区域的第一数量;
在所述第一数量符合区域数量设定条件时,确定所述主体标识为目标标识,作为数据分析结果。
可选的,所述获取所述各个待查询区域内、各自对应的查询时间区间范围内的待分析数据,每条待分析数据包括产生该条待分析数据的主体的主体标识及该条待分析数据的采集位置,包括:
根据所述各个待查询区域各自对应的查询时间区间,确定所述各个待查询区域各自对应的区域查询起始时间及区域查询结束时间;
将所述各个待查询区域各自对应的区域查询起始时间中的最早时间,确定为数据获取起始时间,将所述各个待查询区域各自对应的区域查询结束时间中的最晚时间,确定为数据获取结束时间;
获取采集时间在所述数据获取起始时间至所述数据获取结束时间之内,且采集位置在所述各个待查询区域内的数据,每一条所述数据包括产生该条数据的主体的主体标识、该条数据的采集时间及采集位置;
确定所述采集位置在所述各个待查询区域中的一个待查询区域,且所述采集时间在该待查询区域对应的查询时间区间内的数据为待分析数据。
可选的,所述方法还包括:
确定在同一个待查询区域中同一目标标识的待分析数据的第二数量,作为数据分析结果;
和/或,
确定同一目标标识在所述各个待查询区域中的待分析数据的第三数量,作为数据分析结果。
可选的,还包括:
生成与所述各个待查询区域、所述各个待查询区域各自对应的查询时间区间及所述区域数量设定条件对应的任务标识;
生成与所述数据分析结果对应的分页数据;
存储所述任务标识与所述分页数据。
本发明实施例还提供了一种数据分析装置,所述装置包括:
接收模块,用于接收各个待查询区域、以及所述各个待查询区域各自对应的查询时间区间;
获取模块,用于获取所述各个待查询区域内、各自对应的查询时间区间范围内的待分析数据,每条待分析数据包括产生该条待分析数据的主体的主体标识及该条待分析数据的采集位置;
分析模块,用于根据所述采集位置,确定同一所述主体标识的待分析数据中包含的不同待查询区域的第一数量;
确定模块,用于在所述第一数量符合区域数量设定条件时,确定所述主体标识为目标标识,作为数据分析结果。
可选的,所述获取模块,具体用于:
根据所述各个待查询区域各自对应的查询时间区间,确定所述各个待查询区域各自对应的区域查询起始时间及区域查询结束时间;
将所述各个待查询区域各自对应的区域查询起始时间中的最早时间,确定为数据获取起始时间,将所述各个待查询区域各自对应的区域查询结束时间中的最晚时间,确定为数据获取结束时间;
获取采集时间在所述数据获取起始时间至所述数据获取结束时间之内,且采集位置在所述各个待查询区域内的数据,每一条所述数据包括产生该条数据的主体的主体标识、该条数据的采集时间及采集位置;
确定所述采集位置在所述各个待查询区域中的一个待查询区域,且所述采集时间在该待查询区域对应的查询时间区间内的数据为待分析数据。
可选的,所述确定模块,还用于:
确定在同一个待查询区域中同一目标标识的待分析数据的第二数量,作为数据分析结果;
和/或,
确定同一目标标识在所述各个待查询区域中的待分析数据的第三数量,作为数据分析结果。
可选的,还包括:
存储模块,用于生成与所述各个待查询区域、所述各个待查询区域各自对应的查询时间区间及所述区域数量设定条件对应的任务标识;生成与所述数据分析结果对应的分页数据;存储所述任务标识与所述分页数据。
本发明实施例还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述任一所述的数据分析方法。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一所述的数据分析方法。
本发明实施例还提供了一种包含指令的计算机程序产品,所述计算机程序产品在计算机上运行时,使得所述计算机执行上述任一所述的数据分析方法。
本发明实施例提供的数据分析方法、装置、电子设备及存储介质,接收各个待查询区域以及各个待查询区域各自对应的查询时间区间;获取各个待查询区域内、各自对应的查询时间区间范围内的待分析数据,每条待分析数据包括产生该条待分析数据的主体的主体标识及该条待分析数据的采集位置;根据采集位置,确定同一主体标识的所有待分析数据中包含的不同待查询区域的第一数量;在第一数量符合区域数量设定条件时,确定主体标识为目标标识,作为数据分析结果。这样,可以根据各个待查询区域各自对应的查询时间区间,获取到待分析数据,进而通过对得到的待分析数据进行分析,得到数据分析结果,不依赖于人工对待分析数据的区域碰撞分析,即使在待分析数据的的数据量较大的情况下,也可以快速得到数据分析结果,从而实现一种时效性较高的数据区域碰撞分析方法。当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种数据分析方法的流程示意图;
图2为本发明实施例提供的一种数据分析装置的结构示意图;
图3为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一些场景中,需要对针对多个主体的大量的数据进行区域碰撞分析,从中得到所需要的信息。举例而言,在交通行业中,可以通过对大量车辆行驶数据的分析,确定车辆的活动范围及车辆在各个区域的出现频率等信息,从而便于对车辆进行管理。
为了解决上述技术问题,本发明提供了一种数据处理方法,该方法可以应用于任一具有数据处理能力的电子设备,如服务器、计算机、网络摄像机、移动终端等等,本发明实施例对此不做限定。
下面从总体上对本发明实施例提供的数据分析方法进行说明。
一种实现方式中,上述数据分析方法包括:
接收各个待查询区域、以及各个待查询区域各自对应的查询时间区间;
获取各个待查询区域内、各自对应的查询时间区间范围内的待分析数据,每条待分析数据包括产生该条待分析数据的主体的主体标识及该条待分析数据的采集位置;
根据采集位置,确定同一主体标识的所有待分析数据中包含的不同待查询区域的第一数量;
在第一数量符合区域数量设定条件时,确定主体标识为目标标识,作为数据分析结果。
由以上可见,本发明实施例提供的数据分析方法,在进行区域碰撞分析时,可以根据各个待查询区域各自对应的查询时间区间,获取到待分析数据库,进而通过对得到的待分析数据进行分析,得到数据分析结果,不依赖于人工对待分析数据的区域碰撞分析,即使在待分析数据的的数据量较大的情况下,也可以快速得到数据分析结果,从而实现一种时效性较高的数据区域碰撞分析方法。
下面通过具体实施例,对本发明实施例提供的数据分析方法进行详细说明。
如图1所示,为本发明实施例提供的一种数据分析方法的流程示意图,该方法包括如下步骤:
S101:接收各个待查询区域、以及各个待查询区域各自对应的查询时间区间。
举例而言,各个待查询区域以及各个待查询区域的查询时间区间可以是电子设备(执行主体)根据用户的输入参数确定的,或者,也可以是电子设备按照预设规则生成的,比如,电子设备可以按照固定查询周期对各个待查询区域的待分析数据进行数据分析。
一种实现方式中,电子设备可以是大数据处理集群中的任一节点,在大数据处理集群中,包括多个节点,其中,每个节点均可以接收用户输入的用户参数,并根据用户参数,生成数据处理任务,并对数据处理任务进行拆分,得到各个节点对应的子任务,进而将子任务分发至各个节点,在各个节点接收到的子任务中,即包括该节点需要进行分析的各个待查询区域各自对应的查询时间区间。大数据处理集群可以为Spark集群,Spark是一种专为大数据处理而设计的快速通用的计算引擎。
一种实现方式中,若各个待查询区域各自对应的查询时间区间是电子设备根据用户的输入参数确定的,那么,在获取用户输入的用户参数之后,还可以对用户参数进行校验,判断用户参数是否合法,比如,可以判断用户参数是否符合预设的格式,或用户参数是否在当前数据库的可查询范围内,等等。这样,可以从用户参数中确定有效的待查询信息,进而,根据合法待查询信息,确定各个待查询区域各自对应的查询时间区间。
待查询区域对应的查询时间区间是指待查询区域的查询时间范围,每个待查询区域对应的查询时间区间可以是相同的,也可以是不同的。每个待查询区域的区域范围可以根据位置坐标确定,也可以根据采集待分析数据的预设采集地点确定。
举例而言,若分页数据及其对应的各个待查询区域各自对应的查询时间区间可以对应存储在redis数据库中。
S102:获取各个待查询区域内、各自对应的查询时间区间范围内的待分析数据。
其中,每条待分析数据包括产生该条待分析数据的主体的主体标识及该条待分析数据的采集位置。举例而言,若待分析数据中的主体为车辆,那么,产生该条待分析数据的主体的主体标识可以为车辆的特征信息,如车牌号、车牌颜色、车身颜色等信息。
在本发明实施例中,可以根据采集该条待分析数据的设备的位置确定该条待分析数据所处的待查询区域,也可以根据采集该条待分析数据时,该条待分析数据的主体的位置确定该条待分析数据所处的待查询区域,具体不做限定。
一种实现方式中,获取各个待查询区域内、各自对应的查询时间区间范围内的待分析数据的方式,可以为:
首先,根据各个待查询区域各自对应的查询时间区间,确定各个待查询区域各自对应的区域查询起始时间及区域查询结束时间,然后,将各个待查询区域的区域各自对应查询起始时间中的最早时间,确定为数据获取起始时间,将各个待查询区域各自对应的区域查询结束时间中的最晚时间,确定为数据获取结束时间。这样,就得到了一个范围较大的数据获取时间区间,比如,若待查询区域1对应的查询时间区间为9:00~9:05,待查询区域2对应的查询时间区间为9:02~9:07,待查询区域3对应的查询时间区间为9:04~9:09,那么,数据获取起始时间则为9:00,数据获取结束时间则为9:09。
进而,获取采集时间在数据获取起始时间及数据获取结束时间之内,且采集位置在各个待查询区域内的数据,其中,每一条数据包括产生该条数据的主体的主体标识、该条数据的采集时间及采集位置。这样,在确定数据获取起始时间和数据获取结束时间之后,可以一次性获取到所有在数据获取起始时间和数据获取结束时间之内,且采集位置在各个待查询区域内的数据,而不需要按照各个待查询区域各自对应的查询时间区间,多次分别获取各个待查询区域对应的待分析数据。由于这些数据是本设备(执行主体)通过网络从其他数据存储设备处获取的,那么,获取次数的减少也意味着本设备与其他数据存储设备之间的通信次数减少了,在数据量较大的情况下,相比于多次进行数据传输的方式,可以减少网络环境对数据获取时间的影响,缩短数据获取时间,从而进一步提高数据区域碰撞分析方法的时效性。
之后,可以确定采集位置在各个待查询区域中的一个待查询区域,且采集时间在该待查询区域对应的查询时间区间内的数据,作为待分析数据。在获取到数据获取起始时间及数据获取结束时间之内,且采集位置在各个待查询区域内的数据之后,可以在本地进行进一步的筛选,相比于多次分别通过网络获取各个待查询区域对应的待分析数据的方式,在本地进行筛选所需的时间更少,时效性更高。延续上述例子,在获取到采集时间在9:00~9:09之内,且采集位置在各个待查询区域内的数据之后,可以分别针对待查询区域1、待查询区域2和待查询区域3确定待分析数据,以针对待查询区域1为例,从获取到的数据中选择采集位置在待查询区域1,且采集时间在9:00~9:05的数据,作为待分析数据。
相关技术中的数据区域碰撞分析方法,通常基于单一的大数据技术组件,在获取数据时,采用多次分别通过网络获取各个待查询区域对应的待分析数据的方式,存在实时性与大数据量不能并存的问题,当需要获取大量数据的时候,获取数据所需的时间较长,难以保证满足数据分析结果的时效性,如果要满足数据分析结果的时效性,只能对5Gb(Gigabyte,十亿字节)以内的数据进行区域碰撞分析。而采用上述方法,一次性获取到所有在数据获取起始时间和数据获取结束时间之内,且采集位置在各个待查询区域内的数据,可以在所需数据量较大的情况下,仍然满足数据分析结果的时效性。
举例而言,若在车辆数据分析领域,数据为过车数据,产生该条数据的主体的主体标识即为车辆的特征信息,该条数据的采集时间即为过车时间,该条数据的采集位置即为采集该条数据的卡口设备所处的卡口的卡口标识,每个待查询区域为预设的多个卡口的卡口标识集合。
举例而言,数据可以预先存储在分布式存储系统数据库中,比如,分布式存储系统数据库可以为HBase数据库。
在HBase数据库内的每条数据的数据结构为(plateNO,passtime,crossingIndexCode,rowkey),其中,plateNo表示车辆的车牌,即产生该条待分析数据的主体的主体标识,passtime表示车辆的过车时间,crossingIndexCode表示车辆的过车卡口标识,rowKey表示待分析数据的数据标识,其中,每条待分析数据都具有唯一对应的数据标识,例如过车时间+过车id(Identity document,身份标识号),比如,过车id可以为车牌号。在这种情况下,可以调用scan函数,根据HBase数据库中每条数据的数据标识,获取采集时间在数据获取起始时间及数据获取结束时间之内的数据。或者,也可以调用get函数获取待分析数据。
其中,在调用scan函数的方式中,可以直接获取在数据获取起始时间及数据获取结束时间的时间范围内的连续数据。而在调用get函数的方式中,需要确定每条数据对应的时间信息,进而判断该数据的时间信息是否在数据获取起始时间及数据获取结束时间的时间范围内。也就是说,调用scan函数的方式更为便捷快速。
在HBase数据库中,数据标识的设计决定数据读取的快慢。举例而言,若在车辆数据分析领域,可以采用过车时间+过车id的方式作为HBase中一条过车数据的数据标识。这样,可以提高过车数据在时间维度上的连续性。
在获取到过车时间在数据获取起始时间及数据获取结束时间之内,且卡口标识在各个卡口标识集合内的过车数据之后,可以针对每条过车数据,可以判断卡口标识是否在某一预设的卡口标识集合内,并且过车时间是否在该预设的卡口标识集合对应的查询时间区间内,若是,则该条过车数据为待分析数据。一种实现方式中,可以针对每条待分析数据,生成该条待分析数据对应的分布式数据,也就是说,待分析数据以分布式数据的形式存储在hbase数据库中。
一种实现方式中,在确定采集位置在各个待查询区域中的一个待查询区域,且采集时间在该待查询区域对应的查询时间区间内的数据为待分析数据之前,还可以判断产生该条数据的主体的主体标识是否满足预设筛选条件。
其中,预设筛选条件可以是指按照脏数据处理规则过滤数据,比如,若在车辆数据分析领域,产生该条过车数据的主体的主体标识为车辆的车牌,那么,可以过滤掉车牌为“车牌”、“未知车牌”、“11111111”、“00000000”、“NoPlate”的过车数据,等等。具体的,若电子设备为大数据处理集群中的节点,那么,可以通过大数据处理集群提供filter算子进行筛选操作,具体不做限定。
S103:根据采集位置,确定同一主体标识的待分析数据中包含的不同待查询区域的第一数量。
在本发明实施例中,根据每条待分析数据包括的采集位置例如过车卡口标识可以确定该条待分析数据对应的待查询区域。
举例而言,在车辆数据分析领域,每条待分析数据可以表示为((plateNo,districtId),rowKey),其中,plateNo表示车辆的车牌,即产生该条待分析数据的主体的主体标识,districtId表示车辆经过的区域名称,即该条待分析数据对应的待查询区域,rowKey表示待分析数据的数据标识,其中,每条待分析数据都具有唯一对应的数据标识。
在得到待分析数据之后,可以根据采集位置,确定同一主体标识的各个待分析数据中包含的不同待查询区域的第一数量,即,确定同一主体标识与多少不同的待查询区域对应。
一种实现方式中,确定同一主体标识的待分析数据中包含的不同的待查询区域的第一数量的方式,可以为:将上述待分析数据转换为((plateNo,Set<districtId>),rowKey),其中,Set表示一种集合处理方式,在Set集合中,每个元素都是唯一的,也就是说,在Set集合中包括各个车牌对应的每个待查询区域,Set集合中元素的数量也就是该车牌经过的不同待查询区域的数量,即第一数量。
S104:在第一数量符合区域数量设定条件时,确定主体标识为目标标识,作为数据分析结果。
在计算得到第一数量之后,可以进行进一步的判断,当某一主体标识的第一数量符合区域数量设定条件时,将产生该主体标识确定为目标标识,即,将该主体标识对应的主体确定为数据分析的目标,从而得到数据分析结果。
其中,第一数量符合区域数量设定条件,可以是指第一数量大于预设阈值,比如,延续上述例子,用户可能需要确定在对应的时间区间内出现在至少两个待查询区域的车辆,那么,可以判断各个车牌的第一数量是否大于二,如果大于,说明该车牌对应的车辆经过的待查询区域的数量大于二。
在得到数据分析结果之后,可以生成与各个待查询区域、各个待查询区域各自对应的查询时间区间及区域数量设定条件对应的任务标识,以及与数据分析结果对应的分页数据,进而,存储任务标识与分页数据。这样,当下一次接收到同样的各个待查询区域各自对应的查询时间区间时,可以根据各个待查询区域、各个待查询区域各自对应的查询时间区间及区域数量设定条件,判断是否存在对应的任务标识,若存在,则可以直接根据对应的任务标识获取到数据分析结果,不必在分析条件相同的情况下,再次进行同样的分析处理过程,从而提高数据分析效率。
另外,一种实现方式中,在获取待分析数据之后,还可以确定在同一个待查询区域中同一目标标识的待分析数据的第二数量,作为数据分析结果。其中,第二数量也就是同一目标标识在某一个待查询区域对应的查询时间区间内出现在该待查询区域的次数。
举例而言,延续上述例子,若在车辆数据分析领域,在同一个待查询区域中同一目标标识的待分析数据的第二数量,即为某一车辆经过某一待查询区域的次数。具体的,可以调用reduceByKey算子,对得到的待分析数据进行计算,得到第二数量。
另外,一种实现方式中,在获取待分析数据之后,还可以确定同一目标标识在各个待查询区域中的待分析数据的第三数量,作为数据分析结果。其中,第三数量也就是同一目标标识在各个待查询区域各自对应的时间区间内出现在各个待查询区域的总次数。
举例而言,延续上述例子,若在车辆数据分析领域,同一目标标识在各个待查询区域中的待分析数据的第三数量,即为某一车辆经过所有待分析区域的总次数。具体的,可以调用reduceByKey算子,对得到的待分析数据进行计算,得到第三数量。
由以上可见,本发明实施例提供的数据分析方法,在进行区域碰撞分析时,可以根据各个待查询区域各自对应的查询时间区间,获取到待分析数据库,进而通过对得到的待分析数据进行分析,得到数据分析结果,不依赖于人工对待分析数据的区域碰撞分析,即使在待分析数据的的数据量较大的情况下,也可以快速得到数据分析结果,从而实现一种时效性较高的数据区域碰撞分析方法。
本发明实施例还提供了一种数据分析装置,如图2所示,为上述数据分析装置的结构示意图,该装置包括:
接收模块201,用于接收各个待查询区域、以及各个待查询区域各自对应的查询时间区间;
获取模块202,用于获取所述各个待查询区域内、各自对应的查询时间区间范围内的待分析数据,每条待分析数据包括产生该条待分析数据的主体的主体标识及该条待分析数据的采集位置;
分析模块203,用于根据所述采集位置,确定同一主体标识的待分析数据中包含的不同待查询区域的第一数量;
确定模块204,用于在所述第一数量符合区域数量设定条件时,确定所述主体标识为目标标识,作为数据分析结果。
一种实现方式中,所述获取模块202,具体用于:
根据所述各个待查询区域各自对应的查询时间区间,确定所述各个待查询区域各自对应的区域查询起始时间及区域查询结束时间;
将所述各个待查询区域各自对应的区域查询起始时间中的最早时间,确定为数据获取起始时间,将所述各个待查询区域各自对应的区域查询结束时间中的最晚时间,确定为数据获取结束时间;
获取采集时间在所述数据获取起始时间至所述数据获取结束时间之内,且采集位置在所述各个待查询区域内的数据,每一条所述数据包括产生该条数据的主体的主体标识、该条数据的采集时间及采集位置;
确定所述采集位置在所述各个待查询区域中的一个待查询区域,且所述采集时间在该待查询区域对应的查询时间区间内的数据为待分析数据。
一种实现方式中,所述确定模块204,还用于:
确定在同一个待查询区域中同一目标标识的待分析数据的第二数量,作为数据分析结果;
和/或,
确定同一目标标识在所述各个待查询区域中的待分析数据的第三数量,作为数据分析结果。
一种实现方式中,还包括:
存储模块(图中未示出),用于生成与所述各个待查询区域、所述各个待查询区域各自对应的查询时间区间及区域数量设定条件对应的任务标识;生成与所述数据分析结果对应的分页数据;存储所述任务标识与所述分页数据。
由以上可见,本发明实施例提供的数据分析装置,在进行区域碰撞分析时,可以根据各个待查询区域各自对应的查询时间区间,获取到待分析数据库,进而通过对得到的待分析数据进行分析,得到数据分析结果,不依赖于人工对待分析数据的区域碰撞分析,即使在待分析数据的的数据量较大的情况下,也可以快速得到数据分析结果,从而实现一种时效性较高的数据区域碰撞分析方法。
本发明实施例还提供了一种电子设备,如图3所示,包括处理器301、通信接口302、存储器303和通信总线304,其中,处理器301,通信接口302,存储器303通过通信总线304完成相互间的通信,
存储器303,用于存放计算机程序;
处理器301,用于执行存储器303上所存放的程序时,实现如下步骤:
接收各个待查询区域、以及各个待查询区域各自对应的查询时间区间;
获取各个待查询区域内、各自对应的查询时间区间范围内的待分析数据,每条待分析数据包括产生该条待分析数据的主体的主体标识及该条待分析数据的采集位置;
根据采集位置,确定同一主体标识的所有待分析数据中包含的不同待查询区域的第一数量;
在第一数量符合区域数量设定条件时,确定主体标识为目标标识,作为数据分析结果。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
由以上可见,本发明实施例提供的电子设备,在进行区域碰撞分析时,可以根据各个待查询区域各自对应的查询时间区间,获取到待分析数据库,进而通过对得到的待分析数据进行分析,得到数据分析结果,不依赖于人工对待分析数据的区域碰撞分析,即使在待分析数据的的数据量较大的情况下,也可以快速得到数据分析结果,从而实现一种时效性较高的数据区域碰撞分析方法。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的数据分析方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的数据分析方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例、电子设备实施例、存储介质实施例和计算机程序产品实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (10)
1.一种数据分析方法,其特征在于,所述方法包括:
接收各个待查询区域、以及所述各个待查询区域各自对应的查询时间区间;
获取所述各个待查询区域内、各自对应的查询时间区间范围内的待分析数据,每条待分析数据包括产生该条待分析数据的主体的主体标识及该条待分析数据的采集位置;
根据所述采集位置,确定同一所述主体标识的待分析数据中包含的不同待查询区域的第一数量;
在所述第一数量符合区域数量设定条件时,确定所述主体标识为目标标识,作为数据分析结果。
2.根据权利要求1所述的方法,其特征在于,所述获取所述各个待查询区域内、各自对应的查询时间区间范围内的待分析数据,每条待分析数据包括产生该条待分析数据的主体的主体标识及该条待分析数据的采集位置,包括:
根据所述各个待查询区域各自对应的查询时间区间,确定所述各个待查询区域各自对应的区域查询起始时间及区域查询结束时间;
将所述各个待查询区域各自对应的区域查询起始时间中的最早时间,确定为数据获取起始时间,将所述各个待查询区域各自对应的区域查询结束时间中的最晚时间,确定为数据获取结束时间;
获取采集时间在所述数据获取起始时间至所述数据获取结束时间之内,且采集位置在所述各个待查询区域内的数据,每一条所述数据包括产生该条数据的主体的主体标识、该条数据的采集时间及采集位置;
确定所述采集位置在所述各个待查询区域中的一个待查询区域,且所述采集时间在该待查询区域对应的查询时间区间内的数据为待分析数据。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定在同一个待查询区域中同一目标标识的待分析数据的第二数量,作为数据分析结果;
和/或,
确定同一目标标识在所述各个待查询区域中的待分析数据的第三数量,作为数据分析结果。
4.根据权利要求1至3任一项所述的方法,其特征在于,还包括:
生成与所述各个待查询区域、所述各个待查询区域各自对应的查询时间区间及所述区域数量设定条件对应的任务标识;
生成与所述数据分析结果对应的分页数据;
存储所述任务标识与所述分页数据。
5.一种数据分析装置,其特征在于,所述装置包括:
接收模块,用于接收各个待查询区域、以及所述各个待查询区域各自对应的查询时间区间;
获取模块,用于获取所述各个待查询区域内、各自对应的查询时间区间范围内的待分析数据,每条待分析数据包括产生该条待分析数据的主体的主体标识及该条待分析数据的采集位置;
分析模块,用于根据所述采集位置,确定同一所述主体标识的待分析数据中包含的不同待查询区域的第一数量;
确定模块,用于在所述第一数量符合区域数量设定条件时,确定所述主体标识为目标标识,作为数据分析结果。
6.根据权利要求5所述的装置,其特征在于,所述获取模块,具体用于:
根据所述各个待查询区域各自对应的查询时间区间,确定所述各个待查询区域各自对应的区域查询起始时间及区域查询结束时间;
将所述各个待查询区域各自对应的区域查询起始时间中的最早时间,确定为数据获取起始时间,将所述各个待查询区域各自对应的区域查询结束时间中的最晚时间,确定为数据获取结束时间;
获取采集时间在所述数据获取起始时间至所述数据获取结束时间之内,且采集位置在所述各个待查询区域内的数据,每一条所述数据包括产生该条数据的主体的主体标识、该条数据的采集时间及采集位置;
确定所述采集位置在所述各个待查询区域中的一个待查询区域,且所述采集时间在该待查询区域对应的查询时间区间内的数据为待分析数据。
7.根据权利要求5所述的装置,其特征在于,所述确定模块,还用于:
确定在同一个待查询区域中同一目标标识的待分析数据的第二数量,作为数据分析结果;
和/或,
确定同一目标标识在所述各个待查询区域中的待分析数据的第三数量,作为数据分析结果。
8.根据权利要求5至7任一项所述的装置,其特征在于,还包括:
存储模块,用于生成与所述各个待查询区域、所述各个待查询区域各自对应的查询时间区间及所述区域数量设定条件对应的任务标识;生成与所述数据分析结果对应的分页数据;存储所述任务标识与所述分页数据。
9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-4任一所述的方法步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-4任一所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911135297.1A CN111367958B (zh) | 2019-11-19 | 2019-11-19 | 一种数据分析方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911135297.1A CN111367958B (zh) | 2019-11-19 | 2019-11-19 | 一种数据分析方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111367958A true CN111367958A (zh) | 2020-07-03 |
CN111367958B CN111367958B (zh) | 2024-03-08 |
Family
ID=71207960
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911135297.1A Active CN111367958B (zh) | 2019-11-19 | 2019-11-19 | 一种数据分析方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111367958B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112396830A (zh) * | 2020-10-23 | 2021-02-23 | 武汉烽火众智数字技术有限责任公司 | 一种提供过车数据快速查询及应用的方法及系统 |
CN114238346A (zh) * | 2022-02-25 | 2022-03-25 | 浙江力嘉电子科技有限公司 | 监控密度分析方法、装置、存储介质和电子设备 |
CN114996360A (zh) * | 2022-07-20 | 2022-09-02 | 江西现代职业技术学院 | 数据分析方法、系统、可读存储介质及计算机设备 |
CN116680488A (zh) * | 2023-08-03 | 2023-09-01 | 杭州字节方舟科技有限公司 | 一种基于区块链的数据监管方法、系统以及存储介质 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103678338A (zh) * | 2012-09-07 | 2014-03-26 | 中国科学院计算机网络信息中心 | 一种带智能缓存模块的物联网标识解析方法 |
CN105788264A (zh) * | 2016-04-28 | 2016-07-20 | 泰华智慧产业集团股份有限公司 | 基于Hbase的卡口数据区域碰撞分析的方法及系统 |
CN105912300A (zh) * | 2016-07-01 | 2016-08-31 | 腾讯科技(北京)有限公司 | 一种数据处理方法及装置 |
CN106097708A (zh) * | 2016-06-06 | 2016-11-09 | 浙江宇视科技有限公司 | 一种跟车确定方法及装置 |
CN106484734A (zh) * | 2015-09-01 | 2017-03-08 | 天脉聚源(北京)科技有限公司 | 一种数据查询缓存方法及系统 |
CN107506368A (zh) * | 2017-07-04 | 2017-12-22 | 青岛海信网络科技股份有限公司 | 一种类案嫌疑车辆的确定方法及装置 |
CN107688619A (zh) * | 2017-08-10 | 2018-02-13 | 北京奇安信科技有限公司 | 一种日志数据处理方法及装置 |
CN107688646A (zh) * | 2017-08-30 | 2018-02-13 | 武汉烽火众智数字技术有限责任公司 | 一种基于es的卡口数据区域碰撞分析的方法 |
WO2018036244A1 (zh) * | 2016-08-22 | 2018-03-01 | 深圳市中兴微电子技术有限公司 | 一种数据分析方法和装置、设备、存储介质 |
CN108182258A (zh) * | 2018-01-02 | 2018-06-19 | 福建中金在线信息科技有限公司 | 分布式的数据分析系统及方法 |
CN108733701A (zh) * | 2017-04-20 | 2018-11-02 | 杭州施强教育科技有限公司 | 一种应用于在线教育的查询页面缓存控制方法 |
CN109598963A (zh) * | 2017-09-30 | 2019-04-09 | 杭州海康威视系统技术有限公司 | 一种过车查询方法、装置、电子设备及可读存储介质 |
US20190196933A1 (en) * | 2017-12-21 | 2019-06-27 | Baidu Online Network Technology (Beijing) Co., Ltd . | Data visual analysis method, system and terminal and computer readable storage medium |
WO2019178979A1 (zh) * | 2018-03-21 | 2019-09-26 | 平安科技(深圳)有限公司 | 报表数据查询方法、装置、存储介质和服务器 |
-
2019
- 2019-11-19 CN CN201911135297.1A patent/CN111367958B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103678338A (zh) * | 2012-09-07 | 2014-03-26 | 中国科学院计算机网络信息中心 | 一种带智能缓存模块的物联网标识解析方法 |
CN106484734A (zh) * | 2015-09-01 | 2017-03-08 | 天脉聚源(北京)科技有限公司 | 一种数据查询缓存方法及系统 |
CN105788264A (zh) * | 2016-04-28 | 2016-07-20 | 泰华智慧产业集团股份有限公司 | 基于Hbase的卡口数据区域碰撞分析的方法及系统 |
CN106097708A (zh) * | 2016-06-06 | 2016-11-09 | 浙江宇视科技有限公司 | 一种跟车确定方法及装置 |
CN105912300A (zh) * | 2016-07-01 | 2016-08-31 | 腾讯科技(北京)有限公司 | 一种数据处理方法及装置 |
WO2018036244A1 (zh) * | 2016-08-22 | 2018-03-01 | 深圳市中兴微电子技术有限公司 | 一种数据分析方法和装置、设备、存储介质 |
CN108733701A (zh) * | 2017-04-20 | 2018-11-02 | 杭州施强教育科技有限公司 | 一种应用于在线教育的查询页面缓存控制方法 |
CN107506368A (zh) * | 2017-07-04 | 2017-12-22 | 青岛海信网络科技股份有限公司 | 一种类案嫌疑车辆的确定方法及装置 |
CN107688619A (zh) * | 2017-08-10 | 2018-02-13 | 北京奇安信科技有限公司 | 一种日志数据处理方法及装置 |
CN107688646A (zh) * | 2017-08-30 | 2018-02-13 | 武汉烽火众智数字技术有限责任公司 | 一种基于es的卡口数据区域碰撞分析的方法 |
CN109598963A (zh) * | 2017-09-30 | 2019-04-09 | 杭州海康威视系统技术有限公司 | 一种过车查询方法、装置、电子设备及可读存储介质 |
US20190196933A1 (en) * | 2017-12-21 | 2019-06-27 | Baidu Online Network Technology (Beijing) Co., Ltd . | Data visual analysis method, system and terminal and computer readable storage medium |
CN108182258A (zh) * | 2018-01-02 | 2018-06-19 | 福建中金在线信息科技有限公司 | 分布式的数据分析系统及方法 |
WO2019178979A1 (zh) * | 2018-03-21 | 2019-09-26 | 平安科技(深圳)有限公司 | 报表数据查询方法、装置、存储介质和服务器 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112396830A (zh) * | 2020-10-23 | 2021-02-23 | 武汉烽火众智数字技术有限责任公司 | 一种提供过车数据快速查询及应用的方法及系统 |
CN114238346A (zh) * | 2022-02-25 | 2022-03-25 | 浙江力嘉电子科技有限公司 | 监控密度分析方法、装置、存储介质和电子设备 |
CN114996360A (zh) * | 2022-07-20 | 2022-09-02 | 江西现代职业技术学院 | 数据分析方法、系统、可读存储介质及计算机设备 |
CN114996360B (zh) * | 2022-07-20 | 2022-11-18 | 江西现代职业技术学院 | 数据分析方法、系统、可读存储介质及计算机设备 |
CN116680488A (zh) * | 2023-08-03 | 2023-09-01 | 杭州字节方舟科技有限公司 | 一种基于区块链的数据监管方法、系统以及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111367958B (zh) | 2024-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111367958B (zh) | 一种数据分析方法、装置、电子设备及存储介质 | |
CN110309125B (zh) | 数据校验方法、电子装置及存储介质 | |
CN104216985B (zh) | 一种甄别异常数据的方法及系统 | |
CN111491002B (zh) | 设备巡检方法、装置、被巡检设备、巡检服务器及系统 | |
CN111400288A (zh) | 数据质量检查方法及系统 | |
CN112084180A (zh) | 一种监控车载应用质量的方法、装置、设备及介质 | |
CN115936350A (zh) | 一种基于大数据的区域性消防资源调配方法及系统 | |
CN114743384A (zh) | 报警方法及装置 | |
CN114328017A (zh) | 一种数据库备份方法、系统、计算机设备和存储介质 | |
CN111625700B (zh) | 防抓取的方法、装置、设备及计算机存储介质 | |
CN111369790B (zh) | 过车记录校正方法、装置、设备及存储介质 | |
CN115639578B (zh) | 一种北斗导航定位监测处理方法及系统 | |
CN109558403B (zh) | 数据聚合方法及装置、计算机装置及计算机可读存储介质 | |
CN111754050A (zh) | 配送对象配送画像的预测方法及装置 | |
CN111756869B (zh) | 一种dns解析服务器地址收集方法和系统 | |
CN111368616B (zh) | 从车的识别方法、装置及设备 | |
CN114708425A (zh) | 车辆违停的识别方法、装置及计算机可读存储介质 | |
CN112712610B (zh) | 车辆诊断日志处理方法、装置、终端设备及可读存储介质 | |
CN111222739B (zh) | 核电站的任务分配方法及核电站的任务分配系统 | |
CN113486342A (zh) | 一种基于用户行为分析的信息安全处理方法及系统 | |
CN110718087B (zh) | 数据融合处理方法及装置 | |
CN113051307A (zh) | 告警信号的分析方法、设备、存储介质及装置 | |
CN112148459B (zh) | 节点关联数据的处理方法、装置、可读介质以及设备 | |
CN113505788B (zh) | 获取路网信息的方法、装置及存储介质 | |
CN111368618B (zh) | 一种隐匿车辆的确定方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |